新火種AI|股價暴漲30%!商湯發布日日新5.0,暴打GPT-4

新火種 2024-04-25 23:03:56

作者:一號

編輯:美美

沉寂多時的AI巨頭商湯,這次站在了市場焦點上。

股價沉寂多日的AI巨頭商湯,在4月24日迎來了大爆發,當日股價飙升31.15%。這樣的大漲行情,也讓商湯成爲了市場焦點,在當天上午11時15分起,公司股票暫停了買賣。

而到了4月25日,商湯已漲超15%,如此火熱的背後,是商湯在4月23日推出了其6000億參數的大模型“日日新5.0”,在知識、數學、推理和代碼能力方面大幅提升,綜合性能甚至能夠全面對標GPT-4 Turbo。

誰能想到,如此火熱的商湯,在之前還面臨著虧損危機。

暴打GPT-4,推理速度快到看不清

目前市場上將商湯近期股價暴漲歸功于其日前發布的“日日新5.0”大模型。第一代“日日新”大模型體系發布于2023年4月,並在同年8月獲批上線。據其官網資料顯示,日日新大模型體系包括了商量大語言模型、秒畫文生圖大模型、語音大模型和向量模型等。

時隔一年,“日日新5.0”正式誕生,它基于超過10TB tokens訓練,覆蓋了大量合成數據;同時也采用了當前業內主流的混合專家架構(MoE架構),上下文窗口可達到200K左右,在綜合能力上,可以全面對標GPT-4 Turbo,“主流客觀評測上達到或超越GPT-4 Turbo”。

在發布會現場上,商湯還上演了一次《街頭霸王》遊戲PK,兩個角色分別由商湯新發布的日日新端側大模型SenseChat Life(商量輕量版)和GPT-4操縱,其中綠人由GPT-4操縱,紅人則由商量輕量版操作,當GPT-4還在思考如何決策時,商量輕量版的拳頭就已經打了上去,名副其實的“暴打GPT-4”,生動地體現了商量輕量版推理速度之快。

而且它還是一個端側大模型,采用了端雲聯動的MoE框架,“以小博大”,已經在多項測試中擊敗了Llama2-7B,甚至是13B,在同等尺度上性能已經達到了SOTA水平。在中等性能手機上,商量輕量版可以達到18.3字/秒的推理速度,而人眼一般的閱讀速度爲20字/秒。而在高端旗艦手機上,它的推理速度更是可以達到78.3字/秒。

大版本升級,全面對標GPT-4 Turbo

除了端側大模型的展示,商湯在此次發布會上還在“大基座”方面,把自家的日日新大模型來了個大版本升級——日日新SenseNova 5.0,全面對標GPT-4 Turbo!

從評測榜單的數據上來看,商量5.0在常規客觀評測已經達到或超越了GPT-4 Turbo。其主要依靠兩點做到了這一點,一是數據,二是算力。首先,商湯采用了超過10T的tokens,讓日日新5.0具備了高質量數據的完備性,此外,商湯還合成構造了高達數千億tokens的思維鏈數據,以激活大模型推理的能力。

在算力方面,商湯將算法設計和算力設施進行了聯合的優化:算力設施的拓撲極限用來定義下一階段的算法,而算法上的新進展又要重新指導算力設施的建設。

整體上來說,日日新5.0的亮點可以總結爲:①采用MoE架構;②基于超過10TB tokens訓練,擁有大量合成數據;③推理上下文窗口達到200K;④知識、推理、數學和代碼等能力全面對標GPT-4 Turbo。

在多模態能力方面,日日新5.0也有整體的提升,在識圖、生圖以及代碼能力等方面均可比肩行業領先模型,可以說是夠全面了,這也是商湯所一直強調的“大模型+大裝置”的打法。

股價暴漲之後,商湯能否走出虧損陰雲?

作爲“AI四小龍”之首的商湯,不久前,剛發布了2023年年度業績公告,公司實現營收34億元,同比下滑10.6%;年度虧損64.95億元,較2022年同期的60.93億元增加了6.6%,自2018年以來,商湯已經虧損了近500億。

但與此同時,年報顯示,生成式AI成爲了商湯業績的亮點,生成式AI收入突破11.84億元,實現199.9%的飛速增長,占公司總收入的比例由2022年的10.4%提升到了34.8%。因此,商湯在2024年戰略目標中提到,推動核心業務盈利,集中資源于生成式AI業務以改善現金流和減少虧損。

可見,商湯正在踐行這一目標,在日日新5.0的發布會上,商湯也交出了一份客戶的使用反饋。華爲、WPS、小米、閱文、海通證券,從辦公到文娛,從金融到終端,均分享了他們使用商湯日日新大模型體系後,給自身業務帶來的獎杯呢增效,也因此,商湯股價在發布會之後迎來了大漲。

可見,有技術、有算力、有方法論還有使用場景的商湯,或許真的成功轉型稱爲生成式AI新的龍頭,在AIGC時代,獲得不錯的發展。

0 阅读:6

新火種

簡介:讓一億人用上AI