國産AI再迎突破,新智能助手可支持200萬字無損長文

今日商訊 2024-03-28 13:59:59

“一個有著超大‘內存’的智能助手,可以一口氣讀完二十萬字的小說,還會上網沖浪。”這是Kimi Chat官方對自家推出的智能助手的介紹。

3月18日,月之暗面(Moonshot AI)宣布其旗下推出的智能助手Kimi Chat在大模型長上下文窗口技術上取得新的突破,目前已經可以支持200萬字超長無損上下文,並宣布開啓産品內測。

此消息一出立刻引起資本市場和AI界的關注,相關話題很快登上熱搜,諸多網友前往Kimi Chat官網親自體驗,一度讓Kimi Chat因爲過于火爆而“罷工”。而此時,距離月之暗面第一次向世人介紹Kimi Chat這款AI長文本領域的突破性成果僅過去不到半年。

半年內提升10倍,Kimi開啓千億大模型長文本時代

2023年10月9日,月之暗面向公衆推出世界首個支持輸入20萬漢字的智能助手産品,這是月之暗面第一次在公衆面前亮相,也是Kimi Chat的名字首次被公衆聽到。在此之後,月之暗面就漸漸淡出人們視野,只是在今年2月完成新一輪超10億美元融資時才再度淺淺露個面。此時估計誰也未曾想到,一個月後這家AI新秀將再度爆出大驚喜,把AI長文領域賽道競爭的激烈程度“自我內卷”到難以企及的新高度。

相比于此前的20萬字長文本上限,全新的Kimi智能助手支持文本上限的長度直接提升到原先10倍,而更大容量的長上下文處理能力無疑將幫助Kimi用戶解鎖更多新的使用場景,包括長篇文本的翻譯和理解、輔助分析法律問題、一次性整理幾十張發票、快速理解API開發文檔等。

而除了長文本處理能力大幅提升之外,新的Kimi同樣還強化了自身的上下文窗口和無損記憶功能以及多語言支持優勢,這使得Kimi在聯網搜索與信息搜集、數據處理、編寫代碼和模擬對話等多種使用場景中同樣可以表現出色,也意味著國産AI在文本領域上或已超過海外頂尖水平。

“過去要 10000 小時才能成爲專家的領域,現在只需要 10 分鍾,Kimi就能接近任何一個新領域的初級專家水平。用戶可以跟 Kimi 探討專業領域的問題,讓Kimi幫助自己練習專業技能,或者啓發新的想法。”月之暗面方面爲此舉例道:用戶可以上傳一份完整的近百萬字中醫診療手冊讓Kimi閱讀學習,之後Kimi就可以針對用戶提出的問題給出專業診療建議。

資本市場望風而動,新概念股流行

有趣的是,Kimi升級的消息最先震動的並非AI圈,Sora出世以來對AI市場風向敏感的資本市場反應迅速,搶先一步開始了狂歡,推動Kimi很快成爲資本市場的新寵。

首先開始大漲的,是素有A股“妖王”之稱的九安醫療。自3月19日起,九安醫療股價突然垂直起飛,從當日開盤的41.96元/股,在4個交易日內一度漲至最高54.98元/股,而原因僅僅是因爲在去年8月時,九安醫療曾經投資過月之暗面。

3月20日開始,與Kimi相關的概念股終于集體爆發,“kimi概念股”成爲A股市場上冉冉升起的一個全新的概念,多家上市公司因此集體收益,其中包括華策影視、掌閱科技、中廣天擇等。根據一周牛熊股發布的“本周漲幅最大個股TOP10”,3月18日到3月22日,華策影視股價一周大漲95.41%,堪稱“最強Kimi概念股”。

但Kimi概念股高歌猛進的勢頭並沒能持續太久,多家股市在短期驟漲後就很快開始降溫。25日開始,中廣天擇收盤跌停,福昕軟件、華策影視雙雙大跌,跌幅分別爲15.01%、12.93%;廣宇軟件、深信服、易點天下跌幅均超10%,掌閱科技更是險些在短期內上演了一出“天地板”。開盤以來,掌閱科技一度實現10天6板,但很快股價就大幅劇震,收盤跌近6%。

“Kimi延續了人工智能領域的火熱,因能與智能車等諸多産業結合,所以市場天花板很高。加上政策扶持,受資金青睐在意料之中。”科技分析師趙松解釋道:“該板塊的注意力一般聚焦在資金面和企業估值擡升上。券商炒熱概念然後退出賺錢,導致該板塊短期內出現較大的波動性。”

舊賽道新高度,AI長文本內卷升級

事實上,Kimi主打的長文本賽道本身並不算是目前AI領域的“潮流”賽道,甚至在Sora推出之前,業內就有聲音認爲單一的大語言模型必將被淘汰,多模態轉型才是未來趨勢。但就是在這樣的背景下,月之暗面依然將長文本大語言模型內卷到一個所有人都始料未及的新高度,讓AI長文本再度成爲一時熱點。

無論走哪個賽道,只要做到業內頂尖就不怕沒有市場。隨著Chat GPT發布,AI文本分析和生成就已經不再是什麽稀奇事,日常的工作學習和生活中,不少人也已經逐漸習慣于利用AI助手處理文本,但自始至終,由于目前市面上主流的AI大模型産品在promot的輸入上都存在字數限制,應用場景還是相當局限。

比如GPT-3.5上下文輸入長度約在1.6萬token(token即模型輸入和輸出的基本單位),GPT-4在3.2萬token。把token量化成人類語言的話,3.2萬token的GPT-4達到了閱讀一篇短篇小說的程度,但並不支持閱讀長篇小說。

相比于同賽道的其他文生文大語言模型應用,Kimi自誕生起的核心競爭力就聚焦于長文本分析聯網搜索、文檔處理等功能,在處理分析長文本材料,如厚重的學術文獻、古籍之類,Kimi的性能遠超其他模型。因此Kimi的出現和突破可以說填補了目前AI文本處理方面的市場空白。

有用戶實測了Kimi在長文本閱讀上的表現,發現其在理解超長文本,比如小說和長篇文件上確實具有獨到優勢。輸入一本長達70多萬字的《紅樓夢》,Kimi只用耗時數秒就能給出一篇漂亮的總結報告。

但是舊賽道的內卷並沒有被Kimi終結,反而很快卷出新高度。在Kimi宣布升級後,阿裏和360在幾日後就相繼宣布自家AI助手將免費開放長文本功能。阿裏旗下國産大語言模型通義千問預告即將免費開放1000萬字的長文檔處理功能,如果順利問世就會成爲全球文檔處理容量第一的AI應用。360更是在23號直接宣布其AI大模型智腦正式開啓內測500萬字長文本處理功能,並入駐360AI浏覽器。

Kimi讓AI界再度聚焦大語言模型領域的藍海商機,一批資本開始回流。“隨著競爭對手們相繼發力長文本處理,Kimi的差異化優勢或將不會太突出。如果大家都宣布免費開放,企業們的盈利問題將日益嚴峻。”趙松表示。

無損長文——通往通用人工智能的鑰匙

通用人工智能(General Artificial Intelligence),是指具有高效的學習和泛化能力、能夠根據所處的複雜動態環境自主産生並完成任務的通用人工智能體,具備自主的感知、認知、決策、學習、執行和社會協作等能力,且符合人類情感、倫理與道德觀念。換言之,通用人工智能就是具有真正“智能”的人工智能,是幾個世紀以來人工智能努力發展的最終方向。

即便當下現有的人工智能已經足以突破人類的固有想象,但實際上依然都停留在弱人工智能階段,離真正的人工智能相差甚遠。而無損的長上下文,就將會是走向通用人工智能的一個關鍵的基礎技術。月之暗面創始人楊植麟表示:“曆史上所有的模型架構演進,本質上都是在提升有效的、無損的上下文長度。上下文長度可能存在摩爾定律,但需要同時優化長度和無損壓縮水平兩個指標,才是有意義的規模化。”

時間回溯到2022年底,AI界的“破壁人”ChatGPT問世,相比以往AI産品,這款不僅可以流暢地與人類進行對話,還能夠在這個過程中完成多項自然語言處理任務的大語言模型徹底打破人工智能局限于某一特定領域的桎梏,讓人工智能摘下了“人工智障”的標簽,爲通用人工智能帶來了曙光。而今天,Kimi揭開AI大模型在長文本領域的高速發展序幕,強大的長文本處理能力必將使AI在知識獲取、專業文檔分析以及語義理解等更加複雜的任務上産生巨大的實用價值,拓展AI應用前景。

0 阅读:46
评论列表
  • 2024-03-28 15:57

    感覺這個營銷沒起多大作用

今日商訊

簡介:解讀商業世界的奧秘