國産AI新銳,千億大模型“躍問”,多模態測試力壓GPT4V

開心蓋土 2024-04-02 03:07:42

國産AI黑馬——階躍星辰攜千億參數大模型工具“躍問”強勢登場,多模態測試更勝 GPT-4V 一籌,同時還推出AI角色扮演類軟件冒泡鴨。這家名爲階躍星辰的AI公司由微軟前高管姜大昕創辦,其背後的千億參數大模型Step-1和Step-1V鋒芒畢露。

爆火的KimiChat很好用,但比起GPT4、Claude3和Gemini1.5這些多模態大模型來說畢竟沒法識別圖像,現在終于有很好的國産多模態大模型了。

Scaling Law 的信仰者

這家低調潛行一年的初創公司,究竟有何獨特之處?階躍星辰,顧名思義取自“階躍函數”,其發展理念深受“Scaling Law”的影響。Scaling Law于2020年由OpenAI提出,該理論認爲,隨著模型規模的擴大,性能也會隨之提升,並最終實現階躍式的突破,通俗點說就是給AI堆數據,堆算力,最後力大磚飛。階躍星辰團隊堅信 Scaling Law 是通往 AGI(通用人工智能) 的關鍵路徑,並致力于打造更大規模、更高性能的大模型。

Scaling Laws for Neural Language Models ---OpenAI

厚積薄發,一鳴驚人

成立僅一年,階躍星辰便交出了亮眼的成績單:

Step-1 千億參數語言大模型: 僅用 2 個月訓練完成,性能全面超越 GPT-3.5。

Step-1V 千億參數多模態大模型: 擁有出色的圖像理解、多輪指令跟隨、數學、邏輯推理、文本創作等能力,在“司南”多模態模型評測榜單中位列第一,比肩 GPT-4V。

Step-1V擁有出色的圖像、圖表、視頻理解能力,還能根據所理解的多模態信息完成內容創作、推理分析等多重任務。不僅文字輸入,給它一張圖片或者視頻,都能精准解讀內容並給出全面總結。階躍星辰專門設置了"一圖讀懂"工具,只需丟入文檔、圖片,躍問就能生成圖文並茂的信息高度總結,方便用戶一覽內容要點。這種功能在工作學習中無疑將提升人類的效率。

鏈接:stepchat.cn/textposter

Step-2 萬億參數 MoE大語音模型 (預覽版): 國內首個發布的萬億參數模型,采用 MoE架構,每個 token 都能激活 2000 億以上的參數。目前預覽版僅提供API接口試用,尚未開放。

“躍問”:效率助手的多模態實力

躍問是階躍星辰推出的首款 C 端應用,定位爲個人效率助手,其強大的多模態理解能力令人印象深刻:

輕松解讀複雜圖表: 准確理解圖表信息並進行總結。

精准識別圖片內容: 識別照片中的景點,並給出出行建議。

秒懂網絡熱梗: 無論是諧音梗還是文化梗,都能輕松解讀。

長圖文一鍵總結: 將冗長的文件、報告等內容,自動生成重點解析的長圖文。

鏈接:stepchat.cn/chats

“冒泡鴨”:AI 開放世界,無限可能

冒泡鴨是階躍星辰推出的 AI 開放世界平台,用戶可以與各種 AI 智能體進行互動,體驗不同的劇情和遊戲,甚至可以創建自己的智能體。

冒泡鴨有APP和網頁端,跟全球AI應用top50中,排名第三的Character.AI一樣,是一款AI角色扮演類軟件。它同樣可以自由設定角色劇情,跟其宣傳的一樣,“十億個精彩角色,十億種劇情世界”,每個人可以放飛思想,按自己的想法給AI設定角色,劇情,更難得的是,它還預設了角色聲音,玩的時候會更有沉浸感。

鏈接:maopaoya.com/

對于階躍星辰來說,訓練出千億大模型只是通往AGI的第一步。他們提出了"單模態發展→多模態融合→理解與生成統一 →世界模型→AGI"的技術路線圖,下一步的目標就是實現多模態理解與生成的完全統一。屆時,大模型將擺脫孤芯模態的瓶頸,邁向真正的通用智能。

我們欣慰的看到階躍星辰正在走OpenAI的路,向AGI的目標穩步邁進,希望他早日追上並領先。未來,階躍星辰將如何突破,讓我們拭目以待。

0 阅读:290
评论列表
  • 2024-04-03 19:36

    好巧不巧,老馬開源不久

開心蓋土

簡介:感謝大家的關注