科大訊飛不講大模型的“性感故事”

財經無忌 2024-05-01 09:33:16

文 | 山核桃

2024年的大模型故事,依舊熱鬧非凡。

大洋彼岸外,從Sora的橫空出世到Llama 3再度掀起的“開源 vs 閉源”之爭,再到各類集成大模型能力的AI硬件......在通往AGI的征途上,爲了讓大模型落地,海外科技巨頭靠著scaling laws(規模定律),並沒有停下腳步。

不久前,OpenAI創始人Sam Altman就在演講中表示:“scaling laws依舊有效,GPT-5將比GPT-4聰明得多,我們還沒有到達這條曲線的頂端”。

scaling laws是一條OpenAI驗證過的道路,通過堆算力、卷參數,提升大模型能力,進而抵達真正的通用人工智能階段。

但回到國內大模型行業,scaling laws所面臨的一個現實難題不僅是以芯片爲代表的國內外産業鏈基礎的差距,更關鍵的一個問題是:

如何去發揮從移動互聯網時期中國技術企業的場景和應用優勢,在堆參數之外,找到讓模型高效落地于行業應用的路徑,將實驗室裏的模型能力轉化爲看得見的應用價值?

在這一問題上,作爲國內大模型行業頭部梯隊的科大訊飛,已率先找到了一條新路。

1、拼底座,破解技術焦慮的“正確姿勢”

回到轟轟烈烈的大模型熱潮,隨模型參數量和數據集的增長,大模型的能力邊界進而拓展與叠代,這無疑是scaling laws給國內AI玩家們所帶來的關鍵啓示。

在行業過去殘酷的“百模大戰”裏,盡管國內湧現出諸多行業模型和垂直應用,但如果提及國內大模型玩家的焦慮,排在第一依舊是“技術底座”上的難關,這包含兩個核心問題:一是算力夠不夠用、好不好用?二是對標OpenAI的GPT-4/4V乃至未來的GPT-5等底座基礎模型,國內通用大模型能力能否不斷縮小差距?

在算力層,據李飛飛的估算,最新一代人工智能模型的訓練成本已達到前所未有的水平。比如,OpenAI的GPT-4預計使用了價值7800萬美元的計算資源進行訓練,而谷歌的Gemini Ultra則耗費了接近2億美元的計算資源成本。

回到國內,受地緣政治影響,在美國對華芯片制裁的外部壓力下,國內大模型玩家不可避免地面臨算力稀缺等問題。同時,大卷算力所帶來的高昂算力成本,也擡高了大模型落地的門檻,算力太貴也是一大現實難題。

緩解大模型落地的算力焦慮,上到國家政策支持,下到企業布局,均在行動。不久前,北京市發布《北京市算力基礎設施建設實施方案(2024—2027 年)》,明確指出,將大力推動人工智能大模型與自主可控芯片開展適配,提升我國智能算力産業供應鏈的安全性、穩定性和堅韌性。

作爲中國人工智能的“國家隊”,科大訊飛給出的思路是,打造國産化自主可控的算力底座,爲大模型行業提供新的“算力選擇”。 爲此,科大訊飛同華爲強強聯手,在算力底座上合力打造出了首個萬卡規模的國産算力平台“飛星一號”,華爲的硬件能力結合科大訊飛的AI技術沉澱,一個自主可控的算力底座爲國內大模型生態注入了新的活力。

在此基礎上,底層模型能力的競賽也在同步進行,國內外科技巨頭都在加速追趕與超越GPT-4,對通用模型能力進行叠代。

在國內大模型玩家中,科大訊飛爲數不多對外公布其模型叠代具體時間表的科技企業。今年1月30日,科大訊飛發布的“訊飛星火V3.5”,在邏輯推理、語言理解、文本生成、數學答題、代碼、多模態各個能力方面均實現大幅提升,整體性能已接近GPT-4 Turbo。

不久前,科大訊飛又宣布了V3.5版本的能力更新,聚焦用戶高效知識獲取的長文本、長圖文和長語音功能。以如今已成爲大模型“標配”的長文本爲例,目前星火大模型的通用長文本能力總體已達到GPT-4 Turbo,且在多個垂直領域的知識問答任務上,星火大模型長文本總體水平已超過GPT-4 Turbo。

一個行業共識是,隨著模型技術的收斂與行業競爭格局的演變,2024年,大模型的競爭焦點依舊落在通用大模型能力上。一方面,通用大模型的能力優劣決定中國大模型産業能否掌握自己的核心話語權;另一方面,唯有底層通用大模型能力持續提升,追趕國際最先進水平,行業大模型才能有更好的成效。

圍繞算力和通用模型上的持續加碼,這是夯實技術底座的必由之路,也是破解技術焦慮的正確姿勢。 這也意味著,圍繞技術底座的研發投入,也決定著國産模型廠商的未來身位。

科大訊飛在研發投入上有自己清晰的節奏和策略。在近期公司業績說明會上,科大訊飛董事長劉慶峰透露,2023年,科大訊飛基礎大模型研發和行業應用研發中的比例約爲7:3,今年,依舊會把50%的研發投入用于大模型底座能力上。劉慶峰預測:“中美之間的底座模型能力還存在半年到一年的動態追趕過程,但中國是唯一不會被徹底甩開的國家,科大訊飛作爲中國的國家隊正在持續縮小與美國同行的差距。”

2、拼落地,科大訊飛的“雲、邊、端”之道

在scaling laws給大模型玩家們帶來的“卷技術底座啓示”外,眼下,告別火熱吸睛“參數”等性感概念,大模型的競爭已進入到下一賽點——無論是做應用,還是搶客戶,關注的重點都放在了模型落地和應用的廣度與深度上。

海外如微軟、谷歌等科技巨頭,不僅已加速將大模型能力集成已有産品矩陣中,同時也與諸多行業頭部客戶開展AIGC領域全方位的合作。

客觀來說,在“大模型如何落地”這一問題上,行業至今未能有人給出完美的範本答案。背後原因有兩點:一是從供需兩端看,由于大模型技術發展依舊屬于早期階段,需求方對自身業務落地大模型的需求和價值還在摸索,而作爲供給方的模型廠商也在通過供給創新找到落地的範式。二是大模型技術是一種“生産力”,落地産業就需要建立起供需兩端的循環體系,各參與方都要“有利可圖”,比如行業和産業端需要的是更有性價比的大模型,而模型廠商同樣需要借助大模型實現變現。

大模型如何卷“落地”?科大訊飛給出的解題思路是——從現實的場景需求出發,“雲、邊、端”一體化、全場景布局,來滿足各個複雜多元場景對大模型的需求。

在雲側,科大訊飛在開始大模型技術攻關時就確立了“1+N”的大模型體系,在基礎通用大模型外,同步面向各個行業落地行業大模型與産品應用 ,比如教育大模型、醫療大模型,同時攜手金融、能源、汽車、通信、化工等領域龍頭企業共同打造行業大模型。

于此同時,面向開發者,除了開放API和RAG、Agent等大模型配套能力方案,也開源了訊飛星火-13B模型,支持行業進行場景化定制微調。在過去不到3個月的時間裏,科大訊飛就新增了55萬實名認證的開發者,其中一半以上的應用服務落地于企業剛需場景。

訊飛星火APP也在獲得越來越多用戶的認可。據七麥數據顯示,訊飛星火APP在安卓端的下載量已經超過9600萬次,在國內工具類通用大模型APP中排名第一。

在邊側,針對企業的私有化部署需求,科大訊飛與華爲聯手打造的“訊飛星火一體機”可針對企業的高頻場景應用需求, 提供“開箱即用”的大模型一體化解決方案,目前已落地城市、金融、運營商、制造、能源、汽車等諸多行業場景。

在端側,科大訊飛一方面將大模型能力落地學習機、翻譯機、辦公本等自有智能硬件,另一方面,將大模型的能力深度賦能行業 ,正在落地汽車、家電、機器人、AI手機、AI PC等領域,在人們觸手可及的終端産品上,帶來體驗的升級。

比如,汽車場景中,通過端側小模型+雲側大模型協同,既能夠解決用戶在無網弱網環境下的交互,還能更好地保護隱私,對于簡單問題直接在本地端解決,複雜問題在雲端解決,既能給用戶帶來很好的體驗,也能夠有效降低成本。

“雲、邊、端”布局帶來的利好是雙重的。

首先,開年以來,爲大模型技術能力找到最佳的入口與載體,已成爲業內共識,“三劍齊發”能更大範圍內釋放大模型的落地價值,將大模型引向一條實用的路徑。其次,對科大訊飛而言,“雲、邊、端”協同可以更好地滿足各種場景中的應用需求,不同尺寸的模型組合使用,成本更低、效率更高,爲其商業化提供了更多的通路。無論是大模型賦能的智能硬件銷量表現,還是開發者的快速增長,都顯示科大訊飛走在商業化的前列。

不過,“雲、邊、端”的布局並非人人可做,人人能做。

科大訊飛的優勢在于從後端技術到前端應用場景的系統化能力。 在後端技術層,一方面是基于國産自主可控軟硬件底座所打造出的不斷叠代的星火通用大模型,另一方面,是科大訊飛從模型、框架、工具和應用層的全棧技術布局。

在前端應用場景上,科大訊飛憑借過硬的工程化能力,在效果接近無損的情況下,讓模型尺寸具備“七十二變”的能力,從而實現大模型地高效部署。

據了解,科大訊飛面向不同場景和硬件平台, 提供從面向雲端百B級、十B級到面向端側硬件的B級模型,覆蓋雲+端各類場景和應用,以此滿足各行業複雜場景模型需求。

此前科大訊飛推出13B長文本大模型就是一個例子。在大模型廠商集體“卷長文本”的時代,與動辄千億參數的大模型相比,科大訊飛通過對模型尺寸的“剪枝”和“蒸餾”,從小搏大,推出了業界性能最優的130億參數的大模型,在效果損失僅3%以內的情況下,星火在文檔上傳、解析處理、知識問答的首次響應時間和文字生成方面都有了極大的效率提升。

“雲、邊、端”的全場景布局,從後端技術到前端應用的互相支撐,既延伸了模型落地的廣度,科大訊飛爲大模型落地找到了更多的場景,也拓展了模型落地的深度,行業積累的數據、knowhow能進一步反哺模型能力的叠代,這是一個更健康的循環。

3、拼價值,少有的“技術務實派”

在不少業內人士看來,2024,是大模型落地應用的關鍵之年。從開年伊始,無論是在行業大模型領域,抑或是更輕量化的SaaS企服市場,圍繞應用場景的“大模型化”成了行業玩家的統一動作。

對比國外大模型生態,中國大模型的優勢正在于應用。一方面,中國完備的産業生態下具備廣泛的場景基礎,這是大模型落地的天然優勢。另一方面,從移動互聯網時代,中國科技企業所沉澱出的應用與場景創新經驗,同樣可以複制推廣到大模型時代。

但盡管如此,在應用場景上,圍繞大模型的“價值爭議”也同樣存在。大模型的價值究竟在哪裏?AI企業大舉開發大模型又是否只是一種FOMO(害怕錯過)的心態?

在這一問題上,科大訊飛的態度則顯得尤爲務實。一方面,作爲老牌AI企業,押注AI技術二十余年,科大訊飛對AI技術的商業化探索貫穿這家企業發展始末。

另一方面,在價值理念上,在公開場合,科大訊飛董事長劉慶峰曾不止一次對外闡述“應用場景的重要價值”,劉慶峰曾明確表示,在大模型領域,“誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性循環。”

理解這一點,依舊需要回到科大訊飛BC兩端的大模型應用落地探索中來。

在to B端,國內B端業務鏈條長、個性化強且服務運維重,過去國內to B業務常常是“人要適用機器”,但科大訊飛在做得是“讓模型更好地適應人與行業”。

讓模型適應行業與人,不是光調用API接口那麽簡單,而是需要對行業場景與用戶需求進行深度理解與挖掘,這是發揮模型價值的充分必要條件。

以“大模型上車”爲例,在眼花缭亂的諸多營銷與技術概念背後,科大訊飛關注的是“價值端”:一是對車主而言,大模型是否提升了用車體驗?二是對車企而言,大模型是否爲其帶來業務增量?

沿著上述兩個思路,就能理解科大訊飛的實踐。在今年的北京車展上,科大訊飛就展示了其自研全新一代“訊飛星火+座艙”解決方案,將星火大模型的能力與用車場景緊密結合,利用大模型技術重構人車交互體驗,這一智能座艙解決方案的部分能力已在星途星紀元ET、昊鉑GT、魏牌藍山、大衆ID.UNYX與衆等車型落地。

2023年中國汽車“出海”超522萬台,出口增速達56%,首次超越日本成爲了全球領先的汽車出口國。大模型技術也在賦能中國汽車“出海”,據了解,訊飛車載智能語音系統覆蓋23個主要語種,已定點出海車型超60個,合作車型已銷往亞洲、歐洲、澳洲、非洲、美洲等地的多個國家與地區。在中國汽車出海十強企業中,已有8家企業和科大訊飛達成深度合作。

在家電領域,接入訊飛星火大模型能力的家電行業也正煥發出新的活力。如科大訊飛和海爾共同打造的家電領域大模型,在智能控制、食譜定制、智能客服等領域率先落地大模型應用場景,讓家電變得真正“更懂人心”。三星的電視語音助手同樣結合訊飛星火大模型能力,實現了AI智能問答和智能搜索。

軟件等企服市場同樣是科大訊飛“剛需場景”理念的體現。借助訊飛星火不斷叠代的代碼能力,科大訊飛不僅在內部使用上了“AI程序員”,還與軟通動力、交通銀行等行100多家企業合作,將“AI程序員”推廣複制。

在運營商市場,基于星火大模型基礎能力,科大訊飛聯合運營商打造通話大模型,並與中國移動聯合發布5G新通話“商務速記”産品,商務人事工作電話可以方便實現轉寫和摘要,解決用戶聽不清、記不全的痛點,“AI秘書”實現用戶人手一個智能接聽助理。

公開資料顯示,目前,訊飛星火大模型已與汽車、金融、能源、軟件、家電、運營商等各行業領軍企業合作,大模型落地千行百業的勢頭強勁。

而在to C端,科大訊飛則是典型的“産品思維”,從技術中來,到産品中去,追求更好的用戶體驗。

大模型加持下的智能硬件,在科大訊飛的業務版圖中表現十分亮眼。財報顯示,2023年,訊飛AI學習機整體收入增長達到120%,訊飛智能辦公本、訊飛智能錄音筆、訊飛智能翻譯機等智能辦公硬件GMV同比大增84%。

業績提升、GMV增長的背後,是C端用戶對大模型技術的認可。以AI學習機爲例,幾乎每一次的底層通用模型升級,科大訊飛均會對智能硬件産品進行一次功能叠代。目前,AI學習機已擁有了英語口語陪練、中英作文批改、數學互動輔學、百科自由問答、親子教育助手、智能編程助手等8款大模型應用。

在最新的春季上新中,結合星火大模型長文本、長圖文和長語音的升級,訊飛AI學習機産品,不僅提升在作業批改等任務上的精准性,同時也結合多模態能力升級了“百科問答”功能。融合了大量圖書知識的星火大模型,成爲了孩子們的“百科全書小助手”,孩子們可以和“愛因斯坦”等虛擬人朋友“一問一答”,在生動有趣的互動中,提升學習能力與提問能力。

除了學習機等成熟硬件産品,科大訊飛還在積極布局下一個風口。在如今“具身智能”掀起融資熱潮時,很多人並不知道的是,這一國內外科技大廠爭向競逐的機器人賽道,科大訊飛早在2022年就發布了“訊飛機器人超腦平台”,面向開發者提供了全棧的工具鏈,包括模型訓練、資産生成和軟硬件接入等。

而在大模型到來後,科大訊飛又迅速將星火大模型與“機器人超腦平台”進行了深度融合,科大訊飛如今已和頭部人形機器人明星公司中展開了合作,如智元機器人、優必選、宇樹科技等炫酷的人形機器人産品背後,是訊飛全鏈路語音與星火大模型的加持。

從拼底座、拼落地再到拼價值,從這一點來說,比起那些炫酷十足的PPT展示,科大訊飛的大模型實踐似乎並不“性感”,但卻足夠接地氣。科技史曾告訴我們,無論是iPhone之于智能手機,還是chatGPT之于大模型行業,技術實現顛覆的前置條件,是讓技術紮根需求與場景。

而科大訊飛的這一“務實”,讓我們看到了在大模型熱潮之下,更期待看到的場景——在不久的將來,大模型能迎來“星火時刻”,真正在千行百業中落地生根。

0 阅读:26
评论列表
  • 2024-05-01 21:51

    支持迅飛,發力揚我中華大地之光

財經無忌

簡介:我們更懂中國商業