怎麽向大模型要生産力,訊飛星火的“三問三答

商業科技有我讀 2024-04-01 02:06:59

埃弗雷特·羅傑斯在《創新與擴散》中提出過一個著名觀點:一種創新在剛起步時接受程度比較低,使用人數較少,擴散過程也就相對遲緩,當使用者比例達到臨界值後,創新擴散過程就會快速地增加。

風頭正盛的大模型浪潮,再次印證了創新擴散理論的適用性:三年前還只有少數幾個科技大廠參與,價值被初步驗證的2023年,即上演了“百模大戰”的一幕,2024年大概率是大模型落地應用的元年,向千行萬業加速擴散。

由此産生的一個問題是:怎麽將大模型的能力延伸到産業一線,最適合中國産業結構的路徑是什麽?

半個多月前的華爲中國合作夥伴大會2024上,科大訊飛副總裁劉江參與了“計算峰會”的討論,圍繞大模型落地應用的路線、場景和生態,分享了訊飛星火在過去一年時間裏的探索和答案。

01 大模型的能力從何而來?

盡管不同統計口徑下的數據有所差別,但可以肯定的是,目前國內的大模型數量已經有上百個,用“遍地都是”來形容大模型行業,並不算誇張。問題在于,爲什麽大模型的數量越來越多,産業應用尚未渡過拐點?

大模型的行業競爭,從來都不是拼數量的遊戲,經過一段時間的跟風、躁動後,還是要回到能力上。

2024年1月30日,訊飛星火正式升級到V3.5版本,在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級,其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo的96%,多模態理解達到GPT-4V的91%。

同期發布的星火語音大模型,在中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI的Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種平均MOS分絕對提升了0.25,擬人度超過83%,均達到了國際領先水平。

訊飛星火認知大模型在“百模大戰”中脫穎而出的背後,離不開昇騰AI和科大訊飛在算力底座上的聯合突破。

時間回到2023年4月,訊飛星火V1.0發布前夕。有別于一些大模型廠商搶時間上線的做法,科大訊飛在同步思考一個長遠問題:爲了避免被卡脖子,怎麽將大模型的能力架構在一個自主創新的體系上?

接下來近一年的時間裏,昇騰AI和科大訊飛針對大模型訓練進行了一系列技術攻關,包括大模型底層算子庫開發和優化、大模型算法遷移、超大規模集群智能化運維軟件開發等等。

雙方聯合開發和優化了50多個大模型算子,其中科大訊飛基于昇騰自主開發自定義的關鍵算子就超過10個,最終讓大模型的訓練性能提升了3倍以上,和國外同類産品不相上下。

6個月後的訊飛開發者節上,雙方向外界公布了一個新消息:首個支撐萬億參數大模型訓練的國産算力平台“飛星一號”正式啓用,基于昇騰AI基礎軟硬件平台和大容量交換機構建參數面無損ROCE組網,配置高空間的全閃和混閃並行文件系統,可以支撐萬億參數大模型高速訓練。

解決了大模型的算力底座後,聯合創新的勢能被進一步釋放,先後訓練出了訊飛星火V3.5、星火語音大模型、星火開源大模型以及12個行業大模型,爲大模型的能力提升注入了源源不斷的動力。

02 大模型的能力怎麽輸出?

大模型的能力不能停留在參數上,停留在評測報告中,想要解放生産力,前提是讓大模型的能力落到一個個業務場景中。由此産生的關鍵問題是:大模型的能力怎麽輸出,怎麽降低落地門檻?

經過一年多的摸索後,行業上下遊逐漸形成了一種共識,即通過預訓練産生通用大模型,再在通用大模型的基礎上,使用特定的行業數據精調出行業大模型,然後基于通用大模型或行業大模型來開發應用。

訊飛星火遵循了大模型落地的行業共識。有所不同的是,訊飛星火還提供了一條條通往産業一線的路。

爲了滿足不同規模不同場景的快速部署需求,訊飛星火在“飛星一號”的基礎上,進一步開放了底層算力構建和運維能力、大模型訓練平台和工具鏈,以及數據清洗、數據訓練、應用開發等全套工具,讓企業可以構建自己的智算底座。

爲了滿足企業專有大模型的推理應用需求,科大訊飛和華爲在2023年8月發布了“星火一體機”,提供底層算力、AI框架、訓練算法、推理能力、應用成效等AI能力,讓每家企業或機構都能獲得“開箱即用”的大模型一體化解決方案。

爲了加速企業大模型應用價值的落地,科大訊飛的答案是星火優化套件,包含星火通用大模型、行業大模型優化套件和場景應用優化套件,並未局限在模型和算力層面,而是嘗試在配套服務和能力上打通大模型落地的“最後一公裏”。

回到創新擴散理論的話題上,創新擴散的過程離不開千千萬萬的開發者,他們無疑是大模型走進千行萬業的“螞蟻雄兵”。特別是整個行業還處于“摸著石頭過河”的階段時,“獨角戲”注定不是可行的方式。

所以,訊飛星火在幫助企業和機構降門檻的同時,不斷向開發者抛出橄榄枝,不斷拉近開發者和大模型的距離。

比如訊飛星火在昇思社區等平台上開源了13B大模型,並向開發者提供基礎模型、精調模型、微調工具、人格定制工具、高質量多語種語料等等,通過給開發者提供全生命周期的服務,讓他們把精力聚焦在想要解決的問題上,做最大的投入和努力,而非把時間花在不必要的事務中。

簡單做個總結的話,訊飛星火的路線並不複雜:一方面降低大模型的門檻,涵蓋訓練、推理、部署等環節;另一方面爲開發者賦能,讓他們參與到大模型落地應用的浪潮中。初衷則是借助合理的分工,跑通大模型價值釋放的産業鏈條,讓大模型不再是美好卻空洞的花瓶,而是實實在在的生産力。

03 大模型落地到哪些場景?

大模型的落地又不能一味求快。很多行業對大模型的態度仍是技術上的新鮮感,勢必要有一個價值持續驗證的過程,落地到哪些場景,帶來什麽樣的價值,直接影響著外界對新生産力的認知。

就像瓦特在改良蒸汽機後,沒有預想中那樣迅速在全世界鋪開,而是經曆了近半個世紀的探索,直到在紡織領域“打敗”水能,才讓蒸汽機和産業革命挂鈎。每一次工業革命的出現,與其說是技術課題,不如說是一個經濟課題。

同樣的問題也擺在大模型面前,成爲新一輪工業革命“引擎”的前提,是産生肉眼可見的經濟效益。

科大訊飛在2023年7月打造了一支名爲“星火軍團”的精銳隊伍,被定義爲探索大模型價值落地的戰略業務組織。曆經9個月的穩紮穩打,星火大認知模型帶來的生産力變革正在被越來越多的行業認可。

在能源領域,國家能源集團與科大訊飛聯手開啓了能源行業數字化、智能化轉型的新篇章。

在智慧城市領域,湖北省利川市依托訊飛星火認知大模型和昇騰算力,構建了自主創新人工智能公共算力平台,驅動利川數字産業、智慧文旅、康養産業、智慧農業等領域全面發展。

其中利川文旅大模型發布將在今年五一正式上線使用,將從旅遊線路規劃、旅客需求收集、客流高峰控制等方面,爲景區的精細化管理提供科學高效的輔助決策,推動文化和旅遊深度融合、一體化發展。

在科研領域,中科院文獻情報中心與科大訊飛合作推出的星火科研助手,提供成果調研、論文研讀和學術寫作三大功能;三亞崖州灣科技城借助科研助手增強科研文獻檢索和分析能力,並通過科技文獻大模型爲科研人員提供建議指導,提高了研究效率和質量。

在銀行領域,與某國有銀行強強聯合,實現訊飛星火在客服、展業、辦公、研發等場景的賦能,並正在重點打造銀行領域的代碼能力應用標杆。

在教育領域,謙萃智能利用iFlyCode智能編程助手爲教師提供了高效的備課支持,簡化課程內容,使學生更易于理解和掌握。在團隊協作的項目中,iFlyCode顯著減少了所需的人力和時間資源。這些綜合效果共同促進了教育資源的優化配置和學習效率的整體提升,得到了師生們的廣泛認可。

諸如此類的案例還有很多。需要說明的是,以上只是訊飛星火示範的標志性應用場景,目的是幫助企業探索大模型在B端的商業化之路,讓千行萬業看見大模型的價值所在。

在訊飛開放平台上,生態開發者團隊609.5萬,其中大模型直接開發者的數量41萬,他們才是點燃大模型落地應用的星星之火,不斷將大模型的能力帶入到實際工作中,不斷拓寬大模型應用的邊界。

04 寫在最後

大模型的産業之路還很長,昇騰AI和訊飛星火的合作,無疑爲外界提供了一種值得借鑒的範式:在算力等基礎設施上打破大模型訓練的瓶頸,爲大模型的能力輸出開辟出一條條可行的路,然後由開發者們創造無數個解決問題的應用。

有理由相信,沿著這樣已經被證實的路徑走下去,持續做好應用落地,形成數據飛輪,同時在大模型層面進行可持續叠代和進化,終將會渡過大模型産業應用的“拐點”,帶來百倍、千倍的需求,營造出充滿生機的大模型産業生態。

0 阅读:0

商業科技有我讀

簡介:感謝大家的關注