AI大模型博鳌破局:端雲結合,驅動新質生産力

鋅刻度 2024-04-02 02:10:39

在“博鳌時刻”,vivo藍心大模型等被明確定調爲,是打造“新質生産力”的孕育沃土。

作者|楊 銘

編輯|劉珊珊

海闊風清,椰林蔥郁中,風口上的AI大模型,站上博鳌亞洲論壇2024年年會多個主題分論壇的C位。

“未來是屬于AI大模型的,千行百業將被重塑或被革新挑戰。”衆多嘉賓、參會人士在博鳌的激昂熱情,再次明確一個趨勢:盡管AI大模型發展並非坦途,卻注定成爲推動新一輪技術變革和産業變革的核心驅動力。

類似“驚呼”,時有耳聞。所不同的是,在“博鳌時刻”,AI大模型被明確爲,是打造“新質生産力”孕育沃土的定調。

博鳌亞洲論壇年會期間,人民網正式發布《2024年中國AI大模型産業發展報告》,多維度探討中國AI大模型發展現狀和典型案例時,表達了AI大模型是加快發展新質生産力的關鍵要素,將對中國經濟産生深遠影響。

不止人民網,工信部新聞發言人趙志國在談及新質生産力時,同樣明確表態,將加快推動大模型爲代表的人工智能賦能制造業發展。

作爲2024年以來大衆最關注熱點,“新質生産力”是以科技創新爲主,擺脫傳統增長路徑、符合高質量發展要求的新型生産力。

從蒸汽機、電力到互聯網,生産力叠代一直是人類文明發展內生引擎——其特點都是創新,關鍵在質優,本質是先進生産力的內生創新邏輯。

“曆史不會簡單重複,它會押著同樣的韻腳。”對AI大模型而言,應如何去抓住新質生産力轉型升級契機?如何加速推動AI大模型,走入千家萬戶甚至我們每個人?

01

進入下半場,AI大模型痛點猶在

截至2024年3月,國內大模型數量超243家,以通用大模型爲主,發展到行業大模型、端側、端雲結合等多種模式並行的“百花齊放”階段。

其中,通用AI大模型以百度文心一言、阿裏通義千問、科大訊飛星火爲代表;行業大模型涵蓋容聯雲赤兔、用友YonGPT等;端側AI大模型以蔚來NOMI GPT爲代表。既是通用大模型,也是“端雲結合”的AI大模型,以vivo藍心大模型爲代表。

落地應用看,語音識別、人臉識別、機器翻譯、內容生成等應用領域以外,大模型逐步在制造、教育、醫療、金融、化工等垂直領域得到廣泛應用。比如,AI大模型已在部分醫院影像AI、智能導診、輔助診斷等場景發揮作用,農村用戶“足不出戶”也可以完成診斷。

這就是在打造新質生産力。工信部賽迪研究院數據顯示,2023年,我國生成式人工智能企業采用率達15%,市場規模約14.4萬億元。

這僅僅是AI大模型與千行百業結合,助力實體經濟突圍的開始。

“新質生産力代表著新技術、創造新價值、適應新産業、重塑新動能的新型高質量生産力。”博鳌“實體經濟的突圍”論壇上,vivo執行副總裁、首席運營官、vivo中央研究院院長胡柏山就認爲,在實體經濟如何突圍商,制造行業沒有選擇,只有順應新技術革命和産業變革趨勢,跑出加速度,才能滿足新時代下的用戶需求。

但從大趨勢而言,AI起起落落、沉沉浮浮數十年,中國AI大模型想真正成爲孕育“新質生産力”的沃土,依然面臨諸多艱巨挑戰。

“當前大模型産業挑戰包括算力分散不足、Transformer 結構是否爲最優的疑問、領域數據稀缺、缺少現象級應用等問題。”vivo副總裁、vivo AI 全球研究院院長周圍認爲。

算力局限是首要挑戰。算法是大模型訓練速度與産出質量的基礎,其能力取決于高性能、高成本的AI芯片。

比如,H100 GPU是英偉達專爲AI大模型設計的芯片,售價高達每塊3萬美元。去年僅Meta、微軟就分別購買了15萬塊 H100 GPU,花費高達45億美元。

算力采購成本高昂外,目前中國企業還受進出口限制影響,獲取的只是性能弱于H100的替代品英偉達A800,且依然供不應求情況——盡管國産自研AI芯片進展快速,性能仍與國際頂尖水平存在一定差距。

而東西部算力供需失衡、跨數據中心算力調度難、算力基礎設施能耗大、企業利用算力成本高等等,都是國內企業算力技術痛點。

高質量數據匮乏,是不可忽視的第二大挑戰。數據對大模型訓練重要性不言而喻,當前國內AI大模型數據主要來自電商、社交、搜索等渠道,高質量數據成爲稀缺品。

中國工程院院士高文曾在演講中提到,全球大模型産業普遍面臨訓練數據瓶頸,其中中文數據尤爲匮乏,全球通用50億大模型數據訓練集裏,中文語料僅占1.3%。這一痛點,在要求更高專業垂類數據領域更加凸顯。

大模型架構的局限性,也亟須破局。當前主流大模型無一例外都建立在Transformer架構堆疊的基礎上——該架構源自谷歌大腦團隊2017年發表的《Attention is all you need》論文,推動整個AI領域重大突破。

最大問題是,這種架構對計算資源消耗特別大,存儲設備要求非常高、應用群體也有局限性。

比如,面向C端大模型的應用産品都是通用大模型,專業性不足,存在成本高昂、安全性問題;垂直行業大模型,針對C端應用又不足。更嚴重問題是,架構一樣下,很多大模型能改動的是訓練方法、數據配比,出現大模型同質化趨勢。

相比國外,國內AI大模型至今沒有出現爆款級應用,是産業化落地一大難題。原因在于,因爲算力稀缺,缺乏滿足客戶需求的個性化應用——很難將大模型像微信、抖音那樣,包裝成大範圍使用的C端産品。

加上AI大模型誕生以來,就伴隨的道德、安全風險爭議,如何讓每位用戶可以充分享受大模型真正便利,推動各行各業數字化進程落地,是當下AI大模型的共同考驗。

02

破局有道,“端雲結合”爲核心

理想照進現實。從根本上轉變AI大模型的技術路線——“把大模型和終端結合”,成爲業界心照不宣的破局共識。

最近半年來,從高通、英偉達、AMD、英特爾等上遊芯片廠商,微軟、Meta、亞馬遜等科技巨頭,再到vivo、華爲、OPPO等手機頭部廠商,聯想等PC廠商,甚至是SOTA這樣的閉源大模型,都在集體向終端挺進,開辟AI大模型新戰場。

集體抉擇背後是,相比單一通用、專用大模型的局限性,手機、PC、可穿戴等智能設備,才是AI大模型普惠終點:一方面,在底層就可以和AI芯片適配;另一方面,終端産品形態個人化、小型化,就意味著普及和便攜,更容易走向大衆。

如同當年瓦特改良的“蒸汽機”一樣,智能手機無疑是行業和場景結合最深,連接萬物最好的“AI入口”。2023年7月以來,國內主要手機廠商紛紛將生成式AI帶入終端——包括蘋果,最新消息稱將和百度AI合作。

事實上,受體積、性能、耗電等諸多限制,相比其他應用領域,手機是大模型最難落地場景之一。

比如,直接在端側(手機)輕量化、本地部署大模型——盡管這是當前部分主流手機廠商所選擇技術路線,就失去雲端聯網大規模計算優勢,處理速度不及預期,且終端耗電加快。如果直接將大模型上傳到雲端,又存在失去個性化定制、隱私安全難以保障、成本高昂等難題。

“vivo有3億中國用戶,如果每天用10次,一天運算成本大概是3000萬元,一年需要花費約90億-100億元。”vivo副總裁周圍就曾如此簡單計算。

因此,基于對AI大模型不同理解,各家手機廠商目前形成了端側爲主,以及端雲結合的兩種部署方案。

“極點商業”綜合業內諸多人士觀察,目前vivo、華爲、OPPO選擇的“端雲結合”路線,被普遍視爲推動大模型走向大衆的主流思路。

所謂“端雲結合”,是在架構設計上雲、端協同,即在雲端部署百億、千億級別的通用大模型訓練模型,在手機端側部署十億級別的大模型,推出大模型矩陣。簡單來說,它既有通用大模型的C端普惠功能,又在矩陣大模型下,擁有個性化、定制化能力。

其好處是,複雜內容和任務,可以交給雲端大規模算力;部分任務也可轉移給終端,大幅降低算力成本,個性化服務,端側斷網情況下穩定運行,並有效保護用戶隱私。

其中最重要的,就是矩陣化布局。人民網發布的《報告》中,就以vivo自研“藍心大模型”(BlueLM)爲例,觀察這種“端側化大模型+大模型矩陣化”另辟蹊徑的方式,如何成功破解行業痛點。

vivo“藍心大模型”中,其打造10億、70億、700億、1300億、1750億模型參數5個矩陣,涵蓋從億級到千億級不同規模的模型,使其適配不同應用需求和算力條件。

“這源自對大模型普及痛點的洞察和預判。”周圍曾如此解釋,一是矩陣模式可解決多模態大模型不同研發階段需求;二是讓用戶在雲上使用大模型的同時,在端側本地化運行關鍵數據,滿足隱私及安全需求;三是有效平衡雲端算力成本過高問題。

其中,10億量級模型(1B)和70億(7B)由本地端側算力支撐。1B是主要面向端側場景打造的專業文本大模型,使用不需要成本。7B是面向手機打造的端雲兩用模型,語言理解、文本創作能力優秀。同時,兩者在保證數據安全同時,展現出詞快、內存低、全天候、真安全的強大端側運行優勢。

更複雜邏輯推理能力的應用,仍然需要運行在雲端,是vivo算法優勢的體現。比如700億模型綜合能力,在C-Eval、CMMLU、SuperCLUE等榜單中均處于中文大模型第一梯隊。另外1300億、1750億模型也在不斷叠代中,在更複雜場景中帶來更專業的智能體驗。

當端側化+矩陣化大模型持續成長,vivo就得以在剛剛發布的vivo X Fold3系列上,實現“端側7B”+“雲側70B”的AI藍心大模型超大組合部署,作爲當下“最輕、最強”的折疊旗艦,亮相2024年博鳌亞洲論壇,成功中國科技“新質生産力”的代表。

03

既要又要,打造生産力的“超級智慧體”

在《報告》看來,類似vivo將大模型裝進手機的“端雲結合”,有望打開對AI大模型更廣泛的應用想象,成爲發展新質生産力的關鍵驅動力。

從vivo官方數據來看,已有很多用戶體驗到AI大模型帶來的便利:藍心大模型目前覆蓋超過2000萬用戶,實現2761萬次高質量問答、生成1757萬張畫,寫了649萬份報告,“AI 修圖”功能消除了85萬個路人。

不同參數量級的大模型矩陣下,這背後既有用戶在本地化端側個性化AI修圖、AI寫報告,也有用戶雲端在線回答,AI作畫。

一切技術、産品規劃出發點都是用戶需求。從用戶角度來看,當前對手機AI大模型的期望,是爲用戶提供個性定制、智能交互、專屬陪伴、安全可信等産品體驗,打造個性化專屬私人助理。

這正是所有AI手機廠商競爭核心所在。而在用戶體驗方面,“端雲結合”也體現出自己的獨特優勢。

比如,搭載藍心大模型的vivo X Fold 3,支持超過700種手機相關功能,提供超能問答、超能創作、超能搜索、超能管理、超能交互等五大AI超能服務。

值得一提的是,實現上述超能服務,是在vivo“藍科技”品牌生態中,依托藍晶芯片技術棧、藍海續航系統、藍心大模型、藍河操作系統等多項創新技術,彙聚加持而來。

例如,全局智能輔助應用“藍心小V”、自然語言對話機器人“藍心千詢”等,和Origin OS 4的不斷叠代融合後,用戶可以在vivo手機上萬張圖片管理中,直接向“藍心千詢”說出照片內容,“藍心小V”就可主動識別有對應內容的照片。

“藍科技”整體技術儲備和加持下,“端雲結合”下的藍心大模型,帶來個性化體驗時,還圍繞生産力進行更多挖掘。在vivo X Fold 3中,一句話查找影像素材、一句話視頻剪輯、小V幫記和AI筆記創作等功能,讓AI藍心大模型成爲剪輯視頻、記錄會議、實時翻譯、整理摘要和筆記創作等多場景發揮個性化賦能作用。

值得一提的還有,AI大模型給vivo X Fold 3帶來的交互入口變化,眼動捕捉和隔空手勢功能交互模式變化——聽懂我們的需求,感知我們的意圖後,給出正確反饋,及時幫助決策。

這意味著,vivo X Fold 3這樣的AI大模型手機,早不是簡單的私人助理,而是深入賦能出行、學習、生活、工作等衆多場景,更懂你,更個性化,更互聯的“超級智慧體”。

實際上,“端雲結合”AI大模型給手機帶來的價值,並不局限在應用閉環內。AI賦能下,持續打磨的vivo辦公套件,能夠實現行業唯一支持手機、平板、網頁、Windows、Mac五端協同,滿足商務辦公全場景需求。

這可以理解爲,通過vivo辦公套件或手機,可以協同蘋果Mac筆記本、iPhone手機,能借助AI能力執行、管理。同時,衆多小型開發者可調用vivo的大模型能力,提升開發效率,在新應用領域找到機會。

這正是業內人士此前所提及的,“如果手機廠商AI助手,能理解用戶需求,控制和調用別的應用,用戶體驗會變外,手機廠商、第三方應用關系也會發生徹底的變化。”

“智慧體”+“協同開源”,讓用戶場景不斷叠代,或許是AI大模型走向大衆普適化,加速跑出“新質生産力”的主要思路。

但是,AI大模型價值,很多時候並不完全局限于商業生産,很多時候也有著“人情味”,比如vivo專爲特定人群打造的vivo看見和vivo讀譜的功能,人文關懷得以更智慧。

04

跑出加速度,大模型已成新質生産力

最近幾年,手機行業陷入持續低迷。當AI大模型浪潮洶湧而來,所有人都在期盼,AI大模型+智能手機的結合,能在人與設備結合更緊密間,成爲推動新質生産力的重要引擎。

因此,當vivo通過“藍科技”品牌賦能,打造出vivo X Fold3這樣革命性、開創性折疊産品,就被業界視爲擁抱“新質生産力”的典型範本。

人民網就在《報告》中評價,vivo通過對“端雲結合”的大模型模式有效探索,將帶動商業模式創新,牽引産業升級,爲手機未來發展指明方向。

IDC也預計,2024年全球新一代AI手機出貨量將達到1.7億部,約占智能手機整體出貨量的15%。在中國市場,新一代AI手機所占份額將在2024年後迅速攀升,2027年達到1.5億台,市場份額超過50%。

無論如何,AI大模型只是技術,技術不是拼參數,最大考驗依然是,技術如何真正服務用戶,讓應用更好落地。這需要行業所有企業,都要真正“以用戶爲導向”核心,懂得和理解每一位用戶。

這並不容易。以vivo爲例,作爲較早布局人工智能的先行者,在2017年開始籌備人工智能全球研究院,並在2018年正式組建,是首批設立專攻人工智能方向研究院的中國手機公司之一。截至目前,vivo每年在人工智能上的投入保守估計在20億到30億元。

如今,在人工智能的四個要素——數據、人力、算法、算力方面,vivo均已做到了領先。但更重要的,是在ECR管理方法下,圍繞用戶痛點,展開系統性創新和持續創新,堅持“用戶爲導向”,在AI、影像、芯片、續航、重量等領域都做到極致,始終做最正確的事,才能穩定穿越周期,滿足用戶不同場景下實際需求,也才能讓新生産力真正普惠到每個用戶。

在胡柏山看來,通過科技創新溫暖“萬家燈火”,是vivo這樣的科技企業需要具備的使命感。“不僅關注社會福祉和人類發展,也積極推動産業躍升和協同發展。”

根據vivo規劃,將在擁抱“新質生産力”中跑出加速度,預計在明年30周年之際發布MR眼鏡,同時對人形機器人賽道保持高度關注。

類似vivo對新質生産力的擁抱,也爲實體經濟突圍提供了新思路。從趨勢來看,C端用戶正成爲端側主要客群,垂直行業將是大模型主戰場。“端雲結合”趨勢下,算力成本大幅降低,無人巡檢、智能家居、工業物聯網、醫療健康、智能汽車等領域,都有望通過擁抱“新質生産力”,創造新的價值、適應新的産業、重塑新的動能。

最終,AI大模型落地應用的爆發,又會助推實體經濟和産業生態體系不斷優化調整。“推動中國經濟走出一條質量更優、動力更充沛的增長路徑。”

0 阅读:3