AI大模型博鳌破局：端雲結合，驅動新質生産力

在“博鳌時刻”，vivo藍心大模型等被明確定調爲，是打造“新質生産力”的孕育沃土。

作者|楊銘

編輯|劉珊珊

海闊風清，椰林蔥郁中，風口上的AI大模型，站上博鳌亞洲論壇2024年年會多個主題分論壇的C位。

“未來是屬于AI大模型的，千行百業將被重塑或被革新挑戰。”衆多嘉賓、參會人士在博鳌的激昂熱情，再次明確一個趨勢：盡管AI大模型發展並非坦途，卻注定成爲推動新一輪技術變革和産業變革的核心驅動力。

類似“驚呼”，時有耳聞。所不同的是，在“博鳌時刻”，AI大模型被明確爲，是打造“新質生産力”孕育沃土的定調。

博鳌亞洲論壇年會期間，人民網正式發布《2024年中國AI大模型産業發展報告》，多維度探討中國AI大模型發展現狀和典型案例時，表達了AI大模型是加快發展新質生産力的關鍵要素，將對中國經濟産生深遠影響。

不止人民網，工信部新聞發言人趙志國在談及新質生産力時，同樣明確表態，將加快推動大模型爲代表的人工智能賦能制造業發展。

作爲2024年以來大衆最關注熱點，“新質生産力”是以科技創新爲主，擺脫傳統增長路徑、符合高質量發展要求的新型生産力。

從蒸汽機、電力到互聯網，生産力叠代一直是人類文明發展內生引擎——其特點都是創新，關鍵在質優，本質是先進生産力的內生創新邏輯。

“曆史不會簡單重複，它會押著同樣的韻腳。”對AI大模型而言，應如何去抓住新質生産力轉型升級契機？如何加速推動AI大模型，走入千家萬戶甚至我們每個人？

進入下半場，AI大模型痛點猶在

截至2024年3月，國內大模型數量超243家，以通用大模型爲主，發展到行業大模型、端側、端雲結合等多種模式並行的“百花齊放”階段。

其中，通用AI大模型以百度文心一言、阿裏通義千問、科大訊飛星火爲代表；行業大模型涵蓋容聯雲赤兔、用友YonGPT等；端側AI大模型以蔚來NOMI GPT爲代表。既是通用大模型，也是“端雲結合”的AI大模型，以vivo藍心大模型爲代表。

落地應用看，語音識別、人臉識別、機器翻譯、內容生成等應用領域以外，大模型逐步在制造、教育、醫療、金融、化工等垂直領域得到廣泛應用。比如，AI大模型已在部分醫院影像AI、智能導診、輔助診斷等場景發揮作用，農村用戶“足不出戶”也可以完成診斷。

這就是在打造新質生産力。工信部賽迪研究院數據顯示，2023年，我國生成式人工智能企業采用率達15%，市場規模約14.4萬億元。

這僅僅是AI大模型與千行百業結合，助力實體經濟突圍的開始。

“新質生産力代表著新技術、創造新價值、適應新産業、重塑新動能的新型高質量生産力。”博鳌“實體經濟的突圍”論壇上，vivo執行副總裁、首席運營官、vivo中央研究院院長胡柏山就認爲，在實體經濟如何突圍商，制造行業沒有選擇，只有順應新技術革命和産業變革趨勢，跑出加速度，才能滿足新時代下的用戶需求。

但從大趨勢而言，AI起起落落、沉沉浮浮數十年，中國AI大模型想真正成爲孕育“新質生産力”的沃土，依然面臨諸多艱巨挑戰。

“當前大模型産業挑戰包括算力分散不足、Transformer 結構是否爲最優的疑問、領域數據稀缺、缺少現象級應用等問題。”vivo副總裁、vivo AI 全球研究院院長周圍認爲。

算力局限是首要挑戰。算法是大模型訓練速度與産出質量的基礎，其能力取決于高性能、高成本的AI芯片。

比如，H100 GPU是英偉達專爲AI大模型設計的芯片，售價高達每塊3萬美元。去年僅Meta、微軟就分別購買了15萬塊 H100 GPU，花費高達45億美元。

算力采購成本高昂外，目前中國企業還受進出口限制影響，獲取的只是性能弱于H100的替代品英偉達A800，且依然供不應求情況——盡管國産自研AI芯片進展快速，性能仍與國際頂尖水平存在一定差距。

而東西部算力供需失衡、跨數據中心算力調度難、算力基礎設施能耗大、企業利用算力成本高等等，都是國內企業算力技術痛點。

高質量數據匮乏，是不可忽視的第二大挑戰。數據對大模型訓練重要性不言而喻，當前國內AI大模型數據主要來自電商、社交、搜索等渠道，高質量數據成爲稀缺品。

中國工程院院士高文曾在演講中提到，全球大模型産業普遍面臨訓練數據瓶頸，其中中文數據尤爲匮乏，全球通用50億大模型數據訓練集裏，中文語料僅占1.3%。這一痛點，在要求更高專業垂類數據領域更加凸顯。

大模型架構的局限性，也亟須破局。當前主流大模型無一例外都建立在Transformer架構堆疊的基礎上——該架構源自谷歌大腦團隊2017年發表的《Attention is all you need》論文，推動整個AI領域重大突破。

最大問題是，這種架構對計算資源消耗特別大，存儲設備要求非常高、應用群體也有局限性。

比如，面向C端大模型的應用産品都是通用大模型，專業性不足，存在成本高昂、安全性問題；垂直行業大模型，針對C端應用又不足。更嚴重問題是，架構一樣下，很多大模型能改動的是訓練方法、數據配比，出現大模型同質化趨勢。

相比國外，國內AI大模型至今沒有出現爆款級應用，是産業化落地一大難題。原因在于，因爲算力稀缺，缺乏滿足客戶需求的個性化應用——很難將大模型像微信、抖音那樣，包裝成大範圍使用的C端産品。

加上AI大模型誕生以來，就伴隨的道德、安全風險爭議，如何讓每位用戶可以充分享受大模型真正便利，推動各行各業數字化進程落地，是當下AI大模型的共同考驗。

破局有道，“端雲結合”爲核心

理想照進現實。從根本上轉變AI大模型的技術路線——“把大模型和終端結合”，成爲業界心照不宣的破局共識。

最近半年來，從高通、英偉達、AMD、英特爾等上遊芯片廠商，微軟、Meta、亞馬遜等科技巨頭，再到vivo、華爲、OPPO等手機頭部廠商，聯想等PC廠商，甚至是SOTA這樣的閉源大模型，都在集體向終端挺進，開辟AI大模型新戰場。

集體抉擇背後是，相比單一通用、專用大模型的局限性，手機、PC、可穿戴等智能設備，才是AI大模型普惠終點：一方面，在底層就可以和AI芯片適配；另一方面，終端産品形態個人化、小型化，就意味著普及和便攜，更容易走向大衆。

如同當年瓦特改良的“蒸汽機”一樣，智能手機無疑是行業和場景結合最深，連接萬物最好的“AI入口”。2023年7月以來，國內主要手機廠商紛紛將生成式AI帶入終端——包括蘋果，最新消息稱將和百度AI合作。

事實上，受體積、性能、耗電等諸多限制，相比其他應用領域，手機是大模型最難落地場景之一。

比如，直接在端側（手機）輕量化、本地部署大模型——盡管這是當前部分主流手機廠商所選擇技術路線，就失去雲端聯網大規模計算優勢，處理速度不及預期，且終端耗電加快。如果直接將大模型上傳到雲端，又存在失去個性化定制、隱私安全難以保障、成本高昂等難題。

“vivo有3億中國用戶，如果每天用10次，一天運算成本大概是3000萬元，一年需要花費約90億-100億元。”vivo副總裁周圍就曾如此簡單計算。

因此，基于對AI大模型不同理解，各家手機廠商目前形成了端側爲主，以及端雲結合的兩種部署方案。

“極點商業”綜合業內諸多人士觀察，目前vivo、華爲、OPPO選擇的“端雲結合”路線，被普遍視爲推動大模型走向大衆的主流思路。

所謂“端雲結合”，是在架構設計上雲、端協同，即在雲端部署百億、千億級別的通用大模型訓練模型，在手機端側部署十億級別的大模型，推出大模型矩陣。簡單來說，它既有通用大模型的C端普惠功能，又在矩陣大模型下，擁有個性化、定制化能力。

其好處是，複雜內容和任務，可以交給雲端大規模算力；部分任務也可轉移給終端，大幅降低算力成本，個性化服務，端側斷網情況下穩定運行，並有效保護用戶隱私。

其中最重要的，就是矩陣化布局。人民網發布的《報告》中，就以vivo自研“藍心大模型”（BlueLM）爲例，觀察這種“端側化大模型+大模型矩陣化”另辟蹊徑的方式，如何成功破解行業痛點。

vivo“藍心大模型”中，其打造10億、70億、700億、1300億、1750億模型參數5個矩陣，涵蓋從億級到千億級不同規模的模型，使其適配不同應用需求和算力條件。

“這源自對大模型普及痛點的洞察和預判。”周圍曾如此解釋，一是矩陣模式可解決多模態大模型不同研發階段需求；二是讓用戶在雲上使用大模型的同時，在端側本地化運行關鍵數據，滿足隱私及安全需求；三是有效平衡雲端算力成本過高問題。

其中，10億量級模型（1B）和70億（7B）由本地端側算力支撐。1B是主要面向端側場景打造的專業文本大模型，使用不需要成本。7B是面向手機打造的端雲兩用模型，語言理解、文本創作能力優秀。同時，兩者在保證數據安全同時，展現出詞快、內存低、全天候、真安全的強大端側運行優勢。

更複雜邏輯推理能力的應用，仍然需要運行在雲端，是vivo算法優勢的體現。比如700億模型綜合能力，在C-Eval、CMMLU、SuperCLUE等榜單中均處于中文大模型第一梯隊。另外1300億、1750億模型也在不斷叠代中，在更複雜場景中帶來更專業的智能體驗。

當端側化+矩陣化大模型持續成長，vivo就得以在剛剛發布的vivo X Fold3系列上，實現“端側7B”+“雲側70B”的AI藍心大模型超大組合部署，作爲當下“最輕、最強”的折疊旗艦，亮相2024年博鳌亞洲論壇，成功中國科技“新質生産力”的代表。

既要又要，打造生産力的“超級智慧體”

在《報告》看來，類似vivo將大模型裝進手機的“端雲結合”，有望打開對AI大模型更廣泛的應用想象，成爲發展新質生産力的關鍵驅動力。

從vivo官方數據來看，已有很多用戶體驗到AI大模型帶來的便利：藍心大模型目前覆蓋超過2000萬用戶，實現2761萬次高質量問答、生成1757萬張畫，寫了649萬份報告，“AI 修圖”功能消除了85萬個路人。

不同參數量級的大模型矩陣下，這背後既有用戶在本地化端側個性化AI修圖、AI寫報告，也有用戶雲端在線回答，AI作畫。

一切技術、産品規劃出發點都是用戶需求。從用戶角度來看，當前對手機AI大模型的期望，是爲用戶提供個性定制、智能交互、專屬陪伴、安全可信等産品體驗，打造個性化專屬私人助理。

這正是所有AI手機廠商競爭核心所在。而在用戶體驗方面，“端雲結合”也體現出自己的獨特優勢。

比如，搭載藍心大模型的vivo X Fold 3，支持超過700種手機相關功能，提供超能問答、超能創作、超能搜索、超能管理、超能交互等五大AI超能服務。

值得一提的是，實現上述超能服務，是在vivo“藍科技”品牌生態中，依托藍晶芯片技術棧、藍海續航系統、藍心大模型、藍河操作系統等多項創新技術，彙聚加持而來。

例如，全局智能輔助應用“藍心小V”、自然語言對話機器人“藍心千詢”等，和Origin OS 4的不斷叠代融合後，用戶可以在vivo手機上萬張圖片管理中，直接向“藍心千詢”說出照片內容，“藍心小V”就可主動識別有對應內容的照片。

“藍科技”整體技術儲備和加持下，“端雲結合”下的藍心大模型，帶來個性化體驗時，還圍繞生産力進行更多挖掘。在vivo X Fold 3中，一句話查找影像素材、一句話視頻剪輯、小V幫記和AI筆記創作等功能，讓AI藍心大模型成爲剪輯視頻、記錄會議、實時翻譯、整理摘要和筆記創作等多場景發揮個性化賦能作用。

值得一提的還有，AI大模型給vivo X Fold 3帶來的交互入口變化，眼動捕捉和隔空手勢功能交互模式變化——聽懂我們的需求，感知我們的意圖後，給出正確反饋，及時幫助決策。

這意味著，vivo X Fold 3這樣的AI大模型手機，早不是簡單的私人助理，而是深入賦能出行、學習、生活、工作等衆多場景，更懂你，更個性化，更互聯的“超級智慧體”。

實際上，“端雲結合”AI大模型給手機帶來的價值，並不局限在應用閉環內。AI賦能下，持續打磨的vivo辦公套件，能夠實現行業唯一支持手機、平板、網頁、Windows、Mac五端協同，滿足商務辦公全場景需求。

這可以理解爲，通過vivo辦公套件或手機，可以協同蘋果Mac筆記本、iPhone手機，能借助AI能力執行、管理。同時，衆多小型開發者可調用vivo的大模型能力，提升開發效率，在新應用領域找到機會。

這正是業內人士此前所提及的，“如果手機廠商AI助手，能理解用戶需求，控制和調用別的應用，用戶體驗會變外，手機廠商、第三方應用關系也會發生徹底的變化。”

“智慧體”+“協同開源”，讓用戶場景不斷叠代，或許是AI大模型走向大衆普適化，加速跑出“新質生産力”的主要思路。

但是，AI大模型價值，很多時候並不完全局限于商業生産，很多時候也有著“人情味”，比如vivo專爲特定人群打造的vivo看見和vivo讀譜的功能，人文關懷得以更智慧。

跑出加速度，大模型已成新質生産力

最近幾年，手機行業陷入持續低迷。當AI大模型浪潮洶湧而來，所有人都在期盼，AI大模型+智能手機的結合，能在人與設備結合更緊密間，成爲推動新質生産力的重要引擎。

因此，當vivo通過“藍科技”品牌賦能，打造出vivo X Fold3這樣革命性、開創性折疊産品，就被業界視爲擁抱“新質生産力”的典型範本。

人民網就在《報告》中評價，vivo通過對“端雲結合”的大模型模式有效探索，將帶動商業模式創新，牽引産業升級，爲手機未來發展指明方向。

IDC也預計，2024年全球新一代AI手機出貨量將達到1.7億部，約占智能手機整體出貨量的15%。在中國市場，新一代AI手機所占份額將在2024年後迅速攀升，2027年達到1.5億台，市場份額超過50%。

無論如何，AI大模型只是技術，技術不是拼參數，最大考驗依然是，技術如何真正服務用戶，讓應用更好落地。這需要行業所有企業，都要真正“以用戶爲導向”核心，懂得和理解每一位用戶。

這並不容易。以vivo爲例，作爲較早布局人工智能的先行者，在2017年開始籌備人工智能全球研究院，並在2018年正式組建，是首批設立專攻人工智能方向研究院的中國手機公司之一。截至目前，vivo每年在人工智能上的投入保守估計在20億到30億元。

如今，在人工智能的四個要素——數據、人力、算法、算力方面，vivo均已做到了領先。但更重要的，是在ECR管理方法下，圍繞用戶痛點，展開系統性創新和持續創新，堅持“用戶爲導向”，在AI、影像、芯片、續航、重量等領域都做到極致，始終做最正確的事，才能穩定穿越周期，滿足用戶不同場景下實際需求，也才能讓新生産力真正普惠到每個用戶。

在胡柏山看來，通過科技創新溫暖“萬家燈火”，是vivo這樣的科技企業需要具備的使命感。“不僅關注社會福祉和人類發展，也積極推動産業躍升和協同發展。”

根據vivo規劃，將在擁抱“新質生産力”中跑出加速度，預計在明年30周年之際發布MR眼鏡，同時對人形機器人賽道保持高度關注。

類似vivo對新質生産力的擁抱，也爲實體經濟突圍提供了新思路。從趨勢來看，C端用戶正成爲端側主要客群，垂直行業將是大模型主戰場。“端雲結合”趨勢下，算力成本大幅降低，無人巡檢、智能家居、工業物聯網、醫療健康、智能汽車等領域，都有望通過擁抱“新質生産力”，創造新的價值、適應新的産業、重塑新的動能。

最終，AI大模型落地應用的爆發，又會助推實體經濟和産業生態體系不斷優化調整。“推動中國經濟走出一條質量更優、動力更充沛的增長路徑。”

文采家

AI大模型博鳌破局：端雲結合，驅動新質生産力

鋅刻度