智算中心開建前,想好怎麽賺錢了嗎?

洞見新研社 2024-03-11 19:59:05

作者 | 辰紋

來源 | 洞見新研社

大模型引發的鏈式反應開始傳導到智算中心,2024年剛過,一批大型智算中心項目建成運營。

1月8日,中國移動智算中心(武漢)在武漢未來科技城開放運營,現建成1500P服務能力,到今年底計劃擴容至6800P,成爲華中地區規模最大的智算中心。

1月22日,上海電信在上海點亮“大規模算力集群暨人工智能公共算力服務平台”,計劃2024上半年在上海規劃建設到達15000卡,總算力超4500P,其中單池新建國産算力達萬卡,預計成爲國內首個超大規模國産算力液冷集群。

1月30日,中國聯通人工智能創新中心成立儀式在京舉行。中國聯通長三角(蕪湖)智算中心項目于去年11月24日開工。

2月4日,深圳開放智算中心點亮運營暨深圳市智慧城市算力統籌調度平台揭牌儀式舉行,加快打造10萬卡級別的超強算力集群。

有媒體統計,截至2023年底,全國有超30個城市在建或籌建帶有“智算中心”的項目128個,其中83個項目有規模披露,超過7.7萬P。

圖源:半導體産業縱橫調研

顯而易見,智算中心項目的建設非常火熱,大有“再不跟進,就OUT”了的趨勢,然而在智算中心的實際建設和運營過程中,仍然有諸多問題待解。

01 智算中心建設,國企挑大梁

智算中心當前的熱度有相當一部分來自于國家政策的推動,特別是今年2月19日,國務院國資委召開“AI賦能産業煥新”中央企業人工智能專題推進會,進一步提升了行業對智算中心的關注度。

會議主要針對央企進行工作部署,要求央企把發展人工智能放在全局工作中統籌謀劃,加快建設一批智能算力中心,開展AI+專項行動。

此次會議之前,北京、上海、廣州等數字經濟發達的城市已經出台了各自的地方政策來推進智算中心的建設。

比如,北京市提出“新建一批計算型數據中心和人工智能算力中心”;上海市提出“提出實施大模型智能算力加速計劃;打造市級智能算力統籌調度平台,構建規模化先進算力調度和供給能力”等。

具體項目上,除了文章開頭例舉的那些大型項目外,北京還在近日上線了北京人工智能公共算力平台(上莊),作爲人工智能基礎設施,該平台將爲各類創新主體提供普惠的公共算力服務。

既然是基礎設施,智算中心建設的主體大多爲地方政府,具體執行則由央企挑起了大梁,其中以電信、移動、聯通爲代表的通訊運營商響應最快。

據《IT時報》報道,最近半年,中國電信和中國移動者兩家央企在AI服務器方面的集采金額超過百億。

2月25日舉行的2024世界移動通信大會(MWC2024)全球CEO圓桌論壇上,中國電信董事長柯瑞文透露,中國電信智算規模已經超11EFLOPS,未來將進一步提升智算規模和占比。

中國移動在此前的財報中披露了公司的算力規模,去年上半年時,智算算力爲5.8EFLOPS,自有算力總規模達9.4EFLOPS,預計2023年底達11EFLOPS。

在上述央企之外,以百度、阿裏、騰訊爲代表的互聯網企業以自身業務發展爲基礎,也加入到這股智算中心建設的熱潮中,不但成爲政府主導的算力基礎設施的有力補充,還更好的推動了各類人工智能場景的落地。

圖源:半導體産業縱橫調研

根據工信部等六部門去年10月發布的《算力基礎設施高質量發展行動計劃》,截至2023年底,中國的算力總規模位居全球第二,達到197EFLOPS,其中,智能算力規模占比達到22.8%。到2025年,算力規模要超過300EFLOPS,智能算力占比要達到35%。

從目前的建設速度來看,這個目標有非常大的幾率提前實現。

02 搶建智算中心,源于“算力焦慮”

地方政府和各方企業如此賣力的建設智算中心,很大程度上源于“算力焦慮”。

一般來說,算力分爲通用算力(基礎算力)、智能算力和超算算力三大板塊。

基礎算力主要由基于CPU芯片的服務器提供,用于支持如雲計算和邊緣計算等基礎通用計算。

智能算力則由基于GPU、FPGA、ASIC等AI芯片的加速計算平台提供,主要用于人工智能的訓練和推理計算。

超算算力則由超級計算機等高性能計算集群提供,主要用于尖端科學領域的計算。

智算中心和傳統數據中心最大的差別在于,智算中心通常與雲計算緊密相關,強調資源控制和基礎設施管理的靈活性,智算中心服務商負責硬件和部分軟件工具的維護,客戶擁有數據。

傳統的本地數據中心則由企業自行管理和維護所有的硬件設施和數據資源。

這種區別在資本投入、資源部署、安全性、合規性和可伸縮性方面體現得尤爲明顯。

去年開始,在大模型的推動下,人工智能也迎來了屬于自己的“文藝複興”,衆多大模型産品的發布,繼而催生了整個行業對于智能算力需求的激增。

比如,一般的大語言模型訓練,根據數據規模、檢測效果、模型類別的不同,訓練一次的算力需求大約爲2-19PFLOS不等;

比如,人臉、語言識別的推理過程中,根據識別精度、並發數量等的不同,對算力的需求跨度可能從10GFLOPS-64TFLOPS;

再比如,智能駕駛爲完成環境感知、決策避障、自車定位等功能時的算力需求大概爲8TFLOPS。

特別是2月15日Sora發布,進一步加劇了行業的“算力焦慮”。

有專家測算,Sora的訓練算力需求是大語言模型的上百倍,同時,推理階段的算力需求也將大幅提升,Sora一次推理任務的數據量可達到大語言模型的數十萬倍,由此産生的推理算力需求是大語言模型的成百甚至上千倍。

AI是任何企業,城市,乃至國家都不願錯過的風口,爲了趕上這趟通往未來的列車,智算中心就是車票。

另外一個維度,站在城市經濟和産業發展的角度,建設智算中心具有強大的資源帶動能力。

中國信通院《中國算力發展指數白皮書(2023年)》顯示,我國近6年累計出貨超過2091萬台通用服務器,82萬台AI服務器,計算設備算力總規模達到302 EFLOPS,其中智能算力增長迅速,增速爲72%,在我國算力占比超過59%。

國家信息中心的《智能計算中心創新發展指南》(下稱《指南》)指出,“十四五”期間,在智算中心實現80%應用水平的情況下,城市對智算中心的投資可帶動人工智能核心産業增長2.9至3.4倍,帶動相關産業增長36至42倍。

長遠來看,能卡位未來的大模型之戰;短期來看,則能對地方經濟有相當大的帶動,智算中心遍地開花也就可以理解了。

03 建智算中心不難,難的是如何賺錢

建設智算中心是好事,然而智算中心建多了,就不見得好了,特別是在沒有非常明確的運營模式,盈利模式的行業背景下,過多的智算中心項目或成爲諸多矛盾的來源。

在技術層面,行業實際上對智算中心的能力提出了具體要求。

算力生産方面,要具備多樣化算力的供給能力,要能實現不同架構芯片的多元化融合,其體系架構要從同構計算走向異構計算。

算力聚合方面,要推動通用算力和專用算力的融合。

算力調度方面,需要對多樣算力進行統一調度和運營,讓融合的算力更加靈活、精益的爲各行各業所用。

算力釋放方面,要提供算力服務的應用,讓多樣算力更靈活的釋放到數字産業當中。

這波由央企扛旗掀起的智算中心建設浪潮,很大程度源于構建擁有自主可控的AI基礎設施的要求,因此也給了很多國産AI服務器和AI加速芯片廠商機會。

AI芯片方面,華爲昇騰系列、阿裏含光系列、百度昆侖系列都占有不小的市場份額,加上寒武紀、海光信息、燧原科技、天數智芯、壁仞科技、摩爾線程、沐曦等企業也有相關産品推出,市場的選擇還是比較豐富。

可是在行業端,雖然華爲昇騰與英偉達的H20系列在價格和性能指標上各有優勢,但英偉達的生態還是更勝一籌,這也是說,智算中心主要技術的國産化還有很長一段路要走。

更重要的一點是,上述問題沒有解決之前,智算中心建的多,能否都用起來是一個很大的疑問。

有媒體報道稱,由于智算中心投資、建設和運營往往由不同主體負責,前期建設單位往往對建設後運營的模式、服務標准投入不足,出現了管頭不管尾、建設運營割裂的現象,影響客戶體驗,這也使得不少城市建設的智算中心的機架利用率實際上並不理想。

商業模式方面,智算中心大多以出租或售賣算力爲主,可是由于行業未對算力的定價形成統一的標准,導致不同智算中心間的價格相差極大,市場的接受度也有限。

更爲關鍵的是,智算中心的建設成本非常高,部分智算中心每100P半精算的投資成本最高可達6億,加之高昂的使用成本,比如OpenAI訓練GPT-3時耗費了19萬千瓦時的電量。

智算中心需要多長時間才能通過運營收入收回投資,行業還需更多的探索。

參考資料:

1、半導體産業縱橫,國家隊入場,爲智算中心再添一把火

2、IT時報,獨家:近半年全國智算中心招投標金額超百億

0 阅读:11

洞見新研社

簡介:專注商業與科技,在沒人思考的地方,再深思五分鍾。