回顧NVIDIAGTC2024,Blackwell算力核彈問世,AI機器人來襲

太平洋科技 2024-03-19 08:54:20

AI生成

AI,這個在2023年猶如井泉噴湧進我們日常生活的詞語,現如今正以驚人的速度重塑著我們的生活方式,同時間改變著整個世界的面貌。從大語言LLMs模型到先進的AI圖像生成,從智能算法推薦到驚人的AI視頻生成,人工智能的觸角已經伸展到了科技的各個角落。

圖片源自于網絡

從GPT-4發布,到谷歌Bard的入場、Meta開源模型LLama的問世,再到國內文心一言、星火大模型、通義千問、月之暗面等諸多國産模型的紛紛亮相。我們目睹了全球人工智能領域的快速發展和技術突破。

圖片源自于網絡

圖片源自于網絡

如今AI的競爭依然處于百花齊放百家爭鳴的階段,每一家都在使用自身優勢在AI浪潮中分得一杯羹。從北美的硅谷到歐洲的科技集群,從亞洲的研發中心到其他地區的創新孵化器,AI正在成爲跨國界、跨文化的合作與競爭的焦點。

圖片源自于網絡

若將人工智能比作科技高峰上的璀璨之花,那麽NVIDIA無疑是這些花朵賴以綻放的肥沃土壤。正是NVIDIA提供的先進計算平台,成爲滋養人工智能之林的關鍵養分,讓這些技術之花競相開放,展現出驚世之美。

AI生成

2024 NVIDIA GTC主題演講 見證 AI 的變革時刻

每年春季,NVIDIA的GTC主題演講就如約而至。自2019年以“GPU Computing: The Future of Computing”揭開序幕,AI便成了GTC年會的重頭戲。NVIDIA始終致力于將旗下産品的強大算力與AI技術的前沿需求無縫對接。正是老黃遠見卓識的策略布局,使NVIDIA在AI的黃金時代巍然屹立,穩占行業霸主之位。

圖片源自于網絡

2023年,老黃在演講中詳細闡述了NVIDIA在人工智能、數據中心、雲計算等關鍵領域取得的最新成果。重點介紹了NVIDIA Hopper GPU架構,它使AI性能相比前一代産品實現了翻倍的飛躍。同時,NVIDIA DGX Cloud爲企業級用戶帶來了前所未有的強大算力支持;而NVIDIA Omniverse平台則將AI技術的應用拓展到了設計和建築行業。老黃在演講中富有預見性地指出:我們現在正處在人工智能的‘iPhone時代’。

圖片源自于網絡

圖片源自于網絡

那麽在今天的GTC大會上,老黃,這位“人類AI教父”又給我們帶來了什麽新鮮事呢?

Blackwell 2080億晶體管的算力猛獸

當下,世界範圍內使用最多的AI應用-LLMs,如Google 的 Gemini、Meta 的 NLLB、Maxtral 的 Mistral 以及 OpenAI 的 GPT-4 等模型,均采用了“專家混合”(Mixtures of Experts,MoEs)技術。這些模型功能的強大,對芯片硬件提出了更高的要求。2023年,NVIDIA 憑借其Hopper架構,成功地迎接了這些挑戰。

圖片源自于網絡

在今年的GTC上,老黃再一次地刷新了世界AI商用算力的排行榜,發布了Blackwell 架構和同名AI處理器B100、B200 和 GB200,産品取名自傑出數學家和統計學家 David H. Blackwell,體現了其在概率計算、博弈論、統計學和動態規劃等多個領域的傑出貢獻。

此次發布的 Blackwell GPU B100使用了兩個台積電4NP工藝制造的芯片,芯片面積爲814平方毫米,這個數據已經接近了EUV光刻技術的理論極限值(858平方毫米),兩個芯片通過C2C-Interface進行相連,組成一個“1600平方毫米”的超大處理單元。

左邊爲B100,右邊爲H100 圖片源自于網絡

單個 GPU 芯片含 1040 億晶體管,整體達到 2080 億個,比上一代的 Hopper 架構增加了 240 億個。每個 GPU 連接了四個各有 24 GB 的 HBM3E 存儲芯片,使得 B100 AI處理器擁有 192 GB 的高速存儲,並且存儲帶寬達到了 8 TB/s。

B100/B200/H100/MI300X AI處理器重點參數對比 圖片源自于網絡

在計算性能方面,NVIDIA 目前主要公布了 Blackwell 架構中 Tensor Cores 的性能數據。對比 NVIDIA Hopper架構的數據顯示,對于低精度計算,Blackwell GPU 的性能是前代的2.5倍;而針對 FP64 計算,性能從 67 TFLOPS 降低至 30 TFLOPS。對此,NVIDIA並沒有進行解釋,許多博主也對FP64精度計算性能的下降表示了疑惑。

圖片源自于網絡

在日常的計算任務中,FP32(單精度浮點數)和FP64是最爲普遍的數據格式,它們使用32位和64位分別對浮點數進行編碼,既能提供較大的數值範圍也保障了較高的數值精度,但相對地,也對和計算資源的需求更高。與之相對,FP16(半精度浮點數)和FP4提供的算力精度較低,特別是FP4,其低精度下的性能並不理想,即使在大型語言模型(LLMs)中開啓FP4精度運行也是如此。

圖片源自于網絡

尚不明確NVIDIA此次爲何將主要升級焦點放在FP4運算上。隨著針對移動端LLMs需求的增長,對FP4運算的依賴可能有所增加,這或許促使NVIDIA優化了對FP4的支持,以提升這些應用的運算效率。

功耗方面,NVIDIA 宣布 Blackwell 系列的TDP範圍在 700 至 1200 W之間。其中,風冷版本的 B100 和 B200 的 TDP 分別爲 700W和 1000 W,而 1200 W版本的則需使用上水冷散熱。此外,Blackwell GPU 還配備了支持 6.0 標准的 PCI-Express 控制器。

然後也放一下B100和B200的對比圖,B200在運算性能與顯存上對比B100有了不小的提升,相當于B100的“官方灰燼版”。同時NVIDIA還推出了GB200。

圖片源自于網絡

圖片源自于網絡

GB200就是將四個B200芯片和兩個Grace 整合到一起,“合體之後”的性能表現將是單片H100的30倍左右的提升。當然GB200是應該是不會單獨售賣的,如同去年推出的HGX 100 72X一樣,GB200主要還是通過整合,然後形成一個GB200 NVL72的計算中心進行出售。

GB200與GH200(2024)重點參數對比 圖片源自于網絡

圖片源自于網絡

圖片源自于網絡

回顧最近發布的Blackwell GPU,我認爲其最大亮點並非在于算力的顯著提升,而是它所搭載的192GB HBM 3E高帶寬存儲。面對如今日益增長的模型尺寸——例如,埃隆·馬斯克最近宣布開源的Grok-1模型,它至少需要800GB的顯存才能運行。若使用H100 GPU(配備80GB顯存),運行該模型需要整整10張卡,而采用B100 GPU(如果每張配備192GB顯存),僅需4張便可滿足需求。這對于運維商而言,無疑是一種成本效率極高的解決方案。

這也是未來AI處理器發展的一個趨勢,爲了更好地AMD 的 Instinct MI300 系列産品形成壓制。NVIDIA 還計劃在今年下半年爲 H100 系列加速器增加新的 H200 或 GH200 代,這將提供更高的 141 GB HBM3E 存儲以及 4.8 TB/s 的存儲帶寬,也就是官方的顯存提升版本。

圖片源自于網絡

Omniverse 再升級,Vision Pro應用新場景?

圖片源自于網絡

NVIDIA在本次的GTC 2024中進一步升級了其Omniverse平台,並將其企業技術擴展到了蘋果生態系統。這一策略在于借助Vision Pro應用,使開發者得以在增強現實/虛擬現實(AR/VR)環境中利用Omniverse的強大工具。

在GTC大會上上,NVIDIA展示了設計師如何利用Vision Pro中的汽車配置工具操作車輛模型,並能夠以虛擬的方式“進入”車輛內部進行查看。這種交互是通過Omniverse Cloud API實現的,此外,圖形內容還可以通過雲計算服務直接流式傳輸至Vision Pro,實現高效的圖形傳輸網絡服務。

圖片源自于網絡

這一升級意味著,Omniverse和Vision Pro的結合將爲AR/VR領域帶來更加沉浸式和互動性強的體驗。用戶能夠在三維空間中以更加自然和直觀的方式進行設計、模擬和創作,這對于産品設計、建築可視化以及互動娛樂等多個應用場景都將是一次質的飛躍。

圖片源自于網絡

機器人的ChatGPT時代可能即將來臨

圖片源自于網絡

正當我們以爲今天的大會只會聚焦于算力話題時,老黃卻給我們帶來了意想不到的驚喜——備受矚目的年度機器人環節如約而至,NVIDIA宣布了其人形機器人項目GR00T。

圖片源自于網絡

在今日的主題演講中,黃仁勳展示了多款由GR00T平台驅動的人形機器人如何高效完成多項任務,這些機器人分別來自 Agility Robotics、Apptronik、傅利葉智能以及宇樹科技。

GR00T的誕生源自NVIDIA的Isaac機器人平台工具,它基于全新的通用基礎模型設計,使得GR00T驅動的人形機器人能夠接收並處理文本、語音、視頻乃至現場示範的輸入信息,從而執行精確的操作。這些操作包括理解自然語言、模仿人類行爲、在現實世界中的導航和互動等。可以說,AI已經變成了機器人的“靈魂”。

圖片源自于網絡

NVIDIA還開發了一款新型的“機器人大腦”計算芯片——Jetson Thor,該芯片能夠執行複雜的任務,並借助Transformer引擎處理多元的傳感器數據。

未來,NVIDIA將人形機器人定位爲公司的一個關鍵戰略方向。正如黃仁勳所預示的,機器人界的ChatGPT時代可能即將來臨。

在過去,NVIDIA給人更多的印象就是一個遊戲的制造商,很少有人能夠想到在不到20年的時間裏,NVIDIA通過CUDA能夠讓GPU從一個“遊戲硬件”概念變成一個改變世界的“數字石油”。

圖片源自于網絡

未來,隨著技術的不斷進步,NVIDIA的GPU很可能繼續拓展其影響力。隨著量子計算、邊緣計算和物聯網的發展,NVIDIA的技術有望在新的領域中發揮關鍵作用,進一步加速世界的數字化轉型。

圖片源自于網絡

0 阅读:0

太平洋科技

簡介:PConline以科技敬生活。