回顧NVIDIAGTC2024，Blackwell算力核彈問世，AI機器人來襲

AI生成

AI，這個在2023年猶如井泉噴湧進我們日常生活的詞語，現如今正以驚人的速度重塑著我們的生活方式，同時間改變著整個世界的面貌。從大語言LLMs模型到先進的AI圖像生成，從智能算法推薦到驚人的AI視頻生成，人工智能的觸角已經伸展到了科技的各個角落。

圖片源自于網絡

從GPT-4發布，到谷歌Bard的入場、Meta開源模型LLama的問世，再到國內文心一言、星火大模型、通義千問、月之暗面等諸多國産模型的紛紛亮相。我們目睹了全球人工智能領域的快速發展和技術突破。

圖片源自于網絡

如今AI的競爭依然處于百花齊放百家爭鳴的階段，每一家都在使用自身優勢在AI浪潮中分得一杯羹。從北美的硅谷到歐洲的科技集群，從亞洲的研發中心到其他地區的創新孵化器，AI正在成爲跨國界、跨文化的合作與競爭的焦點。

圖片源自于網絡

若將人工智能比作科技高峰上的璀璨之花，那麽NVIDIA無疑是這些花朵賴以綻放的肥沃土壤。正是NVIDIA提供的先進計算平台，成爲滋養人工智能之林的關鍵養分，讓這些技術之花競相開放，展現出驚世之美。

AI生成

2024 NVIDIA GTC主題演講見證 AI 的變革時刻

每年春季，NVIDIA的GTC主題演講就如約而至。自2019年以“GPU Computing: The Future of Computing”揭開序幕，AI便成了GTC年會的重頭戲。NVIDIA始終致力于將旗下産品的強大算力與AI技術的前沿需求無縫對接。正是老黃遠見卓識的策略布局，使NVIDIA在AI的黃金時代巍然屹立，穩占行業霸主之位。

圖片源自于網絡

2023年，老黃在演講中詳細闡述了NVIDIA在人工智能、數據中心、雲計算等關鍵領域取得的最新成果。重點介紹了NVIDIA Hopper GPU架構，它使AI性能相比前一代産品實現了翻倍的飛躍。同時，NVIDIA DGX Cloud爲企業級用戶帶來了前所未有的強大算力支持；而NVIDIA Omniverse平台則將AI技術的應用拓展到了設計和建築行業。老黃在演講中富有預見性地指出：我們現在正處在人工智能的‘iPhone時代’。

圖片源自于網絡

那麽在今天的GTC大會上，老黃，這位“人類AI教父”又給我們帶來了什麽新鮮事呢？

Blackwell 2080億晶體管的算力猛獸

當下，世界範圍內使用最多的AI應用-LLMs，如Google 的 Gemini、Meta 的 NLLB、Maxtral 的 Mistral 以及 OpenAI 的 GPT-4 等模型，均采用了“專家混合”（Mixtures of Experts，MoEs）技術。這些模型功能的強大，對芯片硬件提出了更高的要求。2023年，NVIDIA 憑借其Hopper架構，成功地迎接了這些挑戰。

圖片源自于網絡

在今年的GTC上，老黃再一次地刷新了世界AI商用算力的排行榜，發布了Blackwell 架構和同名AI處理器B100、B200 和 GB200，産品取名自傑出數學家和統計學家 David H. Blackwell，體現了其在概率計算、博弈論、統計學和動態規劃等多個領域的傑出貢獻。

此次發布的 Blackwell GPU B100使用了兩個台積電4NP工藝制造的芯片，芯片面積爲814平方毫米，這個數據已經接近了EUV光刻技術的理論極限值（858平方毫米），兩個芯片通過C2C-Interface進行相連，組成一個“1600平方毫米”的超大處理單元。

左邊爲B100，右邊爲H100 圖片源自于網絡

單個 GPU 芯片含 1040 億晶體管，整體達到 2080 億個，比上一代的 Hopper 架構增加了 240 億個。每個 GPU 連接了四個各有 24 GB 的 HBM3E 存儲芯片，使得 B100 AI處理器擁有 192 GB 的高速存儲，並且存儲帶寬達到了 8 TB/s。

B100/B200/H100/MI300X AI處理器重點參數對比圖片源自于網絡

在計算性能方面，NVIDIA 目前主要公布了 Blackwell 架構中 Tensor Cores 的性能數據。對比 NVIDIA Hopper架構的數據顯示，對于低精度計算，Blackwell GPU 的性能是前代的2.5倍；而針對 FP64 計算，性能從 67 TFLOPS 降低至 30 TFLOPS。對此，NVIDIA並沒有進行解釋，許多博主也對FP64精度計算性能的下降表示了疑惑。

圖片源自于網絡

在日常的計算任務中，FP32（單精度浮點數）和FP64是最爲普遍的數據格式，它們使用32位和64位分別對浮點數進行編碼，既能提供較大的數值範圍也保障了較高的數值精度，但相對地，也對和計算資源的需求更高。與之相對，FP16（半精度浮點數）和FP4提供的算力精度較低，特別是FP4，其低精度下的性能並不理想，即使在大型語言模型（LLMs）中開啓FP4精度運行也是如此。

圖片源自于網絡

尚不明確NVIDIA此次爲何將主要升級焦點放在FP4運算上。隨著針對移動端LLMs需求的增長，對FP4運算的依賴可能有所增加，這或許促使NVIDIA優化了對FP4的支持，以提升這些應用的運算效率。

功耗方面，NVIDIA 宣布 Blackwell 系列的TDP範圍在 700 至 1200 W之間。其中，風冷版本的 B100 和 B200 的 TDP 分別爲 700W和 1000 W，而 1200 W版本的則需使用上水冷散熱。此外，Blackwell GPU 還配備了支持 6.0 標准的 PCI-Express 控制器。

然後也放一下B100和B200的對比圖，B200在運算性能與顯存上對比B100有了不小的提升，相當于B100的“官方灰燼版”。同時NVIDIA還推出了GB200。

圖片源自于網絡

GB200就是將四個B200芯片和兩個Grace 整合到一起，“合體之後”的性能表現將是單片H100的30倍左右的提升。當然GB200是應該是不會單獨售賣的，如同去年推出的HGX 100 72X一樣，GB200主要還是通過整合，然後形成一個GB200 NVL72的計算中心進行出售。

GB200與GH200（2024）重點參數對比圖片源自于網絡

圖片源自于網絡

回顧最近發布的Blackwell GPU，我認爲其最大亮點並非在于算力的顯著提升，而是它所搭載的192GB HBM 3E高帶寬存儲。面對如今日益增長的模型尺寸——例如，埃隆·馬斯克最近宣布開源的Grok-1模型，它至少需要800GB的顯存才能運行。若使用H100 GPU（配備80GB顯存），運行該模型需要整整10張卡，而采用B100 GPU（如果每張配備192GB顯存），僅需4張便可滿足需求。這對于運維商而言，無疑是一種成本效率極高的解決方案。

這也是未來AI處理器發展的一個趨勢，爲了更好地AMD 的 Instinct MI300 系列産品形成壓制。NVIDIA 還計劃在今年下半年爲 H100 系列加速器增加新的 H200 或 GH200 代，這將提供更高的 141 GB HBM3E 存儲以及 4.8 TB/s 的存儲帶寬，也就是官方的顯存提升版本。

圖片源自于網絡

Omniverse 再升級，Vision Pro應用新場景？

圖片源自于網絡

NVIDIA在本次的GTC 2024中進一步升級了其Omniverse平台，並將其企業技術擴展到了蘋果生態系統。這一策略在于借助Vision Pro應用，使開發者得以在增強現實/虛擬現實（AR/VR）環境中利用Omniverse的強大工具。

在GTC大會上上，NVIDIA展示了設計師如何利用Vision Pro中的汽車配置工具操作車輛模型，並能夠以虛擬的方式“進入”車輛內部進行查看。這種交互是通過Omniverse Cloud API實現的，此外，圖形內容還可以通過雲計算服務直接流式傳輸至Vision Pro，實現高效的圖形傳輸網絡服務。

圖片源自于網絡

這一升級意味著，Omniverse和Vision Pro的結合將爲AR/VR領域帶來更加沉浸式和互動性強的體驗。用戶能夠在三維空間中以更加自然和直觀的方式進行設計、模擬和創作，這對于産品設計、建築可視化以及互動娛樂等多個應用場景都將是一次質的飛躍。

圖片源自于網絡

機器人的ChatGPT時代可能即將來臨

圖片源自于網絡

正當我們以爲今天的大會只會聚焦于算力話題時，老黃卻給我們帶來了意想不到的驚喜——備受矚目的年度機器人環節如約而至，NVIDIA宣布了其人形機器人項目GR00T。

圖片源自于網絡

在今日的主題演講中，黃仁勳展示了多款由GR00T平台驅動的人形機器人如何高效完成多項任務，這些機器人分別來自 Agility Robotics、Apptronik、傅利葉智能以及宇樹科技。

GR00T的誕生源自NVIDIA的Isaac機器人平台工具，它基于全新的通用基礎模型設計，使得GR00T驅動的人形機器人能夠接收並處理文本、語音、視頻乃至現場示範的輸入信息，從而執行精確的操作。這些操作包括理解自然語言、模仿人類行爲、在現實世界中的導航和互動等。可以說，AI已經變成了機器人的“靈魂”。

圖片源自于網絡

NVIDIA還開發了一款新型的“機器人大腦”計算芯片——Jetson Thor，該芯片能夠執行複雜的任務，並借助Transformer引擎處理多元的傳感器數據。

未來，NVIDIA將人形機器人定位爲公司的一個關鍵戰略方向。正如黃仁勳所預示的，機器人界的ChatGPT時代可能即將來臨。

在過去，NVIDIA給人更多的印象就是一個遊戲的制造商，很少有人能夠想到在不到20年的時間裏，NVIDIA通過CUDA能夠讓GPU從一個“遊戲硬件”概念變成一個改變世界的“數字石油”。

圖片源自于網絡

未來，隨著技術的不斷進步，NVIDIA的GPU很可能繼續拓展其影響力。隨著量子計算、邊緣計算和物聯網的發展，NVIDIA的技術有望在新的領域中發揮關鍵作用，進一步加速世界的數字化轉型。

圖片源自于網絡

文采家

回顧NVIDIAGTC2024，Blackwell算力核彈問世，AI機器人來襲

太平洋科技