智能機器人行業報告:NVIDIA加碼機器人賽道,引領具身智能浪潮

報告研讀小助理 2024-04-19 08:28:09

報告出品方:財通證券

以下爲報告原文節選

------

1 全球 AI 算力龍頭,前瞻布局智能機器人領域

1.1 新一輪 AI 技術革命催生高算力需求,英偉達業績創曆史新高

英偉達是全球 AI 算力龍頭,總市值躍居全球前三。英偉達起步于遊戲 GPU 市場,並于 2006 年推出 GPU 計算的革命性架構 CUDA ,正式進入 AI 加速計算領域。

2021 年 , 英 偉 達 發 布 首 款 CPU 處 理 器 , 並 將 公 司 産 品 路 線 升 級 爲“GPU+CPU+DPU”的三芯戰略。2023 年,英偉達受益生成式 AI 浪潮的持續催化,憑借旗艦 AI 芯片 A100/H100 躍升爲全球 AI 領域“賣鏟人”。截至 2024 年4月 16日 (北美時間),英偉達收盤價爲 874.15美元,總市值高達 2.19萬億美元,市值位列全球前三。

算力是 AI 核心要素,以 LLM 爲代表的新一輪 AI 技術革命催生新的算力需求。

AI三大要素包括算法/算力/大數據,AI深度學習需要很高的並行計算、浮點計算以及矩陣運算能力,基于 CPU 的傳統計算架構無法充分滿足人工智能高性能並行計算的需求,因此需要發展適合 AI 架構的專屬芯片,常見的 AI 加速芯片按照技術路線可以分爲 GPU/FPGA/ASIC 三類。其中,應用于圖形、圖像處理領域的GPU 是目前主流的 AI 計算架構。現階段,全球智能算力 (GPU 等芯片算力) 增速遠超通用算力 (CPU芯片算力),算力正在被當作國家科技競爭的關鍵因素,AI芯片是人工智能領域競爭的制高點。

2023 年英偉達成爲全球最大芯片公司,AI 芯片市占率高達 98%。根據 Wells Fargo數據顯示,2023年英偉達在數據中心 AI芯片市場擁有 98%的市場份額,第二名的 AMD 市場份額僅爲 1.2%,第三名的英特爾不足 1%。英偉達/英特爾/AMD 是全球芯片市場上最主要的供應商,從 2023 財務年度來看,英偉達/英特爾/AMD 分別實現營業收入 609 億美元/542 億美元/227 億美元,英偉達的營收規模首次超過英特爾,正式成爲全球最大芯片公司。

受益于生成式 AI 浪潮,2023 年英偉達業績創曆史新高。2024 年 2 月,英偉達公布了 2024 財年 (1M23-1M24) 業績報告,全年實現營業收入 609.2 億美元,同比+126%,營業利潤 329.7 億美元,同比+681%,營業利潤率高達 54.1%,淨利潤297.6 億美元,同比+581%,全年公司營收/營業利潤/淨利潤均創曆史新高。尤其是在數據中心領域,受益于 23 年全球範圍內的生成式 AI 浪潮帶動的算力需求大幅提升,FY24公司數據中心領域實現營收475億美元,同比+217%,其中第四季度實現營收 184 億美元,同比+409%,環比+27%。

1.2 NVIDIA 前瞻布局智能機器人領域,擁抱生成式 AI 新方向

NVIDIA 在機器人領域的核心目標是打造底層開發生態。NVIDIA 在智能機器人領域的布局主要圍繞著大模型、數據、開發平台三大核心領域展開,其終極目標是借助芯片等核心産品,爲打造機器人底層開發生態,搶占産業鏈價值制高點並賦能其他主機廠、加速産業落地。

英偉達早在 2018 便前瞻布局智能機器人領域。英偉達通常會采用“處理器+平台+開發工具”三件套的方式進入新興市場,其對于機器人領域的布局也采用類似方法。2018 年,英偉達推出全新硬件、軟件、虛擬世界機器人模擬器的 NVIDIA Isaac,同時還推出專爲機器人設計的計算機平台 Jetson Xavier 和相關的機器人軟件工具包,正式布局智能機器人領域。

2019-2022 年,英偉達從底層芯片、到計算平台、到訓練與驗證,開啓智能機器人領域的全方位布局。2019 年,英偉達推出 lsaac 軟性開發套件 (SDK),爲機器人提供更新的 AI 感知和仿真功能;2021 年,英偉達推出 Omniverse 平台,支持機器人的協作和模擬,其中 Omniverse Avatar 可生成交互式人工智能化身,對協作機器人影響深遠。2022 年,英偉達推出 Isaac Nova Orin,其配置的計算和傳感器參考平台旨在幫助 AMR (自主移動機器人) 制造商縮短開發時間並降低成本。

2023 年,“生成式 AI+機器人”成爲 NVIDIA 機器人全線産品技術演進和重塑的核心方向。

(1) 2023 年 5 月,英偉達發布全新 Jetson AGX Orin 工業級模塊。該模塊在極其惡劣的環境下可以提供更高的服務器性能級別的計算能力, “服務器性能級別”意味著在嵌入式 s 的端側/邊緣側也能部署 AI 並讓傳感器融合算法;“極其惡劣的環境”意味著智能機器人在農業/建築/能源/航空抗體/衛星等極端環境領域的應用存在可能性。

(2) 2023 年 10 月,英偉達宣布對 Jetson 平台上的 Metropolis 和 Isaac 框架進行有史以來規模最大的軟件擴展,用以來滿足邊緣 AI的快速部署需求。與此同時,英偉達還宣布創建 Jetson生成式 AI 實驗室,供開發者學習和利用開源生成式AI 模型進行開發。另外,英偉達宣布推出 Isaac ROS 和 Isaac Sim 軟件的全新版本,對感知和仿真功能進行了重大改進,這次改進同樣還是與 AI高度相關。

整體來看,英偉達在機器人領域的芯片技術和工具領域有幾個重要的叠代方向,分別是增強性能、模塊化布局、降低使用門檻。

2 正式成立 GEAR 實驗室,引領具身智能浪潮

2.1 具身智能爲 AI 新一波浪潮,英偉達已有深度布局

具身智能 (Embodied AI) 被認爲是人工智能的下一波浪潮。具身智能是指一種基于物理身體進行感知和行動的智能系統,其通過智能體與環境的交互獲取信息、理解問題、做出決策並實現行動,從而産生智能行爲和適應性。在 ITF World2023 大會上,英偉達創始人黃仁勳表示,人工智能的下一個浪潮是具身智能(Embodied AI),這種智能系統能夠理解、推理並與物理世界交互,並舉例機器人、自動駕駛汽車,包括因爲理解物理世界而變得更加聰明的聊天機器人。

具身智能有感知、理解和交互三個主要特征。(1) 感知:指具身智能設備可以通過各種傳感器感知周圍環境中的物體/聲音/光線等信息,並將其轉化爲數字信號進行處理;(2) 理解:是指具身智能設備可以通過各種算法對感知到的信息進行分析和解釋,並生成相應的語義表示或知識圖譜;(3) 交互:是指具身智能設備可以通過語音/圖像/動作等方式與人類或其他設備進行溝通和協作,並根據反饋進行自適應和學習。

具身智能借助具有泛化能力的 LLM/VLM/VLA 等模型,賦能人形機器人大腦。

具身智能的目標是讓具有感知和行動能力的智能體(如人形機器人),在與環境的交互中持續演進,逐漸産生認知能力,能夠理解、推理、學習、規劃和決策,甚至具備常識和情感,從而實現更複雜的功能。具身智能的“頭腦”通常由深度神經網絡模型驅動,結合 LLM/VLM/VLA 等模型,賦予了強大的泛化能力,使得機器人從程序執行導向轉向任務目標導向,不再受限于特定的程序執行,而能夠根據任務目標智能地采取行動,從豐富的數據和任務中學習決策和控制,它們不斷演化以適應更複雜的任務和環境。

NVIDIA 在具身智能領域不斷進行深度布局,以下是現階段最顯著的四項成果:

◼ 在智能體接口上:2022 年 10 月,英偉達發布基于 Transformer 架構的支持多模形態的(仿真)智能體 VIMA。VIMA能像 GPT-4一樣接受 Prompt輸入,而且輸入可以是多模態的(文本、圖像、視頻或它們的混合),然後輸出動作,完成指定任務。該項目爲研究自然語言理解任務傳達給智能體提供了一種便捷靈活的接口,並提出了一種新的多模態 prompting 形式,將各種各樣的機器人操作任務轉換爲一個序列建模問題。

◼ 在智能體架構上:2022 年 11 月 22 日,英偉達發布具有互聯網規模知識的開放式具身智能體——MinDojo。MineDojo 是一個建立在流行的 Minecraft 遊戲之上的新框架,用于具身代理研究。該模型構建了具身智能體最關鍵的三個要素:一是支持多種任務和目標的環境,二是大規模的多模態知識數據庫,三是靈活且可擴展的智能體架構。

◼ 在智能體自主學習上:2023 年 5 月 25 日,英偉達發布 VOYAGER 智能體,這是第一個由 LLM 驅動的可以終身學習的智能體,可以在《我的世界》中驅動探索,掌握廣泛的技能,並在沒有人類幹預的情況下不斷地做出新的發現。 其可以最大限度地探索自動化項目,並擁有可以不斷存儲和檢索複雜行爲的技能庫,爲具身控制生成可執行代碼。

◼ 在智能體機器訓練上:2023 年 10 月 20 日,英偉達發布了 Eureka 智能機器人訓練工具。Eureka 的全稱是 Evolution-driven Universal Reward Kit for Agent,本質是一種由大模型驅動的算法生成工具。借助 GPT-4 寫代碼的能力,Eureka擁有了出色的獎勵函數設計能力,可以自主編寫獎勵算法來訓練機器人。Eureka生成的獎勵程序在超過 80%的任務上優于專家編寫的獎勵程序。

這使得機器人的平均性能提高了 50%以上。

對外投資方面,NVIDIA 積極投資具身智能機器人本體廠商 Figure AI。Figure 公司成立于 2022 年,公司團隊包括來自 IHMC、波士頓動力和特斯拉的機器人專家。2024 年 2 月 29 日 (北美時間),Figure 公司通過 X 平台宣布已從英偉達/OpenAI/微軟/亞馬遜等巨頭籌集合計約 6.75 億美元,公司估值達 26 億美元。同時,Figure 宣布與 OpenAI 展開深度合作,開發新一代的人形機器人專用 AI 模型,還將使用微軟的 Azure 雲服務搭建人工智能基礎設施和存儲數據等。

Figure AI 持續推動具身智能進展,AI+機器人進展順利。2023 年 10 月, Figure發布了代號爲 Figure 01 的首款人形機器人,Figure 01 的設計主要用于搬運重物等以最終解決美國勞動力短缺的問題;2024 年 1 月,Figure 01 更新最新進展,僅需 10 小時的端到端訓練,通過觀看人類的示範視頻就能學會並完全自主搞定煮咖啡任務,還具備自主糾錯和動作優化等功能。

2024 年 3 月,Figure 通過 X 平台更新 Figure 01 的最新進展,機器人在視覺識別/推理能力/命令執行等方面均有明顯進展。(1) 視覺識別:在陳述周邊環境時,Figure 01 可具體描述蘋果/盤子/桌邊人的位置、姿態、顔色等多維度信息;(2) 推理能力:在接受人類想吃東西的指令後,Figure 01 從面前諸多物品中挑選出蘋果並送出,並做出合理解釋,可自主思考後並整齊放置餐具;(3) 命令執行:在收拾物品過程中,Figure 01 靈巧手可快速抓取並整理蘋果/餐碟杯等不同形狀的物品,動作輕巧靈敏。另外,視頻爲 1.0x 倍速拍攝,體現機器人在反應速度/語態/動作等方面已做到高度類人化。 此視頻爲 Figure公布與 OpenAI合作之後僅 10天(視頻拍攝日期爲 3 月 9日) 的階段性進展,體現現階段 AI 已對機器人提供了較高程度的賦能。

2.2 英偉達成立 GEAR 實驗室,研究圍繞四大關鍵領域

2024 年 2 月,英偉達成立通用具身智能體研究 GEAR (Generalist Embodied Agent Research) 團隊。GEAR 團隊將由 AI 高級研究科學家,AI 代理計劃的負責人 Jim Fan 和 Yuke Zhu 教授領導,目標是在虛擬和現實世界中建立具身智能體基礎模型,致力于實現跨多模態、多場景的智能應用。GEAR 有足夠的資金一次性解決機器人基礎模型、遊戲基礎模型和生成式模擬。英偉達 GEAR 實驗室的成立,旨在推動大模型等人工智能技術進一步由虛擬世界向現實世界發展,通過機器人等載體實現人工智能與物理世界的交互,加速感知智能時代的到來。

GEAR 團隊的成立表明英偉達先進 AI 和自主系統領域積極搶占技術和應用的制高點,未來 GEAR 的研究工作將主要圍繞四個關鍵領域開展:

◼ 多模態基礎模型:開發基于大規模互聯網數據源訓練的 LLMs(大型語言模型),用于規劃與推理,視覺-語言模型以及世界模型,旨在打通不同模態信息間的壁壘;

◼ 通用型機器人研究:研發能夠適應複雜環境、實現穩健移動與靈巧操作的機器人模型與系統,以提升其在各類實際場景下的普適性與效能;

◼ 虛擬世界中的基礎智能體:創建能夠在多種遊戲與模擬環境中自主探索並持續自我提升能力的大型動作模型,爲虛擬世界的智能交互設定新標准;

◼ 模擬與合成數據技術:構建大規模學習所需的仿真基礎設施及合成數據流水線,爲智能體的學習過程提供有力支持。

3. GTC推出 GR00T模型,構築機器人底層開發生態

GTC 2024 見證 AI+機器人的最前沿升級。2024 年 3 月 18 日-21 日,NVIDIA 在聖何塞會議中心舉辦 GTC 2024 大會,也是英偉達近 5 年來的首屆線下 GTC。(1)從參會嘉賓來看,谷歌 DeepMind 機器人技術高級總監、OpenAI 首席運營官、波士頓動力首席技術官、斯坦福李飛飛博士、xAI 聯合創始人等機器人行業先進企業的領導人悉數出席。(2) 從展示産品來看,衆多全球機器人領先公司將展示最新機器人産品,谷歌 DeepMind、波士頓動力、Agility Robotics、迪士尼等公司將在現場展出 25 款機器人,包括人形機器人、工業機械手等。

英偉達重磅推出人形機器人 GR00T 通用模型。2024 年 3 月 19 日 (北京時間),英偉達 CEO 黃仁勳在 GTC 2024 大會上重磅推出人形機器人通用基礎模型 Project GR00T。GR00T 全稱是“Generalist Robot 00 Technology”,旨在進一步推動其在機器人和具身智能方面的突破。 GR00T 驅動的機器人將能夠理解自然語言,並通過觀察人類行爲來模仿動作,以便導航、適應現實世界並與之互動。同時英偉達也宣布,正爲領先的人形機器人公司開發綜合 AI 模型,海外公司包括 Figure AI/1X Technologies/Agility Robotics/Apptronik/ Sanctuary AI/波士頓動力等,國內公司包括傅利葉智能/宇樹科技/小鵬鵬行等。

英偉達正在構建 IAI/Omniverse/ISAAC 三大平台,全方面賦能機器人智能化。

IAI/Omniverse/ISAAC 三大平台均與機器人産業高度關聯,其中 IAI 搭載 DGX 系列産品,用于模擬物理世界;Omnivese搭載 RTX和 OVX系列産品,用于驅動數字孿生的計算系統; ISAAC搭載AGX系列,用于驅動人工智能機器人。此次GTC大會上,英偉達發布了配套 GR00T 項目的新型人形機器人計算機 Jetson Thor,以及對 Isaac Lab 進行了重大更新。

(1) Jetson Thor 計算機:在 GTC 2024 上,英偉達 CEO 黃仁勳還推出了新型人形機器人計算機平台 Jetson Thor。Jetson Thor 是一款專爲運行模擬工作流程、生成人工智能模型等人形外形而設計的新型計算機。該平台的設計基于NVIDIA Thor 系統級芯片 (SoC),由 Thor 系統級芯片提供動力,將成爲人形機器人的大腦。Jetson Thor 芯片帶有 Transformer Engine 的新一代 GPU,其采用 NVIDIA Blackwell 架構,可提供每秒 800 萬億次 8 位浮點運算 AI 性能,以運行 GR00T 等多模態模型。

(2) Issac Lab 平台: 在 GTC 2024 大會上,黃仁勳還宣布將對 Isaac 機器人平台進行重大更新,用于爲在任何環境中的任何機器人創建新的基礎模型,平台工具包括用于強化學習的 Isaac Lab 和用于計算編排服務的 OSMO。訓練具身智能模型需要海量的真實數據和合成數據。新的 Isaac Lab 是一個 GPU 加速、性能優化的輕量級應用,基于 Isaac Sim 而構建,專門用于運行數千個用于機器人學習的並行仿真。爲了擴展異構計算的機器人開發工作負載,OSMO 在分布式環境中協調數據生成、模型訓練和軟硬件在環工作流。伴隨著 Isaac的更新,英偉達還發布 Isaac Manipulator (機械臂加速庫) 和 Isaac Preceptor (感知能力軟件庫) 等一系列機器人預訓練模型、庫和參考硬件。

英偉達將機器人與 AI 放在同一戰略高度。在大會收場階段,黃仁勳還和使用英偉達軟硬件平台開發的 9 款人形機器人共同登台,並且黃仁勳還親自介紹了迪士尼 BDX機器人,BDX機器人由 Jetsons系統提供動力,通過 Issac Sim學習走路,並現場進行快速行走/蹲下起身/語音交互等。在黃仁勳的總結材料中,機器人事業部被放在了與 Blackwell GPU/AI Foundry/NIM 等並列的位置,體現機器人業務在英偉達未來商業版圖中十分重要的戰略地位。

在 GTC 2024 的機器人專題論壇中,波士頓動力的首席技術官 Aaron Saunders 將主題聚焦“如何有效地將 AI 技術與現實世界中的機器人相結合”,展開深入探討。

在機器人技術領域,波士頓動力公司的 SPOT 機器人在設計上針對高級別用戶允許全程控制,即用戶只需告訴 Spot 目的地,它便能獨立計算出如何到達。

波士頓動力和英偉達強強聯手,宣布合作推出 SPOT RL Researcher Kit 産品。

盡管 SPOT 機器人車隊在商業部署上規模龐大。但當前版本的 Spot並未完全適配廣泛的機器人研究需求。這一局限性源于波士頓動力公司尚未向開發者社區開放對 SPOT 機器人關節的訪問權限,因而限制了深入研究四足移動性的可能性,導致研究者們不得不轉向其他開放性更強、支持自由實驗的平台。在 GTC 2024 大會上,波士頓動力和英偉達宣布聯手推出 SPOT RL Researcher Kit 産品, 該研究工具包包含了關節級控制 API、英偉達 Jetson AGX Orin 有效載荷以及基于英偉達Isaac Lab 構建的仿真環境,預計該套件計劃在 2024 年晚些時候正式推出。

--- 報告摘錄結束 更多內容請閱讀報告原文 ---

報告合集專題一覽 X 由【報告派】定期整理更新

(特別說明:本文來源于公開資料,摘錄內容僅供參考,不構成任何投資建議,如需使用請參閱報告原文。)

精選報告來源:報告派

科技 / 電子 / 半導體 /

人工智能 | Ai産業 | Ai芯片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機 | 可穿戴設備 |半導體 | 芯片産業 | 第三代半導體 | 藍牙 | 晶圓 | 功率半導體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED芯片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費電子 | 電子FPC | 電路板 | 集成電路 | 元宇宙 | 區塊鏈 | NFT數字藏品 | 虛擬貨幣 | 比特幣 | 數字貨幣 | 資産管理 | 保險行業 | 保險科技 | 財産保險 |

0 阅读:5