性能暴降92%?英特爾中國“特供版”AI芯片曝光

芯智訊 2024-04-14 18:00:24

據外媒The register報道,繼不久前英特爾正式發布了新一代AI加速芯片Gaudi 3 之後,正准備面向中國市場推出“特供版”Gaudi 3,包括名爲HL-328的OAM兼容夾層卡(Mezzanine Card)和名爲HL-388的PCle加速卡兩種硬件形態。

英特爾在其Gaudi 3 白皮書中披露了上述信息,其中HL-328將于6月24日推出,HL-388將于9月24日推出。

具體硬件規格方面,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內存, 128GB HBM2e高帶寬內存,帶寬爲 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標准。但是,由于美國對于AI芯片的出口管制規則限制,使得這類高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。

根據英特爾公布的數據顯示,Gaudi 3 在 FP16/BF16 上可以達到 1835 TFLOPS,相比英偉達H100在大模型訓練方面快40%、推理能效高50%。

顯然,中國特供版的Gaudi 3 需要大幅降低AI性能,才能合規出口到中國。因此,中國特供版Gaudi 3 需要大幅削減內核數量(原版擁有 8 個矩陣數學引擎和64 個張量內核)和工作頻率,最終可能需要其AI性能降低約92%才能符合美國的出口管制要求。

由于中國特供版Gaudi 3 AI性能的降低,這也將使得其TDP(熱設計功耗)大幅降低。根據曝光的資料顯示,中國特供版Gaudi 3的OAM卡和PCIe卡的TDP均爲450瓦,而原版PCIe卡(HL-338)的TDP高達600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達900瓦。

可以預見的是,英特爾專爲中國市場推出的“特供版”Gaudi 3的OAM兼容夾層卡(HL-328)和PCle加速卡(HL-388)的AI性能將會與英偉達針對中國市場推出的AI加速卡H20相當,它具有 148 TFLOPS 的 FP16/ BF16 性能,略低于 150 TFLOPS 的限制。但是,在HBM容量及帶寬上,英特爾中國特供版Gaudi 3將低于英偉達H20,這也使得其在與英偉達H20的競爭當中可能將處于劣勢,當然具體也要看定價是否有優勢。

相關文章《超越英偉達H100!英特爾Gaudi3發布:訓練快40%,推理快50%!》

編輯:芯智訊-浪客劍

3 阅读:2192
评论列表
  • 2024-04-15 00:08

    雷傳志爲首的漢奸們買買買呀!

    微笑面對 回覆:
    自己的筆記本裝的自研utral芯片,比硬幣薄
  • 2024-04-15 14:21

    雷傳志會洋洋得意的說他搶到了首發

  • 2024-04-16 07:36

    都說華爲研發了強力ai芯片,怎麽不見大家買,依然眼巴巴的奢求美國爸爸的剩飯。

  • 2024-04-15 20:32

    盡想在我們這裏清倒垃圾,而且還想要原價。

  • LBB 2
    2024-04-15 17:55

    小米搶到首發嗎?

  • 2024-04-15 23:41

    性能下降92%價格不變[呲牙笑][呲牙笑][呲牙笑]

  • 2024-04-15 18:59

    把性能砍成和國産AI卡差不多了,算是給了國內企業一個機會

  • 2024-04-15 12:47

    請描述清楚,性能暴降92%那就是說性能只有原版的8%

芯智訊

簡介:專注于手機、芯片、智能硬件等相關領域的行業資訊報道。