消息稱英偉達(dá)計(jì)劃 Q2 向中國(guó)市場(chǎng)推出特供版 H20 芯片
據(jù)路透社,英偉達(dá)計(jì)劃于 2024 年第二季度開(kāi)始量產(chǎn)中國(guó)特供的 AI 芯片,以遵守美國(guó)出口管制新規(guī),其中最強(qiáng)的型號(hào)就是 H20。英偉達(dá)對(duì)此拒絕置評(píng)。

除了 HGX H20 之外,英偉達(dá)還計(jì)劃推出另外兩款符合美國(guó)限制的 PCIe 芯片 ——L20 和 L2,但具體信息不詳。
消息人士透露,H20 原定于去年 11 月推出,但該計(jì)劃由于“服務(wù)器制造商在集成該芯片時(shí)遇到了問(wèn)題”而被推遲。其中一位知情人士表示,初期產(chǎn)能十分有限,英偉達(dá)需要首先滿足主流客戶的訂單。

根據(jù) SemiAnalysis 分析,H20、L20 和 L2 包含英偉達(dá)大部分用于 AI 工作的功能特性,但為了遵守新規(guī)則,這三款新品在算力方面有所削減;不過(guò)在 LLM 推理中依然要比 H100 快 20% 以上。
查詢公開(kāi)資料獲悉,NVIDIA H100 Tensor Core GPU 采用全新 Hopper 架構(gòu),基于臺(tái)積電 N4 工藝,集成了 800 億個(gè)晶體管。與上一代產(chǎn)品相比,可為多專家 (MoE) 模型提供高 9 倍的訓(xùn)練速度。
它配備第四代 Tensor Core 和 Transformer 引擎(FP8 精度),還具有高度可擴(kuò)展的 NVLink 互連技術(shù)(最多可連接達(dá) 256 個(gè) H100 GPU,相較于上一代采用 HDR Quantum InfiniBand 網(wǎng)絡(luò),帶寬高出 9 倍,帶寬速度為 900GB/s)等功能。

- 硅谷機(jī)器人明星公司K-Scale Labs猝死,融資600多萬(wàn)美元一年燒光!11-14
- 荷蘭高級(jí)代表團(tuán)下周訪華,共商安世半導(dǎo)體問(wèn)題解決方案11-14
- 因過(guò)熱和起火風(fēng)險(xiǎn),特斯拉大規(guī)模召回10500套Powerwall 211-14
- 立中集團(tuán)又獲3客戶項(xiàng)目定點(diǎn),合計(jì)金額約2.7億元11-14
- 蘇州固锝:含銀量10%的銀包銅產(chǎn)品已進(jìn)入量產(chǎn)階段11-14
- 關(guān)于美光禁售,商務(wù)部這樣回應(yīng)......11-07