據路透社8月19日消息,英偉達正秘密推進一款專為中國市場設計的新型AI芯片研發(fā)項目,暫定代號為B30A。這款基于Blackwell架構的芯片被定位為H20的升級迭代產品,其原始算力雖僅為旗艦級B300雙芯片加速卡的一半。 B30A采用單芯片(single-die)設計,將所有核心組件集成于12英寸晶圓,相較H20的Hopper架構實現23%的能效比提升。該芯片配備新一代HBM3e高帶寬內存,單卡內存容量達128GB,內存帶寬突破4.5TB/s,較H20的4.0TB/s提升12.5%。在核心算力方面,FP8精度下理論算力達340 TFLOPS,超越H20的296 TFLOPS,特別在混合精度訓練場景中,B30A通過動態(tài)精度調節(jié)技術可將有效算力提升至H20的1.3倍。 架構革新破解算力瓶頸 Blackwell架構的引入帶來三大核心升級:其一,第四代NVLink互聯技術實現單服務器內256張加速卡的全互連,集群通信延遲較H20降低40%;其二,Transformer引擎優(yōu)化使千億參數模型訓練效率提升35%,在Llama 3 70B模型測試中,B30A完成單輪訓練耗時較H20縮短2.1小時;其三,新增的動態(tài)功耗管理模塊可根據負載實時調節(jié)TDP,在保持450W基礎功耗下,峰值性能釋放時長較H20延長1.8倍。 合規(guī)設計應對出口管制 為規(guī)避美國4月新規(guī)設定的1.4TB/s內存帶寬限制,B30A采用分頻傳輸技術,將數據通道拆分為四組獨立頻段,通過時序復用實現邏輯帶寬4.8TB/s的同時,物理帶寬控制在1.2TB/s閾值內。該設計已通過美國商務部工業(yè)與安全局(BIS)的初步審查,但知情人士強調,最終量產仍需獲得"最終用戶驗證清單"(UVL)豁免。 市場策略凸顯競爭焦慮 英偉達計劃于2025年9月向阿里云、騰訊等戰(zhàn)略客戶交付首批工程樣品,2026年Q1啟動量產。定價策略方面,B30A單卡售價預計在2.8萬至3.2萬美元區(qū)間,較H20上浮15%,但通過算力密度提升使每PFLOPS成本下降22%。與此同時,英偉達正同步推進RTX6000D推理芯片項目,這款采用GDDR6顯存的入門級產品,將以1.398TB/s的內存帶寬精準卡位管制紅線,預計9月向字節(jié)跳動等企業(yè)提供測試機。 地緣博弈增添變數 盡管特朗普政府近期釋放"可能放寬高端芯片出口"信號,但美國國會兩黨議員已聯名提交《AI芯片出口管制強化法案》,要求將"可訓練參數量超過1000億"作為新的管制標準。在此背景下,英偉達中國區(qū)負責人黃仁勛在內部會議中強調:"B30A不是妥協產物,而是用技術創(chuàng)新在政策縫隙中開辟新賽道。"據供應鏈消息,臺積電CoWoS-L先進封裝產線已預留20%產能應對B30A量產需求,而長江存儲的192層3D NAND閃存也進入認證流程,或將成為該芯片存儲模塊的潛在供應商。 這場圍繞AI芯片的技術博弈,正將全球半導體產業(yè)推向更復雜的競合局面。B30A能否如英偉達所愿成為"合規(guī)框架下的性能標桿",或將取決于中美監(jiān)管機構的最終博弈結果。 |