9月18日,第十屆華為全聯(lián)接大會(huì)在上海世博中心拉開帷幕。華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍以《以開創(chuàng)的超節(jié)點(diǎn)互聯(lián)技術(shù),引領(lǐng)AI基礎(chǔ)設(shè)施新范式》為題發(fā)表主題演講,首次系統(tǒng)性披露昇騰AI芯片未來三年演進(jìn)路線,并發(fā)布全球首款百萬卡級(jí)AI超節(jié)點(diǎn)集群,引發(fā)產(chǎn)業(yè)界強(qiáng)烈震動(dòng)。這場(chǎng)被外界視為"中國(guó)芯片突圍戰(zhàn)"關(guān)鍵戰(zhàn)役的發(fā)布,標(biāo)志著華為在算力封鎖下走出一條獨(dú)特的技術(shù)路徑。 三年三代芯:昇騰芯片開啟算力倍增模式 徐直軍宣布,華為已規(guī)劃2026-2028年三代昇騰芯片:2026年Q1推出950PR(推理優(yōu)化型)和Q4推出950DT(訓(xùn)練優(yōu)化型),2027年Q4發(fā)布960系列,2028年Q4亮相970系列。其中950系列首次采用雙芯片協(xié)同架構(gòu),950PR專注推理場(chǎng)景的Prefill階段,950DT強(qiáng)化訓(xùn)練性能,兩顆芯片通過2TB/s互聯(lián)帶寬實(shí)現(xiàn)算力無縫銜接。 技術(shù)突破方面,950系列新增支持FP8/MXFP8等低精度數(shù)據(jù)格式,向量算力占比提升至40%,并采用SIMD/SIMT雙編程模型創(chuàng)新設(shè)計(jì)。特別值得關(guān)注的是華為自研的HiBL 1.0和HiZQ 2.0兩種HBM內(nèi)存,通過將內(nèi)存訪問顆粒度從512字節(jié)降至128字節(jié),使離散數(shù)據(jù)訪問效率提升3倍。 "昇騰960將在算力、內(nèi)存帶寬等核心指標(biāo)上較950系列翻倍,而970系列將實(shí)現(xiàn)互聯(lián)帶寬再翻倍、內(nèi)存容量增加1.5倍。"徐直軍透露,970系列正在探討引入光子計(jì)算芯片等前沿技術(shù),目標(biāo)在2028年構(gòu)建起對(duì)抗英偉達(dá)Blackwell架構(gòu)的算力壁壘。 超節(jié)點(diǎn)革命:重構(gòu)AI基礎(chǔ)設(shè)施范式 大會(huì)現(xiàn)場(chǎng),華為發(fā)布Atlas 950 SuperPoD和Atlas 960 SuperPoD兩款超節(jié)點(diǎn)產(chǎn)品,分別支持8192和15488張昇騰卡互聯(lián)。經(jīng)實(shí)測(cè),Atlas 950 SuperPoD可提供300PFLOPs的密集BF16算力,較英偉達(dá)GB200 NVL72系統(tǒng)性能提升近2倍。更令人震撼的是其擴(kuò)展能力——通過"靈衢(UnifiedBus)"互聯(lián)協(xié)議,華為構(gòu)建起Atlas 950 SuperCluster(50萬卡規(guī)模)和Atlas 960 SuperCluster(百萬卡規(guī)模)兩大集群產(chǎn)品,其中960集群FP8總算力將達(dá)2 ZFLOPS,相當(dāng)于全球現(xiàn)有最強(qiáng)算力中心的20倍。 "超節(jié)點(diǎn)在邏輯上是一臺(tái)計(jì)算機(jī),但在物理層面需要攻克三大難題。"徐直軍坦言,華為通過重新設(shè)計(jì)光器件、光模塊和互聯(lián)芯片,使光互聯(lián)可靠性提升百倍、距離突破200米;采用多端口聚合與高密封裝技術(shù),實(shí)現(xiàn)TB級(jí)超大帶寬;依托平等架構(gòu)和統(tǒng)一協(xié)議,將跨柜卡間互聯(lián)時(shí)延壓縮至2.1微秒。這些突破使得萬卡級(jí)超節(jié)點(diǎn)能夠像單機(jī)一樣完成深度學(xué)習(xí)訓(xùn)練任務(wù)。 技術(shù)破局:聯(lián)接能力彌補(bǔ)制程短板 面對(duì)美國(guó)制裁導(dǎo)致的先進(jìn)制程獲取困難,華為選擇"以架構(gòu)創(chuàng)新突破物理限制"的戰(zhàn)略路徑。"我們單顆芯片算力或許不及競(jìng)爭(zhēng)對(duì)手,但通過系統(tǒng)工程方法,華為已部署超過300套Cloud Matrix 384超節(jié)點(diǎn)。"徐直軍展示的數(shù)據(jù)顯示,基于7nm制程的昇騰910C芯片,通過超節(jié)點(diǎn)架構(gòu)實(shí)現(xiàn)的集群算力,已超越采用3nm制程的英偉達(dá)H200集群。 這種技術(shù)路線正獲得市場(chǎng)驗(yàn)證。據(jù)IDC數(shù)據(jù),2024年華為昇騰芯片在中國(guó)AI服務(wù)器市場(chǎng)份額從15%躍升至35%,而英偉達(dá)份額從70%跌至40%。百度、阿里等企業(yè)已將昇騰作為大模型訓(xùn)練主要算力底座,特斯拉更在車機(jī)系統(tǒng)中接入鴻蒙生態(tài),采用昇騰芯片進(jìn)行自動(dòng)駕駛模型迭代。 生態(tài)開放:CANN編譯器等核心工具年底前全開源 在發(fā)布硬核技術(shù)的同時(shí),華為宣布重大開源計(jì)劃:2025年12月31日前,將完成CANN編譯器、Mind系列應(yīng)用使能套件及openPangu基礎(chǔ)大模型的全面開源。徐直軍強(qiáng)調(diào):"這不是簡(jiǎn)單的代碼開放,而是要構(gòu)建起包括虛擬指令集接口在內(nèi)的完整技術(shù)生態(tài)。" 目前,昇騰生態(tài)已適配160多個(gè)大模型,聯(lián)合80家伙伴推出大模型一體機(jī)。值得關(guān)注的是,華為首次將超節(jié)點(diǎn)技術(shù)引入通用計(jì)算領(lǐng)域,發(fā)布的TaiShan 950 SuperPoD通用計(jì)算超節(jié)點(diǎn),結(jié)合GaussDB分布式數(shù)據(jù)庫(kù),可完全替代大型機(jī)、小型機(jī)及Exadata數(shù)據(jù)庫(kù)一體機(jī)。"這將是傳統(tǒng)計(jì)算架構(gòu)的終結(jié)者。"徐直軍斷言。 當(dāng)被問及中美芯片競(jìng)爭(zhēng)時(shí),徐直軍回應(yīng):"算力競(jìng)賽不是單芯片的軍備競(jìng)賽,而是系統(tǒng)工程的比拼。華為用三十年聯(lián)接技術(shù)積累,在7nm制程上實(shí)現(xiàn)了3nm制程的算力效能,這就是中國(guó)科技的創(chuàng)新答案。"這場(chǎng)持續(xù)90分鐘的演講,多次被現(xiàn)場(chǎng)2000余名參會(huì)者的掌聲打斷,而華為展區(qū)展示的384顆昇騰芯片組成的超節(jié)點(diǎn)實(shí)物機(jī)柜,更成為本屆大會(huì)最熱門的打卡地標(biāo)。 |