在7月27日的世界人工智能大會(WAIC)上,燧原科技和沐曦首發(fā)各自新一代的主力AI芯片。 燧原科技新發(fā)布的L600芯片歷時兩年半開發(fā),采用訓(xùn)推一體的架構(gòu),亦即可用于大模型訓(xùn)練和推理。L600配備144GB的存儲容量,存儲帶寬為3.6TB/s,支持DeepSeek模型在訓(xùn)練過程中使用的FP8(8位浮點數(shù))低精度——低精度可提升訓(xùn)練速度和降低計算成本。 L600是燧原科技第四代芯片,上一代產(chǎn)品為2024年6月量產(chǎn)的S60推理芯片,面向大語言模型、多模態(tài)大模型、搜索廣告推薦、傳統(tǒng)AI模型等場景。在S60的基礎(chǔ)上,燧原科技還推出DeepSeek一體機(jī),可運(yùn)行滿血版、蒸餾版不同尺寸的模型。 S60芯片目前已出貨7萬顆,在國產(chǎn)卡落地規(guī)模上進(jìn)入前列,且覆蓋到國內(nèi)五大智算集群。其中,2024年12月,燧原科技在甘肅慶陽建成萬卡推理集群,使用了10016張S60算力卡。 沐曦新推出的曦云C600延續(xù)了訓(xùn)推一體的方案,具備多精度的混合算力,同樣支持FP8精度。C600采用HBM3e顯存(第五代高帶寬內(nèi)存),數(shù)據(jù)存儲容量從上一代C500的64GB提升至144GB。值得一提的是,HBM3e是當(dāng)前市場上較先進(jìn)的高帶寬內(nèi)存產(chǎn)品,僅次于最新的HBM4,英偉達(dá)旗下H100等芯片也搭載HBM3e。 目前,沐曦的產(chǎn)品結(jié)構(gòu)涵蓋三大類別:訓(xùn)推一體的曦云C系列、面向傳統(tǒng)人工智能場景的推理GPU曦思N系列、用于圖形渲染的曦彩G系列。曦云C系列是其中的主力產(chǎn)品。根據(jù)沐曦的招股書,2024年度和2025年前三月,曦云的C500芯片的收入占比分別高達(dá)97.28%和 97.87%。南都記者了解到,沐曦正在基于C500系列建設(shè)萬卡集群。 |