近日,在2024 IEEE國(guó)際電子設(shè)備會(huì)議(IEDM)上,全球領(lǐng)先的圖形處理與人工智能計(jì)算技術(shù)提供商英偉達(dá)(NVIDIA)展示了其對(duì)未來人工智能(AI)加速器的創(chuàng)新設(shè)計(jì)。 據(jù)英偉達(dá)介紹,其未來AI加速器的設(shè)計(jì)將引入硅光子技術(shù)(SiPh)作為I/O器件,這一革命性的變化將顯著提升數(shù)據(jù)傳輸速度和能效,同時(shí)減少模塊之間的信號(hào)傳輸距離,從而改善整體性能。硅光子技術(shù)的引入,標(biāo)志著與傳統(tǒng)互連技術(shù)相比的一次重大飛躍,傳統(tǒng)互連技術(shù)一直受到銅制材料自然特性的限制。 英偉達(dá)的新架構(gòu)采用了垂直供電和多模塊設(shè)計(jì),集成了硅光子I/O器件,并運(yùn)用了3D垂直堆疊DRAM內(nèi)存。在這一設(shè)計(jì)中,每個(gè)AI加速器復(fù)合體將包含四個(gè)GPU模塊,每個(gè)GPU模塊將與六個(gè)DRAM內(nèi)存模塊垂直堆疊,并配備三組硅光子I/O器件。這種堆疊DRAM內(nèi)存與GPU模塊之間實(shí)現(xiàn)了直接電氣連接,類似于AMD的3D V-Cache技術(shù),但規(guī)模更大、集成度更高。 具體來說,新架構(gòu)需要12個(gè)硅光子I/O器件來實(shí)現(xiàn)芯片內(nèi)和芯片間的連接,每個(gè)GPU模塊有三個(gè)連接,每層有四個(gè)GPU模塊。這種設(shè)計(jì)不僅提高了帶寬和能效,還有助于優(yōu)化數(shù)據(jù)流,提升可擴(kuò)展性和性能。 英偉達(dá)表示,硅光子I/O技術(shù)的大規(guī)模制造將是一個(gè)特殊的挑戰(zhàn),預(yù)計(jì)每月需要生產(chǎn)超過100萬個(gè)這類器件才能滿足需求。同時(shí),英偉達(dá)還在探索創(chuàng)新的解決方案,以解決模塊堆疊帶來的散熱問題,并可能引入更先進(jìn)的材料和技術(shù)來優(yōu)化熱管理。 盡管面臨諸多技術(shù)挑戰(zhàn),英偉達(dá)仍表示,其新型AI加速器設(shè)計(jì)距離商業(yè)化還需要一段時(shí)間,預(yù)計(jì)將在2028年至2030年之間投入使用。 |