作者:Rambus研究員與杰出發(fā)明家Steven Woo 根據IDC預測,中國在人工智能領域的投資預計到2027年將達到381億美元,占全球總投資的近9%。作為全球人工智能的重要參與者,中國正加速在汽車、通信、醫(yī)療、金融等多個行業(yè)應用和發(fā)展生成式AI技術,全面邁入“AI 2.0”時代。 人工智能這一概念是由約翰·麥卡錫(John McCarthy)在1956年提出。此后數十年間,科學家們投入了巨大努力,讓AI不斷變得更智能,但其能力仍主要局限于在特定輸入輸出范圍內進行分析與預測(例如:從文本生成網頁結果)。而新一代人工智能則帶來了重大范式轉變——它能夠基于數據生成全新的內容。 和上一代不同,AI 2.0 依托多模態(tài)輸入與輸出,在文本、語音、代碼、圖像、視頻,甚至三維模型等多種媒介之間實現無縫交互。大型語言模型(LLMs)的出現,也是這一時代的重要標志。LLMs能夠處理和生成海量數據,正在不斷突破以往的技術邊界,讓更復雜、更先進的AI應用在各行各業(yè)成為可能。 訓練大型語言模型(LLMs)是一個復雜的多步驟過程,首先需要收集用于訓練的數據。數據收集完成后,還需經過分析、處理和清理,才能進入訓練階段。如何實現海量數據的高速傳輸與存儲,已經成為整個行業(yè)面臨的重大挑戰(zhàn),更不用說訓練所需的數據規(guī)模還在持續(xù)增長。以ChatGPT為例,GPT-3的參數量為1750億,而GPT-4則高達1.76萬億,幾乎所有AI公司都在不斷擴大模型的訓練參數。 在完成訓練過程后,AI模型便會生成,并可用于執(zhí)行推理。相比訓練,推理對內存的要求相對較低。然而,隨著AI逐漸普及,越來越多的應用正從數據中心向邊緣和終端延伸,這對現有的內存系統(tǒng)在帶寬、延遲和容量等方面提出了更高的要求。 為應對這些重大挑戰(zhàn)并解決 AI 2.0 的內存瓶頸,業(yè)界已提出了許多創(chuàng)新性技術方案,包括多路復用內存、串行連接內存、新型編碼方案以及全新的模塊形態(tài)。這些創(chuàng)新有望應用于現有內存解決方案,為先進的 AI 工作負載帶來更高的性能表現。 其中一個前景廣闊的解決方案是多路復用內存。正在進入市場的 DDR5 MRDIMMs 采用復用技術,在沿用現有 DRAM 的同時,有效地將數據傳輸速率提升一倍,從而突破了傳統(tǒng) DRAM 在擴展上的限制。另一種提升路徑是串行連接內存。在 CXL 技術的支持下,這一方式能夠實現緩存一致性的內存共享,并通過采用串行而非并行的數據傳輸,大幅提升容量與帶寬。 此外,新型編碼方案也可應用于部分內存模塊。例如,GDDR7 采用三階脈沖幅度調制(PAM3)編碼,數據傳輸速率最高可達 48Gbps,能夠支持高性能的邊緣與終端 AI 應用。模塊形態(tài)的創(chuàng)新同樣在內存容量擴展中發(fā)揮關鍵作用。低功耗壓縮附加內存模塊(LPCAMM)便是其中的典型代表,其專為在空間受限的設備(如筆記本電腦)中擴展 LPDDR 內存的性能與應用而設計。 除了性能和容量的提升之外,RAS(可靠性、可用性和可維護性)在內存領域也變得愈發(fā)重要。隨著內存芯片的數據傳輸速率不斷提高,單元尺寸持續(xù)縮小,以便在一顆芯片中容納更多比特。但單元縮小也帶來了新的挑戰(zhàn),例如芯片內錯誤(on-die errors),這就需要更強大的糾錯機制。此外,像 RowHammer 和 RowPress 這樣的現象——即訪問特定單元時可能干擾相鄰區(qū)域的單元——也亟需進一步的緩解策略。 還需要關注一些相關的發(fā)展。量子計算時代即將到來,現有的非對稱加密將面臨被破解的風險,因此無論是 AI 數據還是硬件,都需要通過新一代的抗量子加密技術(Quantum Safe Cryptography)來保護。 同時,訓練和推理AI所需的能耗問題也正日益受到關注。對此,業(yè)內各方正積極采取行動來應對這一挑戰(zhàn)。從內存角度來看,行業(yè)正持續(xù)通過降低工作電壓和優(yōu)化設計架構來提升能效。電源管理IC(PMIC)將成為在既定功耗范圍內實現更高性能的關鍵一環(huán)。 隨著 AI 模型日益復雜,對內存的需求也將更加嚴苛。AI 2.0將重塑各行各業(yè),從個性化體驗到行業(yè)專屬解決方案,在整個計算領域(云端、邊緣、終端)全面掀起浪潮,進而推動對更高性能內存解決方案的強勁需求。 作為業(yè)內領先的芯片與半導體IP供應商,Rambus 致力于推動數據中心互聯,解決內存與處理器之間的瓶頸問題,從而支持大型語言模型(LLMs)及先進AI應用的發(fā)展。Rambus 的全方位產品組合——包括 DDR5 DIMM 芯片組、HBM3/3E 控制器 IP、GDDR7、PCIe 6.1、CXL 3.1,以及 LPDDR5T/5X/5 等——為這些高負載的 AI 工作提供所需的速度、容量與連接能力。 在 AI 2.0 的演進過程中,Rambus 在內存接口芯片、內存接口 IP 以及安全 IP 解決方案方面的專長,將成為不斷突破技術邊界的重要推動力。展望未來,Rambus 將持續(xù)攜手產業(yè)伙伴,共同開發(fā)前沿的內存解決方案,釋放 AI 技術的全部潛能。 |