2月22日,Arm控股有限公司宣布推出基于全新第三代Neoverse IP構(gòu)建的新的Arm Neoverse 計算子系統(tǒng)(CSS)。與上一代Neoverse CSS N2相比,Neoverse CSS N3的每瓦性能可提高20%。據(jù)介紹,CSS N3的首個實例具備32 核,熱設(shè)計功耗 (TDP) 低至 40W。該芯片可擴展性非常強,可覆蓋電信、網(wǎng)絡(luò)和 DPU 等一系列應(yīng)用。
此外,Arm 還首次將計算子系統(tǒng)引入性能優(yōu)先的V系列產(chǎn)品線,Neoverse CSS V3單芯片性能可比Neoverse CSS N2提高 50%。Arm 基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll表示,CSS V3在使用兩個芯粒 (Chiplet) 的情況下,單芯片最高可支持 128 核心,如果客戶需要實現(xiàn)更高的核心數(shù)量,可以借助 Arm 所提供的 IP 平臺實現(xiàn)。
發(fā)布會上介紹了部分基于Arm Neoverse CSS研發(fā)的芯片實例,以及基于Arm全面設(shè)計生態(tài)項目中合作伙伴的協(xié)作成果,其中包括Socionext 和臺積公司共同打造的 32 核 Neoverse V3芯粒產(chǎn)品、智原科技基于英特爾代工服務(wù)構(gòu)建的64 核服務(wù)器 SoC、由 ADTechnology 與三星代工廠共同打造的 16 核邊緣服務(wù)器 SoC等等。
Dermot O’Driscoll表示,隨著生成式 AI 廣泛應(yīng)用于實際業(yè)務(wù)場景,服務(wù)器的工作重點將轉(zhuǎn)向推理。有分析師估計,已部署的 AI 服務(wù)器中有高達80%專用于推理,且這一數(shù)字還將持續(xù)攀升。這一轉(zhuǎn)變意味著要找到合適的模型和模型配置,并加以訓(xùn)練,然后將其部署到更具成本效益的計算基礎(chǔ)設(shè)施上。但并非所有AI處理都在CPU上進行。打造AI加速器的公司非常多。據(jù)最近統(tǒng)計,這一領(lǐng)域的公司已接近 80 家。
記者在發(fā)布會上了解到,采用芯粒技術(shù)已成為芯片廠商管理良率的常用方法,能讓企業(yè)在單個芯片上利用到多種工藝節(jié)點。例如,使用較舊的工藝節(jié)點處理 I/O,同時搭配先進的工藝節(jié)點處理邏輯功能。企業(yè)也在努力尋找巧妙的方法來復(fù)用芯粒,但當他們將不同團隊的設(shè)計組合在一起時,還是面臨一些挑戰(zhàn),比如協(xié)議層存在多種標準,包括 PCIe、CXL和 AMBA等。
Dermot O’Driscoll表示,Arm正在深入?yún)⑴c到 AMBA CHI,引入芯片到芯片 (C2C) 的擴展功能,但系統(tǒng)架構(gòu)層面仍面臨難題,包括怎樣在設(shè)計時對芯粒進行邏輯分區(qū)、如何設(shè)置直接內(nèi)存訪問 (DMA) 和中斷、電源和安全等管理功能等問題仍有待解決。Arm近期發(fā)布芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA),旨在解決上述問題,幫助整個 Arm生態(tài)系統(tǒng)釋放芯粒技術(shù)的潛力。
- QQ:61149512