AMD董事長兼CEO蘇姿豐在美國當(dāng)?shù)貢r間10月10日于舊金山舉行的Advancing AI活動上帶來了一整套AI“殺手锏”,給整個業(yè)界帶來了全新的AI震撼。
蘇姿豐展示最新發(fā)布的MI325X GPU
其中,最大的驚喜正是AMD最新發(fā)布的旗艦AI芯片-AMD Instinct MI325X GPU(以下簡稱:MI325X),蘇媽也是再次信心滿滿地掏出了與老對手英偉達(dá)當(dāng)下熱銷產(chǎn)品H200的對比圖,她表示,MI325X的內(nèi)存容量是H200的1.8倍,內(nèi)存帶寬、FP16和FP8峰值理論算力都達(dá)到了H200的1.3倍。
此外,蘇媽還發(fā)布了第五代EPYC服務(wù)器CPU,并稱其為“面向云計算、企業(yè)級和AI的全球最好CPU”,與老對手英特爾的第五代至強鉑金8592+處理器相比,這款CPU的HPC(高性能計算)性能提高多達(dá)3.9倍,基于CPU的AI加速提高多達(dá)3.8倍。蘇媽此次可謂是將滿滿的壓力給到了英偉達(dá)和英特爾。
HBM3e內(nèi)存容量是GPU提升的關(guān)鍵?
當(dāng)前,英偉達(dá)毫無疑問是數(shù)據(jù)中心GPU領(lǐng)域的霸主,TechInsights公布的數(shù)據(jù)顯示,2023年全球數(shù)據(jù)中心GPU總出貨量達(dá)到了385萬顆,其中,英偉達(dá)以98%的市場份額穩(wěn)居第一,AMD雖位居第二,卻仍是相差十分懸殊。但熟悉蘇媽的人都知道,她蘇媽受命于AMD危難之際,最不怕的就是打硬仗,此次帶來的MI325X就是為了“硬剛”英偉達(dá)的H200而來。
據(jù)了解,MI325X采用了與上一代MI300X相同的CDNA 3架構(gòu),最大的提升就是首次采用了業(yè)界目前最先進(jìn)的HBM3e,總?cè)萘窟_(dá)256GB,基于16-Hi堆棧制程,內(nèi)存帶寬高達(dá)6TB/s,單顆芯片總共擁有1530億個晶體管。
MI325X GPU的各項參數(shù)
專家告訴記者,HBM內(nèi)存提高,對于GPU來說,能夠帶來數(shù)據(jù)傳輸速度的提升、數(shù)據(jù)處理能力的增強、能效比的提高、空間與延遲的節(jié)省、對更復(fù)雜應(yīng)用場景的支持以及系統(tǒng)穩(wěn)定性與可靠性的提升等多方面的好處。因此,MI325X的FP8性能達(dá)到了2.6PFLOP,F(xiàn)P16性能也達(dá)到了1.3PFLOP。
橫向?qū)Ρ龋ミ_(dá)H200采用的HBM3e容量為141GB,帶寬為4.8TB/sz,總晶體管數(shù)量約為800億個,相比于MI325X肯定是不夠看了,哪怕是英偉達(dá)最新推出的B200,采用的HBM3e內(nèi)存容量也僅為192GB,與MI325X的256GB HBM3e內(nèi)存容量仍存在差距。
雖然,兩家對于GPU的設(shè)計各有不同,HBM3e內(nèi)存容量也并不是評判GPU性能的唯一標(biāo)準(zhǔn),但對產(chǎn)品性能的上限有明顯提升,這也是AMD直面英偉達(dá)的底氣。蘇媽很自豪地在發(fā)布會上強調(diào):“MI325服務(wù)器平臺在運行Llama 3.1時,能提供比英偉達(dá)H200 HGX高出多達(dá)40%的性能?!?/p>
根據(jù)AMD官方信息,MI325X加速器目前有望在2024年第四季度投入生產(chǎn),預(yù)計從2025年第一季度開始發(fā)貨。
AMD最新的GPU技術(shù)路線圖
此外,根據(jù)當(dāng)前“一年一迭代”的節(jié)奏,AMD此次更新了其AI芯片的路線圖,預(yù)計下一代MI350系列將在明年上市,將采用3nm制程,并把HBM3E內(nèi)存再提升至288GB,新一代CDNA 4架構(gòu)也將安排上,使得其推理性能比基于CDNA 3架構(gòu)的加速器提高了35倍,該系列AMD計劃在2025年下半年上市。
其中,MI350系列的代表產(chǎn)品MI355X是AMD專門用來應(yīng)對英偉達(dá)在三月剛剛發(fā)布的Blackwell B200的。據(jù)了解,MI355X的FP8和FP16性能相比MI325X提升了80%,F(xiàn)P16峰值性能達(dá)到2.3PFLOPS,F(xiàn)P8峰值性能達(dá)到4.6PFLOPS,F(xiàn)P6和FP4峰值性能達(dá)到9.2PFLOPS。
最新CPU性能已經(jīng)趕超英特爾?
CPU業(yè)務(wù)對于AMD來說是涅槃重生的開始,在2018年,其EPYC服務(wù)器的市占率僅為2%,經(jīng)過四代的升級,終于在2024年第一季度達(dá)到了34%,從英特爾手里搶走了近30%的CPU服務(wù)器市場份額,也成了AMD的主要營收來源。
EPYC服務(wù)器CPU的市場占比
蘇媽在發(fā)布今年第二季度財報時就表示:“我們在第二季度實現(xiàn)了強勁的營業(yè)額與收入增長,這得益于數(shù)據(jù)中心事業(yè)部創(chuàng)紀(jì)錄的營業(yè)額。我們的AI業(yè)務(wù)繼續(xù)加速攀升,在Instinct系列、,EPYC和Ryzen處理器的市場需求帶動下,AMD為下半年營業(yè)額的強勁增長已做好了充分準(zhǔn)備?!?/p>
所以,AMD此次的另一大殺手锏就是其第五代EPYC服務(wù)器CPU,代號“Turin”。
第五代EPYC服務(wù)器CPU的各項參數(shù)
據(jù)介紹,Turin擁有1500億顆晶體管,采用臺積電3/4nm制程、全新“Zen 5”及“Zen 5c”核心兼容廣泛部署的SP5平臺,最多支持192核、384個線程。當(dāng)前,英特爾能效核版至強6雖然能在未來通過雙芯封裝做到288核心,但無法支持超線程技術(shù),只有288個線程。因此,在核心數(shù)和線程數(shù)上,AMD已經(jīng)趕超了英特爾。
在技術(shù)全面升級的情況下,Turin的性能得到了明顯提升。AMD表示,相比于上一代的英特爾Xeon服務(wù)器,Turin在SPEC CPU測試中性能提升2.7倍,企業(yè)級性能最高提升4.0倍,HPC(高性能計算)性能最高提升3.9倍。
蘇媽打了很形象的比方,她表示,如果用Turin服務(wù)器替代上一代的至強服務(wù)器,只需131臺服務(wù)器就能達(dá)到原來1000臺的性能水平,節(jié)省87%的占地空間。同時,功耗可以節(jié)省最多68%。
AMD還優(yōu)化了Turin在AI工作流程中的關(guān)鍵動作,包括數(shù)據(jù)預(yù)處理、內(nèi)存復(fù)制、內(nèi)核啟動和任務(wù)協(xié)調(diào)等。這些優(yōu)化使得CPU在處理GPU協(xié)調(diào)任務(wù)時更高效,比前代產(chǎn)品快28%。
除了GPU和CPU,蘇媽此次還帶了最新的DPU、AI網(wǎng)卡以及ROCm 6.2生態(tài)系統(tǒng),湊齊了一整套“AI全家桶”,給“雙英”帶來了十足的壓力。但當(dāng)天的AMD股價并沒有買賬,反而以大跌收場,日內(nèi)跌幅一度擴大到約5.3%,最終收跌4%,創(chuàng)9月3日以來最大盤中和收盤跌幅。可見,AMD的新品雖然來勢兇猛,可只有真正量產(chǎn),經(jīng)過客戶檢驗,才能贏得市場的認(rèn)可。
責(zé)任編輯:許子皓
- QQ:61149512