通信世界網(wǎng)消息(CWW)開源模型逐漸占據(jù)主流話語權(quán),接入與適配成為必然選擇,DeepSeek為行業(yè)增添發(fā)展動(dòng)力的同時(shí),也掀起了一場從底層技術(shù)到設(shè)施建設(shè)乃至體系生態(tài)的算力革命。
最直觀地,憑借“輕量化訓(xùn)練+高效推理”的特性,DeepSeek不僅大幅降低了大模型開發(fā)成本,更對傳統(tǒng)以英偉達(dá)為首的訓(xùn)練芯片巨頭形成直接沖擊。在這場技術(shù)變局中,國產(chǎn)算力芯片作為算力的根本支撐,亟待探索出一條屬于自己的發(fā)展之路。
從“訓(xùn)練為王”到“推理稱雄”
在AI技術(shù)體系中,訓(xùn)練與推理是兩大核心環(huán)節(jié),訓(xùn)練需要海量數(shù)據(jù)和超強(qiáng)算力,推理則要求快速響應(yīng)現(xiàn)實(shí)問題,隨著AI應(yīng)用場景的普及,推理算力需求正迅速超越訓(xùn)練端。根據(jù)IDC數(shù)據(jù),未來幾年,推理端的AI服務(wù)器占比將持續(xù)攀升。預(yù)計(jì)到2027年,用于推理的工作負(fù)載將占據(jù)七成以上。
“DeepSeek的核心突破在于算法優(yōu)化和計(jì)算效率提升,這種低算力需求模型對國產(chǎn)芯片的發(fā)展是一個(gè)重要機(jī)遇?!蹦柧€程市場生態(tài)高級總監(jiān)呂其恒在接受采訪時(shí)講道。
首先,DeepSeek的成功表明,通過模型壓縮、稀疏計(jì)算、混合精度訓(xùn)練等技術(shù)手段降低算力需求,可以在一定程度上彌補(bǔ)硬件性能的不足,為國內(nèi)芯片提供了軟硬件協(xié)同設(shè)計(jì)的新思路,證明了在硬件性能短期內(nèi)難以趕超的情況下,通過軟件層面的創(chuàng)新仍可提升整體計(jì)算效能。
其次,DeepSeek在混合精度訓(xùn)練方面的成功,展示了低精度計(jì)算在AI訓(xùn)練中的潛力。國內(nèi)芯片廠商可以借鑒這種模式,優(yōu)化芯片的計(jì)算單元,支持更靈活的精度配置。
據(jù)了解,摩爾線程是目前國內(nèi)唯一能支持包括FP8在內(nèi)的全精度AI訓(xùn)練的全功能GPU企業(yè)。摩爾線程全功能GPU配備了最新一代的Tensor Core,原生支持E5M2和E4M3兩種表示方式的FP8數(shù)據(jù)精度,可以為DeepSeek的模型訓(xùn)練提供國產(chǎn)算力支持。
談及DeepSeek對國產(chǎn)算力芯片的影響,呂其恒認(rèn)為,從訓(xùn)練側(cè)來看,Scaling Law規(guī)模定律仍然有效,模型迭代會(huì)加快,對于國產(chǎn)優(yōu)質(zhì)訓(xùn)練算力的需求不會(huì)降低;長期看,模型參數(shù)規(guī)模擴(kuò)大(如GPT-5)和訓(xùn)練方法革新(如MoE)仍會(huì)推動(dòng)訓(xùn)練算力需求增長。
而從推理側(cè)來看,隨著生成式AI應(yīng)用落地,落地應(yīng)用(如AIGC、智能體、垂直行業(yè)模型)將帶來海量碎片化推理需求,市場規(guī)模有可能超過訓(xùn)練。
激活“訓(xùn)推一體”,驅(qū)動(dòng)協(xié)同增長
目前,DeepSeek憑借算法優(yōu)化與混合精度訓(xùn)練技術(shù),將大模型訓(xùn)練成本顯著降低,一改往日大模型訓(xùn)練“大力出奇跡”的畫風(fēng)。DeepSeek推動(dòng)AI普惠化的同時(shí),國產(chǎn)廠商也有望借鑒DeepSeek的技術(shù)創(chuàng)新經(jīng)驗(yàn),在推理側(cè)開拓新藍(lán)海。
以摩爾線程為代表,作為一家專注于全功能GPU設(shè)計(jì)的企業(yè),其正積極探索與DeepSeek相結(jié)合的AI應(yīng)用與產(chǎn)品。
一方面,摩爾線程的全功能GPU已成功適配DeepSeek-V3和DeepSeek-R1原生671B模型,進(jìn)一步驗(yàn)證了摩爾線程在軟硬件協(xié)同優(yōu)化方面的深厚技術(shù)積累;另一方面,基于全功能GPU,摩爾線程與合作伙伴聯(lián)合打造的多款智算一體機(jī)已完成與DeepSeek等主流大模型的深度適配。
例如,摩爾線程與雪浪云聯(lián)合打造的“軟硬件緊耦合”大模型訓(xùn)推一體機(jī)——雪浪MindCenter X100,憑借其卓越的性能和靈活的架構(gòu),已成功部署DeepSeek-R1-Distill-Qwen推理服務(wù),并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能。
“對于摩爾線程來說,DeepSeek的V3和R1進(jìn)一步驗(yàn)證了我們GPU產(chǎn)品在功能上的前瞻性,特別是對FP8精度的支持和不犧牲算力的異步通信能力?!眳纹浜阒v道。
隨著DeepSeek模型在多個(gè)智算中心快速部署,推理算力需求激增,面向推理側(cè)和訓(xùn)練側(cè)的部署調(diào)整,呂其恒認(rèn)為,短期內(nèi),國產(chǎn)GPU廠商應(yīng)保持訓(xùn)練芯片的持續(xù)迭代,比如最好支持FP8,確保技術(shù)不脫節(jié)),同時(shí)通過推理芯片快速切入商業(yè)化場景。從長期上,應(yīng)瞄準(zhǔn)“訓(xùn)推一體”架構(gòu)(如摩爾線程MUSA),通過統(tǒng)一計(jì)算平臺(tái)降低客戶切換成本,最終在自主生態(tài)中實(shí)現(xiàn)訓(xùn)練與推理的協(xié)同增長。
技術(shù)門檻遷移,迎接“多元共存”
在AI芯片行業(yè),“生態(tài)兼容性”始終是國產(chǎn)廠商難以跨越的隱形門檻。英偉達(dá)憑借CUDA生態(tài)構(gòu)筑的技術(shù)護(hù)城河,曾讓國產(chǎn)GPU在訓(xùn)練場景中舉步維艱。然而,DeepSeek開源模型的推出,配合國產(chǎn)芯片廠商的戰(zhàn)略協(xié)作,正在重塑這一游戲規(guī)則。
“長期來看,隨著國產(chǎn)替代的推進(jìn)、算法優(yōu)化能力的提升,以及行業(yè)對供應(yīng)鏈安全的重視,將逐步降低單一依賴風(fēng)險(xiǎn)。”呂其恒指出,這一過程需要時(shí)間和技術(shù)積累,但已是不可逆的趨勢,未來的算力底座更可能呈現(xiàn)“多元共存”的形態(tài)。
盡管當(dāng)前國產(chǎn)AI生態(tài)仍面臨不同廠商技術(shù)框架兼容性不足、技術(shù)標(biāo)準(zhǔn)碎片化,垂直領(lǐng)域付費(fèi)模式不甚清晰、商業(yè)閉環(huán)尚未成熟,行業(yè)巨頭生態(tài)綁定式制約、全球化競爭壓力等多重挑戰(zhàn)。
在技術(shù)與產(chǎn)業(yè)的雙重考量下,我們可以看到,摩爾線程攜手行業(yè)伙伴探索構(gòu)建全國產(chǎn)“算法-芯片-場景”的生態(tài),驗(yàn)證了AI國產(chǎn)自主發(fā)展創(chuàng)新的道路是完全可行的。
在技術(shù)驗(yàn)證與突破上,摩爾線程接入DeepSeek,驗(yàn)證了其自研全功能GPU的通用性與CUDA兼容性,這表明國產(chǎn)GPU在復(fù)雜AI任務(wù)中具備強(qiáng)大的支持能力,為國產(chǎn)AI技術(shù)的自主可控發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。
在生態(tài)協(xié)同上,DeepSeek的開源模型與摩爾線程的硬件實(shí)踐形成國產(chǎn)閉環(huán),將進(jìn)一步推動(dòng)國產(chǎn)AI硬件與軟件的協(xié)同發(fā)展。這種協(xié)同不僅提升了整體性能,還為未來更多大規(guī)模模型的部署提供了技術(shù)保障,有助于構(gòu)建更加完善的國產(chǎn)AI技術(shù)生態(tài)。
在產(chǎn)業(yè)協(xié)同與集群效應(yīng)上,無論是摩爾線程的行業(yè)合作,還是其他國產(chǎn)芯片廠商的接入與適配實(shí)踐,都將吸引更多上下游企業(yè)參與到國產(chǎn)AI生態(tài)建設(shè)中,形成產(chǎn)業(yè)集群效應(yīng),推動(dòng)整個(gè)國產(chǎn)AI產(chǎn)業(yè)的發(fā)展。
在開源與普惠化上,DeepSeek的開源模式降低了AI技術(shù)的使用門檻,摩爾線程的高效部署使得更多開發(fā)者能夠基于國產(chǎn)GPU進(jìn)行AI應(yīng)用創(chuàng)新。這種開源與普惠化的結(jié)合,也將推動(dòng)AI技術(shù)的廣泛傳播和應(yīng)用,促進(jìn)國產(chǎn)AI生態(tài)的繁榮。
目前,摩爾線程已經(jīng)在制造業(yè)、工程機(jī)械、新能源、教育、金融等多個(gè)行業(yè)中落地應(yīng)用,展示了國產(chǎn)GPU在復(fù)雜AI任務(wù)中的強(qiáng)大支持能力。
呂其恒介紹,未來,摩爾線程將持續(xù)深化與開源社區(qū)合作,通過技術(shù)開放與生態(tài)共建,推動(dòng)國產(chǎn)全功能GPU在AI計(jì)算領(lǐng)域的規(guī)模化應(yīng)用,并協(xié)同多家生態(tài)伙伴形成的強(qiáng)大的生態(tài)網(wǎng)絡(luò)。
結(jié)語
DeepSeek的橫空出世絕非偶然,產(chǎn)業(yè)協(xié)同創(chuàng)新更是發(fā)展必然。從產(chǎn)業(yè)鏈上游的算力基礎(chǔ),到中游的模型研發(fā)和數(shù)據(jù)訓(xùn)練,再到下游的垂直應(yīng)用與合作,折射出了中國AI產(chǎn)業(yè)從“追趕者”向“定義者”轉(zhuǎn)型的集體野心。摩爾線程的實(shí)踐證明,當(dāng)算法創(chuàng)新、硬件突破與生態(tài)協(xié)作形成合力時(shí),國產(chǎn)算力有能力在市場占據(jù)一席之地。深耕技術(shù)自主、生態(tài)開放以及場景縱深的破局之路,2025年,國產(chǎn)算力芯片大有可為。
- QQ:61149512