通信世界網(wǎng)消息(CWW)近兩年,大模型發(fā)展突飛猛進,大算力需求被充分激發(fā),數(shù)據(jù)中心正經(jīng)歷著前所未有的變革。如果說大模型發(fā)展的第一步帶火了GPU,那么放眼下一步發(fā)展,作為數(shù)據(jù)中心第三顆“主力芯片”的DPU,又將如何與時俱進,迎接大算力發(fā)展挑戰(zhàn)?
近日,業(yè)界目光再次聚焦于DPU行業(yè)最新進展,中科馭數(shù)正式發(fā)布國內(nèi)首顆量產(chǎn)全功能DPU芯片K2 Pro,無疑為國產(chǎn)DPU發(fā)展注入了一針“強心劑”。
我們知道,產(chǎn)業(yè)發(fā)展有賴于技術(shù)創(chuàng)新,但衡量創(chuàng)新突破是否合于時勢,還需要到產(chǎn)品和應用場景中去檢驗,此次中科馭數(shù)一系列發(fā)布背后,為DPU行業(yè)帶來了哪些新思考?已有創(chuàng)新實踐又能為國產(chǎn)DPU破局提供哪些借鑒?
重新定義DPU,旨在價值提升
迎接大算力挑戰(zhàn),算效亟待提升,究其根本還是芯片性能有待提升。作為當下算力基礎設施的核心創(chuàng)新之一,DPU作為數(shù)據(jù)中心第三大支柱芯片的地位也逐漸凸顯。
就其重要性來看,DPU與CPU、GPU密不可分。如果把CPU比作大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞,負責數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。
近年來,DPU的關(guān)鍵性也在行業(yè)實踐中得到驗證。放眼全球,國外芯片廠商英偉達、英特爾、AMD等都推出了相應的DPU產(chǎn)品。國內(nèi)市場除了阿里巴巴、華為與騰訊等云計算龍頭發(fā)展符合自身要求的DPU產(chǎn)品線外,其他DPU新興企業(yè)亦蓄勢待發(fā),除中科馭數(shù)外,云豹智能、云脈芯聯(lián)等也紛紛入局。
中國工程院院士、清華大學教授鄭緯民認為,DPU產(chǎn)業(yè)作為國內(nèi)外競爭的新焦點,在未來數(shù)據(jù)中心、智算中心等高帶寬、低延遲、高吞吐率產(chǎn)品都將發(fā)揮重要作用,為“東數(shù)西算”、算力網(wǎng)絡等重要新型算力基礎設施建設提供核心組件。
面對當前行業(yè)對于DPU創(chuàng)新,助力算力發(fā)展的期待,中科馭數(shù)也試圖通過技術(shù)與應用的雙重創(chuàng)新來解答DPU的發(fā)展方向。如何重新定義DPU的價值,中科馭數(shù)創(chuàng)始人、CEO鄢貴海認為,當前已經(jīng)不能僅將DPU視為單一芯片,而是結(jié)合行業(yè)需求去重新定義其價值。
具體來看,可分為三個方面,其一即架構(gòu)決勝,用最先進的芯片架構(gòu)來重新定義DPU芯片架構(gòu)。其二為軟件護城,用最高兼容性來重新定義DPU的軟件系統(tǒng)。其三則是平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務驗證。
此次,中科馭數(shù)發(fā)布的第三代DPU芯片K2-Pro即為重新定義DPU之作,專為破解大規(guī)模數(shù)據(jù)中心性能瓶頸而生的高效能數(shù)據(jù)處理芯片,采用自主研發(fā)的KPU架構(gòu),集網(wǎng)絡、存儲、安全及計算等多業(yè)務卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網(wǎng)絡帶寬,具備高度可編程性,確保了系統(tǒng)的靈活擴展性,為數(shù)據(jù)中心的業(yè)務增長和算力擴容提供堅實基礎。
目前K2-Pro已經(jīng)成功搭載在中科馭數(shù)三大產(chǎn)品系列的6款DPU卡產(chǎn)品中,精準支撐細分業(yè)務場景。鄢貴海預計,2024年K2-Pro的出貨量將累計達1萬顆。
“軟硬”合璧,3U一體值得期待
正如上文所提,重新定義GPU,其提供的思路即不能單一地強調(diào)架構(gòu),與之相對應的要有軟件與平臺支撐,從而推動DPU實踐落地。
針對DPU規(guī)模應用需要面對的集群升級遷移成本大周期長、學習門檻高,大規(guī)模使用、部署和運維難度大,安全性與高可用極具挑戰(zhàn)的難關(guān)。發(fā)布會當天,中科馭數(shù)也透露了自身的應對之策,將自研軟件開發(fā)平臺HADOS升級到3.0版本。
image.png
據(jù)了解,目前,HADOS已突破萬卡級別的落地部署,適配了8 款CPU平臺以及10大主流操作系統(tǒng),成為業(yè)內(nèi)適配最完全、最具競爭力、在國內(nèi)實際落地部署最多的DPU軟件平臺之一。
對標國外基礎開發(fā)軟件,HADOS 3.0在高性能云原生網(wǎng)絡,尤其是微服務治理、運維管控、仿真模擬、生態(tài)適配、國內(nèi)安全加解密、以及最重要的人工智能場景下,國產(chǎn)AI和GPU適配均占據(jù)了明顯的優(yōu)勢。
與此同時,承接算力時代需求,深度洞察算力技術(shù)發(fā)展趨勢,中科馭數(shù)還推出了基于DPU的馭云高性能云底座來釋放云端算力。
image.png
馭云解決方案采用“IaaS on DPU”技術(shù)路線,依托于DPU的卸載能力,將云計算體系中的基礎設施層面完全下沉,為集群提供網(wǎng)絡轉(zhuǎn)發(fā)、存儲服務、安全防護、管理調(diào)度等能力,完成了整個云計算環(huán)境的構(gòu)建與運轉(zhuǎn),將服務器側(cè)的CPU與GPU算力全部預留給業(yè)務系統(tǒng)應用,為云計算提供高性能、高吞吐、高安全的算力底座。
值得一提的是,避免對于單一芯片的過度依賴,更好地協(xié)調(diào)平衡性能,3U一體架構(gòu)也逐漸為行業(yè)認可并落地實踐。目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開放平臺,集成了超400臺高性能服務器,采用創(chuàng)新的3U一體架構(gòu),深度融合CPU、GPU與DPU技術(shù),不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強大的算力支撐,還廣泛向用戶及生態(tài)伙伴開放。
瞄準商業(yè)化未來,建強產(chǎn)業(yè)生態(tài)
就行業(yè)應用來看,目前DPU已經(jīng)可以廣泛應用于超低延遲網(wǎng)絡、云和數(shù)據(jù)中心、金融計算、大數(shù)據(jù)處理、5G邊緣計算、高性能計算等場景。
注重DPU產(chǎn)業(yè)價值發(fā)揮,中科馭數(shù)也在云計算,5G通信、證券基金、銀行等重點場景實現(xiàn)商用落地。
在云計算領(lǐng)域,中科馭數(shù)的DPU產(chǎn)品已經(jīng)在某頭部云計算廠商的云數(shù)據(jù)中心中落地。實際應用當中,基于DPU的方案可以大幅縮短裸金屬服務的交付時間,實現(xiàn)虛擬網(wǎng)絡功能的全面卸載,同時也可為存算分離相關(guān)的多種存儲技術(shù)提供統(tǒng)一的接口。
在5G通信領(lǐng)域,中科馭數(shù)是國內(nèi)三大運營商的硬件合作伙伴,共同探索DPU在5G通信和云計算領(lǐng)域的技術(shù)解決方案。在5G通信網(wǎng)絡快速發(fā)展的過程中,算力和網(wǎng)絡融合發(fā)展需要更加綠色高效的數(shù)據(jù)處理硬件加速技術(shù),亟待借助DPU提升系統(tǒng)性能。由此可以預見,DPU將在高性能數(shù)據(jù)處理、低延遲數(shù)據(jù)傳輸、網(wǎng)絡管理、存儲以及安全等基礎設施底層建設發(fā)揮關(guān)鍵作用。
在證券基金領(lǐng)域,目前,中科馭數(shù)的DPU系列產(chǎn)品已經(jīng)在金融證券領(lǐng)域?qū)崿F(xiàn)規(guī)模化落地,同時也是上交所天相實驗室,以及申萬宏源、東證期貨等低時延實驗室參與方,助力超過30家金融機構(gòu)完成核心超低時延系統(tǒng)替換,有力保障金融系統(tǒng)的平穩(wěn)運行。
本著生產(chǎn)一代,預研一代的前瞻性布局,據(jù)介紹,2025年中科馭數(shù)將完成K3芯片的發(fā)布,采用最新KPU架構(gòu)以及KISA 2.0指令集,集成RISC-V輕量級控制核,處理帶寬將是K2-Pro的四倍,達到800G,延遲低于1微秒,功耗比K2-Pro下降40%。
正所謂獨行快,眾行遠,中科馭數(shù)在增強自身作戰(zhàn)能力的同時,也在積極做大“朋友圈”。在軟件方面,中科馭數(shù)將逐步向各大開源社區(qū)開源HADOS教育版,同時推出企業(yè)版HADOS-4.0。
在云平臺方面,中科馭數(shù)也將進一步擴容——馭云,推出馭云2.0,將DPU的規(guī)?;渴?、運維、調(diào)優(yōu)可視化、一體化。
從架構(gòu)、到軟件,再到云平臺,構(gòu)成了中科馭數(shù)在算力基礎設施領(lǐng)域的“芯云計劃”,也展示了其重新定義DPU后的發(fā)展方向。
迎接算力之挑戰(zhàn),亦借算力之東風,期待DPU在其新發(fā)展內(nèi)涵下,為算力乃至新質(zhì)生產(chǎn)力發(fā)展帶來更多驚喜。
- QQ:61149512