低精度計算能否實現(xiàn)智算中心“輕裝上陣”?
低精度計算應(yīng)用于智算中心說到底還是為了突破算力瓶頸,解決算力應(yīng)用難題,其雖然并非最優(yōu)解,但已經(jīng)成為一塊“關(guān)鍵拼圖”。
7小時前
來源:通信世界網(wǎng) 包建羽??

通信世界網(wǎng)消息(CWW)今年初,低成本、高性能的DeepSeek掀起了大模型狂潮,其在預(yù)訓(xùn)練中采用FP8(8位浮點數(shù))與FP32(32位浮點數(shù))混合精度技術(shù)也成為一項重大技術(shù)創(chuàng)新,前者可以大幅減少算力消耗,提高計算速度;后者則針對數(shù)據(jù)精度關(guān)鍵環(huán)節(jié)保證了模型的準確性。兩者相結(jié)合,在不影響模型性能的前提下,實現(xiàn)了算力資源的高效利用。

類似的思路也被用于智算中心建設(shè),不再像去年卷“萬卡集群”那樣,智算中心從建到用更為注重性價比,低精度計算應(yīng)勢而起,正推動智算中心從“大力出奇跡”轉(zhuǎn)向“四兩撥千斤”的進化路徑。

所謂低精度計算是指采用FP8、FP6(6位浮點數(shù))甚至FP4(4位浮點數(shù))等低比特數(shù)值格式進行運算的技術(shù)體系。相較于傳統(tǒng)FP32計算,其數(shù)據(jù)存儲空間更小、計算能耗更低,不僅能夠破解大模型訓(xùn)練和推理的算力難題,也有助于化解智算中心的能效比困境。

就行業(yè)發(fā)展來看,智算需求的爆發(fā)直接促使低精度計算的崛起。近年來,大模型和生成式人工智能推高算力需求,全球智能算力需求呈指數(shù)級增長。《2025年中國人工智能計算力發(fā)展評估報告》指出,未來兩年,中國智能算力規(guī)模將保持高速增長。2023年至2028年期間,中國智能算力規(guī)模的五年年復(fù)合增長率預(yù)計達46.2%。然而,傳統(tǒng)通用算力中心難以滿足AI模型訓(xùn)練的高密度、低時延需求,智算中心作為專用基礎(chǔ)設(shè)施的重要性得以凸顯。

在低精度計算的作用下,智算中心架構(gòu)層的芯片技術(shù)變革最為明顯。在GTC 2025年大會上,英偉達發(fā)布的Blackwell Ultra/Rubin系列芯片展現(xiàn)了算力精度下移的趨勢。例如Blackwell Ultra在FP4精度下的算力達到15PetaFlops,在特定推理場景中效率提升40倍。作為同類競品的AMD MI350X芯片則創(chuàng)新性引入動態(tài)精度切換技術(shù)。通過支持FP4和FP6,推理性能較前代提升35倍,F(xiàn)P8算力突破4.6 PetaFlops。不僅如此,當前Meta、微軟、AWS等巨頭早已將低精度GPU列為采購核心指標。

低精度計算應(yīng)用于智算中心說到底還是為了突破算力瓶頸,解決算力應(yīng)用難題,其雖然并非最優(yōu)解,但已經(jīng)成為一塊“關(guān)鍵拼圖”。面向智算中心的未來發(fā)展,業(yè)界探索出了兩條關(guān)鍵路徑。

一是異構(gòu)計算架構(gòu),不同于傳統(tǒng)方案強調(diào)雙精度浮動運算性能的超級計算,異構(gòu)智算更多使用半精度浮動運算、整數(shù)運算,甚至更低精度的浮點運算,動態(tài)適配不同精度需求。在傳統(tǒng)算力的局限與旺盛的市場需求共同作用下,通用算力、智算算力、超算算力、邊緣算力等不同類型算力中心的融合發(fā)展將成為大勢所趨。

二是“超智融合”,作為異構(gòu)智算的一種表現(xiàn)形式,“超智融合”即整合超算的高性能并行計算能力與智算的低功耗優(yōu)化優(yōu)勢,通過軟硬件協(xié)同提升算力效率。業(yè)內(nèi)專家認為,隨著AI應(yīng)用場景越來越復(fù)雜,通過單一芯片平臺提供全精度和混合精度計算,已成為“超智融合”背景下的算力基礎(chǔ)設(shè)施發(fā)展趨勢。

技術(shù)路徑找準之余,要想讓智算中心“輕裝上陣”,生態(tài)建設(shè)又是另一核心命題。與低精度計算相適配,國內(nèi)仍需構(gòu)建自主可控的開源框架,解決編程接口不統(tǒng)一、算子庫適配難等問題。因此,智算中心的未來不是一道高精度或低精度的選擇題,而是一道如何“恰到好處”協(xié)調(diào)適配各個環(huán)節(jié)的思考題。

可以預(yù)見,智算中心走向應(yīng)用的“下半場”,一定不再是 單純追求數(shù)值的堆砌,而是如何在有限資源里找到最優(yōu)解。 面向未來,筆者認為智算中心有三大趨勢值得關(guān)注。一是全精度覆蓋,兼顧低精度推理與高精度訓(xùn)練,滿足差異化需求;二是超智算一體化,通過全國一體化算力網(wǎng)實現(xiàn)跨區(qū)域資源共享;三是AI原生設(shè)計,將AI技術(shù)深度融入基礎(chǔ)設(shè)施建設(shè)與管理,實現(xiàn)自動化運維與動態(tài)優(yōu)化。

最新文章
1
海信重磅發(fā)布“云信·通途交通大模型”: 以AI之力,解鎖智能交通無限可能
2
2025Q1智能門鎖:高增長背后的四大核心驅(qū)動力
3
董明珠連任格力電器董事長,先向空調(diào)低價內(nèi)卷競爭“開炮”
4
低精度計算能否實現(xiàn)智算中心“輕裝上陣”?
5
一季度Mini LED電視同比增幅高達520.4%,預(yù)計全年將達900萬臺
6
家電以舊換新交出亮眼成績單,清潔電器增長勢頭強勁
7
外賣領(lǐng)域重演電商舊戲,“內(nèi)卷式”競爭何時休?
8
滿級配置!REDMI Turbo 4 Pro支持IP69防水大滿貫、公里級無網(wǎng)通信
9
跟Intel拼了!臺積電公布全新1.4nm:性能+15%、功耗-30%
10
海信棉花糖Ultra,小天鵝迷你小烏梅,模塊化洗衣機哪家強?
11
拒絕價格戰(zhàn),海信用“健康節(jié)能”重構(gòu)空調(diào)價值坐標系
12
BOE(京東方)發(fā)布行業(yè)首個可持續(xù)發(fā)展品牌“ONE”:以開放創(chuàng)新科技之力守護人類未來
13
為什么GPMI應(yīng)該成為電視的標準配置?
14
謝廣坤、趙四上演“龍虎對決”,快手發(fā)起春耕大舞臺共慶農(nóng)忙盛況
15
甜蜜值超標預(yù)警!快手星芒短劇《暗戀藏不住》見證雙向心動
16
年輕選手過半,快手廣場舞大賽舞出民族風(fēng)與多巴胺
17
快手“非遺傳習(xí)學(xué)堂”第二期能力提升培訓(xùn)啟動,助力困境非遺傳承人持續(xù)發(fā)展
18
讓2200萬用戶的創(chuàng)意被全世界看見!可靈AI發(fā)起全球首支用戶共創(chuàng)AI短片征集
19
快手本地生活用戶洞察報告:大力提振消費背景下,本地生活服務(wù)成消費復(fù)蘇“毛細血管”
20
長虹空調(diào)硬核飛升,濰坊風(fēng)箏節(jié)大出風(fēng)頭
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512