DeepSeek成國內(nèi)半導體產(chǎn)業(yè)鏈新引擎?
當前,每天都有像華為昇騰、沐曦、天數(shù)智芯、燧原科技、昆侖芯等國內(nèi)半導體廠商宣布與DeepSeek旗下不同模型展開適配工作的消息,
2025-02-21 08:22:35
來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng) 許子皓??

在人工智能領域,人們對訓練模型的固有印象就是對算力的需求極大。因此,長期以來,諸如英偉達H100 GPU等高算力芯片幾乎成為行業(yè)標配,使得國內(nèi)芯片廠商難以施展拳腳,也制約了我國人工智能的在地化發(fā)展。而DeepSeek的出現(xiàn)打破了這一困境,使尖端GPU不再是大模型訓練的唯一解法,讓越來越多的的國內(nèi)半導體廠商有機會與全球領先的AI模型適配,有望成為驅動國內(nèi)半導體全產(chǎn)業(yè)鏈發(fā)展的新引擎。

當前,每天都有像華為昇騰、沐曦、天數(shù)智芯、燧原科技、昆侖芯等國內(nèi)半導體廠商宣布與DeepSeek旗下不同模型展開適配工作的消息,據(jù)不完全統(tǒng)計,參與其中的國內(nèi)廠商已經(jīng)超過了20家。

DeepSeek提供技術驗證“實練場”

對于國內(nèi)芯片行業(yè)來說,缺乏實際應用場景和技術驗證機會是其發(fā)展過程中的一大難題。而DeepSeek為國內(nèi)芯片提供了寶貴的技術驗證場景。

據(jù)了解,DeepSeek在架構創(chuàng)新方面,采用了經(jīng)DeepSeek-V2驗證的MLA和DeepSeekMoE技術,并引入了無輔助損失負載均衡策略。這種架構優(yōu)化使得模型在訓練過程中能夠更高效地利用計算資源,減少了對特定高端芯片的依賴。同時,在訓練效率上,DeepSeek設計了專門的FP8訓練混合精度框架,以實現(xiàn)訓練效率和數(shù)值穩(wěn)定性的平衡,還開發(fā)了DualPipe算法實現(xiàn)高效的流水線并行處理,降低訓練過程中的通信開銷。

業(yè)內(nèi)專家表示,這些技術創(chuàng)新使得DeepSeek能夠適配國內(nèi)芯片架構,并且在適配過程中,國內(nèi)芯片企業(yè)可以深入了解模型對芯片性能的需求,從而針對性地進行優(yōu)化和改進。例如,通過觀察DeepSeek模型在國產(chǎn)芯片上的運行情況,芯片企業(yè)可以發(fā)現(xiàn)芯片在計算速度、能耗、穩(wěn)定性等方面存在的問題,并及時調(diào)整研發(fā)方向,改進芯片設計和制造工藝。這種實際應用中的反饋和優(yōu)化,對于國內(nèi)芯片技術的提升至關重要。

目前,華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光信息、壁仞科技、燧原科技、昆侖芯等廠商,相繼宣布適配或上架DeepSeek模型服務,讓國內(nèi)芯片能夠在實際應用中發(fā)揮作用,展示自身的性能和潛力。

例如,天數(shù)智芯和合作伙伴僅用時一天,便完成了與DeepSeek R1的適配工作,并且已正式上線多款大模型服務,包括15億、70億、140億參數(shù)的蒸餾版Qwen模型等。天數(shù)智芯表示,適配完成之后,公司將重點推動基于國內(nèi)算力資源的DeepSeek大模型應用落地:一是持續(xù)優(yōu)化軟硬件,開發(fā)高性能、高性價比的算力產(chǎn)品方案,支持合作伙伴在平臺上推出DeepSeek各大模型在線服務,廣泛提供預訓練、微調(diào)和推理服務;二是與合作伙伴開發(fā)基于DeepSeek模型的一體機、工作站,將DeepSeek模型接入到各類AI應用服務,提供更多個性化、邊側、端側的服務。當然,天數(shù)智芯始終將通用GPU創(chuàng)新突破作為首要任務,發(fā)揮自主通用芯片架構優(yōu)勢,根據(jù)DeepSeek帶動的需求變化來研發(fā)更高算效的通用GPU產(chǎn)品。

燧原科技和壁仞科技則是已完成對DeepSeek全系列模型的優(yōu)化,支持從1.5B到70B參數(shù)規(guī)模的DeepSeek R1蒸餾模型推理部署,覆蓋能源、金融等垂直場景。在這些實際應用場景中,國內(nèi)芯片的性能得到了充分驗證,也為其在更多領域的應用積累了經(jīng)驗。通過與DeepSeek的合作,國內(nèi)芯片在技術驗證和優(yōu)化方面取得了顯著進展,為其未來的發(fā)展奠定了堅實基礎。

2月2日,Gitee AI宣布上線1.5B、7B、14B、32B四個尺寸的DeepSeek R1模型,均部署在沐曦曦云GPU上。2月5日,又確認DeepSeek-V3全精度滿血版(671B)可在沐曦訓推一體GPU上成功運行,并將V3滿血版上線到平臺。沐曦通過與DeepSeek的適配,不僅驗證了自身芯片在AI推理中的性能,也讓更多AI應用開發(fā)者看到本土GPU支持大規(guī)模模型運行的潛力。

寒武紀作為國內(nèi)知名的AI芯片廠商,與南京智算中心合作,借助DeepSeek實現(xiàn)了技術與應用場景的有效對接。通過在零售業(yè)務場景中的應用,寒武紀芯片的性能得到了實際檢驗,也為其進一步優(yōu)化產(chǎn)品、拓展市場提供了寶貴經(jīng)驗。

華為昇騰、海光信息、龍芯中科等GPU/CPU廠商也在積極行動,通過參與DeepSeek模型的訓練優(yōu)化,提升產(chǎn)品在AI推理市場的競爭力。

同時,DeepSeek的開源特性也為國內(nèi)芯片的技術驗證提供了便利。眾多開發(fā)者基于DeepSeek模型進行二次開發(fā)和應用探索,使國內(nèi)芯片可以在不同的應用場景、不同的算法需求等多樣化的環(huán)境下接受檢驗,從而不斷完善自身的性能和功能。

上海天數(shù)智芯半導體股份有限公司副總裁郭為告訴《中國電子報》記者,從行業(yè)角度看,以DeepSeek為代表的自主大模型創(chuàng)新突破,有助于推動國內(nèi)算力技術的發(fā)展。國內(nèi)GPU廠商已相繼完成與DeepSeek的適配,實現(xiàn)了深度學習框架與國內(nèi)硬件的融合,以進一步發(fā)揮算力優(yōu)勢。在適配過程中,AI產(chǎn)業(yè)鏈中的芯片廠商與模型開發(fā)者之間加強合作,促進了上下游企業(yè)的協(xié)同發(fā)展,共同構建從硬件到軟件的完整生態(tài)閉環(huán),完善了庫和框架等工具,有助于構建更加完整、健康的自主AI產(chǎn)業(yè)生態(tài)。DeepSeek的開源特性可降低開發(fā)門檻,吸引更多開發(fā)者和上下游企業(yè)加入,降低了AI應用開發(fā)的門檻和成本,促進AI技術在更多行業(yè)的落地和普及。

帶動供應鏈創(chuàng)新發(fā)展

DeepSeek也助推了邊緣計算與低成本芯片的發(fā)展。它推出的小型模型,如7B參數(shù)版本,可在筆記本電腦運行,且性能接近大模型。這種“小而美”模式的興起,使得端側小模型迎來了快速發(fā)展,也帶動了低功耗、高能效芯片的市場需求。

以手機、平板電腦、藍牙耳機和智能眼鏡等智能終端設備為例,為了滿足用戶對AI語音交互、圖像識別等功能的需求,這些設備需要搭載具備一定算力的芯片。而DeepSeek的應用,使得這些設備能夠更好地運行端側小模型,實現(xiàn)更高效的AI處理。這就促使了設備制造商加大對國內(nèi)算力芯片和存儲芯片的采購,推動了國內(nèi)芯片在智能終端市場的應用。

在服務器領域,隨著企業(yè)加速開發(fā)和部署人工智能應用,如智能客服、智慧政府、數(shù)據(jù)分析等,對服務器的算力要求也越來越高。DeepSeek的出現(xiàn),讓企業(yè)能夠在國內(nèi)算力芯片的支持下,構建高效的人工智能服務平臺,有望帶動國內(nèi)算力芯片在服務器市場的發(fā)展。

半導體行業(yè)專家池憲念表示,目前引發(fā)的對國內(nèi)算力需求的增長,如同一條強有力的紐帶,將半導體產(chǎn)業(yè)鏈上的各個環(huán)節(jié)緊密聯(lián)系在一起。從芯片設計、制造到封裝測試,再到最終的應用市場,每個環(huán)節(jié)都因DeepSeek的出現(xiàn)而獲得了新的發(fā)展動力。未來,整個國內(nèi)半導體供應鏈將在DeepSeek的帶動下,形成一個良性循環(huán)。但這一趨勢也對國內(nèi)半導體廠商提出了更多挑戰(zhàn)。從技術迭代角度來看,人工智能技術發(fā)展日新月異,新的模型和算法不斷涌現(xiàn)。DeepSeek需要不斷優(yōu)化自身模型,以保持技術領先地位。國內(nèi)芯片技術也需要加速升級、及時適配,確保模型與芯片之間的協(xié)同效應。

責任編輯:許子皓

最新文章
1
續(xù)航滅霸 +倍強大 vivo Y300 Pro+正式發(fā)布
2
BOE(京東方)f-OLED柔性顯示技術策源地論壇舉辦 攜手中關村論壇共筑科技創(chuàng)新高地
3
海信視像2024年營收凈利雙增,高端穩(wěn)步增長,蟬聯(lián)世界第二
4
精裝修熱水系統(tǒng)市場外資占優(yōu),高端住宅需求點燃新增長(2025年1-2月)
5
AI家電:技術狂歡還是實用革命?
6
中國半導體并購潮起
7
小家電市場表現(xiàn)低迷,2025年小家電市場面臨嚴峻挑戰(zhàn)
8
全球首款!新型手機OLED面板問世:可發(fā)聲、會變形
9
空調(diào)等家電沖擊傳統(tǒng)廠商!持股近10年 美的徹底清倉了小米:合計套現(xiàn)20億元
10
同期唯一2K直屏超大杯!OPPO Find X8 Ultra外觀正式揭曉
11
添可做飯,追覓洗碗
12
海爾海信洗衣機聽勸玩起“滾筒分身術”,三筒分區(qū)洗哪家強?
13
催更效果拉滿!高對比度屏+萬象分區(qū),TCL T7L&Q9L系列全球首發(fā)
14
健康守護+空間革命+智慧服務,TCL冰洗創(chuàng)新“三重奏”擊中時代剛需
15
三星Galaxy S25 Edge渲染圖亮相:超薄設計+三種配色,預計4月發(fā)布!
16
谷歌宣布停止Android開源項目,但對手機廠商影響有限 通信世界網(wǎng)
17
AI家電:技術狂歡還是實用革命?
18
預計2025年全球投影機將突破2200萬臺,家用市場迎機遇
19
聯(lián)想控股2024年業(yè)績出爐:凈利潤76.8億 暴增1119%!
20
谷歌致中國合作伙伴信曝光:仍將發(fā)布完整源代碼至AOSP
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512