新興技術(shù)越蓬勃,RISC-V就越繁榮。憑借開放、可定制、可擴(kuò)展、簡潔高效等優(yōu)勢,RISC-V在生成式AI、汽車電子、智能終端等領(lǐng)域加速滲透,以新的邏輯和思路煥新計算產(chǎn)業(yè)。同時,隨著RVA23的發(fā)布,RISC-V的軟件生態(tài)和跨平臺能力持續(xù)提升,全產(chǎn)業(yè)鏈加速適配。在7月17日舉辦的第五屆RISC-V中國峰會(以下簡稱“峰會”)上,記者看到了一系列“芯”趨勢。
RVA23照進(jìn)現(xiàn)實 硬件實現(xiàn)與工具鏈適配提速
長期以來,跨平臺兼容性和軟件可移植性,是制約RISC-V生態(tài)擴(kuò)張的瓶頸。去年10月,RISC-V國際基金會宣布RVA23配置文件正式獲批。該配置文件規(guī)范了64位應(yīng)用處理器的實現(xiàn)標(biāo)準(zhǔn),使其能夠運行來自標(biāo)準(zhǔn)二進(jìn)制操作系統(tǒng)發(fā)行版的操作系統(tǒng)堆棧,這對實現(xiàn)跨硬件平臺的軟件可移植性至關(guān)重要,并有效規(guī)避供應(yīng)商鎖定風(fēng)險。
本屆RISC-V峰會,與會嘉賓介紹了一系列圍繞RVA23的適配進(jìn)展。
在配置文件規(guī)范的基礎(chǔ)上,廣大開發(fā)者還需要RVA23的硬件方案,以獲取開發(fā)板等硬件支持。RISC-V國際基金會首席架構(gòu)師Krste Asanovic表示,RVA23硬件已經(jīng)在路上?!昂芏嚅_發(fā)人員會問RVA23的硬件在哪里,請大家耐心等待,不久之后就會有RVA23的硬件解決方案,這是RISC-V萬里長征的第一步。我們會有硬件和軟件生態(tài)系統(tǒng)的路線圖,讓大家清楚獲知RISC-V將何去何從。”
同時,RISC-V國際基金會將聚焦大于32位的長指令,為RISC-V的性能提升預(yù)留更多空間。“固定的32位指令格式將成為RISC-V長期演化的障礙,其他固定32位的ISA在編碼空間上已經(jīng)捉襟見肘。”Krste Asanovic說,“RISC-V從一開始就包含了可變長度的指令,更長的指令有助于縮減代碼規(guī)模、提升性能,并支持日益增多的數(shù)據(jù)類型。”
RVA23也給RISC-V處理器的協(xié)同仿真驗證帶來更多挑戰(zhàn)。中國科學(xué)院計算技術(shù)研究所特別研究助理徐易難表示,一方面,RISC-V指令集的復(fù)雜度迅速膨脹,比如RVA23有33個必選擴(kuò)展、830頁指令集手冊,相比2019年已經(jīng)翻倍,且不同的RISC-V擴(kuò)展有不同的驗證需求,導(dǎo)致驗證難度提升。另一方面,處理器的電路仿真速度——尤其是基于軟件的仿真速度隨著處理器規(guī)模擴(kuò)大而大幅下降。
為了改善芯片驗證質(zhì)量與效率,產(chǎn)業(yè)界轉(zhuǎn)向基于Emulator、FPGA的硬件仿真平臺,其特點在于將REF(參考模型)部署在Host環(huán)境,以軟硬件(RTL-Host)通信為核心,利用PCIE、以太網(wǎng)、InfiniBand等連接手段在軟件(Host側(cè))和硬件(RTL側(cè))之間傳遞信息,實現(xiàn)了對電路仿真的數(shù)量級加速,比如香山處理器團(tuán)隊長期維護(hù)的DiffTest框架,已經(jīng)支持硬件仿真加速。
但香山團(tuán)隊發(fā)現(xiàn),RTL-Host架構(gòu)帶來的通信開銷,限制了DiffTest對香山等復(fù)雜處理器的驗證加速效果。面對這一瓶頸,香山團(tuán)隊提出了SVM(可綜合驗證方法),把整個REF映射到FPGA或Emulator上,使REF與DUT(待測設(shè)計)的通信都在片上完成,從而避免通信開銷。
隨著香山處理器迭代到第三代架構(gòu)“昆明湖”,核心數(shù)量增加至16核,系統(tǒng)復(fù)雜性進(jìn)一步提升。圍繞香山昆明湖16核CPU的大級聯(lián)FPGA系統(tǒng)驗證,香山團(tuán)隊與EDA企業(yè)合見工軟提出了一套系統(tǒng)化的多核處理器FPGA驗證方法論,包括設(shè)計移植與適配、編譯迭代效率與資源優(yōu)化使用的最大化平衡、漸進(jìn)式啟動策略與軟硬協(xié)同調(diào)試技術(shù)?;谶@套方法論,昆明湖16核版本的整體驗證效率提升約40%,大幅縮短產(chǎn)品上市時間,且時鐘轉(zhuǎn)換、自動分割、TDM IP綁定等關(guān)鍵工作都可以交給EDA工具,讓用戶將寶貴的時間留給項目本身。
對于RVA的演進(jìn)路線,Krste Asanovic透露,RVA下一個版本名稱暫定為RVA30,預(yù)計2030年左右推出。RISC-V社區(qū)會先推動RVA23落地,再逐步過渡到RVA30。在這一過程中,會推出RVA23.1、RVA23.2等小版本更新,增加一些小的選項,以加持未來RVA30的功能升級。
朋友圈再擴(kuò)大 CUDA將適配RISC-V
2024年,全球基于RISC-V指令集的芯片出貨量達(dá)到數(shù)百億顆,但相當(dāng)一部分集成在嵌入式系統(tǒng)中。如今,RISC-V的朋友圈正在擴(kuò)大,有望在更高性能的計算架構(gòu)中發(fā)揮更加顯性的作用。
英偉達(dá)每年出貨的芯片中,有十億顆以上集成了RISC-V微控制器。如今,英偉達(dá)正在與RISC-V進(jìn)行更深層次的融合。
“CUDA已經(jīng)部署在x86和Arm指令集上,還沒有在RISC-V部署。但是我們正在向外界傳達(dá)一個信息——我們要將CUDA移植到RISC-V的架構(gòu)上。”英偉達(dá)副總裁Frans Sijstermans表示。
Frans Sijstermans介紹英偉達(dá)在RISC-V的進(jìn)展
在推動CUDA與RISC-V適配的過程中,F(xiàn)rans Sijstermans注意到有三個層面的工作有待加強(qiáng)。
一是技術(shù)規(guī)格上,RVA23架構(gòu)配置文件以及服務(wù)器SoC規(guī)范已經(jīng)獲批,但仍然缺乏服務(wù)器平臺規(guī)范以及性能事件監(jiān)控、內(nèi)存標(biāo)記、機(jī)密虛擬機(jī)、矩陣運算等支持。
二是軟件層面,在RISC-V國際基金會官網(wǎng)上已經(jīng)能看到75個軟件包的適配支持,但在性能優(yōu)化、生態(tài)成熟度、高層應(yīng)用棧方面還有待完善。
三是CPU方面,當(dāng)前可用開發(fā)板有限,主要基于SiFive P550處理器和平頭哥玄鐵C920處理器,尚無符合RVA23架構(gòu)標(biāo)準(zhǔn)的主機(jī)CPU,以及相應(yīng)的AIA中斷控制器、IOMMU(輸入輸出內(nèi)存管理單元)和虛擬化管理程序。
Frans Sijstermans表示,待RISC-V生態(tài)系統(tǒng)成熟后,標(biāo)準(zhǔn)CUDA版本將支持符合服務(wù)器平臺規(guī)范及Linux操作系統(tǒng)的RISC-V架構(gòu)。此外,今年5月,英偉達(dá)推出NVLink Fusion技術(shù),將英偉達(dá)的高速互連技術(shù)NVLink與第三方ASIC、CPU等異構(gòu)芯片深度融合,構(gòu)建半定制AI基礎(chǔ)設(shè)施。NVLink Fusion將為定制化RISC-V CPU提供機(jī)架級解決方案,實現(xiàn)從RISC-V CPU到完整數(shù)據(jù)中心的快速部署。
自主可控又包容 RISC-V將利好AI產(chǎn)業(yè)
“RISC-V在提升生成式AI算法的性能和效率方面,有哪些技術(shù)優(yōu)勢?”在峰會的圓桌討論環(huán)節(jié),與會嘉賓和觀眾圍繞這一問題進(jìn)行了投票。最終,“開放的架構(gòu)利于軟硬件協(xié)同設(shè)計”“模塊化、可擴(kuò)展的架構(gòu)”“指令集簡潔高效”占據(jù)前三。
中國科學(xué)院計算技術(shù)研究所副所長、中國開放指令生態(tài)(RISC-V)聯(lián)盟秘書長包云崗認(rèn)為,RISC-V能為AI帶來三點優(yōu)勢。首先,RISC-V可以與CPU實現(xiàn)更好的協(xié)同。上世紀(jì)80年代的“浮點”、90年代的多媒體指令,都融合到了CPU。AI的擴(kuò)展指令也將融合到CPU,為智能體在多個模型之間反復(fù)調(diào)用帶來優(yōu)勢。其次,RISC-V靈活可定制。當(dāng)前AI推理場景多且需求多樣,云端需要“滿血版”大模型,邊緣側(cè)需要“蒸餾版”大模型,還要根據(jù)具體需求進(jìn)行定制和微調(diào)。而RISC-V允許開發(fā)者在硬件層面進(jìn)行裁剪和定制優(yōu)化。最后,目前國內(nèi)AI芯片企業(yè)都有自己的軟件棧,呈現(xiàn)“垂直煙囪式”的發(fā)展模式。RISC-V能提供統(tǒng)一的擴(kuò)展指令集,將軟件棧和上層的編譯器、庫統(tǒng)一起來,在全球?qū)用婀步ㄜ浖鷳B(tài)。
數(shù)據(jù)顯示,2030年半導(dǎo)體市場規(guī)模將突破萬億美元,其中超過70%與AI相關(guān)。對于AI的技術(shù)架構(gòu),上海開放處理器產(chǎn)業(yè)創(chuàng)新中心理事長、中國RISC-V產(chǎn)業(yè)聯(lián)盟理事長戴偉民作了一個比喻:訓(xùn)練是樹干,端上的微調(diào)是樹枝,推理卡是“樹葉”,未來大量推理卡會用在端側(cè)。而RISC-V“自主可控又繁榮”的優(yōu)勢,將在AI時代發(fā)揮作用。
基于RISC-V,計算系統(tǒng)能夠在更加廣泛的維度、更多產(chǎn)業(yè)鏈環(huán)節(jié)實現(xiàn)開放。由全球知名芯片技術(shù)專家Jim Keller擔(dān)任CEO的AI初創(chuàng)公司Tenstorrent基于RISC-V建立了從IP、芯粒、芯片到板卡/服務(wù)器/系統(tǒng)的全棧方案。其開放式芯粒架構(gòu)(OCA)實現(xiàn)了物理層、傳輸層、協(xié)議層、系統(tǒng)層、軟件層的開源。“數(shù)據(jù)顯示,2028年60%~80%的高性能AI都會采用芯粒架構(gòu),芯粒的好處是降低研發(fā)價格、提升可用性、組合靈活及便于合作。基于OCA,企業(yè)或者研究單位可以節(jié)省研發(fā)費用,將更多資金用于核心價值力的提升?!盩enstorrent首席架構(gòu)師Wei-Han Lien表示。
目前,AI芯片有兩大主流架構(gòu):GPGPU和ASIC?;赗ISC-V,ASIC企業(yè)能夠采用更加靈活的核心配置。在加速卡中,Tenstorrent采用了被稱為“Baby RISC-V”的小型內(nèi)核來負(fù)載復(fù)雜性低但需要專精的工作。比如其Grayskull e75加速卡由96個Tensix核心組成,每個核心包含5個可編程的Baby RISC-V,其中兩個RISC-V內(nèi)核負(fù)責(zé)數(shù)據(jù)移動并管理外部存儲與本地SRAM之間的異步讀寫操作,其余三個內(nèi)核分別負(fù)責(zé)數(shù)據(jù)解包、執(zhí)行計算內(nèi)核和數(shù)據(jù)打包。
在發(fā)揮模塊化優(yōu)勢的同時,RISC-V的開放性能夠保證各類核心、架構(gòu)獲得統(tǒng)一軟件接口,以避免生態(tài)上的割裂。知合計算CEO、阿里巴巴達(dá)摩院首席科學(xué)家孟建熠表示,“Baby RISC-V”是處理AI的一條路徑,能夠大幅簡化CPU的控制通路,將有限的硅面積集中到計算單元去,讓業(yè)務(wù)與計算走得更近。但要轉(zhuǎn)化到業(yè)務(wù)上,還需要“Big RISC-V”推動。此外,計算矩陣增強(qiáng)也可以基于新的器件、新的方法融入RISC-V?;赗ISC-V的開放性,“Baby RISC-V”“Big RISC-V”或者其他物理器件能獲得統(tǒng)一的界面和軟件編程的統(tǒng)一接口,這將極大利好RISC-V的創(chuàng)新和生態(tài)繁榮。
打破生態(tài)孤島 RISC-V加速汽車產(chǎn)業(yè)協(xié)同
汽車這一新型邊緣智能終端,已經(jīng)成為計算軟硬件廠商的必爭之地。在快速演變的汽車電子電氣架構(gòu)中,RISC-V大有可為。
芯來科技創(chuàng)始人胡振波表示,傳統(tǒng)汽車是一個相對封閉的場景,老牌汽車芯片公司大多采用私有架構(gòu),導(dǎo)致汽車軟件生態(tài)割裂。RISC-V作為國際標(biāo)準(zhǔn)的指令集架構(gòu),能夠?qū)⒐聧u式的軟件開發(fā)連接起來,建立統(tǒng)一架構(gòu)。且RISC-V是公開標(biāo)準(zhǔn),不會形成單一的IP供應(yīng)商依賴,這是RISC-V在車規(guī)領(lǐng)域落地的最大的前提?!霸诖饲疤嶂?,領(lǐng)軍(汽車芯片)企業(yè)亦或是中立的第三方IP公司能夠在大生態(tài)下發(fā)展并形成合力?!焙癫ㄕf道。
記者在峰會現(xiàn)場獲悉,目前國內(nèi)外企業(yè)圍繞車規(guī)RISC-V的研發(fā)和適配工作正在緊密展開,包括感知、連接、域控等領(lǐng)域的IP、芯片、開發(fā)板,適配AUTOSAR的軟件和開發(fā)環(huán)境,以及車規(guī)RISC-V編譯器等工具。比如芯來科技率先推出了基于ISO26262 ASIL-B/D認(rèn)證的RISC-V CPU IP——NA900;東風(fēng)汽車與中國信科聯(lián)合開發(fā)了全國產(chǎn)高性能車載控制芯片DF30及其符合AUTOSAR標(biāo)準(zhǔn)的OS(操作系統(tǒng))和MCAL(微控制器抽象層),其中DF30是業(yè)界首款基于自主開源RISC-V多核架構(gòu),且功能安全等級達(dá)到ASIL-D的高端車規(guī)控制芯片;英飛凌于今年3月宣布將在未來幾年內(nèi)推出基于RISC-V的全新汽車MCU系列,該系列將成為英飛凌汽車MCU品牌AURIX的一部分。
峰會展區(qū),奕斯偉基于32位RISC-V CPU的車規(guī)MCU
要繼續(xù)推動RISC-V上車并發(fā)揮其開放、模塊化的優(yōu)勢,需要產(chǎn)業(yè)鏈增加協(xié)同。
“在IP交付層面,要通過技術(shù)賦能和生態(tài)共建,提升RISC—V車規(guī)級IP的穩(wěn)定性、可靠性和安全性,并增強(qiáng)其兼容性。在芯片設(shè)計層面,應(yīng)通過場景驅(qū)動和標(biāo)準(zhǔn)賦能,保證芯片技術(shù)與應(yīng)用的協(xié)同。對于Tier1,建議深度融入芯片的定義環(huán)節(jié)和開發(fā)環(huán)節(jié),通過快速迭代改善應(yīng)用。對于主機(jī)廠,希望優(yōu)先給國產(chǎn)RISC—V車規(guī)芯片上車機(jī)會,通過建設(shè)示范項目增強(qiáng)市場的信心和認(rèn)可度,進(jìn)一步催生產(chǎn)業(yè)繁榮?!蔽錆h二進(jìn)制半導(dǎo)體CTO陳永洲表示。
- QQ:61149512