相比手機(jī)、PC等消費(fèi)電子終端,汽車對芯片最大的差異化要求之一,就是功能安全,也就是確保芯片執(zhí)行開發(fā)者設(shè)計的功能。但是,當(dāng)前主流的功能安全實現(xiàn)方式會在不同程度上增加芯片的PPA(性能、功耗或面積)開銷。比如雙核鎖步法采用兩塊同樣的邏輯芯片執(zhí)行相同的代碼并嚴(yán)格同步,通過計算結(jié)果的比對檢測是否存在錯誤,但這種方式導(dǎo)致硅片面積增加了一倍。再比如工作負(fù)載重復(fù)法將同一項工作執(zhí)行兩次并比較結(jié)果,導(dǎo)致安全工作負(fù)載性能減半。
英國GPU IP供應(yīng)商Imagination正在嘗試用新的思路實現(xiàn)汽車芯片的功能安全。近日,Imagination推出最新汽車GPU IP DXS,基于分布式功能安全機(jī)制,利用約10%的面積代價實現(xiàn)100%的安全功能。
據(jù)Imagination車載GPU產(chǎn)品總監(jiān)章政介紹,DXS的功能安全是利用GPU的特性實現(xiàn)的。
具體來看,GPU的特點是通過大量核心同時處理多個任務(wù),實現(xiàn)多線程并行。當(dāng)一個線程無法獲取執(zhí)行任務(wù)所需的計算資源,就會自動從執(zhí)行隊列切換出去,等待計算資源到位再執(zhí)行任務(wù)。同時,為了并行執(zhí)行多線程,GPU具有許多重復(fù)單元。Imagination DXS利用以上兩個特點,在線程停工等待時,插入測試集,在另一個線程等待時,也插入測試樣例,并執(zhí)行兩個測試,通過對比執(zhí)行結(jié)果來檢測邏輯模塊以及存儲模塊的功能。此外,針對如何快速定位邏輯模塊的錯誤這一難點,DXS采用了周期性的檢查方式,通過不停發(fā)送測試向量,來保證子部件的正確性。
在性能上,DXS峰值性能較上一代汽車GPU產(chǎn)品提升50%,計算工作負(fù)載性能提升十倍。據(jù)章政介紹,計算負(fù)載的提升有一小部分來自于硬件,大約增加了50%;采用雙速率FP16,又帶來兩倍的性能提升;通過優(yōu)化計算庫,包括節(jié)省帶寬、片上內(nèi)存優(yōu)化等,再實現(xiàn)2到4倍的性能提升,在一些典型工作負(fù)載上總體能看到10倍以上的性能提升。
“我們增加了本地存儲,使大部分的計算發(fā)生在片內(nèi),減少了帶寬造成的瓶頸,增強(qiáng)了ALU(算數(shù)邏輯部件),加強(qiáng)了軟件和硬件的協(xié)同優(yōu)化。計算系統(tǒng)的性能提升是軟硬件緊密配合的工作,我們把底層軟件優(yōu)化這項相對艱難的工作留給了自己,因為底層的優(yōu)化往往牽涉到硬件架構(gòu),需要基于對GPU的理解和經(jīng)驗?!闭抡颉吨袊娮訄蟆繁硎?。
責(zé)任編輯:張心怡
- QQ:61149512