短短幾個(gè)月,ChatGPT的橫空出世點(diǎn)燃了眾人對(duì)科技的熱情,賦予千行百業(yè)更多遐想空間。
ChatGPT帶來的風(fēng)也刮到了汽車圈,不少類ChatGPT產(chǎn)品均傳出在不久之后“上車”的消息。2月14日,集度汽車宣布旗下產(chǎn)品將融合百度文心一言的全面能力,支持汽車機(jī)器人實(shí)現(xiàn)自然交流的再進(jìn)階;2月17日,毫末智行也宣布將其自動(dòng)駕駛認(rèn)知大模型正式升級(jí)為DriveGPT,計(jì)劃于2023年4月第八屆HAOMO AI DAY上公布進(jìn)展。
ChatGPT的走俏讓智能網(wǎng)聯(lián)汽車駛向新風(fēng)口。在類ChatGPT等人工智能產(chǎn)品的加持下,智能網(wǎng)聯(lián)汽車有望在車載語音交互和自動(dòng)駕駛領(lǐng)域?qū)崿F(xiàn)“再進(jìn)化”。
企業(yè)競(jìng)逐,ChatGPT吹響“上車”號(hào)角
當(dāng)前,不少企業(yè)對(duì)ChatGPT摩拳擦掌,計(jì)劃面向汽車場(chǎng)景推出類ChatGPT產(chǎn)品,吹響ChatGPT“上車”號(hào)角。
集度汽車機(jī)器人
在2月14日舉行的集度“ROBOVERSE三里屯體驗(yàn)中心啟動(dòng)會(huì)上,集度CEO夏一平宣布,集度汽車機(jī)器人將融合百度研發(fā)的“文心一言”的全面能力,支持汽車機(jī)器人實(shí)現(xiàn)自然交流的再進(jìn)階。
眾多關(guān)注人車互動(dòng)的車企也在“擁抱”ChatGPT及相關(guān)產(chǎn)品。自2月17日起,長(zhǎng)城、吉利、紅旗、零跑、東風(fēng)日產(chǎn)啟辰、嵐圖、愛馳等多家汽車品牌紛紛官宣接入“文心一言”。造車新勢(shì)力小米汽車則在2月9日舉辦的投資日上談到了ChatGPT。小米汽車表示,ChatGPT基于AI大模型、千億級(jí)參數(shù)量、數(shù)據(jù)量、還有人工標(biāo)注支撐,目前小米的汽車業(yè)務(wù)有很多AI大模型落地的場(chǎng)景。
作為一種更自然的語言處理工具,ChatGPT能夠通過學(xué)習(xí)并理解人類的語言來與人對(duì)話。在智能汽車場(chǎng)景下,這樣的應(yīng)用也可以改變?nèi)伺c汽車的交互方式,使人與車輛進(jìn)行更深層次、更高效的語音交互,為用戶提供更好的駕駛體驗(yàn)。在夏一平看來,語音交互是車內(nèi)最高效的交互方式,任何交互都沒有語音來得直接。
記者在2月20日探訪集度ROBOVERSE三里屯體驗(yàn)中心時(shí)了解到,當(dāng)前車內(nèi)的語音交互更多是指令和機(jī)械命令。文心一言“上車”后,集度的車機(jī)系統(tǒng)能和人進(jìn)行更直接的交流,將更符合人類的思考習(xí)慣,接近人與人之間的交流?;蛟S在未來的汽車上,類ChatGPT產(chǎn)品能通過講笑話給疲勞的駕駛員提神。
黃河科技學(xué)院客座教授張翔同樣認(rèn)為,ChatGPT在以語音交互為代表的車載信息娛樂系統(tǒng)具備很大潛力?,F(xiàn)在很多車企的語音交互產(chǎn)品只能識(shí)別比較簡(jiǎn)單的指令,ChatGPT“上車”后能夠進(jìn)行更復(fù)雜的語音識(shí)別。
從更廣義的生成模型來看,類ChatGPT產(chǎn)品的“上車”也能賦予自動(dòng)駕駛更多想象空間。中國(guó)科學(xué)院院士、清華大學(xué)教授歐陽明高在2月17日舉行的中國(guó)電動(dòng)汽車百人會(huì)專家交流會(huì)上說:“ChatGPT的火熱將會(huì)對(duì)今年的自動(dòng)駕駛行業(yè)產(chǎn)生深遠(yuǎn)影響,解放很多測(cè)算門檻,加速這一賽道的全面提速?!?/p>
據(jù)悉,毫末智行推出的“人駕自監(jiān)督認(rèn)知大模型”就借鑒了ChatGPT的實(shí)現(xiàn)思路,采用RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),通過引入真實(shí)人駕接管數(shù)據(jù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。
“ChatGPT是基于自然語言處理的預(yù)訓(xùn)練大模型,所處理的主要是文本語料,基于文本序列來預(yù)測(cè)文本序列。而毫末智行的DriveGPT是一個(gè)基于大規(guī)模參數(shù)、大規(guī)模數(shù)據(jù)的自動(dòng)駕駛認(rèn)知大模型,主要用途是不斷學(xué)習(xí)人駕策略,當(dāng)前主要通過云端測(cè)評(píng)方式來提高車端算法效果?!焙聊┲切袛?shù)據(jù)智能科學(xué)家賀翔對(duì)《中國(guó)電子報(bào)》記者表示,基于大規(guī)模量產(chǎn)輔助駕駛系統(tǒng),可以從不同道路環(huán)境和不同交通流密度等場(chǎng)景中,積累大量更具多樣性的數(shù)據(jù)。
AI大模型是數(shù)據(jù)推衍和底層邏輯背后推手
在數(shù)據(jù)推衍和底層邏輯方面,ChatGPT和智能汽車身后都有一個(gè)共同推手—AI大模型。正如夏一平所言:“真正到ChatGPT時(shí)代,依賴的可能不是車,而是背后模型的能力有多強(qiáng)?!?/p>
在大模型技術(shù)超強(qiáng)的學(xué)習(xí)能力支撐下,類ChatGPT產(chǎn)品上車,重點(diǎn)是聚焦車載語音交互這一垂直場(chǎng)景,再進(jìn)行技術(shù)應(yīng)用。思必馳在車載語音交互領(lǐng)域深耕多年,目前在智能汽車領(lǐng)域的客戶已涵蓋上汽、北汽、理想、哪吒、博泰等國(guó)內(nèi)頭部主機(jī)廠及Tier1 廠商。
思必馳智能車聯(lián)網(wǎng)方案
“大模型技術(shù)通過強(qiáng)化上下文理解能力、思維鏈推理,以及增強(qiáng)指令學(xué)習(xí)來實(shí)現(xiàn)持續(xù)學(xué)習(xí)。”思必馳汽車事業(yè)部產(chǎn)品總監(jiān)葛付江對(duì)《中國(guó)電子報(bào)》記者表示,除了完成“導(dǎo)航去公司”這類固定指令的任務(wù)型對(duì)話,在進(jìn)行日常知識(shí)交流和閑聊對(duì)話時(shí),車與人的交流方式也會(huì)更高效、更直接,且具備高靈活度。
以ChatGPT為代表的大模型應(yīng)用將人類整合、利用海量數(shù)據(jù)的能力又送上了一個(gè)臺(tái)階,這一基礎(chǔ)能力對(duì)自動(dòng)駕駛同樣至關(guān)重要。
在賀翔看來,自動(dòng)駕駛的真正實(shí)現(xiàn),離不開基于數(shù)據(jù)驅(qū)動(dòng)的AI技術(shù)方式。具體到當(dāng)前,就是以Transformer為代表的大模型所驅(qū)動(dòng)的感知、認(rèn)知算法不斷進(jìn)化,使得智能駕駛技術(shù)從低階、限定場(chǎng)景的輔助駕駛,邁向高階全場(chǎng)景的輔助駕駛,再升級(jí)為全場(chǎng)景完全自動(dòng)駕駛。
隨著車端設(shè)備算力的提升,以及數(shù)據(jù)越來越豐富,經(jīng)過訓(xùn)練后的AI大模型將具備更強(qiáng)的自動(dòng)駕駛能力。
“當(dāng)前AI大模型正在廣泛應(yīng)用在自動(dòng)駕駛領(lǐng)域?!辟R翔告訴記者,基于視覺自監(jiān)督大模型,數(shù)據(jù)處理可以實(shí)現(xiàn)對(duì)多模態(tài)感知數(shù)據(jù)的大規(guī)模自動(dòng)標(biāo)注;基于3D重建大模型,可以實(shí)現(xiàn)數(shù)據(jù)生成,并通過仿真模擬極端場(chǎng)景來提升感知效果;在感知端,基于多模態(tài)互監(jiān)督大模型,可以完成一般障礙物以及通用障礙物的識(shí)別,更好地提升感知能力;基于動(dòng)態(tài)環(huán)境大模型,可以更精準(zhǔn)預(yù)測(cè)道路拓?fù)潢P(guān)系,幫助車輛更穩(wěn)定、合理地規(guī)劃行駛路線。
毫末智行宣布推出DriveGPT
賀翔以毫末智行“人駕自監(jiān)督認(rèn)知大模型”DriveGPT為例對(duì)記者表示,該大模型在認(rèn)知端引入了數(shù)千萬公里的真實(shí)駕駛行為數(shù)據(jù)做預(yù)訓(xùn)練,使駕駛策略更加擬人化。同時(shí)還引入了司機(jī)接管數(shù)據(jù)來不斷修正駕駛策略,提升駕駛水平。
“漣漪效應(yīng)”促進(jìn)迭代,商業(yè)化路徑仍在探索
以智能汽車為代表,一些社會(huì)剛需或具備大量活躍用戶的應(yīng)用,可以結(jié)合用戶交互體驗(yàn)數(shù)據(jù),反饋給模型后進(jìn)一步提升模型的能力,在數(shù)據(jù)和模型之間形成正向反饋循環(huán)的“漣漪效應(yīng)”,使迭代更新后的模型越來越強(qiáng)。
“ChatGPT的初步突破帶來的當(dāng)前影響和未來想象空間是巨大的?!笨拼笥嶏w研究院執(zhí)行院長(zhǎng)劉聰對(duì)記者表示,在技術(shù)演化的基礎(chǔ)上,以自然語言處理為代表的人工智能算法有可能重構(gòu)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫(yī)療業(yè)、汽車業(yè)、金融業(yè)、消費(fèi)業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級(jí),最終帶來對(duì)應(yīng)商業(yè)模式的變革。
目前來看,類ChatGPT產(chǎn)品在汽車領(lǐng)域的商業(yè)化路徑還處于探索初期。以車載語音交互為例,應(yīng)用ChatGPT的費(fèi)用高昂,至少包括訓(xùn)練費(fèi)用、對(duì)話使用費(fèi)、硬件軟件費(fèi)用等。成本也因此成為類ChatGPT產(chǎn)品在車載語音交互領(lǐng)域大規(guī)模商用的阻礙之一。
“成本確實(shí)會(huì)成為技術(shù)商業(yè)化落地的影響因素。”葛付江對(duì)記者表示,ChatGPT的研究需要巨額的資金投入和人才儲(chǔ)備,包括超算平臺(tái)、算法、數(shù)據(jù)等各核心力量支撐。目前來看,頭部平臺(tái)公司具備這方面優(yōu)勢(shì)??萍计髽I(yè)可以更多地從場(chǎng)景融合入手,開發(fā)應(yīng)用級(jí)產(chǎn)品,尋求創(chuàng)新機(jī)會(huì)。
思必馳天琴車載語音助手核心能力
在車載語音交互領(lǐng)域,類ChatGPT產(chǎn)品如何在車內(nèi)有限空間里發(fā)揮最大效用?葛付江認(rèn)為,從商業(yè)化場(chǎng)景看,目前ChatGPT更適合用在基于一定背景知識(shí)的創(chuàng)作型產(chǎn)業(yè),以及“剛需”AIGC的場(chǎng)景和SOP(標(biāo)準(zhǔn)作業(yè)程序)行業(yè)。這一方面對(duì)算力優(yōu)化、云和端智能融合技術(shù)等方面提出挑戰(zhàn),另一方面也會(huì)推動(dòng)相關(guān)技術(shù)向安全、對(duì)人有幫助的智能方向發(fā)展。
總體而言,ChatGPT“上車”后,車載語音交互的發(fā)展形勢(shì)仍不明朗。但可預(yù)見的是,在車載場(chǎng)景下,語音交互的形式將更加流暢,內(nèi)容將更有價(jià)值。
“相關(guān)技術(shù)會(huì)向統(tǒng)一多模態(tài)交互發(fā)展,強(qiáng)化語音、文本、圖像等深度融合的多模態(tài)交互技術(shù),形成‘汽車大腦’,以應(yīng)對(duì)車內(nèi)、公共空間等復(fù)雜場(chǎng)景的交互需求。”葛付江說。
賀翔在談及大模型在自動(dòng)駕駛行業(yè)的落地時(shí)表示,大模型具有參數(shù)規(guī)模大、數(shù)據(jù)訓(xùn)練規(guī)模大,對(duì)算力要求大、成本高的特點(diǎn),本身很難在終端設(shè)備上落地。在此背景下,自動(dòng)駕駛行業(yè)需要解決三個(gè)問題:通過建設(shè)智算中心和優(yōu)化訓(xùn)練效率,降低大模型的云端訓(xùn)練成本;通過改進(jìn)車端芯片、定制transformer專用加速芯片來提升計(jì)算效能;通過改進(jìn)車端模型和輕量化模型來提升計(jì)算效率。
搭載毫末智行輔助駕駛產(chǎn)品的汽車行駛在高速路上
盡管面臨一些挑戰(zhàn),但在賀翔看來,大模型在自動(dòng)駕駛落地的趨勢(shì)不會(huì)變化,只是需要分階段、分任務(wù)去解決相應(yīng)問題和挑戰(zhàn)。
- QQ:61149512