百度AI學(xué)會(huì)了舉一反三 離強(qiáng)人工智能又近了一步
你一定知道,AI 在下圍棋上已經(jīng)比人類(lèi)厲害了。不過(guò),絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實(shí)際上只是面向單一任務(wù)進(jìn)行訓(xùn)練出來(lái)的而已,如果一個(gè) AI 的任務(wù)是
2017-03-31 12:10:33
來(lái)源:新浪科技??

  你一定知道,AI 在下圍棋上已經(jīng)比人類(lèi)厲害了。不過(guò),絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實(shí)際上只是面向單一任務(wù)進(jìn)行訓(xùn)練出來(lái)的而已,如果一個(gè) AI 的任務(wù)是下棋,它就只會(huì)一步一步下棋,你要是突然問(wèn)他“怎么下才能贏?”它根本不知道,八成會(huì)宕機(jī)。

  這就是你暫時(shí)不需要擔(dān)心 AI 終結(jié)人類(lèi)的原因:它不會(huì)舉一反三,沒(méi)法解決一些在認(rèn)知上跨度比較大的任務(wù)。舉個(gè)例子,在《坦克大戰(zhàn)》里,勝利的方式是盡量保存更多的磚塊,吃掉增益,擊毀所有的敵方坦克,一個(gè)正常的人類(lèi)玩家可能玩上一兩盤(pán)就明白了,而 AI 可能會(huì)把所有的磚塊全都打掉,輸?shù)舫汕先f(wàn)盤(pán)游戲才能迎來(lái)第一盤(pán)勝利。

  人很容易理解“保存磚塊只打坦克”這句話,但 AI 理解不了,它只會(huì)玩游戲,不會(huì)聽(tīng)話。

  想要實(shí)現(xiàn)強(qiáng)人工智能,甚至通用人工智能,這個(gè)問(wèn)題遲早有一天要解決。PingWest品玩發(fā)現(xiàn),近日百度發(fā)布的一篇論文顯示,該公司搭建了一個(gè) AI 系統(tǒng),組合了計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理兩種技術(shù),讓 AI 學(xué)會(huì)了“舉一反三”:在一個(gè)專(zhuān)門(mén)架設(shè)的游戲環(huán)境中,AI 控制的角色可以理解并執(zhí)行過(guò)去從未發(fā)出,也從未定義過(guò)的指令,且成功率達(dá)到了 90%。

  研究團(tuán)隊(duì)由深度學(xué)習(xí)研究院杰出科學(xué)家徐偉帶領(lǐng),采用的是監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)所組合的深度學(xué)習(xí)技術(shù)。研究人員設(shè)計(jì)了很簡(jiǎn)單的游戲場(chǎng)景 XWORLD,在一個(gè) 8 x 8 的游戲空間,AI 控制一個(gè)主角,一些磚塊和可以“吃”的水果,位置均隨機(jī)。他們采用的訓(xùn)練房室很簡(jiǎn)單,1)直接給出一句自然語(yǔ)言指令,比如“請(qǐng)前往蘋(píng)果的位置”,然后根據(jù) AI 的行為獎(jiǎng)罰;2)用自然語(yǔ)言向 AI 發(fā)問(wèn),比如“在北邊的水果是什么?”根據(jù)答案正確與否獎(jiǎng)罰。

  至于地圖什么情況、哪些是磚塊哪些是水果、北是什么方向、蘋(píng)果長(zhǎng)啥樣,AI 則是采用計(jì)算機(jī)視覺(jué)來(lái)進(jìn)行判斷的。很快研究人員就發(fā)現(xiàn),AI 不需要以往那么多的訓(xùn)練次數(shù),就可以實(shí)現(xiàn)舉一反三,準(zhǔn)確地執(zhí)行一些從未聽(tīng)過(guò)的新指令,比如“請(qǐng)去到無(wú)花果的西邊”、“你可以去蘋(píng)果和香蕉的中間嗎?”、“請(qǐng)移動(dòng)到紅色/綠色的蘋(píng)果”,以及回答非指令問(wèn)題,比如“靠南的水果是什么”(西瓜)。

  如果你已經(jīng)學(xué)會(huì)了怎樣用水果刀削蘋(píng)果,那你幾乎不需要指導(dǎo)也能用水果刀削梨和火龍果。其實(shí)這就是舉一反三,因?yàn)橥ㄟ^(guò)將感官獲得的資訊進(jìn)行認(rèn)知整合(特別是語(yǔ)言方面),從而實(shí)現(xiàn)知識(shí)和經(jīng)驗(yàn)的遷移,對(duì)于人類(lèi)而言是一件特別容易的事情。但在過(guò)去計(jì)算機(jī)一直無(wú)法實(shí)現(xiàn),除非人類(lèi)對(duì)“反三”中每一種可能出現(xiàn)的狀況都預(yù)先編程。

  在徐偉團(tuán)隊(duì)論文描述的實(shí)驗(yàn)中,AI 系統(tǒng)能夠從訓(xùn)練指令中學(xué)習(xí)語(yǔ)法,處理和回答新的指令、問(wèn)題,意味著計(jì)算機(jī)終于首次在某種特定的環(huán)境下獲得了舉一反三的能力。機(jī)器學(xué)習(xí)中,這種能力的術(shù)語(yǔ)叫做“零樣本學(xué)習(xí)”(zero-shot learning ability)。

  對(duì)于這項(xiàng)技術(shù),接下來(lái)百度還有新的打算。除了讓 AI 在 XWORLD 環(huán)境里增加新的功能,理解更多、更復(fù)雜的指令之外,徐偉團(tuán)隊(duì)還打算將它遷移到虛擬的三維空間中進(jìn)行訓(xùn)練,最終極目標(biāo)則是在實(shí)際環(huán)境中,讓人類(lèi)教師用自然語(yǔ)言來(lái)訓(xùn)練機(jī)器人。

  不管終極目標(biāo)能否實(shí)現(xiàn),至少今天,在像人類(lèi)一樣學(xué)習(xí)的道路上,機(jī)器又往前邁了一步。

原創(chuàng)文章
最新文章
1
趙明離職,榮耀兩大看點(diǎn):IPO與份額止跌
2
TCL智能鎖數(shù)字化工廠落地,研產(chǎn)銷(xiāo)服一體化,構(gòu)建起全鏈路品控體系
3
一加國(guó)補(bǔ)方案出爐,1月20號(hào)起立減15%、至高優(yōu)惠500元!
4
蘋(píng)果在中國(guó)又開(kāi)了一家新店,但銷(xiāo)量大跌了25%
5
2024年冰洗市場(chǎng)總結(jié)及2025年展望
6
2025年量子芯片將行至何處?
7
以舊換新國(guó)補(bǔ)2025年將延續(xù),預(yù)計(jì)2025年中國(guó)電視市場(chǎng)增長(zhǎng)1.4%
8
2024年熱水器市場(chǎng)報(bào)告:以舊換新政策帶動(dòng)市場(chǎng)回暖與結(jié)構(gòu)改善
9
2024年國(guó)內(nèi)智能手機(jī)市場(chǎng)迎來(lái)復(fù)蘇,vivo以17%的市場(chǎng)份額領(lǐng)跑
10
iOS 18.3 Beta 3上線:蘋(píng)果屢屢翻車(chē)的功能被禁用
11
折疊屏與AI,誰(shuí)會(huì)是2025智能手機(jī)市場(chǎng)最大亮點(diǎn)?
12
創(chuàng)維百吋電視銷(xiāo)量中國(guó)第一,強(qiáng)勢(shì)領(lǐng)跑
13
消滅藥丸屏!蘋(píng)果屏下Face ID專(zhuān)利曝光
14
追覓、石頭掃機(jī)器加裝機(jī)械臂,國(guó)產(chǎn)清潔電器越來(lái)越像“機(jī)器人”了
15
力推全棧聯(lián)動(dòng)式大規(guī)模創(chuàng)新,亞馬遜云科技加速生成式AI價(jià)值釋放
16
達(dá)人探訪海信研發(fā)中心,親身體驗(yàn)“開(kāi)機(jī)3分鐘,滿屋是新風(fēng)”
17
業(yè)界唯一!科大訊飛發(fā)布首個(gè)基于全國(guó)產(chǎn)算力的深度推理大模型X1
18
斥資134億收購(gòu)LGD工廠,TCL科技押注LCD市場(chǎng)勝算幾何?
19
12月中國(guó)電視整機(jī)出貨量378.5萬(wàn)臺(tái),同比增長(zhǎng)9.7%
20
京東方拿下美國(guó)專(zhuān)利榜全球第12!顯示領(lǐng)域唯一中企
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512