幫我個忙,拿一下你旁邊的東西。隨便什么都行。即使這個東西是你以前從來沒有見過的,你的大腦還是會自動推理出你該怎樣抓這個東西,用多大的力量。這種智慧和靈巧讓你成為一個人類。 (你是人類吧?)
讓機器人去做同樣的事,你會得到一個空洞的眼神或者發(fā)現(xiàn)物體被冰冷的機器捏成一團。機器人擅長做高強度的重復(fù)性工作,但他們在學(xué)習(xí)操控新物體方面仍然有待提高。所以一家名為Embodied Intelligence的公司應(yīng)運而生,它把機器人和人類的力量融合到一個新的系統(tǒng)中,使得研究人員可以更輕松地給機器人傳授新任務(wù)。它就像是一個虛擬現(xiàn)實游戲,只是你需要控制一個巨大的機器人。
如果你想教機器人去做一些像拿起扳手之類的事,方法有很多。第一個就是對它拿起東西所需要的所有動作進行簡單粗暴的編程。一行接一行地敲代碼。這種方法非常沉悶和辛苦。
(L-R)Embodied Intelligence創(chuàng)始團隊:Peter Chen(首席執(zhí)行官),Pieter Abbeel(總裁兼首席科學(xué)家),Rocky Duan(首席技術(shù)官),張?zhí)旌疲ㄑ芯靠茖W(xué)家)。
強化學(xué)習(xí)是一項更新、更復(fù)雜的技術(shù)。加州大學(xué)伯克利分校的實驗室和Embodied Intelligence一起對一個名叫Brett的機器人進行了研究,這個機器人可以通過推測,自己將方塊放在方孔里。當(dāng)它每做出一個讓方塊接近洞口的隨機動作時,人工智能就會收到獎勵。幾次嘗試之后,機器人越來越接近目標(biāo)直到成功,它可以在10分鐘之內(nèi)通過自學(xué)掌握一個兒童游戲。
所以簡單粗暴的編程是不靈活的,而從頭開始進行強化學(xué)習(xí)又非常耗時。畢竟機器人只是一個受物理世界規(guī)律束縛的物理機器,它只能在一定的時間內(nèi)進行有限的嘗試。 (在模擬過程中使用強化學(xué)習(xí)可以大幅提高速度,因為虛擬的嘗試和錯誤發(fā)生地更快。)
模仿學(xué)習(xí)是一項更精確的技術(shù),一個操作員給機器人演示該如何把方塊放入方孔當(dāng)中。它跟直接操縱機器人一樣容易,但是機器人將無法自學(xué)新的任務(wù)。
Embodied Intelligence想要創(chuàng)造一個將模仿和強化混合起來的學(xué)習(xí)系統(tǒng)。通過VR頭顯和控制器,人類可以遙控機器人執(zhí)行某項任務(wù)。它在操作員和機器人之間創(chuàng)建了一個更加自然的動力學(xué)連接,為了與人類動作相匹配,機器會學(xué)習(xí)一些算法來引導(dǎo)機器人的運動。然后強化學(xué)習(xí)就開始了,機器人會通過反復(fù)試驗和錯誤來改善自己的動作,直到它可以比人類做得更好。
“通常情況下,你希望你的機器人是個超人,而不是和人類一樣。” Embodied Intelligence的聯(lián)合創(chuàng)始人兼總裁Pieter Abbeel說?!澳阆M鼈円坏┱莆樟艘豁椉寄埽涂梢酝ㄟ^自己的反復(fù)試驗,使得這項技能更快、更準(zhǔn)確、更可靠,這個過程不需要人類的持續(xù)指導(dǎo),因為人類的動作速度無法與機器人相媲美?!?/p>
想象一下未來的工廠。不再需要辛苦的程序員們?yōu)榱魉€上執(zhí)行不同的任務(wù)的每個機器人編寫代碼,而是只需在VR中展示動作。機器人起初可能會有些生疏,但隨著時間的推移,他們會用人工智能來熟悉自己的動作。隨著研究人員對算法的不斷改進,機器人可能會承擔(dān)起一項人類教授的特定任務(wù),并用通過自己的摸索去完成不同的事情。
這個系統(tǒng)仍然處于萌芽階段。目前它正在開發(fā)PR2研究機器人,這個機器人相對來說反應(yīng)較慢,動作較笨拙。目前來說任何現(xiàn)代機器人都遠不如人類靈巧,所以即使它可以很好地學(xué)習(xí)操作員的動作,也不能復(fù)制抓取的細節(jié)。但是,如果Embodied intelligence有了自己的方法,那么制造商很快就可以向工廠推出可以效仿人類的機器人,然后讓他們進行自我加強。
想象一下多個機器人一起使用這樣的系統(tǒng),可以達到怎樣的效果。如果你有100臺機器人通過網(wǎng)絡(luò)相互聯(lián)系,其中一臺學(xué)到了一些特別有用的東西,那么它就可以把這些知識傳遞給同伴。我們正在談?wù)撘粋€潛在的強大蜂巢思想。機器人甚至不必具有相同的形狀和尺寸。研究人員已經(jīng)想出了如何將知識在不同類型的機器之間轉(zhuǎn)換的方法。
就短時間內(nèi)來看,這個想法不僅能使機器人變得更加智能,也會使人類教起來更容易。在實驗室里編程需要花費大量時間并且需要具有博士學(xué)位,大多數(shù)人都不具備這兩項條件。 Embodied Intelligence的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Peter Chen說:“我們意識到的是任何可以使用VR頭顯的人都能夠快速地為機器人傳授新技能。這種民主化將使機器人技術(shù)真正騰飛起來,傳統(tǒng)的機器人技術(shù)普及面遠不及軟件,因為任何有電腦的人都可以修補它?!?/p>
這是否會使機器人更容易取代人類工作人員?當(dāng)然有可能。我們看到越來越多的機器人開始和人類一起工作,接手繁瑣而重復(fù)的任務(wù),讓工人可以去從事那些需要敏銳觸覺的獨特人類工作。如果我們希望這種關(guān)系可以達到更好的效果,就需要讓我們的機器人同事快速學(xué)習(xí),以免他們成為一種會用扳手打我們的頭的負(fù)擔(dān),而不是一種解脫。
- QQ:61149512