華盛頓發(fā)育心理學(xué)家與計算機科學(xué)家合作,讓機器人像兒童那樣自然地學(xué)習(xí)。兒童會追蹤大人的目光,研究人員將這種方法教給機器人以完成任務(wù)。
孩子來到這個陌生的世界上,他們移動著自己的身體,探索著身體怎樣移動、怎樣抓住玩具、怎樣推開桌上的東西,同時觀察模仿著成人的做法,如此這般學(xué)習(xí)著這個世界的一切。
但如果讓機器人專家教一個機器人執(zhí)行任務(wù),一般情況下,他們只能靠編寫程序,或移動機器人的手臂或身體,如此告知它們?nèi)绾涡袆。美國華盛頓大學(xué)計算機科學(xué)與工程教授拉加什·拉奧說:“你可以把這當(dāng)作是建造能向人類學(xué)習(xí)的機器人的第一步,它們的學(xué)習(xí)方法和兒童向大人學(xué)習(xí)是一樣的。如果讓那些絲毫不懂計算機程序的人去教一個機器人,只能用演示的方法——讓機器人看著怎么洗盤子、疊衣服、做家務(wù)。但要實現(xiàn)這一目標(biāo),機器人還要能看懂這些動作,并自己學(xué)著做出來。”
華盛頓大學(xué)機器人專家與該校學(xué)習(xí)與腦科學(xué)實驗室研究所副主管安德魯·麥茲奧夫合作,開發(fā)出一種新的概率模型,將兒童發(fā)育研究和機器學(xué)習(xí)方法結(jié)合起來,目標(biāo)是解決機器人技術(shù)中的根本性難題:造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機器人。
兒童更擅于感知他人意圖
麥茲奧夫以往的研究表明,18個月大的兒童能推測出大人動作的意圖,并能想出其他方法達到他們想要的目的。
在一個案例中,兒童看到大人想拉開一個玩具杠鈴,但未達到目的,因為杠鈴是粘在一起的,大人的手滑到了杠鈴末端。兒童看著這一切,然后決定用另一種方法:用他的小手指抓住杠鈴末端,更加用力地猛拉——重復(fù)大人想要做的。
從某種程度上說,兒童更擅于感知他人的意圖,他們通過對自身的探索,學(xué)習(xí)物理規(guī)律,了解自己的行動對事物的影響,甚至能積累足夠的知識向他人學(xué)習(xí),并理解他們的意圖。麥茲奧夫認(rèn)為,兒童之所以能學(xué)習(xí)得那么快,原因之一就是他們特別愛玩。
“兒童在玩的時候,看起來是毫無目的,但卻是一種學(xué)習(xí)。”麥茲奧夫說,“這正是兒童很有創(chuàng)造性的秘密。如果他們想知道怎么玩一個新玩具,就要用到玩其他玩具時的經(jīng)驗。在玩的過程中,他們也在學(xué)習(xí)著一種思維模式,即自己的行動會對外界造成怎樣的改變。一旦有了這種思維模式,他們就有了解決新問題的能力,并開始推測別人的意圖。”
用“學(xué)習(xí)概率模型”指導(dǎo)機器人
利用對兒童的研究,拉奧團隊開發(fā)了機器學(xué)習(xí)算法——一種學(xué)習(xí)概率模型:讓機器人觀察自己的動作,看不同動作可能帶來什么樣的不同后果,然后用這種學(xué)習(xí)概率模型,推測一個人究竟想做什么,并完成他的意圖,甚至在機器人無法確定時,還能“詢問”求助。
研究團隊用兩個不同的場景對他們的機器人模型進行了測試:一個是計算機模擬實驗,其中的機器人能通過追蹤人類的目光學(xué)習(xí);另一個是真的機器人,能通過模仿人類行動來學(xué)習(xí),比如移動桌子上的玩具。
在目光追蹤實驗中,機器人學(xué)習(xí)了一種如何移動頭部的規(guī)則模型,并假定人類轉(zhuǎn)頭也遵循這一模型。當(dāng)人在屋內(nèi)環(huán)視時,機器人會追蹤他頭部移動的起點和終點,用這些信息算出他在看什么地方,然后用學(xué)到的頭部運動規(guī)則,把自己的頭轉(zhuǎn)向人所看的地方。
研究人員還重復(fù)了麥茲奧夫?qū)和龅囊粋實驗,讓一個大人看向某個地方然后蒙住眼睛時,兒童會對那個地方視而不見,或者也看向那里并蒙住眼睛,表示不感興趣,因為按他們的理解,大人其實是不想看那里。研究人員讓機器人“理解”蒙住眼睛(視而不見)的后果,它們就不再追蹤人類轉(zhuǎn)頭所看的地方。
“兒童通過自身的體驗來理解他人的行為,我們的機器人也是這樣。”麥茲奧夫說。
在第二個實驗中,研究人員讓機器人模仿人類移動桌上的物體并把它們擦干凈。在學(xué)習(xí)模型的指導(dǎo)下,它們每次都不是生硬地模仿人類動作,有時還會用不同的方法來達到同樣目的。
華盛頓大學(xué)計算機科學(xué)與工程博士生鄭宰永說:“抓取、拿起、移動這些動作對機器人來說比推要困難,讓人類把一個物體拿到另一個位置或許更容易,也更可靠,但還要知道目的是什么,這是機器人技術(shù)中的一個難題,也是我們致力研究的問題。”
雖然實驗最初只是學(xué)習(xí)怎樣推斷目的、模仿簡單動作,但研究人員還打算探索這種模型能否幫助機器人學(xué)習(xí)更復(fù)雜的任務(wù)。
“兒童通過玩耍觀察別人來學(xué)習(xí)。”麥茲奧夫說,“他們是地球上最棒的學(xué)習(xí)者——為什么不設(shè)計一種能像孩子那樣毫不費力學(xué)習(xí)的機器人呢?” |