智東西(公眾號(hào):zhidxcom)
編譯 | 陳佳慧
編輯 | 徐珊
智東西9月21日消息,據(jù)The Verge報(bào)道,豐田研究院(TRI)成功研發(fā)出一種突破性的生成式AI技術(shù)即機(jī)器人行為模型,在“機(jī)器人幼兒園”中教導(dǎo)機(jī)器人各種靈巧的技能。該機(jī)器人行為模型基于AI的擴(kuò)散策略,可以在數(shù)十次新技能的演示后學(xué)習(xí)新技能。
運(yùn)用該機(jī)器人行為模型,能讓機(jī)器人產(chǎn)出一致性強(qiáng)、可重復(fù)和高性能的結(jié)果。而且機(jī)器人學(xué)習(xí)和產(chǎn)出的速度極快,不再需要人工來(lái)進(jìn)行編碼和修復(fù)編碼錯(cuò)誤,提高了機(jī)器人的實(shí)用性,也在構(gòu)建機(jī)器人大型行為模型(LBM)方向上邁進(jìn)了一步。
一、機(jī)器人也上學(xué),通過(guò)機(jī)器人行為模型掌握超60項(xiàng)挑戰(zhàn)性技能
據(jù)TOYOTA官網(wǎng)公告,以前,教機(jī)器人新行為的技術(shù)進(jìn)展緩慢、效率較低,而且一般在執(zhí)行任務(wù)時(shí)有很多限制性條件,所執(zhí)行的任務(wù)也是非常具體和細(xì)節(jié)的。機(jī)器人專家需要花費(fèi)大量時(shí)間編寫復(fù)雜的代碼,可能還要不斷修改代碼錯(cuò)誤,以此為機(jī)器人添加新行為。
現(xiàn)在,有了機(jī)器人行為模型。研究員認(rèn)為,觸覺(jué)是這個(gè)機(jī)器人行為模型的關(guān)鍵要素。他們給機(jī)器人提供了一種大拇指般大小的觸覺(jué)傳感器,能夠讓機(jī)器人通過(guò)觸覺(jué)來(lái)感知和學(xué)習(xí),從而像人類一樣更輕松地執(zhí)行各種復(fù)雜任務(wù)。據(jù)The Verge報(bào)道,研究人員就曾在“機(jī)器人幼兒園”教機(jī)器人如何做早餐。
“機(jī)器人幼兒園”的運(yùn)作方式是,首先由一位“老師”展示一套技能,然后機(jī)器人的模型在后臺(tái)學(xué)習(xí)幾個(gè)小時(shí),最后機(jī)器人成功形成新的工作行為。豐田研究院的靈巧操縱實(shí)驗(yàn)室經(jīng)理Ben Burchfiel說(shuō),他們經(jīng)常是在下午教機(jī)器人,讓它學(xué)習(xí)一晚上,第二天早上就可以來(lái)看到它的新行為了。
到目前為止,研究人員已經(jīng)使用機(jī)器人行為模型,成功培訓(xùn)機(jī)器人獲得了超過(guò)60項(xiàng)具有挑戰(zhàn)性的技能,例如倒液體、使用工具以及操控可變形物體等。并且他們希望在2024年底前將這個(gè)數(shù)字增加到1000項(xiàng)。
▲機(jī)器人攪拌液體(圖源:TOYOTA官網(wǎng))
二、自主觀察學(xué)習(xí)新技能,機(jī)器人大型行為模型正在創(chuàng)建
豐田研究院的研究人員在研發(fā)出現(xiàn)在的機(jī)器人行為模型后,還試圖為機(jī)器人創(chuàng)建大型行為模型。豐田研究院機(jī)器人研究副總裁Russ Tedrake說(shuō),大型行為模型與大語(yǔ)言模型類似,是通過(guò)觀察來(lái)學(xué)習(xí),然后能夠執(zhí)行從沒(méi)有教過(guò)的新技能。
谷歌在其AI學(xué)習(xí)模型機(jī)器人變壓器RT-2的研發(fā)中,其實(shí)也在研究類似的技術(shù)。與豐田研究人員的方法類似,他們的機(jī)器人利用自己獲得的經(jīng)驗(yàn)來(lái)推斷如何執(zhí)行任務(wù)。從理論上講,經(jīng)過(guò)AI訓(xùn)練的機(jī)器人最終可以實(shí)現(xiàn),只給出一個(gè)大致方向,而不需要任何具體的行動(dòng)指令就可以完成任務(wù),例如“清理那個(gè)溢出的東西”。
不過(guò),根據(jù)紐約時(shí)報(bào)報(bào)道,谷歌的機(jī)器人研發(fā)還有很長(zhǎng)的路要走。同時(shí),泰晤士報(bào)也稱,研究工作通常是“緩慢而費(fèi)力的”,提供足夠的訓(xùn)練數(shù)據(jù)比向AI模型提供從互聯(lián)網(wǎng)下載的數(shù)據(jù)要難得多。
結(jié)語(yǔ):機(jī)器人獲得觸覺(jué)提升技能學(xué)習(xí)速度,未來(lái)或能實(shí)現(xiàn)機(jī)器人自主拓展新技能
豐田研究院的機(jī)器人行為模型讓機(jī)器人獲得了觸覺(jué),相比于從前訓(xùn)練機(jī)器人的人工編碼和錯(cuò)誤查找,新模型不僅減少了人力付出,也提高了機(jī)器人學(xué)習(xí)新技能的速度,讓機(jī)器人能夠幫助人們更快、更好地完成更多任務(wù)。
而豐田研究院研究人員稱,他們正在構(gòu)建機(jī)器人大型行為模型,谷歌也在不斷嘗試開(kāi)發(fā)類似技術(shù)。有了現(xiàn)在的機(jī)器人行為模型的出現(xiàn),在研究院與科技公司的探索下,未來(lái)機(jī)器人大型行為模型或許也有可能成為現(xiàn)實(shí),機(jī)器人通過(guò)觀察自主拓展新技能也有可能實(shí)現(xiàn)。
來(lái)源:The Verge