展會(huì)信息港展會(huì)大全

豐田研究院亮出機(jī)器人AI大招:無(wú)須人工編碼,利用觸覺(jué)高效學(xué)習(xí)新技能
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-21 18:44:43   瀏覽:6530次  

導(dǎo)讀:智東西(公眾號(hào):zhidxcom) 編譯 | 陳佳慧 編輯 | 徐珊 智東西9月21日消息,據(jù)The Verge報(bào)道,豐田研究院(TRI)成功研發(fā)出一種突破性的生成式AI技術(shù)即機(jī)器人行為模型,在機(jī)器人幼兒園中教導(dǎo)機(jī)器人各種靈巧的技能。該機(jī)器人行為模型基于AI的擴(kuò)散策略,可以...

智東西(公眾號(hào):zhidxcom)

編譯 | 陳佳慧

編輯 | 徐珊

智東西9月21日消息,據(jù)The Verge報(bào)道,豐田研究院(TRI)成功研發(fā)出一種突破性的生成式AI技術(shù)即機(jī)器人行為模型,在“機(jī)器人幼兒園”中教導(dǎo)機(jī)器人各種靈巧的技能。該機(jī)器人行為模型基于AI的擴(kuò)散策略,可以在數(shù)十次新技能的演示后學(xué)習(xí)新技能。

運(yùn)用該機(jī)器人行為模型,能讓機(jī)器人產(chǎn)出一致性強(qiáng)、可重復(fù)和高性能的結(jié)果。而且機(jī)器人學(xué)習(xí)和產(chǎn)出的速度極快,不再需要人工來(lái)進(jìn)行編碼和修復(fù)編碼錯(cuò)誤,提高了機(jī)器人的實(shí)用性,也在構(gòu)建機(jī)器人大型行為模型(LBM)方向上邁進(jìn)了一步。

一、機(jī)器人也上學(xué),通過(guò)機(jī)器人行為模型掌握超60項(xiàng)挑戰(zhàn)性技能

據(jù)TOYOTA官網(wǎng)公告,以前,教機(jī)器人新行為的技術(shù)進(jìn)展緩慢、效率較低,而且一般在執(zhí)行任務(wù)時(shí)有很多限制性條件,所執(zhí)行的任務(wù)也是非常具體和細(xì)節(jié)的。機(jī)器人專家需要花費(fèi)大量時(shí)間編寫復(fù)雜的代碼,可能還要不斷修改代碼錯(cuò)誤,以此為機(jī)器人添加新行為。

現(xiàn)在,有了機(jī)器人行為模型。研究員認(rèn)為,觸覺(jué)是這個(gè)機(jī)器人行為模型的關(guān)鍵要素。他們給機(jī)器人提供了一種大拇指般大小的觸覺(jué)傳感器,能夠讓機(jī)器人通過(guò)觸覺(jué)來(lái)感知和學(xué)習(xí),從而像人類一樣更輕松地執(zhí)行各種復(fù)雜任務(wù)。據(jù)The Verge報(bào)道,研究人員就曾在“機(jī)器人幼兒園”教機(jī)器人如何做早餐。

“機(jī)器人幼兒園”的運(yùn)作方式是,首先由一位“老師”展示一套技能,然后機(jī)器人的模型在后臺(tái)學(xué)習(xí)幾個(gè)小時(shí),最后機(jī)器人成功形成新的工作行為。豐田研究院的靈巧操縱實(shí)驗(yàn)室經(jīng)理Ben Burchfiel說(shuō),他們經(jīng)常是在下午教機(jī)器人,讓它學(xué)習(xí)一晚上,第二天早上就可以來(lái)看到它的新行為了。

到目前為止,研究人員已經(jīng)使用機(jī)器人行為模型,成功培訓(xùn)機(jī)器人獲得了超過(guò)60項(xiàng)具有挑戰(zhàn)性的技能,例如倒液體、使用工具以及操控可變形物體等。并且他們希望在2024年底前將這個(gè)數(shù)字增加到1000項(xiàng)。

▲機(jī)器人攪拌液體(圖源:TOYOTA官網(wǎng))

二、自主觀察學(xué)習(xí)新技能,機(jī)器人大型行為模型正在創(chuàng)建

豐田研究院的研究人員在研發(fā)出現(xiàn)在的機(jī)器人行為模型后,還試圖為機(jī)器人創(chuàng)建大型行為模型。豐田研究院機(jī)器人研究副總裁Russ Tedrake說(shuō),大型行為模型與大語(yǔ)言模型類似,是通過(guò)觀察來(lái)學(xué)習(xí),然后能夠執(zhí)行從沒(méi)有教過(guò)的新技能。

谷歌在其AI學(xué)習(xí)模型機(jī)器人變壓器RT-2的研發(fā)中,其實(shí)也在研究類似的技術(shù)。與豐田研究人員的方法類似,他們的機(jī)器人利用自己獲得的經(jīng)驗(yàn)來(lái)推斷如何執(zhí)行任務(wù)。從理論上講,經(jīng)過(guò)AI訓(xùn)練的機(jī)器人最終可以實(shí)現(xiàn),只給出一個(gè)大致方向,而不需要任何具體的行動(dòng)指令就可以完成任務(wù),例如“清理那個(gè)溢出的東西”。

不過(guò),根據(jù)紐約時(shí)報(bào)報(bào)道,谷歌的機(jī)器人研發(fā)還有很長(zhǎng)的路要走。同時(shí),泰晤士報(bào)也稱,研究工作通常是“緩慢而費(fèi)力的”,提供足夠的訓(xùn)練數(shù)據(jù)比向AI模型提供從互聯(lián)網(wǎng)下載的數(shù)據(jù)要難得多。

結(jié)語(yǔ):機(jī)器人獲得觸覺(jué)提升技能學(xué)習(xí)速度,未來(lái)或能實(shí)現(xiàn)機(jī)器人自主拓展新技能

豐田研究院的機(jī)器人行為模型讓機(jī)器人獲得了觸覺(jué),相比于從前訓(xùn)練機(jī)器人的人工編碼和錯(cuò)誤查找,新模型不僅減少了人力付出,也提高了機(jī)器人學(xué)習(xí)新技能的速度,讓機(jī)器人能夠幫助人們更快、更好地完成更多任務(wù)。

而豐田研究院研究人員稱,他們正在構(gòu)建機(jī)器人大型行為模型,谷歌也在不斷嘗試開(kāi)發(fā)類似技術(shù)。有了現(xiàn)在的機(jī)器人行為模型的出現(xiàn),在研究院與科技公司的探索下,未來(lái)機(jī)器人大型行為模型或許也有可能成為現(xiàn)實(shí),機(jī)器人通過(guò)觀察自主拓展新技能也有可能實(shí)現(xiàn)。

來(lái)源:The Verge

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港