本文作者:李丹
來(lái)源:硬AI
人形機(jī)器人開發(fā)有望迎來(lái)新突破,會(huì)跳舞的機(jī)器人Atlas將得到先進(jìn)的人工智能(AI)系統(tǒng)加持。
美東時(shí)間10月16日周三,韓國(guó)現(xiàn)代汽車旗下機(jī)器人技術(shù)公司波士頓動(dòng)力(Boston Dynamics)和豐田汽車在美國(guó)的高級(jí)研究機(jī)構(gòu)豐田研究所(TRI)聯(lián)合公布,兩家AI和機(jī)器人領(lǐng)域的機(jī)構(gòu)將在波士頓展開研究合作,旨在運(yùn)用TRI的的大型行為模型(Large Behavior Model)和波士頓動(dòng)力的Atlas機(jī)器人,加快通用人形機(jī)器人的開發(fā)。
大型行為模型簡(jiǎn)稱LBM,是一種復(fù)雜的AI系統(tǒng)。通過(guò)對(duì)大量人類互動(dòng)數(shù)據(jù)集的學(xué)習(xí),它能理解和生成類似人類的行為,從而復(fù)制人類在溝通和決策中的復(fù)雜細(xì)微差別。LBM通常用于機(jī)器人和人機(jī)交互領(lǐng)域。比如讓機(jī)器人與人類的互動(dòng)更自然,理解人類的手勢(shì)并作出適當(dāng)?shù)幕貞?yīng)。
與TRI的合作意味著,波士頓動(dòng)力將進(jìn)一步推動(dòng)先進(jìn)AI技術(shù)在Atlas的應(yīng)用。今年4月,該公司推出了Atlas的電動(dòng)版本,并宣布已打造商用版本,最終將出售給制造業(yè)。波士頓動(dòng)力稱,電動(dòng)Atlas可舉起的物體重量超過(guò)人類的精英運(yùn)動(dòng)員,其發(fā)布的以下視頻顯示,它還能以人類無(wú)法做到的方式移動(dòng),例如向后彎曲膝蓋、將軀干旋轉(zhuǎn)360度。
本周三的聯(lián)合公告稱,最新一代 Atlas 是波士頓動(dòng)力多年軟硬件協(xié)同設(shè)計(jì)的成果,旨在構(gòu)建最強(qiáng)大的人形機(jī)器人平臺(tái),無(wú)論是在物理能力方面,還是在用于編寫全身行為的軟件方面。因此,Atlas成為推進(jìn)給予AI操控技能科學(xué)的理想平臺(tái)。
TRI是目前在研發(fā)機(jī)器人LBM方面得到廣泛認(rèn)可的佼佼者。TRI在擴(kuò)散策略方面的開創(chuàng)性工作讓生成式AI成功應(yīng)用于機(jī)器人靈巧操控的能力。TRI 還在開源機(jī)器人AI模型和數(shù)據(jù)集的開發(fā)中發(fā)揮了主導(dǎo)作用。TRI 利用計(jì)算機(jī)視覺(jué)和大語(yǔ)言模型訓(xùn)練(LLM)方面的額外優(yōu)勢(shì),TRI的LBM研發(fā)旨在實(shí)現(xiàn)多任務(wù)、視覺(jué)和語(yǔ)言相結(jié)合條件的靈巧操控基礎(chǔ)模型。
波士頓動(dòng)力公司的CEO Robert Playter高度評(píng)價(jià)與TRI的合作,稱“機(jī)器人行業(yè)從未有過(guò)如此激動(dòng)人心的時(shí)刻”,此次合作是一個(gè)典范,將展示兩家擁有強(qiáng)大研發(fā)基礎(chǔ)的公司如何攜手應(yīng)對(duì)許多復(fù)雜挑戰(zhàn),并打造能解決現(xiàn)實(shí)問(wèn)題的有用機(jī)器人。
豐田的首席科學(xué)家兼TRI的CEO Gill Pratt稱,AI和機(jī)器學(xué)習(xí)領(lǐng)域最近的進(jìn)展具有推進(jìn)物理智能的巨大潛力。在波士頓動(dòng)力的硬件上采用TRI最先進(jìn)的AI技術(shù)對(duì)兩家機(jī)構(gòu)來(lái)說(shuō)都是可以“改變游戲規(guī)則”的機(jī)遇。
科技媒體TechCrunch評(píng)論稱,波士頓動(dòng)力在人形機(jī)器人領(lǐng)域的主要競(jìng)爭(zhēng)對(duì)手是Agility、Figure 和特斯拉,他們主要選擇在公司內(nèi)部組建 AI 團(tuán)隊(duì)。相比之下,波士頓動(dòng)力與TRI 的合作顯得特別有意思,因?yàn)閮杉覚C(jī)構(gòu)分屬由現(xiàn)代和豐田,也就是兩家是汽車領(lǐng)域的老對(duì)手。