Mobile Aloha機器人這幾天火了!確切地說,是視頻火了。
視頻中,Aloha機器人一口氣烹飪?nèi)莱R娀浭郊页2讼栍蜕、干貝燒雞、滑蛋蝦仁,整個過程絲滑順暢、行云流水,簡直就是常年泡在廚房里的“老司機”。
該視頻在網(wǎng)上病毒式傳播,收獲一大撥激動網(wǎng)友“哇哇哇”的贊嘆聲。
伴隨著上面這個令人激動的炒菜視頻一同出現(xiàn)的,還有一段名為“Mobile Aloha的一天”的視頻:
視頻中展示了Aloha機器人的“十八般武藝”:拉開窗簾、澆花、吸塵、擰瓶蓋、倒垃圾等簡單動作的家務(wù)活自然不在話下,包含更多精細(xì)動作、更復(fù)雜流程的家務(wù)也能輕松應(yīng)對,比如洗衣:機器人將衣物放入洗衣機、打開洗衣凝珠袋子取出一顆凝珠放入洗衣機、順便倒入一點衣物蓬松劑,然后關(guān)上洗衣機蓋子,選擇洗衣模式,最后啟動洗衣程序;
最令人驚嘆的是,機器人還能做各種極為精細(xì)的動作:將一件衣服的拉鏈對齊、一拉到底,并掛入衣柜中;它甚至還能在打開藥瓶蓋之后,精準(zhǔn)地倒出一顆藥,并倒好一杯水,服務(wù)病人吃藥。
更“恐怖”的是,它還能拿著小玩具逗貓。看出來了吧,這個家政機器人,主打的是一個360度全方位沉浸式保姆式的關(guān)懷。
但是,這些是真的嗎?這些視頻以十倍的速度播放,而且經(jīng)過精心的剪輯。
自爆“翻車”
正當(dāng)網(wǎng)友們還在津津有味地討論這個機器人能怎樣像“田螺姑娘”一樣把家務(wù)活都包圓的時候,Aloha機器人開發(fā)人員之一的Tony Zhao主動在網(wǎng)上放出了一段Aloha翻車集錦視頻:
原來,擦桌上的紅酒漬沒那么一氣呵成,它也會打翻酒杯;
炒蝦仁也沒有那么順滑,鍋子都燒黑了不說,連鏟刀都懟不進(jìn)鍋子里;甚至把蝦仁倒出來的時候,連盤子的位置都沒找準(zhǔn);
甚至,它傻傻地連放一個鍋子進(jìn)櫥柜這樣的簡單動作也搞砸了……
Tony Zhao自爆說:機器人還沒有做好準(zhǔn)備接管這個世界。他們只是“編輯了視頻”。
原來,Aloha機器人有兩種模式:自主模式和混合模式。前幾天火爆全網(wǎng)的烹飪視頻引發(fā)了極大的關(guān)注度,很多網(wǎng)友都認(rèn)為,這是Aloha在自主模式下完成的。
Tony Zhao主動發(fā)布Aloha“翻車”視頻,澄清此前視頻中采用的是混合模式,并呼吁網(wǎng)友們?nèi)ロ椖烤W(wǎng)站仔細(xì)閱讀論文和代碼。
低成本、全開源
Aloha機器人背后的團(tuán)隊來自斯坦福大學(xué),其中兩名為計算機科學(xué)專業(yè)的華人博士生。該機器人于今年3月底發(fā)布,歷經(jīng)8個月的迭代和2個月的測試。
ALOHA全稱是“A Low-cost Open-source Hardware System”,是一個雙手遙控操作硬件系統(tǒng),不僅軟硬件和數(shù)據(jù)全部開源,而且成本很低,開發(fā)團(tuán)隊甚至發(fā)布了搭建該系統(tǒng)的硬件清單及價格,全部配齊僅需3.2萬美元左右。
據(jù)介紹,Aloha機器人系統(tǒng)借助ACT或擴(kuò)散策略進(jìn)行模仿學(xué)習(xí),加上靜態(tài)操作數(shù)據(jù)一起進(jìn)行聯(lián)合訓(xùn)練。通過這種方式,機器人性能可以得到顯著提高,尤其是完成需要精確操作的任務(wù)。
就一些簡單的動作而言,如洗鍋、擦桌子、餐椅歸位、呼叫并乘坐電梯等,在少量真人示范下,機器人大概學(xué)習(xí)50次可以達(dá)到90%左右的成功率。
像前兩天爆火的炒菜和Aloha機器人的一天這兩個視頻中展示的操作,其實大部分是真人操控、示范的。
AI研究人員,正在變成被AI耽誤的視頻制作高手。作為一名科學(xué)工作者,應(yīng)該把真實的一面同時用視頻展示出來。
一個月前,谷歌備受矚目的新AI模型Gemini發(fā)布后,曾引發(fā)一場關(guān)于其宣傳視頻夸大性能、誤導(dǎo)觀眾的爭議。視頻通過拼接提示詞、語音、圖像等合成,而且加快了響應(yīng)速度,看起來跟真的一樣,令人震撼。事后谷歌研究人員不得不出面解釋。
Mobile Aloha項目網(wǎng)址是:https://mobile-aloha.github.io/,有興趣的朋友可以去看一看。