展會(huì)信息港展會(huì)大全

研發(fā)者談斯坦福家務(wù)機(jī)器人:泛化能力還不行,暫無(wú)商業(yè)計(jì)劃
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-23 17:59:03   瀏覽:8557次  

導(dǎo)讀:火爆全網(wǎng)的Mobile Aloha如何做到眼里有活?研發(fā)者揭秘稱,背后離不開系統(tǒng)的支持。一是遠(yuǎn)程操作系統(tǒng),二是高性能數(shù)據(jù)利用管道。不過(guò),研發(fā)者也提到,Mobile Aloha在軟件方面還不能自主改進(jìn)或探索獲取新知識(shí),泛化能力還不行,沒(méi)法做到舉一反三。 你眼里有活兒...

火爆全網(wǎng)的Mobile Aloha如何做到“眼里有活”?研發(fā)者揭秘稱,背后離不開系統(tǒng)的支持。一是遠(yuǎn)程操作系統(tǒng),二是高性能數(shù)據(jù)利用管道。不過(guò),研發(fā)者也提到,Mobile Aloha在軟件方面還不能自主改進(jìn)或探索獲取新知識(shí),泛化能力還不行,沒(méi)法做到舉一反三。

你“眼里有活兒”嗎?不然還不如機(jī)器人。比如,這位。

視頻里,一個(gè)雙臂機(jī)器人站在灶臺(tái)邊,化身大廚,熟練使用鍋鏟、廚具,又是煎又是炸,烹制出了蛋蝦仁、干貝燒雞和蠔油生菜。收拾殘羹冷炙,清洗餐具,也可以。它還能澆花、拖地板、開瓶蓋,甚至逗貓貓。

當(dāng)?shù)貢r(shí)間1月4日,斯坦福大學(xué)人工智能實(shí)驗(yàn)室計(jì)算機(jī)科學(xué)專業(yè)的博士生符梓鵬在社交媒體平臺(tái)X上向網(wǎng)友介紹了這款名為Mobile Aloha的機(jī)器人。瀏覽量很快達(dá)到147萬(wàn),Mobile Aloha也成了科技圈“紅人”。

不過(guò),Mobile Aloha有時(shí)也會(huì)“犯蠢”。

火爆全網(wǎng)的斯坦福家務(wù)機(jī)器人也會(huì)“犯蠢”。(01:19)

1月6日,另一位研究團(tuán)隊(duì)成員、斯坦福大學(xué)博士生托尼趙(Tony Z. Zhao)在社交媒體平臺(tái)展示了它的另一面。它看起來(lái)“笨手笨腳”,鍋都放不進(jìn)櫥柜里,炒完的蝦粘鍋不說(shuō),連碗的位置也找不到。托尼趙開玩笑地在社交媒體上留言稱“機(jī)器人還沒(méi)有做好準(zhǔn)備接管這個(gè)世界”。

另一位研發(fā)者TonyZ.Zhao在社交媒體平臺(tái)X上發(fā)布Mobile Aloha“犯蠢”視頻。

公開資料顯示,Mobile的研究團(tuán)隊(duì)共有3人。符梓鵬和托尼趙負(fù)責(zé)硬件、軟件和AI算法的開發(fā),斯坦福大學(xué)助理教授切爾西費(fèi)恩(Chelsea Finn)擔(dān)任指導(dǎo)老師。這款家務(wù)機(jī)器人制作成本約為3.2萬(wàn)美元,可以執(zhí)行家務(wù)勞動(dòng)、廚房工作和與人打招呼、握手等活動(dòng)。

1月17日,符梓鵬在接受澎湃科技(www.thepaper.cn)采訪時(shí)坦言,目前Mobile Aloha沒(méi)有任何商業(yè)計(jì)劃。“我們公開視頻和研究資料是希望能夠推動(dòng)機(jī)器人領(lǐng)域的發(fā)展,吸引更多人才進(jìn)入這個(gè)行業(yè),解決非常多尚未解決的科學(xué)和工程難題。”

斯坦福家務(wù)機(jī)器人研發(fā)者之一符梓鵬。 來(lái)源:本人社交媒體賬號(hào)

符梓鵬的研究興趣集中在機(jī)器人技術(shù)、機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)的交叉領(lǐng)域。他在接受澎湃科技采訪時(shí)稱,Mobile Aloha“眼里有活兒”的背后離不開系統(tǒng)的支持,不過(guò),泛化能力還不行,沒(méi)法做到舉一反三,比如無(wú)法在一個(gè)廚房學(xué)會(huì)做事后,在另一個(gè)沒(méi)見(jiàn)過(guò)的廚房做相同的事情。

Mobile Aloha“眼里有活”的背后離不開系統(tǒng)的支持

澎湃科技:很多人都看過(guò)Mobile Aloha令人印象深刻的視頻。這款機(jī)器人取名為Aloha有什么寓意?

符梓鵬:Mobile,是可以移動(dòng)的。Aloha,是“A Low-cost Open-source Hardware System for Bimanual Teleoperation”,用于雙手遠(yuǎn)程操作的低成本開源硬件系統(tǒng)。

我們認(rèn)為,“low cost”低成本對(duì)于機(jī)器人的普及非常重要,“open-source”開源系統(tǒng)有助于推動(dòng)機(jī)器人領(lǐng)域的發(fā)展。

Mobile Aloha“眼里有活”的背后離不開系統(tǒng)的支持。一是遠(yuǎn)程操作系統(tǒng),以直觀的方式對(duì)復(fù)雜任務(wù)的數(shù)據(jù)進(jìn)行收集,如煮蝦、疊衣服。二是高性能數(shù)據(jù)利用管道,幫助模仿學(xué)習(xí)。

澎湃科技:Mobile Aloha目前主要的應(yīng)用場(chǎng)景集中在日常家務(wù)活動(dòng)中,為何要將場(chǎng)景設(shè)定在廚房、家務(wù)中?研發(fā)的初衷有哪些?

符梓鵬:我們希望未來(lái)智能機(jī)器人真的能每天都幫助人類。

澎湃科技:該系統(tǒng)使用名為Action Chunking with Transformers(ACT)的算法。它與Generative Pre-trained Transformers(GPT)相比有何不同?

符梓鵬:GPT是自然語(yǔ)言模型。ACT是機(jī)器人模型。兩者都使用Transformer,具有相似的神經(jīng)網(wǎng)絡(luò)架構(gòu)。

澎湃科技:在研發(fā)這款機(jī)器人的過(guò)程中,你面臨的最大的技術(shù)挑戰(zhàn)是什么?最重要的突破是什么?

符梓鵬:技術(shù)挑戰(zhàn)是雙重的。從硬件上來(lái)說(shuō),過(guò)去,研究人員大多依賴于從制造商那里購(gòu)買昂貴的現(xiàn)成的移動(dòng)操作機(jī)器人(指能夠在環(huán)境中移動(dòng)和操作物體的機(jī)器人),找不到既低成本、直觀又功能強(qiáng)大的移動(dòng)操作機(jī)器人/家用機(jī)器人。

為了解決這兩個(gè)難題,我們組裝了自己的硬件,并通過(guò)使用Aloha進(jìn)行雙手操縱和推動(dòng)其移動(dòng),設(shè)計(jì)了高質(zhì)量、低成本的遠(yuǎn)程操縱系統(tǒng)。我們構(gòu)建的硬件能夠遠(yuǎn)程操控機(jī)器人完成復(fù)雜的家庭/辦公任務(wù),而這些任務(wù)在以前是不可能完成的。詳情請(qǐng)參見(jiàn)我們項(xiàng)目網(wǎng)站的“遠(yuǎn)程操控”部分。通過(guò)使用這些硬件,我們擁有了高質(zhì)量數(shù)據(jù)收集管道。

過(guò)去,人們主要通過(guò)編程明確家用機(jī)器人的行為來(lái)完成任務(wù)。比如,編程讓機(jī)器人先走到冰箱附近,然后停下來(lái),再移動(dòng)手臂去拿蘋果等。要讓機(jī)器人可靠地完成現(xiàn)實(shí)世界中的任務(wù),需要進(jìn)行大量的編程和手動(dòng)調(diào)整,而這是無(wú)法擴(kuò)展的。

我們采用數(shù)據(jù)驅(qū)動(dòng)的人工智能方法,利用人類的演示數(shù)據(jù)來(lái)教授機(jī)器人(即模仿學(xué)習(xí))。我們?cè)陧?xiàng)目網(wǎng)站的“自主技能”部分展示了模仿學(xué)習(xí)和協(xié)同訓(xùn)練技術(shù)的效果,只需使用大約50次演示(大約1小時(shí)的人類數(shù)據(jù)),就能教會(huì)機(jī)器人新的自主技能。通過(guò)使用這種軟件/人工智能方法,我們擁有了高質(zhì)量數(shù)據(jù)利用的管道。

更重要的是,我們將硬件和軟件一起設(shè)計(jì),一方面硬件的數(shù)據(jù)收集管道能夠與軟件很好地協(xié)同工作,另一方面軟件的訓(xùn)練模型與硬件配合良好,并可部署到硬件上。

澎湃科技:在Mobile Aloha中,我們觀察到了模仿學(xué)習(xí)(imitation learning)在指導(dǎo)機(jī)器人執(zhí)行高度復(fù)雜的類人任務(wù)方面的有效性。然而,強(qiáng)化學(xué)習(xí)(reinforcement learning)在同樣目的上的應(yīng)用卻沒(méi)有取得可比的成功結(jié)果。在你看來(lái),哪種學(xué)習(xí)機(jī)制在這一領(lǐng)域更有前景?

符梓鵬:模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)對(duì)機(jī)器人技術(shù)都很有用。模仿學(xué)習(xí)可以有效地利用人類的教學(xué),獲得高性能的自主機(jī)器人技能。強(qiáng)化學(xué)習(xí)對(duì)于要求機(jī)器人通過(guò)自動(dòng)練習(xí)、自主微調(diào)和改進(jìn)技能而不需要太多人類知識(shí)非常有價(jià)值。

現(xiàn)在泛化能力不行,沒(méi)法做到舉一反三

澎湃科技:Mobile Aloha是斯坦福大學(xué)(你的團(tuán)隊(duì))和Google DeepMind合作開發(fā)的。你們?cè)谶@次合作中各自扮演了什么角色?

符梓鵬:澄清一下,盡管托尼和切爾西目前就職于Google DeepMind,我曾經(jīng)也是,但Mobile Aloha項(xiàng)目嚴(yán)格來(lái)說(shuō)是斯坦福大學(xué)的項(xiàng)目。我和托尼負(fù)責(zé)硬件、軟件和AI算法的開發(fā),切爾西是指導(dǎo)老師。

澎湃科技:論文提到,在軟件方面,當(dāng)下機(jī)器人還不能自主改進(jìn)或探索獲取新知識(shí),“對(duì)于如何從高度次優(yōu)的異構(gòu)數(shù)據(jù)集中進(jìn)行模仿學(xué)習(xí),將留待未來(lái)的工作來(lái)解決。”請(qǐng)問(wèn)這里如何理解?通俗來(lái)說(shuō),今后是否有可能會(huì)讓Mobile Aloha有“大腦”和“小腦”?

符梓鵬:現(xiàn)在Mobile Aloha的泛化能力還不行,沒(méi)法做到舉一反三,比如無(wú)法在一個(gè)廚房學(xué)會(huì)做事后,在另一個(gè)沒(méi)見(jiàn)過(guò)的廚房做相同的事情。

澎湃科技:在Mobile Aloha完成的各種任務(wù)中,有些是通過(guò)遠(yuǎn)程操作完成的,有些是通過(guò)模仿學(xué)習(xí)自主完成的。在未來(lái)的發(fā)展中,你打算如何平衡控制和自主學(xué)習(xí)?

符梓鵬:我們希望機(jī)器人在收集足夠的數(shù)據(jù)后,能夠自主完成遠(yuǎn)程操作視頻中顯示的所有任務(wù)。

澎湃科技:為什么選擇將硬件和算法完全開源公開?

符梓鵬:第一是希望為公眾利益推動(dòng)現(xiàn)實(shí)世界機(jī)器人領(lǐng)域的研究,第二是希望吸引更多的人從事家用/辦公/廚房機(jī)器人的研究,以解決非常多尚未解決的科學(xué)和工程難題。我們目前還沒(méi)有任何商業(yè)計(jì)劃。

澎湃科技:Mobile Aloha的預(yù)算只有2萬(wàn)美元。如果你有更多的預(yù)算和資源,你的下一個(gè)研究目標(biāo)是什么?

符梓鵬:如果有更多的預(yù)算,我們可以嘗試增加更多的傳感器,包括觸覺(jué)和觸感設(shè)備。

澎湃科技:自2023年人工智能成為全球焦點(diǎn)以來(lái),關(guān)于人工智能倫理的爭(zhēng)論一直很激烈。如果人工智能訓(xùn)練不當(dāng),可能會(huì)對(duì)人類社會(huì)造成潛在危害。對(duì)于人形機(jī)器人來(lái)說(shuō),可能會(huì)給人類社會(huì)帶來(lái)更大的風(fēng)險(xiǎn)。作為一名開發(fā)者,你是如何防止這種情況發(fā)生的?

符梓鵬:包括人形機(jī)器人在內(nèi)的機(jī)器人距離實(shí)現(xiàn)對(duì)人類社會(huì)構(gòu)成威脅的通用智能行為還很遙遠(yuǎn)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港