你會把還能穿的臟衣服堆在哪里?我先來揭自己的短:臥室的椅子上。
不知道為什么,每次我要睡覺的時(shí)候,都非常不想收拾這些衣服,所以我寧愿把它們都堆在椅子上,然后告訴自己“明天再說吧”。如果可以的話,我愿意花大價(jià)錢將這項(xiàng)工作自動化。
多虧了人工智能,我們未來或許真的可以看到家務(wù)機(jī)器人的問世。幾十年來,真正好用的家務(wù)機(jī)器人只存在于科幻小說中,這也是許多機(jī)器人科學(xué)家的最終目標(biāo)。
機(jī)器人并不聰明,我們覺得容易的事情它們卻很難做到。能夠完成手術(shù)等非常復(fù)雜工作的機(jī)器人通常售價(jià)高達(dá)數(shù)十萬美元,貴得令人望而卻步。
我最近報(bào)道了美國斯坦福大學(xué)開發(fā)的名為 Mobile ALOHA 的新機(jī)器人系統(tǒng),研究人員用它驅(qū)動了一個(gè)便宜的、可以輕松買到的帶輪子的機(jī)器人,讓它能夠完成一些極其復(fù)雜的事情,比如煮蝦、擦拭污漬和搬動椅子。
他們甚至讓它做了三道菜,盡管是在人類的監(jiān)督下完成的。
斯坦福大學(xué)助理教授切爾西芬恩(Chelsea Finn)是該項(xiàng)目的顧問,她說,機(jī)器人技術(shù)正處于一個(gè)轉(zhuǎn)折點(diǎn)。過去,研究人員一直受到訓(xùn)練機(jī)器人所需數(shù)據(jù)量的限制。
現(xiàn)在有了更多的可用數(shù)據(jù),像 Mobile ALOHA 這樣的工作表明,有了神經(jīng)網(wǎng)絡(luò)和更多的數(shù)據(jù),機(jī)器人可以非?焖佟⑤p松地學(xué)習(xí)復(fù)雜任務(wù)。
驅(qū)動聊天機(jī)器人的大型語言模型,依賴從互聯(lián)網(wǎng)上收集的龐大數(shù)據(jù)集才能完成訓(xùn)練,但訓(xùn)練機(jī)器人需要使用真實(shí)場景中收集的數(shù)據(jù)。
這使得構(gòu)建龐大的數(shù)據(jù)集變得十分困難。紐約大學(xué)和 Meta 的研究小組最近想出了一個(gè)簡單而聰明的方法來解決這個(gè)問題。
他們將 iPhone 綁在機(jī)械臂(抓取器)上并記錄在實(shí)驗(yàn)參與者家里完成的任務(wù)。收集來的數(shù)據(jù)被用來訓(xùn)練一個(gè)名為 Dobb-E 的系統(tǒng),可以在大約 20 分鐘內(nèi)完成 100 多項(xiàng)家庭任務(wù)。
美國卡內(nèi)基梅隆大學(xué)助理教授迪帕克帕塔克(Deepak Pathak)表示,Mobile ALOHA 還反駁了機(jī)器人界的一種觀點(diǎn),即主要是硬件缺陷阻礙了機(jī)器人完成此類任務(wù)。
(來源:STEPHANIE ARNETT/MITTR | ENVATO)
“缺失的部分是人工智能。”他說。
至于讓機(jī)器人對語音指令做出反應(yīng),以及更好地適應(yīng)現(xiàn)實(shí)世界里的混亂環(huán)境,人工智能也可以派上用場:谷歌的 RT-2 系統(tǒng)可以將視覺語言動作模型與機(jī)器人相結(jié)合。
它使機(jī)器人能夠“看到”和分析世界,并對語音指令做出反應(yīng),完成相應(yīng)行動。
DeepMind 開發(fā)了一個(gè)名為 AutoRT 的新系統(tǒng),使用類似的視覺語言模型來幫助機(jī)器人適應(yīng)看不見的環(huán)境,并利用大型語言模型來為一隊(duì)機(jī)器人提供指令。
不過,即使是最先進(jìn)的機(jī)器人也做不到幫人洗衣服,因?yàn)檫@項(xiàng)家務(wù)對于機(jī)器人來說實(shí)在太難了。堆起來的衣服沒什么規(guī)律可言,形狀千奇百怪,這使得機(jī)器人很難處理它們。
但這可能只是時(shí)間問題,來自斯坦福大學(xué)的研究人員 Tony Zhao 說。他樂觀地認(rèn)為,即使是最棘手的任務(wù),總有一天機(jī)器人也有可能使用人工智能來完成。只不過它們需要先收集好的數(shù)據(jù)。
作者簡介:梅麗莎;R(Melissa Heikkil)是《麻省理工科技評論》的資深記者,她著重報(bào)道人工智能及其如何改變我們的社會。此前,她曾在 POLITICO 撰寫有關(guān)人工智能政策和政治的文章。她還曾在《經(jīng)濟(jì)學(xué)人》工作,并曾擔(dān)任新聞主播。
支持:Ren
運(yùn)營/排版:何晨龍