展會(huì)信息港展會(huì)大全

清華趙明國(guó):智能人形機(jī)器人≠智能+人形 | 智者訪談
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-04 19:53:59   瀏覽:77次  

導(dǎo)讀:劃重點(diǎn)01人形機(jī)器人領(lǐng)域的發(fā)展面臨諸多挑戰(zhàn),包括運(yùn)動(dòng)控制、人工智能融合、數(shù)據(jù)獲取等。02專(zhuān)家趙明國(guó)認(rèn)為,未來(lái)機(jī)器人應(yīng)結(jié)合人工智能發(fā)展,將其作為一種新的模式,提高自身技術(shù)水平。03另一方面,趙明國(guó)強(qiáng)調(diào)仿生學(xué)在人形機(jī)器人領(lǐng)域的應(yīng)用,建議工程師把握最基本的機(jī)理,實(shí)現(xiàn)更接近生物系統(tǒng)的控制。04除此之外,趙明國(guó)指出,人形機(jī)器人應(yīng)用場(chǎng)景包括工廠、養(yǎng)老、家庭服務(wù)等,但當(dāng) ......

劃重點(diǎn)

01人形機(jī)器人領(lǐng)域的發(fā)展面臨諸多挑戰(zhàn),包括運(yùn)動(dòng)控制、人工智能融合、數(shù)據(jù)獲取等。

02專(zhuān)家趙明國(guó)認(rèn)為,未來(lái)機(jī)器人應(yīng)結(jié)合人工智能發(fā)展,將其作為一種新的模式,提高自身技術(shù)水平。

03另一方面,趙明國(guó)強(qiáng)調(diào)仿生學(xué)在人形機(jī)器人領(lǐng)域的應(yīng)用,建議工程師把握最基本的機(jī)理,實(shí)現(xiàn)更接近生物系統(tǒng)的控制。

04除此之外,趙明國(guó)指出,人形機(jī)器人應(yīng)用場(chǎng)景包括工廠、養(yǎng)老、家庭服務(wù)等,但當(dāng)前尚無(wú)明確的應(yīng)用場(chǎng)景。

05最后,趙明國(guó)建議大型企業(yè)和國(guó)家隊(duì)攻克技術(shù)難題,組建合適的團(tuán)隊(duì),逐步實(shí)現(xiàn)工業(yè)應(yīng)用場(chǎng)景。

以上內(nèi)容由大模型生成,僅供參考

人工智能的卓越發(fā)展

源于對(duì)技術(shù)與產(chǎn)業(yè)本質(zhì)的洞察

機(jī)器之心視頻欄目「智者訪談」

邀請(qǐng)領(lǐng)域?qū)<,洞悉核心趨?shì)

深化行業(yè)認(rèn)知,激發(fā)創(chuàng)新思考

與智者同行,共創(chuàng) AI 未來(lái)

清華趙明國(guó):智能人形機(jī)器人≠智能+人形 | 智者訪談

2024 年,人形機(jī)器人領(lǐng)域迎來(lái)爆發(fā)式增長(zhǎng)。特斯拉 Optimus 的持續(xù)迭代、OpenAI 對(duì) 1X 的戰(zhàn)略投資,眾多初創(chuàng)公司異軍突起,以及包括 Mobile ALOHA 在內(nèi)學(xué)術(shù)界的不斷創(chuàng)新,共同描繪出一幅激動(dòng)人心的未來(lái)圖景。

技術(shù)進(jìn)步的浪潮固然令人振奮,但保持清醒和冷靜,在開(kāi)放探索的基礎(chǔ)上,審慎選擇最符合時(shí)代需求和技術(shù)發(fā)展規(guī)律的路徑,才是引領(lǐng)人形機(jī)器人走向成熟的關(guān)鍵。

本期機(jī)器之心《智者訪談》邀請(qǐng)到清華大學(xué)自動(dòng)化系研究員、機(jī)器人控制實(shí)驗(yàn)室主任趙明國(guó)教授,從運(yùn)動(dòng)控制的視角看人形機(jī)器人發(fā)展。趙明國(guó)教授在機(jī)器人控制領(lǐng)域有二十多年的研究與實(shí)踐,他認(rèn)為當(dāng)前人形機(jī)器人領(lǐng)域呈現(xiàn)出如春秋戰(zhàn)國(guó)般多元化的發(fā)展態(tài)勢(shì),這既是蓬勃發(fā)展的象征,也潛藏著方向迷失的風(fēng)險(xiǎn)。

趙明國(guó)教授強(qiáng)調(diào),「智能人形機(jī)器人」不能只是「智能」和「人形機(jī)器人」的簡(jiǎn)單疊加,而應(yīng)當(dāng)是一個(gè)全新的研究主題和技術(shù)范疇,需要機(jī)器人學(xué)和人工智能兩個(gè)領(lǐng)域更深層次的融合,制造能夠在復(fù)雜環(huán)境中自主適應(yīng)和學(xué)習(xí)的智能體。

對(duì)大模型技術(shù)在機(jī)器人控制領(lǐng)域的應(yīng)用,趙教授認(rèn)為單純依賴(lài)「大腦」解決運(yùn)動(dòng)控制問(wèn)題并不合理。人類(lèi)的運(yùn)動(dòng)控制是一個(gè)復(fù)雜的多層次系統(tǒng),涉及本體反射、中樞控制和大腦控制等多個(gè)層面。我們需要更深入地研究生物系統(tǒng)的運(yùn)動(dòng)控制機(jī)理,重新思考機(jī)器人控制系統(tǒng)的架構(gòu),并探索更有效的學(xué)習(xí)和優(yōu)化方法。

趙教授主張技術(shù)的先進(jìn)性并不等同于實(shí)用性,只有與時(shí)代需求和經(jīng)濟(jì)發(fā)展相匹配的技術(shù),才能真正落地生根,開(kāi)花結(jié)果。例如,維納控制論中的很多思想因?yàn)檫^(guò)于超前而未能對(duì)早期的計(jì)算機(jī)和人工智能起到重大的推動(dòng)作用。

那么,究竟什么樣的技術(shù)路線(xiàn)才能最終勝出?人形機(jī)器人的未來(lái)又將如何演變?點(diǎn)擊觀看視頻,讓我們一同探索。

訪談鏈接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650941398&idx=1&sn=df7c01e0ecac1cca3dcca11df7166a48&chksm=84e7e3a8b3906abeb08e93ae9eec4c1aacae8c0a5b82d508c2c85668ab6aac561440a634e47f&token=1043832113&lang=zh_CN#rd

訪談文字整理

機(jī)器之心:趙明國(guó)教授好,非常高興您做客機(jī)器之心的《智者訪談》。近年來(lái),隨著具身智能和大語(yǔ)言模型的迅速發(fā)展,公眾對(duì)于如何實(shí)現(xiàn)智能機(jī)器人的討論熱度空前。今天我們很高興能與您從運(yùn)動(dòng)控制的視角探討人形機(jī)器人的發(fā)展前景。

談及人形機(jī)器人,人們往往會(huì)聯(lián)想到幾家著名企業(yè),比如專(zhuān)注于機(jī)器人運(yùn)動(dòng)控制和硬件設(shè)計(jì)的波士頓動(dòng)力,以及憑借在人工智能和大數(shù)據(jù)方面的優(yōu)勢(shì)進(jìn)軍人形機(jī)器人領(lǐng)域的特斯拉。

趙明國(guó):事實(shí)上,在波士頓動(dòng)力之前,日本本田公司就已經(jīng)在人形機(jī)器人領(lǐng)域做出了開(kāi)創(chuàng)性的貢獻(xiàn)。波士頓動(dòng)力主要專(zhuān)注于提升機(jī)器人的運(yùn)動(dòng)控制能力,而特斯拉則依托其在自動(dòng)駕駛技術(shù)和先進(jìn)器件方面的優(yōu)勢(shì),更多從制造業(yè)和供應(yīng)鏈的角度切入,為人形機(jī)器人的發(fā)展帶來(lái)了全新的思路。這種方法讓許多人認(rèn)為,如果未來(lái)機(jī)器人要實(shí)現(xiàn)大規(guī)模應(yīng)用,特斯拉的路線(xiàn)可能更符合當(dāng)前技術(shù)發(fā)展的趨勢(shì),因此也有不少企業(yè)選擇追隨特斯拉的發(fā)展路徑。

然而,這并不意味著波士頓動(dòng)力或本田的技術(shù)路線(xiàn)就失去了重要性。我認(rèn)為這些不同路線(xiàn)都有其價(jià)值,因?yàn)榧夹g(shù)的進(jìn)步是一個(gè)漸進(jìn)的過(guò)程,需要一代又一代的積累和發(fā)展。除了企業(yè)的努力,學(xué)術(shù)界也在不斷提出新的理論和方法。目前,許多公司,包括一些創(chuàng)業(yè)團(tuán)隊(duì),正在嘗試將學(xué)術(shù)界的研究成果與本田、波士頓動(dòng)力和特斯拉等公司的技術(shù)應(yīng)用相結(jié)合,探索新的發(fā)展方向。

當(dāng)前人形機(jī)器人領(lǐng)域的發(fā)展?fàn)顩r,可以比作春秋戰(zhàn)國(guó)時(shí)期,雖然存在幾個(gè)主流的技術(shù)路線(xiàn),但更多呈現(xiàn)出百花齊放的局面。

01、白馬非馬:智能人形機(jī)器人不只是

智能與人形機(jī)器人的簡(jiǎn)單疊加

機(jī)器之心:眾所周知,運(yùn)動(dòng)控制是建立在明確的運(yùn)動(dòng)學(xué)和力學(xué)原理基礎(chǔ)之上,在數(shù)學(xué)和工程方面具有嚴(yán)謹(jǐn)性。相比之下,人工智能具備自適應(yīng)和自學(xué)習(xí)能力,尤其在處理復(fù)雜問(wèn)題時(shí),AI 常能發(fā)現(xiàn)人類(lèi)難以想到的解決方案。然而,這種特性也帶來(lái)了可解釋性的挑戰(zhàn)。

波士頓動(dòng)力的機(jī)器人在運(yùn)動(dòng)控制方面表現(xiàn)卓越,同時(shí)也展現(xiàn)了高度的智能。例如,配備機(jī)械臂的 Spot 機(jī)器人在物體識(shí)別和抓取方面表現(xiàn)出色。另一方面,以 AI 技術(shù)見(jiàn)長(zhǎng)的特斯拉在硬件領(lǐng)域也投入了大量資源。您一直強(qiáng)調(diào)將運(yùn)動(dòng)控制與人工智能相結(jié)合的重要性,在發(fā)展人形機(jī)器人方面,我們可以從這些公司的實(shí)踐中獲得哪些啟示?

趙明國(guó):人形機(jī)器人與人工智能的結(jié)合可以采取多種方式。其中一種是兩個(gè)領(lǐng)域各自發(fā)展,然后將各自的優(yōu)勢(shì)整合。但除此之外,還存在其他途徑。以波士頓動(dòng)力為例,他們?cè)鴱?qiáng)調(diào)專(zhuān)注于運(yùn)動(dòng)控制而不涉足人工智能,但實(shí)際上他們也運(yùn)用了一些智能的方法。不過(guò),他們的核心在于解決運(yùn)動(dòng)控制問(wèn)題,如行走、奔跑和跳躍等,只不過(guò)在解決這些問(wèn)題時(shí),他們采用的方法可以是傳統(tǒng)的運(yùn)動(dòng)控制技術(shù),也可以是智能的方法。

同樣,專(zhuān)注于人工智能的公司在解決智能問(wèn)題時(shí),也會(huì)使用機(jī)器人作為載體。例如,進(jìn)行對(duì)話(huà)交互時(shí),可以選擇人形機(jī)器人,也可以選擇智能音箱,這對(duì)智能本身的影響并不顯著,核心問(wèn)題在于能否實(shí)現(xiàn)順暢的人機(jī)交互。

然而,要將人工智能與人形機(jī)器人真正深度融合,就像「白馬非馬」這個(gè)哲學(xué)命題一樣,需要?jiǎng)?chuàng)造出一個(gè)全新的事物。智能人形機(jī)器人必然不同于傳統(tǒng)意義上的智能系統(tǒng),也不同于常規(guī)的人形機(jī)器人,而是一個(gè)更深層次融合后的獨(dú)立存在。

我認(rèn)為「具身智能」這個(gè)概念較為貼合這種場(chǎng)景。在這種情況下,我們期望機(jī)器人能展現(xiàn)出行為層面的智能,不僅能夠在各種復(fù)雜地形上行走,還能在面對(duì)干擾時(shí)完成任務(wù),表現(xiàn)出智能化的行為。例如,機(jī)器人應(yīng)該能夠避開(kāi)障礙物,在動(dòng)態(tài)環(huán)境中規(guī)劃路徑,比如開(kāi)門(mén)這個(gè)典型案例,包括應(yīng)對(duì)不同形狀、不同類(lèi)型的門(mén),同時(shí)能制定策略繞過(guò)中間的障礙物,或者在有其他人同時(shí)開(kāi)門(mén)時(shí)做出規(guī)避或讓步等行為。在手部操作方面,這樣的例子更為豐富,因?yàn)槿祟?lèi)大部分操作都是通過(guò)手來(lái)完成的。

這是一個(gè)全新的研究主題如何讓機(jī)器人展現(xiàn)智能。這需要機(jī)器人學(xué)和人工智能兩個(gè)領(lǐng)域進(jìn)行更深層次的融合,而不僅僅是一個(gè)領(lǐng)域借用另一個(gè)領(lǐng)域的技術(shù)來(lái)提升自身。我們需要將兩者有機(jī)結(jié)合,創(chuàng)造出一個(gè)全新的技術(shù)范疇。

機(jī)器之心:您的觀點(diǎn)非常具有啟發(fā)性,但似乎目前很少有人從這個(gè)角度來(lái)探討這個(gè)問(wèn)題。

趙明國(guó):這實(shí)際上取決于不同的視角,我只是試圖將問(wèn)題闡述得更加清晰。無(wú)論采用何種方法,要開(kāi)發(fā)出這種新型機(jī)器人,我們需要考慮幾個(gè)關(guān)鍵。

首先是腿部的智能;其次是手部的智能,包括手指和手臂的智能,手臂負(fù)責(zé)運(yùn)動(dòng),手指負(fù)責(zé)實(shí)際的抓取和操作。在進(jìn)行手部操作時(shí),腿部通常也在運(yùn)動(dòng),這需要手足協(xié)調(diào)。除此之外,還有一些全身性的智能,如騎自行車(chē)、攀巖,以及前面提到的開(kāi)門(mén),這些活動(dòng)強(qiáng)調(diào)全身的協(xié)調(diào)。從運(yùn)動(dòng)能力的角度來(lái)看,有些智能機(jī)器人可能更側(cè)重于腿部功能,有些更注重手部功能,還有一些可能側(cè)重全身運(yùn)動(dòng),也可能是這三個(gè)領(lǐng)域的不同組合。

在早期階段,我認(rèn)為可以為這三個(gè)領(lǐng)域分別選取一些典型案例作為代表,用它們來(lái)推動(dòng)技術(shù)發(fā)展,并作為標(biāo)準(zhǔn)測(cè)試平臺(tái)。如果一個(gè)機(jī)器人能夠完成特定任務(wù),就意味著相關(guān)技術(shù)已經(jīng)取得突破,能夠?qū)崿F(xiàn)某些功能了。我們可以從一個(gè)領(lǐng)域開(kāi)始,逐步擴(kuò)展到兩個(gè),最終實(shí)現(xiàn)三個(gè)領(lǐng)域的突破,然后再考慮實(shí)際應(yīng)用。

當(dāng)然,也有團(tuán)隊(duì)選擇直接從應(yīng)用需求出發(fā),通過(guò)反向推導(dǎo)來(lái)進(jìn)行開(kāi)發(fā)。目前業(yè)界還沒(méi)有形成共識(shí),各種方法都有人在嘗試。但從最基本的邏輯看,無(wú)非就是這三個(gè)領(lǐng)域的不同組合。

02、雙足運(yùn)動(dòng)控制難點(diǎn):

學(xué)習(xí)與優(yōu)化的結(jié)合

機(jī)器之心:您在仿人機(jī)器人雙足步態(tài)控制領(lǐng)域擁有 20 余年的研究實(shí)踐和經(jīng)驗(yàn),見(jiàn)證了技術(shù)的幾代變遷。雙足控制一直是機(jī)器人研究中的一個(gè)難點(diǎn),您認(rèn)為目前該領(lǐng)域面臨的主要技術(shù)瓶頸是什么?

趙明國(guó):這個(gè)領(lǐng)域確實(shí)經(jīng)歷了一個(gè)漫長(zhǎng)的發(fā)展過(guò)程。傳統(tǒng)上,研究者傾向于從仿生角度來(lái)解決這個(gè)問(wèn)題,但由于仿生機(jī)理尚未完全掌握,最初出現(xiàn)的是一些簡(jiǎn)化模型。這些模型雖與人體某些運(yùn)動(dòng)相關(guān),但并不完全相同,它們借鑒了人體生理學(xué)的某些特征,如倒立擺模型。這些簡(jiǎn)化模型雖然維度較低,但在當(dāng)時(shí)的計(jì)算機(jī)水平下能夠?qū)崟r(shí)完成計(jì)算,因此在那個(gè)時(shí)期是較為有效的選擇。

我們現(xiàn)在使用的許多方法,如模型預(yù)測(cè)控制(Model-Predictive Control,MPC)和全身控制(Whole-Body Control,WBC),都源自上世紀(jì)。我認(rèn)為真正的突破在于 MPC,它引入了對(duì)未來(lái)進(jìn)行預(yù)測(cè)這一非常重要的概念。這一點(diǎn)在人工智能領(lǐng)域也很重要,即基于某些知識(shí)對(duì)未來(lái)進(jìn)行預(yù)測(cè),兩個(gè)領(lǐng)域在這一點(diǎn)上是共通的。

近期,由于強(qiáng)化學(xué)習(xí)的突破,我們能夠在仿真環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí),然后將獲得的策略遷移到實(shí)體機(jī)器人上。這一路徑已被證明是可行的,我認(rèn)為這是一個(gè)相當(dāng)重要的貢獻(xiàn)。現(xiàn)在通過(guò)強(qiáng)化學(xué)習(xí)方法,大多數(shù)初創(chuàng)團(tuán)隊(duì)能在幾個(gè)月內(nèi)讓機(jī)器人完成多種復(fù)雜任務(wù),比如運(yùn)動(dòng)恢復(fù)和粗糙地面行走,這些任務(wù)在過(guò)去需要大量時(shí)間和資源才能攻克。

目前的仿真技術(shù)能夠支持大部分運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)的仿真。然而,對(duì)于視覺(jué)和其他多種傳感器的仿真,還無(wú)法達(dá)到與人類(lèi)感知相媲美的真實(shí)程度。對(duì)環(huán)境的仿真,尤其是彈性物體的仿真,仍有待改進(jìn)。如果這些方面能夠得到顯著提升,這些工具將大大加速整個(gè)研發(fā)過(guò)程。

就人形機(jī)器人而言,如果僅關(guān)注運(yùn)動(dòng)能力,數(shù)據(jù)獲取可能不是特別困難,或者說(shuō)運(yùn)動(dòng)類(lèi)數(shù)據(jù)具有其特殊性。我個(gè)人認(rèn)為,小規(guī)模數(shù)據(jù)集可能已經(jīng)足夠。但現(xiàn)在面臨的挑戰(zhàn)是,究竟需要什么樣的小規(guī)模數(shù)據(jù)集?這個(gè)問(wèn)題每個(gè)研究者的看法都不盡相同,我認(rèn)為這在很大程度上取決于具體的任務(wù)需求。

2024 年初引發(fā)廣泛關(guān)注的 Mobile ALOHA 項(xiàng)目,沒(méi)有使用仿真,而是通過(guò)遙操作來(lái)獲取真實(shí)場(chǎng)景數(shù)據(jù),直接解決了對(duì)齊和許多中間環(huán)節(jié)的技術(shù)問(wèn)題。在這個(gè)方向上,研究者會(huì)開(kāi)發(fā)出多種方法來(lái)快速有效地獲取數(shù)據(jù),這是一個(gè)非常明確的發(fā)展趨勢(shì)。

另一種可能的方向是利用積累的大量視頻資源。如果能直接從視頻中獲得機(jī)器人運(yùn)動(dòng)控制所需的數(shù)據(jù),將會(huì)是非常有價(jià)值的。舉例來(lái)說(shuō),中學(xué)生學(xué)習(xí)打籃球時(shí),很多人會(huì)模仿喬丹或科比,他們通過(guò)觀看視頻來(lái)學(xué)習(xí),盡管喬丹和科比并未親自指導(dǎo)他們,他們也沒(méi)有這些球星的任何詳細(xì)數(shù)據(jù)。然而,由于機(jī)器的能力水平還無(wú)法像人類(lèi)那樣從視頻中學(xué)習(xí),我們不得不通過(guò)仿真或遙操作來(lái)獲取數(shù)據(jù)。不過(guò),對(duì)于完成人形機(jī)器人的某些復(fù)雜運(yùn)動(dòng)來(lái)說(shuō),遙操作方法可能與完成簡(jiǎn)單任務(wù)(如刷盤(pán)子)還有所不同,需要綜合考慮視覺(jué)等多個(gè)方面。

機(jī)器之心:您提到機(jī)器的能力還無(wú)法像人類(lèi)那樣從視頻中學(xué)習(xí),具體是指哪些能力呢?

趙明國(guó):我主要指的是處理數(shù)據(jù)的能力。目前,機(jī)器的視覺(jué)分析能力還不足以從單目相機(jī)拍攝的普通視頻中直接分析出人的準(zhǔn)確三維坐標(biāo),或者將其轉(zhuǎn)換為所需的數(shù)據(jù)格式。

在人形機(jī)器人領(lǐng)域,目前的重點(diǎn)依然是從仿真中獲取數(shù)據(jù)。在仿真的潛力沒(méi)有被完全挖掘或達(dá)到瓶頸之前,研究者肯定會(huì)集中精力在仿真方面深入探索。但是,當(dāng)任務(wù)發(fā)生變化時(shí),仿真的局限性就會(huì)顯現(xiàn)出來(lái),而目前又無(wú)法直接從視頻中獲取所需的數(shù)據(jù)。在這種情況下,像 Mobile ALOHA 使用的方法就非常巧妙,因?yàn)樗鉀Q了數(shù)據(jù)獲取的難題。然而,如果要讓機(jī)器人完成諸如踢足球、打籃球或攀巖等復(fù)雜運(yùn)動(dòng),遙操作的方法可能就不太適用了。隨著研究的不斷深入,我相信還會(huì)出現(xiàn)許多新的技術(shù)手段,最終很可能會(huì)發(fā)展到能夠直接利用視頻數(shù)據(jù)。

體育院校積累了大量運(yùn)動(dòng)數(shù)據(jù),如何有效利用這些數(shù)據(jù)也是一個(gè)值得探討的問(wèn)題。我認(rèn)為這在很大程度上受到數(shù)據(jù)采集和分析手段以及算法的影響。但最終的核心問(wèn)題仍然是如何獲得高質(zhì)量的數(shù)據(jù),以及如何有效利用這些數(shù)據(jù)。這兩個(gè)問(wèn)題都在不斷發(fā)展,但核心邏輯仍然是進(jìn)行學(xué)習(xí)和訓(xùn)練,獲取數(shù)據(jù),然后利用數(shù)據(jù)進(jìn)行訓(xùn)練,這兩個(gè)基本步驟沒(méi)有改變,但在具體實(shí)施細(xì)節(jié)上會(huì)發(fā)生許多技術(shù)上的變革。目前,技術(shù)發(fā)展速度非?,甚至在一周之內(nèi)就可能產(chǎn)生一些新的突破性結(jié)果。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港