展會信息港展會大全

對話宇樹科技王興興:機器人AI還不太夠,大語言模型只是一部分
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-25 12:03:20   瀏覽:4171次  

導(dǎo)讀:過去一兩年的全球科技浪潮中,在大語言模型技術(shù)影響下,機器人成為熱門賽道之一。在2024世界機器人大會期間,宇樹科技創(chuàng)始人王興興接受了新京報貝殼財經(jīng)等媒體采訪。他表示,機器人行業(yè)目前最大限制是AI(人工智能)還不太夠,真正解放機器人AI能力是讓它干...

過去一兩年的全球科技浪潮中,在大語言模型技術(shù)影響下,機器人成為熱門賽道之一。在2024世界機器人大會期間,宇樹科技創(chuàng)始人王興興接受了新京報貝殼財經(jīng)等媒體采訪。他表示,機器人行業(yè)目前最大限制是AI(人工智能)還“不太夠”,真正解放機器人AI能力是“讓它干活”,實現(xiàn)這一愿景不能只依靠大語言模型,需要發(fā)展真正的機器人模型。

“當(dāng)有人愿意采購產(chǎn)品、社會對它有認可度時,我們才去做。”宇樹科技入局人形機器人是順勢而為,但不會“All in”,仍與四足機器人一起“雙線并重”。面對資本熱潮,王興興相對克制,一如他的創(chuàng)業(yè)經(jīng)歷:從他腦海里誕生小機器狗的想法到他正式扎進機器人賽道大約歷時三年。相比之下,在預(yù)測通用機器人的iPhone時刻時,他又相對樂觀:“不會超過5年”。

機器人行業(yè)最大限制還是AI不太夠

貝殼財經(jīng):近期人形機器人火熱,但早期業(yè)界普遍不看好,請問你如何看待?在人形機器人發(fā)展戰(zhàn)略上,宇樹科技有明確規(guī)劃,還是更多隨著社會共識變化而變化?

王興興:基本還是追尋整個社會共識。2020年前,全球人形機器人控制技術(shù)做得不是特別理想,性能上不去,沒辦法看到它有實用價值或者讓它去干活。

2021年到2022年,全球科技非常關(guān)注人形機器人。并且在2022年底大語言模型出來后,大家已經(jīng)看到AI賦能機器人的潛力。在2022年底,雖然我們還沒做人形機器人,但已經(jīng)有客戶想買。我們覺得社會共識、熱度、客戶的期待程度已經(jīng)足夠,所以在2023年正式開始做人形機器人。

貝殼財經(jīng):機器人瘋狂受關(guān)注,這背后存在AI帶來機器人進步的判斷,這其實忽視了機器人本身的技術(shù)進步。目前宇樹科技在機械和動力等方面有哪些重要突破?

王興興:目前這波機器人浪潮主要是AI帶來的。但真正解放AI的能力,還需要讓機器人去干活。我認為現(xiàn)階段機器人行業(yè)一個最大的限制還是AI不太夠:AI模型、訓(xùn)練數(shù)據(jù)集、場景落地部署這些都遠遠不夠。硬件目前也不夠,但它是工程問題,可以預(yù)估時間。減速器壽命、負載能力、靈巧操作精度、視覺感知分辨率、執(zhí)行速度等這些硬件方面當(dāng)然要繼續(xù)完善,但不是最大限制。

要發(fā)展真正的機器人模型只是大語言模型還不夠

貝殼財經(jīng):從目前人形機器人研發(fā)的角度看,大模型可以重點解決哪些技術(shù)問題,主要應(yīng)用在哪些方向?大模型和人工智能的應(yīng)用有望降低研發(fā)成本嗎?

王興興:大語言模型或多模態(tài)模型可以運用在機器人領(lǐng)域,但真正的機器人模型要發(fā)展,只是大語言模型還不夠。機器人模型本質(zhì)上跟大語言模型有很大區(qū)別,大語言模型是機器人模型的一部分,例如與機器人溝通需要語言。對機器人或具身智能來說,最主要的還是讓它干活,而不是在家里聽你的嘮叨或和你對話。

讓機器人干活還是要做出機器人模型,例如加入圖像、機器人關(guān)節(jié)指令、激光雷達等數(shù)據(jù)。像特斯拉直接招人采集數(shù)據(jù),然后訓(xùn)練。這部分訓(xùn)練和大語言模型關(guān)系不大,更多是模仿學(xué)習(xí)。這個模型結(jié)構(gòu)和大語言模型也偏差較大,這是目前的方向,但整個體系不像大語言模型那么成熟。

在機器人具身智能領(lǐng)域,大家的想法、技術(shù)路線,包括共性都不太一樣。這有點類似ChatGPT出來的前一兩年:大家已經(jīng)發(fā)現(xiàn)要往某個方向做,但沒有哪家敢打保票說我的方向絕對正確。

談電動Atlas和宇樹科技G1“撞車”:產(chǎn)品或技術(shù)浪潮發(fā)展相對成熟時,趨同不可避免

貝殼財經(jīng):宇樹科技和電動Atlas都采用的三指,可以詳細介紹為什么三指剛剛夠用,而不是兩指或者四指?

王興興:目前具身智能或人形機器人的技術(shù)方案不是特別統(tǒng)一,典型代表就是手指。為什么用三指?因為大部分產(chǎn)品只用三只手指也能抓住一個很小的東西。從實用性出發(fā)當(dāng)然希望硬件越來越簡單,甚至只有一個爪子,爪子里只有一個電機,就盡量把活干了。

目前,一個電機確實能干活,例如把物體抓到某個位置。但如果要做更小的事,例如拿一個電烙鐵做焊接或拿一雙筷子,只用兩只手指或只有一兩個關(guān)節(jié)的手指很難實現(xiàn),但三只手指基本能完成。隨著AI技術(shù)的成熟,大家對硬件的自由度、數(shù)量、外觀、靈活度及要求也越低。

貝殼財經(jīng):人形機器人電動Atlas上線,在不久之后的5月,宇樹科技公布G1。這兩款前后出現(xiàn)的人形機器人,在靈活度和外形上都有一定的相似性,為什么會出現(xiàn)這種巧合?G1會率先在哪些場景實現(xiàn)應(yīng)用?

王興興:一個產(chǎn)品或一項技術(shù)浪潮發(fā)展相對成熟時,趨同不可避免。G1不僅運用于工業(yè),可能更多還是一個通用硬件平臺的概念。它比較小,工業(yè)使用相對大的機器人,它們的負載能力、操作空間更大。我們歡迎在G1基礎(chǔ)上做算法的開發(fā)落地應(yīng)用,包括商業(yè)端或家用場景。

貝殼財經(jīng):關(guān)于成本問題,其實市場對G1價格反應(yīng)還蠻大,為什么通過自研能夠做到這么大幅度的降本?能不能具體講一講您對降本這個事情的看法?

王興興:目前人形機器人體量還沒有完全起來,如果定價太低,可能對所有人、對我們、對整個行業(yè)都不是好事。如果后續(xù)整個體量有所提升,例如到明后年,機器人的能力也會越來越強,價格可以有更好的調(diào)整。

另外,降本就是要把所有的零部件各方面設(shè)計得比較極致,哪怕是一顆螺絲釘,還要在生產(chǎn)上做到相應(yīng)的極致管理。另外,“有量就降成本”這件事毋庸置疑,但它也是公認的。某種程度上,公認的事情不是最有競爭力的,很多人也知道在設(shè)計階段就要降成本。汽車也一樣,如果找比亞迪拆車拆機視頻來比對,大概就知道它為什么成本做得相對低,這值得學(xué)習(xí)。

不會All in人形機器人,離通用機器人iPhone時刻不超過5年

貝殼財經(jīng):今年很多人形機器人宣布進廠打工,你怎么看這個現(xiàn)象?

王興興:這是一個趨勢,目前基本還處于試點階段,沒有到真正商業(yè)閉環(huán)的階段,例如達到一臺機器人可能比人還能降低成本的階段。

貝殼財經(jīng):人形機器人的快速發(fā)展,對四足機器人來說是機遇還是挑戰(zhàn)?今年宇樹科技在四足機器人上有哪些研發(fā)計劃?

王興興:四足機器人以及它的硬件、電控系統(tǒng)、軟件、OTA升級平臺、后臺、AI算法等與人形機器人共用的地方非常多,能共用的地方盡量共用。

今年我們在人形機器人上投入會更多,我們目前沒辦法每年都有全新的四足機器人產(chǎn)品,但都有一些硬件、軟件升級?赡苊髂暌矔行碌乃淖銠C器人產(chǎn)品,并不All in人形機器人,基本還是兩條路線并重。

貝殼財經(jīng):通用機器人領(lǐng)域什么時候會出現(xiàn)一個iPhone時刻?

王興興:我比較樂觀,在今年年底之前,全球至少有一家公司或?qū)嶒炇夷茏龀鐾ㄓ眯偷臋C器人AI模型。對于iPhone時刻,還是希望在工業(yè)或服務(wù)業(yè)能真正出現(xiàn)終端產(chǎn)品,并且這個行業(yè)出貨量暴增。iPhone時刻可能還要3年或4年,但不會超過5年。

新京報貝殼財經(jīng)記者 韋英姿

編輯 王進雨

校對 盧茜

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港