展會(huì)信息港展會(huì)大全

歷經(jīng)百年“塵與土”,人形機(jī)器人離云和月還有幾千里?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-28 07:13:21   瀏覽:43629次  

導(dǎo)讀:文/Renee 編輯/孫越 2023,機(jī)器人這一浪漫主義產(chǎn)物在東八區(qū)、西八區(qū),再次火爆。 東八區(qū),是供應(yīng)商們紛紛在階段性presentationWAIC大會(huì)上秀肌肉,拿捏住80%群眾的眼球與攝像頭: 西八區(qū),是兩位風(fēng)云人物為人形機(jī)器人站臺(tái):英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛直...

文/Renee

編輯/孫越

2023,機(jī)器人這一浪漫主義產(chǎn)物在東八區(qū)、西八區(qū),再次火爆。

東八區(qū),是供應(yīng)商們紛紛在階段性presentationWAIC大會(huì)上秀肌肉,拿捏住80%群眾的眼球與攝像頭:

西八區(qū),是兩位風(fēng)云人物為人形機(jī)器人站臺(tái):英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛直言,AI下一個(gè)浪潮就將是具身智能;馬斯克表示,通用型AI算法支持的機(jī)器人是特斯拉未來(lái)長(zhǎng)期價(jià)值所在。

如果要追究“2023年XX股價(jià)暴漲,XX行業(yè)爆火”的導(dǎo)火索,十有八九是因?yàn)镃hatGPT,人形機(jī)器人也不例外。ChatGPT來(lái)臨后,市場(chǎng)情緒高漲:“人形機(jī)器人歷經(jīng)近百年,ChatGPT 有望引爆技術(shù)奇點(diǎn)”等說(shuō)法層出不窮。

在“人形機(jī)器人+大模型”這一命題上,各個(gè)AI廠商、人形機(jī)器人廠商的執(zhí)行力出乎意料:

3月,微軟在其官網(wǎng)發(fā)表了一篇名為《機(jī)器人 ChatGPT:設(shè)計(jì)原則和模型能力》論文,給出“通過(guò)ChatGPT實(shí)現(xiàn)用人類語(yǔ)言控制機(jī)器人”的現(xiàn)實(shí)路徑;

(機(jī)器人與人類自然語(yǔ)言交互 圖源:開(kāi)源證券)

4月,AI公司Levatas與波士頓動(dòng)力合作,將ChatGPT和谷歌的語(yǔ)音合成技術(shù)接入Spot機(jī)器狗,成功實(shí)現(xiàn)與人類的交互。

本文試圖探究,人形機(jī)器人近百年來(lái),為何沒(méi)有所謂的“奇點(diǎn)”?這近百年沉寂的“死水”,ChatGPT要如何打破?

PART-01

1495年,命運(yùn)的齒輪開(kāi)始轉(zhuǎn)動(dòng)

1504年,達(dá)芬奇畫筆下的《蒙娜麗莎的微笑》,被視為“以人為本”意識(shí)覺(jué)醒的標(biāo)志,自此,人類開(kāi)始自我欣賞,走上尋找自我價(jià)值的漫長(zhǎng)征途。

而出人意料的是,機(jī)器人的“覺(jué)醒”,來(lái)得更早些。在1495年,達(dá)芬奇便已提交了關(guān)于機(jī)器人主題的畫稿:一個(gè)靠風(fēng)能和水力驅(qū)動(dòng)的“機(jī)器武士”。

(達(dá)芬奇機(jī)器人畫稿 圖源:網(wǎng)絡(luò))

在這之后的400多年,關(guān)于人形機(jī)器人的探索從未停止。

憑借著一腔熱血和為人形機(jī)器人“千千萬(wàn)萬(wàn)遍”的韌勁,1927年,美國(guó)西屋公司推出“Televox”:不能走動(dòng),但可以抬起接收器以接聽(tīng)電話,并根據(jù)接收到的信號(hào)通過(guò)操作開(kāi)關(guān)來(lái)控制簡(jiǎn)單的動(dòng)作,此外其還能回答一些問(wèn)題。

(世界上第一臺(tái)人形機(jī)器人“Televox” 圖源:國(guó)盛證券研究所)

10年過(guò)后,西屋公司在此基礎(chǔ)上制造出“摩托人Elektro”,被認(rèn)為是真正的第一個(gè)類人機(jī)器人,如此論斷,或許是因?yàn)樗鼤?huì)抽煙?

在1939年的世博會(huì)上,摩托人Elektro接到煙之后,像人類一樣嘬了幾口,但遺憾的是,它并不會(huì)“吐氣”,煙霧只能從頭顱里散發(fā)出來(lái)。

(摩托人Elektro 圖源:國(guó)盛證券研究所)

又經(jīng)過(guò)半個(gè)世紀(jì)的“調(diào)教”,人形機(jī)器人不再是藝術(shù)品里的天馬行空,或是科技展會(huì)里的“喜劇秀”,開(kāi)始“腳踏實(shí)地”起來(lái)。

1972年,早稻田大學(xué)孵化出ASIMO,世界上第一個(gè)真正意義上的人形機(jī)器人誕生(能走動(dòng)能說(shuō)話)。2000年,第一代ASIMO能“拉呱”和“搬磚”,到十幾年后的第七代,ASIMO已經(jīng)具備了類似人類的步行方式,能以將近9公里的時(shí)速奔跑和倒行,也能擰杯蓋和倒水。

(ASIMO 多代參數(shù)比較 圖源:廣發(fā)證券)

緊接著,人形機(jī)器人故事的主角紛紛涌現(xiàn):其中不得不提的,便是現(xiàn)階段花活最多的波士頓機(jī)器人。

(Atlas機(jī)器人發(fā)展歷程 圖源:海通國(guó)際)

Atlas原型機(jī)最早于2009年亮相,Atlas多年以來(lái),主打一個(gè)“體育生”人設(shè),秀肌肉,秀技能:

2013年7月11日向公眾正式公開(kāi)。Atlas機(jī)器人身高188cm,體重150kg,其設(shè)計(jì)目的是為了搜索和救援任務(wù)。

2018年,波士頓動(dòng)力進(jìn)一步對(duì)機(jī)器人進(jìn)行優(yōu)化設(shè)計(jì),最新身高1.5m,體重80kg,全身具有28個(gè)關(guān)節(jié),速度能達(dá)到1.5m/s,能完成快速小跑、三級(jí)跳、后空翻和空中體操等一系列復(fù)雜動(dòng)作。

本以為,人形機(jī)器人會(huì)一路高歌,而2022年卻帶來(lái)了一個(gè)好消息和一個(gè)壞消息,讓整個(gè)人形機(jī)器人行業(yè)“撲朔迷離”。

壞消息是,“一代梟雄”退出歷史舞臺(tái),商業(yè)化落地的大坑,無(wú)人幸免:2022年3月31日,在本田汽車公司的東京總部,仿人機(jī)器人ASIMO正式宣布退役,結(jié)束了長(zhǎng)達(dá)22年的職業(yè)生涯。

好消息是,多個(gè)科技大廠跨界奔赴而來(lái),“壁壘高筑”成為歷史:2022年,特斯拉推出人形機(jī)器人“擎天柱”、小米發(fā)布全棧自研人形機(jī)器人“CyberOne”、亞馬遜注資機(jī)器人“Digit”

好運(yùn)延續(xù)到了2023年,這半年,原生賽道選手動(dòng)作頻頻:

1月31日,Walker機(jī)器人的優(yōu)必選正式向港交所遞交招股說(shuō)明書;

7月6日,傅利葉智能在2023世界人工智能大會(huì)上發(fā)布首款GR-1通用人形機(jī)器人;

但從WAIC的展會(huì)來(lái)看,人形機(jī)器人仍然令人心生敬畏:

在機(jī)器人展區(qū),僅有傅利葉的下肢康復(fù)機(jī)器人,云深處的絕影等四足機(jī)器人能夠?qū)a(chǎn)品搬到展會(huì)并進(jìn)行演示,特斯拉的人形機(jī)器人模型“束之高閣”,達(dá)闥陳列了各式各樣職業(yè)的人形機(jī)器人模型

1495年開(kāi)始,人形機(jī)器人命運(yùn)的齒輪開(kāi)始轉(zhuǎn)動(dòng)。以下是現(xiàn)如今,人形機(jī)器人廠商,給出的階段性成果:

(典型的人形機(jī)器人 圖源:廣發(fā)證券)

500多年過(guò)去,基于成本、續(xù)航等難題,人形機(jī)器人仍未成功“落戶”。

PART-02

人形,究竟有多難?

機(jī)器人想要成“人”的成本,是精英的千千萬(wàn)萬(wàn)倍。

將一個(gè)真正的人培養(yǎng)至大學(xué)畢業(yè),時(shí)間成本是23年,其金錢成本按知乎博主三笛規(guī)劃測(cè)算,低配版至少要花70萬(wàn),高配版要花費(fèi)966萬(wàn)。

而僅僅是要為6歲WALKER進(jìn)行4次迭代,“家長(zhǎng)”優(yōu)必選的代價(jià)是,近25億元的投入(按照優(yōu)必選披露的最低數(shù)據(jù)測(cè)算,近年來(lái)優(yōu)必選科技的研發(fā)開(kāi)支分別達(dá)到2020年4.288億元、2021年5.171億元和2022年前9個(gè)月3.247億元)

如此費(fèi)錢的根源是,人形機(jī)器人需要集“運(yùn)動(dòng)健將、智多星、導(dǎo)航助手”三大“完美人設(shè)”于一身,即在運(yùn)動(dòng)模塊、傳感模塊和人工智能模塊都要駕輕就熟。

而其他機(jī)器人的“KPI”往往只有一項(xiàng):工業(yè)機(jī)器人的能力,取決于其“肌肉個(gè)數(shù)”,即主要側(cè)重于運(yùn)動(dòng)控制技術(shù);掃地機(jī)器人的能力,取決于其能否成功規(guī)避障礙物,把全屋打掃干凈,即側(cè)重于導(dǎo)航傳感技術(shù)。

所以,人形機(jī)器人的這一“完美人設(shè)”背后,需要大把銀兩去維護(hù):今年6月,天風(fēng)證券的一份專家紀(jì)要顯示,目前國(guó)內(nèi)單臺(tái)人形機(jī)器人生產(chǎn)成本在70-100萬(wàn)元。

一個(gè)自然而然的問(wèn)題是,如何降本?

難題多的是,目標(biāo)得先行。國(guó)內(nèi)外皆有廠商,給出自己的schedule:根據(jù)優(yōu)必選預(yù)測(cè),在2030年,人形機(jī)器人將降本70%-80%至2-3萬(wàn)美元。特斯拉的Flag更為激進(jìn):3-5年之內(nèi),降到2萬(wàn)美元。

基于特斯拉數(shù)據(jù)與自身測(cè)算,開(kāi)源證券給出了降本的方向與空間:對(duì)比當(dāng)前時(shí)點(diǎn)和終局狀態(tài)下 BOM 表拆解,線性關(guān)節(jié)和靈巧手的降本空間最大。

可以看到在核心環(huán)節(jié),技術(shù)壁壘較高,國(guó)產(chǎn)化率較低,供應(yīng)鏈話語(yǔ)權(quán)堪憂。尤其是諧波減速器,其技術(shù)迭代幾近停滯,同時(shí)日本哈默納科一家獨(dú)大,短期之內(nèi),國(guó)產(chǎn)廠商難以突破,現(xiàn)階段國(guó)產(chǎn)廠商正布局機(jī)電一體化,以期提高工業(yè)機(jī)器人等自動(dòng)化設(shè)備的靈活性。

技術(shù)降本,荊棘重重,故現(xiàn)階段廠商用產(chǎn)能擴(kuò)張規(guī);,來(lái)講述降本的故事:

優(yōu)必選的降本規(guī)劃,便是基于產(chǎn)能擴(kuò)張規(guī)模化來(lái)測(cè)算的,同時(shí)其相關(guān)負(fù)責(zé)人表示,國(guó)產(chǎn)人形機(jī)器人的降本,受益于行業(yè)應(yīng)用擴(kuò)展的規(guī)模化量產(chǎn)和國(guó)產(chǎn)供應(yīng)鏈的成本優(yōu)勢(shì),同時(shí)也可通過(guò)改進(jìn)制造工藝、采用更魯棒運(yùn)動(dòng)控制算法降低對(duì)硬件精確度、硬件指標(biāo)要求來(lái)實(shí)現(xiàn)。

(優(yōu)必選對(duì)人形機(jī)器人成本預(yù)測(cè) 圖源:開(kāi)源證券)

這更為考驗(yàn)國(guó)產(chǎn)廠商的量產(chǎn)能力與供應(yīng)鏈管理能力。除此之外,眼下還有一大障礙是,人形機(jī)器人的續(xù)航問(wèn)題。

據(jù)優(yōu)必選向睿洞察透露,目前其產(chǎn)品Walker在充滿電的情況下,續(xù)航時(shí)間大約在兩小時(shí)左右,而這已然是前幾名的成績(jī)。

機(jī)器人巨大的耗電量實(shí)際上主要來(lái)自于關(guān)節(jié)部位,伺服驅(qū)動(dòng)器是最主要的耗電單元,而它的耗電量又與效率有關(guān)。對(duì)此,優(yōu)必選給出的解決方案是:通過(guò)優(yōu)化“單個(gè)伺服舵機(jī)的驅(qū)動(dòng)方式、機(jī)器人直立行走的算法、手眼協(xié)調(diào)的算法”,從而大幅降低機(jī)器人在運(yùn)動(dòng)狀態(tài)下的耗電量。

以上,還是沒(méi)有計(jì)算進(jìn)階版“大腦”和“眼睛”的顯性成本與困境;诂F(xiàn)狀,無(wú)論是科技大廠還是原生選手,皆選擇面向TO B,等待蛻變。

Tesla bot最新一批“打工人”大概率將去造車,奔赴超級(jí)工廠;

據(jù)傅利葉智能7月12日發(fā)布會(huì)顯示,其未來(lái)將繼續(xù)深耕醫(yī)療場(chǎng)景,在陪護(hù)/照護(hù)/康復(fù)等細(xì)分領(lǐng)域注力,同時(shí)邁向生產(chǎn)制造、科技展館/演出等B端場(chǎng)景;

優(yōu)必選已然在科研開(kāi)發(fā)和科技展館、政企展廳等落地,同時(shí)近期的一系列動(dòng)作,也圍繞著新能源汽車、3C電子等相關(guān)工業(yè)場(chǎng)景。

人形,難在核心部件技術(shù)壁壘高企,降本依靠量產(chǎn)規(guī)模;難在續(xù)航在兩小時(shí)左右,工作效率遠(yuǎn)比不上打工人;更難在集“運(yùn)動(dòng)健將、智多星、導(dǎo)航助手”于一身

PART-03

成年人的戰(zhàn)爭(zhēng),只會(huì)更加激烈

業(yè)內(nèi)專家認(rèn)為,人形機(jī)器人對(duì)本體制造商的考驗(yàn),在以下三個(gè)方面:整機(jī)集成能力、運(yùn)動(dòng)控制算法軟件開(kāi)發(fā)能力、AI布局。

AI布局,也就是大腦層面,成為現(xiàn)階段最大的變數(shù):

先前在“大腦”層面,幾乎沒(méi)有什么水花,各家推出的模型,能動(dòng)的基本只能倒倒水、搬搬快遞;而現(xiàn)階段,ChatGPT來(lái)臨之后,人形機(jī)器人的“大腦”,終于迎來(lái)質(zhì)變的可能性。

微軟已給出“通過(guò)ChatGPT實(shí)現(xiàn)用人類語(yǔ)言控制機(jī)器人”的現(xiàn)實(shí)路徑:

首先,由于機(jī)器人是個(gè)多元化領(lǐng)域,在微軟的操作框架下,不同機(jī)器人都有自己對(duì)應(yīng)的特定函數(shù)庫(kù)。這些函數(shù)庫(kù),可以理解為中控,能夠連接機(jī)器人控制系統(tǒng)進(jìn)行底層硬件的管理,以及執(zhí)行基本運(yùn)動(dòng)的代碼和功能模塊。

然后,為了讓ChatGPT能遵循函數(shù)庫(kù)的規(guī)則,需要清晰的預(yù)定義函數(shù)命名。清晰的函數(shù)名,能讓各API之間建立良好的功能連接,最終生成高質(zhì)量的回答。

最終,在設(shè)計(jì)好庫(kù)和API后,用戶給ChatGPT編寫了一個(gè)文本提示(prompt),描述目標(biāo)任務(wù),并明確說(shuō)明函數(shù)庫(kù)中哪些函數(shù)可用,就可以控制機(jī)器人去執(zhí)行任務(wù)。

(機(jī)器人與人類自然語(yǔ)言交互 圖源:開(kāi)源證券)

ChatGPT的利好,還在持續(xù)進(jìn)行中:一個(gè)具體案例是,近日已經(jīng)有開(kāi)發(fā)人員將GPT-4與目標(biāo)檢測(cè)網(wǎng)絡(luò)結(jié)合,實(shí)時(shí)捕獲攝像頭中的物體進(jìn)行分析并執(zhí)行人類指令。

(向GPT-4提問(wèn)攝像頭中的信息 圖源:杳杳寒山道)

這也就意味著,人形機(jī)器人的心智很快要脫離稚嫩,“成年人”的戰(zhàn)爭(zhēng),只會(huì)更加激烈。

那么,誰(shuí)會(huì)先碰掉那條終點(diǎn)的紅線?整機(jī)集成能力、運(yùn)動(dòng)控制算法軟件開(kāi)發(fā)能力(下文簡(jiǎn)稱控制能力)、AI布局是三大參考標(biāo)尺。

以特斯拉為代表的車企跨界選手,在AI布局上,有著天然優(yōu)勢(shì):

特斯拉FSD視覺(jué)感知算法可以在機(jī)器人上復(fù)用,并以智駕領(lǐng)域積累的Know-How進(jìn)行賦能,同時(shí)還有FSD V12、Dojo超算落地,這將大幅提升AI訓(xùn)練速度;

同時(shí),自有工廠創(chuàng)造應(yīng)用場(chǎng)景,以機(jī)器學(xué)習(xí)+大量數(shù)據(jù)的方式,在真實(shí)的場(chǎng)景不斷訓(xùn)練-優(yōu)化機(jī)器人。

除此之外,在供應(yīng)鏈上,特斯拉有著充足話語(yǔ)權(quán)。據(jù)開(kāi)源證券表示,特斯拉機(jī)器人軸承、齒輪箱、滾珠絲杠、電機(jī)等部件可直接復(fù)用特斯拉汽車成熟的供應(yīng)鏈。

這是因?yàn)椋?/strong>特斯拉機(jī)器人關(guān)節(jié)執(zhí)行器采用的零部件種類和現(xiàn)有的工業(yè)機(jī)器人基本一致,同時(shí),由于沒(méi)有像工業(yè)機(jī)器人一樣對(duì)實(shí)現(xiàn)高速運(yùn)動(dòng)的要求,還一定程度上降低了生產(chǎn)難度。

換言之,特斯拉只需根據(jù)人形機(jī)器人的特點(diǎn)對(duì)零部件進(jìn)行調(diào)整修改就可以進(jìn)行標(biāo)準(zhǔn)化的大批量生產(chǎn)。

以優(yōu)必癬傅利葉為代表的原生賽道選手,在整機(jī)集成能力、控制能力上把握更多的“Know-How”,而在AI布局上,略有欠缺,現(xiàn)階段也在努力查漏補(bǔ)缺:

優(yōu)必選透露,其已經(jīng)嘗試在人形機(jī)器人上導(dǎo)入具身多模態(tài)語(yǔ)言大模型提升語(yǔ)音交互,靈巧自主操作,足式機(jī)器人環(huán)境認(rèn)知學(xué)習(xí)與自主導(dǎo)航能力。

傅利葉創(chuàng)始人顧捷表示,其正在與高;蛘咂渌 AI 團(tuán)隊(duì)深度合作,構(gòu)建商業(yè)化智能 AI 大模型的能力;

跨界選手追覓,在控制能力上積累了不少導(dǎo)航模塊的經(jīng)驗(yàn):據(jù)其透露,其在運(yùn)控算法、導(dǎo)航算法、視覺(jué)與AI算法等方面有著持續(xù)儲(chǔ)備優(yōu)勢(shì)。

當(dāng)ChatGPT強(qiáng)勢(shì)入局之后,人形機(jī)器人將邁入成年人的賽道。

成年“人”的世界,無(wú)疑會(huì)更加激烈:在整機(jī)集成能力、控制能力、AI能力這三大維度上,大家各有優(yōu)勢(shì),沒(méi)有誰(shuí)是絕對(duì)的贏家。但,成年人也更懂如何合力,如以上企業(yè)所做的,聯(lián)合多方力量,奔赴云和月。

至于還有幾千里,得看大模型們能否將“大腦”訓(xùn)練明白,滿足人們對(duì)人形機(jī)器人最基礎(chǔ)的要求:其既是博士生,能進(jìn)行日常、專業(yè)的對(duì)話,也是“跑腿”的,能完美馴服四肢,拿快遞掃地倒垃圾

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港