展會信息港展會大全

Coatue重磅報告解讀:空間大模型與通用機器人
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-07-19 15:55:25   瀏覽:7610次  

導(dǎo)讀:文|AlphaEngineer,作者|費斌杰 全球頂級對沖基金Coatue近日發(fā)布了一篇關(guān)于具身智能的重磅報告,題為《The Path to General-Purpose Robots》。 Coatue認為,AI機器人是一股顛覆性的力量,有望成為人類歷史上最大的科技浪潮之一,值得高度重視。 這篇報告亮...

文|AlphaEngineer,作者|費斌杰

全球頂級對沖基金Coatue近日發(fā)布了一篇關(guān)于“具身智能”的重磅報告,題為《The Path to General-Purpose Robots》。

Coatue認為,AI機器人是一股顛覆性的力量,有望成為人類歷史上最大的科技浪潮之一,值得高度重視。

這篇報告亮點很多,不僅細致分析了現(xiàn)階段AI機器人面臨的挑戰(zhàn),同時也對行業(yè)發(fā)展做出了合理展望,從投資的角度給出了專業(yè)意見。無論你是科技投資人、AI從業(yè)者、還是對機器人感興趣的朋友,都值得一讀。

下面我給大家解讀一下這篇大報告。

理想很豐滿,現(xiàn)實很骨感

機器人行業(yè)也許是Demo與現(xiàn)實差距最大的行業(yè)之一。

Demo視頻中是這樣的:

現(xiàn)實則是另一種畫風(fēng):

1961年,第一臺工業(yè)機器人誕生于GM,用于汽車生產(chǎn)流水線。

經(jīng)過50多年的發(fā)展,機器人的形態(tài)變得越來越多樣,功能場景也豐富了起來,有掃地機器人、四足機器人、人型機器人等。

縱觀歷史,機器人滲透率其實是線性提升的。

以工業(yè)機器人為例,每萬名制造業(yè)員工對應(yīng)機器人的數(shù)量從2013年的53臺增長到2022年的151臺,CAGR達到12%。

雖然機器人行業(yè)整體發(fā)展穩(wěn)中向好,但是具體公司的的表現(xiàn)并不盡如人意。

機器人公司普遍存在商業(yè)化困難的問題,加之前期資本開支巨大,22-23年大量機器人公司破產(chǎn)倒閉。

空間智能,讓通用機器人成為可能

上一代機器人更多是執(zhí)行某些單一任務(wù)的,比如掃地機器人只負責(zé)掃地,農(nóng)業(yè)無人機只負責(zé)灌溉農(nóng)田,工業(yè)機器人只負責(zé)機械焊接等。

但是隨著AI泛化智能的涌現(xiàn),下一代機器人有望成為“通用機器人”,勝任各式各樣的任務(wù)與環(huán)境。

正如大語言模型讓語言推理成為現(xiàn)實,空間大模型有望打破第四面墻,讓AI真正理解物理世界,從而與之交互。

機器人面臨的核心挑戰(zhàn):缺乏訓(xùn)練數(shù)據(jù)

對人類來說很簡單的任務(wù),對機器人來說可能并不容易。

Coatue舉了三個具體例子。

靈巧性:

空間感知能力:

平衡恢復(fù)能力:

為了克服這些問題,需要用海量數(shù)據(jù)進行訓(xùn)練,使機器人變得更加智能。

但是機器人是一個非常新的領(lǐng)域,嚴重缺乏訓(xùn)練數(shù)據(jù)的積累。

對比不同模態(tài)下的最大數(shù)據(jù)集,文本模態(tài)約15T tokens,圖片模態(tài)有6B圖文配對數(shù)據(jù),視頻模態(tài)有2.6B視聽特征數(shù)據(jù)。

然而機器人模態(tài)只有240萬個數(shù)據(jù)片段,相比其他模態(tài)而言,數(shù)據(jù)積累遠遠不夠。

機器人訓(xùn)練數(shù)據(jù)的四種采集方式

既然數(shù)據(jù)是機器人發(fā)展的核心瓶頸,那么有什么方法可以快速積累機器人訓(xùn)練數(shù)據(jù)呢?

近年來,這方面的研究層出不窮,逐漸形成了四種流派。

機器人數(shù)據(jù)采集方法1:遠程操作(Teleoperation)

顧名思義,由實驗人員操作機械手柄,遠程控制機器人做出相同動作,以此來積累數(shù)據(jù)。

機器人數(shù)據(jù)采集方法2:AR

在一項名為《Explainable Human-Robot Training and Cooperation with Augmented Reality》的研究中,研究人員通過AR(增強現(xiàn)實)技術(shù)讓人機交互過程具備更強的可解釋性,從而進行數(shù)據(jù)積累。

機器人數(shù)據(jù)采集方法3:仿真

通過海量算力進行模擬運算,計算得出海量機器人訓(xùn)練數(shù)據(jù)集。

仿真可能是目前最有可能做到規(guī);瘮(shù)據(jù)生成的路徑,背后需要巨大的算力支持。

目前Nvidia的Jim Fan團隊采取的就是這條技術(shù)路徑。

機器人數(shù)據(jù)采集方法4:視頻學(xué)習(xí)

通過多模態(tài)大模型,直接讓機器人通過視頻學(xué)習(xí)人類動作,從而積累訓(xùn)練數(shù)據(jù)。

機器人成本與人類工資的黃金交叉

隨著GPU成本的下降,大模型訓(xùn)練的成本大幅降低。

過去一年中,Azure云平臺上的A100顯卡租賃價格從6美金/小時下降到1.5美金/小時,降幅達到75%。

硬件成本同樣在快速降低,20年L3 LiDAR傳感器的成本在7400美金左右,現(xiàn)在已經(jīng)腰斬到3200美金。

機器人成本不斷下降的同時,人類的薪酬水平卻在穩(wěn)步提升。

可以想見,在不久的將來,二者終將迎來金叉。

Coatue認為26-27年人型機器人的成本就會降低到人類平均薪酬以下,這無疑會對全球勞動力市場造成重大沖擊。

硅基生命進化進行時:更快的速度,更高的靈巧性

作為硅基生命的代表,機器人在很多場合的能力表現(xiàn)已經(jīng)超過了人類。

比如宇樹的H1機器人行走速度達到3.3米/秒,而人類平均行走速度只有1.42米/秒。

除了行走速度之外,機器人動作的靈巧性也在快速提升。

馬斯克表示,今年新的Optimus機器人將有22個自由度。

隨著大量AI機器人公司的涌現(xiàn),硅基生命的進化速度會越來越快。

類比無人駕駛,L4人型機器人即將到來

在自主性方面,人型機器人與無人駕駛汽車類似,可以分為L1到L5。

無人駕駛汽車從L1到L2花了大約20年,而從L2到現(xiàn)在的L4只用了不到10年。

人型機器人從L1到L2用了大約50年,從L2到L4預(yù)計只需要不到5年。

機器人的“ChatGPT時刻”即將到來?

大模型發(fā)展如火如荼,大家都在期待著機器人領(lǐng)域迎來自己的“ChatGPT時刻”。

縱觀過去20年,真正稱得上科技領(lǐng)域的“WOW!時刻”的只有三次,分別是07年的iPhone、22年的ChatGPT、以及24年的無人駕駛。

這些“WOW!時刻”有著一些共同特征。

首先,它們都在day 1帶來了激動人心的use case,并通過口耳相傳形成病毒式傳播。

其次,應(yīng)用成本達到拐點,使得技術(shù)能夠向市場大眾普及,構(gòu)成正向的商業(yè)模型。

第三,開發(fā)者社區(qū)增長迅猛,圍繞核心技術(shù)及產(chǎn)品形成商業(yè)生態(tài)。

Coatue預(yù)測,機器人并不會迎來所謂的“ChatGPT時刻”,因為它尚不具備以上幾點特征。

相反,Coatue認為機器人的普及,會經(jīng)歷由淺入深的三個階段,走出一條獨特的發(fā)展路徑。

第一階段:Seeing,人們通過電影、小說等媒介對機器人形成初步模糊的了解。

第二階段:Experiencing,指消費者直接享受機器人提供的服務(wù),而非自己擁有機器人,類似B2B2C的模式。比如你在咖啡廳享用一杯機器人拉花的咖啡,就屬于這個階段。

第三階段:Owning,即每個用戶自己擁有一臺或多臺機器人。

Coatue還預(yù)測了人型機器人能力的成長曲線。

對于家庭人型機器人,能力成長路徑依次為:掃地->做飯 -> 管家-> 保姆。

對于戶外人型機器人,應(yīng)用場景成長路徑依次為:倉庫 -> 門店 -> 消防-> 手術(shù)。

投融資火熱,機器人生態(tài)漸成

隨著奇點的不斷逼近,AI機器人公司的投融資越來越火熱。

圍繞AI機器人,一個完整的生態(tài)圈正在形成,包括機器人開發(fā)工具、機器人訓(xùn)練數(shù)據(jù)集、機器人運維、空間大模型、機器人生產(chǎn)制造等。

Wintel,還是圍墻花園?

類似PC時代,AI機器人正在形成Wintel-like以及Walled Garden這兩種典型的商業(yè)模式。

Neuralink的腦機接口、SpaceX的衛(wèi)星通信、Tesla的無人駕駛、xAI的大語言模型、Optimus的人型機器人,馬斯克的這盤大棋正在逐漸浮出水面,越來越清晰。

作為AI時代極少數(shù)擁有機器人全棧能力的公司,Optimus的發(fā)展值得期待。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港