本文來源:時代周報 作者:郭美婷
人形機器人火了。
今年人工智能大會,以特斯拉的二代人形機器人Optimus為代表,宇樹科技、傅利葉、達闥、樂聚、開普勒、天鏈等十數(shù)家人形機器人廠商均展出了自家的“得意之作”,狠狠秀了一輪“肌肉”。
雖然有機構(gòu)預測,今年會成為人形機器人的量產(chǎn)元年。但達闥機器人(下稱“達闥”)副總裁、廣州公司總經(jīng)理王恩璽在接受時代周報記者專訪時卻表示,目前“量產(chǎn)”只是一個噱頭。人形機器人僅僅被造出來了,但還沒到能解具體決問題的階段。
而且他表示,在商業(yè)化落地過程中,人形機器人的價格也是廠商們需要考慮的一大問題。
達闥是人形機器人行業(yè)的頭部公司之一,在2019年B輪融資后躋身為獨角獸企業(yè)。在WAIC 2024會場,時代周報記者對達闥副總裁王恩璽進行了專訪,對人形機器人的商業(yè)化進展和落地難題等相關(guān)問題進行探討。
王恩璽。圖源:受訪者供圖
為什么非“人形”不可?
時代周報:機器人并不是一個新鮮的概念。在很久之前,工廠中就利用機械臂完成重復單一的任務。為何我們還要發(fā)展人形機器人?
王恩璽:
機器人的概念確實存在很長時間了。從整個機器人的分類來看,大概包括工業(yè)機器人、服務機器人和特種機器人。某些機器人是為特定場景而服務的,如工業(yè)機械臂、爬蟲機器人、清潔機器人等。
但是,人類創(chuàng)造機器人的最終目標,是為了將人類從骯臟、復雜、繁瑣的功能中解脫出來,最直接的方法就是能完全代替這個人,首先外形設計要像人。在人類的生產(chǎn)生活中,各種工具的發(fā)明、流程的制定都是以人為核心的,當你使用一個人形機器人去替代人的時候,它對周圍環(huán)境的影響是最小的,也無需對現(xiàn)有的生產(chǎn)場景和工具做出較大變動。
另一方面,從新物種的角度來看,人類對特異的物種有天生的排斥感。那么當人形機器人未來應用于居家、服務、養(yǎng)老行業(yè),從而進入到千家萬戶,人類一定更能接受和自己外形相似的機器人一起生活。如果機器人長著三條手臂,即使技術(shù)上不存在問題,工作起來也更高效,但人類可能還是很難接受該物種。
時代周報:目前,有哪些場景比較適合人形機器人應用?
王恩璽:
對此問題,業(yè)內(nèi)如今其實有一定共識。2023年11月,工業(yè)和信息化部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,里面提到了兩類場景。一類是面向民爆、救援等等特殊環(huán)境,強化人形機器人本體安全防護能力、復雜任務智慧生成與高精度操作能力,降低作業(yè)人員危險性。
另一類場景是聚焦3C、汽車等制造業(yè)重點領(lǐng)域,打造人形機器人示范產(chǎn)線和工廠。這也是為何如今汽車制造變成了人形機器人行業(yè)較為重要的發(fā)力點,汽車的整個生產(chǎn)制造流程較為清晰,也相對容易定義出哪些可替代人類工作的場景。當企業(yè)把汽車制造“玩”明白后,下一步就可以做3C了。
例如去年比亞迪就投資人形機器人公司智元機器人,上汽在今年同樣投資了該公司;去年小米、優(yōu)必選等成立北京人形機器人創(chuàng)新中心;我們達闥也正在和廣汽談合作。
而當人形機器人ToB場景打磨成熟后,就能夠逐步進入到家庭,服務居家養(yǎng)老,技術(shù)是一步步演進的。
圖源:時代周報記者攝
大模型如何上機?
時代周報:這屆人工智能大會,“大模型+機器人”對機器人泛化能力的提升是大家較為關(guān)注的熱點。達闥的人形機器人上是否也搭載了大模型?是如何部署的?
王恩璽:
達闥成立之初就是從云端大腦開發(fā)起的,我們認為機器人的算力、智力一定是運行在云端,配合5G低延遲的網(wǎng)絡。大模型出現(xiàn)之前,2017年我們利用多模態(tài)算法,訓練人形機器人的視覺、語音、動作和運動。大模型出現(xiàn)后,我們就基于原有算法技術(shù)的積累做了針對性的模型微調(diào)和優(yōu)化,并通過我們自己的機器人收集的各類型數(shù)據(jù)做了大量訓練,在2023年發(fā)布了RobotGPT。
我認為人形機器人想在復雜的場景完成任務的話,光靠端側(cè)的算力是不夠的。雖然如今部分設備如手機、PC等,能夠植入經(jīng)過充分訓練后的、參數(shù)較小的模型,并在端側(cè)做推理。但是當面臨復雜的場景或如居家服務中的開放性場景,人形機器人需要很泛化的能力,光靠端側(cè)大模型的能力是不足的,需要云端大腦來支撐訓練和推理。
時代周報:但是,當人形機器人居家使用時候,將家庭私人的數(shù)據(jù)上傳到云端,是否會存在隱私泄露的問題?
王恩璽:
數(shù)據(jù)安全是一個永恒的話題。保證數(shù)據(jù)安全的方法通常有兩種,一是通過各種先進技術(shù)保證數(shù)據(jù)不被竊取和泄露。當然,在這方面有時存在“道高一尺魔高一丈”的情況,沒有什么技術(shù)是永遠奏效的。所以我認為數(shù)據(jù)安全不完全是一個技術(shù)問題,而是一個管理問題。
二是建立保障或信任機制。我們的策略是跟運營商合作,將云端大腦部署在運營商,如中國移動的云平臺上,通過國企背書來確保數(shù)據(jù)隱私安全。
未來,我們設計的商業(yè)模式是通過運營商的渠道向每個家庭租賃人形機器人,就好比每家使用機頂盒上網(wǎng),一千兆寬帶每月200塊錢,未來可能租賃一臺人形機器人每月花1500-3000元。機器人收集的數(shù)據(jù)將保存在運營商的云平臺上,就如同手機電話數(shù)據(jù)存儲在運營商的數(shù)據(jù)庫中。
“量產(chǎn)”還是一個噱頭
時代周報:有機構(gòu)預測,今年會成為人形機器人的量產(chǎn)元年,你同意這種看法嗎?
王恩璽:
對于“量產(chǎn)”這個詞我是有疑義的。量產(chǎn)的前提是,一個產(chǎn)品有非常具體的使用場景,能夠解決該場景下的問題,而且有非常明確的產(chǎn)品功能說明書,這和我們購買任何一件消費類產(chǎn)品是一致的。這個時候的量產(chǎn)才是有意義的。
那么現(xiàn)在人形機器人所謂的“量產(chǎn)”,我認為只是聲明人形機器人被造出來了。人形機器人還沒有到具體能解決什么問題的階段,例如在ToB場景下,是否能在生產(chǎn)線幫忙擰螺絲、打膠、搬東西等,都沒有明確。所以我認為現(xiàn)在談“量產(chǎn)”,還只是一個噱頭。
包括從這次人工智能大會會場,你會看到大家比拼的不是人形機器人在哪個場景做了什么工作,從端到端實現(xiàn)場景閉環(huán)等,而是展示機器人能走路,能揮手等功能,這是人形機器人的基本功能要求。從原型機的推出,到具體能解決什么場景問題,是目前整個業(yè)界都在努力攻破的。
時代周報:現(xiàn)在人形機器人的發(fā)展還存在哪些技術(shù)難點?
王恩璽:
硬件上,人形機器人關(guān)節(jié)的發(fā)展,架構(gòu)設計,是否更加靈活,能夠?qū)崿F(xiàn)抓娶翻轉(zhuǎn)等類人的更精準的操作等,這是在運動控制領(lǐng)域需要持續(xù)迭代的。
另外一個難點體現(xiàn)在利用大模型技術(shù)對人形機器人做各種場景的訓練。自大模型技術(shù)出現(xiàn)后,人形機器人在某些場景下能夠做出的動作已經(jīng)超出了原有的訓練模式。例如通過視頻學習、人工示教、強化學習等,能夠讓機器人快速掌握在該場景下應該做出的動作,并且泛化到其他場景,這就是大模型所具備的優(yōu)勢,大模型的發(fā)展與人形機器人息息相關(guān)。
其實,我更傾向于認為人形機器人的發(fā)展沒有卡脖子的技術(shù),沒有不可攻克的難題,但它需要時間迭代,變得更加成熟、更加精細、也更加精準。
時代周報:價格高昂也是人形機器人實現(xiàn)商業(yè)化落地的阻礙之一。能否舉例說明,怎樣定價一臺人形機器人才能使其更具購買力?
王恩璽:
我跟一些汽車制造廠商交流過,如果人形機器人真的能替代人工,他們希望產(chǎn)品的定價最高限制不超過20萬。因為現(xiàn)在生產(chǎn)線上的工人的工資大概在8000-1萬左右,一年開支大概是10-15萬塊錢,人形機器人不知疲憊,可以24小時持續(xù)干活,所以價格可以稍高,但超過20萬也不劃算了。
但如今人形機器人的造價基本上是百萬級別的。這是因為目前人形機器人的造價還沒有考慮到未來銷量。公司們剛剛把人形機器人造出來,更多考慮其功能的實現(xiàn),還沒開始重視成本的優(yōu)化。如果對銷量沒有合理預期的話,就無法從供應鏈的維度降低成本。
時代周報:從商業(yè)邏輯來看,你認為人形機器人企業(yè)如何能加速商業(yè)化落地的進程?
王恩璽:
現(xiàn)在人形機器人需要更多場景開放去推進其發(fā)展。市場上對人形機器人的使用是持開放態(tài)度的,無論是老齡化社會的到來,還是制造業(yè)降低成本的需求催化下,社會對于人形機器人的期望值很高。
對于人形機器人公司而言,目前最大的成本是時間成本。因為打開和解決一個具體場景的問題,需要研發(fā)、測試,迭代等反復過程,如果企業(yè)無法在短時間內(nèi)找到落地場景,可能會導致其生存都難以為繼。
現(xiàn)在整個產(chǎn)業(yè)界也在爭先恐后、優(yōu)勝劣汰的賽馬進程中。我特別認同馬斯克的一句話:創(chuàng)新的速度比創(chuàng)新更重要。