展會信息港展會大全

AI會讓機器人更聰明嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-07 18:12:44   瀏覽:8868次  

導(dǎo)讀:AI和機器人的關(guān)系一直是個絕妙的話題,具身AI實際上一直是人工智能領(lǐng)域研究的前沿方向之一,它的終極目標(biāo)就是創(chuàng)造一個像人一樣的機器人。 這一愿景的終極實現(xiàn)或許還要花費很久時間,然而從去年開始,生成式AI的突破進(jìn)展讓人們看到了機器人進(jìn)化的新方向。 當(dāng)...

AI和機器人的關(guān)系一直是個絕妙的話題,具身AI實際上一直是人工智能領(lǐng)域研究的前沿方向之一,它的終極目標(biāo)就是創(chuàng)造一個像人一樣的機器人。

這一愿景的終極實現(xiàn)或許還要花費很久時間,然而從去年開始,生成式AI的突破進(jìn)展讓人們看到了機器人進(jìn)化的新方向。

當(dāng)大模型能力與機器人場景結(jié)合起來會發(fā)生什么?我們離人工智能機器人的未來有多遠(yuǎn)?

撇開浪漫的想象,想要切實回答這些問題,我們需要與機器人領(lǐng)域真正一線的從業(yè)者們進(jìn)行深度對話與交流。

這正是品玩未來科技力聯(lián)合頭部投資機構(gòu)險峰K2VC共同舉辦以《AI浪潮下機器人領(lǐng)域的新機遇》為題的國內(nèi)大模型產(chǎn)業(yè)生態(tài)研討沙龍的原因。

我們邀請到國內(nèi)工業(yè)機器人領(lǐng)域的頭部參與者、一線投資專家和學(xué)界領(lǐng)軍,一起分析、探討和拆解關(guān)于人工智能羅曼蒂克愿景背后的具體問題:AI對機器人進(jìn)化有什么推動作用?我們目前處于機器人發(fā)展的什么階段?機器人大模型訓(xùn)練數(shù)據(jù)該如何收集?大模型對人機交互的改變是什么?

以及最關(guān)鍵的,我們距離更智能的機器人還有多遠(yuǎn),這中間還需要克服什么樣的困難呢?

下面是這些關(guān)鍵決策人們的回答。

楊健勃|可以科技創(chuàng)始人&CEO

當(dāng)整個情感交互模型轉(zhuǎn)到深度學(xué)習(xí)的時候,就可以做到從10秒為周期的交互模態(tài)轉(zhuǎn)到百毫秒級的交互機制。

云端會有情感交互大模型,但是在邊緣端,目前還沒有專門針對transfomer芯片產(chǎn)生。

楊健勃分享了可以科技出品的名為Loona的智能陪伴機器人,或者叫智能小寵物。它里面已經(jīng)蘊含了基于深度學(xué)習(xí)的情感交互模型,機器人某種程度上可以自主決策,自主推理出目前要表達(dá)的動作、效果,以及和用戶的互動反饋,模型中包含了近400種不同的語音指令,互動的動作和表達(dá)則有近1500種,幾乎可以感知人所有模態(tài)的交互。

但由于在邊緣側(cè)尚未出現(xiàn)可以高效運行大模型的芯片,目前的技術(shù)方案是通過實體機器人收集多模態(tài)人機雙向主動交互的數(shù)據(jù),然后在云端訓(xùn)練機器人交互模型,在未來,楊健勃希望可以把這種基于大模型的智能決策推廣到用戶側(cè)的使用過程中。

邵天蘭|梅卡曼德創(chuàng)始人&CEO

現(xiàn)在還處于早期技術(shù)探索期,技術(shù)路線還沒有開始收斂。

大模型最重要的能力是根據(jù)常識處理異常,高層次抽象任務(wù)和主動感知。

梅卡曼德成立六年,已經(jīng)是國內(nèi)首屈一指的工業(yè)機器人解決方案提供商,邵天蘭在分享中給出了幾個自己的判斷。首先是目前大模型還處于技術(shù)探索期,它的路線還沒有開始收斂。無論是算法、算力還是數(shù)據(jù),本身都還在快速的發(fā)展過程中。

邵天蘭舉了個例子,2012年時一個5億參數(shù)的模型就非常大了,需要跑半個小時,而現(xiàn)在標(biāo)準(zhǔn)的CPU可以用不到一秒的時間完成。過去五年,3D視覺、AI、算力和傳感器都有非?焖俚陌l(fā)展,5年前看今天做的東西就好像科幻一樣。邵天蘭認(rèn)為技術(shù)帶來的確定性是非常強的,很多人會高估1年后的發(fā)展水平,但卻低估5年后的。“一年內(nèi)帶來的改變沒有什么確定性可言,但五年就有很強的確定性了,在十年的尺度上看,技術(shù)確定性幾乎是顯而易見的。”

其次,機器人和AI結(jié)合的成功產(chǎn)品形態(tài)還沒有出現(xiàn),但可能也就會在近幾年內(nèi)出現(xiàn)。機器人將能處理更復(fù)雜、更模糊的任務(wù),大模型會在機器人過去能力的基礎(chǔ)上解決更多的問題,這不是一個互相替代,而是互相補充,進(jìn)一步全面擴展能力的過程。

第三,泛自動化領(lǐng)域還有非常大的空間,但用戶的需求是非標(biāo)準(zhǔn)化的,這意味著機器人需要具有高柔性。大模型引領(lǐng)著這種技術(shù)方向。

最后,大模型是非常重大的機會,但它要求的研發(fā)鏈條和資金量是非常巨大的,和過去的創(chuàng)業(yè)將不再相同。

弭寶瞳|北京矩視智能科技有限公司CEO

在工業(yè)視覺領(lǐng)域,由于對準(zhǔn)確度要求非常苛刻,所以基于目前大模型的準(zhǔn)確度,還無法實現(xiàn)端到端的識別,但大模型已經(jīng)可以作用在開發(fā)小模型的各個環(huán)節(jié)里,極大降低了模型開發(fā)成本,比如基于Diffusion的樣本生成,降低收集樣本的成本,基于prompt的輔助標(biāo)注,降低圖像標(biāo)注成本。

弭寶瞳認(rèn)為大模型在工業(yè)視覺領(lǐng)域最終的落地是成為一款非常簡單的工具直接面對開發(fā)端、面向開發(fā)者,讓所有人可以非常方便地開發(fā)各自行業(yè)里的小應(yīng)用。這將對整個行業(yè)有顛覆性作用。

另外從數(shù)據(jù)層面,中國的工業(yè)產(chǎn)業(yè)鏈積累也為大模型在中國的落地發(fā)展提供了有利支撐。占據(jù)全球制造三分之一的中國工業(yè)擁有著完備全產(chǎn)業(yè)鏈條,有各種場景和環(huán)境為大模型提供訓(xùn)練所有的大數(shù)據(jù)。

圓桌金句

大模型通用泛化能力對機器人能力帶來什么影響?

李宇浩|麥巖智能創(chuàng)始人&CEO

我感覺至少5年內(nèi)還是很難出現(xiàn)大規(guī)模的人形機器人的產(chǎn)品形態(tài)應(yīng)用。但大模型真的是在我們非常絕望,根本找不到方法的時候突然出現(xiàn)的,以GPT為代表的新的AI浪潮必定會對機器人產(chǎn)生革命性的推動。

曾祥永|云跡科技 AI 技術(shù)負(fù)責(zé)人

機器人要結(jié)合大模型,首先要融入到這個行業(yè)的垂直大模型中。

謝思為|BV百度風(fēng)投投資人

我相信大模型+機器人有可能誕生通用的機器人范式。

董 豪|北京大學(xué)助理教授、研究員

我個人感覺,通用機器人的出現(xiàn)會在自動駕駛完全普及之后,因為它的技術(shù)路線是相通的。

大模型會對機器人與人的交互方式產(chǎn)生什么樣的影響?

許華|史河機器人創(chuàng)始人& CEO

我們做的清潔機器人場景還是比較特殊的,它主要針對船舶和樓宇。因為樓、船有復(fù)雜結(jié)構(gòu),短期看不到機器人全自主作業(yè)的可能。目前看最適合的交互方式是遙控器,未來可能會是AR+手勢控制。

李宇浩|麥巖智能創(chuàng)始人&CEO

在結(jié)構(gòu)化交互到完全非結(jié)構(gòu)化自然語言交互中間有一個基于場景的自然語言交互,其實這跟理想汽車學(xué)的,智艙環(huán)境下理想已經(jīng)能夠提供一個非常接近準(zhǔn)自然語言的交互了。

謝思為|BV百度風(fēng)投投資人

我認(rèn)為有兩個分類:一類是跟人交互,另外一類是跟環(huán)境交互。前者比如小度機器人,比如基于情感需求的配料等。而跟環(huán)境的交互還是會落地到不同的場景中去。

董 豪|北京大學(xué)助理教授、研究員

從我看來,交互方式越簡單越好,最好是沒有交互,直接實現(xiàn)意圖識別。

機器人領(lǐng)域數(shù)據(jù)收集難、生成難,如何更好地讓數(shù)據(jù)服務(wù)與AI?

董 豪|北京大學(xué)助理教授、研究員

數(shù)據(jù)采集成本很高,而且往往有局限性。換一個型號的機器人,數(shù)據(jù)可能都不能用了。

目前學(xué)術(shù)界認(rèn)為最直接的方法是先利用虛擬環(huán)境讓模型學(xué)一個策略,然后用虛擬環(huán)境中學(xué)到的成功策略繼續(xù)在真實環(huán)境里訓(xùn)練。

這樣數(shù)據(jù)采集流程的ROI會特別好,因為不用人工采集,整套過程是機器人自己完成的,而虛擬環(huán)境的背景、物體材質(zhì)形狀都可以隨便生成,成本很低。

許華|史河機器人創(chuàng)始人& CEO

我覺得數(shù)據(jù)分幾塊,包括環(huán)境數(shù)據(jù),機器人的運動數(shù)據(jù),還有作業(yè)對象的數(shù)據(jù)。董老師說在仿真環(huán)境中先自主產(chǎn)生大量數(shù)據(jù),利用這些數(shù)據(jù)做監(jiān)督式的學(xué)習(xí),這樣數(shù)據(jù)來源就變得非常簡單了。

前段靠仿真,中段靠人的干預(yù)來評估和修正,這樣能在保證ROI的基礎(chǔ)上充分采集和利用好數(shù)據(jù)。

大模型會給機器人帶來什么樣的問題?

許華|史河機器人創(chuàng)始人& CEO

邊緣計算最后一定是通過小模型實現(xiàn),因為大模型的響應(yīng)延遲太長。至于安全性方面的問題,我們會采取最簡單、最可靠的機械或電氣等方式來保證,而不會依賴于算法。

李宇浩|麥巖智能創(chuàng)始人&CEO

大模型部署在端側(cè)這在3年內(nèi)不可能的,現(xiàn)在大家都是端+云的模式,這樣就會有一個信號的問題,丟了信號就變成只有端側(cè)智能的產(chǎn)品了,哪怕是信號延遲也會嚴(yán)重影響產(chǎn)品體驗。

曾祥永|云跡科技 AI 技術(shù)負(fù)責(zé)人

一致性問題非常重要,在我們商用場景一定強調(diào)的是輸出的準(zhǔn)確性、一致性,不能脫離預(yù)期生成很隨意的答案。

數(shù)據(jù)安全也非常重要,我的數(shù)據(jù)是不是都要上到云上大模型上?上去之后數(shù)據(jù)安全嗎?我們最近考慮基于開源中小模型,疊加行業(yè)數(shù)據(jù),打造我們自己的垂直領(lǐng)域模型。

董 豪|北京大學(xué)助理教授、研究員

如果把語言模型跟機器人做結(jié)合,對齊問題不解決的話是會出現(xiàn)很嚴(yán)重的后果的。

在自然語言大模型里現(xiàn)在就有人研究對齊問題,這是個研究熱點。但在機器人領(lǐng)域現(xiàn)在大家還沒有開始研究這塊。

大模型會讓機器人公司的競爭壁壘發(fā)生怎樣的變化?

謝思為|BV百度風(fēng)投投資人

相關(guān)公司的核心競爭力可能存在于在細(xì)分場景下,收集小模型和動作的數(shù)據(jù)庫的能力,長遠(yuǎn)來講,評估一家大模型+機器人公司的指標(biāo)之一就是看它是否具備突破新場景的能力。

董 豪|北京大學(xué)助理教授、研究員

從長遠(yuǎn)來看主要是技術(shù)通用性,如果從技術(shù)來看,一個好的技術(shù)應(yīng)該是可以適用于任何場景。

曾祥永|云跡科技 AI 技術(shù)負(fù)責(zé)人

如果進(jìn)入到RaaS(機器人即服務(wù))階段,那么就在兩個層面上存在壁壘。一個是把機器人本體做得穩(wěn)定、可靠、執(zhí)行成功率足夠高,成本也能做到充分控制。再一個是能夠真正做到規(guī);⻊(wù)。

許華|史河機器人創(chuàng)始人& CEO

除了做好產(chǎn)品研發(fā)的基本功、制造業(yè)的基本功、品牌營銷的基本功,還要建立好行業(yè)內(nèi)的場景、任務(wù)、工藝等數(shù)據(jù)壁壘,并基于這些數(shù)據(jù)搭建專用的小模型。這些數(shù)據(jù)可以幫助公司很好地建立門檻。

李宇浩|麥巖智能創(chuàng)始人&CEO

機器人公司一定要基于對垂直場景的深入理解。我認(rèn)為,絕大多數(shù)機器人的形態(tài)一定不會是人形。盡管通用人形機器人是個很好的生意。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港