AI會讓機器人更聰明嗎？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-07 18:12:44 瀏覽：8868次

導(dǎo)讀：AI和機器人的關(guān)系一直是個絕妙的話題，具身AI實際上一直是人工智能領(lǐng)域研究的前沿方向之一，它的終極目標(biāo)就是創(chuàng)造一個像人一樣的機器人。這一愿景的終極實現(xiàn)或許還要花費很久時間，然而從去年開始，生成式AI的突破進(jìn)展讓人們看到了機器人進(jìn)化的新方向。當(dāng)...

AI和機器人的關(guān)系一直是個絕妙的話題，具身AI實際上一直是人工智能領(lǐng)域研究的前沿方向之一，它的終極目標(biāo)就是創(chuàng)造一個像人一樣的機器人。

這一愿景的終極實現(xiàn)或許還要花費很久時間，然而從去年開始，生成式AI的突破進(jìn)展讓人們看到了機器人進(jìn)化的新方向。

當(dāng)大模型能力與機器人場景結(jié)合起來會發(fā)生什么？我們離人工智能機器人的未來有多遠(yuǎn)？

撇開浪漫的想象，想要切實回答這些問題，我們需要與機器人領(lǐng)域真正一線的從業(yè)者們進(jìn)行深度對話與交流。

這正是品玩未來科技力聯(lián)合頭部投資機構(gòu)險峰K2VC共同舉辦以《AI浪潮下機器人領(lǐng)域的新機遇》為題的國內(nèi)大模型產(chǎn)業(yè)生態(tài)研討沙龍的原因。

我們邀請到國內(nèi)工業(yè)機器人領(lǐng)域的頭部參與者、一線投資專家和學(xué)界領(lǐng)軍，一起分析、探討和拆解關(guān)于人工智能羅曼蒂克愿景背后的具體問題：AI對機器人進(jìn)化有什么推動作用？我們目前處于機器人發(fā)展的什么階段？機器人大模型訓(xùn)練數(shù)據(jù)該如何收集？大模型對人機交互的改變是什么？

以及最關(guān)鍵的，我們距離更智能的機器人還有多遠(yuǎn)，這中間還需要克服什么樣的困難呢？

下面是這些關(guān)鍵決策人們的回答。

楊健勃｜可以科技創(chuàng)始人&CEO

當(dāng)整個情感交互模型轉(zhuǎn)到深度學(xué)習(xí)的時候，就可以做到從10秒為周期的交互模態(tài)轉(zhuǎn)到百毫秒級的交互機制。

云端會有情感交互大模型，但是在邊緣端，目前還沒有專門針對transfomer芯片產(chǎn)生。

楊健勃分享了可以科技出品的名為Loona的智能陪伴機器人，或者叫智能小寵物。它里面已經(jīng)蘊含了基于深度學(xué)習(xí)的情感交互模型，機器人某種程度上可以自主決策，自主推理出目前要表達(dá)的動作、效果，以及和用戶的互動反饋，模型中包含了近400種不同的語音指令，互動的動作和表達(dá)則有近1500種，幾乎可以感知人所有模態(tài)的交互。

但由于在邊緣側(cè)尚未出現(xiàn)可以高效運行大模型的芯片，目前的技術(shù)方案是通過實體機器人收集多模態(tài)人機雙向主動交互的數(shù)據(jù)，然后在云端訓(xùn)練機器人交互模型，在未來，楊健勃希望可以把這種基于大模型的智能決策推廣到用戶側(cè)的使用過程中。

邵天蘭｜梅卡曼德創(chuàng)始人&CEO

現(xiàn)在還處于早期技術(shù)探索期，技術(shù)路線還沒有開始收斂。

大模型最重要的能力是根據(jù)常識處理異常，高層次抽象任務(wù)和主動感知。

梅卡曼德成立六年，已經(jīng)是國內(nèi)首屈一指的工業(yè)機器人解決方案提供商，邵天蘭在分享中給出了幾個自己的判斷。首先是目前大模型還處于技術(shù)探索期，它的路線還沒有開始收斂。無論是算法、算力還是數(shù)據(jù)，本身都還在快速的發(fā)展過程中。

邵天蘭舉了個例子，2012年時一個5億參數(shù)的模型就非常大了，需要跑半個小時，而現(xiàn)在標(biāo)準(zhǔn)的CPU可以用不到一秒的時間完成。過去五年，3D視覺、AI、算力和傳感器都有非�？焖俚陌l(fā)展，5年前看今天做的東西就好像科幻一樣。邵天蘭認(rèn)為技術(shù)帶來的確定性是非常強的，很多人會高估1年后的發(fā)展水平，但卻低估5年后的。“一年內(nèi)帶來的改變沒有什么確定性可言，但五年就有很強的確定性了，在十年的尺度上看，技術(shù)確定性幾乎是顯而易見的。”

其次，機器人和AI結(jié)合的成功產(chǎn)品形態(tài)還沒有出現(xiàn)，但可能也就會在近幾年內(nèi)出現(xiàn)。機器人將能處理更復(fù)雜、更模糊的任務(wù)，大模型會在機器人過去能力的基礎(chǔ)上解決更多的問題，這不是一個互相替代，而是互相補充，進(jìn)一步全面擴展能力的過程。

第三，泛自動化領(lǐng)域還有非常大的空間，但用戶的需求是非標(biāo)準(zhǔn)化的，這意味著機器人需要具有高柔性。大模型引領(lǐng)著這種技術(shù)方向。

最后，大模型是非常重大的機會，但它要求的研發(fā)鏈條和資金量是非常巨大的，和過去的創(chuàng)業(yè)將不再相同。

弭寶瞳｜北京矩視智能科技有限公司CEO

在工業(yè)視覺領(lǐng)域，由于對準(zhǔn)確度要求非常苛刻，所以基于目前大模型的準(zhǔn)確度，還無法實現(xiàn)端到端的識別，但大模型已經(jīng)可以作用在開發(fā)小模型的各個環(huán)節(jié)里，極大降低了模型開發(fā)成本，比如基于Diffusion的樣本生成，降低收集樣本的成本，基于prompt的輔助標(biāo)注，降低圖像標(biāo)注成本。

弭寶瞳認(rèn)為大模型在工業(yè)視覺領(lǐng)域最終的落地是成為一款非常簡單的工具直接面對開發(fā)端、面向開發(fā)者，讓所有人可以非常方便地開發(fā)各自行業(yè)里的小應(yīng)用。這將對整個行業(yè)有顛覆性作用。

另外從數(shù)據(jù)層面，中國的工業(yè)產(chǎn)業(yè)鏈積累也為大模型在中國的落地發(fā)展提供了有利支撐。占據(jù)全球制造三分之一的中國工業(yè)擁有著完備全產(chǎn)業(yè)鏈條，有各種場景和環(huán)境為大模型提供訓(xùn)練所有的大數(shù)據(jù)。

圓桌金句

大模型通用泛化能力對機器人能力帶來什么影響？

李宇浩｜麥巖智能創(chuàng)始人&CEO

我感覺至少5年內(nèi)還是很難出現(xiàn)大規(guī)模的人形機器人的產(chǎn)品形態(tài)應(yīng)用。但大模型真的是在我們非常絕望，根本找不到方法的時候突然出現(xiàn)的，以GPT為代表的新的AI浪潮必定會對機器人產(chǎn)生革命性的推動。

曾祥永｜云跡科技 AI 技術(shù)負(fù)責(zé)人

機器人要結(jié)合大模型，首先要融入到這個行業(yè)的垂直大模型中。

謝思為｜BV百度風(fēng)投投資人

我相信大模型+機器人有可能誕生通用的機器人范式。

董豪｜北京大學(xué)助理教授、研究員

我個人感覺，通用機器人的出現(xiàn)會在自動駕駛完全普及之后，因為它的技術(shù)路線是相通的。

大模型會對機器人與人的交互方式產(chǎn)生什么樣的影響？

許華｜史河機器人創(chuàng)始人& CEO

我們做的清潔機器人場景還是比較特殊的，它主要針對船舶和樓宇。因為樓、船有復(fù)雜結(jié)構(gòu)，短期看不到機器人全自主作業(yè)的可能。目前看最適合的交互方式是遙控器，未來可能會是AR+手勢控制。

李宇浩｜麥巖智能創(chuàng)始人&CEO

在結(jié)構(gòu)化交互到完全非結(jié)構(gòu)化自然語言交互中間有一個基于場景的自然語言交互，其實這跟理想汽車學(xué)的，智艙環(huán)境下理想已經(jīng)能夠提供一個非常接近準(zhǔn)自然語言的交互了。

謝思為｜BV百度風(fēng)投投資人

我認(rèn)為有兩個分類：一類是跟人交互，另外一類是跟環(huán)境交互。前者比如小度機器人，比如基于情感需求的配料等。而跟環(huán)境的交互還是會落地到不同的場景中去。

董豪｜北京大學(xué)助理教授、研究員

從我看來，交互方式越簡單越好，最好是沒有交互，直接實現(xiàn)意圖識別。

機器人領(lǐng)域數(shù)據(jù)收集難、生成難，如何更好地讓數(shù)據(jù)服務(wù)與AI？

董豪｜北京大學(xué)助理教授、研究員

數(shù)據(jù)采集成本很高，而且往往有局限性。換一個型號的機器人，數(shù)據(jù)可能都不能用了。

目前學(xué)術(shù)界認(rèn)為最直接的方法是先利用虛擬環(huán)境讓模型學(xué)一個策略，然后用虛擬環(huán)境中學(xué)到的成功策略繼續(xù)在真實環(huán)境里訓(xùn)練。

這樣數(shù)據(jù)采集流程的ROI會特別好，因為不用人工采集，整套過程是機器人自己完成的，而虛擬環(huán)境的背景、物體材質(zhì)形狀都可以隨便生成，成本很低。

許華｜史河機器人創(chuàng)始人& CEO

我覺得數(shù)據(jù)分幾塊，包括環(huán)境數(shù)據(jù)，機器人的運動數(shù)據(jù)，還有作業(yè)對象的數(shù)據(jù)。董老師說在仿真環(huán)境中先自主產(chǎn)生大量數(shù)據(jù)，利用這些數(shù)據(jù)做監(jiān)督式的學(xué)習(xí)，這樣數(shù)據(jù)來源就變得非常簡單了。

前段靠仿真，中段靠人的干預(yù)來評估和修正，這樣能在保證ROI的基礎(chǔ)上充分采集和利用好數(shù)據(jù)。

大模型會給機器人帶來什么樣的問題？

許華｜史河機器人創(chuàng)始人& CEO

邊緣計算最后一定是通過小模型實現(xiàn)，因為大模型的響應(yīng)延遲太長。至于安全性方面的問題，我們會采取最簡單、最可靠的機械或電氣等方式來保證，而不會依賴于算法。

李宇浩｜麥巖智能創(chuàng)始人&CEO

大模型部署在端側(cè)這在3年內(nèi)不可能的，現(xiàn)在大家都是端+云的模式，這樣就會有一個信號的問題，丟了信號就變成只有端側(cè)智能的產(chǎn)品了，哪怕是信號延遲也會嚴(yán)重影響產(chǎn)品體驗。

曾祥永｜云跡科技 AI 技術(shù)負(fù)責(zé)人

一致性問題非常重要，在我們商用場景一定強調(diào)的是輸出的準(zhǔn)確性、一致性，不能脫離預(yù)期生成很隨意的答案。

數(shù)據(jù)安全也非常重要，我的數(shù)據(jù)是不是都要上到云上大模型上？上去之后數(shù)據(jù)安全嗎？我們最近考慮基于開源中小模型，疊加行業(yè)數(shù)據(jù)，打造我們自己的垂直領(lǐng)域模型。

董豪｜北京大學(xué)助理教授、研究員

如果把語言模型跟機器人做結(jié)合，對齊問題不解決的話是會出現(xiàn)很嚴(yán)重的后果的。

在自然語言大模型里現(xiàn)在就有人研究對齊問題，這是個研究熱點。但在機器人領(lǐng)域現(xiàn)在大家還沒有開始研究這塊。

大模型會讓機器人公司的競爭壁壘發(fā)生怎樣的變化？

謝思為｜BV百度風(fēng)投投資人

相關(guān)公司的核心競爭力可能存在于在細(xì)分場景下，收集小模型和動作的數(shù)據(jù)庫的能力，長遠(yuǎn)來講，評估一家大模型+機器人公司的指標(biāo)之一就是看它是否具備突破新場景的能力。

董豪｜北京大學(xué)助理教授、研究員

從長遠(yuǎn)來看主要是技術(shù)通用性，如果從技術(shù)來看，一個好的技術(shù)應(yīng)該是可以適用于任何場景。

曾祥永｜云跡科技 AI 技術(shù)負(fù)責(zé)人

如果進(jìn)入到RaaS（機器人即服務(wù)）階段，那么就在兩個層面上存在壁壘。一個是把機器人本體做得穩(wěn)定、可靠、執(zhí)行成功率足夠高，成本也能做到充分控制。再一個是能夠真正做到規(guī)�；⻊�(wù)。

許華｜史河機器人創(chuàng)始人& CEO

除了做好產(chǎn)品研發(fā)的基本功、制造業(yè)的基本功、品牌營銷的基本功，還要建立好行業(yè)內(nèi)的場景、任務(wù)、工藝等數(shù)據(jù)壁壘，并基于這些數(shù)據(jù)搭建專用的小模型。這些數(shù)據(jù)可以幫助公司很好地建立門檻。

李宇浩｜麥巖智能創(chuàng)始人&CEO

機器人公司一定要基于對垂直場景的深入理解。我認(rèn)為，絕大多數(shù)機器人的形態(tài)一定不會是人形。盡管通用人形機器人是個很好的生意。

上一篇：蘋果XR光學(xué)專利：基于液晶透鏡的動態(tài)屈光調(diào)節(jié)系統(tǒng)

下一篇：數(shù)字經(jīng)濟(jì)賦能種業(yè)振興論壇在京召開我們距離數(shù)字育種還有多遠(yuǎn)？

AiLab云推薦

AI會讓機器人更聰明嗎？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-07 18:12:44 瀏覽：8868次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI會讓機器人更聰明嗎？ 來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-07 18:12:44 瀏覽：8868次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI會讓機器人更聰明嗎？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-07 18:12:44 瀏覽：8868次