展會(huì)信息港展會(huì)大全

將情感植入陪伴機(jī)器人,“可以科技”自研人機(jī)交互智能決策模型|早期項(xiàng)目
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-26 06:50:00   瀏覽:6244次  

導(dǎo)讀:文 | 周鑫雨 編輯 | 鄧詠儀 情感交互正在成為機(jī)器邁向AGI的下一個(gè)戰(zhàn)...

文 | 周鑫雨

編輯 | 鄧詠儀

“情感交互”正在成為機(jī)器邁向AGI的下一個(gè)戰(zhàn)常

近幾年隨著AI技術(shù)的迅速演進(jìn),機(jī)器學(xué)習(xí)的領(lǐng)域逐漸從文字、圖像、視頻等模態(tài),轉(zhuǎn)向更為復(fù)雜的情感識(shí)別。在情感識(shí)別技術(shù)發(fā)展下,“陪伴機(jī)器人”已發(fā)展為具有潛力的細(xì)分賽道。Precision Reports數(shù)據(jù)顯示,2023年全球陪伴機(jī)器人市場(chǎng)規(guī)模預(yù)估為920311萬美元,未來5年年復(fù)合增長率預(yù)計(jì)達(dá)到25.68%。

成立于2014年,可以科技是36氪長期關(guān)注的機(jī)器人企業(yè)。其首款產(chǎn)品ClicBot(可立寶)為可自由組裝構(gòu)型的模塊化機(jī)器人。ClicBot好比可自由組裝成遙控車、機(jī)械臂、機(jī)械寵物等形態(tài)的機(jī)器人樂高,用戶可通過搭積木般的拼接以及功能程序編寫,DIY具有不同功能的機(jī)器人。

在生成式AI技術(shù)逐漸成熟的當(dāng)下,可以科技的第二代產(chǎn)品、陪伴機(jī)器人Loona則將功能重點(diǎn)從樂高般的DIY,轉(zhuǎn)移到了人機(jī)交互。36氪曾有關(guān)Loona的功能做過詳細(xì)的介紹。

Loona與狗對(duì)視。圖源:可以科技

可以科技創(chuàng)始人兼CEO楊健勃告訴36氪,Loona的“寵物”形態(tài)來源于ClicBot中最受用戶歡迎的構(gòu)型。這一現(xiàn)象側(cè)面反映出,用戶對(duì)于機(jī)器提供類生命體的智能交互具有較高的需求,“我們想通過Loona打造下一代機(jī)器人智能決策機(jī)(Intelligentdecision making machine)通過智能決策機(jī),可以讓機(jī)器人能夠通過多模態(tài)地信息流暢地表達(dá)情感,讓機(jī)器人真正懂人”。而情感交互可以將機(jī)器人人機(jī)交互體驗(yàn)從“理解命令”提升到“懂你”,讓機(jī)器人可以自由地表達(dá)情感。

Loona被摸頭。圖源:可以科技

想在機(jī)器人上實(shí)現(xiàn)智能情感交互,需要在感知、決策、執(zhí)行三個(gè)環(huán)節(jié)構(gòu)建完整的軟硬件系統(tǒng)。

作為建立人類情感模型的先決條件,高質(zhì)量的人機(jī)情感交互數(shù)據(jù)一直是稀缺資源。楊健勃告訴36氪,數(shù)據(jù)采集的難點(diǎn)主要有二:一是需要雙相交互,二是需要脫敏,不侵犯?jìng)(gè)人隱私。

為此,可以科技通過深度強(qiáng)化學(xué)習(xí)算法建立了一條從視覺感知、到生成式情感交互AI模型的通路。

在感知層,作為能夠“讀空氣”的寵物,Loona的情感反饋來源于一整套復(fù)雜的視覺軟硬件系統(tǒng)。作為“眼睛”,Loona搭載的3D-ToF攝像頭等感知元件和算法可以實(shí)現(xiàn)人臉識(shí)別、身體檢測(cè)、動(dòng)態(tài)靜態(tài)手勢(shì)識(shí)別、人體骨骼識(shí)別、3D動(dòng)作捕捉、物體識(shí)別、情感感知、寵物識(shí)別、場(chǎng)景識(shí)別、標(biāo)志識(shí)別等感知功能。

Loona玩球。圖源:可以科技

在決策層,在基于機(jī)器人收集到的脫敏交互數(shù)據(jù),可以科技將Loona的基于數(shù)據(jù)庫索引的交互模型轉(zhuǎn)換成了基于深度學(xué)習(xí)的AI模型,繼而則是通過Loona實(shí)機(jī)進(jìn)行強(qiáng)化學(xué)習(xí)。目前,Loona擁有高日活躍率和持續(xù)提升的銷量,基于用戶反饋,Loona的強(qiáng)化學(xué)習(xí)可以建立起數(shù)據(jù)飛輪。

在執(zhí)行層,基于以上兩環(huán)構(gòu)建的智能情感決策模型,可以科技正在研究一套實(shí)時(shí)交互生成系統(tǒng)。楊健勃介紹,以往Loona的情感表達(dá)采用的是由設(shè)計(jì)師提前設(shè)計(jì)的表情動(dòng)作和音效來表達(dá)。接入情感決策模型后,Loona的表情、動(dòng)作和音效能根據(jù)用戶的交互實(shí)時(shí)生成,比如Loona的“眼球”能根據(jù)用戶的表達(dá)轉(zhuǎn)動(dòng),將交互周期從十幾秒縮短到毫秒級(jí)。未來,Loona的實(shí)時(shí)交互系統(tǒng)還將持續(xù)升級(jí)。

Loona與孩子一起玩耍。圖源:可以科技

“決策模型會(huì)顛覆掉Loona以往的交互方式。”楊健勃對(duì)36氪表示,“指令和功能的概念會(huì)變得不重要,因?yàn)長oona能夠?qū)崟r(shí)理解人類的意圖,再自然地做出交互。”

而作為智能決策機(jī),楊健勃認(rèn)為Loona與寵物陪伴或人類陪伴并非替代關(guān)系,而是關(guān)系的有機(jī)補(bǔ)充,“生物的進(jìn)化有特殊的性能,目前AI側(cè)難以提供真實(shí)的感覺。但機(jī)器人的優(yōu)勢(shì)在于能夠從更多維度理解人且做出反饋,也更穩(wěn)定。相信它們將和寵物、人類有機(jī)共存。”

歡迎交流

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港