展會信息港展會大全

一款機器人多模態(tài)大模型發(fā)布:機器人也能“察言觀色”
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-07 18:08:04   瀏覽:5939次  

導讀:機器人賽道也開始出現(xiàn)大模型創(chuàng)新者。 7月7日上午,在上海世博展覽館的世界人工智能大會新品發(fā)布環(huán)節(jié),機器人領域的獨角獸頭部企業(yè)達闥機器人,發(fā)布了業(yè)界首個機器人多模態(tài)大模型RobotGPT。該大模型包含RobotGPT 1.0服務平臺產(chǎn)品和RobotGPT 1.0一體機產(chǎn)品。...

機器人賽道也開始出現(xiàn)大模型創(chuàng)新者。

7月7日上午,在上海世博展覽館的世界人工智能大會新品發(fā)布環(huán)節(jié),機器人領域的獨角獸頭部企業(yè)達闥機器人,發(fā)布了業(yè)界首個機器人多模態(tài)大模型RobotGPT。該大模型包含RobotGPT 1.0服務平臺產(chǎn)品和RobotGPT 1.0一體機產(chǎn)品。

達闥機器人 進行舞蹈展示。澎湃新聞記者 俞凱 攝

發(fā)布會上,達闥首先介紹了海睿AGI平臺的全新升級。海睿AGI平臺是一個通用人工智能平臺,為云端智能機器人提供了運營生態(tài)技術底座,可以接入各種主流的GPT和AIGC服務,進行多模態(tài)賦能。正是基于海睿AGI平臺和海量機器人數(shù)據(jù)積累,該企業(yè)訓練出了業(yè)界首個機器人多模態(tài)人工智能大模型RobotGPT。它是為實現(xiàn)機器人在復雜應用場景下的多模態(tài)行為而提供的交互生成型AI大模型。

與其它的文本、語音類大模型相比,RobotGPT具備多模態(tài)(文本、語音、圖片、視覺、運動、點云等)融合感知、認知、決策和行為生成能力,并基于人工反饋的強化學習完成并快速智能進化。RobotGPT與機器人的具身智能相結(jié)合,實現(xiàn)機器人理解人類語言,自動分解、規(guī)劃和執(zhí)行任務,進行“察言觀色”和實時交互,完成復雜的場景應用,推動具身智能的自主進化,讓云端機器人成為通用人工智能的最佳載體。此外,RobotGPT還可以賦能數(shù)字人應用,實現(xiàn)虛實融合。

具身智能,是指擁有身體并支持物理交互的智能體,具備感知、思考、學習、決策等能力,能夠與環(huán)境進行交互,標桿產(chǎn)品是人形機器人。“我們的目標是通過RobotGPT大模型,幫助企業(yè)更好地解決特定行業(yè)中的大模型推理、訓練或混合推訓及應用私有化部署等問題,從而提升企業(yè)的智能生產(chǎn)力。不僅如此,RobotGPT還將促進機器人AI大腦的進化,服務機器人逐步演變?yōu)榫呱碇悄軝C器人,人工智能的終極形態(tài)也有了具象化的載體。”達闥創(chuàng)始人、董事長兼CEO黃曉慶在發(fā)布會上表示。

RobotGPT 1.0的主要功能包括行業(yè)問答、多輪對話、多模態(tài)交互、人設場景、智能語音、AI變聲、聲紋識別、通用問答、文本摘要、情感分析、圖片理解和圖片生成等。經(jīng)過實測,對于類ChatGPT生成式實時對話,RobotGPT 1.0表現(xiàn)相當出色,支持可控且精準的行業(yè)問答且具備高實時性,進行針對特定場景多輪對話。

澎湃新聞記者從大會獲悉,依托達闥的業(yè)界首個國家新一代人工智能開放平臺,RobotGPT大模型正在加速各領域發(fā)展和應用落地。目前,RobotGPT及解決方案已落地能源電力、醫(yī)療健康、金融保險、交通樞紐、教育咨詢、高端制造等十多個垂直行業(yè),支持超過100個應用場景。

贊助本站

人工智能實驗室
相關內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港