展會(huì)信息港展會(huì)大全

機(jī)器人裝上OpenAI大模型:合作僅13天,能思考會(huì)識別,動(dòng)作流暢
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-18 08:57:16   瀏覽:6498次  

導(dǎo)讀:澎湃新聞編輯 趙子易(02:02) 裝載OpenAI大模型的人形機(jī)器人已經(jīng)出現(xiàn)。 當(dāng)?shù)貢r(shí)間3月13日,在宣布與AI(人工智能)新銳巨頭OpenAI展開合作的13天后,AI機(jī)器人初創(chuàng)企業(yè)Figure發(fā)布了旗下全尺寸人形機(jī)器人Figure 01的最新演示視頻,該機(jī)器人裝有OpenAI提供的視覺...

澎湃新聞編輯 趙子易(02:02)

裝載OpenAI大模型的人形機(jī)器人已經(jīng)出現(xiàn)。

當(dāng)?shù)貢r(shí)間3月13日,在宣布與AI(人工智能)新銳巨頭OpenAI展開合作的13天后,AI機(jī)器人初創(chuàng)企業(yè)Figure發(fā)布了旗下全尺寸人形機(jī)器人Figure 01的最新演示視頻,該機(jī)器人裝有OpenAI提供的視覺語言模型(VLM)。視頻顯示,F(xiàn)igure 01可以在執(zhí)行任務(wù)時(shí)實(shí)現(xiàn)與人類的互動(dòng)。

來源:Figure視頻截圖

根據(jù)Figure的介紹,這段時(shí)長2分33秒的展示視頻“連貫地錄制”于3月9日,以原速播放,顯示出Figure 01已經(jīng)能夠?qū)崿F(xiàn)“語音到語音的推理”和“端到端的神經(jīng)網(wǎng)絡(luò)”。

在視頻中,外表頗具科技感的Figure 01站在一張放有盤子、蘋果和水杯的桌子后面,旁邊還放著一個(gè)裝了盤子和水杯的碗架。一個(gè)主持人站在Figure 01的面前,問它能夠看見什么。在停頓幾秒鐘后,F(xiàn)igure 01用一個(gè)很像真人的聲音,詳細(xì)描述了桌子上的東西和站在桌前的主持人。

而當(dāng)主持人詢問Figure 01“我可以吃點(diǎn)什么嗎”,機(jī)器人以非常流暢的動(dòng)作拿起了桌上的蘋果,將其遞給主持人,并在清理主持人用一個(gè)籃子倒在桌上的垃圾的同時(shí),向主持人解釋自己的“思考”過程:“我給你蘋果,因?yàn)樗沁@張桌子上唯一可以吃的東西。”

來源:Figure視頻截圖

隨后,機(jī)器人又在主持人十分模糊的提示下,準(zhǔn)確地將桌上的盤子和水杯放進(jìn)了一旁的碗架。在視頻的最后,F(xiàn)igure用 “完全掌握技能、快速、靈巧操作”來形容Figure 01。

在X(原推特)平臺上,F(xiàn)igure在轉(zhuǎn)發(fā)該視頻時(shí)寫道:“有了OpenAI,F(xiàn)igure 01現(xiàn)在可以與人進(jìn)行完整的對話。OpenAI的模型提供了高水平的視覺和語言智能。Figure神經(jīng)網(wǎng)絡(luò)提供快速、低級、靈巧的機(jī)器人動(dòng)作。”

對于本視頻,F(xiàn)igure的CEO布雷特阿德科克(Brett Adcock)在X平臺上進(jìn)行了更多解釋:“Figure的機(jī)載攝像頭被輸入了由OpenAI訓(xùn)練的視覺語言模型(VLM),F(xiàn)igure的神經(jīng)網(wǎng)絡(luò)也通過機(jī)器人的攝像頭以10赫茲的頻率接收圖像。然后,神經(jīng)網(wǎng)絡(luò)以200赫茲的速度輸出具有24個(gè)自由度的動(dòng)作……除了構(gòu)建領(lǐng)先的AI,F(xiàn)igure還垂直整合了基本所有的方面。”

不過,F(xiàn)igure尚未明確表示Figure 01使用的VLM是否為GPT-4的相關(guān)版本,還是一個(gè)截然不同的模型。阿德科克也沒有提到任何關(guān)于Figure 01推出時(shí)間的信息。

去年10月,F(xiàn)igure放出了Figure 01雙足站立行走的演示視頻。今年1月7日,F(xiàn)igure發(fā)布了Figure 01使用膠囊咖啡機(jī)制作咖啡的視頻,當(dāng)時(shí)的Figure 01還動(dòng)作緩慢。而在Figure發(fā)布本次視頻后,由于機(jī)器人的動(dòng)作過于流暢,不少網(wǎng)友對視頻的真實(shí)度產(chǎn)生了質(zhì)疑,認(rèn)為其經(jīng)過剪輯處理。

然而,阿德科克堅(jiān)稱,該視頻屬于真實(shí)拍攝:“正如你從視頻中看到的,機(jī)器人的速度已經(jīng)得到顯著提升,開始接近人類的速度……我們的目標(biāo)是訓(xùn)練一個(gè)世界模型,使其能夠操作達(dá)到十億單位水平的人型機(jī)器人。”

資料顯示,F(xiàn)igure AI由阿德科克創(chuàng)辦于2022年,公司目標(biāo)是為人類“在全球范圍內(nèi)部署自動(dòng)人形工作者”,正在研發(fā)的人形機(jī)器人Figure 01身高1.5米,體重60公斤。

近期,隨著機(jī)器人概念持續(xù)走紅,對標(biāo)特斯拉Optimus機(jī)器人的Figure受到了廣泛關(guān)注。今年2月,F(xiàn)igure在最新一輪融資中獲得了來自AI芯片龍頭英偉達(dá)、亞馬遜創(chuàng)始人杰夫貝索斯(Jeff Bezos)、科技巨頭微軟以及其他幾家大型科技公司的投資,在本輪融資中累計(jì)籌得約6.75億美元,公司估值達(dá)到26億美元。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港