展會(huì)信息港展會(huì)大全

GPT-4o登場(chǎng)!實(shí)時(shí)語(yǔ)音視頻交互震撼全場(chǎng) 或推動(dòng)AI應(yīng)用打開商業(yè)化空間
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-14 08:50:34   瀏覽:2862次  

導(dǎo)讀:北京時(shí)間周二(5月14日)凌晨,美國(guó)人工智能研究公司OpenAI在線上舉辦了春季更新活動(dòng)。OpenAI在活動(dòng)中發(fā)布了新旗艦?zāi)P虶PT-4o,可以實(shí)時(shí)對(duì)音頻、視覺(jué)和文本進(jìn)行推理。據(jù)介紹,新模型使ChatGPT能夠處理50種不同的語(yǔ)言,同時(shí)提高了速度和質(zhì)量。 GPT-4o是邁向更...

北京時(shí)間周二(5月14日)凌晨,美國(guó)人工智能研究公司OpenAI在線上舉辦了“春季更新”活動(dòng)。OpenAI在活動(dòng)中發(fā)布了新旗艦?zāi)P?ldquo;GPT-4o”,“可以實(shí)時(shí)對(duì)音頻、視覺(jué)和文本進(jìn)行推理。”據(jù)介紹,新模型使ChatGPT能夠處理50種不同的語(yǔ)言,同時(shí)提高了速度和質(zhì)量。

GPT-4o是邁向更自然人機(jī)交互的一步,與現(xiàn)有模型相比,GPT-4o在圖像和音頻理解方面尤其出色。GPT-4o可以在232毫秒內(nèi)對(duì)音頻輸入做出反應(yīng),與人類在對(duì)話中的反應(yīng)時(shí)間相近。在錄播視頻中,兩位高管做出了演示:機(jī)器人能夠從急促的喘氣聲中理解“緊張”的含義,并且指導(dǎo)他進(jìn)行深呼吸。開源證券發(fā)布研報(bào)稱,國(guó)內(nèi)AI多模態(tài)模型不斷躍遷,或持續(xù)賦能IP開發(fā)、影視、音樂(lè)、教育、營(yíng)銷等領(lǐng)域降本提效,拉動(dòng)對(duì)音視頻語(yǔ)料的需求,并衍生全新變現(xiàn)模式,建議繼續(xù)布局多模態(tài)AI應(yīng)用。

據(jù)財(cái)聯(lián)社主題庫(kù)顯示,相關(guān)上市公司中:

值得買的“AI問(wèn)答機(jī)器人”將采用對(duì)話形式與用戶進(jìn)行交互,用戶只需通過(guò)自然語(yǔ)言描述自己的購(gòu)物需求或問(wèn)題,機(jī)器人即可智能分析并給出相應(yīng)的購(gòu)物建議或鏈接。

奧飛娛樂(lè)在互動(dòng)易平臺(tái)上表示,目前其持有光年無(wú)限5%股權(quán),光年無(wú)限有自己的AI對(duì)話機(jī)器人產(chǎn)品圖靈機(jī)器人開放平臺(tái)。公司上線AI對(duì)話小程序“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗(yàn)。

(財(cái)聯(lián)社)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港