北京時(shí)間周二(5月14日)凌晨,美國(guó)人工智能研究公司OpenAI在線上舉辦了“春季更新”活動(dòng)。OpenAI在活動(dòng)中發(fā)布了新旗艦?zāi)P?ldquo;GPT-4o”,“可以實(shí)時(shí)對(duì)音頻、視覺(jué)和文本進(jìn)行推理。”據(jù)介紹,新模型使ChatGPT能夠處理50種不同的語(yǔ)言,同時(shí)提高了速度和質(zhì)量。
GPT-4o是邁向更自然人機(jī)交互的一步,與現(xiàn)有模型相比,GPT-4o在圖像和音頻理解方面尤其出色。GPT-4o可以在232毫秒內(nèi)對(duì)音頻輸入做出反應(yīng),與人類在對(duì)話中的反應(yīng)時(shí)間相近。在錄播視頻中,兩位高管做出了演示:機(jī)器人能夠從急促的喘氣聲中理解“緊張”的含義,并且指導(dǎo)他進(jìn)行深呼吸。開源證券發(fā)布研報(bào)稱,國(guó)內(nèi)AI多模態(tài)模型不斷躍遷,或持續(xù)賦能IP開發(fā)、影視、音樂(lè)、教育、營(yíng)銷等領(lǐng)域降本提效,拉動(dòng)對(duì)音視頻語(yǔ)料的需求,并衍生全新變現(xiàn)模式,建議繼續(xù)布局多模態(tài)AI應(yīng)用。
據(jù)財(cái)聯(lián)社主題庫(kù)顯示,相關(guān)上市公司中:
值得買的“AI問(wèn)答機(jī)器人”將采用對(duì)話形式與用戶進(jìn)行交互,用戶只需通過(guò)自然語(yǔ)言描述自己的購(gòu)物需求或問(wèn)題,機(jī)器人即可智能分析并給出相應(yīng)的購(gòu)物建議或鏈接。
奧飛娛樂(lè)在互動(dòng)易平臺(tái)上表示,目前其持有光年無(wú)限5%股權(quán),光年無(wú)限有自己的AI對(duì)話機(jī)器人產(chǎn)品圖靈機(jī)器人開放平臺(tái)。公司上線AI對(duì)話小程序“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗(yàn)。
(財(cái)聯(lián)社)