展會信息港展會大全

OpenAI大招要來了!AI語音助手狙擊谷歌,官宣下周二上新,GPT-5年前見
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-11 15:40:40   瀏覽:7468次  

導讀:智東西(公眾號:zhidxcom) 作者 | 香草 編輯 | 李水青 智東西5月11日消息,今天凌晨,OpenAI宣布將于美國時間13日上午10點(北京時間14日凌晨1點)在官網(wǎng)直播,演示ChatGPT、GPT-4的更新內容。 據(jù)外媒The Information今日報道,OpenAI正在構建具備音頻和視...

智東西(公眾號:zhidxcom)

作者 | 香草

編輯 | 李水青

智東西5月11日消息,今天凌晨,OpenAI宣布將于美國時間13日上午10點(北京時間14日凌晨1點)在官網(wǎng)直播,演示ChatGPT、GPT-4的更新內容。

據(jù)外媒The Information今日報道,OpenAI正在構建具備音頻和視覺理解能力的AI語音助手,其中一些功能已經(jīng)開始向客戶展示,可能在下周的發(fā)布活動中預覽。

知情人士消息透露,OpenAI可能會在今年內完成GPT-5的開發(fā)并公開發(fā)布。此外,OpenAI還計劃推出一種新的定價模式,客戶通過預付費預定Token,最高可以享受50%的折扣。

此前有多家外媒和博主曝料,稱OpenAI將在近日發(fā)布AI搜索引擎。其CEO阿爾特曼對此回應道:“不是GPT-5,也不是搜索引擎,但我們一直在努力開發(fā)一些我們認為會得到喜歡的新東西。”

▲阿爾特曼回應新品演示(圖源:X)

值得注意的是,其競爭對手谷歌的I/O開發(fā)者大會時間定在美國時間14日上午10點(北京時間15日凌晨1點),預計可能發(fā)布Gemini大模型的重要更新。OpenAI此次發(fā)布時間沒有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大會的前一天,火藥味可謂濃厚。

要知道,這已經(jīng)不是OpenAI第一次“卡點”狙擊谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,結果沒過幾個小時,OpenAI就掏出文生視頻“王炸”模型Sora,狠狠搶了Gemini 1.5 Pro的風頭。

直播發(fā)布地址:http://openai.com

一、AI語音助手仍存在“幻覺”問題,或將集成至ChatGPT免費版

據(jù)The Information報道,阿爾特曼的終極目標是開發(fā)出類似電影《她》(Her)中,可高度響應的虛擬助手,提升蘋果Siri等現(xiàn)有語音助手的可用程度。

▲電影《她》劇照

OpenAI認為,具有視覺和音頻功能的AI語音助手具有像智能手機一樣的變革性潛力,理論上其可以做到一系列現(xiàn)在的AI助手無法做到的事,例如充當論文、數(shù)學問題指導老師,或是翻譯交通標識、幫助解決汽車故障等。

但類似的技術目前所需硬件門檻太高,無法在個人設備上運行,用戶可以在短期內使用基于云的版本來獲取這些功能,例如自動化客戶服務Agent。

OpenAI目前已經(jīng)推出具備音頻轉錄、文本轉語音等功能的軟件,不過這些功能是基于獨立的對話AI模型實現(xiàn),而新的語音助手則將這些功能整合在一起。據(jù)知情人士透露,該AI語音助手的音頻功能能夠幫助客服人員更好地理解對方的語氣。

目前尚不清楚OpenAI何時向付費客戶提供這些新功能,但據(jù)試用過該語音助手的人士透露,OpenAI最終的計劃是將這些功能都納入ChatGPT免費版本,目標是比目前其最先進模型GPT-4 Turbo的運行成本更低。該人士還談道,AI語音助手在有些類型的問題上回答優(yōu)于GPT-4 Turbo,但仍然存在幻覺問題。

對此,OpenAI發(fā)言人沒有回應置評請求。

二、與谷歌競爭iPhone合作位,GPT-5或于年底前發(fā)布

OpenAI推出AI語音助手主要目標是與谷歌競爭。

谷歌的AI模型Gemini能實時響應語音命令,并識別圖像、視頻等。不過這些功能目前仍需要研究人員附以圖像和文字說明,且并不能理解許多傳統(tǒng)的語音指令,也不能像Siri和谷歌助手等傳統(tǒng)語音助手那樣與用戶對話。

▲谷歌展示Gemini多模態(tài)功能(圖源:谷歌)

另一方面,提高模型的視覺、音頻能力也有助于OpenAI與蘋果達成合作。

最近幾個月,蘋果與OpenAI就下一代iPhone操作系統(tǒng)如何整合OpenAI的模型進行了討論。然而,與此同時,蘋果也與谷歌進行著類似的談判。

這場競爭的最新消息是,據(jù)彭博社今早報道,蘋果已接近與OpenAI達成協(xié)議,將在下一代iPhone操作系統(tǒng)iOS 18中使用ChatGPT;與谷歌尚未達成協(xié)議,但談判仍在進行中。

除了可能在下周推出的AI語音助手外,OpenAI還一直致力于構建一款AI搜索引擎,旨在與谷歌競爭。此外,其也在開發(fā)一種被稱作“計算機使用Agent”的自動化軟件,用來輔助軟件開發(fā)和其他計算機任務。

阿爾特曼還在與iPhone開發(fā)者喬尼艾維(Jony Ive)合作開發(fā)一款獨立的AI硬件。然而,最先進的AI模型體積龐大,需要在云端運行,并需要互聯(lián)網(wǎng)連接才能工作。要使具有視覺和聽覺功能的復雜AI模型變得足夠小巧,以便在設備上運行,可能需要幾個月甚至幾年的時間。

不過,大家最關心的可能還是GPT-5。據(jù)The Information報道,一位接近OpenAI領導人的人士稱,其可能在今年年底完成GPT-5并公開發(fā)布。

OpenAI的新產(chǎn)品和AI模型開發(fā)工作進展得如火如荼,與此同時,其此前宣布的一些項目卻變得不再那么受關注。盡管OpenAI曾向開發(fā)者承諾,會在今年第一季度推出GPT Store開發(fā)者激勵計劃,但目前仍沒有實現(xiàn)。

三、計劃推出預付費定價模式,最高提供50%折扣

在定價方面,據(jù)知情人士透露,OpenAI計劃推出一種新的定價模式,如果客戶通過預付費預定Token,最高可以享受50%的折扣。

這樣的優(yōu)惠形式在云計算領域比較常見,微軟Azure、谷歌云、亞馬遜云服務(AWS)等都提供提前預定服務器容量折扣的方式來降低成本。

目前,按需定價提供API(應用程序接口)是OpenAI大模型的主要付費形式,通過每生成100萬Tokens,向開發(fā)者收取幾美分至一百多美分不等的費用,其中大客戶可以享受批量折扣。

此前OpenAI已經(jīng)提供了一種降低開發(fā)者成本的方式,其在4月推出Batch API,如果開發(fā)者批量上傳模型查詢,并接受等待最長24小時的時間,就可以獲取更低的價格。

Together AI和Anyscale等AI服務器經(jīng)銷商曾表示,在他們的軟件上運行開源模型要比使用OpenAI的模型便宜6倍。通過更靈活的定價,OpenAI與其他模型開發(fā)商的競爭將更具優(yōu)勢。據(jù)透露,其今年的營收可能達到數(shù)十億美元。

結語:OpenAI谷歌相爭,蘋果微軟得利?

OpenAI與谷歌之間的競爭愈發(fā)激烈,二者之間的“商戰(zhàn)”火藥味也愈發(fā)濃厚。OpenAI又一次將新品發(fā)布時間定在了谷歌重大發(fā)布時間附近,似乎執(zhí)著于搶奪谷歌風頭這件事。

這一邊,蘋果同時與OpenAI、谷歌商談模型集成至iPhone事宜,再次加劇了兩家公司之間的競爭。雖然OpenAI被曝已與蘋果達成合作,但谷歌那邊的談判也仍在繼續(xù)。

而另一邊,微軟作為OpenAI最大的財務支持者,可以優(yōu)先使用其先進技術來改進自己的語音助手。而微軟也并非“孤注一擲”,除了積極自研模型外,還投資了OpenAI有力競對Mistral AI,后者成為第二家在微軟Azure云平臺上提供商業(yè)AI模型的公司。

下周的OpenAI新品發(fā)布和谷歌I/O大會,或許會將這場“商戰(zhàn)”推向新高度。究竟誰的“大招”會更厲害,我們拭目以待。

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港