機器之心報道
機器之心編輯部
GPT-4 發(fā)布不到半年,GPT-5 就要來了嗎?
最近,美國專利商標局 (USPTO) 一份文件顯示:OpenAI 于 7 月 18 日提交了「GPT-5」的商標申請,并且已經(jīng)被 USPTO Office 接收(滿足最低申請要求),后續(xù)將由審查人員進一步審批。
OpenAI 在這份商標申請中提及了 GPT-5 的基本信息。GPT-5 將是一個用于自然語言處理、生成、理解和分析的大型語言模型(LLM)。值得注意的是,除了文本,GPT-5 還將具備語音理解與生成的能力。
USPTO 文件截圖
具體來說,GPT-5 的功能包括把文本或語音從一種語言翻譯成另一種語言、語音識別、生成文本和語音等。此外,GPT-5 可能還具備學(xué)習(xí)、分析、分類和回應(yīng)數(shù)據(jù)的能力。
有趣的是,今年上半年已經(jīng)機器學(xué)習(xí)領(lǐng)域的專家、學(xué)者已經(jīng)多次聯(lián)合發(fā)表公開信,呼吁人們重視生成式 AI 的潛在風(fēng)險,并限制構(gòu)建生成式 AI 大模型。其中,圖靈獎得主 Geoffrey Hinton 更是在 4 月從谷歌離職,警告人們生成式 AI 將「對人類構(gòu)成威脅」。OpenAI 作為 ChatGPT、GPT-4 等大模型背后的公司,無疑被推上了風(fēng)口浪尖。
彼時,OpenAI 表示將會專注于改進 GPT-4 版本,GPT-5 不在其近期計劃內(nèi)。
現(xiàn)在,雖然 OpenAI 已經(jīng)提交了商標申請,但 GPT-5 也不會很快到來。OpenAI CEO Sam Altman 曾在 6 月的「北京智源大會」上也說明過這一點。
OpenAI CEO Sam Altman
一般來說,科技公司會為尚未開發(fā)的概念申請商標,以保證其領(lǐng)先于競爭對手,并保護知識產(chǎn)權(quán)。申請中說明的 GPT-5 功能大部分 GPT-4 已經(jīng)具備,在一定程度上 GPT-5 是 GPT-4 的改進版本。
GPT-4 發(fā)布之后,學(xué)界和業(yè)界對大模型有了更加深入的研究和探討。ChatGPT 和 GPT-4 強大的性能讓人們看到了大模型巨大的潛力,因而對 GPT-5 抱有很多期待。
首先在多模態(tài)能力方面,目前 GPT-4 只能處理文本和圖像兩種類型的數(shù)據(jù),人們希望 GPT-5 能夠在語音、視頻等其他模態(tài)上有所突破。
其次,在計算效率與成本上,GPT-4 的定價是每 1k 個 prompt token 0.03 美元,默認速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。而 GPT-3.5-turbo 的定價是每 1k 個 token 0.002 美元,只有 GPT-4 的 1/15。GPT-5 的價格或許會比 GPT-4 更高。
最后,ChatGPT、GPT-4 等大型語言模型都固有一些問題,包括「幻覺」、「偏見」等等,這些問題讓大模型難以直接實際應(yīng)用。GPT-4 相對于以前的模型已經(jīng)顯著減輕了幻覺問題。在 OpenAI 的內(nèi)部對抗性真實性評估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%:
我們期待 GPT-5 在「幻覺」和「對齊」方面能夠進一步改善。
此外,近期一些新模型在上下文窗口方面有了新的突破,例如 Anthropic 將 Claude 2 的上下文窗口擴展至 200K token(目前發(fā)布版本僅支持 100K token),將大幅提升模型長文檔閱讀的能力。這也給以后發(fā)布的 LLM 帶來了新的壓力,包括 GPT-5。
當(dāng)然,GPT-5 實際會具備哪些能力,還要等到它問世那一天才能揭曉謎底,我們拭目以待。
參考鏈接:
https://www.searchenginejournal.com/openai-files-trademark-application-gpt-5/493040/
https://www.wbolt.com/gpt-5.html
https://www.windowslatest.com/2023/08/01/microsoft-backed-openai-files-trademark-for-chatgpt-5-but-it-doesnt-mean-anything/