作者|LiYuan、宛辰
編輯|靖宇
對于 AI 行業(yè)從業(yè)者來說,剛剛可能是一夜未眠。
北京時間 11 月 7 日凌晨,美國人工智能公司 OpenAI 的開發(fā)者大會正式開啟,創(chuàng)始人 Sam Altman 在臺上和同事,只用 45 分鐘時間,就「轟」出了團隊最新的成果 GPT-4 Turbo,后者不僅更快、有更長的上下文、而且更好的控制。
同時,OpenAI 下調(diào) API 的價格近 3 倍,降到了 1000 輸入/美分,讓在場開發(fā)者歡呼不已。
當(dāng)然,更重要的是,OpenAI 推出了「GPTs」讓人們能用自然語言構(gòu)建定制化 GPT,然后,你猜到了可以把 GPT 上傳到即將發(fā)布的「GPT Store」!
如果說 GPT-4 Turbo 是更好用的「iPhone」,GPT Store 則可能是讓OpenAI成為「蘋果」一樣的巨頭的重要一步。
當(dāng)競爭對手們依然在「AI 煉丹」時,OpenAI 已經(jīng)開始構(gòu)建起一個看起來相當(dāng)宏偉的生態(tài)了。
GPT-4 Turbo,更快,更省錢
發(fā)布會一開始,Sam Altman 就宣布了 GPT-4 的一次大升級,推出了 GPT-4 Turbo,同步在 ChatGPT 和 API 版本推出。
Sam Altman 表示團隊一直在征求開發(fā)者的建議,對開發(fā)者關(guān)注的問題做了六大升級,分別是更長的上下文長度、更強的控制、模型的知識升級、多模態(tài)、模型微調(diào)定制和更高的速率限制。
其中前四條主要關(guān)于新模型的性能的提升,而后兩點則主要針對企業(yè)開發(fā)者的痛點。在提升性能的同時,OpenAI 還宣布了 API 價格的下調(diào),可謂「加量不加價」了。
Sam Altman 公布 GPT 的六大升級|OpenAI
六大升級中,第一,就是上下文長度。
OpenAI 原本提供的最長的上下文長度為 32k,而此次,GPT-4 Turbo 直接將上下文長度提升至 128k,一舉超過了競爭對手 Anthropic 的 100k 上下文長度。
128k 的上下文大概是什么概念?大概約等于 300 頁標(biāo)準(zhǔn)大小的書所涵蓋的文字量。除了能夠容納更長上下文外,Sam 還表示,新模型還能夠在更長的上下文中,保持更連貫和準(zhǔn)確。
第二,是為開發(fā)者提供了幾項更強的控制手段,以更好地進行API和函數(shù)調(diào)用。
首先,新模型提供了一個 JSON Mode,可以保證模型以特定 JSON 方式提供回答,調(diào)用 API 時也更加方便。
另外,新模型還允許同時調(diào)用多個函數(shù),同時引入了 seed parameter,在需要的時候,可以確保模型能夠返回固定輸出。接下來幾周,模型還將增加新功能,讓開發(fā)者能看到 log probs。
第三,則是模型內(nèi)部和外部知識庫的升級。
ChatGPT 橫空出世大概一年后,GPT 的知識庫終于更新到了 2023 年 4 月。Sam Altman 承諾未來還將繼續(xù)更新其知識庫,不使其落伍!笇τ GPT 的知識停留在 2021 年,我們和你們一樣,甚至比你們更惱火!筍am Altman 表示。
GPT 內(nèi)部知識庫終于升級到了 2023 年 4 月|OpenAI
除了內(nèi)部知識庫的升級,GPT-4 Turbo 也升級了外部知識庫的更新方式,現(xiàn)在可以上傳外部數(shù)據(jù)庫或文件,來為 GPT-4 Turbo 提供外部知識庫的支持。
第四,或許是最不讓人意外的,多模態(tài)。
新模型支持了 OpenAI 的視覺模型 DALLE 3,還支持了新的文本到語音模型開發(fā)者可以從六種預(yù)設(shè)聲音中選擇所需的聲音。
多模態(tài)成為 GPT 的內(nèi)置功能|OpenAI
GPT-4 Turbo 現(xiàn)在可以以圖生圖了。同時,在圖像問題上,目前 OpenAI 推出了防止濫用的安全系統(tǒng)。OpenAI 還表示,它將為所有客戶提供牽涉到的版權(quán)問題的法律費用。
在語音系統(tǒng)中,OpenAI 表示,目前的語音模型遠(yuǎn)超市場上的同類,并宣布了開源語音識別模型 Whisper V3。
第五,模型微調(diào)與定制。
8 月,OpenAI 曾經(jīng)發(fā)布過 GPT-3.5 Turbo 的微調(diào)服務(wù)。當(dāng)時,有早期測試表明,經(jīng)過微調(diào)的 GPT-3.5 Turbo 版本在某些任務(wù)中甚至可以超越 GPT-4,不過定價相對較高。
而此次,Sam 宣布 GPT-3.5 Turbo 16k 的版本目前也可以進行微調(diào)的定制了,且價格將比前一代更低。GPT-4 的微調(diào)定制也在申請中了。
同時,OpenAI 也開始接受單個企業(yè)的模型定制了!赴ㄐ薷哪P陀(xùn)練過程的每一步,進行額外的特定領(lǐng)域的預(yù)訓(xùn)練,針對特定領(lǐng)域的后訓(xùn)練等等。」Sam 表示。同時他表示,OpenAI 沒有辦法做很多這樣的模型定制,而且價格不會便宜。
第六,也是最后一點,是更高的速率限制。
GPT-4 用戶,發(fā)布會后馬上可以享受到每分鐘的速率限制翻倍的體驗。同時,如果不夠滿意,還可以進一步通過 API 賬戶,申請進一步提升速率限制。
六大升級以外,是 API 體系的全線降價。
此次新發(fā)布的 GPT-4 Turbo,輸入方面比 GPT-4 降價 3 倍,而輸出方面降價 2 倍,OpenAI 表示,總體使用上降價大概 2.75 倍。
新模型的價格是每千輸入 token 1 美分,而每千輸出 token 3 美分。降價的 API 迎來了現(xiàn)場開發(fā)者的歡呼。
Sam 還表示,在優(yōu)先解決價格之后,下一個重點解決的問題將是速度問題,很快,開發(fā)者們就會發(fā)現(xiàn) GPT-4 Turbo 將變快很多。
GPT Store 來了!
早在 5 月,OpenAI 就開放了插件系統(tǒng),首批上線了 70 個大模型相關(guān)的應(yīng)用,領(lǐng)域包括猜詞、翻譯、查找股票數(shù)據(jù)等等。
GPT Store 風(fēng)格都非!窤pp Store」|OpenAI
當(dāng)時,該功能被寄予厚望,不少媒體將其類比于蘋果的 App Store 時刻,認(rèn)為它將改變大模型應(yīng)用的生態(tài)。不過雖然后期插件不斷增加,但插件系統(tǒng)卻遠(yuǎn)遠(yuǎn)沒有達(dá)到蘋果應(yīng)用商店的影響力。
而此次發(fā)布會上,OpenAI 則重新梳理了其應(yīng)用商店的體系,并將其擴大到了一個全新的范疇人人都能通過自然語言創(chuàng)建基于自己的知識庫的AIAgent,加入 OpenAI 的應(yīng)用商店,并獲得分成。
OpenAI 此次發(fā)布的應(yīng)用,不再稱為插件,而選擇了一個相對比較奇怪的名字,GPT。而整體的應(yīng)用商店,名字叫做 GPT Store,將在本月后期正式推出。
按照 Sam Altman 的說法,每一個 GPT 像是 ChatGPT 的一個為了特殊目的而做出的定制版本。
OpenAI 的工作人員嘗試讓 ChatGPT 管理自己的生活|OpenAI
為了突出新的 GPT 應(yīng)用,ChatGPT 整個頁面將有小幅度的調(diào)整。左上角除了 ChatGPT,下面的應(yīng)用,就是此次推出的 GPT 應(yīng)用。
在演示中,可以看到,較為復(fù)雜的插件比如曾經(jīng)在 OpenAI 上線插件系統(tǒng)時第一批進入插件系統(tǒng)的 Zapier,仍然存在于目前的應(yīng)用商店中,而且仍然可能是未來應(yīng)用商店里很重要的一批應(yīng)用。
演示中,OpenAI 的 Jessica Shay,就利用了 Zapier 鏈接了自己的日歷和手機短信,通過與 Zapier 這個應(yīng)用聊天的方式,直接安排了自己的日程,并通知了同事。
不過,Zapier 的功能雖然強大,這樣的應(yīng)用并不是此次發(fā)布的重點。據(jù) Glassdoor 數(shù)據(jù)顯示,Zapier 公司擁有 500-1000 名員工,而財富網(wǎng)站報道,Zapier 估值已達(dá) 50 億美金。指望這樣的應(yīng)用來填充 OpenAI 的羽翼未豐的應(yīng)用商店,使其成為一個豐富的生態(tài)顯然不太現(xiàn)實。
因此,此次發(fā)布中,OpenAI 推出一個重磅發(fā)布:讓不懂代碼的人也能輕松定義一個 GPT。
Sam Altman 為此進行了現(xiàn)場展示。
「在 YC 工作過很多年,我總是遇到開發(fā)者向我咨詢商業(yè)意見!筍am Altman 講到,「我一直想,如果有一天有個機器人能幫我回答這些問題就好了!
接著,Sam Altman 打開了 GPT Builder,先打上一段對這個 GPT 的定義,類似于幫助初創(chuàng)公司的創(chuàng)始人思考他們的業(yè)務(wù)創(chuàng)意并獲得建議,接著,在對話中,GPT Builder 自己生成了這個 GPT 的名字、圖標(biāo),并通過與 Sam 對話的形式,詢問 Sam 是否要對對生成的名字和圖標(biāo)等進行調(diào)整。
Sam Altman 正在創(chuàng)建一個「創(chuàng)業(yè)導(dǎo)師 GPT」|OpenAI
接下來,GPT Builder 主動向他詢問這個應(yīng)用該如何與用戶交互,Sam 表示可以從我的過往演講中選擇合適且有建設(shè)性的回答,然后上傳了一段自己過往的演講。
即使加上講解,整個應(yīng)用也在三分鐘內(nèi)就完成了。訪問這個 GPT 的人,會收到 GPT 自動生成的對話開頭,可以與這個 GPT 對話咨詢創(chuàng)業(yè)相關(guān)的內(nèi)容,而得到的,將是一個類似于 Sam Altman 本人的回答。
Sam 表示,創(chuàng)建者還可以進一步為 GPT 增加 action(動作)。
創(chuàng)建一個這樣的 GPT,本質(zhì)上,用戶能夠定制的功能其實并不多:指令(預(yù)設(shè)的 prompt),外設(shè)的知識庫和動作。但是,能把三者絲滑地結(jié)合起來,讓一個不懂代碼的人也能更簡單地創(chuàng)建應(yīng)用,確實是此次 OpenAI的創(chuàng)舉。
GPT 發(fā)布后,應(yīng)用可以選擇私有,專屬企業(yè)擁有和公開所有三種方式。而 Open AI 表示,將為受歡迎的應(yīng)用提供利潤分享。
很明顯,OpenAI 在這里的發(fā)布,并沒有希望普通用戶能夠通過自然語言創(chuàng)建出多么復(fù)雜的應(yīng)用,其中的想象空間,更重要的在于個人和企業(yè)能夠?qū)⒆约旱闹R庫上傳到 OpenAI,一鍵構(gòu)建專屬應(yīng)用。
比如作為一個擁有貨運價格表的代理,可以將文件上傳到 OpenAI 后,一鍵部署出自己的詢價助理,這樣簡潔絲滑的應(yīng)用部署,在之前還并不存在。而如果發(fā)布最終能夠得到用戶認(rèn)可的話,類似的應(yīng)用也將能夠填充 OpenAI 的應(yīng)用商店,使其成為各種信息的寶庫。
零代碼創(chuàng)建 AI Agent
如果你覺得上述的 0 代碼的 GPT 很酷,此次 OpenAI 也推出了讓開發(fā)者更容易使用 OpenAI API 的開發(fā)方式Assistants API。
Sam Altman 表示,市面上基于 API 構(gòu)建 agent 的體驗很棒。比如,Shopify 的 Sidekick 可以讓用戶在平臺上采取行動,Discord 的 Clyde 可以讓管理員幫忙創(chuàng)建自定義人物,Snap 的 My AI 是一個自定義聊天機器人,可以添加到群聊中并提出建議。
但問題是,這些 agent 很難建立。有時需要幾個月的時間,由數(shù)十名工程師組成的團隊,處理很多事情才能使這種定制助手體驗。這些事情包括狀態(tài)管理(state management)、提示和上下文管理(prompt and context management)、擴展功能(extend capabilities)和檢索(retrievel)。
在 OpenAI 開發(fā)者大會上,這些事情被 API 化OpenAI 推出 Assistants API,讓開發(fā)人員在他們的應(yīng)用程序中構(gòu)建「助手」。
使用 Assistants API,OpenAI 客戶可以構(gòu)建一個具有特定指令、利用外部知識并可以調(diào)用OpenAI生成式AI模型和工具來執(zhí)行任務(wù)的「助手」。像這樣的案例范圍包含,從基于自然語言的數(shù)據(jù)分析應(yīng)用程序到編碼助手,甚至是人工智能驅(qū)動的假期規(guī)劃器。
AssistantsAPI封裝的能力包括:
持久的線程(persistent threads),人們不必弄清楚如何處理長的對話歷史;
內(nèi)置的檢索(Retrieval),利用來自 OpenAI 模型外部的知識(例如公司員工提供的產(chǎn)品信息或文檔)來增強開發(fā)人員創(chuàng)建的助手;提供新的 Stateful API 管理上下文;
內(nèi)置的代碼解釋器(Code Interpreter),可在沙盒執(zhí)行環(huán)境中編寫和運行 Python 代碼。這一功能于 3 月份針對 ChatGPT 推出,可以生成圖形和圖表并處理文件,讓使用 Assistants API 創(chuàng)建的助手迭代運行代碼來解決代碼和數(shù)學(xué)問題;
改進的函數(shù)調(diào)用,使助手能夠調(diào)用開發(fā)人員定義的編程函數(shù)并將響應(yīng)合并到他們的消息中。
Assistants API 處于測試階段,從今天開始可供所有開發(fā)人員使用。開發(fā)者可以前往 Assistants Playground 來嘗試 Assistants API 測試版,而無需編寫任何代碼。
Assistants API 被 OpenAI 視為幫助開發(fā)者在其應(yīng)用程序中構(gòu)建「類 agent 體驗」的第一步。有了 Assistants API,構(gòu)建 agent 應(yīng)用將變得更容易。OpenAI 表示,隨著時間的推移,將會持續(xù)提高它們的能力。并且,未來計劃允許客戶提供自己的 copilot 工具,以補充其平臺上的 Code Interpreter、檢索組件和函數(shù)調(diào)用。
OpenAI 開發(fā)者大會上的產(chǎn)品升級,再次告訴人們,距離每個人都能有一個甚至多個專屬私人助理、使用自然語言就能開發(fā)軟件、還能像瀏覽應(yīng)用一樣,付費/免費購買流行的私人助理,這樣的一個未來,正在加速向人們走來。
從 GPT-4 到 GPT-4 Turbo 和 GPT Store,OpenAI只用了半年多一點的時間。而在 6 個月之內(nèi),全球的科技和 AI 行業(yè),已經(jīng)是天上人間。
Sam Altman 總結(jié)發(fā)布會亮點|OpenAI
當(dāng)多模態(tài)、長文本輸入、更便宜、個性化……這些旨在和 OpenAI 大模型錯位競爭的特點,都被 OpenAI 搶先拿來自我革命;當(dāng) OpenAI 的產(chǎn)品在 B 端和 C 端都體現(xiàn)出強大的吸引力、并且還將利用 GPT Store 率先籠絡(luò)住全球AI開發(fā)者時,不知道全球的 AI 對手們的心情如何。
但 OpenAI 的技術(shù)進步是令人興奮的,而團隊所采用的商業(yè)策略,又有著超出一般創(chuàng)業(yè)公司的成熟我們目睹著一個行業(yè)的潮起,也可能正在見證一個巨頭的誕生。
頭圖來源:OpenAI