展會(huì)信息港展會(huì)大全

OpenAI更新GPT-4等模型,新增API函數(shù)調(diào)用,價(jià)格最高降75%
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-15 20:01:43   瀏覽:6202次  

導(dǎo)讀:機(jī)器之心報(bào)道 編輯:陳萍 OpenAI 的模型開始增量降價(jià)了。 前些天,OpenAI 的 CEO Sam Altman 在全球巡回演講中,透漏了 OpenAI 近期發(fā)展路線,主要分兩個(gè)階段,2023 年的首要任務(wù)是推出更便宜、更快的 GPT-4,更長的上下文窗口等;2024 年重點(diǎn)是多模態(tài)。 Ope...

機(jī)器之心報(bào)道

編輯:陳萍

OpenAI 的模型開始增量降價(jià)了。

前些天,OpenAI 的 CEO Sam Altman 在全球巡回演講中,透漏了 OpenAI 近期發(fā)展路線,主要分兩個(gè)階段,2023 年的首要任務(wù)是推出更便宜、更快的 GPT-4,更長的上下文窗口等;2024 年重點(diǎn)是多模態(tài)。

OpenAI 2023 年的這些目標(biāo)正在逐一實(shí)現(xiàn)。從 ChatGPT 推出至今,短短幾個(gè)月,OpenAI 在 GPT-3.5 Turbo、GPT-4 等這些模型的基礎(chǔ)上構(gòu)建了令人難以置信的應(yīng)用程序。當(dāng)?shù)貢r(shí)間 6 月 13 日,OpenAI 發(fā)布函數(shù)調(diào)用及其他 API 更新,具體包括:

在 Chat Completions API 中新增新的函數(shù)調(diào)用,能讓模型在需要的時(shí)候調(diào)用函數(shù)并生成對應(yīng)的 JSON 對象作為輸出;

更新和更可操縱版本的 GPT-4 和 GPT-3.5 Turbo;

16k 上下文版本的 gpt-3.5-turbo(標(biāo)準(zhǔn)的是 4k 版本);

最先進(jìn)的嵌入模型(embeddings model)成本降低了 75%;

gpt-3.5-turbo 輸入 token 成本降低 25%;

宣布 gpt-3.5-turbo-0301 和 gpt-4-0314 型號(hào)的棄用時(shí)間表。

OpenAI 表示:API 中的 GPT-4 和 GPT-3.5 Turbo 模型現(xiàn)在支持調(diào)用用戶自定義函數(shù),允許模型使用用戶為其設(shè)計(jì)的工具。此外,用戶使用模型的價(jià)格降低了,OpenAI 也發(fā)布了一些新的型號(hào)版本(包括 16k 上下文 GPT-3.5 Turbo):

函數(shù)調(diào)用

現(xiàn)在開發(fā)人員可以向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函數(shù),并讓模型智能地選擇輸出一個(gè)包含調(diào)用這些函數(shù)所需參數(shù)的 JSON 對象。這是一種更可靠地將 GPT 的能力與外部工具和 API 連接起來的新方法。

模型經(jīng)過微調(diào),既可以檢測何時(shí)需要調(diào)用函數(shù)(取決于用戶的輸入),又可以使用符合函數(shù)簽名的 JSON 進(jìn)行響應(yīng)。函數(shù)調(diào)用使開發(fā)人員可以更可靠地從模型中獲取結(jié)構(gòu)化數(shù)據(jù)。例如,開發(fā)人員可以:

創(chuàng)建聊天機(jī)器人,通過調(diào)用外部工具來回答問題(像 ChatGPT 插件一樣):

例如將諸如「給 Anya 發(fā)電子郵件,問問她下周五是否想喝咖啡」之類的查詢轉(zhuǎn)換為函數(shù)調(diào)用 send_email (to: string, body: string) ;或者將「波士頓的天氣怎么樣?」 轉(zhuǎn)換為 get_current_weather (location: string, unit: 'celsius' | 'fahrenheit')。

將自然語言轉(zhuǎn)換為 API 調(diào)用或數(shù)據(jù)庫查詢:

例如將「誰是我這個(gè)月的十大客戶?」轉(zhuǎn)換為內(nèi)部 API 調(diào)用 get_customers_by_revenue (start_date: string, end_date: string, limit: int);又或者將「Acme 公司上個(gè)月下了多少訂單?」轉(zhuǎn)化為 SQL 查詢 sql_query (query: string)。

從文本中提取數(shù)據(jù)結(jié)構(gòu):

例如定義一個(gè)名為 extract_people_data (people: []) 的函數(shù),用來提取維基百科中提到的所有人。

以上這些用例由 /v1/chat/completions 端點(diǎn)、functions 和 function_call 中的新 API 參數(shù)啟用,允許開發(fā)人員通過 JSON 模式向模型描述函數(shù),并選擇要求它調(diào)用特定函數(shù)。

函數(shù)調(diào)用示例

例如用戶詢問「現(xiàn)在波士頓的天氣怎么樣?」,經(jīng)過一系列處理后,最終模型輸出答案:「波士頓目前天氣晴朗,氣溫為 22 攝氏度!

下圖對應(yīng)上圖中的第一步,包括請求和響應(yīng):

新模型

首先是 GPT-4:

gpt-4-0613 包含了一個(gè)更新和改進(jìn)的函數(shù)調(diào)用模型。

gpt-4-32k-0613 包括與 gpt-4-0613 相同的改進(jìn),以及擴(kuò)展的上下文長度,以理解更大的文本。

然后是 GPT - 3.5 Turbo:

gpt-3.5-turbo-0613 包含與 GPT-4 相同的函數(shù)調(diào)用,以及通過系統(tǒng)消息更可靠的可操作性,開發(fā)人員可以利用這兩個(gè)特性更加有效地指導(dǎo)模型進(jìn)行響應(yīng)。

gpt-3.5-turbo-16k 提供的上下文長度是 gpt-3.5-turbo 的 4 倍,價(jià)格是 gpt-3.5-turbo 的兩倍:每 1K 輸入 token 0.003 美元,每 1K 輸出 token 0.004 美元。16k 上下文意味著該模型現(xiàn)在可以在單個(gè)請求中支持大約 20 頁的文本。

模型棄用

3 月發(fā)布的 gpt-4 和 gpt-3.5-turbo 的初始版本將進(jìn)行棄用和升級(jí)。應(yīng)用程序?qū)⑹褂酶(wěn)定的模型 gpt-3.5-turbo、 gpt-4 和 gpt-4-32k,這些模型將于 6 月 27 日自動(dòng)升級(jí)。如果大家想對不同版本的模型進(jìn)行比較,可以使用 Eval 庫進(jìn)行公共和私有評估。

此外,那些需要過渡時(shí)間的開發(fā)人員可以繼續(xù)使用舊版本的模型 gpt-3.5-turbo-0301、gpt-4-0314 或 gpt-4-32k-0314,但在 9 月 13 號(hào)之后,在請求使用這些模型,將會(huì)失敗。想要了解更多模型棄用消息,可參考:

模型棄用查詢:https://platform.openai.com/docs/deprecations/

此外,本次更新價(jià)格更低了,Text-embedding-ada-002 是嵌入系統(tǒng)最流行的嵌入模型。如今,其成本降低了 75%,低至每 1K token 0.0001 美元。

最后,還有大家比較關(guān)注的 GPT - 3.5 Turbo,其為數(shù)百萬用戶提供了 ChatGPT 功能。現(xiàn)今,gpt-3.5-turbo 的輸入 token 成本降低了 25%。開發(fā)人員現(xiàn)在使用這個(gè)模型,每 1K 輸入 token 只需 0.0015 美元,每 1K 輸出 token 只需 0.002 美元,這相當(dāng)于每美元大約 700 頁。

參考文獻(xiàn):https://openai.com/blog/function-calling-and-other-api-updates

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港