展會(huì)信息港展會(huì)大全

最新AI預(yù)判|新的語(yǔ)言模型技術(shù)棧全解
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-18 10:58:59   瀏覽:9138次  

導(dǎo)讀:在這幾個(gè)月內(nèi),ChatGPT借著大語(yǔ)言模型掀起了人工智能行業(yè)的新一輪浪潮,那么在未來(lái),大語(yǔ)言模型及相關(guān)技術(shù)的發(fā)展又可能呈現(xiàn)哪些趨勢(shì)?本文嘗試進(jìn)行了預(yù)判和解讀,一起來(lái)看看,或許會(huì)對(duì)AI創(chuàng)業(yè)者們有所幫助。 今天看到紅杉美國(guó)發(fā)表了一篇新文章:《The New Lan...

在這幾個(gè)月內(nèi),ChatGPT借著大語(yǔ)言模型掀起了人工智能行業(yè)的新一輪浪潮,那么在未來(lái),大語(yǔ)言模型及相關(guān)技術(shù)的發(fā)展又可能呈現(xiàn)哪些趨勢(shì)?本文嘗試進(jìn)行了預(yù)判和解讀,一起來(lái)看看,或許會(huì)對(duì)AI創(chuàng)業(yè)者們有所幫助。

今天看到紅杉美國(guó)發(fā)表了一篇新文章:《The New Language Model Stack》,這篇文章內(nèi)容是紅杉美國(guó)在訪談了投資Portfolio里的33家小到種子輪,大到已經(jīng)上市的公司后總結(jié)出來(lái)的。全文總共有8點(diǎn)分析,每一點(diǎn)都結(jié)合了當(dāng)下的最新情況,并給出了對(duì)未來(lái)的判斷。

這篇文章可以說(shuō)是之前生成式AI開(kāi)篇之作:《紅杉觀點(diǎn)|生成式AI:一個(gè)創(chuàng)造性的新世界》的最新版,干貨非常多。很多內(nèi)容對(duì)AI創(chuàng)業(yè)者應(yīng)該會(huì)有不少幫助,筆者在此借助GPT-4快速翻譯了這篇文章,希望能夠給大家也帶來(lái)最新的思考和啟發(fā)。

導(dǎo)語(yǔ)

ChatGPT憑借大型語(yǔ)言模型(LLMs)引發(fā)了創(chuàng)新的巨浪,越來(lái)越多的公司將自然語(yǔ)言交互的能力引入到他們的產(chǎn)品中。語(yǔ)言模型API的采用正在逐漸形成新的技術(shù)棧。

為了更好地理解人們正在構(gòu)建的應(yīng)用以及他們使用的技術(shù)棧,我們采訪了投資portfolio中的33家公司,范圍從種子階段的初創(chuàng)公司到大型上市企業(yè)。我們分別在兩個(gè)月前和上周與他們交談,來(lái)抓住變化的步伐。許多創(chuàng)始人正在努力解決他們自身的AI策略,盡管這個(gè)領(lǐng)域正在快速發(fā)展,我們?nèi)韵M窒砦覀兊陌l(fā)現(xiàn)。

一、幾乎所有公司都在產(chǎn)品中用到語(yǔ)言模型

我們看到了一些神奇的自動(dòng)完成(auto-complete)功能,應(yīng)用范圍從編程(Sourcegraph, Warp, Github)到數(shù)據(jù)科學(xué)(Hex)。我們看到更好的聊天機(jī)器人,應(yīng)用于從客戶支持、員工支持到消費(fèi)者娛樂(lè)的各個(gè)領(lǐng)域。其他一些公司正在用AI優(yōu)先的視角重塑整個(gè)工作流程:視覺(jué)藝術(shù)(Midjourney)、營(yíng)銷(Hubspot, Attentive, Drift, Jasper, Copy, Writer)、銷售(Gong)、接觸中心(Cresta)、法律(Ironclad, Harvey)、會(huì)計(jì)(Pilot)、生產(chǎn)力(Notion)、數(shù)據(jù)工程(dbt)、搜索(Glean, Neeva)、購(gòu)物(Instacart)、消費(fèi)支付(Klarna)以及旅行計(jì)劃(Airbnb)。這些只是幾個(gè)例子,而且只是個(gè)開(kāi)始。

二、這些應(yīng)用主要基于API、檢索和編排,但開(kāi)源使用也在增長(zhǎng)

65%的公司已經(jīng)將應(yīng)用投入生產(chǎn),比兩個(gè)月前的50%有所提高,其余的公司仍在實(shí)驗(yàn)階段。

94%的公司正在使用基礎(chǔ)模型API,在我們的樣本中,OpenAI的GPT是首選,占比達(dá)到了91%,但是,Anthropic在上個(gè)季度的關(guān)注度增長(zhǎng)到了15%。(有些公司使用多個(gè)模型)。

88%的公司認(rèn)為檢索技術(shù),如向量數(shù)據(jù)庫(kù),將繼續(xù)是他們技術(shù)棧的關(guān)鍵部分。檢索模型通過(guò)檢索相關(guān)上下文來(lái)提高結(jié)果的質(zhì)量,減少“幻覺(jué)”(不準(zhǔn)確之處),并解決數(shù)據(jù)實(shí)時(shí)性的問(wèn)題。一些公司使用專門構(gòu)建的向量數(shù)據(jù)庫(kù)(如Pinecone,Weaviate,Chroma,Qdrant,Milvus等),而其他公司則使用pgvector或AWS的產(chǎn)品。

38%的公司對(duì)像LangChain這樣的LLM編排和應(yīng)用開(kāi)發(fā)框架感興趣,一些公司用它進(jìn)行原型設(shè)計(jì),而其他公司則將其投入生產(chǎn)。在過(guò)去的幾個(gè)月里,采用率有所提高。

不到10%的公司正在尋找用于監(jiān)控LLM輸出、成本或性能并進(jìn)行A/B測(cè)試提示的工具。我們認(rèn)為,隨著越來(lái)越多的大公司和受監(jiān)管的行業(yè)開(kāi)始采用語(yǔ)言模型,這些一數(shù)字可能會(huì)增加。

少數(shù)公司正在研究補(bǔ)充性的生成技術(shù),如將生成文本和語(yǔ)音結(jié)合。我們也認(rèn)為這是一個(gè)令人興奮的增長(zhǎng)領(lǐng)域。

15%的公司從頭開(kāi)始或使用開(kāi)源資源構(gòu)建了自定義的語(yǔ)言模型,通常還會(huì)使用LLM API。從幾個(gè)月前開(kāi)始,自定義模型的訓(xùn)練意義增加了。這需要自己的計(jì)算堆棧、模型中心、托管、訓(xùn)練框架、實(shí)驗(yàn)跟蹤等,來(lái)自Hugging Face,Replicate,F(xiàn)oundry,Tecton,Weights & Biases,PyTorch,Scale等受人喜愛(ài)的公司對(duì)此提供了支持。

我們與每一位實(shí)踐者交談的結(jié)果顯示,AI的發(fā)展速度太快,以至于很難對(duì)最終的技術(shù)棧有高度的信心,但大家一致認(rèn)為,LLM API將繼續(xù)作為一個(gè)關(guān)鍵支柱,其次是檢索機(jī)制像LangChain這樣的開(kāi)發(fā)框架。開(kāi)源和自定義模型的訓(xùn)練和調(diào)整似乎也在增長(zhǎng)。語(yǔ)言模型技術(shù)棧的其他領(lǐng)域也很重要,但成熟度較低。

三、公司希望根據(jù)自己的上下文來(lái)定制語(yǔ)言模型

通用語(yǔ)言模型非常強(qiáng)大,但對(duì)于許多用例來(lái)說(shuō),它們并不能區(qū)分和滿足需求。公司希望在他們的數(shù)據(jù)上啟用自然語(yǔ)言交互他們的開(kāi)發(fā)文檔、產(chǎn)品庫(kù)存、人力資源或IT規(guī)則等。在某些情況下,公司也希望根據(jù)用戶的數(shù)據(jù)定制他們的模型:你的個(gè)人筆記、設(shè)計(jì)布局、數(shù)據(jù)指標(biāo)和代碼庫(kù)等。

目前,有三種主要的方式來(lái)定制語(yǔ)言模型:

從頭開(kāi)始訓(xùn)練自定義模型,難度最高。

這是解決此問(wèn)題的最傳統(tǒng)且最困難的方式,它通常需要高度熟練的機(jī)器學(xué)習(xí)科學(xué)家、大量相關(guān)的數(shù)據(jù)、訓(xùn)練基礎(chǔ)設(shè)施和計(jì)算能力。

這也是歷史上大部分自然語(yǔ)言處理創(chuàng)新發(fā)生在大型科技公司的主要原因之一,BloombergGPT是一個(gè)在大型科技公司之外進(jìn)行自定義模型嘗試的例子,他們使用了Hugging Face和其他開(kāi)源工具的資源。隨著開(kāi)源工具的改進(jìn)和更多公司使用LLM進(jìn)行創(chuàng)新,我們預(yù)計(jì)會(huì)看到更多的自定義和預(yù)訓(xùn)練模型的使用。

微調(diào)基礎(chǔ)模型,難度中等。

這是通過(guò)使用進(jìn)一步的專有或領(lǐng)域特定數(shù)據(jù)對(duì)預(yù)訓(xùn)練模型的權(quán)重進(jìn)行額外訓(xùn)練來(lái)進(jìn)行微調(diào),開(kāi)源創(chuàng)新也使這種方法越來(lái)越可行,但它仍然通常需要一個(gè)成熟的團(tuán)隊(duì)。一些實(shí)踐者私下承認(rèn),微調(diào)比聽(tīng)起來(lái)要難得多,可能會(huì)產(chǎn)生意想不到的后果,如模型漂移無(wú)預(yù)警的“破壞”模型的其他技能。雖然這種方法有很大的可能性會(huì)變得更為常見(jiàn),但目前對(duì)大多數(shù)公司來(lái)說(shuō)仍然遙不可及。但再次強(qiáng)調(diào),這種情況正在快速改變。

使用預(yù)訓(xùn)練模型并檢索相關(guān)上下文,難度最低。

人們經(jīng)常認(rèn)為他們想要一個(gè)專門為他們微調(diào)的模型,但實(shí)際上他們只是希望模型在正確的時(shí)間推理他們的信息。有許多方法可以在正確的時(shí)間向模型提供正確的信息:向SQL數(shù)據(jù)庫(kù)提出結(jié)構(gòu)化查詢,搜索整個(gè)產(chǎn)品目錄,調(diào)用一些外部API或使用嵌入檢索。

嵌入檢索的優(yōu)點(diǎn)是它使得使用自然語(yǔ)言輕松搜索非結(jié)構(gòu)化數(shù)據(jù)成為可能。從技術(shù)上講,這是通過(guò)獲取數(shù)據(jù),將其轉(zhuǎn)換為嵌入(embedding),將這些嵌入存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,當(dāng)查詢發(fā)生時(shí),搜索這些嵌入以找到最相關(guān)的上下文,并將其提供給模型來(lái)實(shí)現(xiàn)的。這種方法可以幫助你解決模型有限的上下文窗口問(wèn)題,成本更低,解決了數(shù)據(jù)實(shí)時(shí)性的問(wèn)題(例如,ChatGPT不知道2021年9月以后的世界),而且它可以由沒(méi)有正規(guī)機(jī)器學(xué)習(xí)培訓(xùn)的獨(dú)立開(kāi)發(fā)者完成。關(guān)于這塊技術(shù)內(nèi)容可以看深思圈之前的文章:零基礎(chǔ)|搭建基于私域數(shù)據(jù)的ChatGPT

向量數(shù)據(jù)庫(kù)很有用,因?yàn)樵诟咭?guī)模下,它們使存儲(chǔ)、搜索和更新嵌入變得更加簡(jiǎn)單。到目前為止,我們觀察到大公司往往會(huì)遵守他們的企業(yè)云協(xié)議,并使用他們的云提供商的工具,而初創(chuàng)公司傾向于使用專為向量數(shù)據(jù)庫(kù)設(shè)計(jì)的工具。然而,這個(gè)領(lǐng)域的變化非?。上下文窗口正在擴(kuò)大(最新消息,OpenAI剛剛擴(kuò)展到16K,而Anthropic已經(jīng)推出了一個(gè)100K token的上下文窗口)。基礎(chǔ)模型和云數(shù)據(jù)庫(kù)可能會(huì)直接將檢索嵌入到他們的服務(wù)中,我們將密切關(guān)注這個(gè)市場(chǎng)的演變。

四、如今API調(diào)用和訓(xùn)練模型是相互獨(dú)立的,但未來(lái)兩者將慢慢融合在一起

有時(shí)候,我們可能會(huì)覺(jué)得我們面臨著兩種技術(shù)棧的選擇:一種是利用LLM API的技術(shù)棧(更傾向于閉源,針對(duì)開(kāi)發(fā)人員設(shè)計(jì));另一種是訓(xùn)練自定義語(yǔ)言模型的技術(shù)棧(更傾向于開(kāi)源,歷史上針對(duì)更復(fù)雜的機(jī)器學(xué)習(xí)團(tuán)隊(duì)設(shè)計(jì))。

有些人想知道,如果LLMs通過(guò)API輕松獲取,那么公司是否會(huì)減少自己的自定義訓(xùn)練。

然而,我們目前看到的情況正好相反。

隨著人工智能的關(guān)注度提高和開(kāi)源開(kāi)發(fā)的加速,越來(lái)越多的公司對(duì)訓(xùn)練和微調(diào)自己的模型產(chǎn)生了興趣。我們認(rèn)為,隨著時(shí)間的推移,LLM API技術(shù)棧和自定義模型技術(shù)棧會(huì)越來(lái)越融合。例如,一家公司可能會(huì)從開(kāi)源項(xiàng)目中訓(xùn)練自己的語(yǔ)言模型,但又通過(guò)向量數(shù)據(jù)庫(kù)來(lái)進(jìn)行檢索以解決數(shù)據(jù)實(shí)時(shí)性的問(wèn)題。為自定義模型堆棧構(gòu)建工具的智能初創(chuàng)公司也正在努力擴(kuò)展他們的產(chǎn)品,以適應(yīng)LLM API革命的需求。

五、技術(shù)棧正在變得越來(lái)越易于開(kāi)發(fā)者使用

語(yǔ)言模型API讓普通開(kāi)發(fā)者也能手握強(qiáng)大的現(xiàn)成模型,而不僅僅是機(jī)器學(xué)習(xí)團(tuán)隊(duì),F(xiàn)在,與語(yǔ)言模型打交道的人群已經(jīng)明顯擴(kuò)大到所有開(kāi)發(fā)者,我們相信將會(huì)看到更多面向開(kāi)發(fā)者的工具。例如,LangChain通過(guò)抽象化常見(jiàn)問(wèn)題,幫助開(kāi)發(fā)者構(gòu)建LLM應(yīng)用:將模型組合成更高級(jí)的系統(tǒng),將多個(gè)模型調(diào)用鏈接在一起,將模型連接到工具和數(shù)據(jù)源,構(gòu)建能夠操作這些工具的代理,以及通過(guò)簡(jiǎn)化語(yǔ)言模型切換的過(guò)程,幫助避免對(duì)供應(yīng)商的依賴。有些人使用LangChain進(jìn)行原型設(shè)計(jì),而其他人則繼續(xù)在生產(chǎn)中使用它。

六、語(yǔ)言模型需要變得更可靠(輸出質(zhì)量、數(shù)據(jù)隱私和安全性)

在全面引入LLM到他們的應(yīng)用之前,許多公司希望有更好的工具來(lái)處理數(shù)據(jù)隱私、隔離、安全、版權(quán)和監(jiān)控模型輸出。來(lái)自金融科技到醫(yī)療保健的受監(jiān)管行業(yè)的公司特別關(guān)注這一點(diǎn),并報(bào)告說(shuō)他們?cè)趯ふ臆浖鉀Q方案來(lái)解決這個(gè)問(wèn)題(對(duì)創(chuàng)始人來(lái)說(shuō)這是一個(gè)成熟的領(lǐng)域)上遇到了困難。

理想的情況是:如果不能防止模型生成錯(cuò)誤/幻覺(jué)、歧視性內(nèi)容、危險(xiǎn)內(nèi)容或其他問(wèn)題,軟件可以及時(shí)給出警告信息。一些公司也關(guān)注與模型分享的數(shù)據(jù)如何被用于訓(xùn)練:例如,很少有人知道ChatGPT消費(fèi)者數(shù)據(jù)默認(rèn)用于訓(xùn)練,而ChatGPT商業(yè)版和API數(shù)據(jù)則不是。隨著政策的明確和更多的安全措施到位,語(yǔ)言模型將得到更好的信任,這時(shí)候我們就會(huì)看到采用率的另一個(gè)階段性改變。

七、語(yǔ)言模型應(yīng)用將變得越來(lái)越多模態(tài)

有公司已經(jīng)在尋找有趣的方式將多個(gè)生成模型結(jié)合起來(lái)產(chǎn)生巨大的效果:結(jié)合文本和語(yǔ)音生成的聊天機(jī)器人解鎖了新的對(duì)話體驗(yàn)層次。文本和語(yǔ)音模型可以結(jié)合起來(lái),幫助你快速修復(fù)視頻錄制錯(cuò)誤,而不用重新錄制整個(gè)視頻。模型本身也正變得越來(lái)越多模態(tài)。我們可以想象未來(lái)豐富的消費(fèi)者和企業(yè)AI應(yīng)用,將文本、語(yǔ)音/音頻和圖像/視頻生成結(jié)合起來(lái),創(chuàng)造更吸引人的用戶體驗(yàn),并完成更復(fù)雜的任務(wù)。

八、目前還僅僅只是初期階段

AI剛剛開(kāi)始滲透到技術(shù)的每一個(gè)角落,只有65%的受訪者今天已經(jīng)開(kāi)始嘗試,而且其中很多都是相對(duì)簡(jiǎn)單的應(yīng)用。隨著更多的公司推出LLM應(yīng)用,新的難題將會(huì)出現(xiàn)為創(chuàng)業(yè)者創(chuàng)造更多的機(jī)會(huì)。基礎(chǔ)設(shè)施層(我理解就是中間層的意思)將在未來(lái)幾年內(nèi)快速發(fā)展,如果我們看到的一半Demo演示都能真正落地投入生產(chǎn),那么前方等待我們的將是一次令人激動(dòng)的旅程?吹轿覀冏钤缙诘腁rc孵化投資的公司到Zoom的創(chuàng)業(yè)者們都在專注于同一件事情:用AI讓用戶愉快,這是令人激動(dòng)的。

If you’re founding a company that will become a key pillar of the language model stack or an AI-first application, Sequoia would love to meet you.

紅杉美國(guó)正在尋找并投資那些將成為語(yǔ)言模型技術(shù)棧的關(guān)鍵支柱或AI優(yōu)先應(yīng)用的公司。

參考材料:

[1]https://www.sequoiacap.com/article/llm-stack-perspective/

結(jié)尾

在看完這篇文章后,又重新回顧了一下去年9月份在這波AI浪潮還未開(kāi)始前的這篇紅杉美國(guó)的預(yù)判和分析《紅杉觀點(diǎn)|生成式AI:一個(gè)創(chuàng)造性的新世界》。不得不感嘆老牌VC的分析和預(yù)判能力,成功預(yù)測(cè)了最近幾個(gè)月的AI浪潮或者說(shuō)正是這篇文章開(kāi)啟了這樣一個(gè)新的浪潮。希望這篇文章也能給更多AI創(chuàng)業(yè)者一些新的啟發(fā)與思考,另外關(guān)于更多Plugin和AI生態(tài)的分析,可以閱讀我之前的文章AGI要來(lái)了?AI Paradigm的新階段和新趨勢(shì)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港