當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 最新AI預(yù)判｜新的語(yǔ)言模型技術(shù)棧全解

最新AI預(yù)判｜新的語(yǔ)言模型技術(shù)棧全解
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2023-06-18 10:58:59 瀏覽：9138次

導(dǎo)讀：在這幾個(gè)月內(nèi)，ChatGPT借著大語(yǔ)言模型掀起了人工智能行業(yè)的新一輪浪潮，那么在未來(lái)，大語(yǔ)言模型及相關(guān)技術(shù)的發(fā)展又可能呈現(xiàn)哪些趨勢(shì)？本文嘗試進(jìn)行了預(yù)判和解讀，一起來(lái)看看，或許會(huì)對(duì)AI創(chuàng)業(yè)者們有所幫助。今天看到紅杉美國(guó)發(fā)表了一篇新文章：《The New Lan...

在這幾個(gè)月內(nèi)，ChatGPT借著大語(yǔ)言模型掀起了人工智能行業(yè)的新一輪浪潮，那么在未來(lái)，大語(yǔ)言模型及相關(guān)技術(shù)的發(fā)展又可能呈現(xiàn)哪些趨勢(shì)？本文嘗試進(jìn)行了預(yù)判和解讀，一起來(lái)看看，或許會(huì)對(duì)AI創(chuàng)業(yè)者們有所幫助。

今天看到紅杉美國(guó)發(fā)表了一篇新文章：《The New Language Model Stack》，這篇文章內(nèi)容是紅杉美國(guó)在訪談了投資Portfolio里的33家小到種子輪，大到已經(jīng)上市的公司后總結(jié)出來(lái)的。全文總共有8點(diǎn)分析，每一點(diǎn)都結(jié)合了當(dāng)下的最新情況，并給出了對(duì)未來(lái)的判斷。

這篇文章可以說(shuō)是之前生成式AI開(kāi)篇之作：《紅杉觀點(diǎn)｜生成式AI：一個(gè)創(chuàng)造性的新世界》的最新版，干貨非常多。很多內(nèi)容對(duì)AI創(chuàng)業(yè)者應(yīng)該會(huì)有不少幫助，筆者在此借助GPT-4快速翻譯了這篇文章，希望能夠給大家也帶來(lái)最新的思考和啟發(fā)。

導(dǎo)語(yǔ)

ChatGPT憑借大型語(yǔ)言模型（LLMs）引發(fā)了創(chuàng)新的巨浪，越來(lái)越多的公司將自然語(yǔ)言交互的能力引入到他們的產(chǎn)品中。語(yǔ)言模型API的采用正在逐漸形成新的技術(shù)棧。

為了更好地理解人們正在構(gòu)建的應(yīng)用以及他們使用的技術(shù)棧，我們采訪了投資portfolio中的33家公司，范圍從種子階段的初創(chuàng)公司到大型上市企業(yè)。我們分別在兩個(gè)月前和上周與他們交談，來(lái)抓住變化的步伐。許多創(chuàng)始人正在努力解決他們自身的AI策略，盡管這個(gè)領(lǐng)域正在快速發(fā)展，我們?nèi)韵Ｍ窒砦覀兊陌l(fā)現(xiàn)。

一、幾乎所有公司都在產(chǎn)品中用到語(yǔ)言模型

我們看到了一些神奇的自動(dòng)完成（auto-complete）功能，應(yīng)用范圍從編程（Sourcegraph, Warp, Github）到數(shù)據(jù)科學(xué)（Hex）。我們看到更好的聊天機(jī)器人，應(yīng)用于從客戶支持、員工支持到消費(fèi)者娛樂(lè)的各個(gè)領(lǐng)域。其他一些公司正在用AI優(yōu)先的視角重塑整個(gè)工作流程：視覺(jué)藝術(shù)（Midjourney）、營(yíng)銷（Hubspot, Attentive, Drift, Jasper, Copy, Writer）、銷售（Gong）、接觸中心（Cresta）、法律（Ironclad, Harvey）、會(huì)計(jì)（Pilot）、生產(chǎn)力（Notion）、數(shù)據(jù)工程（dbt）、搜索（Glean, Neeva）、購(gòu)物（Instacart）、消費(fèi)支付（Klarna）以及旅行計(jì)劃（Airbnb）。這些只是幾個(gè)例子，而且只是個(gè)開(kāi)始。

二、這些應(yīng)用主要基于API、檢索和編排，但開(kāi)源使用也在增長(zhǎng)

65%的公司已經(jīng)將應(yīng)用投入生產(chǎn)，比兩個(gè)月前的50%有所提高，其余的公司仍在實(shí)驗(yàn)階段。

94%的公司正在使用基礎(chǔ)模型API，在我們的樣本中，OpenAI的GPT是首選，占比達(dá)到了91%，但是，Anthropic在上個(gè)季度的關(guān)注度增長(zhǎng)到了15%。（有些公司使用多個(gè)模型）。

88%的公司認(rèn)為檢索技術(shù)，如向量數(shù)據(jù)庫(kù)，將繼續(xù)是他們技術(shù)棧的關(guān)鍵部分。檢索模型通過(guò)檢索相關(guān)上下文來(lái)提高結(jié)果的質(zhì)量，減少“幻覺(jué)”（不準(zhǔn)確之處），并解決數(shù)據(jù)實(shí)時(shí)性的問(wèn)題。一些公司使用專門構(gòu)建的向量數(shù)據(jù)庫(kù)（如Pinecone，Weaviate，Chroma，Qdrant，Milvus等），而其他公司則使用pgvector或AWS的產(chǎn)品。

38%的公司對(duì)像LangChain這樣的LLM編排和應(yīng)用開(kāi)發(fā)框架感興趣，一些公司用它進(jìn)行原型設(shè)計(jì)，而其他公司則將其投入生產(chǎn)。在過(guò)去的幾個(gè)月里，采用率有所提高。

不到10%的公司正在尋找用于監(jiān)控LLM輸出、成本或性能并進(jìn)行A/B測(cè)試提示的工具。我們認(rèn)為，隨著越來(lái)越多的大公司和受監(jiān)管的行業(yè)開(kāi)始采用語(yǔ)言模型，這些一數(shù)字可能會(huì)增加。

少數(shù)公司正在研究補(bǔ)充性的生成技術(shù)，如將生成文本和語(yǔ)音結(jié)合。我們也認(rèn)為這是一個(gè)令人興奮的增長(zhǎng)領(lǐng)域。

15%的公司從頭開(kāi)始或使用開(kāi)源資源構(gòu)建了自定義的語(yǔ)言模型，通常還會(huì)使用LLM API。從幾個(gè)月前開(kāi)始，自定義模型的訓(xùn)練意義增加了。這需要自己的計(jì)算堆棧、模型中心、托管、訓(xùn)練框架、實(shí)驗(yàn)跟蹤等，來(lái)自Hugging Face，Replicate，F(xiàn)oundry，Tecton，Weights & Biases，PyTorch，Scale等受人喜愛(ài)的公司對(duì)此提供了支持。

我們與每一位實(shí)踐者交談的結(jié)果顯示，AI的發(fā)展速度太快，以至于很難對(duì)最終的技術(shù)棧有高度的信心，但大家一致認(rèn)為，LLM API將繼續(xù)作為一個(gè)關(guān)鍵支柱，其次是檢索機(jī)制和像LangChain這樣的開(kāi)發(fā)框架。開(kāi)源和自定義模型的訓(xùn)練和調(diào)整似乎也在增長(zhǎng)。語(yǔ)言模型技術(shù)棧的其他領(lǐng)域也很重要，但成熟度較低。

三、公司希望根據(jù)自己的上下文來(lái)定制語(yǔ)言模型

通用語(yǔ)言模型非常強(qiáng)大，但對(duì)于許多用例來(lái)說(shuō)，它們并不能區(qū)分和滿足需求。公司希望在他們的數(shù)據(jù)上啟用自然語(yǔ)言交互他們的開(kāi)發(fā)文檔、產(chǎn)品庫(kù)存、人力資源或IT規(guī)則等。在某些情況下，公司也希望根據(jù)用戶的數(shù)據(jù)定制他們的模型：你的個(gè)人筆記、設(shè)計(jì)布局、數(shù)據(jù)指標(biāo)和代碼庫(kù)等。

目前，有三種主要的方式來(lái)定制語(yǔ)言模型：

從頭開(kāi)始訓(xùn)練自定義模型，難度最高。

這是解決此問(wèn)題的最傳統(tǒng)且最困難的方式，它通常需要高度熟練的機(jī)器學(xué)習(xí)科學(xué)家、大量相關(guān)的數(shù)據(jù)、訓(xùn)練基礎(chǔ)設(shè)施和計(jì)算能力。

這也是歷史上大部分自然語(yǔ)言處理創(chuàng)新發(fā)生在大型科技公司的主要原因之一，BloombergGPT是一個(gè)在大型科技公司之外進(jìn)行自定義模型嘗試的例子，他們使用了Hugging Face和其他開(kāi)源工具的資源。隨著開(kāi)源工具的改進(jìn)和更多公司使用LLM進(jìn)行創(chuàng)新，我們預(yù)計(jì)會(huì)看到更多的自定義和預(yù)訓(xùn)練模型的使用。

微調(diào)基礎(chǔ)模型，難度中等。

這是通過(guò)使用進(jìn)一步的專有或領(lǐng)域特定數(shù)據(jù)對(duì)預(yù)訓(xùn)練模型的權(quán)重進(jìn)行額外訓(xùn)練來(lái)進(jìn)行微調(diào)，開(kāi)源創(chuàng)新也使這種方法越來(lái)越可行，但它仍然通常需要一個(gè)成熟的團(tuán)隊(duì)。一些實(shí)踐者私下承認(rèn)，微調(diào)比聽(tīng)起來(lái)要難得多，可能會(huì)產(chǎn)生意想不到的后果，如模型漂移和無(wú)預(yù)警的“破壞”模型的其他技能。雖然這種方法有很大的可能性會(huì)變得更為常見(jiàn)，但目前對(duì)大多數(shù)公司來(lái)說(shuō)仍然遙不可及。但再次強(qiáng)調(diào)，這種情況正在快速改變。

使用預(yù)訓(xùn)練模型并檢索相關(guān)上下文，難度最低。

人們經(jīng)常認(rèn)為他們想要一個(gè)專門為他們微調(diào)的模型，但實(shí)際上他們只是希望模型在正確的時(shí)間推理他們的信息。有許多方法可以在正確的時(shí)間向模型提供正確的信息：向SQL數(shù)據(jù)庫(kù)提出結(jié)構(gòu)化查詢，搜索整個(gè)產(chǎn)品目錄，調(diào)用一些外部API或使用嵌入檢索。

嵌入檢索的優(yōu)點(diǎn)是它使得使用自然語(yǔ)言輕松搜索非結(jié)構(gòu)化數(shù)據(jù)成為可能。從技術(shù)上講，這是通過(guò)獲取數(shù)據(jù)，將其轉(zhuǎn)換為嵌入（embedding），將這些嵌入存儲(chǔ)在向量數(shù)據(jù)庫(kù)中，當(dāng)查詢發(fā)生時(shí)，搜索這些嵌入以找到最相關(guān)的上下文，并將其提供給模型來(lái)實(shí)現(xiàn)的。這種方法可以幫助你解決模型有限的上下文窗口問(wèn)題，成本更低，解決了數(shù)據(jù)實(shí)時(shí)性的問(wèn)題（例如，ChatGPT不知道2021年9月以后的世界），而且它可以由沒(méi)有正規(guī)機(jī)器學(xué)習(xí)培訓(xùn)的獨(dú)立開(kāi)發(fā)者完成。關(guān)于這塊技術(shù)內(nèi)容可以看深思圈之前的文章：零基礎(chǔ)｜搭建基于私域數(shù)據(jù)的ChatGPT

向量數(shù)據(jù)庫(kù)很有用，因?yàn)樵诟咭?guī)模下，它們使存儲(chǔ)、搜索和更新嵌入變得更加簡(jiǎn)單。到目前為止，我們觀察到大公司往往會(huì)遵守他們的企業(yè)云協(xié)議，并使用他們的云提供商的工具，而初創(chuàng)公司傾向于使用專為向量數(shù)據(jù)庫(kù)設(shè)計(jì)的工具。然而，這個(gè)領(lǐng)域的變化非�？�。上下文窗口正在擴(kuò)大（最新消息，OpenAI剛剛擴(kuò)展到16K，而Anthropic已經(jīng)推出了一個(gè)100K token的上下文窗口）。基礎(chǔ)模型和云數(shù)據(jù)庫(kù)可能會(huì)直接將檢索嵌入到他們的服務(wù)中，我們將密切關(guān)注這個(gè)市場(chǎng)的演變。

四、如今API調(diào)用和訓(xùn)練模型是相互獨(dú)立的，但未來(lái)兩者將慢慢融合在一起

有時(shí)候，我們可能會(huì)覺(jué)得我們面臨著兩種技術(shù)棧的選擇：一種是利用LLM API的技術(shù)棧（更傾向于閉源，針對(duì)開(kāi)發(fā)人員設(shè)計(jì)）；另一種是訓(xùn)練自定義語(yǔ)言模型的技術(shù)棧（更傾向于開(kāi)源，歷史上針對(duì)更復(fù)雜的機(jī)器學(xué)習(xí)團(tuán)隊(duì)設(shè)計(jì)）。

有些人想知道，如果LLMs通過(guò)API輕松獲取，那么公司是否會(huì)減少自己的自定義訓(xùn)練。

然而，我們目前看到的情況正好相反。

隨著人工智能的關(guān)注度提高和開(kāi)源開(kāi)發(fā)的加速，越來(lái)越多的公司對(duì)訓(xùn)練和微調(diào)自己的模型產(chǎn)生了興趣。我們認(rèn)為，隨著時(shí)間的推移，LLM API技術(shù)棧和自定義模型技術(shù)棧會(huì)越來(lái)越融合。例如，一家公司可能會(huì)從開(kāi)源項(xiàng)目中訓(xùn)練自己的語(yǔ)言模型，但又通過(guò)向量數(shù)據(jù)庫(kù)來(lái)進(jìn)行檢索以解決數(shù)據(jù)實(shí)時(shí)性的問(wèn)題。為自定義模型堆棧構(gòu)建工具的智能初創(chuàng)公司也正在努力擴(kuò)展他們的產(chǎn)品，以適應(yīng)LLM API革命的需求。

五、技術(shù)棧正在變得越來(lái)越易于開(kāi)發(fā)者使用

語(yǔ)言模型API讓普通開(kāi)發(fā)者也能手握強(qiáng)大的現(xiàn)成模型，而不僅僅是機(jī)器學(xué)習(xí)團(tuán)隊(duì)�，F(xiàn)在，與語(yǔ)言模型打交道的人群已經(jīng)明顯擴(kuò)大到所有開(kāi)發(fā)者，我們相信將會(huì)看到更多面向開(kāi)發(fā)者的工具。例如，LangChain通過(guò)抽象化常見(jiàn)問(wèn)題，幫助開(kāi)發(fā)者構(gòu)建LLM應(yīng)用：將模型組合成更高級(jí)的系統(tǒng)，將多個(gè)模型調(diào)用鏈接在一起，將模型連接到工具和數(shù)據(jù)源，構(gòu)建能夠操作這些工具的代理，以及通過(guò)簡(jiǎn)化語(yǔ)言模型切換的過(guò)程，幫助避免對(duì)供應(yīng)商的依賴。有些人使用LangChain進(jìn)行原型設(shè)計(jì)，而其他人則繼續(xù)在生產(chǎn)中使用它。

六、語(yǔ)言模型需要變得更可靠（輸出質(zhì)量、數(shù)據(jù)隱私和安全性）

在全面引入LLM到他們的應(yīng)用之前，許多公司希望有更好的工具來(lái)處理數(shù)據(jù)隱私、隔離、安全、版權(quán)和監(jiān)控模型輸出。來(lái)自金融科技到醫(yī)療保健的受監(jiān)管行業(yè)的公司特別關(guān)注這一點(diǎn)，并報(bào)告說(shuō)他們?cè)趯ふ臆浖鉀Q方案來(lái)解決這個(gè)問(wèn)題（對(duì)創(chuàng)始人來(lái)說(shuō)這是一個(gè)成熟的領(lǐng)域）上遇到了困難。

理想的情況是：如果不能防止模型生成錯(cuò)誤/幻覺(jué)、歧視性內(nèi)容、危險(xiǎn)內(nèi)容或其他問(wèn)題，軟件可以及時(shí)給出警告信息。一些公司也關(guān)注與模型分享的數(shù)據(jù)如何被用于訓(xùn)練：例如，很少有人知道ChatGPT消費(fèi)者數(shù)據(jù)默認(rèn)用于訓(xùn)練，而ChatGPT商業(yè)版和API數(shù)據(jù)則不是。隨著政策的明確和更多的安全措施到位，語(yǔ)言模型將得到更好的信任，這時(shí)候我們就會(huì)看到采用率的另一個(gè)階段性改變。

七、語(yǔ)言模型應(yīng)用將變得越來(lái)越多模態(tài)

有公司已經(jīng)在尋找有趣的方式將多個(gè)生成模型結(jié)合起來(lái)產(chǎn)生巨大的效果：結(jié)合文本和語(yǔ)音生成的聊天機(jī)器人解鎖了新的對(duì)話體驗(yàn)層次。文本和語(yǔ)音模型可以結(jié)合起來(lái)，幫助你快速修復(fù)視頻錄制錯(cuò)誤，而不用重新錄制整個(gè)視頻。模型本身也正變得越來(lái)越多模態(tài)。我們可以想象未來(lái)豐富的消費(fèi)者和企業(yè)AI應(yīng)用，將文本、語(yǔ)音/音頻和圖像/視頻生成結(jié)合起來(lái)，創(chuàng)造更吸引人的用戶體驗(yàn)，并完成更復(fù)雜的任務(wù)。

八、目前還僅僅只是初期階段

AI剛剛開(kāi)始滲透到技術(shù)的每一個(gè)角落，只有65%的受訪者今天已經(jīng)開(kāi)始嘗試，而且其中很多都是相對(duì)簡(jiǎn)單的應(yīng)用。隨著更多的公司推出LLM應(yīng)用，新的難題將會(huì)出現(xiàn)為創(chuàng)業(yè)者創(chuàng)造更多的機(jī)會(huì)。基礎(chǔ)設(shè)施層（我理解就是中間層的意思）將在未來(lái)幾年內(nèi)快速發(fā)展，如果我們看到的一半Demo演示都能真正落地投入生產(chǎn)，那么前方等待我們的將是一次令人激動(dòng)的旅程�？吹轿覀冏钤缙诘腁rc孵化投資的公司到Zoom的創(chuàng)業(yè)者們都在專注于同一件事情：用AI讓用戶愉快，這是令人激動(dòng)的。

If you’re founding a company that will become a key pillar of the language model stack or an AI-first application, Sequoia would love to meet you.

紅杉美國(guó)正在尋找并投資那些將成為語(yǔ)言模型技術(shù)棧的關(guān)鍵支柱或AI優(yōu)先應(yīng)用的公司。

參考材料：

[1]https://www.sequoiacap.com/article/llm-stack-perspective/

結(jié)尾

在看完這篇文章后，又重新回顧了一下去年9月份在這波AI浪潮還未開(kāi)始前的這篇紅杉美國(guó)的預(yù)判和分析《紅杉觀點(diǎn)｜生成式AI：一個(gè)創(chuàng)造性的新世界》。不得不感嘆老牌VC的分析和預(yù)判能力，成功預(yù)測(cè)了最近幾個(gè)月的AI浪潮或者說(shuō)正是這篇文章開(kāi)啟了這樣一個(gè)新的浪潮。希望這篇文章也能給更多AI創(chuàng)業(yè)者一些新的啟發(fā)與思考，另外關(guān)于更多Plugin和AI生態(tài)的分析，可以閱讀我之前的文章AGI要來(lái)了？AI Paradigm的新階段和新趨勢(shì)。