當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 紅杉資本：關(guān)于AI的一份訪談報(bào)告

紅杉資本：關(guān)于AI的一份訪談報(bào)告
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2023-06-19 08:49:46 瀏覽：6631次

導(dǎo)讀：作者| Michelle Fradin Lauren Reeder 來(lái)源| Sequoiacap 導(dǎo)語(yǔ)：所有被訪企業(yè)都認(rèn)為AI的發(fā)展速度太快，難以跟上節(jié)奏。 ChatGPT通過(guò)大型語(yǔ)言模型(Large Language Models)引發(fā)了創(chuàng)新浪潮，越來(lái)越多的公司將自然語(yǔ)言交互的能力應(yīng)用到他們的產(chǎn)品中。語(yǔ)言模型API...

作者| Michelle Fradin & Lauren Reeder

來(lái)源| Sequoiacap

導(dǎo)語(yǔ)：所有被訪企業(yè)都認(rèn)為AI的發(fā)展速度太快，難以跟上節(jié)奏。

ChatGPT通過(guò)大型語(yǔ)言模型(Large Language Models)引發(fā)了創(chuàng)新浪潮，越來(lái)越多的公司將自然語(yǔ)言交互的能力應(yīng)用到他們的產(chǎn)品中。

語(yǔ)言模型API的采用正在形成一種新的技術(shù)風(fēng)潮。為了更好地了解人們正在構(gòu)建的應(yīng)用和所使用的技術(shù)棧，我們與紅杉網(wǎng)絡(luò)中的33家公司進(jìn)行了訪談，包括種子階段的初創(chuàng)企業(yè)和大型上市企業(yè)。

我們?cè)趦蓚€(gè)月前和上周進(jìn)行了訪談，以捕捉到變化的速度。

由于許多創(chuàng)始人和開(kāi)發(fā)者自己還在摸索他們的人工智能戰(zhàn)略，我們希望分享我們的發(fā)現(xiàn)，即使這個(gè)領(lǐng)域正在快速發(fā)展。

紅杉網(wǎng)絡(luò)中的幾乎每家公司都在將語(yǔ)言模型集成到他們的產(chǎn)品中

我們已經(jīng)看到了許多神奇的自動(dòng)完成功能，涵蓋了從代碼（Sourcegraph、Warp、Github）到數(shù)據(jù)科學(xué)（Hex）的各個(gè)領(lǐng)域。我們還看到了更好的聊天機(jī)器人，用于客戶支持、員工支持和消費(fèi)者娛樂(lè)等方面。

其他一些公司則通過(guò)以人工智能為核心來(lái)重新構(gòu)想整個(gè)工作流程，如視覺(jué)藝術(shù)（Midjourney）、營(yíng)銷(xiāo)（Hubspot、Attentive、Drift、Jasper、Copy、Writer）、銷(xiāo)售（Gong）、聯(lián)系中心（Cresta）、法律（Ironclad、Harvey）、會(huì)計(jì)（Pilot）、生產(chǎn)力（Notion）、數(shù)據(jù)工程（dbt）、搜索（Glean、Neeva）、雜貨購(gòu)物（Instacart）、消費(fèi)者支付（Klarna）和旅行規(guī)劃（Airbnb）。這只是一小部分示例，這僅僅只是開(kāi)始。

應(yīng)用程序的新技術(shù)棧以語(yǔ)言模型API、檢索和編排為中心，

但開(kāi)源模型的使用也在增長(zhǎng)

65%的公司已經(jīng)將應(yīng)用程序投入生產(chǎn)，相比兩個(gè)月前的50%有所增加，其余的公司仍在進(jìn)行實(shí)驗(yàn)。

94%的公司正在使用基礎(chǔ)模型API。在我們的樣本中，OpenAI的GPT是明顯的首選，占比為91%，然而Anthropic的興趣在過(guò)去的一個(gè)季度增長(zhǎng)到了15%（有些公司使用多個(gè)模型）。

88%的公司認(rèn)為檢索機(jī)制，比如向量數(shù)據(jù)庫(kù)，將仍然是他們技術(shù)棧的關(guān)鍵部分。為模型提供相關(guān)上下文以進(jìn)行推理有助于提高結(jié)果的質(zhì)量，減少“幻覺(jué)”（不準(zhǔn)確性）并解決數(shù)據(jù)新鮮度問(wèn)題。一些公司使用定制的向量數(shù)據(jù)庫(kù)（Pinecone、Weaviate、Chroma、Qdrant、Milvus等），而其他公司使用pgvector或AWS的解決方案。

38%的公司對(duì)像LangChain這樣的LLM編排和應(yīng)用開(kāi)發(fā)框架很感興趣。有些公司在原型設(shè)計(jì)中使用它，而其他公司在生產(chǎn)中使用它。在過(guò)去幾個(gè)月里，采用率有所增加。

不到10%的公司正在尋找監(jiān)控LLM輸出、成本或性能以及A/B測(cè)試提示的工具。我們認(rèn)為隨著更多大公司和受監(jiān)管行業(yè)采用語(yǔ)言模型，這些領(lǐng)域的興趣可能會(huì)增加。

少數(shù)公司正在研究補(bǔ)充性的生成技術(shù)，例如結(jié)合生成文本和語(yǔ)音。我們也相信這是一個(gè)令人興奮的增長(zhǎng)領(lǐng)域。

15%的公司從頭開(kāi)始或使用開(kāi)源工具構(gòu)建定制語(yǔ)言模型，通常是在使用LLM API。幾個(gè)月前，定制模型訓(xùn)練的需求有所增加。這需要自己的計(jì)算、搭建模型庫(kù)、托管、訓(xùn)練框架、實(shí)驗(yàn)跟蹤等技術(shù)棧，其中包括一些備受喜愛(ài)的公司，如Hugging Face、Replicate、Foundry、Tecton、Weights & Biases、PyTorch、Scale等。

我們與每位從業(yè)者交談時(shí)都說(shuō)AI的發(fā)展速度太快，無(wú)法對(duì)最終技術(shù)棧有很高的信心，但他們一致認(rèn)為L(zhǎng)LM API將繼續(xù)是一個(gè)關(guān)鍵支柱，其次是檢索機(jī)制和LangChain類(lèi)似的開(kāi)發(fā)框架。開(kāi)源和定制模型訓(xùn)練和調(diào)整似乎也在增長(zhǎng)。其他領(lǐng)域的技術(shù)棧也很重要，但還處于早期階段。

根據(jù)其獨(dú)特的上下文定制語(yǔ)言模型

通用的語(yǔ)言模型很強(qiáng)大，但對(duì)于許多用例來(lái)說(shuō)，并不具備差異化或足夠的能力。很多公司希望能夠在其數(shù)據(jù)上實(shí)現(xiàn)自然語(yǔ)言交互，例如開(kāi)發(fā)者文檔、產(chǎn)品庫(kù)存、人力資源或IT規(guī)則等。在某些情況下，這些公司還希望根據(jù)用戶的數(shù)據(jù)進(jìn)行模型定制，比如個(gè)人筆記、設(shè)計(jì)布局、數(shù)據(jù)指標(biāo)或代碼庫(kù)。

目前，有三種主要的定制語(yǔ)言模型的方法（有關(guān)更深入的技術(shù)解釋?zhuān)?qǐng)參閱Andrej在Microsoft Build上的最新GPT現(xiàn)狀演講）：

1）從頭開(kāi)始訓(xùn)練一個(gè)定制模型，這也是最困難的方法。

這是解決這個(gè)問(wèn)題的經(jīng)典和最困難的方式。通常需要高技能的機(jī)器學(xué)習(xí)科學(xué)家、大量相關(guān)數(shù)據(jù)、訓(xùn)練基礎(chǔ)設(shè)施和計(jì)算資源。這也是為什么在歷史上大部分自然語(yǔ)言處理創(chuàng)新發(fā)生在大型科技公司內(nèi)部的主要原因之一。

BloombergGPT是一個(gè)很好的例子，它是一個(gè)在大型科技公司之外進(jìn)行定制模型工作的努力，使用了Hugging Face和其他開(kāi)源工具資源。隨著開(kāi)源工具的改進(jìn)和更多公司對(duì)LLM進(jìn)行創(chuàng)新，我們預(yù)計(jì)會(huì)看到更多定制模型和預(yù)訓(xùn)練模型的使用。

2）微調(diào)基礎(chǔ)模型，難度適中。

這是通過(guò)使用專(zhuān)有數(shù)據(jù)或領(lǐng)域特定數(shù)據(jù)進(jìn)行額外訓(xùn)練來(lái)更新預(yù)訓(xùn)練模型的權(quán)重。開(kāi)源創(chuàng)新也使這種方法變得越來(lái)越可行，但它通常仍需要一個(gè)精通的團(tuán)隊(duì)。

一些從業(yè)者私下承認(rèn)，微調(diào)比聽(tīng)起來(lái)要困難得多，并且可能會(huì)產(chǎn)生意想不到的后果，比如模型漂移和在沒(méi)有預(yù)告的情況下“破壞”模型的其他技能。雖然這種方法更有可能變得更普遍，但目前對(duì)于大多數(shù)公司來(lái)說(shuō)仍然不可行。但同樣，這一切正在迅速改變中。

3）使用預(yù)訓(xùn)練模型并檢索相關(guān)上下文，難度最低。

人們通常認(rèn)為他們希望為自己進(jìn)行微調(diào)的模型，實(shí)際上他們只是希望在合適的時(shí)候讓模型對(duì)其信息進(jìn)行推理。有許多方法可以在適當(dāng)?shù)臅r(shí)間為模型提供正確的信息：

向SQL數(shù)據(jù)庫(kù)進(jìn)行結(jié)構(gòu)化查詢、在產(chǎn)品目錄中進(jìn)行搜索、調(diào)用一些外部API或使用嵌入式檢索。嵌入式檢索的好處是可以使用自然語(yǔ)言輕松搜索非結(jié)構(gòu)化數(shù)據(jù)。

從技術(shù)上講，這是通過(guò)將數(shù)據(jù)轉(zhuǎn)化為嵌入式向量、將其存儲(chǔ)在向量數(shù)據(jù)庫(kù)中，在查詢發(fā)生時(shí)搜索這些嵌入式向量以獲得最相關(guān)的上下文，并將其提供給模型來(lái)實(shí)現(xiàn)的。

這種方法有助于突破模型的有限上下文窗口，成本更低，解決了數(shù)據(jù)新鮮度的問(wèn)題（例如，ChatGPT不了解2021年9月之后的世界），并且可以由單獨(dú)的開(kāi)發(fā)人員在沒(méi)有正式機(jī)器學(xué)習(xí)訓(xùn)練的情況下完成。向量數(shù)據(jù)庫(kù)在高規(guī)模情況下非常有用，它們使存儲(chǔ)、搜索和更新嵌入式向量變得更加容易。

到目前為止，我們觀察到較大的公司仍在使用他們的企業(yè)云協(xié)議內(nèi)的工具，并使用他們?cè)品⻊?wù)提供商的工具，而初創(chuàng)公司傾向于使用專(zhuān)門(mén)構(gòu)建的向量數(shù)據(jù)庫(kù)。

然而，這個(gè)領(lǐng)域變化非常快速。上下文窗口正在增長(zhǎng)（剛剛發(fā)布的消息，OpenAI將擴(kuò)展到16K，而Anthropic推出了10萬(wàn)個(gè)令牌的上下文窗口）�；A(chǔ)模型和云數(shù)據(jù)庫(kù)可能會(huì)直接嵌入檢索功能到其服務(wù)中。我們將密切關(guān)注這個(gè)市場(chǎng)的發(fā)展。

LLM API的技術(shù)棧與定制模型訓(xùn)練的技術(shù)�？赡芨杏X(jué)有些分離，

但隨著時(shí)間的推移，它們會(huì)趨于融合

有時(shí)候我們會(huì)感覺(jué)存在兩個(gè)技術(shù)棧：利用LLM API的技術(shù)棧（更多是閉源的，面向開(kāi)發(fā)人員）與訓(xùn)練定制語(yǔ)言模型的技術(shù)棧（更多是開(kāi)源的，歷史上面向更復(fù)雜的機(jī)器學(xué)習(xí)團(tuán)隊(duì)）。一些人納悶，LLM通過(guò)API的可用性是否意味著公司會(huì)減少自己的定制訓(xùn)練。到目前為止，我們看到的情況恰恰相反。

隨著對(duì)AI的興趣增加和開(kāi)源開(kāi)發(fā)的加速，許多公司對(duì)訓(xùn)練和微調(diào)自己的模型越來(lái)越感興趣。我們認(rèn)為L(zhǎng)LM API和定制模型的技術(shù)棧將隨著時(shí)間的推移越來(lái)越融合。例如，一家公司可能從開(kāi)源中訓(xùn)練自己的語(yǔ)言模型，但通過(guò)向量數(shù)據(jù)庫(kù)進(jìn)行檢索來(lái)解決數(shù)據(jù)新鮮度的問(wèn)題。為定制模型技術(shù)棧構(gòu)建工具的智能初創(chuàng)公司也在努力擴(kuò)展其產(chǎn)品，使其與LLM API的革命更相關(guān)。

技術(shù)棧變得越來(lái)越適合開(kāi)發(fā)人員使用

語(yǔ)言模型API將強(qiáng)大的現(xiàn)成模型交到了普通開(kāi)發(fā)人員手中，而不僅僅是機(jī)器學(xué)習(xí)團(tuán)隊(duì)�，F(xiàn)在，使用語(yǔ)言模型的人群已經(jīng)顯著擴(kuò)大到所有開(kāi)發(fā)人員，我們相信會(huì)看到更多面向開(kāi)發(fā)人員的工具。

例如，LangChain通過(guò)抽象常見(jiàn)的問(wèn)題，幫助開(kāi)發(fā)人員構(gòu)建LLM應(yīng)用程序：將模型組合成更高級(jí)的系統(tǒng)，將多個(gè)模型調(diào)用鏈接在一起，將模型與工具和數(shù)據(jù)源連接起來(lái)，構(gòu)建可以操作這些工具的代理，并通過(guò)簡(jiǎn)化切換語(yǔ)言模型，幫助避免供應(yīng)商鎖定。有些人在原型設(shè)計(jì)中使用LangChain，而其他人則繼續(xù)在生產(chǎn)環(huán)境中使用它。

語(yǔ)言模型需要在輸出質(zhì)量、數(shù)據(jù)隱私和安全性方面變得更可信，

以實(shí)現(xiàn)全面采用

在將LLM完全應(yīng)用于他們的應(yīng)用程序之前，許多公司希望有更好的工具來(lái)處理數(shù)據(jù)隱私、隔離、安全性、版權(quán)以及監(jiān)控模型輸出。從金融科技到醫(yī)療保健的受監(jiān)管行業(yè)的公司尤其關(guān)注這一點(diǎn)。報(bào)告稱(chēng)很難找到解決這個(gè)問(wèn)題的軟件解決方案（這是創(chuàng)業(yè)者的一個(gè)潛在領(lǐng)域）。

理想情況下，會(huì)有軟件來(lái)警告（如果不是阻止）模型生成錯(cuò)誤/幻覺(jué)、歧視性內(nèi)容、危險(xiǎn)內(nèi)容或其他問(wèn)題。

一些公司還擔(dān)心與模型共享的數(shù)據(jù)被用于訓(xùn)練：例如，很少有人了解到ChatGPT Consumer數(shù)據(jù)默認(rèn)用于訓(xùn)練，而ChatGPT Business和API數(shù)據(jù)則不用于訓(xùn)練。隨著政策的明確和更多的監(jiān)管措施的出臺(tái)，語(yǔ)言模型將獲得更多信任，并且我們可能會(huì)看到采用率的另一個(gè)重大變化。

語(yǔ)言模型應(yīng)用將越來(lái)越多元化

很多公司已經(jīng)找到了將多個(gè)生成模型結(jié)合起來(lái)產(chǎn)生巨大效果的有趣方法：結(jié)合文本和語(yǔ)音生成的聊天機(jī)器人可以實(shí)現(xiàn)全新的對(duì)話體驗(yàn)。文本和語(yǔ)音模型可以結(jié)合使用，幫助您快速修正視頻錄制中的錯(cuò)誤，而無(wú)需重新錄制整個(gè)視頻。

模型本身也越來(lái)越多元化。我們可以想象未來(lái)豐富的消費(fèi)者和企業(yè)AI應(yīng)用將結(jié)合文本、語(yǔ)音/音頻和圖像/視頻生成，以創(chuàng)建更具吸引力的用戶體驗(yàn)并完成更復(fù)雜的任務(wù)。

目前仍處于早期階段

人工智能正逐漸滲透到技術(shù)的方方面面。只有65%的受訪公司目前處于生產(chǎn)階段，而且其中許多應(yīng)用相對(duì)簡(jiǎn)單。隨著越來(lái)越多的公司推出LLM應(yīng)用，新的障礙將出現(xiàn)，為創(chuàng)業(yè)者創(chuàng)造更多機(jī)會(huì)。

未來(lái)幾年基礎(chǔ)設(shè)施層將繼續(xù)快速發(fā)展。如果我們看到的演示中只有一半進(jìn)入生產(chǎn)階段，我們將迎來(lái)一個(gè)令人興奮的未來(lái)�？吹綇淖钤缙诘腁rc投資到Zoom的創(chuàng)始人們都專(zhuān)注于同一件事情用人工智能來(lái)讓用戶滿意，這真是令人激動(dòng)。