展會(huì)信息港展會(huì)大全

紅杉資本:關(guān)于AI的一份訪談報(bào)告
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-19 08:49:46   瀏覽:6631次  

導(dǎo)讀:作者| Michelle Fradin Lauren Reeder 來(lái)源| Sequoiacap 導(dǎo)語(yǔ):所有被訪企業(yè)都認(rèn)為AI的發(fā)展速度太快,難以跟上節(jié)奏。 ChatGPT通過(guò)大型語(yǔ)言模型(Large Language Models)引發(fā)了創(chuàng)新浪潮,越來(lái)越多的公司將自然語(yǔ)言交互的能力應(yīng)用到他們的產(chǎn)品中。 語(yǔ)言模型API...

作者| Michelle Fradin & Lauren Reeder

來(lái)源| Sequoiacap

導(dǎo)語(yǔ):所有被訪企業(yè)都認(rèn)為AI的發(fā)展速度太快,難以跟上節(jié)奏。

ChatGPT通過(guò)大型語(yǔ)言模型(Large Language Models)引發(fā)了創(chuàng)新浪潮,越來(lái)越多的公司將自然語(yǔ)言交互的能力應(yīng)用到他們的產(chǎn)品中。

語(yǔ)言模型API的采用正在形成一種新的技術(shù)風(fēng)潮。為了更好地了解人們正在構(gòu)建的應(yīng)用和所使用的技術(shù)棧,我們與紅杉網(wǎng)絡(luò)中的33家公司進(jìn)行了訪談,包括種子階段的初創(chuàng)企業(yè)和大型上市企業(yè)。

我們?cè)趦蓚(gè)月前和上周進(jìn)行了訪談,以捕捉到變化的速度。

由于許多創(chuàng)始人和開(kāi)發(fā)者自己還在摸索他們的人工智能戰(zhàn)略,我們希望分享我們的發(fā)現(xiàn),即使這個(gè)領(lǐng)域正在快速發(fā)展。

紅杉網(wǎng)絡(luò)中的幾乎每家公司都在將語(yǔ)言模型集成到他們的產(chǎn)品中

我們已經(jīng)看到了許多神奇的自動(dòng)完成功能,涵蓋了從代碼(Sourcegraph、Warp、Github)到數(shù)據(jù)科學(xué)(Hex)的各個(gè)領(lǐng)域。我們還看到了更好的聊天機(jī)器人,用于客戶支持、員工支持和消費(fèi)者娛樂(lè)等方面。

其他一些公司則通過(guò)以人工智能為核心來(lái)重新構(gòu)想整個(gè)工作流程,如視覺(jué)藝術(shù)(Midjourney)、營(yíng)銷(xiāo)(Hubspot、Attentive、Drift、Jasper、Copy、Writer)、銷(xiāo)售(Gong)、聯(lián)系中心(Cresta)、法律(Ironclad、Harvey)、會(huì)計(jì)(Pilot)、生產(chǎn)力(Notion)、數(shù)據(jù)工程(dbt)、搜索(Glean、Neeva)、雜貨購(gòu)物(Instacart)、消費(fèi)者支付(Klarna)和旅行規(guī)劃(Airbnb)。這只是一小部分示例,這僅僅只是開(kāi)始。

應(yīng)用程序的新技術(shù)棧以語(yǔ)言模型API、檢索和編排為中心,

但開(kāi)源模型的使用也在增長(zhǎng)

65%的公司已經(jīng)將應(yīng)用程序投入生產(chǎn),相比兩個(gè)月前的50%有所增加,其余的公司仍在進(jìn)行實(shí)驗(yàn)。

94%的公司正在使用基礎(chǔ)模型API。在我們的樣本中,OpenAI的GPT是明顯的首選,占比為91%,然而Anthropic的興趣在過(guò)去的一個(gè)季度增長(zhǎng)到了15%(有些公司使用多個(gè)模型)。

88%的公司認(rèn)為檢索機(jī)制,比如向量數(shù)據(jù)庫(kù),將仍然是他們技術(shù)棧的關(guān)鍵部分。為模型提供相關(guān)上下文以進(jìn)行推理有助于提高結(jié)果的質(zhì)量,減少“幻覺(jué)”(不準(zhǔn)確性)并解決數(shù)據(jù)新鮮度問(wèn)題。一些公司使用定制的向量數(shù)據(jù)庫(kù)(Pinecone、Weaviate、Chroma、Qdrant、Milvus等),而其他公司使用pgvector或AWS的解決方案。

38%的公司對(duì)像LangChain這樣的LLM編排和應(yīng)用開(kāi)發(fā)框架很感興趣。有些公司在原型設(shè)計(jì)中使用它,而其他公司在生產(chǎn)中使用它。在過(guò)去幾個(gè)月里,采用率有所增加。

不到10%的公司正在尋找監(jiān)控LLM輸出、成本或性能以及A/B測(cè)試提示的工具。我們認(rèn)為隨著更多大公司和受監(jiān)管行業(yè)采用語(yǔ)言模型,這些領(lǐng)域的興趣可能會(huì)增加。

少數(shù)公司正在研究補(bǔ)充性的生成技術(shù),例如結(jié)合生成文本和語(yǔ)音。我們也相信這是一個(gè)令人興奮的增長(zhǎng)領(lǐng)域。

15%的公司從頭開(kāi)始或使用開(kāi)源工具構(gòu)建定制語(yǔ)言模型,通常是在使用LLM API。幾個(gè)月前,定制模型訓(xùn)練的需求有所增加。這需要自己的計(jì)算、搭建模型庫(kù)、托管、訓(xùn)練框架、實(shí)驗(yàn)跟蹤等技術(shù)棧,其中包括一些備受喜愛(ài)的公司,如Hugging Face、Replicate、Foundry、Tecton、Weights & Biases、PyTorch、Scale等。

我們與每位從業(yè)者交談時(shí)都說(shuō)AI的發(fā)展速度太快,無(wú)法對(duì)最終技術(shù)棧有很高的信心,但他們一致認(rèn)為L(zhǎng)LM API將繼續(xù)是一個(gè)關(guān)鍵支柱,其次是檢索機(jī)制和LangChain類(lèi)似的開(kāi)發(fā)框架。開(kāi)源和定制模型訓(xùn)練和調(diào)整似乎也在增長(zhǎng)。其他領(lǐng)域的技術(shù)棧也很重要,但還處于早期階段。

根據(jù)其獨(dú)特的上下文定制語(yǔ)言模型

通用的語(yǔ)言模型很強(qiáng)大,但對(duì)于許多用例來(lái)說(shuō),并不具備差異化或足夠的能力。很多公司希望能夠在其數(shù)據(jù)上實(shí)現(xiàn)自然語(yǔ)言交互,例如開(kāi)發(fā)者文檔、產(chǎn)品庫(kù)存、人力資源或IT規(guī)則等。在某些情況下,這些公司還希望根據(jù)用戶的數(shù)據(jù)進(jìn)行模型定制,比如個(gè)人筆記、設(shè)計(jì)布局、數(shù)據(jù)指標(biāo)或代碼庫(kù)。

目前,有三種主要的定制語(yǔ)言模型的方法(有關(guān)更深入的技術(shù)解釋?zhuān)?qǐng)參閱Andrej在Microsoft Build上的最新GPT現(xiàn)狀演講):

1)從頭開(kāi)始訓(xùn)練一個(gè)定制模型,這也是最困難的方法。

這是解決這個(gè)問(wèn)題的經(jīng)典和最困難的方式。通常需要高技能的機(jī)器學(xué)習(xí)科學(xué)家、大量相關(guān)數(shù)據(jù)、訓(xùn)練基礎(chǔ)設(shè)施和計(jì)算資源。這也是為什么在歷史上大部分自然語(yǔ)言處理創(chuàng)新發(fā)生在大型科技公司內(nèi)部的主要原因之一。

BloombergGPT是一個(gè)很好的例子,它是一個(gè)在大型科技公司之外進(jìn)行定制模型工作的努力,使用了Hugging Face和其他開(kāi)源工具資源。隨著開(kāi)源工具的改進(jìn)和更多公司對(duì)LLM進(jìn)行創(chuàng)新,我們預(yù)計(jì)會(huì)看到更多定制模型和預(yù)訓(xùn)練模型的使用。

2)微調(diào)基礎(chǔ)模型,難度適中。

這是通過(guò)使用專(zhuān)有數(shù)據(jù)或領(lǐng)域特定數(shù)據(jù)進(jìn)行額外訓(xùn)練來(lái)更新預(yù)訓(xùn)練模型的權(quán)重。開(kāi)源創(chuàng)新也使這種方法變得越來(lái)越可行,但它通常仍需要一個(gè)精通的團(tuán)隊(duì)。

一些從業(yè)者私下承認(rèn),微調(diào)比聽(tīng)起來(lái)要困難得多,并且可能會(huì)產(chǎn)生意想不到的后果,比如模型漂移和在沒(méi)有預(yù)告的情況下“破壞”模型的其他技能。雖然這種方法更有可能變得更普遍,但目前對(duì)于大多數(shù)公司來(lái)說(shuō)仍然不可行。但同樣,這一切正在迅速改變中。

3)使用預(yù)訓(xùn)練模型并檢索相關(guān)上下文,難度最低。

人們通常認(rèn)為他們希望為自己進(jìn)行微調(diào)的模型,實(shí)際上他們只是希望在合適的時(shí)候讓模型對(duì)其信息進(jìn)行推理。有許多方法可以在適當(dāng)?shù)臅r(shí)間為模型提供正確的信息:

向SQL數(shù)據(jù)庫(kù)進(jìn)行結(jié)構(gòu)化查詢、在產(chǎn)品目錄中進(jìn)行搜索、調(diào)用一些外部API或使用嵌入式檢索。嵌入式檢索的好處是可以使用自然語(yǔ)言輕松搜索非結(jié)構(gòu)化數(shù)據(jù)。

從技術(shù)上講,這是通過(guò)將數(shù)據(jù)轉(zhuǎn)化為嵌入式向量、將其存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,在查詢發(fā)生時(shí)搜索這些嵌入式向量以獲得最相關(guān)的上下文,并將其提供給模型來(lái)實(shí)現(xiàn)的。

這種方法有助于突破模型的有限上下文窗口,成本更低,解決了數(shù)據(jù)新鮮度的問(wèn)題(例如,ChatGPT不了解2021年9月之后的世界),并且可以由單獨(dú)的開(kāi)發(fā)人員在沒(méi)有正式機(jī)器學(xué)習(xí)訓(xùn)練的情況下完成。向量數(shù)據(jù)庫(kù)在高規(guī)模情況下非常有用,它們使存儲(chǔ)、搜索和更新嵌入式向量變得更加容易。

到目前為止,我們觀察到較大的公司仍在使用他們的企業(yè)云協(xié)議內(nèi)的工具,并使用他們?cè)品⻊?wù)提供商的工具,而初創(chuàng)公司傾向于使用專(zhuān)門(mén)構(gòu)建的向量數(shù)據(jù)庫(kù)。

然而,這個(gè)領(lǐng)域變化非常快速。上下文窗口正在增長(zhǎng)(剛剛發(fā)布的消息,OpenAI將擴(kuò)展到16K,而Anthropic推出了10萬(wàn)個(gè)令牌的上下文窗口);A(chǔ)模型和云數(shù)據(jù)庫(kù)可能會(huì)直接嵌入檢索功能到其服務(wù)中。我們將密切關(guān)注這個(gè)市場(chǎng)的發(fā)展。

LLM API的技術(shù)棧與定制模型訓(xùn)練的技術(shù)?赡芨杏X(jué)有些分離,

但隨著時(shí)間的推移,它們會(huì)趨于融合

有時(shí)候我們會(huì)感覺(jué)存在兩個(gè)技術(shù)棧:利用LLM API的技術(shù)棧(更多是閉源的,面向開(kāi)發(fā)人員)與訓(xùn)練定制語(yǔ)言模型的技術(shù)棧(更多是開(kāi)源的,歷史上面向更復(fù)雜的機(jī)器學(xué)習(xí)團(tuán)隊(duì))。一些人納悶,LLM通過(guò)API的可用性是否意味著公司會(huì)減少自己的定制訓(xùn)練。到目前為止,我們看到的情況恰恰相反。

隨著對(duì)AI的興趣增加和開(kāi)源開(kāi)發(fā)的加速,許多公司對(duì)訓(xùn)練和微調(diào)自己的模型越來(lái)越感興趣。我們認(rèn)為L(zhǎng)LM API和定制模型的技術(shù)棧將隨著時(shí)間的推移越來(lái)越融合。例如,一家公司可能從開(kāi)源中訓(xùn)練自己的語(yǔ)言模型,但通過(guò)向量數(shù)據(jù)庫(kù)進(jìn)行檢索來(lái)解決數(shù)據(jù)新鮮度的問(wèn)題。為定制模型技術(shù)棧構(gòu)建工具的智能初創(chuàng)公司也在努力擴(kuò)展其產(chǎn)品,使其與LLM API的革命更相關(guān)。

技術(shù)棧變得越來(lái)越適合開(kāi)發(fā)人員使用

語(yǔ)言模型API將強(qiáng)大的現(xiàn)成模型交到了普通開(kāi)發(fā)人員手中,而不僅僅是機(jī)器學(xué)習(xí)團(tuán)隊(duì),F(xiàn)在,使用語(yǔ)言模型的人群已經(jīng)顯著擴(kuò)大到所有開(kāi)發(fā)人員,我們相信會(huì)看到更多面向開(kāi)發(fā)人員的工具。

例如,LangChain通過(guò)抽象常見(jiàn)的問(wèn)題,幫助開(kāi)發(fā)人員構(gòu)建LLM應(yīng)用程序:將模型組合成更高級(jí)的系統(tǒng),將多個(gè)模型調(diào)用鏈接在一起,將模型與工具和數(shù)據(jù)源連接起來(lái),構(gòu)建可以操作這些工具的代理,并通過(guò)簡(jiǎn)化切換語(yǔ)言模型,幫助避免供應(yīng)商鎖定。有些人在原型設(shè)計(jì)中使用LangChain,而其他人則繼續(xù)在生產(chǎn)環(huán)境中使用它。

語(yǔ)言模型需要在輸出質(zhì)量、數(shù)據(jù)隱私和安全性方面變得更可信,

以實(shí)現(xiàn)全面采用

在將LLM完全應(yīng)用于他們的應(yīng)用程序之前,許多公司希望有更好的工具來(lái)處理數(shù)據(jù)隱私、隔離、安全性、版權(quán)以及監(jiān)控模型輸出。從金融科技到醫(yī)療保健的受監(jiān)管行業(yè)的公司尤其關(guān)注這一點(diǎn)。報(bào)告稱(chēng)很難找到解決這個(gè)問(wèn)題的軟件解決方案(這是創(chuàng)業(yè)者的一個(gè)潛在領(lǐng)域)。

理想情況下,會(huì)有軟件來(lái)警告(如果不是阻止)模型生成錯(cuò)誤/幻覺(jué)、歧視性內(nèi)容、危險(xiǎn)內(nèi)容或其他問(wèn)題。

一些公司還擔(dān)心與模型共享的數(shù)據(jù)被用于訓(xùn)練:例如,很少有人了解到ChatGPT Consumer數(shù)據(jù)默認(rèn)用于訓(xùn)練,而ChatGPT Business和API數(shù)據(jù)則不用于訓(xùn)練。隨著政策的明確和更多的監(jiān)管措施的出臺(tái),語(yǔ)言模型將獲得更多信任,并且我們可能會(huì)看到采用率的另一個(gè)重大變化。

語(yǔ)言模型應(yīng)用將越來(lái)越多元化

很多公司已經(jīng)找到了將多個(gè)生成模型結(jié)合起來(lái)產(chǎn)生巨大效果的有趣方法:結(jié)合文本和語(yǔ)音生成的聊天機(jī)器人可以實(shí)現(xiàn)全新的對(duì)話體驗(yàn)。文本和語(yǔ)音模型可以結(jié)合使用,幫助您快速修正視頻錄制中的錯(cuò)誤,而無(wú)需重新錄制整個(gè)視頻。

模型本身也越來(lái)越多元化。我們可以想象未來(lái)豐富的消費(fèi)者和企業(yè)AI應(yīng)用將結(jié)合文本、語(yǔ)音/音頻和圖像/視頻生成,以創(chuàng)建更具吸引力的用戶體驗(yàn)并完成更復(fù)雜的任務(wù)。

目前仍處于早期階段

人工智能正逐漸滲透到技術(shù)的方方面面。只有65%的受訪公司目前處于生產(chǎn)階段,而且其中許多應(yīng)用相對(duì)簡(jiǎn)單。隨著越來(lái)越多的公司推出LLM應(yīng)用,新的障礙將出現(xiàn),為創(chuàng)業(yè)者創(chuàng)造更多機(jī)會(huì)。

未來(lái)幾年基礎(chǔ)設(shè)施層將繼續(xù)快速發(fā)展。如果我們看到的演示中只有一半進(jìn)入生產(chǎn)階段,我們將迎來(lái)一個(gè)令人興奮的未來(lái)?吹綇淖钤缙诘腁rc投資到Zoom的創(chuàng)始人們都專(zhuān)注于同一件事情用人工智能來(lái)讓用戶滿意,這真是令人激動(dòng)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港