當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 硅谷頂級(jí)VC的最新洞察：AI公司應(yīng)該專注用戶需求，而非模型構(gòu)建

硅谷頂級(jí)VC的最新洞察：AI公司應(yīng)該專注用戶需求，而非模型構(gòu)建
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-04 15:02:37 瀏覽：6118次

導(dǎo)讀：文 | 烏鴉智能說本文編譯自播客節(jié)目Generative Now Podcast。在本期節(jié)目中，長(zhǎng)期創(chuàng)業(yè)者和創(chuàng)業(yè)投資人Elad Gil，前Greylock總合伙人、Conviction創(chuàng)始人Sarah Guo和Lightspeed合伙人Michael Mignano共同審視AI投資的廣闊世界。 Elad Gil是硅谷知名的Solo VC 投...

文 | 烏鴉智能說

本文編譯自播客節(jié)目Generative Now Podcast。在本期節(jié)目中，長(zhǎng)期創(chuàng)業(yè)者和創(chuàng)業(yè)投資人Elad Gil，前Greylock總合伙人、Conviction創(chuàng)始人Sarah Guo和Lightspeed合伙人Michael Mignano共同審視AI投資的廣闊世界。

Elad Gil是硅谷知名的Solo VC 投資人，參與投資了Perpleixty 、Character.ai、Mistral、Harvy 以及 Pika 等知名 AI 初創(chuàng)公司。去年11月， Elad Gil完成了第三支基金募集，也是迄今為止規(guī)模最大的基金總計(jì)超10億美元；據(jù)悉，這支基金從 54 位 LPs 那里獲得了近11 億美元的承諾，相比 2021 年關(guān)閉的 6.2 億美元基金規(guī)模擴(kuò)大了 77%。

在訪談中，Gil表示新型模型公司仍然有可能出現(xiàn)，部分基礎(chǔ)模型將被通用模型采用，而另一些則需要在訓(xùn)練數(shù)據(jù)集和架構(gòu)方面進(jìn)行微調(diào)。此外，Gil還提到，AI公司應(yīng)該更關(guān)注專注于客戶需求，而不是將注意力集中在模型構(gòu)建上。

以下為本文目錄，建議結(jié)合要點(diǎn)進(jìn)行針對(duì)性閱讀：

01 AI將迎來五個(gè)人力資本浪潮02新型模型公司仍然有可能出現(xiàn)03下一波應(yīng)用浪潮會(huì)是什么樣子？04誰會(huì)贏得AI：B端還是C端05提供AI服務(wù) VS 使用AI服務(wù)，誰將是頭號(hào)贏家06垂直整合的模型07聊天界面，會(huì)成為主要的交互方式嗎08硬件 x AI09Web3，將是驗(yàn)證真實(shí)性的途徑10AI監(jiān)管將走向何方

01 AI將迎來五個(gè)人力資本浪潮

Michael Mignano：你們都是聰慧老練的投資者，有預(yù)見到2023年AI投資領(lǐng)域會(huì)是這樣嗎？

Sarah Guo：我們做了一個(gè)長(zhǎng)期的賭注。我們?cè)?022年10月創(chuàng)立了Conviction，隨后在11月就出現(xiàn)了ChatGPT時(shí)刻，用戶的反應(yīng)還是很出乎我的意料的.我本以為這樣的時(shí)刻會(huì)出現(xiàn)得更晚一些。而且我們看到人工智能飛速發(fā)展乃至遇到了擴(kuò)展的瓶頸，Transformer模型變得越來越有效，長(zhǎng)期存在的開放性問題也得到了解決……這一切都令人激動(dòng)。我本以為這會(huì)是一個(gè)比較緩慢的推進(jìn)過程，我會(huì)有更多的時(shí)間組建基金，但我想現(xiàn)在的這種速度令所有人驚訝。

PS：Samsara是一家總部位于美國(guó)舊金山的傳感器數(shù)據(jù)平臺(tái)，為客戶提供大量追蹤服務(wù)所需的物聯(lián)網(wǎng)傳感器硬件和軟件產(chǎn)品

Anduril Industries 是一家國(guó)防產(chǎn)品公司，其產(chǎn)品是由AI驅(qū)動(dòng)的開放操作系統(tǒng)Lattice OS，該系統(tǒng)將自動(dòng)化感知和指揮控制能力與開放、模塊化和可擴(kuò)展的硬件組件連接起來，為防務(wù)任務(wù)提供自動(dòng)化解決方案。

Elad Gil：我從20多年前谷歌時(shí)期就開始從事人工智能領(lǐng)域的工作，當(dāng)時(shí)我正在研究早期的機(jī)器學(xué)習(xí)，也就是深度學(xué)習(xí)之前的時(shí)代。后來深度學(xué)習(xí)興起，我在過去10年里投資了很多公司，但絕大部分都沒有取得成功。當(dāng)然也有一些公司利用了人工智能作為輔助或賦能的手段，從而發(fā)展壯大，比如我投資初期的Samsara和Anduril等公司。

對(duì)我來說，真正的轉(zhuǎn)折點(diǎn)是GPT-3的出現(xiàn)，因?yàn)樗菺PT-2有了質(zhì)的飛躍。GPT-3發(fā)布時(shí)，我在播客中表達(dá)了我的興奮之情，甚至主動(dòng)聯(lián)系了他們，想要合作探討。后來我們確實(shí)就加密貨幣、人工智能等幾個(gè)主題與Chris Dixon和Scalar Capital合作過。

當(dāng)GPT-3出現(xiàn)時(shí)，人工智能領(lǐng)域又向前躍進(jìn)了一大步。從那時(shí)起，我開始大量投資并接觸研究人員。有些人主動(dòng)聯(lián)系我，比如我以前就認(rèn)識(shí)的Character.AI的Noam，他說想創(chuàng)立一家公司；還有Perplexity公司的Aravind，我們開始經(jīng)常聚會(huì)，討論潛在的創(chuàng)業(yè)機(jī)會(huì)。

簡(jiǎn)而言之，技術(shù)在短時(shí)間內(nèi)實(shí)現(xiàn)了巨大飛躍，但當(dāng)時(shí)幾乎沒有人真正關(guān)注它。這簡(jiǎn)直就像是一個(gè)黃金時(shí)代，聚集了眾多有趣的想法和人才，但幾乎無人問津，這讓人非常興奮。

Michael Mignano：Sarah，你之前提到通過觀察事物的發(fā)展趨勢(shì)，幾乎可以預(yù)見這種突破性進(jìn)展的到來，盡管你沒有預(yù)計(jì)它會(huì)發(fā)生在ChatGPT問世的那一刻�，F(xiàn)在，當(dāng)展望未來時(shí)，感覺我們似乎處于發(fā)展曲線的中間階段。你們認(rèn)為人工智能的發(fā)展是會(huì)在不久的將來就趨于平緩，還是在可預(yù)見的未來我們將一直保持直線上升的軌跡？

Sarah Guo：我不想過多重復(fù)加密貨幣投資者的觀點(diǎn)，但我確實(shí)感覺我們目前處于人工智能發(fā)展的非常早期階段，未來我們將獲得堆疊式的能力提升。

投資時(shí)機(jī)非常重要。如果時(shí)機(jī)稍早或稍晚都無關(guān)緊要，關(guān)鍵是要有獨(dú)特且極具創(chuàng)新性的見解。在技術(shù)變革期間，即使進(jìn)入較晚，只要有足夠獨(dú)特和聰明的見解，也是可以的。

更重要的一點(diǎn)是，作為投資者，你必須通過足夠的實(shí)踐和嘗試，無論是作為創(chuàng)始人還是投資者，來了解我們距離人工智能成熟發(fā)展還有多遠(yuǎn)。我之前在Greylock工作了十年，投資了一些上一代的機(jī)器學(xué)習(xí)公司，可能有些為時(shí)過早。

事實(shí)上，今天最引人注目的那些創(chuàng)始人都研究人工智能很長(zhǎng)時(shí)間了，比如你們都認(rèn)識(shí)的來自Weights & Biases的Lukas，他之前嘗試過一次，但當(dāng)時(shí)進(jìn)場(chǎng)太早，沒有取得成功。

就我個(gè)人而言，大約三四年前，我投資了Base10，而今年它終于開始真正落地運(yùn)作。我們也在Inflection公司下了重注，這個(gè)公司的名字選得很貼切。除了OpenAI之外，Inflection是最早一批專注于基礎(chǔ)模型的公司之一。

也許從規(guī)模成本的角度來看，推動(dòng)大型語(yǔ)言模型繼續(xù)突破現(xiàn)有水平變得更加困難，下一組訓(xùn)練數(shù)據(jù)的來源也不太明朗。但隨著越來越多的人關(guān)注人工智能，生態(tài)系統(tǒng)得到更大規(guī)模的支持和資金投入，人工智能發(fā)展將有更強(qiáng)的復(fù)合效應(yīng)。所以我認(rèn)為我們現(xiàn)在處于人工智能發(fā)展的相當(dāng)早期階段。

Elad Gil：我認(rèn)為人工智能仍有大量增長(zhǎng)空間。ChatGPT對(duì)大多數(shù)人來說是一個(gè)發(fā)令槍，包括我們，因?yàn)槟壳盎旧线€沒有真正的企業(yè)級(jí)大規(guī)模部署應(yīng)用。所以這將是一個(gè)大浪潮。

總的來說，我認(rèn)為將會(huì)有五個(gè)人力資本浪潮。

Aravind Srinivas，Perplexity創(chuàng)始人

第一浪潮是原生人工智能建設(shè)者，他們一直在研究大型語(yǔ)言模型和基礎(chǔ)模型，希望做出應(yīng)用程序。這就是Noam創(chuàng)辦Character.AI的原因，他是Transformer原作之一。還有來自Perplexity的Aravind等人，他們都曾在谷歌、OpenAI或Facebook等公司工作。

第二波是一群極客，我也將自己歸入這一陣營(yíng)。他們是經(jīng)驗(yàn)豐富的開發(fā)人員和基礎(chǔ)設(shè)施人員。他們中的一些人早期就開始創(chuàng)辦公司，比如Sarah提到的Base10，但也有一些公司成立較晚，比如Together等，它們現(xiàn)在為這些模型提供支持服務(wù)。我們經(jīng)歷了一個(gè)基礎(chǔ)設(shè)施浪潮，現(xiàn)在仍在持續(xù)，同時(shí)涌現(xiàn)出像Braintrust這樣的工具公司。

第三浪潮將是ToB應(yīng)用程序開發(fā)者。我認(rèn)為很多在一年多前聽說過ChatGPT的人，可能六個(gè)月前就已經(jīng)辭去了工作，花了幾個(gè)月的時(shí)間思考，現(xiàn)在正在開始創(chuàng)業(yè)。所以我們會(huì)看到一波企業(yè)級(jí)應(yīng)用程序浪潮。隨后的第四浪潮將在ToC應(yīng)用領(lǐng)域出現(xiàn)。第五個(gè)浪潮將出現(xiàn)在企業(yè)級(jí)的實(shí)際大規(guī)模部署應(yīng)用方面。

所以我認(rèn)為這將是一波接一波的人潮，他們?cè)跁r(shí)間上有所錯(cuò)開，具有不同的技術(shù)能力，專注于產(chǎn)品或工程思維等等。當(dāng)然也有一些夾在中間的人，比如Harvey團(tuán)隊(duì)就是一個(gè)很好的例子。但總的來說，我認(rèn)為這就是人工智能發(fā)展的大致軌跡。

02 新型模型公司仍然有可能出現(xiàn)

Michael Mignano：目前大型模型的機(jī)遇是否已經(jīng)盡現(xiàn)，比如2023年那些投向Anthropic、Inflection或OpenAI等公司的巨額融資？這種機(jī)遇之窗對(duì)于初創(chuàng)公司而言，是否已經(jīng)基本關(guān)閉了？如果是這樣，2024年大部分資金將投向哪些領(lǐng)域呢？

Sarah Guo：風(fēng)投資本往往追隨先例，但是一些真正創(chuàng)新型的公司往往史無前例，在發(fā)展上無法預(yù)測(cè)。人們最初并不熱衷于投資基礎(chǔ)模型公司，直到ChatGPT的飛速增長(zhǎng)引起了廣泛關(guān)注。

我認(rèn)為不同模態(tài)的模型或模型應(yīng)用領(lǐng)域存在機(jī)會(huì)，比如視頻領(lǐng)域、生物技術(shù)、臨床醫(yī)學(xué)等。我認(rèn)為我的基金將大部分投資于應(yīng)用方向，但目前還投資了一些基礎(chǔ)模型公司。

Elad Gil：我非常認(rèn)同未來會(huì)出現(xiàn)新型模型公司的觀點(diǎn)�，F(xiàn)今模型類型琳瑯滿目，涵蓋語(yǔ)言模型、語(yǔ)音模型、圖像/視頻/音頻擴(kuò)散模型、代碼模型、生物、物理、材料科學(xué)、數(shù)學(xué)等領(lǐng)域。部分基礎(chǔ)模型將被通用模型采用，而另一些則需要在訓(xùn)練數(shù)據(jù)集和架構(gòu)方面進(jìn)行微調(diào)。例如，AlphaFold并非單純基于Transformer的模型，而是采用了混合架構(gòu)，盡管Transformer也在其開發(fā)中發(fā)揮了重要作用。

一些模型將會(huì)應(yīng)用到科學(xué)、機(jī)器人、醫(yī)學(xué)等領(lǐng)域。從資金角度來看，大部分投資可能會(huì)流向模型公司，因?yàn)樗鼈冑Y金需求更大。但從公司數(shù)量的角度來看，我預(yù)計(jì)明年我們將看到更多的應(yīng)用程序開發(fā)公司，而不是基礎(chǔ)模型公司。

03 下一波應(yīng)用浪潮是什么樣？

Michael Mignano：下一波應(yīng)用浪潮會(huì)是什么樣子？當(dāng)我們談?wù)搼?yīng)用程序時(shí)，可以是傳統(tǒng)意義上的桌面應(yīng)用、移動(dòng)應(yīng)用，也可以是ChatGPT這樣的大型語(yǔ)言模型應(yīng)用，后者是否會(huì)成為一個(gè)全新的可投資公司和產(chǎn)品領(lǐng)域？

Elad Gil：我認(rèn)為在ToB和ToC領(lǐng)域都會(huì)有一些大型語(yǔ)言模型的應(yīng)用。我和我的小團(tuán)隊(duì)做了一件事，就是將所有服務(wù)領(lǐng)域按照可被AIGC解決的程度進(jìn)行了分類，并研究了每個(gè)垂直行業(yè)的人力資源支出情況。

例如，如果看整個(gè)軟件支出，根據(jù)我正在撰寫的一篇博客，在美國(guó)軟件支出總體約5000億美元，同時(shí)服務(wù)行業(yè)的人力資源支出約3.5萬億美元，這些都是我們認(rèn)為可以通過生成式人工智能來解決的領(lǐng)域。即使只有5%到10%被轉(zhuǎn)化為新的商業(yè)模式，其市場(chǎng)規(guī)模和市值也相當(dāng)于再?gòu)?fù)制了整個(gè)現(xiàn)有軟件產(chǎn)業(yè)。這包括法律服務(wù)等行業(yè)，可能還有2-3家公司需要建立。各行各業(yè)都有不同的服務(wù)機(jī)會(huì)。我認(rèn)為隨著GPT級(jí)別模型的不斷升級(jí)，每一個(gè)新的能力階段都將為初創(chuàng)公司開啟新的服務(wù)市常

GPT-4或許開啟了法律服務(wù)領(lǐng)域，而GPT-3尚未能做到；GPT-5可能會(huì)開啟另一個(gè)全新的領(lǐng)域，GPT-6、GPT-7又會(huì)各自開啟不同的領(lǐng)域。所以我認(rèn)為，隨著模型能力的不斷攀升，對(duì)于初創(chuàng)公司來說，可進(jìn)入或可利用的市場(chǎng)也會(huì)持續(xù)擴(kuò)大。

與此同時(shí)，還有消費(fèi)者層面的應(yīng)用。我團(tuán)隊(duì)的David在上個(gè)季度進(jìn)行了一個(gè)實(shí)驗(yàn)，讓十幾個(gè)斯坦福學(xué)生以消遣的方式構(gòu)建ToC應(yīng)用。這純粹是為了好玩，沒有任何經(jīng)濟(jì)安排，我只是每周與他們會(huì)面，討論他們正在做的事情、見解、想法或認(rèn)識(shí)的人等。

最終孵化出幾個(gè)不同的應(yīng)用程序，并舉辦了一個(gè)Demo Day。大家提出了一些非常有趣的思路，比如AIGC在消費(fèi)者應(yīng)用領(lǐng)域可以做些什么。我認(rèn)為消費(fèi)者應(yīng)用在人工智能領(lǐng)域仍然是一個(gè)非常薄弱的環(huán)節(jié)。

總的來說，在整個(gè)初創(chuàng)世界，對(duì)消費(fèi)者領(lǐng)域的關(guān)注度已經(jīng)很低了。差不多就是那些30多歲的創(chuàng)始人了，他們已被視為"古董"。但我認(rèn)為在社交、消費(fèi)等領(lǐng)域，利用人工智能做一些真正有趣的事情，仍有很大的空間。

04 誰會(huì)贏得AI：B端還是C端？

Michael Mignano：OpenAI據(jù)說大部分16億美元收入來自C端，而Midjourney據(jù)報(bào)道也有數(shù)億美元收入，顯然也是一家ToC的公司。這是否意味著AI公司的機(jī)會(huì)可能更多地存在于消費(fèi)領(lǐng)域？

此外，您提到的那種為整個(gè)行業(yè)提供AI動(dòng)力的ToB公司，比如人們以前認(rèn)為 OpenAI會(huì)扮演的角色，也許其實(shí)現(xiàn)難度會(huì)更大。你們對(duì)此怎么看？

Sarah Guo：我認(rèn)為，無論是Figma、Canva還是其他任何廣泛定義的生產(chǎn)力公司（例如涉及寫作、圖形設(shè)計(jì)、用戶體驗(yàn)設(shè)計(jì)、視頻制作的工具），都將成為一個(gè)非常大的類別。這與“人力資本五代布局”中提到的“專業(yè)消費(fèi)者”概念有關(guān)，我認(rèn)為這個(gè)概念將在未來快速發(fā)展。

AI應(yīng)用浪潮的核心在于，軟件可以做一些以前需要雇傭人力才能完成的工作。這開辟了全新的市場(chǎng)，例如以前需要外包給代理機(jī)構(gòu)的工作，現(xiàn)在可以直接控制和操作。我認(rèn)為這對(duì)于軟件行業(yè)來說非常令人興奮。

在ToB開發(fā)方面，我認(rèn)為會(huì)有更多的應(yīng)用層公司探索開發(fā)新的端到端應(yīng)用工具或新的工作流。企業(yè)可能會(huì)花很長(zhǎng)時(shí)間去部署采用，但它們是具備這樣的意愿的。

05 提供AI服務(wù) VS 使用AI服務(wù)，誰將是頭號(hào)贏家？

Michael Mignano：你可以看到一些小企業(yè)在AI幫助下變得非常非常大，非常非常成功，而無需雇用那么多人。你也可以看到新的初創(chuàng)公司正在為中小型企業(yè)構(gòu)建AI業(yè)務(wù)和產(chǎn)品。你認(rèn)為哪一個(gè)機(jī)會(huì)更大？是利用人工智能做大事的小公司，還是幫助小公司AI化運(yùn)作的工具和服務(wù)？

Elad Gil：我想避免夸大AI的影響力。那種認(rèn)為AI會(huì)讓每個(gè)公司只留一人、所有應(yīng)用瞬間用AI重建的觀點(diǎn)，我認(rèn)為還需要很長(zhǎng)時(shí)間才能實(shí)現(xiàn)。雖然AI能顯著提高某些工作的效率，但大多數(shù)情況下仍然需要人類參與。例如Harvey是一個(gè)優(yōu)秀的法律工具，但不會(huì)在明年取代法律職業(yè)，而是成為法律專業(yè)人士的強(qiáng)力幫手。隨著時(shí)間的推移，法律服務(wù)所需的團(tuán)隊(duì)規(guī)�；蛟S會(huì)減小，但這個(gè)過程會(huì)很緩慢。

極端情況下，或許會(huì)出現(xiàn)由AI自動(dòng)開發(fā)軟件的情況，甚至可能會(huì)有人質(zhì)疑創(chuàng)始人存在的必要性。但我認(rèn)為人類總是傾向于高估AI對(duì)自身工作的影響，覺得除了自己的工作以外，所有領(lǐng)域都可以被AI取代。這種想法未免有些夸張。

Sarah Guo：我是Seek公司的投資者，該公司致力于自動(dòng)化數(shù)據(jù)分析工作。他們開發(fā)了一款產(chǎn)品，可以讓人用自然語(yǔ)言向公司的結(jié)構(gòu)化數(shù)據(jù)源（如Snowflake、數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)庫(kù)）提問，并獲得準(zhǔn)確答案。這不僅涉及自然語(yǔ)言轉(zhuǎn)SQL的問題，而是更復(fù)雜的挑戰(zhàn)。

有趣的是，他們獲得最成功案例的地方是中小企業(yè)和大型客戶，但同時(shí)也遇到了一部分分析師群體抵觸自動(dòng)化。這些人對(duì)只需少量培訓(xùn)就能完成70%或80%工作的說法并不心動(dòng)，認(rèn)為這反而會(huì)增加他們的工作負(fù)擔(dān)。然而，對(duì)于他們的老板來說，這可能極具吸引力。

我認(rèn)為銷售策略和組織內(nèi)部激勵(lì)措施都很重要。例如，小型企業(yè)通常不愿承擔(dān)過多非核心職能，他們更喜歡專注于自己喜愛的工作，而不必處理營(yíng)銷、資產(chǎn)創(chuàng)建等其他事務(wù)。因此向這類客戶銷售更簡(jiǎn)單。

總而言之，我認(rèn)為經(jīng)濟(jì)因素和能力的民主化最終會(huì)戰(zhàn)勝自動(dòng)化帶來的抵觸情緒。不過，值得注意的是，2023年和2022年底，我第一次看到創(chuàng)業(yè)者在人員配置方面如此注重效率。例如，我們最近投資了一位連續(xù)創(chuàng)業(yè)者，他正在研究如何用最少的人力實(shí)現(xiàn)1億美金收入，這與2019年的創(chuàng)業(yè)心態(tài)截然不同。

Elad Gil：真正的小公司(5人左右)非常忙碌，只會(huì)購(gòu)買3-4個(gè)必需品，例如工資、醫(yī)療保險(xiǎn)、稅務(wù)等(Rippling、Gusto、HubSpot等公司的出現(xiàn)就是證明)。因此，小公司并不是大多數(shù)產(chǎn)品的理想市常雖然AI可能帶來一些針對(duì)小公司的工具，但我認(rèn)為目前夸大了AI對(duì)人力資本的替代作用。

隨著技術(shù)發(fā)展，這種影響會(huì)逐漸擴(kuò)大，但也會(huì)有一些垂直領(lǐng)域受到的沖擊比預(yù)期更大。Midjourney就是一個(gè)例子，它在某些類型的工作上取代了人力，同時(shí)也拓展了市常隨著語(yǔ)言模型和擴(kuò)散模型不斷發(fā)展，類似的例子會(huì)越來越多出現(xiàn)。不過，目前其他領(lǐng)域的資本效率問題可能被夸大了。

06 提供AI服務(wù) VS 使用AI服務(wù)，誰將是頭號(hào)贏家？

Michael Mignano：兩位認(rèn)為擁有自研基礎(chǔ)模型是否為AI公司的終極優(yōu)勢(shì)？

Sarah Guo：從當(dāng)前的研究來看，對(duì)于足夠大量獨(dú)特?cái)?shù)據(jù)進(jìn)行微調(diào)和預(yù)訓(xùn)練之間的界限開始變得模糊，假設(shè)你從某個(gè)有用和重要的開源基礎(chǔ)模型開始。我認(rèn)為將會(huì)有應(yīng)用層面的公司從某個(gè)具有自身護(hù)城河的基礎(chǔ)模型出發(fā)，以不同的方式發(fā)展。

Elad Gil：我認(rèn)為，第一波創(chuàng)始人都是希望為各種公司(包括不需要這些模型的公司)開發(fā)自己的模型的研究人員。因此，在前一波中，每家公司都籌集了2000萬至5000萬美元資金，我認(rèn)為其中有一半的公司將難以取得成功，部分原因是他們將注意力集中在模型構(gòu)建上，而不是客戶需求上，本應(yīng)該專注于客戶。

當(dāng)然也有一些公司很好地整合了模型，比如Anthropic。我認(rèn)為，當(dāng)OpenAI推出ChatGPT時(shí)，包括OpenAI自己在內(nèi)，沒有人認(rèn)為它會(huì)如此成功。它只是一個(gè)研究預(yù)覽，卻瘋狂般流行起來，因?yàn)樗侨绱肆瞬黄鸬膭?chuàng)新。

我確實(shí)認(rèn)為，第一波人將構(gòu)建自己的模型。我想會(huì)有一部分人會(huì)繼續(xù)這樣做，因?yàn)閿U(kuò)散模型訓(xùn)練和構(gòu)建的成本明顯低于這些非常大的語(yǔ)言模型。所以在圖像、視頻和音頻方面，我們可能會(huì)繼續(xù)看到這種趨勢(shì)�？梢詮臄U(kuò)散模型開始，進(jìn)行微調(diào)，最終決定隨著時(shí)間的推移訓(xùn)練自己的模型，你會(huì)看到很多團(tuán)隊(duì)采取這樣的演進(jìn)路徑。

而對(duì)于大語(yǔ)言模型，最終將在通用性、規(guī)模和性能之間展開較量，人們將在這些曲線上做出不同的權(quán)衡。在某些情況下我將使用GPT-6，因?yàn)樗転槲姨峁⿵?qiáng)大的邏輯推理能力、可泛化的知識(shí)和完成各種任務(wù)的能力。而在其他情況下，我只需要一些小型的、高性能的東西，我可以添加一些RAG或其他東西就可以使用了。

很多應(yīng)用層公司不需要自己定制的從底層構(gòu)建的模型。而在機(jī)器人技術(shù)、科學(xué)及其不同領(lǐng)域、物理學(xué)和材料等方面，您可能會(huì)看到更多垂直整合模型的公司，這很大程度上取決于所在領(lǐng)域的特點(diǎn)。所以我認(rèn)為，情況會(huì)有所分化。

Michael Mignano：的確。近來每周都有新的模型發(fā)布基準(zhǔn)測(cè)試結(jié)果，聲稱自己比其他所有模型都更出色，然后一周后又有另一家公司做出類似主張。這種現(xiàn)象幾乎讓人感覺，所有模型都在朝著同一個(gè)方向收斂，我們正經(jīng)歷這種技術(shù)的商品化趨勢(shì)。因此，最重要的問題可能仍然是客戶采納度、留存率，以及回歸到最基本的問題是什么造就了一款偉大的產(chǎn)品。這是否也是你們兩位的看法？

Sarah Guo：我想談?wù)勀鷦偛盘岬降幕鶞?zhǔn)測(cè)試。目前流行的基準(zhǔn)測(cè)試并不能真實(shí)反映模型在實(shí)際應(yīng)用中的性能，例如代碼生成模型的基準(zhǔn)測(cè)試往往是學(xué)術(shù)研究式的，無法模擬真實(shí)開發(fā)環(huán)境的復(fù)雜性。真正衡量模型價(jià)值的方法應(yīng)該是用戶測(cè)試和實(shí)際部署，觀察用戶的使用反饋和模型帶來的實(shí)際收益。

07 聊天界面，會(huì)成為主要交互方式嗎？

Michael Mignano：我認(rèn)為，所有這一切都是基于這樣一個(gè)假設(shè)，那就是通過文字聊天界面與應(yīng)用程序互動(dòng)，是人們希望體驗(yàn)下一波應(yīng)用程序的方式。我們可以看到ChatGPT變得非常流行，這可能正是人們期待的。

另一方面，計(jì)算機(jī)發(fā)展歷史表明，人們不僅僅希望與聊天界面互動(dòng)，這就是我們有圖形用戶界面、按鈕和鼠標(biāo)的原因。你們兩個(gè)對(duì)此有何看法？你們認(rèn)為在交互界面上與程序聊天對(duì)話是一種足夠支持全新的一批應(yīng)用存在的方式嗎？Sarah，你怎么看？

Sarah Guo：聊天界面作為應(yīng)用程序的交互方式已經(jīng)得到驗(yàn)證，比如AI女友應(yīng)用的成功案例。這表明聊天界面有作為新型應(yīng)用交互方式的潛力。聊天界面是否能演變成一個(gè)操作系統(tǒng)平臺(tái)，還有待觀察。多模態(tài)界面更有可能，純聊天界面不太現(xiàn)實(shí)。

聊天界面作為自然交互方式的優(yōu)勢(shì)在于人人都會(huì)用，并且現(xiàn)在的AI技術(shù)使計(jì)算機(jī)開始理解人的意圖了。這為打造某個(gè)消費(fèi)類或生產(chǎn)力工具類Killer App奠定了基矗從一個(gè)成功的旗艦應(yīng)用出發(fā)，逐步衍生出一個(gè)應(yīng)用生態(tài)，甚至操作系統(tǒng)平臺(tái)的可能性是存在的�？刂朴布拖到y(tǒng)的一方也更有主導(dǎo)權(quán)。我對(duì)聊天界面成為主導(dǎo)交互模式保持開放態(tài)度，但它不會(huì)是唯一的交互方式。

Elad Gil：我認(rèn)為會(huì)有一系列交互界面，聊天界面、多模態(tài)界面等等。GPT-3作為一個(gè)有趣的API沒有得到足夠討論，你可以用它來處理圖片和OCR，然后以不同方式使用圖片。所以我認(rèn)為這對(duì)各種企業(yè)應(yīng)用、國(guó)防應(yīng)用、建筑、芯片設(shè)計(jì)都大有用處。極端情況下，未來幾年或者十年后，代理程序可能代表個(gè)人、企業(yè)進(jìn)行高度自動(dòng)化交互。我們自身參與的直接交互或?qū)p少。所以我認(rèn)為這些會(huì)不斷發(fā)展，關(guān)鍵在于基礎(chǔ)技術(shù)能力。

從根本上說，現(xiàn)在就有一些真實(shí)奏效、用戶喜歡的交互方式，人們通常喜歡對(duì)這些進(jìn)行修改、迭代，想出完全不同的范式。而事實(shí)上，人與人之間的對(duì)話交互通常都很順暢，沒有理由認(rèn)為人機(jī)交互就不會(huì)這樣。

如果你還記得20世紀(jì)90年代，人們剛剛推出首批個(gè)人數(shù)字助理和智能手機(jī)原型，一直想通過手寫識(shí)別。因?yàn)樗麄冋J(rèn)為人們會(huì)手寫一切。但現(xiàn)在我們只是鍵入一切。然而人們錯(cuò)誤地認(rèn)為大家不喜歡打字，必須手寫一切。于是他們?cè)O(shè)計(jì)了一種叫做Graffiti的語(yǔ)言，你必須用特定方式寫l、a、r等。因?yàn)楫?dāng)時(shí)機(jī)器沒有智能化到能夠識(shí)別手寫。在某種意義上這很愚蠢，在當(dāng)時(shí)被認(rèn)為是人機(jī)交互界面的重大突破，但現(xiàn)在它毫無用處。所以我認(rèn)為在這類事物上人們常常過度思考。打字和語(yǔ)音交互的效果就很好。

Sarah Guo：判斷一種交互方式是否可行，需要從“是否為用戶提供便利”和“技術(shù)上是否可實(shí)現(xiàn)”兩個(gè)維度考量。舉例來說，銷售代表更新CRM記錄是一件枯燥無味的事情。如果能自動(dòng)完成、減少操作步驟，用戶當(dāng)然會(huì)歡迎。

雖然聊天界面可能不是萬能解決方案，但它可以簡(jiǎn)化任務(wù)，讓人們更愿意使用。例如，有人認(rèn)為聊天界面很愚蠢，但他們真正擔(dān)心的可能是沒有其他數(shù)據(jù)源支持，或者缺乏多模態(tài)交互。如果聊天界面可以理解用戶的意圖，預(yù)測(cè)他們的下一步行動(dòng)，并且結(jié)合其他信息，例如日程安排、會(huì)議內(nèi)容等，那么它就變得更加實(shí)用。

多模態(tài)AI助手可以創(chuàng)造非常強(qiáng)大的體驗(yàn)。例如，在預(yù)訂旅行時(shí)，我可以通過與助手交談來選擇目的地，但我也可能想要查看預(yù)訂內(nèi)容，或者瀏覽附近景點(diǎn)的信息。所以多模態(tài)交互非常重要。

08 硬件 x AI

Michael Mignano：說到界面，最近我們看到很多硬件產(chǎn)品與AI結(jié)合。你們?nèi)绾慰创@種趨勢(shì)？你們認(rèn)為AI會(huì)催生新的硬件產(chǎn)品嗎？或者現(xiàn)有硬件也能通過AI實(shí)現(xiàn)新的體驗(yàn)？你們?nèi)绾慰创鼳I和硬件的未來結(jié)合？

Elad Gil：我在這領(lǐng)域投資已經(jīng)很久了。舉例來說，Samsara是一家非上市的農(nóng)業(yè)管理公司，他們?cè)谕侠瓩C(jī)等車輛上安裝硬件，為車隊(duì)提供服務(wù)。我還從Anduril公司的早期就參與了投資，這家公司專注于國(guó)防硬件與 AI、機(jī)器視覺和機(jī)器學(xué)習(xí)的結(jié)合。Square在剛開始的時(shí)候也主要是一個(gè)硬件設(shè)備。我投資他們的時(shí)候，他們還生產(chǎn)連接手機(jī)的小型讀卡器，用于刷信用卡。

所以，在某些情況下，硬件與AI的結(jié)合的確是一種強(qiáng)有力的能力提升方式，尤其是在與物理世界交互時(shí)，像Samsara和Anduril做的那樣。但在沒有硬件支持的情況下，我認(rèn)為很多消費(fèi)級(jí)應(yīng)用最終會(huì)融入現(xiàn)有的平臺(tái)。當(dāng)然，也存在一些例外，比如睡眠監(jiān)測(cè)設(shè)備，它不完全依賴于手機(jī)的功能。

不過，我認(rèn)為需要全新的功能，而不是僅僅做得更好。因此，短期內(nèi)，我認(rèn)為這些都是非�？岬膶�(shí)驗(yàn)，我很期待它們的發(fā)展，但很多早期的迭代實(shí)際上最終會(huì)在設(shè)備本身上進(jìn)行。獨(dú)立設(shè)備的功能可能會(huì)受到限制，除非它們像Anduril、Samsara、Square或其他一些公司那樣，服務(wù)于非常特定的物理功能需求。我覺得這樣才是有意義的。

不知道你還記得嗎，曾經(jīng)有個(gè)說法，會(huì)涌現(xiàn)出許多圍繞AirPods建立的企業(yè)，甚至?xí)霈F(xiàn)專門的“AirPods 公司”。但事實(shí)證明，這很難做到。問題在于，真正的功能增益是什么？你能從中創(chuàng)造什么價(jià)值？我個(gè)人覺得，有些事情有時(shí)是媒體炒作，最終并沒有太大成果。就好像當(dāng)年Instagram剛出現(xiàn)時(shí)，也有好幾家不同的照片上傳應(yīng)用公司，但只有Instagram真正做到了極致。所以，我不禁懷疑，其中一部分會(huì)不會(huì)只是炒作浪潮，雖然可能為未來埋下一些有趣的種子，但最終不會(huì)真正轉(zhuǎn)化為有價(jià)值的產(chǎn)品。

Michael Mignano：Sarah，如果你也同意這個(gè)觀點(diǎn)，那么我們接下來可以討論一下，AI如何在現(xiàn)有硬件平臺(tái)上創(chuàng)造全新的用戶體驗(yàn)。以Uber為例，如果沒有 GPS，它就不可能存在，即使當(dāng)時(shí)的手機(jī)上有各種應(yīng)用。同樣，Instagram也是相機(jī)技術(shù)發(fā)展的結(jié)果，才得以誕生。那么，隨著AI的發(fā)展，我們是否會(huì)在現(xiàn)有平臺(tái)上看到全新的應(yīng)用類型，這些應(yīng)用只有借助AI的力量才能實(shí)現(xiàn)？這些應(yīng)用又會(huì)是什么樣的呢？

Sarah Guo：我認(rèn)為這些新應(yīng)用的出現(xiàn)既是必然的，也難以準(zhǔn)確預(yù)測(cè)具體形式。就像CRM的例子一樣，人們因?yàn)榭吹竭^不成熟的版本而對(duì)技術(shù)失去信心，導(dǎo)致很難想象未來會(huì)是什么樣子。比如跨應(yīng)用操作，如今的相關(guān)指令并不完善。

從用戶的角度來看，另一個(gè)問題是，新硬件是否應(yīng)該為用戶服務(wù)，還是僅僅為了訓(xùn)練模型而收集設(shè)備數(shù)據(jù)？如果想要?jiǎng)?chuàng)造新的體驗(yàn)，是否真的需要新硬件？當(dāng)然，如果提供給用戶新的硬件功能，并擁有現(xiàn)成的用戶基礎(chǔ)，那么肯定會(huì)催生新的應(yīng)用。但這也是個(gè)先有雞還是先有蛋的問題，關(guān)鍵在于找到Killer App。

您提到的一些例子，例如電池管理、傳感器、權(quán)限管理以及上下文智能，可以幫助實(shí)現(xiàn)更好的體驗(yàn)，這的確是支持新硬件的一個(gè)重要論據(jù)。眼鏡、聽覺設(shè)備等可能成為未來的新形態(tài)，關(guān)鍵在于如何以新的或現(xiàn)有的形式獲取數(shù)據(jù)和信息。但是，現(xiàn)有的生態(tài)系統(tǒng)能否支持這些新的應(yīng)用和硬件也是一個(gè)難題�？偠灾@是一個(gè)非常復(fù)雜的問題。

Elad Gil：我想再分享兩個(gè)例子，我認(rèn)為它們非常值得關(guān)注。第一個(gè)是機(jī)器人領(lǐng)域。最近幾周，關(guān)于機(jī)器人研究的論文層出不窮，其中一些將機(jī)器人技術(shù)與標(biāo)準(zhǔn)深度學(xué)習(xí)方法結(jié)合，令人興奮。我認(rèn)為，將更多標(biāo)準(zhǔn)深度學(xué)習(xí)技術(shù)應(yīng)用于機(jī)器人領(lǐng)域，將大大提升其能力。第二個(gè)領(lǐng)域是自動(dòng)駕駛。它同樣融合了機(jī)器人、硬件等多方面技術(shù)。我相信，隨著我們將基礎(chǔ)模型應(yīng)用于這些物理世界領(lǐng)域，并開發(fā)專門的硬件，這些領(lǐng)域?qū)⑷〉蔑@著發(fā)展。不過，消費(fèi)類硬件設(shè)備當(dāng)下還并不具備發(fā)展之勢(shì)。

09 Web3會(huì)是驗(yàn)證真實(shí)性的途徑嗎？

Michael Mignano：最近，許多公司和個(gè)人都在討論Web3的Killer App之一可能與AI和內(nèi)容真實(shí)性密切相關(guān)。例如，投資人Fred Wilson和Scott Banister都曾提及過這個(gè)觀點(diǎn)。隨著像Pika、Midjourney等公司不斷推出生成各種媒體形式的模型，這些模型全部基于其他原始媒體進(jìn)行訓(xùn)練。未來，我們需要一種方法來追蹤這些內(nèi)容的真實(shí)性和來源，以建立一個(gè)公平的權(quán)利結(jié)構(gòu)。Web3可能成為實(shí)現(xiàn)這一目標(biāo)的途徑。那么，您二位如何看待這一點(diǎn)？你們認(rèn)為Web3和AI有哪些潛在機(jī)遇？

Sarah Guo：從可用性角度來看，要讓那些擁有IP的創(chuàng)作者和企業(yè)利用Crypto技術(shù)去進(jìn)行內(nèi)容溯源距離實(shí)際應(yīng)用還有一定的距離，但從技術(shù)可行性上來看，這似乎是一個(gè)可實(shí)現(xiàn)的解決方案。

Elad Gil：我一直認(rèn)為，區(qū)塊鏈將成為一種身份認(rèn)證形式，不僅可以用于內(nèi)容溯源，還可以用于驗(yàn)證代理的身份和資格。如果一個(gè)代理聲稱代表你，你怎么知道它確實(shí)代表了一個(gè)特定的個(gè)體？它能否以安全的方式部分展示該個(gè)體的數(shù)據(jù)或某些方面的信息？這可能是你的醫(yī)療數(shù)據(jù)，可能是關(guān)于你是誰的某些方面。這是一個(gè)我長(zhǎng)期以來一直感興趣的領(lǐng)域。我曾在播客中采訪過Illia Polosukhin，他是Transformer論文的最后一名作者。我還在加拿大與他進(jìn)行了一次閑聊。我認(rèn)為這些概念真的很有意思，但它們的發(fā)展可能需要一段時(shí)間。

從內(nèi)容溯源角度來說，我認(rèn)為情況會(huì)略復(fù)雜一些。比如，假設(shè)你的數(shù)據(jù)集中已經(jīng)包含了大量類似梵高風(fēng)格的衍生藝術(shù)作品。即便你從數(shù)據(jù)集中移除所有原始的梵高作品，由于數(shù)據(jù)集中仍保留了足夠多“梵高風(fēng)格”的訊號(hào)，模型訓(xùn)練的結(jié)果依舊不會(huì)受很大影響。

而且，這些衍生作品從版權(quán)或使用許可的角度來說也不構(gòu)成任何侵權(quán)。我認(rèn)為在討論內(nèi)容來源和證明方面，人們沒有充分考慮這些情況。事實(shí)上，你可以移除所有知名藝術(shù)家的原創(chuàng)作品，但這對(duì)模型的訓(xùn)練影響不大，因?yàn)檫@種風(fēng)格的作品已經(jīng)“內(nèi)化”到數(shù)據(jù)集中。在圖像生成方面，我認(rèn)為它比人們想象的要復(fù)雜得多，在某種程度上也更難去保護(hù)某些藝術(shù)家，因?yàn)樗麄冿L(fēng)格的衍生創(chuàng)作已經(jīng)廣泛存在。

10 AI監(jiān)管將走向何方？

Michael Mignano：美國(guó)國(guó)會(huì)已經(jīng)開始討論AI訓(xùn)練的合法性問題。雖然我們都不是該領(lǐng)域的專家，但我們可以談?wù)勎覀儗?duì)這個(gè)問題的看法。從理論上講，我認(rèn)為AI訓(xùn)練是合理的，因?yàn)樗菣C(jī)器學(xué)習(xí)的一種方式。我們?nèi)祟愐彩峭ㄟ^閱讀、學(xué)習(xí)和模仿來進(jìn)行創(chuàng)作的，為什么機(jī)器不能這樣做呢？您二位認(rèn)為AI訓(xùn)練的合法性將會(huì)如何演變？

Sarah Guo：這是一個(gè)政治性問題，所以它取決于哪一派是當(dāng)權(quán)者。但是，我認(rèn)為只要對(duì)模型的輸出設(shè)置一系列的保障措施，那么AI訓(xùn)練是合理使用的觀點(diǎn)就站得住腳。

我認(rèn)為人們會(huì)在應(yīng)用層面和經(jīng)過驗(yàn)證的輸出能力層面上去參與這些斗爭(zhēng)。這是正確的著手點(diǎn)。正如Elad所說，基于區(qū)塊鏈的技術(shù)的另一個(gè)核心用例是低成本地實(shí)現(xiàn)微交易。這方面仍有工作要做。Ilia說的一件事仍然讓我記憶深刻，那就是模型訓(xùn)練繼續(xù)進(jìn)步的障礙之一是收集我們還沒有的數(shù)據(jù)，并讓人們貢獻(xiàn)這些數(shù)據(jù)。對(duì)此，有抵御濫用的數(shù)據(jù)貢獻(xiàn)、標(biāo)記和交易系統(tǒng)將非常有價(jià)值，這聽起來像是一個(gè)身份和信譽(yù)系統(tǒng)。如果能解決這個(gè)問題，我認(rèn)為它會(huì)非常有價(jià)值。