展會(huì)信息港展會(huì)大全

硅谷頂級(jí)VC的最新洞察:AI公司應(yīng)該專注用戶需求,而非模型構(gòu)建
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-04 15:02:37   瀏覽:6118次  

導(dǎo)讀:文 | 烏鴉智能說 本文編譯自播客節(jié)目Generative Now Podcast。在本期節(jié)目中,長(zhǎng)期創(chuàng)業(yè)者和創(chuàng)業(yè)投資人Elad Gil,前Greylock總合伙人、Conviction創(chuàng)始人Sarah Guo和Lightspeed合伙人Michael Mignano共同審視AI投資的廣闊世界。 Elad Gil是硅谷知名的Solo VC 投...

文 | 烏鴉智能說

本文編譯自播客節(jié)目Generative Now Podcast。在本期節(jié)目中,長(zhǎng)期創(chuàng)業(yè)者和創(chuàng)業(yè)投資人Elad Gil,前Greylock總合伙人、Conviction創(chuàng)始人Sarah Guo和Lightspeed合伙人Michael Mignano共同審視AI投資的廣闊世界。

Elad Gil是硅谷知名的Solo VC 投資人,參與投資了Perpleixty 、Character.ai、Mistral、Harvy 以及 Pika 等知名 AI 初創(chuàng)公司。去年11月, Elad Gil完成了第三支基金募集,也是迄今為止規(guī)模最大的基金總計(jì)超10億美元;據(jù)悉,這支基金從 54 位 LPs 那里獲得了近11 億美元的承諾,相比 2021 年關(guān)閉的 6.2 億美元基金規(guī)模擴(kuò)大了 77%。

在訪談中,Gil表示新型模型公司仍然有可能出現(xiàn),部分基礎(chǔ)模型將被通用模型采用,而另一些則需要在訓(xùn)練數(shù)據(jù)集和架構(gòu)方面進(jìn)行微調(diào)。此外,Gil還提到,AI公司應(yīng)該更關(guān)注專注于客戶需求,而不是將注意力集中在模型構(gòu)建上。

以下為本文目錄,建議結(jié)合要點(diǎn)進(jìn)行針對(duì)性閱讀:

01 AI將迎來五個(gè)人力資本浪潮02新型模型公司仍然有可能出現(xiàn)03下一波應(yīng)用浪潮會(huì)是什么樣子?04誰會(huì)贏得AI:B端還是C端05提供AI服務(wù) VS 使用AI服務(wù),誰將是頭號(hào)贏家06垂直整合的模型07聊天界面,會(huì)成為主要的交互方式嗎08硬件 x AI09Web3,將是驗(yàn)證真實(shí)性的途徑10AI監(jiān)管將走向何方

01 AI將迎來五個(gè)人力資本浪潮

Michael Mignano:你們都是聰慧老練的投資者,有預(yù)見到2023年AI投資領(lǐng)域會(huì)是這樣嗎?

Sarah Guo:我們做了一個(gè)長(zhǎng)期的賭注。我們?cè)?022年10月創(chuàng)立了Conviction,隨后在11月就出現(xiàn)了ChatGPT時(shí)刻,用戶的反應(yīng)還是很出乎我的意料的.我本以為這樣的時(shí)刻會(huì)出現(xiàn)得更晚一些。而且我們看到人工智能飛速發(fā)展乃至遇到了擴(kuò)展的瓶頸,Transformer模型變得越來越有效,長(zhǎng)期存在的開放性問題也得到了解決……這一切都令人激動(dòng)。我本以為這會(huì)是一個(gè)比較緩慢的推進(jìn)過程,我會(huì)有更多的時(shí)間組建基金,但我想現(xiàn)在的這種速度令所有人驚訝。

PS:Samsara是一家總部位于美國(guó)舊金山的傳感器數(shù)據(jù)平臺(tái),為客戶提供大量追蹤服務(wù)所需的物聯(lián)網(wǎng)傳感器硬件和軟件產(chǎn)品

Anduril Industries 是一家國(guó)防產(chǎn)品公司,其產(chǎn)品是由AI驅(qū)動(dòng)的開放操作系統(tǒng)Lattice OS,該系統(tǒng)將自動(dòng)化感知和指揮控制能力與開放、模塊化和可擴(kuò)展的硬件組件連接起來,為防務(wù)任務(wù)提供自動(dòng)化解決方案。

Elad Gil:我從20多年前谷歌時(shí)期就開始從事人工智能領(lǐng)域的工作,當(dāng)時(shí)我正在研究早期的機(jī)器學(xué)習(xí),也就是深度學(xué)習(xí)之前的時(shí)代。后來深度學(xué)習(xí)興起,我在過去10年里投資了很多公司,但絕大部分都沒有取得成功。當(dāng)然也有一些公司利用了人工智能作為輔助或賦能的手段,從而發(fā)展壯大,比如我投資初期的Samsara和Anduril等公司。

對(duì)我來說,真正的轉(zhuǎn)折點(diǎn)是GPT-3的出現(xiàn),因?yàn)樗菺PT-2有了質(zhì)的飛躍。GPT-3發(fā)布時(shí),我在播客中表達(dá)了我的興奮之情,甚至主動(dòng)聯(lián)系了他們,想要合作探討。后來我們確實(shí)就加密貨幣、人工智能等幾個(gè)主題與Chris Dixon和Scalar Capital合作過。

當(dāng)GPT-3出現(xiàn)時(shí),人工智能領(lǐng)域又向前躍進(jìn)了一大步。從那時(shí)起,我開始大量投資并接觸研究人員。有些人主動(dòng)聯(lián)系我,比如我以前就認(rèn)識(shí)的Character.AI的Noam,他說想創(chuàng)立一家公司;還有Perplexity公司的Aravind,我們開始經(jīng)常聚會(huì),討論潛在的創(chuàng)業(yè)機(jī)會(huì)。

簡(jiǎn)而言之,技術(shù)在短時(shí)間內(nèi)實(shí)現(xiàn)了巨大飛躍,但當(dāng)時(shí)幾乎沒有人真正關(guān)注它。這簡(jiǎn)直就像是一個(gè)黃金時(shí)代,聚集了眾多有趣的想法和人才,但幾乎無人問津,這讓人非常興奮。

Michael Mignano:Sarah,你之前提到通過觀察事物的發(fā)展趨勢(shì),幾乎可以預(yù)見這種突破性進(jìn)展的到來,盡管你沒有預(yù)計(jì)它會(huì)發(fā)生在ChatGPT問世的那一刻,F(xiàn)在,當(dāng)展望未來時(shí),感覺我們似乎處于發(fā)展曲線的中間階段。你們認(rèn)為人工智能的發(fā)展是會(huì)在不久的將來就趨于平緩,還是在可預(yù)見的未來我們將一直保持直線上升的軌跡?

Sarah Guo:我不想過多重復(fù)加密貨幣投資者的觀點(diǎn),但我確實(shí)感覺我們目前處于人工智能發(fā)展的非常早期階段,未來我們將獲得堆疊式的能力提升

投資時(shí)機(jī)非常重要。如果時(shí)機(jī)稍早或稍晚都無關(guān)緊要,關(guān)鍵是要有獨(dú)特且極具創(chuàng)新性的見解。在技術(shù)變革期間,即使進(jìn)入較晚,只要有足夠獨(dú)特和聰明的見解,也是可以的。

更重要的一點(diǎn)是,作為投資者,你必須通過足夠的實(shí)踐和嘗試,無論是作為創(chuàng)始人還是投資者,來了解我們距離人工智能成熟發(fā)展還有多遠(yuǎn)。我之前在Greylock工作了十年,投資了一些上一代的機(jī)器學(xué)習(xí)公司,可能有些為時(shí)過早。

事實(shí)上,今天最引人注目的那些創(chuàng)始人都研究人工智能很長(zhǎng)時(shí)間了,比如你們都認(rèn)識(shí)的來自Weights & Biases的Lukas,他之前嘗試過一次,但當(dāng)時(shí)進(jìn)場(chǎng)太早,沒有取得成功。

就我個(gè)人而言,大約三四年前,我投資了Base10,而今年它終于開始真正落地運(yùn)作。我們也在Inflection公司下了重注,這個(gè)公司的名字選得很貼切。除了OpenAI之外,Inflection是最早一批專注于基礎(chǔ)模型的公司之一。

也許從規(guī)模成本的角度來看,推動(dòng)大型語(yǔ)言模型繼續(xù)突破現(xiàn)有水平變得更加困難,下一組訓(xùn)練數(shù)據(jù)的來源也不太明朗。但隨著越來越多的人關(guān)注人工智能,生態(tài)系統(tǒng)得到更大規(guī)模的支持和資金投入,人工智能發(fā)展將有更強(qiáng)的復(fù)合效應(yīng)。所以我認(rèn)為我們現(xiàn)在處于人工智能發(fā)展的相當(dāng)早期階段。

Elad Gil:我認(rèn)為人工智能仍有大量增長(zhǎng)空間。ChatGPT對(duì)大多數(shù)人來說是一個(gè)發(fā)令槍,包括我們,因?yàn)槟壳盎旧线沒有真正的企業(yè)級(jí)大規(guī)模部署應(yīng)用。所以這將是一個(gè)大浪潮。

總的來說,我認(rèn)為將會(huì)有五個(gè)人力資本浪潮 。

Aravind Srinivas,Perplexity創(chuàng)始人

第一浪潮是原生人工智能建設(shè)者,他們一直在研究大型語(yǔ)言模型和基礎(chǔ)模型,希望做出應(yīng)用程序。這就是Noam創(chuàng)辦Character.AI的原因,他是Transformer原作之一。還有來自Perplexity的Aravind等人,他們都曾在谷歌、OpenAI或Facebook等公司工作。

第二波是一群極客,我也將自己歸入這一陣營(yíng)。他們是經(jīng)驗(yàn)豐富的開發(fā)人員和基礎(chǔ)設(shè)施人員。他們中的一些人早期就開始創(chuàng)辦公司,比如Sarah提到的Base10,但也有一些公司成立較晚,比如Together等,它們現(xiàn)在為這些模型提供支持服務(wù)。我們經(jīng)歷了一個(gè)基礎(chǔ)設(shè)施浪潮,現(xiàn)在仍在持續(xù),同時(shí)涌現(xiàn)出像Braintrust這樣的工具公司。

第三浪潮將是ToB應(yīng)用程序開發(fā)者。我認(rèn)為很多在一年多前聽說過ChatGPT的人,可能六個(gè)月前就已經(jīng)辭去了工作,花了幾個(gè)月的時(shí)間思考,現(xiàn)在正在開始創(chuàng)業(yè)。所以我們會(huì)看到一波企業(yè)級(jí)應(yīng)用程序浪潮。隨后的第四浪潮將在ToC應(yīng)用領(lǐng)域出現(xiàn)。第五個(gè)浪潮將出現(xiàn)在企業(yè)級(jí)的實(shí)際大規(guī)模部署應(yīng)用方面。

所以我認(rèn)為這將是一波接一波的人潮,他們?cè)跁r(shí)間上有所錯(cuò)開,具有不同的技術(shù)能力,專注于產(chǎn)品或工程思維等等。當(dāng)然也有一些夾在中間的人,比如Harvey團(tuán)隊(duì)就是一個(gè)很好的例子。但總的來說,我認(rèn)為這就是人工智能發(fā)展的大致軌跡。

02 新型模型公司仍然有可能出現(xiàn)

Michael Mignano:目前大型模型的機(jī)遇是否已經(jīng)盡現(xiàn),比如2023年那些投向Anthropic、Inflection或OpenAI等公司的巨額融資?這種機(jī)遇之窗對(duì)于初創(chuàng)公司而言,是否已經(jīng)基本關(guān)閉了?如果是這樣,2024年大部分資金將投向哪些領(lǐng)域呢?

Sarah Guo:風(fēng)投資本往往追隨先例,但是一些真正創(chuàng)新型的公司往往史無前例,在發(fā)展上無法預(yù)測(cè)。人們最初并不熱衷于投資基礎(chǔ)模型公司,直到ChatGPT的飛速增長(zhǎng)引起了廣泛關(guān)注。

我認(rèn)為不同模態(tài)的模型或模型應(yīng)用領(lǐng)域存在機(jī)會(huì),比如視頻領(lǐng)域、生物技術(shù)、臨床醫(yī)學(xué)等。我認(rèn)為我的基金將大部分投資于應(yīng)用方向,但目前還投資了一些基礎(chǔ)模型公司。

Elad Gil:我非常認(rèn)同未來會(huì)出現(xiàn)新型模型公司的觀點(diǎn),F(xiàn)今模型類型琳瑯滿目,涵蓋語(yǔ)言模型、語(yǔ)音模型、圖像/視頻/音頻擴(kuò)散模型、代碼模型、生物、物理、材料科學(xué)、數(shù)學(xué)等領(lǐng)域。部分基礎(chǔ)模型將被通用模型采用,而另一些則需要在訓(xùn)練數(shù)據(jù)集和架構(gòu)方面進(jìn)行微調(diào)。例如,AlphaFold并非單純基于Transformer的模型,而是采用了混合架構(gòu),盡管Transformer也在其開發(fā)中發(fā)揮了重要作用。

一些模型將會(huì)應(yīng)用到科學(xué)、機(jī)器人、醫(yī)學(xué)等領(lǐng)域。從資金角度來看,大部分投資可能會(huì)流向模型公司,因?yàn)樗鼈冑Y金需求更大。但從公司數(shù)量的角度來看,我預(yù)計(jì)明年我們將看到更多的應(yīng)用程序開發(fā)公司,而不是基礎(chǔ)模型公司

03 下一波應(yīng)用浪潮是什么樣?

Michael Mignano:下一波應(yīng)用浪潮會(huì)是什么樣子?當(dāng)我們談?wù)搼?yīng)用程序時(shí),可以是傳統(tǒng)意義上的桌面應(yīng)用、移動(dòng)應(yīng)用,也可以是ChatGPT這樣的大型語(yǔ)言模型應(yīng)用,后者是否會(huì)成為一個(gè)全新的可投資公司和產(chǎn)品領(lǐng)域?

Elad Gil:我認(rèn)為在ToB和ToC領(lǐng)域都會(huì)有一些大型語(yǔ)言模型的應(yīng)用。我和我的小團(tuán)隊(duì)做了一件事,就是將所有服務(wù)領(lǐng)域按照可被AIGC解決的程度進(jìn)行了分類,并研究了每個(gè)垂直行業(yè)的人力資源支出情況。

例如,如果看整個(gè)軟件支出,根據(jù)我正在撰寫的一篇博客,在美國(guó)軟件支出總體約5000億美元,同時(shí)服務(wù)行業(yè)的人力資源支出約3.5萬億美元,這些都是我們認(rèn)為可以通過生成式人工智能來解決的領(lǐng)域。即使只有5%到10%被轉(zhuǎn)化為新的商業(yè)模式,其市場(chǎng)規(guī)模和市值也相當(dāng)于再?gòu)?fù)制了整個(gè)現(xiàn)有軟件產(chǎn)業(yè)。這包括法律服務(wù)等行業(yè),可能還有2-3家公司需要建立。各行各業(yè)都有不同的服務(wù)機(jī)會(huì)。我認(rèn)為隨著GPT級(jí)別模型的不斷升級(jí),每一個(gè)新的能力階段都將為初創(chuàng)公司開啟新的服務(wù)市常

GPT-4或許開啟了法律服務(wù)領(lǐng)域,而GPT-3尚未能做到;GPT-5可能會(huì)開啟另一個(gè)全新的領(lǐng)域,GPT-6、GPT-7又會(huì)各自開啟不同的領(lǐng)域。所以我認(rèn)為,隨著模型能力的不斷攀升,對(duì)于初創(chuàng)公司來說,可進(jìn)入或可利用的市場(chǎng)也會(huì)持續(xù)擴(kuò)大。

與此同時(shí),還有消費(fèi)者層面的應(yīng)用。我團(tuán)隊(duì)的David在上個(gè)季度進(jìn)行了一個(gè)實(shí)驗(yàn),讓十幾個(gè)斯坦福學(xué)生以消遣的方式構(gòu)建ToC應(yīng)用。這純粹是為了好玩,沒有任何經(jīng)濟(jì)安排,我只是每周與他們會(huì)面,討論他們正在做的事情、見解、想法或認(rèn)識(shí)的人等。

最終孵化出幾個(gè)不同的應(yīng)用程序,并舉辦了一個(gè)Demo Day。大家提出了一些非常有趣的思路,比如AIGC在消費(fèi)者應(yīng)用領(lǐng)域可以做些什么。我認(rèn)為消費(fèi)者應(yīng)用在人工智能領(lǐng)域仍然是一個(gè)非常薄弱的環(huán)節(jié)。

總的來說,在整個(gè)初創(chuàng)世界,對(duì)消費(fèi)者領(lǐng)域的關(guān)注度已經(jīng)很低了。差不多就是那些30多歲的創(chuàng)始人了,他們已被視為"古董"。但我認(rèn)為在社交、消費(fèi)等領(lǐng)域,利用人工智能做一些真正有趣的事情,仍有很大的空間。

04 誰會(huì)贏得AI:B端還是C端?

Michael Mignano:OpenAI據(jù)說大部分16億美元收入來自C端,而Midjourney據(jù)報(bào)道也有數(shù)億美元收入,顯然也是一家ToC的公司。這是否意味著AI公司的機(jī)會(huì)可能更多地存在于消費(fèi)領(lǐng)域?

此外,您提到的那種為整個(gè)行業(yè)提供AI動(dòng)力的ToB公司,比如人們以前認(rèn)為 OpenAI會(huì)扮演的角色,也許其實(shí)現(xiàn)難度會(huì)更大。你們對(duì)此怎么看?

Sarah Guo:我認(rèn)為,無論是Figma、Canva還是其他任何廣泛定義的生產(chǎn)力公司(例如涉及寫作、圖形設(shè)計(jì)、用戶體驗(yàn)設(shè)計(jì)、視頻制作的工具),都將成為一個(gè)非常大的類別。這與“人力資本五代布局”中提到的“專業(yè)消費(fèi)者”概念有關(guān),我認(rèn)為這個(gè)概念將在未來快速發(fā)展。

AI應(yīng)用浪潮的核心在于,軟件可以做一些以前需要雇傭人力才能完成的工作。這開辟了全新的市場(chǎng),例如以前需要外包給代理機(jī)構(gòu)的工作,現(xiàn)在可以直接控制和操作。我認(rèn)為這對(duì)于軟件行業(yè)來說非常令人興奮。

在ToB開發(fā)方面,我認(rèn)為會(huì)有更多的應(yīng)用層公司探索開發(fā)新的端到端應(yīng)用工具或新的工作流。企業(yè)可能會(huì)花很長(zhǎng)時(shí)間去部署采用,但它們是具備這樣的意愿的。

05 提供AI服務(wù) VS 使用AI服務(wù),誰將是頭號(hào)贏家?

Michael Mignano:你可以看到一些小企業(yè)在AI幫助下變得非常非常大,非常非常成功,而無需雇用那么多人。你也可以看到新的初創(chuàng)公司正在為中小型企業(yè)構(gòu)建AI業(yè)務(wù)和產(chǎn)品。你認(rèn)為哪一個(gè)機(jī)會(huì)更大?是利用人工智能做大事的小公司,還是幫助小公司AI化運(yùn)作的工具和服務(wù)?

Elad Gil:我想避免夸大AI的影響力。那種認(rèn)為AI會(huì)讓每個(gè)公司只留一人、所有應(yīng)用瞬間用AI重建的觀點(diǎn),我認(rèn)為還需要很長(zhǎng)時(shí)間才能實(shí)現(xiàn)。雖然AI能顯著提高某些工作的效率,但大多數(shù)情況下仍然需要人類參與。例如Harvey是一個(gè)優(yōu)秀的法律工具,但不會(huì)在明年取代法律職業(yè),而是成為法律專業(yè)人士的強(qiáng)力幫手。隨著時(shí)間的推移,法律服務(wù)所需的團(tuán)隊(duì)規(guī);蛟S會(huì)減小,但這個(gè)過程會(huì)很緩慢。

極端情況下,或許會(huì)出現(xiàn)由AI自動(dòng)開發(fā)軟件的情況,甚至可能會(huì)有人質(zhì)疑創(chuàng)始人存在的必要性。但我認(rèn)為人類總是傾向于高估AI對(duì)自身工作的影響,覺得除了自己的工作以外,所有領(lǐng)域都可以被AI取代。這種想法未免有些夸張。

Sarah Guo:我是Seek公司的投資者,該公司致力于自動(dòng)化數(shù)據(jù)分析工作。他們開發(fā)了一款產(chǎn)品,可以讓人用自然語(yǔ)言向公司的結(jié)構(gòu)化數(shù)據(jù)源(如Snowflake、數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)庫(kù))提問,并獲得準(zhǔn)確答案。這不僅涉及自然語(yǔ)言轉(zhuǎn)SQL的問題,而是更復(fù)雜的挑戰(zhàn)。

有趣的是,他們獲得最成功案例的地方是中小企業(yè)和大型客戶,但同時(shí)也遇到了一部分分析師群體抵觸自動(dòng)化。這些人對(duì)只需少量培訓(xùn)就能完成70%或80%工作的說法并不心動(dòng),認(rèn)為這反而會(huì)增加他們的工作負(fù)擔(dān)。然而,對(duì)于他們的老板來說,這可能極具吸引力。

我認(rèn)為銷售策略和組織內(nèi)部激勵(lì)措施都很重要。例如,小型企業(yè)通常不愿承擔(dān)過多非核心職能,他們更喜歡專注于自己喜愛的工作,而不必處理營(yíng)銷、資產(chǎn)創(chuàng)建等其他事務(wù)。因此向這類客戶銷售更簡(jiǎn)單

總而言之,我認(rèn)為經(jīng)濟(jì)因素和能力的民主化最終會(huì)戰(zhàn)勝自動(dòng)化帶來的抵觸情緒。不過,值得注意的是,2023年和2022年底,我第一次看到創(chuàng)業(yè)者在人員配置方面如此注重效率。例如,我們最近投資了一位連續(xù)創(chuàng)業(yè)者,他正在研究如何用最少的人力實(shí)現(xiàn)1億美金收入,這與2019年的創(chuàng)業(yè)心態(tài)截然不同。

Elad Gil:真正的小公司(5人左右)非常忙碌,只會(huì)購(gòu)買3-4個(gè)必需品,例如工資、醫(yī)療保險(xiǎn)、稅務(wù)等(Rippling、Gusto、HubSpot等公司的出現(xiàn)就是證明)。因此,小公司并不是大多數(shù)產(chǎn)品的理想市常雖然AI可能帶來一些針對(duì)小公司的工具,但我認(rèn)為目前夸大了AI對(duì)人力資本的替代作用。

隨著技術(shù)發(fā)展,這種影響會(huì)逐漸擴(kuò)大,但也會(huì)有一些垂直領(lǐng)域受到的沖擊比預(yù)期更大。Midjourney就是一個(gè)例子,它在某些類型的工作上取代了人力,同時(shí)也拓展了市常隨著語(yǔ)言模型和擴(kuò)散模型不斷發(fā)展,類似的例子會(huì)越來越多出現(xiàn)。不過,目前其他領(lǐng)域的資本效率問題可能被夸大了。

06 提供AI服務(wù) VS 使用AI服務(wù),誰將是頭號(hào)贏家?

Michael Mignano:兩位認(rèn)為擁有自研基礎(chǔ)模型是否為AI公司的終極優(yōu)勢(shì)?

Sarah Guo:從當(dāng)前的研究來看,對(duì)于足夠大量獨(dú)特?cái)?shù)據(jù)進(jìn)行微調(diào)和預(yù)訓(xùn)練之間的界限開始變得模糊,假設(shè)你從某個(gè)有用和重要的開源基礎(chǔ)模型開始。我認(rèn)為將會(huì)有應(yīng)用層面的公司從某個(gè)具有自身護(hù)城河的基礎(chǔ)模型出發(fā),以不同的方式發(fā)展。

Elad Gil:我認(rèn)為,第一波創(chuàng)始人都是希望為各種公司(包括不需要這些模型的公司)開發(fā)自己的模型的研究人員。因此,在前一波中,每家公司都籌集了2000萬至5000萬美元資金,我認(rèn)為其中有一半的公司將難以取得成功,部分原因是他們將注意力集中在模型構(gòu)建上,而不是客戶需求上,本應(yīng)該專注于客戶。

當(dāng)然也有一些公司很好地整合了模型,比如Anthropic。我認(rèn)為,當(dāng)OpenAI推出ChatGPT時(shí),包括OpenAI自己在內(nèi),沒有人認(rèn)為它會(huì)如此成功。它只是一個(gè)研究預(yù)覽,卻瘋狂般流行起來,因?yàn)樗侨绱肆瞬黄鸬膭?chuàng)新。

我確實(shí)認(rèn)為,第一波人將構(gòu)建自己的模型。我想會(huì)有一部分人會(huì)繼續(xù)這樣做,因?yàn)閿U(kuò)散模型訓(xùn)練和構(gòu)建的成本明顯低于這些非常大的語(yǔ)言模型。所以在圖像、視頻和音頻方面,我們可能會(huì)繼續(xù)看到這種趨勢(shì)?梢詮臄U(kuò)散模型開始,進(jìn)行微調(diào),最終決定隨著時(shí)間的推移訓(xùn)練自己的模型,你會(huì)看到很多團(tuán)隊(duì)采取這樣的演進(jìn)路徑。

而對(duì)于大語(yǔ)言模型,最終將在通用性、規(guī)模和性能之間展開較量,人們將在這些曲線上做出不同的權(quán)衡。在某些情況下我將使用GPT-6,因?yàn)樗転槲姨峁⿵?qiáng)大的邏輯推理能力、可泛化的知識(shí)和完成各種任務(wù)的能力。而在其他情況下,我只需要一些小型的、高性能的東西,我可以添加一些RAG或其他東西就可以使用了。

很多應(yīng)用層公司不需要自己定制的從底層構(gòu)建的模型。而在機(jī)器人技術(shù)、科學(xué)及其不同領(lǐng)域、物理學(xué)和材料等方面,您可能會(huì)看到更多垂直整合模型的公司,這很大程度上取決于所在領(lǐng)域的特點(diǎn)。所以我認(rèn)為,情況會(huì)有所分化。

Michael Mignano:的確。近來每周都有新的模型發(fā)布基準(zhǔn)測(cè)試結(jié)果,聲稱自己比其他所有模型都更出色,然后一周后又有另一家公司做出類似主張。這種現(xiàn)象幾乎讓人感覺,所有模型都在朝著同一個(gè)方向收斂,我們正經(jīng)歷這種技術(shù)的商品化趨勢(shì)。因此,最重要的問題可能仍然是客戶采納度、留存率,以及回歸到最基本的問題是什么造就了一款偉大的產(chǎn)品。這是否也是你們兩位的看法?

Sarah Guo:我想談?wù)勀鷦偛盘岬降幕鶞?zhǔn)測(cè)試。目前流行的基準(zhǔn)測(cè)試并不能真實(shí)反映模型在實(shí)際應(yīng)用中的性能,例如代碼生成模型的基準(zhǔn)測(cè)試往往是學(xué)術(shù)研究式的,無法模擬真實(shí)開發(fā)環(huán)境的復(fù)雜性。真正衡量模型價(jià)值的方法應(yīng)該是用戶測(cè)試和實(shí)際部署,觀察用戶的使用反饋和模型帶來的實(shí)際收益

07 聊天界面,會(huì)成為主要交互方式嗎?

Michael Mignano:我認(rèn)為,所有這一切都是基于這樣一個(gè)假設(shè),那就是通過文字聊天界面與應(yīng)用程序互動(dòng),是人們希望體驗(yàn)下一波應(yīng)用程序的方式。我們可以看到ChatGPT變得非常流行,這可能正是人們期待的。

另一方面,計(jì)算機(jī)發(fā)展歷史表明,人們不僅僅希望與聊天界面互動(dòng),這就是我們有圖形用戶界面、按鈕和鼠標(biāo)的原因。你們兩個(gè)對(duì)此有何看法?你們認(rèn)為在交互界面上與程序聊天對(duì)話是一種足夠支持全新的一批應(yīng)用存在的方式嗎?Sarah,你怎么看?

Sarah Guo:聊天界面作為應(yīng)用程序的交互方式已經(jīng)得到驗(yàn)證,比如AI女友應(yīng)用的成功案例。這表明聊天界面有作為新型應(yīng)用交互方式的潛力。聊天界面是否能演變成一個(gè)操作系統(tǒng)平臺(tái),還有待觀察。多模態(tài)界面更有可能,純聊天界面不太現(xiàn)實(shí)

聊天界面作為自然交互方式的優(yōu)勢(shì)在于人人都會(huì)用,并且現(xiàn)在的AI技術(shù)使計(jì)算機(jī)開始理解人的意圖了。這為打造某個(gè)消費(fèi)類或生產(chǎn)力工具類Killer App奠定了基矗從一個(gè)成功的旗艦應(yīng)用出發(fā),逐步衍生出一個(gè)應(yīng)用生態(tài),甚至操作系統(tǒng)平臺(tái)的可能性是存在的?刂朴布拖到y(tǒng)的一方也更有主導(dǎo)權(quán)。我對(duì)聊天界面成為主導(dǎo)交互模式保持開放態(tài)度,但它不會(huì)是唯一的交互方式。

Elad Gil:我認(rèn)為會(huì)有一系列交互界面,聊天界面、多模態(tài)界面等等。GPT-3作為一個(gè)有趣的API沒有得到足夠討論,你可以用它來處理圖片和OCR,然后以不同方式使用圖片。所以我認(rèn)為這對(duì)各種企業(yè)應(yīng)用、國(guó)防應(yīng)用、建筑、芯片設(shè)計(jì)都大有用處。極端情況下,未來幾年或者十年后,代理程序可能代表個(gè)人、企業(yè)進(jìn)行高度自動(dòng)化交互。我們自身參與的直接交互或?qū)p少。所以我認(rèn)為這些會(huì)不斷發(fā)展,關(guān)鍵在于基礎(chǔ)技術(shù)能力。

從根本上說,現(xiàn)在就有一些真實(shí)奏效、用戶喜歡的交互方式,人們通常喜歡對(duì)這些進(jìn)行修改、迭代,想出完全不同的范式。而事實(shí)上,人與人之間的對(duì)話交互通常都很順暢,沒有理由認(rèn)為人機(jī)交互就不會(huì)這樣。

如果你還記得20世紀(jì)90年代,人們剛剛推出首批個(gè)人數(shù)字助理和智能手機(jī)原型,一直想通過手寫識(shí)別。因?yàn)樗麄冋J(rèn)為人們會(huì)手寫一切。但現(xiàn)在我們只是鍵入一切。然而人們錯(cuò)誤地認(rèn)為大家不喜歡打字,必須手寫一切。于是他們?cè)O(shè)計(jì)了一種叫做Graffiti的語(yǔ)言,你必須用特定方式寫l、a、r等。因?yàn)楫?dāng)時(shí)機(jī)器沒有智能化到能夠識(shí)別手寫。在某種意義上這很愚蠢,在當(dāng)時(shí)被認(rèn)為是人機(jī)交互界面的重大突破,但現(xiàn)在它毫無用處。所以我認(rèn)為在這類事物上人們常常過度思考。打字和語(yǔ)音交互的效果就很好。

Sarah Guo:判斷一種交互方式是否可行,需要從“是否為用戶提供便利”和“技術(shù)上是否可實(shí)現(xiàn)”兩個(gè)維度考量。舉例來說,銷售代表更新CRM記錄是一件枯燥無味的事情。如果能自動(dòng)完成、減少操作步驟,用戶當(dāng)然會(huì)歡迎。

雖然聊天界面可能不是萬能解決方案,但它可以簡(jiǎn)化任務(wù),讓人們更愿意使用。例如,有人認(rèn)為聊天界面很愚蠢,但他們真正擔(dān)心的可能是沒有其他數(shù)據(jù)源支持,或者缺乏多模態(tài)交互。如果聊天界面可以理解用戶的意圖,預(yù)測(cè)他們的下一步行動(dòng),并且結(jié)合其他信息,例如日程安排、會(huì)議內(nèi)容等,那么它就變得更加實(shí)用。

多模態(tài)AI助手可以創(chuàng)造非常強(qiáng)大的體驗(yàn)。例如,在預(yù)訂旅行時(shí),我可以通過與助手交談來選擇目的地,但我也可能想要查看預(yù)訂內(nèi)容,或者瀏覽附近景點(diǎn)的信息。所以多模態(tài)交互非常重要。

08 硬件 x AI

Michael Mignano:說到界面,最近我們看到很多硬件產(chǎn)品與AI結(jié)合。你們?nèi)绾慰创@種趨勢(shì)?你們認(rèn)為AI會(huì)催生新的硬件產(chǎn)品嗎?或者現(xiàn)有硬件也能通過AI實(shí)現(xiàn)新的體驗(yàn)?你們?nèi)绾慰创鼳I和硬件的未來結(jié)合?

Elad Gil:我在這領(lǐng)域投資已經(jīng)很久了。舉例來說,Samsara是一家非上市的農(nóng)業(yè)管理公司,他們?cè)谕侠瓩C(jī)等車輛上安裝硬件,為車隊(duì)提供服務(wù)。我還從Anduril公司的早期就參與了投資,這家公司專注于國(guó)防硬件與 AI、機(jī)器視覺和機(jī)器學(xué)習(xí)的結(jié)合。Square在剛開始的時(shí)候也主要是一個(gè)硬件設(shè)備。我投資他們的時(shí)候,他們還生產(chǎn)連接手機(jī)的小型讀卡器,用于刷信用卡。

所以,在某些情況下,硬件與AI的結(jié)合的確是一種強(qiáng)有力的能力提升方式,尤其是在與物理世界交互時(shí),像Samsara和Anduril做的那樣。但在沒有硬件支持的情況下,我認(rèn)為很多消費(fèi)級(jí)應(yīng)用最終會(huì)融入現(xiàn)有的平臺(tái)。當(dāng)然,也存在一些例外,比如睡眠監(jiān)測(cè)設(shè)備,它不完全依賴于手機(jī)的功能。

不過,我認(rèn)為需要全新的功能,而不是僅僅做得更好。因此,短期內(nèi),我認(rèn)為這些都是非?岬膶(shí)驗(yàn),我很期待它們的發(fā)展,但很多早期的迭代實(shí)際上最終會(huì)在設(shè)備本身上進(jìn)行。獨(dú)立設(shè)備的功能可能會(huì)受到限制,除非它們像Anduril、Samsara、Square或其他一些公司那樣,服務(wù)于非常特定的物理功能需求。我覺得這樣才是有意義的。

不知道你還記得嗎,曾經(jīng)有個(gè)說法,會(huì)涌現(xiàn)出許多圍繞AirPods建立的企業(yè),甚至?xí)霈F(xiàn)專門的“AirPods 公司”。但事實(shí)證明,這很難做到。問題在于,真正的功能增益是什么?你能從中創(chuàng)造什么價(jià)值?我個(gè)人覺得,有些事情有時(shí)是媒體炒作,最終并沒有太大成果。就好像當(dāng)年Instagram剛出現(xiàn)時(shí),也有好幾家不同的照片上傳應(yīng)用公司,但只有Instagram真正做到了極致。所以,我不禁懷疑,其中一部分會(huì)不會(huì)只是炒作浪潮,雖然可能為未來埋下一些有趣的種子,但最終不會(huì)真正轉(zhuǎn)化為有價(jià)值的產(chǎn)品。

Michael Mignano:Sarah,如果你也同意這個(gè)觀點(diǎn),那么我們接下來可以討論一下,AI如何在現(xiàn)有硬件平臺(tái)上創(chuàng)造全新的用戶體驗(yàn)。以Uber為例,如果沒有 GPS,它就不可能存在,即使當(dāng)時(shí)的手機(jī)上有各種應(yīng)用。同樣,Instagram也是相機(jī)技術(shù)發(fā)展的結(jié)果,才得以誕生。那么,隨著AI的發(fā)展,我們是否會(huì)在現(xiàn)有平臺(tái)上看到全新的應(yīng)用類型,這些應(yīng)用只有借助AI的力量才能實(shí)現(xiàn)?這些應(yīng)用又會(huì)是什么樣的呢?

Sarah Guo:我認(rèn)為這些新應(yīng)用的出現(xiàn)既是必然的,也難以準(zhǔn)確預(yù)測(cè)具體形式。就像CRM的例子一樣,人們因?yàn)榭吹竭^不成熟的版本而對(duì)技術(shù)失去信心,導(dǎo)致很難想象未來會(huì)是什么樣子。比如跨應(yīng)用操作,如今的相關(guān)指令并不完善。

從用戶的角度來看,另一個(gè)問題是,新硬件是否應(yīng)該為用戶服務(wù),還是僅僅為了訓(xùn)練模型而收集設(shè)備數(shù)據(jù)?如果想要?jiǎng)?chuàng)造新的體驗(yàn),是否真的需要新硬件?當(dāng)然,如果提供給用戶新的硬件功能,并擁有現(xiàn)成的用戶基礎(chǔ),那么肯定會(huì)催生新的應(yīng)用。但這也是個(gè)先有雞還是先有蛋的問題,關(guān)鍵在于找到Killer App。

您提到的一些例子,例如電池管理、傳感器、權(quán)限管理以及上下文智能,可以幫助實(shí)現(xiàn)更好的體驗(yàn),這的確是支持新硬件的一個(gè)重要論據(jù)。眼鏡、聽覺設(shè)備等可能成為未來的新形態(tài),關(guān)鍵在于如何以新的或現(xiàn)有的形式獲取數(shù)據(jù)和信息。但是,現(xiàn)有的生態(tài)系統(tǒng)能否支持這些新的應(yīng)用和硬件也是一個(gè)難題?偠灾@是一個(gè)非常復(fù)雜的問題。

Elad Gil:我想再分享兩個(gè)例子,我認(rèn)為它們非常值得關(guān)注。第一個(gè)是機(jī)器人領(lǐng)域。最近幾周,關(guān)于機(jī)器人研究的論文層出不窮,其中一些將機(jī)器人技術(shù)與標(biāo)準(zhǔn)深度學(xué)習(xí)方法結(jié)合,令人興奮。我認(rèn)為,將更多標(biāo)準(zhǔn)深度學(xué)習(xí)技術(shù)應(yīng)用于機(jī)器人領(lǐng)域,將大大提升其能力。第二個(gè)領(lǐng)域是自動(dòng)駕駛。它同樣融合了機(jī)器人、硬件等多方面技術(shù)。我相信,隨著我們將基礎(chǔ)模型應(yīng)用于這些物理世界領(lǐng)域,并開發(fā)專門的硬件,這些領(lǐng)域?qū)⑷〉蔑@著發(fā)展。不過,消費(fèi)類硬件設(shè)備當(dāng)下還并不具備發(fā)展之勢(shì)。

09 Web3會(huì)是驗(yàn)證真實(shí)性的途徑嗎?

Michael Mignano:最近,許多公司和個(gè)人都在討論Web3的Killer App之一可能與AI和內(nèi)容真實(shí)性密切相關(guān)。例如,投資人Fred Wilson和Scott Banister都曾提及過這個(gè)觀點(diǎn)。隨著像Pika、Midjourney等公司不斷推出生成各種媒體形式的模型,這些模型全部基于其他原始媒體進(jìn)行訓(xùn)練。未來,我們需要一種方法來追蹤這些內(nèi)容的真實(shí)性和來源,以建立一個(gè)公平的權(quán)利結(jié)構(gòu)。Web3可能成為實(shí)現(xiàn)這一目標(biāo)的途徑。那么,您二位如何看待這一點(diǎn)?你們認(rèn)為Web3和AI有哪些潛在機(jī)遇?

Sarah Guo:從可用性角度來看,要讓那些擁有IP的創(chuàng)作者和企業(yè)利用Crypto技術(shù)去進(jìn)行內(nèi)容溯源距離實(shí)際應(yīng)用還有一定的距離,但從技術(shù)可行性上來看,這似乎是一個(gè)可實(shí)現(xiàn)的解決方案。

Elad Gil:我一直認(rèn)為,區(qū)塊鏈將成為一種身份認(rèn)證形式,不僅可以用于內(nèi)容溯源,還可以用于驗(yàn)證代理的身份和資格。如果一個(gè)代理聲稱代表你,你怎么知道它確實(shí)代表了一個(gè)特定的個(gè)體?它能否以安全的方式部分展示該個(gè)體的數(shù)據(jù)或某些方面的信息?這可能是你的醫(yī)療數(shù)據(jù),可能是關(guān)于你是誰的某些方面。這是一個(gè)我長(zhǎng)期以來一直感興趣的領(lǐng)域。我曾在播客中采訪過Illia Polosukhin,他是Transformer論文的最后一名作者。我還在加拿大與他進(jìn)行了一次閑聊。我認(rèn)為這些概念真的很有意思,但它們的發(fā)展可能需要一段時(shí)間。

從內(nèi)容溯源角度來說,我認(rèn)為情況會(huì)略復(fù)雜一些。比如,假設(shè)你的數(shù)據(jù)集中已經(jīng)包含了大量類似梵高風(fēng)格的衍生藝術(shù)作品。即便你從數(shù)據(jù)集中移除所有原始的梵高作品,由于數(shù)據(jù)集中仍保留了足夠多“梵高風(fēng)格”的訊號(hào),模型訓(xùn)練的結(jié)果依舊不會(huì)受很大影響。

而且,這些衍生作品從版權(quán)或使用許可的角度來說也不構(gòu)成任何侵權(quán)。我認(rèn)為在討論內(nèi)容來源和證明方面,人們沒有充分考慮這些情況。事實(shí)上,你可以移除所有知名藝術(shù)家的原創(chuàng)作品,但這對(duì)模型的訓(xùn)練影響不大,因?yàn)檫@種風(fēng)格的作品已經(jīng)“內(nèi)化”到數(shù)據(jù)集中。在圖像生成方面,我認(rèn)為它比人們想象的要復(fù)雜得多,在某種程度上也更難去保護(hù)某些藝術(shù)家,因?yàn)樗麄冿L(fēng)格的衍生創(chuàng)作已經(jīng)廣泛存在

10 AI監(jiān)管將走向何方?

Michael Mignano:美國(guó)國(guó)會(huì)已經(jīng)開始討論AI訓(xùn)練的合法性問題。雖然我們都不是該領(lǐng)域的專家,但我們可以談?wù)勎覀儗?duì)這個(gè)問題的看法。從理論上講,我認(rèn)為AI訓(xùn)練是合理的,因?yàn)樗菣C(jī)器學(xué)習(xí)的一種方式。我們?nèi)祟愐彩峭ㄟ^閱讀、學(xué)習(xí)和模仿來進(jìn)行創(chuàng)作的,為什么機(jī)器不能這樣做呢?您二位認(rèn)為AI訓(xùn)練的合法性將會(huì)如何演變?

Sarah Guo:這是一個(gè)政治性問題,所以它取決于哪一派是當(dāng)權(quán)者。但是,我認(rèn)為只要對(duì)模型的輸出設(shè)置一系列的保障措施,那么AI訓(xùn)練是合理使用的觀點(diǎn)就站得住腳。

我認(rèn)為人們會(huì)在應(yīng)用層面和經(jīng)過驗(yàn)證的輸出能力層面上去參與這些斗爭(zhēng)。這是正確的著手點(diǎn)。正如Elad所說,基于區(qū)塊鏈的技術(shù)的另一個(gè)核心用例是低成本地實(shí)現(xiàn)微交易。這方面仍有工作要做。Ilia說的一件事仍然讓我記憶深刻,那就是模型訓(xùn)練繼續(xù)進(jìn)步的障礙之一是收集我們還沒有的數(shù)據(jù),并讓人們貢獻(xiàn)這些數(shù)據(jù)。對(duì)此,有抵御濫用的數(shù)據(jù)貢獻(xiàn)、標(biāo)記和交易系統(tǒng)將非常有價(jià)值,這聽起來像是一個(gè)身份和信譽(yù)系統(tǒng)。如果能解決這個(gè)問題,我認(rèn)為它會(huì)非常有價(jià)值。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港