當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動態(tài) > 生成式AI進(jìn)入第二階段了

生成式AI進(jìn)入第二階段了
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-09-21 18:51:47 瀏覽：7397次

導(dǎo)讀：去年的今日，紅杉美國官網(wǎng)發(fā)表了一篇題為《Generative AI: A Creative New World》的文章，我個(gè)人認(rèn)為當(dāng)時(shí)的那篇文章代表著新一輪Paradigm shift（范式轉(zhuǎn)移）的開始，拉開了AIGC時(shí)代的序幕。原文作者是紅杉的兩位合伙人：Sonya Huang和Pat Grady，當(dāng)時(shí)我也在...

去年的今日，紅杉美國官網(wǎng)發(fā)表了一篇題為《Generative AI: A Creative New World》的文章，我個(gè)人認(rèn)為當(dāng)時(shí)的那篇文章代表著新一輪Paradigm shift（范式轉(zhuǎn)移）的開始，拉開了AIGC時(shí)代的序幕。原文作者是紅杉的兩位合伙人：Sonya Huang和Pat Grady，當(dāng)時(shí)我也在第一時(shí)間翻譯了那篇文章，并且在國內(nèi)廣為流傳。那篇文章也可以說是開啟了我自己的AIGC的創(chuàng)業(yè)之路，無論是深思圈自媒體還是自己的創(chuàng)業(yè)項(xiàng)目，都因此發(fā)生了巨大的變化。

時(shí)間過得很快，轉(zhuǎn)眼間一年時(shí)間就過去了。紅杉美國的兩位投資人作者又帶來最新的一周年新文章《Generative AI’s Act Two》，讓我們一同來回顧一下過去一年里AIGC發(fā)生了哪些巨大變化，以及接下來的第二階段，又會有哪些新的東西出現(xiàn)呢？

一年前，我們發(fā)布了一個(gè)假設(shè)，即生成式AI將成為技術(shù)中的一個(gè)深遠(yuǎn)的平臺轉(zhuǎn)變，然后，風(fēng)暴來臨。

科學(xué)家、歷史學(xué)家和經(jīng)濟(jì)學(xué)家長久以來都在研究創(chuàng)新的寒武紀(jì)大爆發(fā)的最佳條件。在生成式AI中，我們已經(jīng)達(dá)到了一個(gè)現(xiàn)代的奇跡，我們這一代的太空競賽。

這一時(shí)刻已經(jīng)醞釀了幾十年，摩爾定律的六十年為我們提供了處理浮點(diǎn)數(shù)據(jù)的計(jì)算能力，四十年的互聯(lián)網(wǎng)為我們提供了數(shù)萬億代幣的訓(xùn)練數(shù)據(jù)，移動和云計(jì)算的二十年讓每個(gè)人的手掌中都有一臺超級計(jì)算機(jī)。換句話說，數(shù)十年的技術(shù)進(jìn)步為生成式AI的起飛創(chuàng)造了必要的條件。

ChatGPT的崛起成為點(diǎn)燃導(dǎo)火線的火花，釋放出我們多年未見的創(chuàng)新密度和熱情可能自互聯(lián)網(wǎng)初期以來。在“腦力谷”中，人們尤其是激動，AI研究者達(dá)到了搖滾明星的地位，每個(gè)周末黑客馬拉松的房子都擠滿了新的自主代理（Agent）和陪伴聊天機(jī)器人。AI研究者從車庫里的“黑客”變成了指揮數(shù)十億美元計(jì)算的特種部隊(duì)。arXiv的論文如此多產(chǎn)，以至于研究者們開玩笑要求暫停新的出版物，以便他們能趕上。

但很快，AI的興奮變成了近乎歇斯底里。突然，每家公司都成了“AI副駕駛（Copilot）”。我們的收件箱被“AI Salesforce”、“AI Adobe”和“AI Instagram”的無差別的宣傳充滿。1億美元的種子輪又回來了。我們發(fā)現(xiàn)自己處于一個(gè)不可持續(xù)的融資、人才戰(zhàn)和GPU采購的瘋狂。

果然，裂痕開始顯現(xiàn)。藝術(shù)家、作家和歌手挑戰(zhàn)機(jī)器生成的IP的合法性，關(guān)于倫理、監(jiān)管和即將到來的超級智能的辯論充斥了華盛頓。更令人擔(dān)憂的是，硅谷開始有傳言稱生成式AI實(shí)際上并不有用。產(chǎn)品遠(yuǎn)遠(yuǎn)低于預(yù)期，這可以通過糟糕的用戶留存率來證明。對許多應(yīng)用的最終用戶需求開始達(dá)到高潮，這只是另一個(gè)蒸汽泡沫周期嗎？

對AI的不滿之夏使批評者歡欣鼓舞地跳舞，讓人想起互聯(lián)網(wǎng)的初期，那時(shí)在1998年，一位著名的經(jīng)濟(jì)學(xué)家宣稱：“到2005年，將變得清晰，互聯(lián)網(wǎng)對經(jīng)濟(jì)的影響不會超過傳真機(jī)。”

毫無疑問盡管有噪音、歇斯底里和不確定性及不滿的氛圍，生成式AI的起步已經(jīng)比SaaS更加成功，僅從初創(chuàng)公司就獲得了超過10億美元的收入（SaaS市場需要幾年，而不是幾個(gè)月，才達(dá)到同樣的規(guī)模）。一些應(yīng)用已經(jīng)成為家喻戶曉的名字：ChatGPT成為增長最快的應(yīng)用，尤其在學(xué)生和開發(fā)者中有很強(qiáng)的產(chǎn)品市場契合度；Midjourney成為我們的集體創(chuàng)意繆斯，據(jù)報(bào)道僅用11個(gè)團(tuán)隊(duì)就達(dá)到了數(shù)億美元的收入；Character推廣了AI娛樂和伴侶，并創(chuàng)造了我們最渴望的消費(fèi)者“社交”應(yīng)用用戶平均在應(yīng)用中花費(fèi)兩個(gè)小時(shí)。

盡管如此，這些成功的早期跡象并沒有改變一個(gè)事實(shí)，那就是許多AI公司根本沒有產(chǎn)品市場契合度（PMF）或可持續(xù)的競爭優(yōu)勢，而整個(gè)AI生態(tài)系統(tǒng)的繁榮是不可持續(xù)的。

現(xiàn)在塵埃已經(jīng)稍微落定，我們認(rèn)為現(xiàn)在是一個(gè)適當(dāng)?shù)臅r(shí)候來放大和反思生成式AI我們現(xiàn)在所處的位置，以及我們可能的走向。

一、面向第二階段

生成式AI的首年“第一幕”是從技術(shù)出發(fā)的。我們發(fā)現(xiàn)了一個(gè)新的“錘子”基礎(chǔ)模型，并引發(fā)了一波輕量級的新技術(shù)演示應(yīng)用。

我們現(xiàn)在認(rèn)為市場正在進(jìn)入“第二幕”這將是從客戶開始的。第二幕將端到端地解決人類問題。這些應(yīng)用與首批推出的應(yīng)用在本質(zhì)上有所不同。它們往往將基礎(chǔ)模型作為更全面解決方案的一部分，而不是整個(gè)解決方案。它們引入了新的編輯界面，使工作流程更加粘性，輸出效果更好。它們往往是多模態(tài)的。

市場已經(jīng)開始從“第一幕”轉(zhuǎn)向“第二幕”。進(jìn)入“第二幕”的公司的例子包括Harvey，該公司為頂級律師事務(wù)所定制LLM；Glean，該公司正在爬行和索引我們的工作空間，使生成式AI在工作中更加相關(guān)；以及Character和Ava，它們正在創(chuàng)建數(shù)字伴侶。

二、市場格局

我們更新的生成式AI市場圖如下：

與去年的地圖不同，我們選擇按照使用案例而不是模型模態(tài)來組織這張地圖。這反映了市場上兩個(gè)重要的推動力：生成式AI從技術(shù)錘子到實(shí)際使用案例和價(jià)值的演變，以及生成式AI應(yīng)用日益多模態(tài)的特性。

此外，我們還加入了一個(gè)新的LLM開發(fā)者棧，反映了公司在生產(chǎn)中構(gòu)建生成型AI應(yīng)用時(shí)轉(zhuǎn)向的計(jì)算和工具供應(yīng)商。

三、重新審視我們的觀點(diǎn)

我們?nèi)ツ甑奈恼绿岢隽艘粋€(gè)關(guān)于生成式AI市場機(jī)會的論題，以及對市場如何發(fā)展的假設(shè)。如今一年過去了，來看看我們預(yù)測的怎么樣呢？

以下是我們預(yù)測錯(cuò)的：

事情發(fā)展得很快。去年，我們預(yù)計(jì)還需要近十年的時(shí)間擁有實(shí)習(xí)生級別的代碼生成、好萊塢質(zhì)量的視頻或不發(fā)機(jī)械聲的人類質(zhì)量語音。但聽一聽Eleven Labs在TikTok上的聲音或Runway的AI電影節(jié)就明白，未來已經(jīng)以光速到來。甚至3D模型、游戲和音樂都快速變得優(yōu)秀。瓶頸在供應(yīng)端。我們沒有預(yù)料到最終用戶的需求會超過GPU的供應(yīng)。許多公司增長的瓶頸很快就不是客戶需求，而是獲取Nvidia的最新GPU。長時(shí)間的等待成為常態(tài)，出現(xiàn)了一個(gè)簡單的商業(yè)模型：支付訂閱費(fèi)跳過等待隊(duì)列并獲得更好的模型。垂直分離尚未發(fā)生。我們仍然相信“應(yīng)用層”公司和基礎(chǔ)模型提供商之間會有分離，模型公司專注于規(guī)模和研究，應(yīng)用層公司專注于產(chǎn)品和UI。實(shí)際上，這種分離還沒有干凈利落地發(fā)生。事實(shí)上，最初面向用戶的應(yīng)用中最成功的是垂直整合的。競爭環(huán)境殘酷，現(xiàn)有競爭者的反應(yīng)迅速。去年，競爭格局中有幾個(gè)過于擁擠的類別（尤其是圖像生成和文案寫作），但總體上市場還是一個(gè)空白區(qū)域。如今，競爭格局的許多角落比機(jī)會還要競爭激烈。從Google的Duet和Bard到Adobe的Firefly，現(xiàn)有競爭者迅速的反應(yīng)以及他們最終愿意承擔(dān)“風(fēng)險(xiǎn)”的意愿加劇了競爭的熱度。即使在基礎(chǔ)模型層，我們也看到客戶在不同供應(yīng)商之間建立自己的基礎(chǔ)設(shè)施。壁壘在客戶中，而不是在數(shù)據(jù)中。我們預(yù)測，最好的生成式AI公司可以通過數(shù)據(jù)飛輪生成可持續(xù)的競爭優(yōu)勢：更多使用→更多數(shù)據(jù)→更好的模型→更多使用。盡管這在某種程度上仍然是對的，特別是在擁有非常專業(yè)和難以獲得的數(shù)據(jù)的領(lǐng)域，但“數(shù)據(jù)壕溝”正處于不穩(wěn)定的地面：應(yīng)用公司生成的數(shù)據(jù)并沒有創(chuàng)造一個(gè)無法逾越的壕溝，下一代基礎(chǔ)模型很可能會摧毀初創(chuàng)公司生成的任何數(shù)據(jù)壕溝。相反，工作流和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢來源。

以下是我們預(yù)測對的：

生成式AI是一種事物。突然之間，每個(gè)開發(fā)者都在研究生成式AI應(yīng)用，每個(gè)企業(yè)買家都在要求它。市場甚至保留了“生成式AI”的名稱。人才涌入市場，風(fēng)險(xiǎn)資本也涌入。生成式AI甚至成為了流行文化現(xiàn)象，如“哈利波特巴倫西亞加”這樣的病毒視頻，或者由Ghostwriter創(chuàng)作的模仿德雷克的歌曲“Heart on My Sleeve”，這首歌已經(jīng)成為了排行榜上的熱門歌曲。第一個(gè)殺手級應(yīng)用已經(jīng)出現(xiàn)。眾所周知，ChatGPT是最快達(dá)到1億MAU的應(yīng)用程序并且在短短6周內(nèi)自然而然地做到了這一點(diǎn)。相比之下，Instagram花了2.5年，WhatsApp花了3.5年，YouTube和Facebook花了4年才達(dá)到那種用戶需求水平。但ChatGPT并不是一個(gè)孤立的現(xiàn)象。Character AI的參與深度（平均每次會話2小時(shí)）、Github Copilot的生產(chǎn)力益處（效率提高55%）以及Midjourney的商業(yè)化路徑（數(shù)億美元的收入）都表明，第一批殺手級應(yīng)用已經(jīng)到來。開發(fā)者是關(guān)鍵。像Stripe或Unity這樣以開發(fā)者為中心的公司的核心洞察是，開發(fā)者創(chuàng)造了你甚至無法想象的使用案例。在過去的幾個(gè)季度里，我們接到了從音樂生成社區(qū)到AI紅娘到AI客戶支持代理的各種想法。形態(tài)正在發(fā)展。AI應(yīng)用的第一版大多是自動完成和初稿，但這些形態(tài)現(xiàn)在正在變得越來越復(fù)雜。Midjourney引入的攝像機(jī)平移和填充是生成式AI優(yōu)先用戶體驗(yàn)變得更豐富的一個(gè)很好的例子�？偟膩碚f，形態(tài)正在從個(gè)體到系統(tǒng)級的生產(chǎn)力，從人在循環(huán)中到執(zhí)行導(dǎo)向的代理系統(tǒng)發(fā)展。版權(quán)、倫理和存在的恐懼。這些熱點(diǎn)話題的辯論如火如荼，藝術(shù)家、作家和音樂家意見不一，有些創(chuàng)作者正當(dāng)?shù)貞嵟谄渌藦难苌髌分蝎@利，有些創(chuàng)作者則接受了新的AI現(xiàn)實(shí)（Grimes的利潤分享提議和James Buckhouse對成為創(chuàng)意基因組的一部分的樂觀態(tài)度浮現(xiàn)在腦海中）。沒有初創(chuàng)公司想成為最終的Spotify的Napster或Limewire（感謝Jason Boehmig）。規(guī)則是模糊的：日本已經(jīng)宣布用于培訓(xùn)AI的內(nèi)容沒有IP權(quán)利，而歐洲已經(jīng)提議下重手進(jìn)行監(jiān)管。

四、我們現(xiàn)在所處的位置？生成式AI的價(jià)值問題

生成式AI并不缺乏使用案例或客戶需求。用戶渴望AI能使他們的工作變得更容易，他們的工作產(chǎn)品變得更好，這就是為什么他們會成群結(jié)隊(duì)地 flock 到應(yīng)用程序中（盡管缺乏自然分布）。

但人們會繼續(xù)使用嗎？并不真的。下面的圖表比較了AI優(yōu)先應(yīng)用與現(xiàn)有公司的第一個(gè)月移動應(yīng)用保留率。

用戶參與度也不佳。一些最好的消費(fèi)公司有60-65%的DAU/MAU；WhatsApp的為85%。相比之下，生成式AI應(yīng)用的中位數(shù)為14%（Character和“AI陪伴”類別是顯著的例外）。這意味著用戶還沒有在生成式AI產(chǎn)品中找到足夠的價(jià)值，以至于每天都在使用它們。

簡而言之，生成式AI最大的問題不是尋找使用案例、需求或分發(fā)，而是證明價(jià)值。正如我們的同事David Cahn所寫：“2000億美元的問題是：你打算使用所有這些基礎(chǔ)設(shè)施來做什么？它如何改變?nèi)藗兊纳睿?rdquo;建立持久的業(yè)務(wù)的路徑將需要解決保留問題，并為客戶生成足夠深入的價(jià)值，使他們堅(jiān)持并成為每日活躍用戶。

但我們不應(yīng)該絕望。生成式AI仍處于其“尷尬的青春期”。有時(shí)會有卓越的跡象，當(dāng)產(chǎn)品沒有達(dá)到預(yù)期時(shí)，失敗通常是可靠的、可重復(fù)的且可修復(fù)的。我們的工作擺在面前。

五、第二階段分析

創(chuàng)始人正在進(jìn)行prompt工程、微調(diào)和數(shù)據(jù)集策劃的艱苦工作，以使他們的AI產(chǎn)品優(yōu)秀起來。他們正在逐步地建設(shè)，將引人注目的Demo演示變成完整的產(chǎn)品體驗(yàn)。與此同時(shí)，基礎(chǔ)模型底層繼續(xù)充滿研究和創(chuàng)新。

隨著公司找到持久價(jià)值的路徑，正在發(fā)展一個(gè)共享的劇本。我們現(xiàn)在有了共享的技術(shù)來使模型變得有用，以及將塑造生成式AI第二幕的新興UI范式。

1. 模型開發(fā)棧

新興的推理技術(shù)，如連鎖思考、樹狀思考和反射，正在提高模型執(zhí)行更豐富、更復(fù)雜的推理任務(wù)的能力，從而縮小了客戶期望與模型能力之間的差距。開發(fā)者使用像Langchain這樣的框架來調(diào)用和調(diào)試更復(fù)雜的多鏈序列。遷移學(xué)習(xí)技術(shù)，如RLHF和微調(diào)，正變得更加可用，特別是隨著GPT-3.5和Llama-2的微調(diào)的最近可用性，這意味著公司可以將基礎(chǔ)模型適應(yīng)其特定領(lǐng)域，并從用戶反饋中改進(jìn)。開發(fā)者從Hugging Face下載開源模型，并微調(diào)它們以實(shí)現(xiàn)優(yōu)質(zhì)的性能。檢索增強(qiáng)生成（RAG）正在引入關(guān)于業(yè)務(wù)或用戶的上下文，減少幻覺并增加真實(shí)性和實(shí)用性。像Pinecone這樣的公司的向量數(shù)據(jù)庫已成為RAG的基礎(chǔ)設(shè)施支柱。新的開發(fā)者工具和應(yīng)用框架為公司提供了可重用的構(gòu)建塊，以創(chuàng)建更先進(jìn)的AI應(yīng)用，并幫助開發(fā)者評估、改進(jìn)和監(jiān)控生產(chǎn)中的AI模型的性能，包括像Langsmith和Weights & Biases這樣的LLMOps工具。像Coreweave、Lambda Labs、Foundry、Replicate和Modal這樣的AI-first基礎(chǔ)設(shè)施公司正在解除公共云的捆綁，并提供AI公司最需要的東西：大量的GPU以合理的成本、按需可用和高度可擴(kuò)展，以及一個(gè)不錯(cuò)的PaaS開發(fā)者體驗(yàn)。

這些技術(shù)應(yīng)該能夠在基礎(chǔ)模型同時(shí)改進(jìn)的情況下，縮小期望與現(xiàn)實(shí)之間的差距。但使模型變得出色只是成功了一半，生成式AI優(yōu)先的用戶體驗(yàn)也在進(jìn)化：

2. 新興產(chǎn)品藍(lán)圖

生成式界面：基于文本的對話用戶體驗(yàn)是LLM的默認(rèn)界面。漸漸地，新的形態(tài)進(jìn)入了武器庫，從Perplexity的生成用戶界面到Inflection AI的語音發(fā)聲等新的模態(tài)。新的編輯體驗(yàn)：從Copilot到導(dǎo)演模式（Director‘s Mode）。隨著我們從Zero-shot到ask-and-adjust（感謝Zach Lloyd），生成式AI公司正在發(fā)明一套新的旋鈕和開關(guān)，它們看起來與傳統(tǒng)的編輯工作流程非常不同。Midjourney的新的平移命令和Runway的導(dǎo)演模式創(chuàng)造了新的相機(jī)般的編輯體驗(yàn)。Eleven Labs使得通過提示（Prompt）操作聲音成為可能。越來越復(fù)雜的代理系統(tǒng)。生成式AI應(yīng)用越來越不僅僅是需要人來審查的自動完成或初稿；它們現(xiàn)在有自主權(quán)來解決問題、訪問外部工具并代表我們端到端地解決問題。我們正穩(wěn)步從0級進(jìn)展到5級自主性。系統(tǒng)范圍內(nèi)的優(yōu)化。有些公司并不是嵌入單個(gè)人用戶的工作流程并使該個(gè)體更有效，而是直接解決系統(tǒng)范圍內(nèi)的優(yōu)化問題。你能否選擇一部分支持票據(jù)或拉取請求并自主地解決它們，從而使整個(gè)系統(tǒng)更加有效？

參考材料

[1]https://www.sequoiacap.com/article/generative-ai-act-two/

結(jié)尾的思考

當(dāng)我們接近前沿悖論，當(dāng)Transformers和擴(kuò)散模型的新奇性逐漸消失時(shí)，生成式AI市場的性質(zhì)正在發(fā)生變化。炒作和快速展示正在為真正的價(jià)值和完整的產(chǎn)品體驗(yàn)所取代。

在紅杉美國，我們?nèi)匀粓?jiān)定地相信生成式AI。這個(gè)市場起飛所需的條件在幾十年的時(shí)間里已經(jīng)累積起來，市場終于到來了。殺手級應(yīng)用的出現(xiàn)和終端用戶需求的巨大規(guī)模加深了我們對市場的信心。

然而，Amara的法則我們傾向于在短期內(nèi)高估一項(xiàng)技術(shù)的效果，在長期內(nèi)低估其效果的現(xiàn)象正在發(fā)揮作用。我們在投資決策中運(yùn)用耐心和判斷，密切關(guān)注創(chuàng)始人是如何解決價(jià)值問題的。公司使用的共享劇本來推動模型性能和產(chǎn)品體驗(yàn)的界限，使我們對生成式AI的第二階段感到樂觀。