展會信息港展會大全

生成式AI進(jìn)入第二階段了
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-21 18:51:47   瀏覽:7397次  

導(dǎo)讀:去年的今日,紅杉美國官網(wǎng)發(fā)表了一篇題為《Generative AI: A Creative New World》的文章,我個(gè)人認(rèn)為當(dāng)時(shí)的那篇文章代表著新一輪Paradigm shift(范式轉(zhuǎn)移)的開始,拉開了AIGC時(shí)代的序幕。原文作者是紅杉的兩位合伙人:Sonya Huang和Pat Grady,當(dāng)時(shí)我也在...

去年的今日,紅杉美國官網(wǎng)發(fā)表了一篇題為《Generative AI: A Creative New World》的文章,我個(gè)人認(rèn)為當(dāng)時(shí)的那篇文章代表著新一輪Paradigm shift(范式轉(zhuǎn)移)的開始,拉開了AIGC時(shí)代的序幕。原文作者是紅杉的兩位合伙人:Sonya Huang和Pat Grady,當(dāng)時(shí)我也在第一時(shí)間翻譯了那篇文章,并且在國內(nèi)廣為流傳。那篇文章也可以說是開啟了我自己的AIGC的創(chuàng)業(yè)之路,無論是深思圈自媒體還是自己的創(chuàng)業(yè)項(xiàng)目,都因此發(fā)生了巨大的變化。

時(shí)間過得很快,轉(zhuǎn)眼間一年時(shí)間就過去了。紅杉美國的兩位投資人作者又帶來最新的一周年新文章《Generative AI’s Act Two》,讓我們一同來回顧一下過去一年里AIGC發(fā)生了哪些巨大變化,以及接下來的第二階段,又會有哪些新的東西出現(xiàn)呢?

一年前,我們發(fā)布了一個(gè)假設(shè),即生成式AI將成為技術(shù)中的一個(gè)深遠(yuǎn)的平臺轉(zhuǎn)變,然后,風(fēng)暴來臨。

科學(xué)家、歷史學(xué)家和經(jīng)濟(jì)學(xué)家長久以來都在研究創(chuàng)新的寒武紀(jì)大爆發(fā)的最佳條件。在生成式AI中,我們已經(jīng)達(dá)到了一個(gè)現(xiàn)代的奇跡,我們這一代的太空競賽。

這一時(shí)刻已經(jīng)醞釀了幾十年,摩爾定律的六十年為我們提供了處理浮點(diǎn)數(shù)據(jù)的計(jì)算能力,四十年的互聯(lián)網(wǎng)為我們提供了數(shù)萬億代幣的訓(xùn)練數(shù)據(jù),移動和云計(jì)算的二十年讓每個(gè)人的手掌中都有一臺超級計(jì)算機(jī)。換句話說,數(shù)十年的技術(shù)進(jìn)步為生成式AI的起飛創(chuàng)造了必要的條件。

ChatGPT的崛起成為點(diǎn)燃導(dǎo)火線的火花,釋放出我們多年未見的創(chuàng)新密度和熱情可能自互聯(lián)網(wǎng)初期以來。在“腦力谷”中,人們尤其是激動,AI研究者達(dá)到了搖滾明星的地位,每個(gè)周末黑客馬拉松的房子都擠滿了新的自主代理(Agent)和陪伴聊天機(jī)器人。AI研究者從車庫里的“黑客”變成了指揮數(shù)十億美元計(jì)算的特種部隊(duì)。arXiv的論文如此多產(chǎn),以至于研究者們開玩笑要求暫停新的出版物,以便他們能趕上。

但很快,AI的興奮變成了近乎歇斯底里。突然,每家公司都成了“AI副駕駛(Copilot)”。我們的收件箱被“AI Salesforce”、“AI Adobe”和“AI Instagram”的無差別的宣傳充滿。1億美元的種子輪又回來了。我們發(fā)現(xiàn)自己處于一個(gè)不可持續(xù)的融資、人才戰(zhàn)和GPU采購的瘋狂。

果然,裂痕開始顯現(xiàn)。藝術(shù)家、作家和歌手挑戰(zhàn)機(jī)器生成的IP的合法性,關(guān)于倫理、監(jiān)管和即將到來的超級智能的辯論充斥了華盛頓。更令人擔(dān)憂的是,硅谷開始有傳言稱生成式AI實(shí)際上并不有用。產(chǎn)品遠(yuǎn)遠(yuǎn)低于預(yù)期,這可以通過糟糕的用戶留存率來證明。對許多應(yīng)用的最終用戶需求開始達(dá)到高潮,這只是另一個(gè)蒸汽泡沫周期嗎

對AI的不滿之夏使批評者歡欣鼓舞地跳舞,讓人想起互聯(lián)網(wǎng)的初期,那時(shí)在1998年,一位著名的經(jīng)濟(jì)學(xué)家宣稱:“到2005年,將變得清晰,互聯(lián)網(wǎng)對經(jīng)濟(jì)的影響不會超過傳真機(jī)。”

毫無疑問盡管有噪音、歇斯底里和不確定性及不滿的氛圍,生成式AI的起步已經(jīng)比SaaS更加成功,僅從初創(chuàng)公司就獲得了超過10億美元的收入(SaaS市場需要幾年,而不是幾個(gè)月,才達(dá)到同樣的規(guī)模)。一些應(yīng)用已經(jīng)成為家喻戶曉的名字:ChatGPT成為增長最快的應(yīng)用,尤其在學(xué)生和開發(fā)者中有很強(qiáng)的產(chǎn)品市場契合度;Midjourney成為我們的集體創(chuàng)意繆斯,據(jù)報(bào)道僅用11個(gè)團(tuán)隊(duì)就達(dá)到了數(shù)億美元的收入;Character推廣了AI娛樂和伴侶,并創(chuàng)造了我們最渴望的消費(fèi)者“社交”應(yīng)用用戶平均在應(yīng)用中花費(fèi)兩個(gè)小時(shí)。

盡管如此,這些成功的早期跡象并沒有改變一個(gè)事實(shí),那就是許多AI公司根本沒有產(chǎn)品市場契合度(PMF)或可持續(xù)的競爭優(yōu)勢,而整個(gè)AI生態(tài)系統(tǒng)的繁榮是不可持續(xù)的。

現(xiàn)在塵埃已經(jīng)稍微落定,我們認(rèn)為現(xiàn)在是一個(gè)適當(dāng)?shù)臅r(shí)候來放大和反思生成式AI我們現(xiàn)在所處的位置,以及我們可能的走向。

一、面向第二階段

生成式AI的首年“第一幕”是從技術(shù)出發(fā)的。我們發(fā)現(xiàn)了一個(gè)新的“錘子”基礎(chǔ)模型,并引發(fā)了一波輕量級的新技術(shù)演示應(yīng)用。

我們現(xiàn)在認(rèn)為市場正在進(jìn)入“第二幕”這將是從客戶開始的。第二幕將端到端地解決人類問題。這些應(yīng)用與首批推出的應(yīng)用在本質(zhì)上有所不同。它們往往將基礎(chǔ)模型作為更全面解決方案的一部分,而不是整個(gè)解決方案。它們引入了新的編輯界面,使工作流程更加粘性,輸出效果更好。它們往往是多模態(tài)的。

市場已經(jīng)開始從“第一幕”轉(zhuǎn)向“第二幕”。進(jìn)入“第二幕”的公司的例子包括Harvey,該公司為頂級律師事務(wù)所定制LLM;Glean,該公司正在爬行和索引我們的工作空間,使生成式AI在工作中更加相關(guān);以及Character和Ava,它們正在創(chuàng)建數(shù)字伴侶。

二、市場格局

我們更新的生成式AI市場圖如下:

與去年的地圖不同,我們選擇按照使用案例而不是模型模態(tài)來組織這張地圖。這反映了市場上兩個(gè)重要的推動力:生成式AI從技術(shù)錘子到實(shí)際使用案例和價(jià)值的演變,以及生成式AI應(yīng)用日益多模態(tài)的特性。

此外,我們還加入了一個(gè)新的LLM開發(fā)者棧,反映了公司在生產(chǎn)中構(gòu)建生成型AI應(yīng)用時(shí)轉(zhuǎn)向的計(jì)算和工具供應(yīng)商。

三、重新審視我們的觀點(diǎn)

我們?nèi)ツ甑奈恼绿岢隽艘粋(gè)關(guān)于生成式AI市場機(jī)會的論題,以及對市場如何發(fā)展的假設(shè)。如今一年過去了,來看看我們預(yù)測的怎么樣呢?

以下是我們預(yù)測錯(cuò)的:

事情發(fā)展得很快。去年,我們預(yù)計(jì)還需要近十年的時(shí)間擁有實(shí)習(xí)生級別的代碼生成、好萊塢質(zhì)量的視頻或不發(fā)機(jī)械聲的人類質(zhì)量語音。但聽一聽Eleven Labs在TikTok上的聲音或Runway的AI電影節(jié)就明白,未來已經(jīng)以光速到來。甚至3D模型、游戲和音樂都快速變得優(yōu)秀。瓶頸在供應(yīng)端。我們沒有預(yù)料到最終用戶的需求會超過GPU的供應(yīng)。許多公司增長的瓶頸很快就不是客戶需求,而是獲取Nvidia的最新GPU。長時(shí)間的等待成為常態(tài),出現(xiàn)了一個(gè)簡單的商業(yè)模型:支付訂閱費(fèi)跳過等待隊(duì)列并獲得更好的模型。垂直分離尚未發(fā)生。我們仍然相信“應(yīng)用層”公司和基礎(chǔ)模型提供商之間會有分離,模型公司專注于規(guī)模和研究,應(yīng)用層公司專注于產(chǎn)品和UI。實(shí)際上,這種分離還沒有干凈利落地發(fā)生。事實(shí)上,最初面向用戶的應(yīng)用中最成功的是垂直整合的。競爭環(huán)境殘酷,現(xiàn)有競爭者的反應(yīng)迅速。去年,競爭格局中有幾個(gè)過于擁擠的類別(尤其是圖像生成和文案寫作),但總體上市場還是一個(gè)空白區(qū)域。如今,競爭格局的許多角落比機(jī)會還要競爭激烈。從Google的Duet和Bard到Adobe的Firefly,現(xiàn)有競爭者迅速的反應(yīng)以及他們最終愿意承擔(dān)“風(fēng)險(xiǎn)”的意愿加劇了競爭的熱度。即使在基礎(chǔ)模型層,我們也看到客戶在不同供應(yīng)商之間建立自己的基礎(chǔ)設(shè)施。壁壘在客戶中,而不是在數(shù)據(jù)中。我們預(yù)測,最好的生成式AI公司可以通過數(shù)據(jù)飛輪生成可持續(xù)的競爭優(yōu)勢:更多使用→更多數(shù)據(jù)→更好的模型→更多使用。盡管這在某種程度上仍然是對的,特別是在擁有非常專業(yè)和難以獲得的數(shù)據(jù)的領(lǐng)域,但“數(shù)據(jù)壕溝”正處于不穩(wěn)定的地面:應(yīng)用公司生成的數(shù)據(jù)并沒有創(chuàng)造一個(gè)無法逾越的壕溝,下一代基礎(chǔ)模型很可能會摧毀初創(chuàng)公司生成的任何數(shù)據(jù)壕溝。相反,工作流和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢來源

以下是我們預(yù)測對的:

生成式AI是一種事物。突然之間,每個(gè)開發(fā)者都在研究生成式AI應(yīng)用,每個(gè)企業(yè)買家都在要求它。市場甚至保留了“生成式AI”的名稱。人才涌入市場,風(fēng)險(xiǎn)資本也涌入。生成式AI甚至成為了流行文化現(xiàn)象,如“哈利波特巴倫西亞加”這樣的病毒視頻,或者由Ghostwriter創(chuàng)作的模仿德雷克的歌曲“Heart on My Sleeve”,這首歌已經(jīng)成為了排行榜上的熱門歌曲。第一個(gè)殺手級應(yīng)用已經(jīng)出現(xiàn)。眾所周知,ChatGPT是最快達(dá)到1億MAU的應(yīng)用程序并且在短短6周內(nèi)自然而然地做到了這一點(diǎn)。相比之下,Instagram花了2.5年,WhatsApp花了3.5年,YouTube和Facebook花了4年才達(dá)到那種用戶需求水平。但ChatGPT并不是一個(gè)孤立的現(xiàn)象。Character AI的參與深度(平均每次會話2小時(shí))、Github Copilot的生產(chǎn)力益處(效率提高55%)以及Midjourney的商業(yè)化路徑(數(shù)億美元的收入)都表明,第一批殺手級應(yīng)用已經(jīng)到來。開發(fā)者是關(guān)鍵。像Stripe或Unity這樣以開發(fā)者為中心的公司的核心洞察是,開發(fā)者創(chuàng)造了你甚至無法想象的使用案例。在過去的幾個(gè)季度里,我們接到了從音樂生成社區(qū)到AI紅娘到AI客戶支持代理的各種想法。形態(tài)正在發(fā)展。AI應(yīng)用的第一版大多是自動完成和初稿,但這些形態(tài)現(xiàn)在正在變得越來越復(fù)雜。Midjourney引入的攝像機(jī)平移和填充是生成式AI優(yōu)先用戶體驗(yàn)變得更豐富的一個(gè)很好的例子?偟膩碚f,形態(tài)正在從個(gè)體到系統(tǒng)級的生產(chǎn)力,從人在循環(huán)中到執(zhí)行導(dǎo)向的代理系統(tǒng)發(fā)展。版權(quán)、倫理和存在的恐懼。這些熱點(diǎn)話題的辯論如火如荼,藝術(shù)家、作家和音樂家意見不一,有些創(chuàng)作者正當(dāng)?shù)貞嵟谄渌藦难苌髌分蝎@利,有些創(chuàng)作者則接受了新的AI現(xiàn)實(shí)(Grimes的利潤分享提議和James Buckhouse對成為創(chuàng)意基因組的一部分的樂觀態(tài)度浮現(xiàn)在腦海中)。沒有初創(chuàng)公司想成為最終的Spotify的Napster或Limewire(感謝Jason Boehmig)。規(guī)則是模糊的:日本已經(jīng)宣布用于培訓(xùn)AI的內(nèi)容沒有IP權(quán)利,而歐洲已經(jīng)提議下重手進(jìn)行監(jiān)管。

四、我們現(xiàn)在所處的位置?生成式AI的價(jià)值問題

生成式AI并不缺乏使用案例或客戶需求。用戶渴望AI能使他們的工作變得更容易,他們的工作產(chǎn)品變得更好,這就是為什么他們會成群結(jié)隊(duì)地 flock 到應(yīng)用程序中(盡管缺乏自然分布)。

但人們會繼續(xù)使用嗎?并不真的。下面的圖表比較了AI優(yōu)先應(yīng)用與現(xiàn)有公司的第一個(gè)月移動應(yīng)用保留率。

用戶參與度也不佳。一些最好的消費(fèi)公司有60-65%的DAU/MAU;WhatsApp的為85%。相比之下,生成式AI應(yīng)用的中位數(shù)為14%(Character和“AI陪伴”類別是顯著的例外)。這意味著用戶還沒有在生成式AI產(chǎn)品中找到足夠的價(jià)值,以至于每天都在使用它們。

簡而言之,生成式AI最大的問題不是尋找使用案例、需求或分發(fā),而是證明價(jià)值。正如我們的同事David Cahn所寫:“2000億美元的問題是:你打算使用所有這些基礎(chǔ)設(shè)施來做什么?它如何改變?nèi)藗兊纳睿?rdquo;建立持久的業(yè)務(wù)的路徑將需要解決保留問題,并為客戶生成足夠深入的價(jià)值,使他們堅(jiān)持并成為每日活躍用戶。

但我們不應(yīng)該絕望。生成式AI仍處于其“尷尬的青春期”。有時(shí)會有卓越的跡象,當(dāng)產(chǎn)品沒有達(dá)到預(yù)期時(shí),失敗通常是可靠的、可重復(fù)的且可修復(fù)的。我們的工作擺在面前。

五、第二階段分析

創(chuàng)始人正在進(jìn)行prompt工程、微調(diào)和數(shù)據(jù)集策劃的艱苦工作,以使他們的AI產(chǎn)品優(yōu)秀起來。他們正在逐步地建設(shè),將引人注目的Demo演示變成完整的產(chǎn)品體驗(yàn)。與此同時(shí),基礎(chǔ)模型底層繼續(xù)充滿研究和創(chuàng)新。

隨著公司找到持久價(jià)值的路徑,正在發(fā)展一個(gè)共享的劇本。我們現(xiàn)在有了共享的技術(shù)來使模型變得有用,以及將塑造生成式AI第二幕的新興UI范式。

1. 模型開發(fā)棧

新興的推理技術(shù),如連鎖思考、樹狀思考和反射,正在提高模型執(zhí)行更豐富、更復(fù)雜的推理任務(wù)的能力,從而縮小了客戶期望與模型能力之間的差距。開發(fā)者使用像Langchain這樣的框架來調(diào)用和調(diào)試更復(fù)雜的多鏈序列。遷移學(xué)習(xí)技術(shù),如RLHF和微調(diào),正變得更加可用,特別是隨著GPT-3.5和Llama-2的微調(diào)的最近可用性,這意味著公司可以將基礎(chǔ)模型適應(yīng)其特定領(lǐng)域,并從用戶反饋中改進(jìn)。開發(fā)者從Hugging Face下載開源模型,并微調(diào)它們以實(shí)現(xiàn)優(yōu)質(zhì)的性能。檢索增強(qiáng)生成(RAG)正在引入關(guān)于業(yè)務(wù)或用戶的上下文,減少幻覺并增加真實(shí)性和實(shí)用性。像Pinecone這樣的公司的向量數(shù)據(jù)庫已成為RAG的基礎(chǔ)設(shè)施支柱。新的開發(fā)者工具和應(yīng)用框架為公司提供了可重用的構(gòu)建塊,以創(chuàng)建更先進(jìn)的AI應(yīng)用,并幫助開發(fā)者評估、改進(jìn)和監(jiān)控生產(chǎn)中的AI模型的性能,包括像Langsmith和Weights & Biases這樣的LLMOps工具。像Coreweave、Lambda Labs、Foundry、Replicate和Modal這樣的AI-first基礎(chǔ)設(shè)施公司正在解除公共云的捆綁,并提供AI公司最需要的東西:大量的GPU以合理的成本、按需可用和高度可擴(kuò)展,以及一個(gè)不錯(cuò)的PaaS開發(fā)者體驗(yàn)。

這些技術(shù)應(yīng)該能夠在基礎(chǔ)模型同時(shí)改進(jìn)的情況下,縮小期望與現(xiàn)實(shí)之間的差距。但使模型變得出色只是成功了一半,生成式AI優(yōu)先的用戶體驗(yàn)也在進(jìn)化:

2. 新興產(chǎn)品藍(lán)圖

生成式界面:基于文本的對話用戶體驗(yàn)是LLM的默認(rèn)界面。漸漸地,新的形態(tài)進(jìn)入了武器庫,從Perplexity的生成用戶界面到Inflection AI的語音發(fā)聲等新的模態(tài)。新的編輯體驗(yàn):從Copilot到導(dǎo)演模式(Director‘s Mode)。隨著我們從Zero-shot到ask-and-adjust(感謝Zach Lloyd),生成式AI公司正在發(fā)明一套新的旋鈕和開關(guān),它們看起來與傳統(tǒng)的編輯工作流程非常不同。Midjourney的新的平移命令和Runway的導(dǎo)演模式創(chuàng)造了新的相機(jī)般的編輯體驗(yàn)。Eleven Labs使得通過提示(Prompt)操作聲音成為可能。越來越復(fù)雜的代理系統(tǒng)。生成式AI應(yīng)用越來越不僅僅是需要人來審查的自動完成或初稿;它們現(xiàn)在有自主權(quán)來解決問題、訪問外部工具并代表我們端到端地解決問題。我們正穩(wěn)步從0級進(jìn)展到5級自主性。系統(tǒng)范圍內(nèi)的優(yōu)化。有些公司并不是嵌入單個(gè)人用戶的工作流程并使該個(gè)體更有效,而是直接解決系統(tǒng)范圍內(nèi)的優(yōu)化問題。你能否選擇一部分支持票據(jù)或拉取請求并自主地解決它們,從而使整個(gè)系統(tǒng)更加有效?

參考材料

[1]https://www.sequoiacap.com/article/generative-ai-act-two/

結(jié)尾的思考

當(dāng)我們接近前沿悖論,當(dāng)Transformers和擴(kuò)散模型的新奇性逐漸消失時(shí),生成式AI市場的性質(zhì)正在發(fā)生變化。炒作和快速展示正在為真正的價(jià)值和完整的產(chǎn)品體驗(yàn)所取代。

在紅杉美國,我們?nèi)匀粓?jiān)定地相信生成式AI。這個(gè)市場起飛所需的條件在幾十年的時(shí)間里已經(jīng)累積起來,市場終于到來了。殺手級應(yīng)用的出現(xiàn)和終端用戶需求的巨大規(guī)模加深了我們對市場的信心。

然而,Amara的法則我們傾向于在短期內(nèi)高估一項(xiàng)技術(shù)的效果,在長期內(nèi)低估其效果的現(xiàn)象正在發(fā)揮作用。我們在投資決策中運(yùn)用耐心和判斷,密切關(guān)注創(chuàng)始人是如何解決價(jià)值問題的。公司使用的共享劇本來推動模型性能和產(chǎn)品體驗(yàn)的界限,使我們對生成式AI的第二階段感到樂觀。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港