展會信息港展會大全

Perplexity AI,比Google Bard和Bing Chat更靠譜的問答引擎
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-21 13:32:03   瀏覽:22809次  

導(dǎo)讀:作者:Cage 編輯:Cage、penny 排版:Scout 麥克盧漢說過,舊的媒介會成為新的媒介內(nèi)容的一部分。Google 中搜索到的知識成就了 ChatGPT 學(xué)習(xí)到的海量語料,但 ChatGPT 本身無法取代 Google。因?yàn)?ChatGPT 記不住所有的知識,也無法保證知識的實(shí)時(shí)性。因此,...

作者:Cage

編輯:Cage、penny

排版:Scout

麥克盧漢說過,舊的媒介會成為新的媒介內(nèi)容的一部分。Google 中搜索到的知識成就了 ChatGPT 學(xué)習(xí)到的海量語料,但 ChatGPT 本身無法取代 Google。因?yàn)?ChatGPT 記不住所有的知識,也無法保證知識的實(shí)時(shí)性。因此,檢索 (Retrieval) 技術(shù)被引入 LLM 應(yīng)用中,問答引擎這個(gè)結(jié)合搜索和 LLM 的產(chǎn)品品類就出現(xiàn)了。

Perplexity AI 是目前產(chǎn)品體驗(yàn)最好、知識獲取最準(zhǔn)確的問答引擎,在用戶中口碑顯著優(yōu)于 Google Bard 和 Bing Chat。其最大的特點(diǎn)是產(chǎn)品迭代速度快,Retrival 系統(tǒng)優(yōu)化好:具體體現(xiàn)在生成速度快、模型 Hallucination 少,且回答中的每一句話都明確標(biāo)注了引用來源。但由于核心用戶都在知識領(lǐng)域使用 Perplexity,目前尚很難成為一款低門檻的大眾化使用產(chǎn)品。生活/購物助手等更高價(jià)值的場景可能是其用戶泛化的路徑,但該領(lǐng)域要競爭的是對于 Workspace、Shopping、Map 等深入積累的 Google。

作為創(chuàng)業(yè)公司,Perplexity 的重心在于打磨產(chǎn)品和召回系統(tǒng),而不是自建模型+搜索技術(shù)棧。后者現(xiàn)在用的是 OAI 和 Google/Bing 的api,但這樣做成本偏高,且定價(jià)權(quán)掌握在別人手里,Bing 已經(jīng)將其 search api 的價(jià)格上調(diào)了 10 倍。

作為一款知識生產(chǎn)力向的產(chǎn)品,Perplexity 目前以 20 美元的訂閱制進(jìn)行商業(yè)化,但這個(gè)商業(yè)模型對于問答引擎這樣高 inference 成本的產(chǎn)品是不可持續(xù)的,尤其所挑戰(zhàn)的搜索引擎有一套極其成熟的商業(yè)化模型,能使用戶、商家、創(chuàng)作者同時(shí)受益。接下來 Perplexity 必須要在商業(yè)化方面發(fā)力:如何幫助開發(fā)者和企業(yè)優(yōu)化其搜索體驗(yàn),如何將廣告無縫地銜接入 AIGC 和 UGC。如果沒有長期新的商業(yè)模式出現(xiàn),Perplexity 當(dāng)前的形態(tài)更可能成為 Gen AI 時(shí)代的新 Quora + Wikipedia;如果探索出了 LLM native 的商業(yè)模式,Perplexity 具備挑戰(zhàn)傳統(tǒng)搜索的潛力。

以下為本文目錄,建議結(jié)合要點(diǎn)進(jìn)行針對性閱讀。

01 信息組織粒度的變化:從搜索引擎到回答引擎

02 產(chǎn)品:精心打磨的問答引擎

03 技術(shù):定位應(yīng)用層,使用技術(shù)巨頭的 api 開發(fā)產(chǎn)品

04團(tuán)隊(duì)與商業(yè)化發(fā)展

01.

信息組織粒度的變化:從搜索引擎到回答引擎

歡迎關(guān)注海外獨(dú)角獸視頻號

獲取最前沿的科技行業(yè)資訊

在互聯(lián)網(wǎng)時(shí)代,搜索引擎將信息以網(wǎng)頁為最小粒度為用戶進(jìn)行排序和推薦。

LLM 的出現(xiàn)使信息組織的最小粒度發(fā)生了變化:LLM 學(xué)習(xí)了所有 Google 上能得到的信息,將知識以詞匯為最小粒度生成相應(yīng)的內(nèi)容。很多用戶更青睞靈活度更優(yōu)的后者,開始與 ChatGPT 交互獲取各類知識。

LLM 本身是好的知識獲取平臺嗎?著名科幻作家 Ted Chiang 對 ChatGPT 取代搜索引擎是相當(dāng)悲觀的,他說:“ChatGPT 是對網(wǎng)絡(luò)模糊壓縮的 JPEG。” 在這篇著名的紐約客文章中,他認(rèn)為互聯(lián)網(wǎng)用戶需要有精確的索引和參考依據(jù)。不然過度依賴 ChatGPT 那樣的有損壓縮,會讓人們失去對事物追根溯源的思考能力。

而有損壓縮在生產(chǎn)力場景很難嚴(yán)肅使用有一個(gè)重要原因:Hallucination。模型會模仿人類的口吻說出一些實(shí)際不符合事實(shí)的內(nèi)容,有時(shí)很難分辨其真?zhèn)。因此,大家?dāng)前普遍使用的解決方案是 Retrieval Augmentation 把與問題相關(guān)的事實(shí)交給模型一起加工和學(xué)習(xí)。

這樣模糊與精確兼?zhèn)涞漠a(chǎn)品,是“回答引擎” 當(dāng)前最接近下一代搜索引擎的產(chǎn)品形態(tài)。Google Bard、Bing Chat 和本文的主角 Perplexity AI 都是這一品類的代表。接下來就將從產(chǎn)品、技術(shù)棧等方向去詳細(xì)分析各回答引擎、尤其是 Perplexity AI 的主要特點(diǎn)。

02.

產(chǎn)品:

精心打磨的問答引擎

出色的產(chǎn)品迭代速度

Perplexity AI 是一家 Gen AI 應(yīng)用層公司,模型或技術(shù)棧能力不是核心價(jià)值,產(chǎn)品迭代能力強(qiáng)是重要特點(diǎn)。Nat Fridman,Github 前 CEO 在今年初稱贊過 Perplexity:創(chuàng)立不到六個(gè)月,比很多公司全生命周期發(fā)布的產(chǎn)品迭代都更多。

回到其產(chǎn)品公測的第一天:22年12月8日,Perplexity 發(fā)布了其 beta 版本的搜索產(chǎn)品 Ask。根據(jù)用戶的問題,輸出用 Bing 搜索引擎結(jié)果驗(yàn)證過的 GPT 3.5 回答。其最早的產(chǎn)品與搜索引擎很接近,將文字輸入頂端對話框之后,出現(xiàn)下面兩段式內(nèi)容:

第一部分是 AI 生成的總結(jié),其中包含有引用內(nèi)容和索引;第二部分是 AI 生成過程中參考的鏈接來源,會且只會出現(xiàn) 3 條。在生成內(nèi)容下方可以給反饋:like 和 dislike,也可以轉(zhuǎn)發(fā)到推特促使自然裂變。

最早產(chǎn)品形態(tài)

12 月 16 日,Perplexity 緊接著發(fā)布了第二款產(chǎn)品:Bird SQL,能夠根據(jù)自然語言搜索推特中的內(nèi)容。其實(shí)現(xiàn)方式是,用 OpenAI Codex 模型將自然語言變成 SQL,從當(dāng)時(shí)還開放的 Twitter SQL 接口去查詢到最相關(guān)的 post。

由于 Twitter 自身的搜索功能優(yōu)化得很差,這一功能在早期受到了很多好評。因?yàn)楫a(chǎn)品的查詢是基于 SQL 實(shí)現(xiàn)的,還產(chǎn)生了很多有趣的數(shù)據(jù)可視化,與 ChatGPT 最近受到熱議的 code interpreter 有些相似。

可惜在今年 2 月底,Twitter 關(guān)閉了這個(gè)接口。從這個(gè)產(chǎn)品能看出 Perplexity 對搜索理解很深,且能抓住當(dāng)時(shí) Google、Bing、Twitter 都沒有通過 LLM 優(yōu)化自己搜索能力的時(shí)機(jī),快速推出市場認(rèn)可的產(chǎn)品。Twitter 的搜索經(jīng)驗(yàn)在未來也能幫助其他公司的數(shù)據(jù)庫優(yōu)化其搜索能力。

今年 5 月,Perplexity 又大幅迭代了產(chǎn)品,問答引擎中的 Agent 實(shí)踐:推出基于 GPT-4 理解和規(guī)劃能力的 Copilot。在這款產(chǎn)品中,輸入的問題中缺失的細(xì)節(jié)會由 Copilot 給出一些選項(xiàng)和輸入框,使其能夠讓用戶更精準(zhǔn)地傳達(dá)自己的需求。這一能力在輸入復(fù)雜問題的時(shí)候,能給到更可控且準(zhǔn)確的回答。當(dāng)前的 copilot, 雖然只是一個(gè)界定了能力邊界問答引擎助手,但卻可能在嘗試定義和探索未來基于 LLM 能力的 AI agent UI 形態(tài)。

與這一產(chǎn)品發(fā)布的還有 AI profile 和 Perplexity Pro 方案,前者是用戶自己的背景和偏好介紹,在使用 Copilot 的時(shí)候能體驗(yàn)到一定的個(gè)性化內(nèi)容;而后者是一個(gè)月 20 美元無限使用 Copilot 的額度。

根據(jù) Lilian Weng 最新博客中的定義,Agent = Planning + Memory + Action with tools。Copilot 本身是 planning 的體現(xiàn),AI profile 是 memory 的形式,而 Actions with tools 是當(dāng)前 Perplexity 當(dāng)前相對缺失的,也是最可能在之后和 Google 的競爭中落下風(fēng)的:Google Workspace 中可以給 Bard 使用的工作和地圖工具很多。

除了上文中這些重要迭代,Perplexity 產(chǎn)品還經(jīng)歷了一系列小迭代:

Perplexity 推出產(chǎn)品已經(jīng) 7 個(gè)月了,開發(fā)和迭代速度很快,對 LLM 的想法也非常的應(yīng)用思維:用好模型是第一位的,盡管他們有了自己的模型也不做任何宣傳,因?yàn)檎J(rèn)識到模型能力很難和 GPT-4 level 直接競爭。他們對搜索也有著很深的執(zhí)念,目前 Ask、Bird SQL、Copilot 都圍繞著核心命題:如何用 LLM 優(yōu)化搜索的體驗(yàn)。

產(chǎn)品評價(jià)與反饋

Quantative Analysis

搜索引擎有一套嚴(yán)謹(jǐn)?shù)闹笜?biāo)體系,如 Precision@10(前十個(gè)結(jié)果是否解決用戶的問題)、CTR(點(diǎn)擊數(shù)/展示數(shù)),但這些指標(biāo)對單個(gè)生成式的結(jié)果并不合適。Percy Liang 團(tuán)隊(duì)今年 4 月的一篇論文 Evaluating Verifiability in Generative Search Engines 中提出了一套對于生成式搜索引擎,也就是回答引擎的評價(jià)標(biāo)準(zhǔn):

1. 體感效果:

文本流暢度

內(nèi)容有用性

2. 引用能力:

Recall(引用是否完整)

Precision(引用是否準(zhǔn)確)

經(jīng)過他們對每個(gè)問答引擎 1450 道題的提問,評分如下:

根據(jù)這一套評價(jià)體系,各回答引擎的生成體感效果總體都不錯(cuò),其中 Youchat 的體感是最好的,Perplexity AI 排名第二,Bing Chat 墊底。

而到了引用能力部分,總體的表現(xiàn)就差了些。尤其是第一part表現(xiàn)良好的 Youchat 就出現(xiàn)了嚴(yán)重的可用性問題,大部分內(nèi)容都沒有得到文本支持。Perplexity 是在準(zhǔn)召率上做得最平衡全面的,而 Bing Chat 盡管引用準(zhǔn)確,但也和 Youchat 類似召回率偏低。和體感評分相比,這一項(xiàng)各產(chǎn)品的評分都不算高,Perplexity 是當(dāng)前相對最好的。

因此,將以上評估指標(biāo)投射到坐標(biāo)軸上,可以看到在量化評估中 Perplexity AI 收到的評價(jià)是最好、最全面的。(注意,評測時(shí) Perplexity 用的是免費(fèi)版本不用 GPT-4 的,而 Bing 的是已經(jīng)用上了 GPT-4 的版本,可見 Bing Chat 的表現(xiàn)不如人意):

Qualitative Analysis

Perplexity

Perplexity 作為回答引擎有兩個(gè)重要的產(chǎn)品特點(diǎn):

1. 很強(qiáng)的知識產(chǎn)品屬性,閱讀和分享體驗(yàn)與 Google 相比,接近 Wikipedia 和 Quora:

顯示文本引用來源:每次生成的回答中會有 3-5 個(gè)鏈接,來佐證其生成內(nèi)容的準(zhǔn)確性。閱讀體驗(yàn)非常類似學(xué)術(shù)文獻(xiàn)閱讀,且來源可以控制:如果不喜歡華盛頓郵報(bào)的內(nèi)容,就可以將其從 source 中刪除,重新生成。

有完善的查詢歷史和內(nèi)容分享:每次對話會生成一個(gè)鏈接 permalink,成為與其他用戶分享的知識百科頁,自己過去查詢的歷史也會完全記錄下來。(詳見reference)

其他的產(chǎn)品更多的是將查詢內(nèi)容當(dāng)作聊天記錄隨用隨拋,而 Perplexity 則將其作為維基百科,可見其對自己生成內(nèi)容是更有信心的。

焦點(diǎn)搜索功能:在搜索框下方,有個(gè)下拉菜單,其中包含多個(gè)領(lǐng)域,例如YouTube、新聞、Reddit、學(xué)術(shù)等(學(xué)術(shù)專區(qū)增加了 SemanticScholar、Arxiv 和 NIH 等資源)。這個(gè)能力可以使搜索效果更為聚焦,用戶調(diào)研中常見使用于學(xué)術(shù)研究和創(chuàng)意寫作相關(guān)。

2. 將 LLM 和搜索結(jié)合得很好,盡可能減少了 Hallucination:

生成內(nèi)容簡潔且可靠:在與多問題引擎對比的時(shí)候,Perplexity 是最能用有限的字?jǐn)?shù)準(zhǔn)確回答問題的產(chǎn)品。Bing Chat 有時(shí)回答過于簡短需要反復(fù)追問,Google Bard 有時(shí)回答太過冗長,需要從中提煉出關(guān)鍵信息。結(jié)合有用戶反饋 Perplexity 生成的內(nèi)容有大約 650 字的字?jǐn)?shù)限制,能夠精煉地提供言之有物的回答,是問答引擎這個(gè)場景的重要標(biāo)準(zhǔn)。

理解問題并拆解、主動反問的能力:在 Copilot 產(chǎn)品中,AI 能夠根據(jù)問題理解,并且深入問題的細(xì)節(jié)反問得到更多信息,再去進(jìn)行搜索。這里是靈活使用 GPT-4 的規(guī)劃和理解能力,通過 prompt engineering 去引導(dǎo)其提問和反問,使生成的內(nèi)容質(zhì)量更高,可控性更強(qiáng)。

多輪對話:在同一次搜索中可以不斷追問,得到更接近自己想要的內(nèi)容,在產(chǎn)品形態(tài)上兼具了 Chat 和 Search 的優(yōu)點(diǎn)。實(shí)際使用時(shí),偶爾會有多輪記憶和理解上的遺忘現(xiàn)象。

基本沒有Hallucination:有主動表示搜索結(jié)果中沒有符合問題答案的能力。

多語言能力不錯(cuò),生成速度快:Google Bard 目前只支持英語,Bing Chat 在瀏覽那一步的速度較慢。

Comparison with Bard and Bing

03.

技術(shù):定位應(yīng)用層,使用技術(shù)巨頭的 api 開發(fā)產(chǎn)品

技術(shù)對比:傳統(tǒng)搜索引擎技術(shù)棧

Google/Bing 搜索引擎的大致技術(shù)模塊包括以下幾個(gè)模塊:

1. 內(nèi)容收集和整理:

這一層負(fù)責(zé)抓取網(wǎng)絡(luò)、下載網(wǎng)頁并解析它們以提取內(nèi)容。它還包括一些過濾和優(yōu)化內(nèi)容的過程,如刪除重復(fù)頁面、檢測垃圾郵件和按主題分類頁面。

抓。谷歌的抓取器,也稱為Googlebot,負(fù)責(zé)訪問網(wǎng)站并下載頁面。它們使用各種技術(shù)來避免使網(wǎng)站過載,例如限制每秒訪問的頁面數(shù)量和遵循robots.txt文件。

解析:頁面下載后,會對它們進(jìn)行解析以提取內(nèi)容。這包括頁面上的文本、圖像和其他媒體。解析器還識別頁面的標(biāo)題、關(guān)鍵字和其他元數(shù)據(jù)。

過濾和整理:從頁面中提取的內(nèi)容接著進(jìn)行過濾和整理。這包括刪除重復(fù)頁面、檢測垃圾郵件和按主題分類頁面。

2. 搜索核心:

這一層負(fù)責(zé)對內(nèi)容進(jìn)行索引并創(chuàng)建搜索索引。它還包括一些用于在搜索結(jié)果中對頁面進(jìn)行排序的算法,如PageRank,它根據(jù)頁面與其他頁面的鏈接關(guān)系衡量頁面的重要性。

索引:經(jīng)過過濾和整理的內(nèi)容隨后被索引。這涉及到創(chuàng)建一個(gè)包含頁面及其內(nèi)容、元數(shù)據(jù)和排名信息的數(shù)據(jù)庫。

排序:索引中的頁面使用各種算法進(jìn)行排名。這些算法考慮到頁面的內(nèi)容、指向頁面的鏈接等因素。

3. 用戶和應(yīng)用程序接口:

這一層負(fù)責(zé)與用戶交互并向他們提供搜索結(jié)果。它包括谷歌搜索網(wǎng)站以及允許其他應(yīng)用程序訪問搜索結(jié)果的API。

谷歌搜索網(wǎng)站:谷歌搜索網(wǎng)站是谷歌搜索引擎最著名的用戶界面。它允許用戶輸入搜索查詢并查看搜索結(jié)果。

API:谷歌還提供了一些 API,允許其他應(yīng)用程序訪問搜索結(jié)果。這使得開發(fā)人員可以創(chuàng)建與谷歌搜索引擎集成的自定義搜索應(yīng)用程序。

這些技術(shù)模塊共同構(gòu)成了 Google/Bing 搜索引擎的基本架構(gòu),而 Perplexity 的搜索能力是建立在這些巨頭的能力之上的。

而 Perplexity 的技術(shù)棧則直接基于 Google/Bing 的技術(shù)來繞過了需要長時(shí)間積累和工程復(fù)雜度的爬蟲、數(shù)據(jù)庫系統(tǒng)。其流程可以分為以下幾個(gè)部分:

1. Google/Bing 搜索返回:

從他們的查詢引擎 api 返回與用戶 query 有關(guān)的網(wǎng)頁內(nèi)容。

2. 索引系統(tǒng):

將內(nèi)容向量化進(jìn)行細(xì)粒度的處理和組織,目標(biāo)有二,其一是方便排序時(shí)能理解和定位到網(wǎng)頁中與用戶問題最相關(guān)的內(nèi)容,其二是可以將 api 返回的內(nèi)容存儲以用作之后復(fù)用。

3. 排序系統(tǒng):

以語義搜索的方式 retrieve 最相關(guān)的內(nèi)容,交給 LLM 作為 input 進(jìn)行學(xué)習(xí)。

4. 問答系統(tǒng)與 LLM 調(diào)用:

LLM 根據(jù)召回的內(nèi)容進(jìn)行學(xué)習(xí),輸出對用戶 query 的解答,并在其中對引用內(nèi)容進(jìn)行標(biāo)注。學(xué)習(xí)過程中根據(jù)用戶選擇和系統(tǒng)判斷決定使用自研模型還是 OpenAI 的模型。

成本測算:長期需要自研 search stack 以降低成本

使用大公司的 api 使他們能專注于優(yōu)化產(chǎn)品,但也會拉高成本。他們意識到這點(diǎn),回到了 ML Researcher 的老本行開發(fā)了 7B 的自研模型,成功將 query 中 LLM 生成成本降低到了相對低的水平。

但與此同時(shí),和 Twitter 關(guān)掉自己的數(shù)據(jù)庫一樣,Google/Bing 也察覺到了搜索引擎 startup 的動向,將其 search api 的價(jià)格抬高了 10 倍左右,對 Perplexity 等不自建 search stack 的公司造成了壓力。以 Bing Search API 為例:

漲價(jià)后,單次 Bing Search 的成本在 0.015 美元,而 LLM 交互成本(如果自研模型成本能達(dá)到 GPT-3.5 一半的話)也就在 0.02 美元左右。因此接下來如果要將產(chǎn)品可持續(xù)地?cái)U(kuò)大使用量,search stack 的自研會使成本降低 30% 左右。按當(dāng)前的假設(shè)估算,Perplexity 維持當(dāng)前的搜索量和技術(shù)棧,一年需要的成本在 1000萬美元以上。技術(shù)非自研會對其未來的 runway 有比較大的影響。

04.

團(tuán)隊(duì)與商業(yè)化發(fā)展

團(tuán)隊(duì):創(chuàng)始科學(xué)家比例高,

LLM/search/ranking 經(jīng)驗(yàn)豐富

Perplexity 團(tuán)隊(duì)目前有 18 人,其中一半以上是 Engineering Team 的。團(tuán)隊(duì)優(yōu)點(diǎn)明顯:創(chuàng)始團(tuán)隊(duì)對 LLM 有很深入的理解,工程團(tuán)隊(duì)對 Ranking /問答系統(tǒng)有很豐富的經(jīng)驗(yàn)。大部分之前都在獨(dú)角獸或大廠工作,有 3 位成員之前在 Quora 工作過。接下來重點(diǎn)介紹幾位團(tuán)隊(duì)中的重要成員。

CEO Aravind Srinivas 來自印度,博士期間才移民來到美國。Aravind 是 UCB 的 CS Phd,主攻方向是在計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)中融入 Transformer 模型。Phd 期間,他先后分別在 OpenAI、DeepMind 和 Google 做 Research Intern。畢業(yè)后,他加入 OpenAI 工作了一年,研究語言模型和擴(kuò)散模型。22 年 8 月,離開 OpenAI 創(chuàng)立 Perplexity。

和他一起創(chuàng)業(yè)的是 CTO Denis,有很強(qiáng)的搜索和工程背景。11-13 年期間,他是 Bing 團(tuán)隊(duì)的工程師,之后來到 Quora 成為排序算法的 Tech Lead。16 年從 Quora 離開后加入 Facebook FAIR,同樣開始做計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)相關(guān)的研究,18 年開始在紐約大學(xué)做 AI Phd。

Aravind 在訪談中夸過 Denis 很會招聘,團(tuán)隊(duì)第三人就是 Denis 招來的:CSO Johnny Ho。他是哈佛大學(xué)數(shù)學(xué)/CS 雙學(xué)位,畢業(yè)后在 Quora 待過一年,當(dāng)時(shí)在 Denis 的 team 工作。離開 Quora 之后,他成為了職業(yè)編程競賽選手、量化交易員。用 Aravind 的話說,Johnny 是 Perplexity 運(yùn)轉(zhuǎn)迭代速度高效的重要原因。在官方的 Discord 和 Reddit 中,Johnny 是主要的運(yùn)營和收集用戶反饋的那位,在團(tuán)隊(duì)中是復(fù)合型的多面手。

Andy 是 Databricks 的 Co-founder,CS Phd 出身的他在 Databricks 承擔(dān)了很多創(chuàng)業(yè)公司運(yùn)營相關(guān)的工作,先后做過 VP of professional services 和 VP of Product。在 Perplexity 早期,Andy 作為 President 以其連續(xù)創(chuàng)業(yè)的經(jīng)驗(yàn)幫助公司少走了很多彎路。

Henry Modisett 是 Perplexity 的 Founding Designer。在加入 Perplexity 前,他在 Quora 待了 8 年,從產(chǎn)品早期的年輕設(shè)計(jì)師一直成長為產(chǎn)品的 design lead & manager。Quora 的 feed 流、問答和 Google 郵箱 iOS 產(chǎn)品設(shè)計(jì)都有他的參與。他在今年 2 月加入,那之后的產(chǎn)品迭代 feature 設(shè)計(jì)可能與他緊密相關(guān),比如 4 月的網(wǎng)頁設(shè)計(jì)風(fēng)格改版和 6 月的 Copilot。

融資歷史:天使投資陣容豪華

值得一提的是,團(tuán)隊(duì)的天使投資人陣容極其豪華,基本全是海外 AI/ML 的核心人物:

商業(yè)化進(jìn)展:

早期核心用戶穩(wěn)定,尚需跨越鴻溝

在今年初創(chuàng)始人 Aravind 接受采訪的時(shí)候提到,Subscription 對問答引擎不是一個(gè)好的商業(yè)模式,Google 才是 role model。6 月,GPT-4 的接入和 Copilot 功能發(fā)布后,高額的 api 成本使 Perplexity 開始推出會員制產(chǎn)品:付費(fèi)會員所有 query 回答都以 GPT-4 進(jìn)行回答和生成,每天有 300+ 次 Copilot 使用額度。

對于 20 美元一個(gè)月的產(chǎn)品而言,用戶的評價(jià)相對兩極分化。有一部分用戶認(rèn)為其價(jià)格與 ChatGPT/Poe 持平是比較貴的,因?yàn)槠涮峁┑木褪且粋(gè)更可靠的 ChatGPT + Browsing 能力,而 ChatGPT 還有其他更豐富的 plugin offering,Poe 有 Claude 等其他 LLM 的接入。

Pro 方案推出三天后就有了 1000+ 付費(fèi)用戶。用戶評價(jià)以大多是好評,認(rèn)為 Pro 產(chǎn)品并不是單純換了個(gè)模型 api,而是做了更用心的優(yōu)化,使用 GPT-4 之后的查詢體驗(yàn)更好,Hallucination、Latency 等效果好于 ChatGPT。商業(yè)化收入的快速成長,代表 Perplexity 已經(jīng)有了穩(wěn)定的核心商業(yè)化客戶。

此外,團(tuán)隊(duì)還有其他的商業(yè)化想法:

1. 提供問答引擎 api:成熟需求,上千開發(fā)者來詢問過。

2. 專業(yè)版?zhèn)性化 Indexing:

To C:個(gè)性化體驗(yàn)(用戶自己的鏈接、書簽);

To B:工作流工具,Index 工作中的合作儀表盤等。

3. 廣告:如何用 Gen AI 做營銷是當(dāng)前最有趣的 Open Question。

未來發(fā)展分析

Upside:

顛覆搜索引擎市場,

爭奪 Google 的市場份額

搜索引擎是一個(gè)巨大的壟斷市常在過去的五年中,Google 都保持著 90% 以上的市場占有率。在榜單上的公司都已經(jīng)有 10 年以上的歷史。一方面,這讓他們積累了非常深的系統(tǒng) Infra 優(yōu)勢,讓后來者很難超越;但另一方面,這也使這些公司有著很深的 Legacy Problem,很難讓產(chǎn)品徹底的轉(zhuǎn)型。

Data Summarized by Perplexity

同時(shí),搜索引擎市場也非常大:2022年谷歌搜索的收入是 $283B,Bing 的收入是 $11.5B。即使是市占率 5% 以下的玩家仍然收入不錯(cuò)。

但要侵蝕一部分 Google 的搜索市場占比,最大的挑戰(zhàn)會是商業(yè)模型。Google 商業(yè)模型除了給用戶提供高質(zhì)量的搜索引擎外,還有兩個(gè)非常重要的輪子。其一是廣告主營銷,只有實(shí)現(xiàn)了滿足廣告主的商業(yè)化系統(tǒng),才能有良好的現(xiàn)金流使用戶免費(fèi)地用上高質(zhì)量的搜索系統(tǒng);第二是創(chuàng)作者激勵(lì),內(nèi)容發(fā)布者能夠通過在互聯(lián)網(wǎng)上發(fā)布高質(zhì)量內(nèi)容,得到平臺和廣告主的激勵(lì),是其源源不斷發(fā)布內(nèi)容的動力。盡管 AI 看似減少了創(chuàng)作端需求,但還是需要用戶去創(chuàng)作高質(zhì)量的內(nèi)容交給 AI 來學(xué)習(xí)和召回。

除了商業(yè)化上的難點(diǎn)之外,還有產(chǎn)品形態(tài)上的難點(diǎn)。廣告模型下的搜索引擎,天然是有良好的數(shù)據(jù)飛輪的:用戶的瀏覽和點(diǎn)擊行為,反應(yīng)了用戶的偏好,同時(shí)反饋到排序系統(tǒng)和廣告競價(jià)系統(tǒng),使搜索引擎的效果更佳。

這樣的數(shù)據(jù)飛輪在當(dāng)下的問答引擎中還未出現(xiàn):Chat 的形式并不方便用戶直接去做偏好反饋,用戶也不會有額外的時(shí)間去專門為答案做編輯或修改,Like/Dislike 類標(biāo)簽的比例也只有 10% 用戶給出。問答引擎需要一個(gè)好的產(chǎn)品形態(tài),來讓用戶使用的同時(shí)自然地給反饋,才能讓產(chǎn)品在 Google 面前有競爭力。

當(dāng)商業(yè)模式和產(chǎn)品數(shù)據(jù)飛輪的問題都能有原創(chuàng)的新解法,且不容易被復(fù)制時(shí),相信 Perplexity 有潛力成為一家撼動巨頭的公司。

Neutral:

Gen AI 時(shí)代的 Quora/Wikipedia

撼動 Google 的市場可能暫時(shí)是一個(gè)好高騖遠(yuǎn)的目標(biāo),而成為新時(shí)代的 Quora/Wikipedia 這樣的知識平臺是完全有可能的。

在互聯(lián)網(wǎng)時(shí)代,這兩家公司都以優(yōu)秀的知識產(chǎn)品出名,但是苦于沒有好的商業(yè)化能力,沒法持續(xù)的激勵(lì)創(chuàng)作者留在平臺上,流量價(jià)值進(jìn)一步減少形成了負(fù)反饋循環(huán)。而 Gen AI 的出現(xiàn)正減少了內(nèi)容供給上的壓力,AI 替代大部分人類創(chuàng)作者組織和整理知識成為可能。從 Perplexity 當(dāng)前的產(chǎn)品形態(tài)上,有很多知識產(chǎn)品的理念,核心用戶群也常常使用其做知識研究類工作。

Downside:

獨(dú)到的收購價(jià)值,Tech Giants 可能都需要 LLM + Retrieval 能力

Perplexity 團(tuán)隊(duì)是很獨(dú)樹一幟和清醒的:他們把用戶的信任而不是技術(shù)棧作為自己的 moat。盡管從表面上來看,Perplexity 用的是 Bing Search 和 OpenAI 的 api,但技術(shù)棧類似的 Bing Chat 比 Perplexity 使用體驗(yàn)糟糕很多?梢娖渲杏泻芏 Indexing、Prompting 等相關(guān)的技術(shù)和設(shè)計(jì)是比較復(fù)雜有技巧的,要做到嚴(yán)肅場景下的使用是一件很有門檻的事情。

最近巨頭開始了一波收購潮,Snow 收購了 Neeva(之前Perplexity 的競爭對手,由于其完整的 search stack,被收購后專心做 enterprise search),Databricks 收購了 MosaicML,都還在技術(shù)棧查缺補(bǔ)漏的階段。但經(jīng)過這一階段的探索,大家都會發(fā)現(xiàn)只有好的 LLM 是很難在商業(yè)環(huán)境下有好的使用效果的,LLM + Retrieval 是必要的解決方案。這時(shí),Perplexity 這樣一個(gè)深入理解 LLM 和 Retrieval 技術(shù)與應(yīng)用、在一個(gè)紅海賽道階段性領(lǐng)先巨頭的團(tuán)隊(duì)是否會有著更高的收購價(jià)值呢?

Reference

https://www.perplexity.ai/search/4f22f1bd-e957-4a50-bc9e-591f16f42464?s=c。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: Perplexity Google Bard Bing Ch

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港