當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動態(tài) > Perplexity AI，比Google Bard和Bing Chat更靠譜的問答引擎

Perplexity AI，比Google Bard和Bing Chat更靠譜的問答引擎
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-21 13:32:03 瀏覽：22809次

導(dǎo)讀：作者：Cage 編輯：Cage、penny 排版：Scout 麥克盧漢說過，舊的媒介會成為新的媒介內(nèi)容的一部分。Google 中搜索到的知識成就了 ChatGPT 學(xué)習(xí)到的海量語料，但 ChatGPT 本身無法取代 Google。因?yàn)?ChatGPT 記不住所有的知識，也無法保證知識的實(shí)時(shí)性。因此，...

作者：Cage

編輯：Cage、penny

排版：Scout

麥克盧漢說過，舊的媒介會成為新的媒介內(nèi)容的一部分。Google 中搜索到的知識成就了 ChatGPT 學(xué)習(xí)到的海量語料，但 ChatGPT 本身無法取代 Google。因?yàn)?ChatGPT 記不住所有的知識，也無法保證知識的實(shí)時(shí)性。因此，檢索 (Retrieval) 技術(shù)被引入 LLM 應(yīng)用中，問答引擎這個(gè)結(jié)合搜索和 LLM 的產(chǎn)品品類就出現(xiàn)了。

Perplexity AI 是目前產(chǎn)品體驗(yàn)最好、知識獲取最準(zhǔn)確的問答引擎，在用戶中口碑顯著優(yōu)于 Google Bard 和 Bing Chat。其最大的特點(diǎn)是產(chǎn)品迭代速度快，Retrival 系統(tǒng)優(yōu)化好：具體體現(xiàn)在生成速度快、模型 Hallucination 少，且回答中的每一句話都明確標(biāo)注了引用來源。但由于核心用戶都在知識領(lǐng)域使用 Perplexity，目前尚很難成為一款低門檻的大眾化使用產(chǎn)品。生活/購物助手等更高價(jià)值的場景可能是其用戶泛化的路徑，但該領(lǐng)域要競爭的是對于 Workspace、Shopping、Map 等深入積累的 Google。

作為創(chuàng)業(yè)公司，Perplexity 的重心在于打磨產(chǎn)品和召回系統(tǒng)，而不是自建模型+搜索技術(shù)棧。后者現(xiàn)在用的是 OAI 和 Google/Bing 的api，但這樣做成本偏高，且定價(jià)權(quán)掌握在別人手里，Bing 已經(jīng)將其 search api 的價(jià)格上調(diào)了 10 倍。

作為一款知識生產(chǎn)力向的產(chǎn)品，Perplexity 目前以 20 美元的訂閱制進(jìn)行商業(yè)化，但這個(gè)商業(yè)模型對于問答引擎這樣高 inference 成本的產(chǎn)品是不可持續(xù)的，尤其所挑戰(zhàn)的搜索引擎有一套極其成熟的商業(yè)化模型，能使用戶、商家、創(chuàng)作者同時(shí)受益。接下來 Perplexity 必須要在商業(yè)化方面發(fā)力：如何幫助開發(fā)者和企業(yè)優(yōu)化其搜索體驗(yàn)，如何將廣告無縫地銜接入 AIGC 和 UGC。如果沒有長期新的商業(yè)模式出現(xiàn)，Perplexity 當(dāng)前的形態(tài)更可能成為 Gen AI 時(shí)代的新 Quora + Wikipedia；如果探索出了 LLM native 的商業(yè)模式，Perplexity 具備挑戰(zhàn)傳統(tǒng)搜索的潛力。

以下為本文目錄，建議結(jié)合要點(diǎn)進(jìn)行針對性閱讀。

01 信息組織粒度的變化：從搜索引擎到回答引擎

02 產(chǎn)品：精心打磨的問答引擎

03 技術(shù)：定位應(yīng)用層，使用技術(shù)巨頭的 api 開發(fā)產(chǎn)品

04團(tuán)隊(duì)與商業(yè)化發(fā)展

01.

信息組織粒度的變化：從搜索引擎到回答引擎

歡迎關(guān)注海外獨(dú)角獸視頻號

獲取最前沿的科技行業(yè)資訊

在互聯(lián)網(wǎng)時(shí)代，搜索引擎將信息以網(wǎng)頁為最小粒度為用戶進(jìn)行排序和推薦。

LLM 的出現(xiàn)使信息組織的最小粒度發(fā)生了變化：LLM 學(xué)習(xí)了所有 Google 上能得到的信息，將知識以詞匯為最小粒度生成相應(yīng)的內(nèi)容。很多用戶更青睞靈活度更優(yōu)的后者，開始與 ChatGPT 交互獲取各類知識。

LLM 本身是好的知識獲取平臺嗎？著名科幻作家 Ted Chiang 對 ChatGPT 取代搜索引擎是相當(dāng)悲觀的，他說：“ChatGPT 是對網(wǎng)絡(luò)模糊壓縮的 JPEG。” 在這篇著名的紐約客文章中，他認(rèn)為互聯(lián)網(wǎng)用戶需要有精確的索引和參考依據(jù)。不然過度依賴 ChatGPT 那樣的有損壓縮，會讓人們失去對事物追根溯源的思考能力。

而有損壓縮在生產(chǎn)力場景很難嚴(yán)肅使用有一個(gè)重要原因：Hallucination。模型會模仿人類的口吻說出一些實(shí)際不符合事實(shí)的內(nèi)容，有時(shí)很難分辨其真?zhèn)�。因此，大家�?dāng)前普遍使用的解決方案是 Retrieval Augmentation 把與問題相關(guān)的事實(shí)交給模型一起加工和學(xué)習(xí)。

這樣模糊與精確兼?zhèn)涞漠a(chǎn)品，是“回答引擎” 當(dāng)前最接近下一代搜索引擎的產(chǎn)品形態(tài)。Google Bard、Bing Chat 和本文的主角 Perplexity AI 都是這一品類的代表。接下來就將從產(chǎn)品、技術(shù)棧等方向去詳細(xì)分析各回答引擎、尤其是 Perplexity AI 的主要特點(diǎn)。

02.

產(chǎn)品：

精心打磨的問答引擎

出色的產(chǎn)品迭代速度

Perplexity AI 是一家 Gen AI 應(yīng)用層公司，模型或技術(shù)棧能力不是核心價(jià)值，產(chǎn)品迭代能力強(qiáng)是重要特點(diǎn)。Nat Fridman，Github 前 CEO 在今年初稱贊過 Perplexity：創(chuàng)立不到六個(gè)月，比很多公司全生命周期發(fā)布的產(chǎn)品迭代都更多。

回到其產(chǎn)品公測的第一天：22年12月8日，Perplexity 發(fā)布了其 beta 版本的搜索產(chǎn)品 Ask。根據(jù)用戶的問題，輸出用 Bing 搜索引擎結(jié)果驗(yàn)證過的 GPT 3.5 回答。其最早的產(chǎn)品與搜索引擎很接近，將文字輸入頂端對話框之后，出現(xiàn)下面兩段式內(nèi)容：

第一部分是 AI 生成的總結(jié)，其中包含有引用內(nèi)容和索引；第二部分是 AI 生成過程中參考的鏈接來源，會且只會出現(xiàn) 3 條。在生成內(nèi)容下方可以給反饋：like 和 dislike，也可以轉(zhuǎn)發(fā)到推特促使自然裂變。

最早產(chǎn)品形態(tài)

12 月 16 日，Perplexity 緊接著發(fā)布了第二款產(chǎn)品：Bird SQL，能夠根據(jù)自然語言搜索推特中的內(nèi)容。其實(shí)現(xiàn)方式是，用 OpenAI Codex 模型將自然語言變成 SQL，從當(dāng)時(shí)還開放的 Twitter SQL 接口去查詢到最相關(guān)的 post。

由于 Twitter 自身的搜索功能優(yōu)化得很差，這一功能在早期受到了很多好評。因?yàn)楫a(chǎn)品的查詢是基于 SQL 實(shí)現(xiàn)的，還產(chǎn)生了很多有趣的數(shù)據(jù)可視化，與 ChatGPT 最近受到熱議的 code interpreter 有些相似。

可惜在今年 2 月底，Twitter 關(guān)閉了這個(gè)接口。從這個(gè)產(chǎn)品能看出 Perplexity 對搜索理解很深，且能抓住當(dāng)時(shí) Google、Bing、Twitter 都沒有通過 LLM 優(yōu)化自己搜索能力的時(shí)機(jī)，快速推出市場認(rèn)可的產(chǎn)品。Twitter 的搜索經(jīng)驗(yàn)在未來也能幫助其他公司的數(shù)據(jù)庫優(yōu)化其搜索能力。

今年 5 月，Perplexity 又大幅迭代了產(chǎn)品，問答引擎中的 Agent 實(shí)踐：推出基于 GPT-4 理解和規(guī)劃能力的 Copilot。在這款產(chǎn)品中，輸入的問題中缺失的細(xì)節(jié)會由 Copilot 給出一些選項(xiàng)和輸入框，使其能夠讓用戶更精準(zhǔn)地傳達(dá)自己的需求。這一能力在輸入復(fù)雜問題的時(shí)候，能給到更可控且準(zhǔn)確的回答。當(dāng)前的 copilot, 雖然只是一個(gè)界定了能力邊界問答引擎助手，但卻可能在嘗試定義和探索未來基于 LLM 能力的 AI agent UI 形態(tài)。

與這一產(chǎn)品發(fā)布的還有 AI profile 和 Perplexity Pro 方案，前者是用戶自己的背景和偏好介紹，在使用 Copilot 的時(shí)候能體驗(yàn)到一定的個(gè)性化內(nèi)容；而后者是一個(gè)月 20 美元無限使用 Copilot 的額度。

根據(jù) Lilian Weng 最新博客中的定義，Agent = Planning + Memory + Action with tools。Copilot 本身是 planning 的體現(xiàn)，AI profile 是 memory 的形式，而 Actions with tools 是當(dāng)前 Perplexity 當(dāng)前相對缺失的，也是最可能在之后和 Google 的競爭中落下風(fēng)的：Google Workspace 中可以給 Bard 使用的工作和地圖工具很多。

除了上文中這些重要迭代，Perplexity 產(chǎn)品還經(jīng)歷了一系列小迭代：

Perplexity 推出產(chǎn)品已經(jīng) 7 個(gè)月了，開發(fā)和迭代速度很快，對 LLM 的想法也非常的應(yīng)用思維：用好模型是第一位的，盡管他們有了自己的模型也不做任何宣傳，因?yàn)檎J(rèn)識到模型能力很難和 GPT-4 level 直接競爭。他們對搜索也有著很深的執(zhí)念，目前 Ask、Bird SQL、Copilot 都圍繞著核心命題：如何用 LLM 優(yōu)化搜索的體驗(yàn)。

產(chǎn)品評價(jià)與反饋

Quantative Analysis

搜索引擎有一套嚴(yán)謹(jǐn)?shù)闹笜?biāo)體系，如 Precision@10（前十個(gè)結(jié)果是否解決用戶的問題）、CTR（點(diǎn)擊數(shù)/展示數(shù)），但這些指標(biāo)對單個(gè)生成式的結(jié)果并不合適。Percy Liang 團(tuán)隊(duì)今年 4 月的一篇論文 Evaluating Verifiability in Generative Search Engines 中提出了一套對于生成式搜索引擎，也就是回答引擎的評價(jià)標(biāo)準(zhǔn)：

1. 體感效果：

文本流暢度

內(nèi)容有用性

2. 引用能力：

Recall（引用是否完整）

Precision（引用是否準(zhǔn)確）

經(jīng)過他們對每個(gè)問答引擎 1450 道題的提問，評分如下：

根據(jù)這一套評價(jià)體系，各回答引擎的生成體感效果總體都不錯(cuò)，其中 Youchat 的體感是最好的，Perplexity AI 排名第二，Bing Chat 墊底。

而到了引用能力部分，總體的表現(xiàn)就差了些。尤其是第一part表現(xiàn)良好的 Youchat 就出現(xiàn)了嚴(yán)重的可用性問題，大部分內(nèi)容都沒有得到文本支持。Perplexity 是在準(zhǔn)召率上做得最平衡全面的，而 Bing Chat 盡管引用準(zhǔn)確，但也和 Youchat 類似召回率偏低。和體感評分相比，這一項(xiàng)各產(chǎn)品的評分都不算高，Perplexity 是當(dāng)前相對最好的。

因此，將以上評估指標(biāo)投射到坐標(biāo)軸上，可以看到在量化評估中 Perplexity AI 收到的評價(jià)是最好、最全面的。（注意，評測時(shí) Perplexity 用的是免費(fèi)版本不用 GPT-4 的，而 Bing 的是已經(jīng)用上了 GPT-4 的版本，可見 Bing Chat 的表現(xiàn)不如人意）：

Qualitative Analysis

Perplexity

Perplexity 作為回答引擎有兩個(gè)重要的產(chǎn)品特點(diǎn)：

1. 很強(qiáng)的知識產(chǎn)品屬性，閱讀和分享體驗(yàn)與 Google 相比，接近 Wikipedia 和 Quora：

顯示文本引用來源：每次生成的回答中會有 3-5 個(gè)鏈接，來佐證其生成內(nèi)容的準(zhǔn)確性。閱讀體驗(yàn)非常類似學(xué)術(shù)文獻(xiàn)閱讀，且來源可以控制：如果不喜歡華盛頓郵報(bào)的內(nèi)容，就可以將其從 source 中刪除，重新生成。

有完善的查詢歷史和內(nèi)容分享：每次對話會生成一個(gè)鏈接 permalink，成為與其他用戶分享的知識百科頁，自己過去查詢的歷史也會完全記錄下來。（詳見reference）

其他的產(chǎn)品更多的是將查詢內(nèi)容當(dāng)作聊天記錄隨用隨拋，而 Perplexity 則將其作為維基百科，可見其對自己生成內(nèi)容是更有信心的。

焦點(diǎn)搜索功能：在搜索框下方，有個(gè)下拉菜單，其中包含多個(gè)領(lǐng)域，例如YouTube、新聞、Reddit、學(xué)術(shù)等（學(xué)術(shù)專區(qū)增加了 SemanticScholar、Arxiv 和 NIH 等資源）。這個(gè)能力可以使搜索效果更為聚焦，用戶調(diào)研中常見使用于學(xué)術(shù)研究和創(chuàng)意寫作相關(guān)。

2. 將 LLM 和搜索結(jié)合得很好，盡可能減少了 Hallucination：

生成內(nèi)容簡潔且可靠：在與多問題引擎對比的時(shí)候，Perplexity 是最能用有限的字?jǐn)?shù)準(zhǔn)確回答問題的產(chǎn)品。Bing Chat 有時(shí)回答過于簡短需要反復(fù)追問，Google Bard 有時(shí)回答太過冗長，需要從中提煉出關(guān)鍵信息。結(jié)合有用戶反饋 Perplexity 生成的內(nèi)容有大約 650 字的字?jǐn)?shù)限制，能夠精煉地提供言之有物的回答，是問答引擎這個(gè)場景的重要標(biāo)準(zhǔn)。

理解問題并拆解、主動反問的能力：在 Copilot 產(chǎn)品中，AI 能夠根據(jù)問題理解，并且深入問題的細(xì)節(jié)反問得到更多信息，再去進(jìn)行搜索。這里是靈活使用 GPT-4 的規(guī)劃和理解能力，通過 prompt engineering 去引導(dǎo)其提問和反問，使生成的內(nèi)容質(zhì)量更高，可控性更強(qiáng)。

多輪對話：在同一次搜索中可以不斷追問，得到更接近自己想要的內(nèi)容，在產(chǎn)品形態(tài)上兼具了 Chat 和 Search 的優(yōu)點(diǎn)。實(shí)際使用時(shí)，偶爾會有多輪記憶和理解上的遺忘現(xiàn)象。

基本沒有Hallucination：有主動表示搜索結(jié)果中沒有符合問題答案的能力。

多語言能力不錯(cuò)，生成速度快：Google Bard 目前只支持英語，Bing Chat 在瀏覽那一步的速度較慢。

Comparison with Bard and Bing

03.

技術(shù)：定位應(yīng)用層，使用技術(shù)巨頭的 api 開發(fā)產(chǎn)品

技術(shù)對比：傳統(tǒng)搜索引擎技術(shù)棧

Google/Bing 搜索引擎的大致技術(shù)模塊包括以下幾個(gè)模塊：

1. 內(nèi)容收集和整理：

這一層負(fù)責(zé)抓取網(wǎng)絡(luò)、下載網(wǎng)頁并解析它們以提取內(nèi)容。它還包括一些過濾和優(yōu)化內(nèi)容的過程，如刪除重復(fù)頁面、檢測垃圾郵件和按主題分類頁面。

抓�。�谷歌的抓取器，也稱為Googlebot，負(fù)責(zé)訪問網(wǎng)站并下載頁面。它們使用各種技術(shù)來避免使網(wǎng)站過載，例如限制每秒訪問的頁面數(shù)量和遵循robots.txt文件。

解析：頁面下載后，會對它們進(jìn)行解析以提取內(nèi)容。這包括頁面上的文本、圖像和其他媒體。解析器還識別頁面的標(biāo)題、關(guān)鍵字和其他元數(shù)據(jù)。

過濾和整理：從頁面中提取的內(nèi)容接著進(jìn)行過濾和整理。這包括刪除重復(fù)頁面、檢測垃圾郵件和按主題分類頁面。

2. 搜索核心：

這一層負(fù)責(zé)對內(nèi)容進(jìn)行索引并創(chuàng)建搜索索引。它還包括一些用于在搜索結(jié)果中對頁面進(jìn)行排序的算法，如PageRank，它根據(jù)頁面與其他頁面的鏈接關(guān)系衡量頁面的重要性。

索引：經(jīng)過過濾和整理的內(nèi)容隨后被索引。這涉及到創(chuàng)建一個(gè)包含頁面及其內(nèi)容、元數(shù)據(jù)和排名信息的數(shù)據(jù)庫。

排序：索引中的頁面使用各種算法進(jìn)行排名。這些算法考慮到頁面的內(nèi)容、指向頁面的鏈接等因素。

3. 用戶和應(yīng)用程序接口：

這一層負(fù)責(zé)與用戶交互并向他們提供搜索結(jié)果。它包括谷歌搜索網(wǎng)站以及允許其他應(yīng)用程序訪問搜索結(jié)果的API。

谷歌搜索網(wǎng)站：谷歌搜索網(wǎng)站是谷歌搜索引擎最著名的用戶界面。它允許用戶輸入搜索查詢并查看搜索結(jié)果。

API：谷歌還提供了一些 API，允許其他應(yīng)用程序訪問搜索結(jié)果。這使得開發(fā)人員可以創(chuàng)建與谷歌搜索引擎集成的自定義搜索應(yīng)用程序。

這些技術(shù)模塊共同構(gòu)成了 Google/Bing 搜索引擎的基本架構(gòu)，而 Perplexity 的搜索能力是建立在這些巨頭的能力之上的。

而 Perplexity 的技術(shù)棧則直接基于 Google/Bing 的技術(shù)來繞過了需要長時(shí)間積累和工程復(fù)雜度的爬蟲、數(shù)據(jù)庫系統(tǒng)。其流程可以分為以下幾個(gè)部分：

1. Google/Bing 搜索返回：

從他們的查詢引擎 api 返回與用戶 query 有關(guān)的網(wǎng)頁內(nèi)容。

2. 索引系統(tǒng)：

將內(nèi)容向量化進(jìn)行細(xì)粒度的處理和組織，目標(biāo)有二，其一是方便排序時(shí)能理解和定位到網(wǎng)頁中與用戶問題最相關(guān)的內(nèi)容，其二是可以將 api 返回的內(nèi)容存儲以用作之后復(fù)用。

3. 排序系統(tǒng)：

以語義搜索的方式 retrieve 最相關(guān)的內(nèi)容，交給 LLM 作為 input 進(jìn)行學(xué)習(xí)。

4. 問答系統(tǒng)與 LLM 調(diào)用：

LLM 根據(jù)召回的內(nèi)容進(jìn)行學(xué)習(xí)，輸出對用戶 query 的解答，并在其中對引用內(nèi)容進(jìn)行標(biāo)注。學(xué)習(xí)過程中根據(jù)用戶選擇和系統(tǒng)判斷決定使用自研模型還是 OpenAI 的模型。

成本測算：長期需要自研 search stack 以降低成本

使用大公司的 api 使他們能專注于優(yōu)化產(chǎn)品，但也會拉高成本。他們意識到這點(diǎn)，回到了 ML Researcher 的老本行開發(fā)了 7B 的自研模型，成功將 query 中 LLM 生成成本降低到了相對低的水平。

但與此同時(shí)，和 Twitter 關(guān)掉自己的數(shù)據(jù)庫一樣，Google/Bing 也察覺到了搜索引擎 startup 的動向，將其 search api 的價(jià)格抬高了 10 倍左右，對 Perplexity 等不自建 search stack 的公司造成了壓力。以 Bing Search API 為例：

漲價(jià)后，單次 Bing Search 的成本在 0.015 美元，而 LLM 交互成本（如果自研模型成本能達(dá)到 GPT-3.5 一半的話）也就在 0.02 美元左右。因此接下來如果要將產(chǎn)品可持續(xù)地?cái)U(kuò)大使用量，search stack 的自研會使成本降低 30% 左右。按當(dāng)前的假設(shè)估算，Perplexity 維持當(dāng)前的搜索量和技術(shù)棧，一年需要的成本在 1000萬美元以上。技術(shù)非自研會對其未來的 runway 有比較大的影響。

04.

團(tuán)隊(duì)與商業(yè)化發(fā)展

團(tuán)隊(duì)：創(chuàng)始科學(xué)家比例高，

LLM/search/ranking 經(jīng)驗(yàn)豐富

Perplexity 團(tuán)隊(duì)目前有 18 人，其中一半以上是 Engineering Team 的。團(tuán)隊(duì)優(yōu)點(diǎn)明顯：創(chuàng)始團(tuán)隊(duì)對 LLM 有很深入的理解，工程團(tuán)隊(duì)對 Ranking /問答系統(tǒng)有很豐富的經(jīng)驗(yàn)。大部分之前都在獨(dú)角獸或大廠工作，有 3 位成員之前在 Quora 工作過。接下來重點(diǎn)介紹幾位團(tuán)隊(duì)中的重要成員。

CEO Aravind Srinivas 來自印度，博士期間才移民來到美國。Aravind 是 UCB 的 CS Phd，主攻方向是在計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)中融入 Transformer 模型。Phd 期間，他先后分別在 OpenAI、DeepMind 和 Google 做 Research Intern。畢業(yè)后，他加入 OpenAI 工作了一年，研究語言模型和擴(kuò)散模型。22 年 8 月，離開 OpenAI 創(chuàng)立 Perplexity。

和他一起創(chuàng)業(yè)的是 CTO Denis，有很強(qiáng)的搜索和工程背景。11-13 年期間，他是 Bing 團(tuán)隊(duì)的工程師，之后來到 Quora 成為排序算法的 Tech Lead。16 年從 Quora 離開后加入 Facebook FAIR，同樣開始做計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)相關(guān)的研究，18 年開始在紐約大學(xué)做 AI Phd。

Aravind 在訪談中夸過 Denis 很會招聘，團(tuán)隊(duì)第三人就是 Denis 招來的：CSO Johnny Ho。他是哈佛大學(xué)數(shù)學(xué)/CS 雙學(xué)位，畢業(yè)后在 Quora 待過一年，當(dāng)時(shí)在 Denis 的 team 工作。離開 Quora 之后，他成為了職業(yè)編程競賽選手、量化交易員。用 Aravind 的話說，Johnny 是 Perplexity 運(yùn)轉(zhuǎn)迭代速度高效的重要原因。在官方的 Discord 和 Reddit 中，Johnny 是主要的運(yùn)營和收集用戶反饋的那位，在團(tuán)隊(duì)中是復(fù)合型的多面手。

Andy 是 Databricks 的 Co-founder，CS Phd 出身的他在 Databricks 承擔(dān)了很多創(chuàng)業(yè)公司運(yùn)營相關(guān)的工作，先后做過 VP of professional services 和 VP of Product。在 Perplexity 早期，Andy 作為 President 以其連續(xù)創(chuàng)業(yè)的經(jīng)驗(yàn)幫助公司少走了很多彎路。

Henry Modisett 是 Perplexity 的 Founding Designer。在加入 Perplexity 前，他在 Quora 待了 8 年，從產(chǎn)品早期的年輕設(shè)計(jì)師一直成長為產(chǎn)品的 design lead & manager。Quora 的 feed 流、問答和 Google 郵箱 iOS 產(chǎn)品設(shè)計(jì)都有他的參與。他在今年 2 月加入，那之后的產(chǎn)品迭代 feature 設(shè)計(jì)可能與他緊密相關(guān)，比如 4 月的網(wǎng)頁設(shè)計(jì)風(fēng)格改版和 6 月的 Copilot。

融資歷史：天使投資陣容豪華

值得一提的是，團(tuán)隊(duì)的天使投資人陣容極其豪華，基本全是海外 AI/ML 的核心人物：

商業(yè)化進(jìn)展：

早期核心用戶穩(wěn)定，尚需跨越鴻溝

在今年初創(chuàng)始人 Aravind 接受采訪的時(shí)候提到，Subscription 對問答引擎不是一個(gè)好的商業(yè)模式，Google 才是 role model。6 月，GPT-4 的接入和 Copilot 功能發(fā)布后，高額的 api 成本使 Perplexity 開始推出會員制產(chǎn)品：付費(fèi)會員所有 query 回答都以 GPT-4 進(jìn)行回答和生成，每天有 300+ 次 Copilot 使用額度。

對于 20 美元一個(gè)月的產(chǎn)品而言，用戶的評價(jià)相對兩極分化。有一部分用戶認(rèn)為其價(jià)格與 ChatGPT/Poe 持平是比較貴的，因?yàn)槠涮峁┑木褪且粋€(gè)更可靠的 ChatGPT + Browsing 能力，而 ChatGPT 還有其他更豐富的 plugin offering，Poe 有 Claude 等其他 LLM 的接入。

Pro 方案推出三天后就有了 1000+ 付費(fèi)用戶。用戶評價(jià)以大多是好評，認(rèn)為 Pro 產(chǎn)品并不是單純換了個(gè)模型 api，而是做了更用心的優(yōu)化，使用 GPT-4 之后的查詢體驗(yàn)更好，Hallucination、Latency 等效果好于 ChatGPT。商業(yè)化收入的快速成長，代表 Perplexity 已經(jīng)有了穩(wěn)定的核心商業(yè)化客戶。

此外，團(tuán)隊(duì)還有其他的商業(yè)化想法：

1. 提供問答引擎 api：成熟需求，上千開發(fā)者來詢問過。

2. 專業(yè)版?zhèn)€性化 Indexing：

To C：個(gè)性化體驗(yàn)（用戶自己的鏈接、書簽）；

To B：工作流工具，Index 工作中的合作儀表盤等。

3. 廣告：如何用 Gen AI 做營銷是當(dāng)前最有趣的 Open Question。

未來發(fā)展分析

Upside:

顛覆搜索引擎市場，

爭奪 Google 的市場份額

搜索引擎是一個(gè)巨大的壟斷市常在過去的五年中，Google 都保持著 90% 以上的市場占有率。在榜單上的公司都已經(jīng)有 10 年以上的歷史。一方面，這讓他們積累了非常深的系統(tǒng) Infra 優(yōu)勢，讓后來者很難超越；但另一方面，這也使這些公司有著很深的 Legacy Problem，很難讓產(chǎn)品徹底的轉(zhuǎn)型。

Data Summarized by Perplexity

同時(shí)，搜索引擎市場也非常大：2022年谷歌搜索的收入是 $283B，Bing 的收入是 $11.5B。即使是市占率 5% 以下的玩家仍然收入不錯(cuò)。

但要侵蝕一部分 Google 的搜索市場占比，最大的挑戰(zhàn)會是商業(yè)模型。Google 商業(yè)模型除了給用戶提供高質(zhì)量的搜索引擎外，還有兩個(gè)非常重要的輪子。其一是廣告主營銷，只有實(shí)現(xiàn)了滿足廣告主的商業(yè)化系統(tǒng)，才能有良好的現(xiàn)金流使用戶免費(fèi)地用上高質(zhì)量的搜索系統(tǒng)；第二是創(chuàng)作者激勵(lì)，內(nèi)容發(fā)布者能夠通過在互聯(lián)網(wǎng)上發(fā)布高質(zhì)量內(nèi)容，得到平臺和廣告主的激勵(lì)，是其源源不斷發(fā)布內(nèi)容的動力。盡管 AI 看似減少了創(chuàng)作端需求，但還是需要用戶去創(chuàng)作高質(zhì)量的內(nèi)容交給 AI 來學(xué)習(xí)和召回。

除了商業(yè)化上的難點(diǎn)之外，還有產(chǎn)品形態(tài)上的難點(diǎn)。廣告模型下的搜索引擎，天然是有良好的數(shù)據(jù)飛輪的：用戶的瀏覽和點(diǎn)擊行為，反應(yīng)了用戶的偏好，同時(shí)反饋到排序系統(tǒng)和廣告競價(jià)系統(tǒng)，使搜索引擎的效果更佳。

這樣的數(shù)據(jù)飛輪在當(dāng)下的問答引擎中還未出現(xiàn)：Chat 的形式并不方便用戶直接去做偏好反饋，用戶也不會有額外的時(shí)間去專門為答案做編輯或修改，Like/Dislike 類標(biāo)簽的比例也只有 10% 用戶給出。問答引擎需要一個(gè)好的產(chǎn)品形態(tài)，來讓用戶使用的同時(shí)自然地給反饋，才能讓產(chǎn)品在 Google 面前有競爭力。

當(dāng)商業(yè)模式和產(chǎn)品數(shù)據(jù)飛輪的問題都能有原創(chuàng)的新解法，且不容易被復(fù)制時(shí)，相信 Perplexity 有潛力成為一家撼動巨頭的公司。

Neutral:

Gen AI 時(shí)代的 Quora/Wikipedia

撼動 Google 的市場可能暫時(shí)是一個(gè)好高騖遠(yuǎn)的目標(biāo)，而成為新時(shí)代的 Quora/Wikipedia 這樣的知識平臺是完全有可能的。

在互聯(lián)網(wǎng)時(shí)代，這兩家公司都以優(yōu)秀的知識產(chǎn)品出名，但是苦于沒有好的商業(yè)化能力，沒法持續(xù)的激勵(lì)創(chuàng)作者留在平臺上，流量價(jià)值進(jìn)一步減少形成了負(fù)反饋循環(huán)。而 Gen AI 的出現(xiàn)正減少了內(nèi)容供給上的壓力，AI 替代大部分人類創(chuàng)作者組織和整理知識成為可能。從 Perplexity 當(dāng)前的產(chǎn)品形態(tài)上，有很多知識產(chǎn)品的理念，核心用戶群也常常使用其做知識研究類工作。

Downside:

獨(dú)到的收購價(jià)值，Tech Giants 可能都需要 LLM + Retrieval 能力

Perplexity 團(tuán)隊(duì)是很獨(dú)樹一幟和清醒的：他們把用戶的信任而不是技術(shù)棧作為自己的 moat。盡管從表面上來看，Perplexity 用的是 Bing Search 和 OpenAI 的 api，但技術(shù)棧類似的 Bing Chat 比 Perplexity 使用體驗(yàn)糟糕很多�？梢娖渲杏泻芏� Indexing、Prompting 等相關(guān)的技術(shù)和設(shè)計(jì)是比較復(fù)雜有技巧的，要做到嚴(yán)肅場景下的使用是一件很有門檻的事情。

最近巨頭開始了一波收購潮，Snow 收購了 Neeva（之前Perplexity 的競爭對手，由于其完整的 search stack，被收購后專心做 enterprise search），Databricks 收購了 MosaicML，都還在技術(shù)棧查缺補(bǔ)漏的階段。但經(jīng)過這一階段的探索，大家都會發(fā)現(xiàn)只有好的 LLM 是很難在商業(yè)環(huán)境下有好的使用效果的，LLM + Retrieval 是必要的解決方案。這時(shí)，Perplexity 這樣一個(gè)深入理解 LLM 和 Retrieval 技術(shù)與應(yīng)用、在一個(gè)紅海賽道階段性領(lǐng)先巨頭的團(tuán)隊(duì)是否會有著更高的收購價(jià)值呢？

Reference

https://www.perplexity.ai/search/4f22f1bd-e957-4a50-bc9e-591f16f42464?s=c。