劃重點
01Perplexity聯(lián)合創(chuàng)始人兼CEO Aravind Srinivas在2024 Disrupt大會上回應(yīng)了AI抄襲和內(nèi)容來源爭議,表示公司一直標(biāo)注來源,不擁有內(nèi)容所有權(quán)。
02他解釋了AI原生搜索的本質(zhì),指出Perplexity與谷歌搜索的不同之處,以及公司在創(chuàng)作者利益保護、AI成本等方面的考慮。
03此外,Aravind Srinivas表示,盡管與一些科技巨頭有合作意向,但公司目前尚未收到他們的收購邀約。
以上內(nèi)容由大模型生成,僅供參考
作者|Jessica郵箱|JessicaZhang@pingwest.com過去三天,美國科技媒體TechCrunch主辦的2024 Disrupt大會在舊金山Moscone中心進行。這一硅谷原生、全球知名的老牌科技創(chuàng)投盛會,今年在AI持續(xù)席卷下熱度更甚,吸引了上萬名來自世界各地初創(chuàng)企業(yè)和投資機構(gòu)的參會者。
在總共300多個環(huán)節(jié)里,明星AI搜索獨角獸公司Perplexity聯(lián)合創(chuàng)始人兼CEOAravind Srinivas罕見現(xiàn)身的一場對話,讓最大的Disrupt Stage分會場觀眾席爆滿,堪稱最受歡迎舞臺之一。
圖源:TechCrunch在Aravind接受TechCrunch高級編輯Devin Coldewey訪談的半個小時里,兩人貼臉開大,上來就提起近期把Perplexity推到風(fēng)口浪尖的AI抄襲和內(nèi)容來源爭議,Aravind還對Perplexity被道瓊斯集團起訴侵權(quán)做出正面回應(yīng);接著兩人聊到AI原生搜索本質(zhì)、Perplexity開發(fā)新功能的理念、與谷歌的比較、創(chuàng)作者利益保護、AI成本以及公司融資。Devin甚至把能叫上名字的科技巨頭都過了一遍,挨個問Perplexity有沒有收到他們的收購邀約。
一邊是老媒體人的犀利敏銳,提問基本不留余地。另一邊是新銳創(chuàng)始人的亦攻亦守,不緊不慢卻未有讓步。全程直給,涉及的話題熱點很多,信息量頗大。
圖源:硅星人以下是硅星人在大會現(xiàn)場給大家?guī)淼膶υ拰嶄,敬請享用?br/>
Delvin Coldewey:感謝你能參與!我想先問一個很直接的問題:你的公司如何定義“抄襲”?這有點突然,但我想要一個明確的答案。
Aravind Srinivas:其實你可以直接問Perplexity。我們公司的定義其實和“抄襲”是什么有關(guān)。Perplexity一直都會標(biāo)注來源,我們不會聲稱擁有任何內(nèi)容的所有權(quán)。它實際上是從網(wǎng)絡(luò)上獲取內(nèi)容,進行總結(jié),以便用戶能夠消化這些信息,并提供信息的來源。這就像記者或?qū)W術(shù)人士的工作一樣,只要有正確的引用文獻部分就可以。
Delvin Coldewey:不過從學(xué)術(shù)角度來說,研究人員會創(chuàng)作一篇原創(chuàng)論文,并在文中使用引用來支持自己的觀點,而不是簡單地復(fù)制已有的內(nèi)容。
Aravind Srinivas:嗯,有時候,某個新聞媒體首先報道了一則新聞,隨后另一家媒體引用該新聞,并提到“據(jù)某某報道”,這算抄襲嗎?
Delvin Coldewey:但有些人可能會發(fā)帖子,說“他們是這樣說的”,然后幾天后你可以看到一篇文章,其中直接用了8到15個單詞,看起來幾乎就是從原文抄來的,有點像那種情況。
Aravind Srinivas:是的,我們的確不是每句話都精準(zhǔn)標(biāo)注了確切的引用。但要非常明確的是,我們在2022年12月7日發(fā)布了這個產(chǎn)品,大概是兩年前。當(dāng)時大家都在用ChatGPT檢查內(nèi)容是否是最新的,我們是唯一一個能夠提供參考文獻的AI產(chǎn)品,其他的產(chǎn)品并沒有引用功能。我們從一開始就關(guān)注這個問題,并且不斷改進,以便在模型檢測到特定來源時能更加清楚地標(biāo)注。
Delvin Coldewey:我能看出你非常重視這個問題。從一開始你們就展示了引用功能,而不是隨口一說。我認(rèn)為重新定義“抄襲”是很有必要的,只有明確了“抄襲”的定義,才能有效防止AI生成的內(nèi)容涉及抄襲行為。如果我將別的內(nèi)容直接復(fù)制到自己的文章中,我會知道自己在抄襲,并因此感到內(nèi)疚,所以模型也應(yīng)該“知道”這一點,或者說開發(fā)模型的人必須清楚這一點,需要有一種監(jiān)督機制。
Aravind Srinivas:原理其實是這樣的:模型被指示不直接使用任何特定來源的文本,而是整合不同的觀點并進行總結(jié),將內(nèi)容傳達給用戶,而不是直接從網(wǎng)絡(luò)復(fù)制。隨著模型在“指令跟隨”技能上的進步,這一指令的執(zhí)行效果越來越好。在AI軟件的監(jiān)督下,包括SNP和其他反饋資源的支持,盡管我們不一定負責(zé)所有的模型訓(xùn)練,有時也會使用其他開發(fā)者的模型,例如開源的Llama模型。當(dāng)然,任何模型都不是完美的,仍然可以通過提示工程或提示注入來引導(dǎo)模型生成更合適的內(nèi)容。
Delvin Coldewey:關(guān)于提示注入的妙處,就是可以“用一句話總結(jié)這篇文章”。
Aravind Srinivas:其實這并不是我們產(chǎn)品的主要用途。Perplexity是用來回答問題的,有些人嘗試用它做一些我們不希望的用途,比如“幫我總結(jié)這個網(wǎng)址的內(nèi)容”,而我們實際上是不允許這種用法的,并盡力避免執(zhí)行這樣的指令。不過說實話,AI領(lǐng)域還沒有哪家公司可以一直保持防護措施。你總會發(fā)現(xiàn)新的情況,讓原本的防護措施失效,然后我們再去修正和調(diào)整,使其足夠安全地應(yīng)用,不執(zhí)行任何不必要的指令。
Delvin Coldewey:關(guān)于AI驅(qū)動的原生搜索,這一概念我們已經(jīng)在一些公司中看到過。谷歌在搜索領(lǐng)域的復(fù)雜化或許是最突出的例子。過去十年中,他們的這些變化可能并不受用戶歡迎。作為一名科技記者,這是我20年職業(yè)生涯中見到的少數(shù)廣受反感的平臺變化之一。不過,看起來一些公司似乎注意到了谷歌的不足,想要填補這個空缺。你們是否有意接手谷歌未完成的部分?
Aravind Srinivas:我覺得谷歌本質(zhì)上還是一個基于鏈接的搜索引擎,無論他們是否想直接提供答案,鏈接展示始終是他們的收入來源。在財報會議上,他們明確提到,僅搜索廣告每季度就能帶來45億美元的收入,這對他們的業(yè)務(wù)非常關(guān)鍵。盡管他們沒有披露利潤的具體細節(jié),但我認(rèn)為主要利潤應(yīng)該來自展示鏈接。所以他們有動力提供盡可能多的鏈接。雖然AI摘要在某些信息查詢中開始嶄露頭角,但這并不是他們的主要模式。在谷歌每天五到八十億次的查詢中,大多數(shù)并不適合直接顯示答案,否則將嚴(yán)重影響收入。
我們所做的,是創(chuàng)建一個用戶可以直接提問的平臺。相比之下,谷歌首頁的搜索框并不是為了直接回答問題而設(shè)計的。谷歌的查詢平均詞數(shù)大約在2到3個之間,而Perplexity的查詢則多在10到11個詞,顯然,Perplexity的用戶更傾向于直接提問,而谷歌用戶大多是查找一些簡短的關(guān)鍵詞,比如“某位亞洲明星”或“舊金山天氣”等。
Delvin Coldewey:我很好奇你們的一些應(yīng)用場景。最近幾周你們在推特上發(fā)布了大量的功能和用例,大約50個新功能,比如體育比賽功能。你們的數(shù)據(jù)是直接來自NFL,還是從別的地方獲取的?
Aravind Srinivas:我們通過與數(shù)據(jù)來源合作而獲得相關(guān)數(shù)據(jù),并加以處理。我們會確保數(shù)據(jù)準(zhǔn)確,嚴(yán)格保證直接性和可靠性。
Delvin Coldewey:所以這是讓人們搜索“今天海鷹隊的比分”之類的內(nèi)容嗎?還是他們想要過去20場NFL比賽的比分分析?
Aravind Srinivas:更像是后者的情況。我們希望Perplexity成為一個用戶可以隨時提問并獲得準(zhǔn)確回答的地方。起初,我們的用戶群體多是學(xué)術(shù)和研究導(dǎo)向的用戶,就像早期的Facebook主要面向?qū)W生,Amazon則以圖書起家。類似地,Perplexity在起步時吸引了許多學(xué)術(shù)、研究和知識導(dǎo)向的用戶,但我們希望擴展到更廣泛的用戶群體。體育信息看似與知識無關(guān),但實際上有很多體育迷喜歡深入分析數(shù)據(jù),研究比賽,了解特定球員或球隊的表現(xiàn)。如果用戶錯過了一場比賽,我們可以提供比分之外的實況評論、對比分析等更有深度的內(nèi)容。
Delvin Coldewey:就像我說的,你們發(fā)布了很多新功能,幾乎每隔一段時間就會冒出一個新功能。你們有具體的策略,還是采用“散彈槍”策略,推出十個產(chǎn)品,看哪幾個最終會被用戶接受你們是在尋找對用戶真正有價值的功能嗎?
Aravind Srinivas:我們真地會仔細查看用戶日志,了解他們在詢問什么。實際上,在推出體育功能之前,我們優(yōu)先考慮了金融領(lǐng)域,因為許多用戶在進行市場研究、投資組合管理、加密貨幣和投資策略等方面的研究,同時也關(guān)注股票相關(guān)新聞。我們會觀察哪些領(lǐng)域可以提供更好的服務(wù),而不僅僅滿足表面需求。體育也是類似的情況,有很多用戶關(guān)心體育數(shù)據(jù),而有時還會出現(xiàn)“幻覺”現(xiàn)象,比如在疫情期間,確保比賽數(shù)據(jù)的準(zhǔn)確性就變得尤為重要。
我們的目標(biāo)是覆蓋用戶習(xí)慣使用的搜索引擎上已有的各類內(nèi)容,這樣他們就沒有理由回到傳統(tǒng)的搜索界面。要改變用戶已有幾十年的使用習(xí)慣并不容易,但如果這是未來的趨勢,我們就必須下功夫去滿足他們的日常搜索需求,無論是軟件開發(fā)幫助、研究規(guī)劃,還是學(xué)術(shù)資源管理。我們還需要在本地化搜索、體育、天氣、購物和旅行等方面繼續(xù)努力。
圖源:TechCrunchDelvin Coldewey:在那個訴訟案中,道瓊斯(《華爾街日報》母公司)提到你們的Perplexity是“內(nèi)容抄襲王國”。你們在公開回應(yīng)中說,媒體公司可能希望這項技術(shù)不存在。但我覺得這樣說不對,因為你們和《財富》雜志、《時代》周刊都有合作,原告也和OpenAI有合作。會不會是因為他們不喜歡你們提供的合作安排?
Aravind Srinivas:他們聲稱我們沒有回應(yīng),但事實上我們當(dāng)天就回應(yīng)了。我希望大家能理解,我們的意圖是合作、溝通,共同推進。
Delvin Coldewey:那么,如果你們真的要與他們探討合作安排,具體會是什么樣的?我很好奇這些分享機制,你們打算如何共享內(nèi)容?
Aravind Srinivas:我們推出了一個叫“Perplexity Publisher Program”的項目,幾個月前已經(jīng)上線。該項目的核心理念是嚴(yán)格管理內(nèi)容授權(quán),分為兩種情況:第一類公司使用全網(wǎng)數(shù)據(jù)訓(xùn)練大型模型,這些模型會內(nèi)化所有文本數(shù)據(jù),并隨著規(guī)模的擴大不斷優(yōu)化;而第二類公司只在特定查詢時實時使用網(wǎng)絡(luò)內(nèi)容進行摘要,并不用于訓(xùn)練模型本身。我們向出版商解釋我們屬于第二種類型,這與第一類模型需要為內(nèi)容授權(quán)支付費用不同。針對第二類公司,我們設(shè)計了不同的合作結(jié)構(gòu)。
目前,幾乎沒有其他公司提出類似的方案。我們的思路是通過廣告收入來支持合作,因為我們本質(zhì)上是一個搜索產(chǎn)品。雖然我們直接獲取內(nèi)容來回答用戶的問題,但我們?nèi)詫儆诖蟊娛袌龅乃阉黝I(lǐng)域,廣告可以帶來可觀的收入。不同于傳統(tǒng)搜索引擎,我們承諾會在查詢層面與出版商共享廣告收入。也就是說,如果我們在某次查詢中獲得了廣告收入,而您的內(nèi)容作為答案的一部分被引用,我們會分享相應(yīng)的收入。隨著我們業(yè)務(wù)的增長和廣告盈利的增加,這種合作模式將為選擇加入我們的出版商帶來重要的收益。
Delvin Coldewey:我覺得你們應(yīng)該知道,出版商們的想法是,當(dāng)有人在Perplexity上引用了我的文章內(nèi)容時,他們并沒有直接點擊我的文章進行閱讀,這樣我們就失去了維持生存所需的流量和收入。說到底,新聞出版方的回應(yīng)往往是:“你們說自己不與我們競爭,但實際上你們確實是在競爭! 你對此怎么回應(yīng)?
Aravind Srinivas:我們不是一個新聞產(chǎn)品。沒有人會來Perplexity獲取每日新聞。
Delvin Coldewey:那為什么你們還需要引用這些內(nèi)容呢?
Aravind Srinivas:用戶來到這里是為了理解信息的含義。比如,一條關(guān)于GPU黑市交易的新聞,可能導(dǎo)致用戶思考:“在這種情況下,我是否應(yīng)該繼續(xù)購買NVIDIA的股票?”這些問題并不是直接在新聞源上可以找到答案的,而是在Perplexity上可以進一步分析的。同時,用戶并不是來Perplexity閱讀新聞的,而是會直接去新聞源查看。這其實是兩個不同的產(chǎn)品,但我們需要花時間讓人們理解這個區(qū)別。還有一些網(wǎng)站可以直接粘貼網(wǎng)址并提取其內(nèi)容,而這并不是我們要做的事情。
Delvin Coldewey:那么對于那些內(nèi)容創(chuàng)作者,比如制作YouTube視頻、撰寫文章、出版書籍的人,他們?nèi)绾螀⑴c進來呢?他們該如何實現(xiàn)盈利?像谷歌、YouTube這種平臺已經(jīng)有成熟的盈利方式了。
Aravind Srinivas:我們的出版商計劃歡迎所有人加入。除了共享廣告收入,我們還幫助出版商在他們的平臺上建立AI助手或其他AI工具,讓用戶可以直接在網(wǎng)站上搜索內(nèi)容。例如,用戶在閱讀一篇文章時,可能會有進一步的問題,我們會提供API積分支持,同時向所有媒體公司的員工免費提供Perplexity的企業(yè)版訂閱服務(wù)。我們相信,我們的工具可以讓內(nèi)容創(chuàng)作更高效,特別是在做背景調(diào)查和事實核查時,Perplexity已成為一個廣泛使用的研究工具,能幫助用戶更輕松地完成深度研究。
Delvin Coldewey:我很感謝你們的解答,盡管在獲取來源的方式上我們可能仍存在一些分歧。接下來我想提到版權(quán)問題。這個領(lǐng)域相當(dāng)復(fù)雜,是一個前所未有的知識產(chǎn)權(quán)法律難題,因此幾乎沒有現(xiàn)成的先例。所以是否有可能在某些情況下,無意中觸犯到版權(quán)法?
Aravind Srinivas:我已經(jīng)在我的博客里回應(yīng)過了,在任何法律下我們都會捍衛(wèi)自己。
Delvin Coldewey:你覺得法律需要做出改變嗎,讓IP保護更寬松?
Aravind Srinivas:其實關(guān)于版權(quán)已經(jīng)有很多明確的法律程序了,現(xiàn)行的版權(quán)法很多,并且已經(jīng)有判例確立了事實本身不受版權(quán)保護。
Delvin Coldewey:當(dāng)然沒錯,但問題不只是關(guān)于事實。
Aravind Srinivas:我們都不是律師,所以在這里無法解決這個爭議。我認(rèn)為事實應(yīng)該平等分發(fā)給每一個人。設(shè)想一下,如果科學(xué)家們宣稱擁有某些事實的權(quán)利,而其他人無法傳播這些知識與真相,那將是一個什么樣的世界。(臺下一大片掌聲)
圖源:硅星人Delvin Coldewey:好,不說事實問題了。為什么你們要籌集那么多資金?
Aravind Srinivas:AI的成本很高。目前GPU和數(shù)據(jù)中心都很昂貴,我們希望未來能降低成本,但現(xiàn)在開發(fā)這些模型需要大量投入,提供這些服務(wù)的公司需要通過收費來回收成本。我們觀察到,API成本大約每4到5個月就會下降一半,如果這一趨勢能再持續(xù)一兩年,我們的模型成本將可能降低10到50倍,這對我們這樣的成長型公司來說是極大的利好。
我們可以專注于增長,同時在短期內(nèi)管理成本,因為我們知道成本會逐步下降。在這個過程中,我們也在摸索長期可持續(xù)的收入模式。我們認(rèn)為AI產(chǎn)品的變現(xiàn)方式不僅限于訂閱服務(wù),雖然訂閱模式對很多公司來說效果很好,我們也有不錯的表現(xiàn),但我們認(rèn)為還有其他更好的方式,比如按使用量收費,而不是僅僅靠月費。
Delvin Coldewey:你覺得能從谷歌手里搶到一些收入嗎?
Delvin Coldewey:最后一個簡短問題,我列出幾個公司名,你來回答是否收到過這些科技公司的收購邀約,只需要給我一個“是”或“不是”準(zhǔn)備好了嗎?OpenAI?
Aravind Srinivas:無可奉告。
Delvin Coldewey:微軟?
Aravind Srinivas:無可奉告。
Delvin Coldewey:谷歌?
Aravind Srinivas:絕對沒有!
(Delvin又問了Notion、Amazon、Meta、Elon Musk,Aravind的回答全是“無可奉告”,即便他和馬斯克“是朋友”。)
Delvin Coldewey:好吧,算了哈哈。
你今天早些時候發(fā)推文提到你的綠卡申請問題。對于那些在類似情況下經(jīng)營著數(shù)十億公司,但像你一樣還沒拿到綠卡的人,你有什么建議?這真得很讓人震驚。
Aravind Srinivas:我的意思不是我就應(yīng)該因此獲得所有優(yōu)待。我對此有一些基本理解,美國移民系統(tǒng)對每個國家每年有固定的移民配額,而我來自印度,很多印度人希望移民美國,加上疫情造成的積壓,這是進展緩慢的主要原因。我只是希望通過表達這個問題,引發(fā)一些關(guān)注。
Delvin Coldewey:感謝你和我們分享。