當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > 賈揚(yáng)清用500行代碼“打臉”這家估值5.2億美元的初創(chuàng)公司

賈揚(yáng)清用500行代碼“打臉”這家估值5.2億美元的初創(chuàng)公司
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-02-02 15:11:30 瀏覽：4754次

導(dǎo)讀：500行代碼 VS 估值5億 1月25日，自從宣布創(chuàng)業(yè)后就備受社區(qū)矚目的賈揚(yáng)清，在推特上展示了一個(gè)對(duì)話(huà)式搜索引擎的demo。這個(gè)demo基于他創(chuàng)辦的LeptonAI提供的框架，只用500行python 代碼就開(kāi)發(fā)完成。在邀請(qǐng)大家體驗(yàn)同時(shí)，賈揚(yáng)清也表示后續(xù)計(jì)劃把代碼開(kāi)源。在介紹...

500行代碼 VS 估值5億

1月25日，自從宣布創(chuàng)業(yè)后就備受社區(qū)矚目的賈揚(yáng)清，在推特上展示了一個(gè)對(duì)話(huà)式搜索引擎的demo。

這個(gè)demo基于他創(chuàng)辦的LeptonAI提供的框架，“只用500行python 代碼”就開(kāi)發(fā)完成。在邀請(qǐng)大家體驗(yàn)同時(shí)，賈揚(yáng)清也表示后續(xù)計(jì)劃把代碼開(kāi)源。在介紹Lepton Search的一系列推特里，他還艾特了Perplexity估值已經(jīng)達(dá)到5.2億美元的當(dāng)紅對(duì)話(huà)式搜索公司，并表示受到他們優(yōu)秀產(chǎn)品的啟發(fā)。

而這也很快吸引來(lái)Perplexiyt的注意，但引來(lái)的并不是什么好話(huà)。

其創(chuàng)始人Aravind Srinivas在推特上很快轉(zhuǎn)發(fā)賈揚(yáng)清的推特并表示：“太棒了，看到 Perplexity 成為一些融資動(dòng)作的參照物，包括前 Meta 和阿里巴巴高管都這樣做。這說(shuō)明 Perplexity 的影響力不局限于產(chǎn)品本身，而是輻射到了整個(gè)科技生態(tài)和行業(yè)發(fā)展，令人振奮！”

翻譯過(guò)來(lái)就一句話(huà)：Lepton為了融資而抄了我Perplexity尊貴的前端代碼。

而這條推特下面不乏煽風(fēng)點(diǎn)火的評(píng)論，有人說(shuō)Aravind你說(shuō)的真委婉，這不就是抄襲了。但也有人指出，Aravind是反應(yīng)過(guò)度，Lepton根本不是個(gè)做搜索的公司，人干嘛要盯著你借鑒。

賈揚(yáng)清也迅速回應(yīng)，感謝了對(duì)方“友好的評(píng)論”，然后立刻表示咱們開(kāi)源見(jiàn)。

之后加速寫(xiě)代碼，居然一個(gè)周末不到真就把代碼開(kāi)源了。

然后這500行代碼在周日上線(xiàn)Github，一天后拿到Githhub熱榜第一，第二天繼續(xù)熱榜。星星數(shù)不斷增長(zhǎng)，目前三天已經(jīng)有了4500顆星星。

而從人們的討論看，有人已經(jīng)基于它拿到了一些黑客松冠軍，它還被一款聚焦開(kāi)發(fā)者版的Perplexity產(chǎn)品集成，其CEO夸贊這給自己帶來(lái)速度大幅提升。許多體驗(yàn)和對(duì)比了Lepton和Perplexity的用戶(hù)也夸贊了Lepton的體驗(yàn)。而且它還在不停迭代功能，兩天不到，賈揚(yáng)清和團(tuán)隊(duì)成員就給它增加了包括中文在內(nèi)的多語(yǔ)言支持，把對(duì)話(huà)結(jié)果分享到推特和Facebook的功能，以及更多的API合作。

簡(jiǎn)單體驗(yàn)它后，我發(fā)現(xiàn)它確實(shí)用戶(hù)界面更加簡(jiǎn)潔，速度也快很多。當(dāng)然，它的功能整體也更簡(jiǎn)單，比如在每一次回答后，它就結(jié)束，再次輸入開(kāi)啟的是新一輪回答，而非持續(xù)的對(duì)話(huà)。包括提問(wèn)的長(zhǎng)度識(shí)別，中文的識(shí)別等一些小bug也依然存在。

但他顯然打破了我對(duì)Perplexity的一部分濾鏡。

Perplexity的護(hù)城河被捅破了？

在開(kāi)源代碼后，賈揚(yáng)清不忘再次艾特Aravind，表示期待合作，可以讓對(duì)方體驗(yàn)一下真正“快速，云原生和用戶(hù)體驗(yàn)友好的平臺(tái)”。但這一次Aravind沒(méi)再說(shuō)什么奇怪的話(huà)。

事實(shí)上這500行代碼以一種最粗暴的方式把所謂十幾年來(lái)第一次能挑戰(zhàn)谷歌的創(chuàng)新對(duì)話(huà)式搜索的真實(shí)技術(shù)含量展示了出來(lái)。

從代碼入手看一看，它一共就是幾個(gè)步驟：1.獲取查詢(xún)，說(shuō)白了就是得到用戶(hù)輸入的文字、2.抓取用戶(hù)輸入關(guān)鍵字相關(guān)的搜索頁(yè)面、3.解析網(wǎng)頁(yè)文本、4.基于文本構(gòu)建提示詞、5.把提示詞遞交給大語(yǔ)言模型、6.把大語(yǔ)言模型生成的結(jié)果返回給用戶(hù)。

當(dāng)然它還有些具體區(qū)別，比如搜索的來(lái)源是使用Bing或Google的API，還是使用一個(gè)自己的數(shù)據(jù)庫(kù)；背后大模型上的選擇，是Mistral 還是Llama這些開(kāi)源的，還是直接使用OpenAI的API，或像Perplexity還有自己的幾款模型供選擇；以及大模型在其中起作用的方式，是直接讓它根據(jù)需求生成回答，還是經(jīng)過(guò)一定的Prompt優(yōu)化。

不過(guò)這樣看起來(lái)你很快會(huì)明白，它本質(zhì)上是關(guān)于更好使用別人API的技術(shù)。

也就是說(shuō)，這一切還是建立在傳統(tǒng)搜索引擎提供的檢索能力之上想要替代Google的Perplexity是建立在Google的API之上的。它們本質(zhì)上屬于RAG技術(shù)的應(yīng)用，只不過(guò)，R更多來(lái)自對(duì)其他人API的系統(tǒng)性掌握，而G似乎可以更多歸功于自己的能力。賈揚(yáng)清則表示，他在開(kāi)發(fā)過(guò)程里發(fā)現(xiàn)在RAG里，R（檢索）比G（生成）的重要性更大。這樣看來(lái)，目前Lepton Search的demo之所以一開(kāi)始沒(méi)有做多輪對(duì)話(huà)的能力，也似乎因?yàn)檫@個(gè)思路。展示R的能力更加重要。

Perplexity同樣沿著相似的技術(shù)思路，而在一些技術(shù)人士看來(lái)，他們的根源可能來(lái)自一篇Google和OpenAI合作的論文是的，今天看起來(lái)可能不再可能一起寫(xiě)論文的兩家公司，最后一次合作是對(duì)話(huà)式搜索的技術(shù)原理。

在這篇《FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation》的論文里，他們提出了一種FreshPrompt的技術(shù)思路，也就是為了解決預(yù)訓(xùn)練模型對(duì)正在發(fā)生的事情的無(wú)知，要把它與實(shí)時(shí)搜索能力結(jié)合，而結(jié)合的方法是通過(guò)提供一種Prompt，這種Prompt本身是在按照發(fā)布日期，關(guān)鍵信源等各種要素來(lái)為大模型提供上下文信息，并通過(guò)一組優(yōu)化的Prompt來(lái)引導(dǎo)和改善大模型生成更實(shí)時(shí)更好的回答。

這種技術(shù)思路其實(shí)也在指向R的重要性可能大過(guò)G。

Perplexity的網(wǎng)頁(yè)版事實(shí)上誕生于這個(gè)論文之前，但據(jù)一些研究它產(chǎn)品邏輯的人表示，這個(gè)論文提出的方法也被用到后來(lái)Perplexity迭代后的產(chǎn)品中。

而只要看看這張論文里給出的prompt示意圖，這種技術(shù)方案之下，前端長(zhǎng)成什么樣最終似乎就是一個(gè)大概率的雷同。

說(shuō)了這么多，其實(shí)你會(huì)發(fā)現(xiàn)，如果換成一個(gè)其他的基于“別人”的API和大模型能力，以及公開(kāi)的論文給出的技術(shù)路線(xiàn)而開(kāi)發(fā)的應(yīng)用，可能這“抄襲”的指責(zé)只會(huì)讓人一笑而過(guò)。Perplexity的指責(zé)似乎也是一樣的事情，賈揚(yáng)清的500行代碼成了破解獨(dú)角獸身份帶來(lái)的技術(shù)幻覺(jué)最好的解藥。

醉翁之意

但沒(méi)人否認(rèn)的是，Perplexity依然是一款好產(chǎn)品。

然而一款充滿(mǎn)新設(shè)計(jì)的產(chǎn)品的好，在于功能體驗(yàn)的量級(jí)上的領(lǐng)先，它來(lái)自對(duì)一整個(gè)系統(tǒng)的好品味與一個(gè)個(gè)細(xì)節(jié)積攢起來(lái)的優(yōu)化。對(duì)Perplexity來(lái)說(shuō)，對(duì)大模型和召回技術(shù)的理解，以及它們與應(yīng)用的結(jié)合才是它快速成功的關(guān)鍵。而不在于一個(gè)單點(diǎn)的而且事實(shí)上也并不新鮮的概念。

在把理念通過(guò)簡(jiǎn)潔的前端實(shí)現(xiàn)后，perplexity真正抓住用戶(hù)的是對(duì)產(chǎn)品的打磨進(jìn)而將對(duì)話(huà)能力與強(qiáng)大搜索引擎的準(zhǔn)確性相結(jié)合。這背后是各種細(xì)節(jié)，品味，經(jīng)驗(yàn)積累的最終結(jié)果。因此，它的護(hù)城河必然和時(shí)間成正比，從今天人們對(duì)它的好評(píng)也能看出速度快，體驗(yàn)絲滑，都是最樸素的感知，也是最容易替代的感知，因此在面對(duì)一個(gè)速度甚至更快的Lepton開(kāi)源產(chǎn)品demo時(shí)，弦自然繃緊了。

而這也帶來(lái)整件事里真正有意思的地方：Perplexity暗示Lepton是抄襲其實(shí)在揣著明白裝糊涂。這種做法的一個(gè)表面上的作用，自然是“掩蓋”上面講的技術(shù)門(mén)檻并不高這件事。而除此之外，裝糊涂其實(shí)還有更重要的理由。

賈揚(yáng)清在去年離開(kāi)阿里后，創(chuàng)業(yè)初期其實(shí)十分低調(diào)。但這名開(kāi)發(fā)了Caffe，核心參與了Tensorflow和Pytorch的框架大神，身經(jīng)百戰(zhàn)的原阿里副總裁，顯然對(duì)自己和團(tuán)隊(duì)的技術(shù)能力并不低調(diào)。在9月時(shí)我在硅谷聽(tīng)他創(chuàng)業(yè)后的第一次公開(kāi)分享，他已經(jīng)在展示自己的Lepton服務(wù)是大模型基礎(chǔ)框架服務(wù)里速度第一的存在。只不過(guò)，現(xiàn)在看起來(lái)當(dāng)時(shí)Lepton仍處早期，對(duì)更多模型的適配，對(duì)算力的建設(shè)等都在解決當(dāng)中。

而進(jìn)入2024年，賈揚(yáng)清和Lepton開(kāi)始逐漸高調(diào)。這一次Lepton Search的發(fā)布像是一個(gè)轉(zhuǎn)折點(diǎn)。這家創(chuàng)業(yè)公司正式開(kāi)始進(jìn)入戰(zhàn)常

在這條Lepton Search的發(fā)布推特引發(fā)討論的同一天，AI創(chuàng)業(yè)公司Martian的一份開(kāi)源大模型API推理榜單發(fā)布，對(duì)多款推理產(chǎn)品在主要的開(kāi)源模型上的推理成本、速率和吞吐量等指標(biāo)做了測(cè)試，而Lepton拿下多項(xiàng)關(guān)鍵指標(biāo)第一。在另一個(gè)由ArtificialAnalysis.ai發(fā)布的API推理榜單中，Lepton也拿下了Mixtral 8x7B這個(gè)模型的每秒處理Token數(shù)的第一，并且是唯一一個(gè)支持Mixtral 32k上下文窗口的服務(wù)。“它的價(jià)格也極具競(jìng)爭(zhēng)力”，這個(gè)榜單這樣說(shuō)。

而在賈揚(yáng)清轉(zhuǎn)發(fā)的榜單圖中，Lepton高高的圓圈旁邊，被它超過(guò)的一個(gè)小圓圈正是Perplexity。

是的，Perplexity才不只是一個(gè)應(yīng)用公司。

在Perplexity的對(duì)話(huà)搜索產(chǎn)品之外，Perplexity Lab其實(shí)和Lepton一樣，也是一個(gè)API推理服務(wù)商，比如最近剛發(fā)布的CodeLlama-70B-Instruct，就可以購(gòu)買(mǎi)Perplexity Lab的API來(lái)直接使用，這也是最近Perplexity真正在發(fā)力的重點(diǎn)，它的社交媒體等賬號(hào)在大力推廣的是這個(gè)服務(wù)。

相比Perplexity這個(gè)搜索應(yīng)用，Lepton無(wú)疑直接沖擊的是后面這部分的付費(fèi)用戶(hù)。

這對(duì)Perplexity有多重要呢？

事實(shí)上今天的Perplexity有點(diǎn)掛羊頭賣(mài)狗肉的意味：

用一個(gè)極具話(huà)題度（VC可以參與共謀）的toC產(chǎn)品吸引融資彈藥，然后補(bǔ)貼到API 燒錢(qián)競(jìng)賽中去。因?yàn)榍罢呙鎸?duì)的是今天商業(yè)世界里最成熟的全家桶＋廣告的搜索商業(yè)模式，而后者則是在新周期里重演一遍被驗(yàn)證多次的規(guī)模效益的機(jī)會(huì)先燒錢(qián)拿到市場(chǎng)份額，再提高收費(fèi)。

也就是說(shuō)都是關(guān)乎API，一個(gè)是成本，一個(gè)是收益。一個(gè)是被數(shù)據(jù)方控制生死的應(yīng)用，一個(gè)是掘金潮里賣(mài)鏟子的生意。你說(shuō)拿個(gè)真正更重要呢？

而且，如果去看一看Perplexity創(chuàng)業(yè)初期的故事，它最早做了一款口碑不錯(cuò)的推特內(nèi)容的搜索，后來(lái)正因?yàn)轳R斯克收購(gòu)?fù)铺睾蟠蠓岣逜PI價(jià)格而被迫放棄。這些經(jīng)驗(yàn)Perplexity顯然是吸取了，不想再犯一次。

所以裝糊涂的第二層目的就是借著先占據(jù)的領(lǐng)先和C端產(chǎn)品的存在感發(fā)起一下進(jìn)攻，騷擾一下在基礎(chǔ)設(shè)施端未來(lái)肉眼可見(jiàn)必有一戰(zhàn)的強(qiáng)敵。

看來(lái)所有人都意識(shí)到，在AI基礎(chǔ)設(shè)施層面，在所謂的API框架層面，一場(chǎng)更持久的戰(zhàn)爭(zhēng)要來(lái)了。