展會(huì)信息港展會(huì)大全

賈揚(yáng)清用500行代碼“打臉”這家估值5.2億美元的初創(chuàng)公司
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-02 15:11:30   瀏覽:4754次  

導(dǎo)讀:500行代碼 VS 估值5億 1月25日,自從宣布創(chuàng)業(yè)后就備受社區(qū)矚目的賈揚(yáng)清,在推特上展示了一個(gè)對(duì)話(huà)式搜索引擎的demo。 這個(gè)demo基于他創(chuàng)辦的LeptonAI提供的框架,只用500行python 代碼就開(kāi)發(fā)完成。在邀請(qǐng)大家體驗(yàn)同時(shí),賈揚(yáng)清也表示后續(xù)計(jì)劃把代碼開(kāi)源。在介紹...

500行代碼 VS 估值5億

1月25日,自從宣布創(chuàng)業(yè)后就備受社區(qū)矚目的賈揚(yáng)清,在推特上展示了一個(gè)對(duì)話(huà)式搜索引擎的demo。

這個(gè)demo基于他創(chuàng)辦的LeptonAI提供的框架,“只用500行python 代碼”就開(kāi)發(fā)完成。在邀請(qǐng)大家體驗(yàn)同時(shí),賈揚(yáng)清也表示后續(xù)計(jì)劃把代碼開(kāi)源。在介紹Lepton Search的一系列推特里,他還艾特了Perplexity估值已經(jīng)達(dá)到5.2億美元的當(dāng)紅對(duì)話(huà)式搜索公司,并表示受到他們優(yōu)秀產(chǎn)品的啟發(fā)。

而這也很快吸引來(lái)Perplexiyt的注意,但引來(lái)的并不是什么好話(huà)。

其創(chuàng)始人Aravind Srinivas在推特上很快轉(zhuǎn)發(fā)賈揚(yáng)清的推特并表示:“太棒了,看到 Perplexity 成為一些融資動(dòng)作的參照物,包括前 Meta 和阿里巴巴高管都這樣做。這說(shuō)明 Perplexity 的影響力不局限于產(chǎn)品本身,而是輻射到了整個(gè)科技生態(tài)和行業(yè)發(fā)展,令人振奮!”

翻譯過(guò)來(lái)就一句話(huà):Lepton為了融資而抄了我Perplexity尊貴的前端代碼。

而這條推特下面不乏煽風(fēng)點(diǎn)火的評(píng)論,有人說(shuō)Aravind你說(shuō)的真委婉,這不就是抄襲了。但也有人指出,Aravind是反應(yīng)過(guò)度,Lepton根本不是個(gè)做搜索的公司,人干嘛要盯著你借鑒。

賈揚(yáng)清也迅速回應(yīng),感謝了對(duì)方“友好的評(píng)論”,然后立刻表示咱們開(kāi)源見(jiàn)。

之后加速寫(xiě)代碼,居然一個(gè)周末不到真就把代碼開(kāi)源了。

然后這500行代碼在周日上線(xiàn)Github,一天后拿到Githhub熱榜第一,第二天繼續(xù)熱榜。星星數(shù)不斷增長(zhǎng),目前三天已經(jīng)有了4500顆星星。

而從人們的討論看,有人已經(jīng)基于它拿到了一些黑客松冠軍,它還被一款聚焦開(kāi)發(fā)者版的Perplexity產(chǎn)品集成,其CEO夸贊這給自己帶來(lái)速度大幅提升。許多體驗(yàn)和對(duì)比了Lepton和Perplexity的用戶(hù)也夸贊了Lepton的體驗(yàn)。而且它還在不停迭代功能,兩天不到,賈揚(yáng)清和團(tuán)隊(duì)成員就給它增加了包括中文在內(nèi)的多語(yǔ)言支持,把對(duì)話(huà)結(jié)果分享到推特和Facebook的功能,以及更多的API合作。

簡(jiǎn)單體驗(yàn)它后,我發(fā)現(xiàn)它確實(shí)用戶(hù)界面更加簡(jiǎn)潔,速度也快很多。當(dāng)然,它的功能整體也更簡(jiǎn)單,比如在每一次回答后,它就結(jié)束,再次輸入開(kāi)啟的是新一輪回答,而非持續(xù)的對(duì)話(huà)。包括提問(wèn)的長(zhǎng)度識(shí)別,中文的識(shí)別等一些小bug也依然存在。

但他顯然打破了我對(duì)Perplexity的一部分濾鏡。

Perplexity的護(hù)城河被捅破了?

在開(kāi)源代碼后,賈揚(yáng)清不忘再次艾特Aravind,表示期待合作,可以讓對(duì)方體驗(yàn)一下真正“快速,云原生和用戶(hù)體驗(yàn)友好的平臺(tái)”。但這一次Aravind沒(méi)再說(shuō)什么奇怪的話(huà)。

事實(shí)上這500行代碼以一種最粗暴的方式把所謂十幾年來(lái)第一次能挑戰(zhàn)谷歌的創(chuàng)新對(duì)話(huà)式搜索的真實(shí)技術(shù)含量展示了出來(lái)。

從代碼入手看一看,它一共就是幾個(gè)步驟:1.獲取查詢(xún),說(shuō)白了就是得到用戶(hù)輸入的文字、2.抓取用戶(hù)輸入關(guān)鍵字相關(guān)的搜索頁(yè)面、3.解析網(wǎng)頁(yè)文本、4.基于文本構(gòu)建提示詞、5.把提示詞遞交給大語(yǔ)言模型、6.把大語(yǔ)言模型生成的結(jié)果返回給用戶(hù)。

當(dāng)然它還有些具體區(qū)別,比如搜索的來(lái)源是使用Bing或Google的API,還是使用一個(gè)自己的數(shù)據(jù)庫(kù);背后大模型上的選擇,是Mistral 還是Llama這些開(kāi)源的,還是直接使用OpenAI的API,或像Perplexity還有自己的幾款模型供選擇;以及大模型在其中起作用的方式,是直接讓它根據(jù)需求生成回答,還是經(jīng)過(guò)一定的Prompt優(yōu)化。

不過(guò)這樣看起來(lái)你很快會(huì)明白,它本質(zhì)上是關(guān)于更好使用別人API的技術(shù)。

也就是說(shuō),這一切還是建立在傳統(tǒng)搜索引擎提供的檢索能力之上想要替代Google的Perplexity是建立在Google的API之上的。它們本質(zhì)上屬于RAG技術(shù)的應(yīng)用,只不過(guò),R更多來(lái)自對(duì)其他人API的系統(tǒng)性掌握,而G似乎可以更多歸功于自己的能力。賈揚(yáng)清則表示,他在開(kāi)發(fā)過(guò)程里發(fā)現(xiàn)在RAG里,R(檢索)比G(生成)的重要性更大。這樣看來(lái),目前Lepton Search的demo之所以一開(kāi)始沒(méi)有做多輪對(duì)話(huà)的能力,也似乎因?yàn)檫@個(gè)思路。展示R的能力更加重要。

Perplexity同樣沿著相似的技術(shù)思路,而在一些技術(shù)人士看來(lái),他們的根源可能來(lái)自一篇Google和OpenAI合作的論文是的,今天看起來(lái)可能不再可能一起寫(xiě)論文的兩家公司,最后一次合作是對(duì)話(huà)式搜索的技術(shù)原理。

在這篇《FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation》的論文里,他們提出了一種FreshPrompt的技術(shù)思路,也就是為了解決預(yù)訓(xùn)練模型對(duì)正在發(fā)生的事情的無(wú)知,要把它與實(shí)時(shí)搜索能力結(jié)合,而結(jié)合的方法是通過(guò)提供一種Prompt,這種Prompt本身是在按照發(fā)布日期,關(guān)鍵信源等各種要素來(lái)為大模型提供上下文信息,并通過(guò)一組優(yōu)化的Prompt來(lái)引導(dǎo)和改善大模型生成更實(shí)時(shí)更好的回答。

這種技術(shù)思路其實(shí)也在指向R的重要性可能大過(guò)G。

Perplexity的網(wǎng)頁(yè)版事實(shí)上誕生于這個(gè)論文之前,但據(jù)一些研究它產(chǎn)品邏輯的人表示,這個(gè)論文提出的方法也被用到后來(lái)Perplexity迭代后的產(chǎn)品中。

而只要看看這張論文里給出的prompt示意圖,這種技術(shù)方案之下,前端長(zhǎng)成什么樣最終似乎就是一個(gè)大概率的雷同。

說(shuō)了這么多,其實(shí)你會(huì)發(fā)現(xiàn),如果換成一個(gè)其他的基于“別人”的API和大模型能力,以及公開(kāi)的論文給出的技術(shù)路線(xiàn)而開(kāi)發(fā)的應(yīng)用,可能這“抄襲”的指責(zé)只會(huì)讓人一笑而過(guò)。Perplexity的指責(zé)似乎也是一樣的事情,賈揚(yáng)清的500行代碼成了破解獨(dú)角獸身份帶來(lái)的技術(shù)幻覺(jué)最好的解藥。

醉翁之意

但沒(méi)人否認(rèn)的是,Perplexity依然是一款好產(chǎn)品。

然而一款充滿(mǎn)新設(shè)計(jì)的產(chǎn)品的好,在于功能體驗(yàn)的量級(jí)上的領(lǐng)先,它來(lái)自對(duì)一整個(gè)系統(tǒng)的好品味與一個(gè)個(gè)細(xì)節(jié)積攢起來(lái)的優(yōu)化。對(duì)Perplexity來(lái)說(shuō),對(duì)大模型和召回技術(shù)的理解,以及它們與應(yīng)用的結(jié)合才是它快速成功的關(guān)鍵。而不在于一個(gè)單點(diǎn)的而且事實(shí)上也并不新鮮的概念。

在把理念通過(guò)簡(jiǎn)潔的前端實(shí)現(xiàn)后,perplexity真正抓住用戶(hù)的是對(duì)產(chǎn)品的打磨進(jìn)而將對(duì)話(huà)能力與強(qiáng)大搜索引擎的準(zhǔn)確性相結(jié)合。這背后是各種細(xì)節(jié),品味,經(jīng)驗(yàn)積累的最終結(jié)果。因此,它的護(hù)城河必然和時(shí)間成正比,從今天人們對(duì)它的好評(píng)也能看出速度快,體驗(yàn)絲滑,都是最樸素的感知,也是最容易替代的感知,因此在面對(duì)一個(gè)速度甚至更快的Lepton開(kāi)源產(chǎn)品demo時(shí),弦自然繃緊了。

而這也帶來(lái)整件事里真正有意思的地方:Perplexity暗示Lepton是抄襲其實(shí)在揣著明白裝糊涂。這種做法的一個(gè)表面上的作用,自然是“掩蓋”上面講的技術(shù)門(mén)檻并不高這件事。而除此之外,裝糊涂其實(shí)還有更重要的理由。

賈揚(yáng)清在去年離開(kāi)阿里后,創(chuàng)業(yè)初期其實(shí)十分低調(diào)。但這名開(kāi)發(fā)了Caffe,核心參與了Tensorflow和Pytorch的框架大神,身經(jīng)百戰(zhàn)的原阿里副總裁,顯然對(duì)自己和團(tuán)隊(duì)的技術(shù)能力并不低調(diào)。在9月時(shí)我在硅谷聽(tīng)他創(chuàng)業(yè)后的第一次公開(kāi)分享,他已經(jīng)在展示自己的Lepton服務(wù)是大模型基礎(chǔ)框架服務(wù)里速度第一的存在。只不過(guò),現(xiàn)在看起來(lái)當(dāng)時(shí)Lepton仍處早期,對(duì)更多模型的適配,對(duì)算力的建設(shè)等都在解決當(dāng)中。

而進(jìn)入2024年,賈揚(yáng)清和Lepton開(kāi)始逐漸高調(diào)。這一次Lepton Search的發(fā)布像是一個(gè)轉(zhuǎn)折點(diǎn)。這家創(chuàng)業(yè)公司正式開(kāi)始進(jìn)入戰(zhàn)常

在這條Lepton Search的發(fā)布推特引發(fā)討論的同一天,AI創(chuàng)業(yè)公司Martian的一份開(kāi)源大模型API推理榜單發(fā)布,對(duì)多款推理產(chǎn)品在主要的開(kāi)源模型上的推理成本、速率和吞吐量等指標(biāo)做了測(cè)試,而Lepton拿下多項(xiàng)關(guān)鍵指標(biāo)第一。在另一個(gè)由ArtificialAnalysis.ai發(fā)布的API推理榜單中,Lepton也拿下了Mixtral 8x7B這個(gè)模型的每秒處理Token數(shù)的第一,并且是唯一一個(gè)支持Mixtral 32k上下文窗口的服務(wù)。“它的價(jià)格也極具競(jìng)爭(zhēng)力”,這個(gè)榜單這樣說(shuō)。

而在賈揚(yáng)清轉(zhuǎn)發(fā)的榜單圖中,Lepton高高的圓圈旁邊,被它超過(guò)的一個(gè)小圓圈正是Perplexity。

是的,Perplexity才不只是一個(gè)應(yīng)用公司。

在Perplexity的對(duì)話(huà)搜索產(chǎn)品之外,Perplexity Lab其實(shí)和Lepton一樣,也是一個(gè)API推理服務(wù)商,比如最近剛發(fā)布的CodeLlama-70B-Instruct,就可以購(gòu)買(mǎi)Perplexity Lab的API來(lái)直接使用,這也是最近Perplexity真正在發(fā)力的重點(diǎn),它的社交媒體等賬號(hào)在大力推廣的是這個(gè)服務(wù)。

相比Perplexity這個(gè)搜索應(yīng)用,Lepton無(wú)疑直接沖擊的是后面這部分的付費(fèi)用戶(hù)。

這對(duì)Perplexity有多重要呢?

事實(shí)上今天的Perplexity有點(diǎn)掛羊頭賣(mài)狗肉的意味:

用一個(gè)極具話(huà)題度(VC可以參與共謀)的toC產(chǎn)品吸引融資彈藥,然后補(bǔ)貼到API 燒錢(qián)競(jìng)賽中去。因?yàn)榍罢呙鎸?duì)的是今天商業(yè)世界里最成熟的全家桶+廣告的搜索商業(yè)模式,而后者則是在新周期里重演一遍被驗(yàn)證多次的規(guī)模效益的機(jī)會(huì)先燒錢(qián)拿到市場(chǎng)份額,再提高收費(fèi)。

也就是說(shuō)都是關(guān)乎API,一個(gè)是成本,一個(gè)是收益。一個(gè)是被數(shù)據(jù)方控制生死的應(yīng)用,一個(gè)是掘金潮里賣(mài)鏟子的生意。你說(shuō)拿個(gè)真正更重要呢?

而且,如果去看一看Perplexity創(chuàng)業(yè)初期的故事,它最早做了一款口碑不錯(cuò)的推特內(nèi)容的搜索,后來(lái)正因?yàn)轳R斯克收購(gòu)?fù)铺睾蟠蠓岣逜PI價(jià)格而被迫放棄。這些經(jīng)驗(yàn)Perplexity顯然是吸取了,不想再犯一次。

所以裝糊涂的第二層目的就是借著先占據(jù)的領(lǐng)先和C端產(chǎn)品的存在感發(fā)起一下進(jìn)攻,騷擾一下在基礎(chǔ)設(shè)施端未來(lái)肉眼可見(jiàn)必有一戰(zhàn)的強(qiáng)敵。

看來(lái)所有人都意識(shí)到,在AI基礎(chǔ)設(shè)施層面,在所謂的API框架層面,一場(chǎng)更持久的戰(zhàn)爭(zhēng)要來(lái)了。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港