劃重點(diǎn)
01不同AI搜索產(chǎn)品給出的答案數(shù)量參差不齊,引發(fā)對(duì)AI搜索結(jié)果展示方式的討論。
02測(cè)試結(jié)果顯示,Kimi.AI和知乎直答的結(jié)論結(jié)構(gòu)化且簡(jiǎn)潔有力,最受滿意。
03然而,文心一言的回答與問(wèn)題的相關(guān)性較弱,微信搜一搜則更注重直接陳述。
04專家表示,AI搜索結(jié)果展示方式應(yīng)考慮問(wèn)題理解、技術(shù)邏輯和使用體驗(yàn)三個(gè)因素。
05用戶行為研究表明,人們往往只關(guān)注一個(gè)屏幕內(nèi)的內(nèi)容,直接展示答案更符合用戶需求。
以上內(nèi)容由大模型生成,僅供參考
本文來(lái)自微信公眾號(hào):王智遠(yuǎn),作者:王智遠(yuǎn),題圖來(lái)自:AI生成
使用AI搜索時(shí),我注意到一個(gè)問(wèn)題:
不同AI搜索產(chǎn)品給出的答案數(shù)量參差不齊,有的比較簡(jiǎn)單,一兩句話總結(jié);有的比較復(fù)雜,結(jié)構(gòu)化呈現(xiàn)5~6條,沒(méi)一個(gè)能用的。
這讓我好奇,AI搜索結(jié)果,到底展示多少條合適?要不要結(jié)構(gòu)化?多少條是人們接受的?帶著問(wèn)題,我進(jìn)行了測(cè)試和調(diào)研。
先說(shuō)結(jié)論:最滿意Kimi.AI和知乎直答。為什么呢?
測(cè)試部分,我問(wèn)Kimi探索版,AI搜索應(yīng)該顯示幾條內(nèi)容?它搜索39個(gè)網(wǎng)頁(yè)后,給出的結(jié)論只有5句話,即:
搜狗搜索每頁(yè)顯示10條結(jié)果,最多可以設(shè)置為100條;百度搜索可以提供10條、20條或50條內(nèi)容,數(shù)量取決于用戶選擇。
必應(yīng)則說(shuō)自己有置頂框,會(huì)展示AI總結(jié)和相關(guān)鏈接。perplexity只呈現(xiàn)五六條結(jié)果;360 AI是通過(guò)答案再提供20到30條信源鏈接。
從Kimi的回答結(jié)果看,搜狗、百度的結(jié)論是基于傳統(tǒng)搜索引擎,而必應(yīng)、perplexity、360可能是基于AI的。
帶著問(wèn)題,我又問(wèn)了騰訊的ima.copilot,這是一個(gè)筆記軟件,能搜索所有公眾號(hào)內(nèi)容;我說(shuō):AI搜索應(yīng)該顯示幾條內(nèi)容?
它提到結(jié)果呈現(xiàn)方式取決于搜索目的、用戶需求、內(nèi)容類型和AI算法性能;百度一般顯示10條結(jié)果,最多100條;Google可以在10到100條之間顯示,根據(jù)用戶需求決定。
不過(guò),它的答案的確很繁瑣,結(jié)構(gòu)化了還很長(zhǎng),以上都是我?guī)退鼉?yōu)化后的。
接著,我測(cè)試了知乎知答。答案很簡(jiǎn)單,只有4句話:
AI搜索內(nèi)容不固定,由算法根據(jù)用戶最有價(jià)值、最相關(guān)的結(jié)果決定;搜索引擎的目標(biāo)是提供最相關(guān)的結(jié)果,數(shù)量從幾條到幾十條不等,同時(shí)考慮用戶體驗(yàn)和多樣性。
比如:谷歌搜索可能顯示10條結(jié)果,并提供下一頁(yè)鏈接以瀏覽更多內(nèi)容;AI搜索工具會(huì)挑選最重要、最合適的內(nèi)容,關(guān)鍵在于質(zhì)量而不是數(shù)量(這個(gè)例子是知乎直答答案中的)。
然后,我測(cè)試了文心一言,它給出5條結(jié)構(gòu)化內(nèi)容。
不同的是,它比較模棱兩可;它說(shuō),答案數(shù)量取決于用戶需求、搜索上下文、設(shè)備和界面、算法與性能以及用戶體驗(yàn),并且會(huì)根據(jù)這些因素動(dòng)態(tài)調(diào)整。
微信的AI搜索自然也不能放過(guò),它的AI在“搜一搜”里,相對(duì)隱蔽。我測(cè)試了幾個(gè)問(wèn)題,發(fā)現(xiàn)微信搜一搜的AI生成式答案相對(duì)簡(jiǎn)單直接。
我搜索“王智遠(yuǎn)是誰(shuí)”時(shí),結(jié)果顯示王智遠(yuǎn)是個(gè)多才多藝的人,有多種身份,包括一級(jí)建造師、藝人和商業(yè)創(chuàng)作者,每個(gè)身份都有進(jìn)一步的5點(diǎn)介紹。
綜上認(rèn)為,Kimi的答案結(jié)構(gòu)化,且簡(jiǎn)潔有力;知乎知答則更為直接,沒(méi)有列出具體條數(shù),但直接給出了答案;相比之下,文心一言的回答與問(wèn)題的相關(guān)性較弱,微信搜一搜則更注重直接陳述。
對(duì)比不難看出,AI搜索給出的答案,大致分為兩類:
一,簡(jiǎn)潔明確的;問(wèn)題和答案匹配,不拖泥帶水,二,切題詳實(shí)的,AI會(huì)圍繞答案展開(kāi)很多討論;這些討論看似正確,實(shí)際上只有一部分對(duì)用戶有幫助。
為什么會(huì)這樣?帶著好奇,我詢問(wèn)了身邊兩位技術(shù)朋友:他們說(shuō),可以從問(wèn)題理解、技術(shù)邏輯和使用體驗(yàn)三個(gè)角度來(lái)看。
首先,使用AI搜索,不能指望它像人類一樣理解我們。
聊天時(shí),我能知道你的過(guò)去、經(jīng)驗(yàn)和外貌,但AI做不到。AI更像一個(gè)“缸中之腦”(Brain in a Vat)。這個(gè)概念有點(diǎn)奇怪,就像一個(gè)人的大腦被放在裝滿營(yíng)養(yǎng)液的缸里,通過(guò)電腦來(lái)操縱,讓它感覺(jué)像人腦一樣。
實(shí)際上,AI的模型像大腦,外部信息像營(yíng)養(yǎng)液,我們給AI一個(gè)問(wèn)題,它會(huì)在各種知識(shí)庫(kù)中搜索,然后整合信息找到答案。
因此,它對(duì)問(wèn)題的理解是基于大量數(shù)據(jù)做出的平衡,平衡什么呢?就是那些被大量點(diǎn)擊的,或者相對(duì)準(zhǔn)確的信息,有些模型為了準(zhǔn)確性,自然會(huì)選擇呈現(xiàn)多一些內(nèi)容。
其次,從技術(shù)角度來(lái)看,當(dāng)你輸入一個(gè)問(wèn)題后,AI會(huì)捕捉這個(gè)問(wèn)題,利用搜索引擎,比如Google,或者一些第三方服務(wù)來(lái)尋找答案。
AI會(huì)用一種叫embedding的技術(shù)來(lái)處理搜索結(jié)果,這個(gè)技術(shù)就像給結(jié)果排序和分類,讓它們更容易管理;最后,AI會(huì)使用RAG技術(shù),從眾多網(wǎng)頁(yè)中挑選出與你問(wèn)題相關(guān)的信息,再通過(guò)一個(gè)大型模型整合這些信息,最終給出答案。
很多AI搜索產(chǎn)品不會(huì)自己建立搜索引擎,因?yàn)槌杀咎吡,爬?000萬(wàn)個(gè)網(wǎng)頁(yè)可能需要花費(fèi)一兩百萬(wàn)人民幣,而且爬取的內(nèi)容還需要進(jìn)行安全檢查。
現(xiàn)在大型搜索引擎擁有的網(wǎng)頁(yè)數(shù)量是以千億計(jì)的,這是多年積累的結(jié)果,從時(shí)間和金錢(qián)來(lái),一般創(chuàng)業(yè)者難以承擔(dān)。
所以,AI搜索找到網(wǎng)頁(yè)內(nèi)容后,會(huì)把它們按照段落、句子切成小塊,這樣處理更方便,那么,很自然地如果問(wèn)題很長(zhǎng),答案可能也會(huì)很詳細(xì);如果問(wèn)題很短,或者一個(gè)詞有多個(gè)解釋,它也可能給出很多相關(guān)的信息。
這就像找東西,一個(gè)詞能引出很多相關(guān)內(nèi)容。
朋友還說(shuō),針對(duì)一個(gè)問(wèn)題,AI給的答案比較豐富,也取決于生成式(generative)和交互式(interactive)。
什么意思呢?
AI搜索系統(tǒng)本質(zhì)上是一個(gè)問(wèn)答系統(tǒng),它的答案和傳統(tǒng)檢索方式有很大區(qū)別。
傳統(tǒng)檢索只是把相關(guān)網(wǎng)頁(yè)展示出來(lái),而生成式可能返回一個(gè)文檔或一組鏈接,這樣用戶可以直接獲取所有信息,不用再?gòu)亩鄠(gè)來(lái)源中篩選總結(jié)。
這種技術(shù)有創(chuàng)造性,因?yàn)樗斫饽愕恼Z(yǔ)料后,再給出答案。所以,雖然有些內(nèi)容可能我們不需要,但這些多余的內(nèi)容能增強(qiáng)人與AI的互動(dòng)性。
比如說(shuō):
你問(wèn)“如何提升工作效率?”,AI可能會(huì)先給你一個(gè)常見(jiàn)的幾條建議,比如設(shè)定清晰目標(biāo)、合理分配時(shí)間等。
但它還可能進(jìn)一步提到一些新工具或方法,類似于“你可以嘗試使用時(shí)間管理工具,如Notion或Todoist,它們能幫助你更好地安排任務(wù)”;這樣,你會(huì)因?yàn)檫@些額外的信息對(duì)某個(gè)工具產(chǎn)生興趣,從而進(jìn)行下一次的搜索。
問(wèn)題是:我們真需要那么多答案嗎?我從體驗(yàn)角度做了樣本測(cè)試。
有些人說(shuō):用AI搜索時(shí),喜歡先看到結(jié)論,再看過(guò)程,這樣能讓他們更快地找到想要的信息。
雖然AI能提供很多長(zhǎng)文本,但并不是每個(gè)人都想要,就像一個(gè)知識(shí)淵博的人能講很多,但并不是所有內(nèi)容我們都感興趣一樣。
你要不明白,就想象一下,在工作中,如果領(lǐng)導(dǎo)問(wèn)你事情辦得怎么樣,你先說(shuō)一大堆過(guò)程,最后才說(shuō)沒(méi)辦成,領(lǐng)導(dǎo)肯定不高興,相反,先告訴領(lǐng)導(dǎo)結(jié)果,再詳細(xì)說(shuō)過(guò)程,這樣更好。
但也有人覺(jué)得,AI搜索顯示的內(nèi)容越多越好,因?yàn)檫@樣可以學(xué)到更多知識(shí),提高找信息的效率。
比如:我問(wèn)一個(gè)問(wèn)題,可能還沒(méi)完全想清楚,如果AI能展示很多內(nèi)容,有些反而會(huì)激發(fā)我的好奇心,這種好奇心再次引導(dǎo)我探索更多不同的解決方法。
然而,實(shí)際情況是這樣嗎?
雖然歷史上沒(méi)有人專門(mén)研究AI搜索結(jié)果,但我查了一些關(guān)于傳統(tǒng)搜索引擎的用戶調(diào)研。
到了2024年,谷歌搜索的用戶調(diào)研顯示,排名第一的鏈接點(diǎn)擊率高達(dá)39.8%,第二名是18.7%,后面的點(diǎn)擊率會(huì)越來(lái)越低。這說(shuō)明用戶更關(guān)注搜索結(jié)果頁(yè)面靠前的鏈接,越往下,關(guān)注度就越低[1]。
統(tǒng)計(jì)數(shù)據(jù)還顯示,75%的用戶從不瀏覽搜索結(jié)果第一頁(yè)之外的內(nèi)容,只有0.78%的用戶會(huì)點(diǎn)擊谷歌第二頁(yè)的結(jié)果。
而那些直接顯示答案的精選摘要(Featured Snippets),在2018年初的出現(xiàn)頻率約為12%,到2020年初增長(zhǎng)到了約16%[2];這意味著在搜索頁(yè)面上,直接展示答案可能減少了用戶對(duì)更多搜索結(jié)果頁(yè)面的需求。
換言之,用戶愿意直接獲取答案,不想瀏覽無(wú)關(guān)信息。
我也讀了谷歌核心工程師瑪麗莎梅耶(Marissa Mayer)的一些用戶調(diào)研。她說(shuō):
很多用戶告訴她,他們希望每頁(yè)能看到盡可能多的結(jié)果,20個(gè)不夠,25個(gè)也不行,最好是30個(gè);但當(dāng)她觀察用戶的實(shí)際行為時(shí),發(fā)現(xiàn)了一個(gè)不同的趨勢(shì):用戶其實(shí)更喜歡每頁(yè)顯示較少的結(jié)果。
當(dāng)搜索結(jié)果數(shù)量在10到20之間時(shí),用戶的點(diǎn)擊率會(huì)急劇下降。當(dāng)每頁(yè)顯示25個(gè)結(jié)果時(shí),點(diǎn)擊率下降得更多,而當(dāng)每頁(yè)顯示30個(gè)結(jié)果時(shí),情況最為糟糕。
最后,梅耶決定每頁(yè)顯示10個(gè)搜索結(jié)果,這個(gè)決定也被谷歌一直沿用至今。
所以,這個(gè)結(jié)論是:用戶在AI搜索時(shí),往往只關(guān)注一個(gè)屏幕內(nèi)的內(nèi)容;如果這一屏的前面就能完整呈現(xiàn)結(jié)論,他們就能獲取所需要的結(jié)果,而后面的內(nèi)容,對(duì)他們來(lái)說(shuō),可能就沒(méi)那么相關(guān)了。
問(wèn)題是,為什么人們說(shuō)的話和實(shí)際行為不一致呢?我們總說(shuō)想看到更多內(nèi)容,但當(dāng)AI搜索結(jié)果真的呈現(xiàn)大量?jī)?nèi)容時(shí),卻不愿意花時(shí)間去看?
經(jīng)過(guò)長(zhǎng)期使用AI搜索,我找到了答案:速度。很多人沒(méi)有意識(shí)到,大量搜索結(jié)果會(huì)干擾我們的認(rèn)知,影響體驗(yàn)。
舉個(gè)例子:
我嘗試了Kimi和天工AI的探索版,當(dāng)我問(wèn)它們一個(gè)心理學(xué)研究的問(wèn)題時(shí),一個(gè)給了簡(jiǎn)短有力的答案,并適當(dāng)引導(dǎo)我去網(wǎng)頁(yè)查看更多。
另一個(gè)卻給了很多內(nèi)容,要我先瀏覽再點(diǎn)擊鏈接查看;相比之下,后者讓我感到選擇困難,甚至覺(jué)得大腦負(fù)擔(dān)加重,而前者的信息,讓我獲取得更直接、更方便。
扎克伯格在Facebook早期發(fā)展時(shí),也遇到過(guò)類似情況。
當(dāng)Facebook從哈佛擴(kuò)展到耶魯和哥倫比亞大學(xué)時(shí),學(xué)生們一開(kāi)始表示懷疑,甚至有些嘲諷,盡管他們抱怨,但沒(méi)人真正刪除信息或停止使用,反而使用頻率增加了。
扎克伯格得出結(jié)論:“人們并不擅長(zhǎng)預(yù)測(cè)自己對(duì)新事物的反應(yīng)。”Facebook的成功證明,用戶可能對(duì)新事物持懷疑態(tài)度,但最終會(huì)喜歡成為其中的一部分。
很少有人能清楚表達(dá)自己的真實(shí)需求,尤其是在面對(duì)未知的新事物時(shí),語(yǔ)言可能會(huì)騙人,但行動(dòng)不會(huì),因?yàn)樾袆?dòng)的代價(jià)比語(yǔ)言更大。
在產(chǎn)品開(kāi)發(fā)中,我們常聽(tīng)到一句話:“不要聽(tīng)別人說(shuō)什么,要看他們做什么。”這句話同樣適用于AI產(chǎn)品,用戶可能會(huì)說(shuō)他們想要更多功能或選項(xiàng),但他們的行為表明,很多人更喜歡簡(jiǎn)單快捷的解決方案。
所以,有兩個(gè)結(jié)論:
一,AI搜索一開(kāi)始不要展示太多內(nèi)容,搜索引擎應(yīng)該先直接給出答案,然后,逐步引導(dǎo)用戶探索,這樣更合適。
二,AI越專業(yè),答案越簡(jiǎn)潔,長(zhǎng)文本能力應(yīng)該用在解釋過(guò)程上,而不是直接給答案。
你認(rèn)為是不是這樣?AI搜索后,你期望看到幾條結(jié)論?
研究參考:
1.WSR團(tuán)隊(duì). (2024). 30+ GOOGLE搜索引擎統(tǒng)計(jì)數(shù)據(jù)和趨勢(shì) [2024年更新].
2.谷歌洞察. (2024, March 8). 用戶搜索行為分析.
本文來(lái)自微信公眾號(hào):王智遠(yuǎn),作者:王智遠(yuǎn)
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系 hezuo@huxiu.com
正在改變與想要改變世界的人,都在 虎嗅APP