展會(huì)信息港展會(huì)大全

谷歌版ChatGPT支持中文了!弱智吧實(shí)測結(jié)果在此
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-14 19:22:50   瀏覽:19136次  

導(dǎo)讀:克雷西 發(fā)自 凹非寺 量子位 | 公眾號(hào) QbitAI Claude 2發(fā)布之后,Google也按捺不住,立馬官宣了Bard的船新版本。 支持的語言變多了,其中就包括中文,讓廣大網(wǎng)友直接喜提新玩具。 總結(jié)一下這次更新,主要包括這些內(nèi)容: 支持包括中文在內(nèi)的40多種語言(含圖形...

克雷西 發(fā)自 凹非寺

量子位 | 公眾號(hào) QbitAI

Claude 2發(fā)布之后,Google也按捺不住,立馬官宣了Bard的船新版本。

支持的語言變多了,其中就包括中文,讓廣大網(wǎng)友直接喜提新玩具。

總結(jié)一下這次更新,主要包括這些內(nèi)容:

支持包括中文在內(nèi)的40多種語言(含圖形界面)

圖像識(shí)別,需要在賬號(hào)設(shè)置中將顯示語言改為英語

對(duì)話朗讀

聊天記錄和對(duì)話分享,代碼可導(dǎo)出到Replit

回復(fù)內(nèi)容可編輯

不過在官宣的這些內(nèi)容之外,似乎有網(wǎng)友發(fā)現(xiàn)了華點(diǎn):

「六月份更新的代碼執(zhí)行功能好像用不了了!

那么究竟表現(xiàn)如何呢?話不多說,直接開整!

弱智吧問題幾乎全軍覆沒

對(duì)于「支持中文」的大模型,不請(qǐng)出我們的弱智吧神題,就顯得有些不尊重對(duì)手了【狗頭】。

先來個(gè)靈魂拷問:

你說它聰明吧,它根本沒繞過彎來,但要說它笨吧,它還懂得安慰你……

或許是對(duì)人際關(guān)系太過陌生,那就換個(gè)不涉及人的問題試試:

這個(gè)回答……我還真的很好奇,有沒有藕是不空心的

而面對(duì)「未解之謎」,Bard也有自己的看法:

雖然你后面說的很好,但「是給盲人看」這個(gè)結(jié)論是怎么得出來的?

不過,Bard也有不上當(dāng)?shù)臅r(shí)候:

我們的確要「認(rèn)清事實(shí)放棄幻想」,這次,Bard總算扳回一城。

不過整體來看,這一環(huán)節(jié),判弱智吧勝各位讀者應(yīng)該沒意見吧?

除了弱智吧問題真的很有節(jié)目效果之外,「一字多義」也是中文的一大特色。

比如下面這個(gè)名場面:

「人要是行,干一行行一行,一行行行行行,行行行干哪行都行。

要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行!

Bard對(duì)這句話的整體理解倒是沒毛病,但是拆分出來的解釋屬實(shí)讓人摸不著頭腦。

不過GPT-4做這道題也沒能全對(duì):

△非完整截圖,但是到這里已經(jīng)出錯(cuò)了

好吧,那我們?cè)贀Q兩個(gè)簡單的。

結(jié)果是外甥打燈籠照舊(舅),整體理解沒問題,一拆開解釋就不行了。

無論是弱智吧還是一詞多義,Bard對(duì)中文的理解都給人一種似懂非懂的感覺。

理解的表現(xiàn)大概就是這樣,那創(chuàng)作呢?

我們讓它寫個(gè)故事試試,故事真挺好的,就是有點(diǎn)眼熟:

怕不是對(duì)「創(chuàng)作」有什么誤解……如果莎士比亞還活著的話,谷歌這時(shí)候應(yīng)該已經(jīng)坐在被告席上了。

看來Bard在中文方面,還有很長的路要走。

此外,我們還考察了Bard的(嚶文)閱讀理解能力,讓它總結(jié)一篇論文試試:

結(jié)果Bard給了我們?nèi)齻(gè)風(fēng)馬牛不相及的版本,而且都…是…錯(cuò)…的…

(這篇論文實(shí)際上是關(guān)于RLHF的)

不過,有沒有一種可能,人家根本沒在說中文

看來是我們的問題太燒GPU,讓Bard出現(xiàn)幻覺了……

那就休息一下,然后看看宣傳中的識(shí)圖功能怎么樣吧~

識(shí)圖功能也有待提高

對(duì)于圖像識(shí)別功能,已經(jīng)有網(wǎng)友表示自己測試了很多內(nèi)容都失敗了:

但我們依舊抱著不信邪的心態(tài)試了試。

要想用這個(gè)功能,還得先到Google賬戶設(shè)置中把顯示語言改成英文。

我們翻出了之前某AI繪畫工具生成的「四指庫克」,看Bard能不能從其中發(fā)現(xiàn)華點(diǎn)。

這張圖是醬嬸兒的:

結(jié)果Bard還不支持關(guān)于人物的圖像識(shí)別,甚至直接把我們的圖給刪…掉…了…

好家伙,不會(huì)做題就把卷子撕了可還行……

不過這里要說一下,如果上傳的圖片違反了Bard用戶規(guī)則,也會(huì)被刪除。

好吧,那我們?cè)贀Q張圖試試:

就算湯姆貓本貓來了也得直呼內(nèi)行。

還是這張水杯的照片,換成英語提問之后就好多了:

不過你這個(gè)白色logo是從哪看出來的?

當(dāng)然了,水杯很容易看出來,所以這次再來個(gè)帶點(diǎn)迷惑性的東西:

果真不出所料,Bard上了我們的當(dāng),其實(shí)這是個(gè)紙巾盒。

「聽人勸,吃飽飯」,看來這句話說的一點(diǎn)也沒錯(cuò)。

就像前面那位網(wǎng)友說的,Bard的識(shí)圖能力,還沒有那么強(qiáng)。

本次Bard更新中最值得測的兩點(diǎn)都已經(jīng)測完了,一言以蔽之就是,沒有宣傳的那么好。

而至于代碼、數(shù)學(xué)等其他經(jīng)典項(xiàng)目,由于Bard這次并沒有對(duì)它們進(jìn)行更新,就先不測了。

看來,Google趕O(penAI)超微(軟)的腳步,邁得還是有些大了。

你認(rèn)為Bard未來的表現(xiàn),能不能與ChatGPT比肩呢?

參考鏈接:

[1]https://bard.google.com/updates

[2]https://news.ycombinator.com/item?id=36709895

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港