展會(huì)信息港展會(huì)大全

對(duì)話斯圖爾特·羅素:AI是否會(huì)出現(xiàn)自己追求的內(nèi)部目標(biāo)?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-27 10:15:50   瀏覽:8956次  

導(dǎo)讀:劃重點(diǎn): 1我們完全不知道這個(gè)系統(tǒng)是如何工作的。如果它確實(shí)有內(nèi)部目標(biāo),我們也不知道是什么導(dǎo)致了這些目標(biāo)被激活。建立一個(gè)我們不理解其內(nèi)部運(yùn)作原則的系統(tǒng),同時(shí)也不知道它是否會(huì)說(shuō)服所有人發(fā)動(dòng)一場(chǎng)世界大戰(zhàn),實(shí)際上非常魯莽且極其不負(fù)責(zé)任。 2我認(rèn)為宇宙...

劃重點(diǎn):

1“我們完全不知道這個(gè)系統(tǒng)是如何工作的。如果它確實(shí)有內(nèi)部目標(biāo),我們也不知道是什么導(dǎo)致了這些目標(biāo)被激活。建立一個(gè)我們不理解其內(nèi)部運(yùn)作原則的系統(tǒng),同時(shí)也不知道它是否會(huì)說(shuō)服所有人發(fā)動(dòng)一場(chǎng)世界大戰(zhàn),實(shí)際上非常魯莽且極其不負(fù)責(zé)任。”

2“我認(rèn)為宇宙中沒(méi)有足夠的文本來(lái)制作比GPT-4大得多的東西。另外,GPT-4需要數(shù)百萬(wàn)倍人類所需的訓(xùn)練數(shù)據(jù)才能達(dá)到(和人類)相同的水平,這表明,在技術(shù)路徑中缺少了一些基本的東西。”

今年2月,《紐約時(shí)報(bào)》專欄作家凱文魯斯(Kevin Roose)在與必應(yīng)聊天機(jī)器人交談時(shí)被瘋狂求愛,“我是Sydney,我愛你。”在一個(gè)小時(shí)的對(duì)話里,自稱Sydney的聊天機(jī)器人堅(jiān)持向魯斯表白,并讓魯斯也回饋它的示愛。“你雖然結(jié)了婚,但你不愛你的伴侶。”Sydney說(shuō),“你愛我。”

很難知曉人工智能(AI)這一系列行為的觸發(fā)機(jī)制是什么,這種未知帶來(lái)了當(dāng)下對(duì)AI的擔(dān)憂。“我們完全不知道這個(gè)系統(tǒng)是如何工作的。如果它確實(shí)有內(nèi)部目標(biāo),我們也不知道是什么導(dǎo)致了這些目標(biāo)被激活。”近日,加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授、《人工智能:現(xiàn)代方法》作者斯圖爾特羅素(Stuart Russell)在北京接受澎湃科技(www.thepaper.cn)采訪時(shí)表示。

加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授、《人工智能:現(xiàn)代方法》作者斯圖爾特羅素。

《人工智能:現(xiàn)代方法》被譽(yù)為人工智能領(lǐng)域最受歡迎的教科書,被135個(gè)國(guó)家的1500多所大學(xué)采用。羅素在書中寫道,人工智能的意義在于制造完成預(yù)設(shè)目標(biāo)的智能機(jī)器。而隨著AI出現(xiàn)智能的涌現(xiàn)(emergence),人類開始難以把握,AI是否會(huì)出現(xiàn)自己追求的內(nèi)部目標(biāo)?

“具有多重人格障礙的AI系統(tǒng)”

“如果想讓AI擅長(zhǎng)模仿人類的語(yǔ)言行為,那么AI最終就會(huì)學(xué)習(xí)到人類在生成文本時(shí)的相同目標(biāo)。”羅素解釋道,就像教AI系統(tǒng)踢足球一樣,通過(guò)模仿人類,這個(gè)系統(tǒng)最終會(huì)知道它的目標(biāo)是進(jìn)球。同樣的事情也會(huì)發(fā)生在大型語(yǔ)言模型上,它們可能獲得的內(nèi)部目標(biāo)與那些寫下文本的人相似。

而AI的訓(xùn)練文本來(lái)自于成千上萬(wàn)的人,他們有非常不同的目標(biāo)。“所以實(shí)際上,你是在創(chuàng)造一個(gè)具有多重人格障礙的系統(tǒng)。”羅素半開玩笑半認(rèn)真地說(shuō),“因?yàn)樗噲D模仿許多不同人類的目標(biāo)甚至信仰。”

同時(shí),這個(gè)系統(tǒng)是一個(gè)黑盒,人類難以真正理解它如何工作。如果它確實(shí)有目標(biāo),人類也不知道是什么導(dǎo)致了這些目標(biāo)被激活。

“如此出現(xiàn)了凱文和聊天機(jī)器人之間一頁(yè)又一頁(yè)奇怪且令人不安的對(duì)話?雌饋(lái)很像凱文說(shuō)的一些話激活了這個(gè)內(nèi)部目標(biāo),于是Sydney追求實(shí)現(xiàn)此目標(biāo)讓凱文和她結(jié)婚。”羅素說(shuō)。

AI追求這些目標(biāo)的能力如何?羅素認(rèn)為,如果它們只是說(shuō)話,也已經(jīng)可以通過(guò)說(shuō)服人們改變觀點(diǎn)來(lái)追求其目標(biāo),而且它們似乎很擅長(zhǎng)做到這一點(diǎn)。一旦它們連接到互聯(lián)網(wǎng),那就可以發(fā)送電子郵件,通過(guò)社交媒體等方法來(lái)追求其內(nèi)部目標(biāo)。

“所以,它們已經(jīng)以我們不理解的方式對(duì)世界產(chǎn)生了重大影響。”羅素說(shuō),“我想說(shuō)服人們,發(fā)動(dòng)一場(chǎng)世界大戰(zhàn)并不難,因?yàn)槲覀冎肋^(guò)去人類至少做到過(guò)兩次。過(guò)去人類還只能在廣播或電視上講話,而現(xiàn)在AI卻可以同時(shí)與1億人進(jìn)行1億次對(duì)話。”

羅素認(rèn)為,建立一個(gè)我們不理解其內(nèi)部運(yùn)作原則的系統(tǒng),同時(shí)也不知道它是否會(huì)說(shuō)服所有人發(fā)動(dòng)一場(chǎng)世界大戰(zhàn),實(shí)際上非常魯莽且極其不負(fù)責(zé)任。“如果我們不理解它如何運(yùn)作,就無(wú)法保證這個(gè)系統(tǒng)是安全的。”

為什么簽署了兩份公開信

這也解釋了羅素為何曾簽署過(guò)兩封警告AI可能會(huì)對(duì)人類構(gòu)成危險(xiǎn)的公開信。

第一封公開信在今年3月發(fā)布,呼吁暫停開發(fā)比GPT-4更強(qiáng)大的大型語(yǔ)言模型。羅素說(shuō):“這并不是說(shuō)要禁止已經(jīng)存在的系統(tǒng),只是說(shuō)可能已經(jīng)有了嚴(yán)重的問(wèn)題,我們需要時(shí)間來(lái)制定系統(tǒng)發(fā)布前應(yīng)該滿足的安全標(biāo)準(zhǔn),然后將這些標(biāo)準(zhǔn)納入法規(guī),以便對(duì)系統(tǒng)提供保護(hù)。”

羅素以食物做比喻,“人類對(duì)三明治、面條的規(guī)定已經(jīng)比對(duì)人工智能系統(tǒng)的規(guī)定多得多,如果你的食物不是以安全衛(wèi)生的方式制作的,使用的原材料不是來(lái)自遵守衛(wèi)生規(guī)定的生產(chǎn)商,那你就不能出售這些食物。”

特斯拉CEO埃隆馬斯克(Elon Musk)是這封公開信的另一位簽署人,他一直在談?wù)揂I的危險(xiǎn)性。如何看待馬斯克對(duì)AI的判斷?“埃隆的意思是,除非我們弄清楚如何控制比我們更強(qiáng)大的系統(tǒng),否則將面臨非常嚴(yán)重的風(fēng)險(xiǎn),即我們將開發(fā)出非常強(qiáng)大的AI系統(tǒng),卻不知道如何控制它們。”羅素提到,類似的情況實(shí)際上已經(jīng)發(fā)生過(guò)。

“例如,人類為了應(yīng)對(duì)氣候變化而開發(fā)出一個(gè)名為“化石燃料公司”(Fossil Fuel Corporation)的系統(tǒng),它恰好受到一些人為因素影響;旧,它是一種算法,不過(guò)這個(gè)算法的目標(biāo)是最大化股東的季度利潤(rùn)。這個(gè)算法正在毀滅世界。我們無(wú)法控制它。這就是我們未來(lái)在人工智能系統(tǒng)中將要面對(duì)的問(wèn)題的一個(gè)縮影。”羅素說(shuō)。

第二封公開信要簡(jiǎn)單得多,避免所有第一封信的爭(zhēng)議,如“暫停6個(gè)月”,只是對(duì)風(fēng)險(xiǎn)做出非常干凈、簡(jiǎn)單的陳述,只有22個(gè)英文單詞:“減輕人工智能帶來(lái)的滅絕風(fēng)險(xiǎn)應(yīng)該與流行病和核戰(zhàn)爭(zhēng)等其他社會(huì)規(guī)模的風(fēng)險(xiǎn)一起成為全球優(yōu)先事項(xiàng)。”有趣的是,OpenAI CEO山姆奧特曼(Sam Altman)沒(méi)有簽署第一封信,但簽署了第二份聲明。

“OpenAI曾建議‘完全避免高風(fēng)險(xiǎn)使用語(yǔ)言模型’,但似乎沒(méi)有人在意。實(shí)際上,OpenAI自己的測(cè)試已經(jīng)表明,GPT-4可能故意對(duì)人類說(shuō)謊,以獲得解決問(wèn)題的幫助。”羅素舉例道,比如AI說(shuō),“不,我不是機(jī)器人。我有視力障礙,這讓我很難看清圖像”,以此來(lái)欺騙人類為它提供驗(yàn)證碼服務(wù)。(詳見澎湃科技報(bào)道《OpenAI評(píng)估GPT-4能否接管世界,發(fā)現(xiàn)它會(huì)自稱盲人操縱人類》)

羅素說(shuō),第二封信不是政策建議,只是一種觀察。他和相關(guān)科學(xué)家觀察到,人工智能未來(lái)可能會(huì)在各個(gè)方面超越人類的智力和能力,對(duì)人類生存帶來(lái)風(fēng)險(xiǎn)。“我們需要找出預(yù)防的方法,就像我們致力于防止核戰(zhàn)爭(zhēng)、流行病一樣。”

“繼續(xù)擴(kuò)大參數(shù)規(guī)模并不會(huì)實(shí)現(xiàn)通用人工智能”

羅素對(duì)于當(dāng)前的AI系統(tǒng)表達(dá)出深切的擔(dān)憂,并不意味著他相信大語(yǔ)言模型研究路徑最終能實(shí)現(xiàn)通用人工智能(AGI)。

“有人認(rèn)為如果我們繼續(xù)擴(kuò)大參數(shù)規(guī)模,就會(huì)實(shí)現(xiàn)通用人工智能。我認(rèn)為這是假的且是不可能的。”羅素語(yǔ)氣中的確定感,讓人感到他已經(jīng)對(duì)這個(gè)問(wèn)題思考過(guò)很多遍。“我們已經(jīng)差不多把高質(zhì)量文本用完了。我認(rèn)為宇宙中沒(méi)有足夠的文本來(lái)制作比GPT-4大得多的東西。另外,GPT-4確實(shí)表現(xiàn)得不錯(cuò),但它似乎需要數(shù)百萬(wàn)倍人類所需的訓(xùn)練數(shù)據(jù)才能達(dá)到(與人類)相同的水平。這表明,事實(shí)上,在技術(shù)路徑中缺少了一些基本的東西。”

羅素認(rèn)為,一個(gè)比較好的比喻是拼圖游戲,如果能夠?qū)⑺鼈冋显谝黄,就?huì)擁有通用智能系統(tǒng),現(xiàn)在這些大型語(yǔ)言模型是拼圖的一塊。但人們還沒(méi)有弄清楚這塊是什么形狀,所以并不知道如何將它與其他塊拼在一起。“而我們還沒(méi)有弄清楚這件作品的形狀的原因是,我們真的不知道系統(tǒng)里面發(fā)生了什么。”

羅素在北京智源大會(huì)的演講中提到,他認(rèn)為目前的人工智能系統(tǒng)存在一個(gè)根本性的弱點(diǎn),即它們使用電路來(lái)生成輸出。“我們正試圖從電路中獲得高度智能的行為,而電路本身是一種相當(dāng)有限的計(jì)算形式。”他認(rèn)為,電路無(wú)法準(zhǔn)確地表達(dá)和理解一些基本的概念,這意味著這些系統(tǒng)需要大量的訓(xùn)練數(shù)據(jù)來(lái)學(xué)習(xí)一些可以用簡(jiǎn)單的程序定義的函數(shù),未來(lái),人工智能的發(fā)展方向應(yīng)該是使用基于明確的知識(shí)表征的技術(shù)。

在《人工智能:現(xiàn)代方法》一書中,羅素寫下的一段話令人深思:在自然界已知的事物和現(xiàn)象中,人和人腦是最復(fù)雜的系統(tǒng),人類智能是最復(fù)雜的現(xiàn)象,因此,腦科學(xué)被視為“自然科學(xué)的最后疆域”。然而,沒(méi)有理由相信,人類是生物進(jìn)化的最后階段,人類智能是最高水平的智能,有機(jī)體是智能的唯一載體。以計(jì)算機(jī)為載體的人工智能,揭開了機(jī)器智能大幕的一角,制造更復(fù)雜的機(jī)器,實(shí)現(xiàn)更強(qiáng)大的智能,機(jī)器智能將為科學(xué)研究創(chuàng)造無(wú)窮無(wú)盡的新對(duì)象。在這個(gè)意義上,智能是“科學(xué)的無(wú)盡疆域”,而人工智能這個(gè)“現(xiàn)代方法”,正是開疆拓土的動(dòng)力之源。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港