展會信息港展會大全

生成式人工智能會塑造信息繭房?復(fù)旦教授揭示如何讓危機(jī)“已知”
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-21 19:08:45   瀏覽:7411次  

導(dǎo)讀:【編者按】 2023年5月27日,是復(fù)旦大學(xué)118周年校慶。校慶種種活動(dòng),以促進(jìn)科學(xué)研究為中心。從1954年校慶前夕時(shí)任校長陳望道提出這一主張開始,在校慶期間舉辦科學(xué)報(bào)告會,成為復(fù)旦的重要學(xué)術(shù)傳統(tǒng)之一。 賡續(xù)學(xué)術(shù)傳統(tǒng),百年弦歌不絕。5月9日起,來自文社理工...

【編者按】

2023年5月27日,是復(fù)旦大學(xué)118周年校慶。“校慶種種活動(dòng),以促進(jìn)科學(xué)研究為中心。”從1954年校慶前夕時(shí)任校長陳望道提出這一主張開始,在校慶期間舉辦科學(xué)報(bào)告會,成為復(fù)旦的重要學(xué)術(shù)傳統(tǒng)之一。

賡續(xù)學(xué)術(shù)傳統(tǒng),百年弦歌不絕。5月9日起,來自文社理工醫(yī)各學(xué)科的50多位復(fù)旦名師將陸續(xù)帶來學(xué)術(shù)演講。

“2023相輝校慶系列學(xué)術(shù)報(bào)告”第十場,由復(fù)旦大學(xué)國家智能評價(jià)與治理實(shí)驗(yàn)基地副主任、大數(shù)據(jù)研究院教授趙星,與浙江大學(xué)公共管理學(xué)院信息資源管理系“百人計(jì)劃”研究員蔣卓人于線上線下共話“生成式人工智能的挑戰(zhàn)與治理”。

活動(dòng)現(xiàn)常 本文均為 復(fù)旦大學(xué) 供圖

從2011年蘋果手機(jī)首次推出的Siri語音助手,到今年包攬奧斯卡七大獎(jiǎng)項(xiàng)的電影《瞬息全宇宙》,生成式人工智能早已融入人類生活。當(dāng)下,ChatGPT類工具進(jìn)一步引爆全球人工智能熱潮,趙星和蔣卓人攜手帶來一場貫穿生成式人工智能前世、今生和未來的學(xué)術(shù)盛宴,解析生成式人工智能帶來的多重挑戰(zhàn),啟發(fā)我們對其治理問題的思考。

生成式人工智能的前世今生

金色的夕陽被烏云遮住,小草在風(fēng)雨中搖曳,水珠在葉片上滾動(dòng)……蔣卓人首先播放了一段名為“Summer showers”(《夏日陣雨》)的視頻。這段充滿靈動(dòng)色彩和生動(dòng)風(fēng)景的視頻,卻完全是由生成式人工智能模型創(chuàng)作的。

何為生成式人工智能?

目前,生成式人工智能還沒有統(tǒng)一的定義,一般可以理解為一種能夠根據(jù)提示生成文本、圖像或其他媒體信息的人工智能系統(tǒng)。

“這個(gè)技術(shù)不是像魔法一樣憑空出現(xiàn)的,而是有著悠久的歷史淵源。”蔣卓人強(qiáng)調(diào)。在生成式人工智能90多年的發(fā)展歷程中,不乏人類智慧閃耀的時(shí)刻。

1932年,法國工程師Georges Artsrouni創(chuàng)造了裝置“mechanical pain”(機(jī)器大腦)。它通過查詢多功能詞典完成翻譯,輸入、輸出都是一條紙帶。蔣卓人認(rèn)為,雖然它和今天的機(jī)器翻譯不同,但它完全符合今天對生成式人工智能的定義,即人類輸入一段內(nèi)容,機(jī)器產(chǎn)生一段新的內(nèi)容。

在20世紀(jì)中,麻省理工學(xué)院創(chuàng)造了最早的生成式人工智能之一Eliza,Judea Peal(朱迪亞珀?duì)枺┮肓素惾~斯網(wǎng)絡(luò)因果分析概念,Yann Lecun(楊立昆)等展示了如何利用卷積神經(jīng)網(wǎng)絡(luò)來識別圖像……

2006年,華裔計(jì)算機(jī)科學(xué)家李飛飛著手構(gòu)建數(shù)據(jù)庫ImageNet。該數(shù)據(jù)庫中有超過1400萬張手工標(biāo)注的圖片,包含超過2萬個(gè)類別。“正是有了這樣一個(gè)龐大數(shù)據(jù)庫的支撐,深度學(xué)習(xí)才能得以興起。所以我們總說,好的科研品位,加上持續(xù)不斷的努力,就能成就一段好的學(xué)術(shù)生涯。”蔣卓人評價(jià)。

ChatGPT何以成為明星產(chǎn)品?

1750億參數(shù)量,3000億訓(xùn)練單詞數(shù),這是ChatGPT的數(shù)據(jù)。2022年發(fā)布后,ChatGPT在短短兩個(gè)月內(nèi)吸引了超過1億的用戶,成為有史以來用戶增長最快的應(yīng)用。

蔣卓人認(rèn)為,要理解ChatGPT,就要理解它的關(guān)鍵技術(shù):大模型基礎(chǔ)訓(xùn)練、指令微調(diào)、人類反饋強(qiáng)化學(xué)習(xí)。

“大模型的全稱是大型語言模型,”蔣卓人講道,“它是一種概率模型,能告訴你一個(gè)詞出現(xiàn)的概率是多少。”

蔣卓人教授

比如,在The students opened their這句英文后面,可以出現(xiàn)books、laptops、exams、minds等詞。“但它們出現(xiàn)的概率是不一樣的。一個(gè)好的語言模型,能精準(zhǔn)地預(yù)測下一個(gè)詞是什么。”蔣卓人說。

隨著語言模型的發(fā)展,它具備了良好的語言理解能力,但如何讓其與人類建立對話呢?

研究者們提出的辦法是指令微調(diào)。通過引入思維鏈以及代碼生成,大模型的推理能力得以提升。“這種能力對于大模型來說至關(guān)重要,使其可以在開放領(lǐng)域有很好的表現(xiàn)。”蔣卓人評價(jià)。

至此,大模型初步具備了回答人們提出的任何指令的可能,但回答的質(zhì)量卻參差不齊,如何讓大模型持續(xù)性地輸出高質(zhì)量回答呢?

研究者們又為此設(shè)計(jì)了一套基于人類反饋的強(qiáng)化學(xué)習(xí)方法,即通過大模型的微調(diào)、獎(jiǎng)勵(lì)函數(shù)的訓(xùn)練、以及大規(guī)模強(qiáng)化學(xué)習(xí)的優(yōu)化來確保高質(zhì)量回答的生成。“OpenAI就是使用這種方法,大幅度降低了數(shù)據(jù)集構(gòu)建成本。”蔣卓人說。

生成式人工智能:新智能面臨新挑戰(zhàn)

面對生成式人工智能帶來的挑戰(zhàn),趙星從資源、技術(shù)、應(yīng)用與社會倫理四個(gè)維度進(jìn)行解讀。

從資源維度來看,生成式人工智能需要高質(zhì)量的數(shù)據(jù),而中文世界的數(shù)據(jù)質(zhì)量弱于英文。趙星認(rèn)為,即使有很強(qiáng)大的翻譯能力,類ChatGPT工具的中文處理效果也顯著弱于英文,核心的原因之一是投喂的中文數(shù)據(jù)質(zhì)量較差。另外,硬件技術(shù)也是支撐我國人工智能產(chǎn)業(yè)高速發(fā)展的關(guān)鍵要素。

趙星教授

“科技界曾將人工智能的應(yīng)用比作煉金術(shù),”趙星打趣道,“人們將數(shù)據(jù)一股腦往模型里面扔,至于能否煉出有價(jià)值的東西,煉出的是什么,卻沒有明確的預(yù)期。”很明顯,在技術(shù)層面上生成式人工智能存在內(nèi)生的不確定性。

“當(dāng)我們準(zhǔn)備向全社會投放一種通用性工具,卻不能明確它的科學(xué)原理是什么,就一定會有內(nèi)生性的風(fēng)險(xiǎn)。”人工智能風(fēng)險(xiǎn)中最核心的一點(diǎn)在于其結(jié)果的不可承受性。“我們很少在治理問題上處于如此無力的狀態(tài),”趙星說。在應(yīng)用層面上,生成式人工智能產(chǎn)業(yè)發(fā)展的確定性與風(fēng)險(xiǎn)治理的不確定性將長期存在。

而在社會方面,生成式人工智能不僅深陷知識產(chǎn)權(quán)與信息泄露問題,或也將塑造真正的信息繭房。“當(dāng)生成式人工智能24小時(shí)都陪伴你身邊,潛移默化地,你會誤認(rèn)為一切都是你自己的決定。”

趙星警示,“我們面對的,是一個(gè)會在短時(shí)間內(nèi)崛起,或?qū)⒁饑?yán)重后果且后果未知的事物。”

內(nèi)生安全治理:讓危機(jī)“已知”

面對生成式人工智能這個(gè)新對手,趙星認(rèn)為不能沿用傳統(tǒng)治理“被動(dòng)回應(yīng)外在威脅”的方法。相反,他的團(tuán)隊(duì)正在著眼于借助復(fù)旦大學(xué)大數(shù)據(jù)研究院院長鄔江興院士提出的“內(nèi)生安全理論”,構(gòu)建生成式人工智能治理的新模型。

“我們能否在未知的風(fēng)險(xiǎn)爆發(fā)之前找到抵抗它的辦法?這是生成式人工智能內(nèi)生安全治理要解決的問題。”趙星說,“我們需要在人工智能風(fēng)險(xiǎn)來臨前,給人類社會點(diǎn)亮一棵新的技能樹:應(yīng)對人工智能非傳統(tǒng)安全問題的能力。”

生成式人工智能的治理模型涵蓋了三個(gè)層面。最外層是法律的監(jiān)督與規(guī)約,中間層是管理層的敏捷治理,尤為強(qiáng)調(diào)的最內(nèi)層是教育。在法律和政府治理之前,高等院校應(yīng)和所有的教育機(jī)構(gòu)一起,完成針對全人類的社會性融合人工智能的教育和訓(xùn)練。

“我們應(yīng)當(dāng)在每一位年輕人的成長過程中,讓他們學(xué)會如何與人工智能良好共處與規(guī)避‘信息繭房’,以及如何去做一個(gè)智能社會中的‘好人’。”

內(nèi)生安全治理模型的原理,是基于群體智能將個(gè)體“未知的未知”轉(zhuǎn)化為群體“已知的未知”,從而進(jìn)一步將其轉(zhuǎn)化為“已知的已知”。

“當(dāng)我們知道可能的風(fēng)險(xiǎn)是什么、產(chǎn)生在何處,生成式人工智能治理便有機(jī)會轉(zhuǎn)化為常規(guī)性安全問題,我們就能嘗試尋求到治理閉環(huán)的實(shí)現(xiàn)。”趙星說,“然而這仍需要理論、實(shí)踐上長期的探索。”

趙星團(tuán)隊(duì)也開始探索生成式人工智能在科學(xué)評價(jià)中的應(yīng)用,創(chuàng)新構(gòu)建了“客觀數(shù)據(jù)、智能算法、專家評議”三者和諧共生的“數(shù)智人”評價(jià)與治理新范式。近期團(tuán)隊(duì)也在開展利用類ChatGPT工具進(jìn)行智能評價(jià)系統(tǒng)構(gòu)建的探索實(shí)驗(yàn)。

“初步結(jié)果顯示,雖然現(xiàn)階段的生成式人工智能遠(yuǎn)沒到能勝任學(xué)術(shù)評價(jià)這樣的嚴(yán)肅評價(jià)工作的程度,”趙星表示,“但生成式人工智能表現(xiàn)出的“跨學(xué)科”評價(jià)能力和“涌現(xiàn)”推斷預(yù)測潛力值得高度關(guān)注。”

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港