展會(huì)信息港展會(huì)大全

張鈸院士:大模型存在難以逾越的天花板,必須建立可解釋AI理論
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-16 18:16:12   瀏覽:21415次  

導(dǎo)讀:GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機(jī)器人,也就是具身智能。張鈸認(rèn)為不一定要做人形機(jī)器人,不需要把硬件搞得非常復(fù)雜,他主張以一定的硬件為基礎(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí)研究。 全世界對(duì)大模型強(qiáng)大的生成能力、遷移能力、交互能力感...

GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機(jī)器人,也就是具身智能。張鈸認(rèn)為不一定要做人形機(jī)器人,不需要把硬件搞得非常復(fù)雜,他主張以一定的硬件為基礎(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí)研究。

全世界對(duì)大模型強(qiáng)大的生成能力、遷移能力、交互能力感到驚訝卻無法解釋,只能歸結(jié)為“涌現(xiàn)”。為了人工智能產(chǎn)業(yè)的健康發(fā)展,必須將科學(xué)研究、技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展結(jié)合起來。要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論和方法,否則AI技術(shù)永遠(yuǎn)難以令人相信。

大語言模型存在天花板。

“通向通用人工智能的道路雖然依然艱難,但大語言模型為AI產(chǎn)業(yè)的發(fā)展打開一條通向通用AI寬廣的道路。”1月16日,中文認(rèn)知大模型企業(yè)北京智譜華章科技有限公司(以下簡(jiǎn)稱“智譜AI”)舉辦的2024年度技術(shù)開放日上,中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院院長(zhǎng)、清華大學(xué)計(jì)算機(jī)系教授張鈸表示,大模型提供了發(fā)展通用硬件和軟件的機(jī)會(huì)。

傳統(tǒng)AI范式利用特定的算法和規(guī)則完成特定任務(wù),生成式AI范式是基于一種稱為基礎(chǔ)模型的通用模型,通過廣泛文本數(shù)據(jù)的訓(xùn)練,在開領(lǐng)域(open domain,開域)內(nèi)可以生成類似于人類水平的高質(zhì)量文本、圖像和其他內(nèi)容,通過微調(diào)等方式可適配于廣泛的下游任務(wù)。生成式AI向通用AI邁出一步,第二步是AI智能體,第三步則是具身智能。張鈸表示,GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機(jī)器人,也就是具身智能。具身智能的提出有助于構(gòu)造完整的智能體,讓智能體既有感知,又有思考。“不一定要做人形機(jī)器人,因?yàn)楹芏鄷r(shí)候只要用手或腳就可以了,不需要把硬件搞得非常復(fù)雜。”他主張以一定的硬件為基礎(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí)研究。

生成式AI大模型具備三大能力和一大缺點(diǎn),即強(qiáng)大的生成能力、強(qiáng)大的遷移(推廣)能力、強(qiáng)大的交互能力和幻覺。強(qiáng)大的語言生成能力可基于上下文和過去的對(duì)話,在開領(lǐng)域能夠生成多樣性令人驚訝的類似人類的連貫文本。強(qiáng)大的遷移能力可在代理任務(wù)上訓(xùn)練一個(gè)模型,通過細(xì)調(diào)適配到感興趣的下游任務(wù)。強(qiáng)大的交互能力包括與人類的交互(人機(jī)交互)、機(jī)器之間的交互(多智能體)、與環(huán)境的交互(具身智能),通過交互在不同專業(yè)和科學(xué)的測(cè)試基準(zhǔn)上表現(xiàn)出人類水平的智能。而針對(duì)幻覺,大模型有時(shí)會(huì)生成看似合理的編造或無意義的答案。

人工智能有助于推動(dòng)經(jīng)濟(jì)增長(zhǎng),建筑、維護(hù)、安裝等行業(yè)難以被自動(dòng)化和智能化,但行政管理等白領(lǐng)工作或被AI替代。AI可提高大多數(shù)人類工作的質(zhì)量和效率,但被AI完全替代的工作仍是少數(shù)。之所以AI還不能替代大多數(shù)工作,是因?yàn)榇竽P瓦存在難以逾越的天花板。張鈸表示,大模型的所有工作都是外部提示而非主動(dòng),并且在外部提示的情況下利用概率預(yù)測(cè)完成任務(wù),而人類的工作依靠?jī)?nèi)部意圖驅(qū)動(dòng)。大語言模型生成語言與人類語言生成只是行為上的相似性,而內(nèi)在機(jī)制根本不同,大語言模型存在不自知、質(zhì)量不可控、不可信、不魯棒等天花板,給出不同的提示詞,大模型會(huì)輸出不同的回答。大模型也會(huì)產(chǎn)生幻覺,“不管模型多么大,幻覺這個(gè)缺點(diǎn)一直存在。”

他提出,要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論和方法,發(fā)展安全、可控、可信、可靠、可擴(kuò)展的AI技術(shù),推動(dòng)AI的創(chuàng)新應(yīng)用和產(chǎn)業(yè)化。如果不能建立可解釋和魯棒的人工智能理論,AI技術(shù)是不可靠的,AI技術(shù)永遠(yuǎn)難以令人相信。“到現(xiàn)在為止,這個(gè)理論還沒有建立起來,這也是人工智能之所以發(fā)展緩慢和曲折的原因。理論建立不起來,是因?yàn)槭艿饺齻(gè)特定限制,過去只能在特定領(lǐng)域利用特定模型解決特定任務(wù),這怎么可能建立通用理論?大模型的出現(xiàn)為建立這個(gè)理論提供了可能性。”

張鈸表示,大模型為我們提供了發(fā)展通用硬件和軟件的機(jī)會(huì)。人工智能正進(jìn)入穩(wěn)步發(fā)展的階段,對(duì)各行各業(yè)有巨大影響,必須抓住機(jī)遇發(fā)展人工智能產(chǎn)業(yè)。但仍有大量不確定性,因?yàn)锳I不可預(yù)測(cè)、不可控。全世界對(duì)大模型強(qiáng)大的生成能力、遷移能力、交互能力感到驚訝,卻無法解釋,只能歸結(jié)為“涌現(xiàn)”。所以為了人工智能產(chǎn)業(yè)的健康發(fā)展,必須將科學(xué)研究、技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展結(jié)合起來。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港