當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > 專訪智源院長王仲遠(yuǎn)：當(dāng)模型參數(shù)超過千萬億級別就可能超越人類大腦

專訪智源院長王仲遠(yuǎn)：當(dāng)模型參數(shù)超過千萬億級別就可能超越人類大腦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-07 12:19:35 瀏覽：0次

導(dǎo)讀：注意，人機(jī)共存的時(shí)代不遠(yuǎn)了！可當(dāng)AI無所不能，人類做什么？訪談丨薛芳對話整理丨嘉林編輯丨薛芳出品丨深網(wǎng)騰訊新聞小滿工作室“叔叔，如果人工智能什么都能做了，我們未來能做什么？”一個(gè)小姑娘站起來問智源研究院院長王仲遠(yuǎn)。去年3月，王仲遠(yuǎn)去北京的一所小學(xué)講了一堂人工智能的課，小朋友們發(fā)現(xiàn)他們的課程作業(yè)人工智能都能回答得非常好。這個(gè)問題擊中了王仲遠(yuǎn)的心靈，一直 ......

注意，人機(jī)共存的時(shí)代不遠(yuǎn)了！可當(dāng)AI無所不能，人類做什么？

訪談丨薛芳對話整理丨嘉林編輯丨薛芳

出品丨深網(wǎng)科技新聞小滿工作室

“叔叔，如果人工智能什么都能做了，我們未來能做什么？”一個(gè)小姑娘站起來問智源研究院院長王仲遠(yuǎn)。去年3月，王仲遠(yuǎn)去北京的一所小學(xué)講了一堂人工智能的課，小朋友們發(fā)現(xiàn)他們的課程作業(yè)人工智能都能回答得非常好。

這個(gè)問題擊中了王仲遠(yuǎn)的心靈，一直在AI前沿的他內(nèi)心并沒有很明確的答案。2023年2月，王仲遠(yuǎn)履新智源研究院院長。王仲遠(yuǎn)講話語速適中，氣質(zhì)沉穩(wěn)而內(nèi)斂。他過往的工作經(jīng)歷，十年磨一劍，霜刃未曾試。

此前，他曾擔(dān)任過微軟亞洲研究院的主任研究員，負(fù)責(zé)知識圖譜項(xiàng)目和對話機(jī)器人項(xiàng)目；也曾入職Facebook ，擔(dān)任計(jì)算機(jī)科學(xué)家；2018年，王仲遠(yuǎn)入職美團(tuán)，用半年就領(lǐng)導(dǎo)團(tuán)隊(duì)構(gòu)建出世界上最大的知識圖譜“美團(tuán)大腦”。

他重新做出了選擇從研究院到公司，再從公司回到研究院，用了十五年時(shí)間，他從最初知春路的希格瑪?shù)浆F(xiàn)在五道口的智源大廈，距離2.7公里。當(dāng)然，這種選擇的背后王仲遠(yuǎn)看到了整個(gè)AI領(lǐng)域未來已來。

過去這些年，AI三次引發(fā)了公眾的關(guān)注。1997年，IBM的超級計(jì)算機(jī)深藍(lán)戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫；第二次則是2016年3月，AlphaGo在圍棋人機(jī)大戰(zhàn)中擊敗圍棋世界冠軍李世石；第三次是2023年直到一家叫OpenAI的公司打開了通往未來的星際之門。

“大模型帶來的技術(shù)突破，徹底解決了過去幾十年一直都無法攻克的一個(gè)難題自然語言理解與邏輯推理。以2023年為界限，之前是弱人工智能時(shí)代，而之后很有可能進(jìn)入通用人工智能時(shí)代，這里面有很多技術(shù)問題需要突破�！蓖踔龠h(yuǎn)闡述。

可以想象王仲遠(yuǎn)內(nèi)心的震動和興奮。他一直以來的夢想就是希望能推動人工智能技術(shù)的發(fā)展。那么，智源研究院無疑是在那個(gè)時(shí)間節(jié)點(diǎn)最能實(shí)現(xiàn)夢想的地方。“智源是一家非營利性機(jī)構(gòu)，定位是做高校做不了，企業(yè)不愿意做的事情。”王仲遠(yuǎn)闡述。

2018年，北京智源人工智能研究院成立。智源研究院是中國最早開展AI大模型研究的機(jī)構(gòu)之一，也被稱作“AI大模型的黃埔軍�！薄Ｖ亲VAI創(chuàng)始人唐杰、月之暗面創(chuàng)始人楊植麟、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)、以及行業(yè)內(nèi)的大模型領(lǐng)軍人物或技術(shù)骨干不少等都曾參與過智源研究院的大模型項(xiàng)目。

去年 3 月，微軟總裁Brad Smith在采訪中說全球有三家頂尖的AI機(jī)構(gòu)， Open AI，Google和北京智源人工智能研究院。智源研究院的創(chuàng)始人張宏江和前院長黃鐵軍的珠玉在前，成為這樣一家機(jī)構(gòu)的掌舵人，對于1985年出生的王仲遠(yuǎn)來說，肩上擔(dān)子并不輕。

王仲遠(yuǎn)不僅僅是一個(gè)科學(xué)家，智源研究院的負(fù)責(zé)人，他更像一個(gè)創(chuàng)業(yè)者。

“智源研究院致力于成為人工智能創(chuàng)新引領(lǐng)者，那么如何做出突破性的成果？我們的技術(shù)路線判斷是否正確？如何匯集最優(yōu)秀的人才？人工智能造福人類的同時(shí)如何做到安全可控？怎樣獲取可持續(xù)發(fā)展的資源和算力？”這些都是王仲遠(yuǎn)一直在思考的問題，也是他要解決的問題。

整個(gè)過程中，焦慮是存在的。在王仲遠(yuǎn)看來，人在對抗焦慮的過程中才會有進(jìn)步，焦慮往往會轉(zhuǎn)化為他前行的動力。對他來說，“我自己會冥想、聽音樂、旅游，與人交流，用開放的心態(tài)去對抗焦慮�！�

焦慮，僅僅是一種情緒。那個(gè)小女孩的提問一直在王仲遠(yuǎn)腦海里縈繞，“我不能說有比較明確的答案，但我感受到了的責(zé)任。這個(gè)責(zé)任是既要促進(jìn)人工智能的發(fā)展，為各行各業(yè)賦能，同時(shí)，要確保人工智能足夠的安全，不會傷害人類�！�

世界模型一定是未來的技術(shù)發(fā)展的路徑

《AI光年》：2024諾貝爾物理學(xué)獎獲得者、“AI教父”Geoffrey Hinton（杰弗里辛頓）教授認(rèn)為，在AI領(lǐng)域，生物智能最終戰(zhàn)勝了機(jī)器智能，您怎么看？

王仲遠(yuǎn)：今年 3 月智源研究院舉辦的北京 AI 安全國際對話上，辛頓教授分享，他終于想明白了為什么數(shù)字智能一定會超越生物智能。人類大腦的神經(jīng)網(wǎng)絡(luò)不能直接復(fù)制給另外一個(gè)人，每個(gè)人學(xué)習(xí)所形成的神經(jīng)網(wǎng)絡(luò)都是獨(dú)一無二的。不能把一個(gè)高智商的人的參數(shù)復(fù)制給另外一個(gè)人，使其具備同樣的智能，但機(jī)器可以復(fù)制。

如果不考慮能耗的情況之下，機(jī)器智能有它獨(dú)特的優(yōu)勢。當(dāng)我們訓(xùn)練出一個(gè)非常強(qiáng)大的人工智能神經(jīng)網(wǎng)絡(luò)，它存在數(shù)字世界里，可以非常容易復(fù)制，每一個(gè)模型可以繼續(xù)訓(xùn)練變得更優(yōu)秀。只要模型的性能還能夠持續(xù)提升，復(fù)制效率和學(xué)習(xí)效率比人類高得多。人類的學(xué)習(xí)效率其實(shí)非常低，我們只能讀幾千本、幾萬本書，但是機(jī)器可以把人類歷史上的所有的書籍都閱讀完。未來當(dāng)人工智能寫的書籍比人類書籍質(zhì)量還高時(shí)，這種合成的數(shù)據(jù)就可能反哺智能進(jìn)一步的提升。

《AI光年》：OpenAI的草莓目前好像部分地解決了大模型的幻覺問題，你怎么看？

王仲遠(yuǎn)：幻覺是阻礙大模型產(chǎn)業(yè)化落地的一個(gè)問題。這個(gè)問題不會被消除，但是會被不斷地改進(jìn)，直到控制在一定的范圍內(nèi)。

事實(shí)上，難道人類就沒有“幻覺”問題嗎，就能確保說的每句話都是正確的嗎？關(guān)鍵還是幻覺比例的問題，以及是否知道可能出現(xiàn)幻覺。產(chǎn)業(yè)界當(dāng)前通過信息檢索增強(qiáng)的方案來作為解決幻覺問題的解法之一，智源研究院所研發(fā)的 BGE 模型，它是一種檢索增強(qiáng)的模型，近期登頂了全球AI開源社區(qū)Hugging Face月度模型下載量榜首，成為了在信息檢索增強(qiáng)方向非常重要的模型。當(dāng)大模型需要回答法律、醫(yī)療或者產(chǎn)品的問題，必須有根有據(jù)。通過基于知識庫的文檔檢索增強(qiáng)，增強(qiáng)模型回答的準(zhǔn)確性，所以這是一個(gè)非常重要的基礎(chǔ)模型。

Open AI的草莓模擬的是人腦的思考過程，會反思，糾正自己的錯(cuò)誤，直到找到一個(gè)可能的答案。這樣的雙系統(tǒng)（快系統(tǒng)和慢系統(tǒng)）未來會逐漸成為主流。檢索系統(tǒng)也是一種路徑。正�；卮饐栴}時(shí)，如果知道這個(gè)答案就直接回答，不知道可能就會去搜索、查資料再來回答這個(gè)問題，搜索和查資料就是檢索增強(qiáng)。

《AI光年》：ChatGPT 被認(rèn)為是大腦的模擬器，Sora被稱為物理世界的模擬器。多模態(tài)會不會是未來的趨勢？

王仲遠(yuǎn)：人工智能的研究都會參考人腦的工作機(jī)制。人腦雖然有不同的分區(qū)，但它是一個(gè)整體的結(jié)構(gòu)。人腦不僅僅處理文字信息，還處理很多模態(tài)的信息，聲音、圖像乃至更復(fù)雜、更多元的信號。所以我們相信，統(tǒng)一原生的多模態(tài)大模型一定是未來的技術(shù)發(fā)展路徑。

當(dāng)前多模態(tài)技術(shù)仍然沒有收斂，行業(yè)在做多模態(tài)的理解與生成所使用的技術(shù)路線是完全不一樣的。智源研究院在研究一套能夠?qū)⒍呓y(tǒng)一的原生多模態(tài)世界模型的技術(shù)路線。行業(yè)現(xiàn)在多模態(tài)生成模型基本上走的是 Diffusion Transformer 這樣的 DiT 基礎(chǔ)路線，理解模型通常都是以語言模型為核心，再把視覺信號、其他信號映射到語言模型這樣的一條技術(shù)路線。這種圖像生成和視頻生成的效果確實(shí)非常驚艷。

但是兩者需要合為一嗎？不同的科學(xué)家有不同的觀點(diǎn)。不過，我們相信，多模態(tài)生成模型和多模態(tài)理解模型是要統(tǒng)一的。因?yàn)槿说拇竽X是有視頻生成能力的，我們每一天都在做夢，大腦每一天都在產(chǎn)生各種各樣的畫面和場景。這種生成能力也很可能會成為校準(zhǔn)理解能力的信號，從而進(jìn)一步提升理解能力。最后的世界模型是更接近人腦的，不僅要理解、推理世界，還要能跟這個(gè)世界交互。

《AI光年》：你剛才談到了兩種技術(shù)路線，這兩種技術(shù)路線有沒有難易之說？

王仲遠(yuǎn)：不是這兩種技術(shù)路線的難易，而是我們要走一條全新的技術(shù)路線，叫原生多模態(tài)世界模型的技術(shù)路線，國內(nèi)沒有幾個(gè)團(tuán)隊(duì)在嘗試這條技術(shù)路線，因?yàn)樗_實(shí)非常難。

智源研究院在過去半年的時(shí)間里攻克了一個(gè)又一個(gè)的基礎(chǔ)難關(guān)，直到今天依然不能說完全攻克，但終于將不同的模態(tài)，將生成和理解的能力壓縮在了一起。希望做到World in one，One for world。這是我們一個(gè)技術(shù)路徑的選擇。這個(gè)路徑的選擇，從創(chuàng)業(yè)的維度來講，有可能會失敗。沒有失敗的科研就不是真正的創(chuàng)新。失敗也是創(chuàng)新的形式之一，是必經(jīng)路徑。但永遠(yuǎn)要有信念，技術(shù)理想。

10月21日，智源研究院基于下一個(gè)token預(yù)測，發(fā)布了原生多模態(tài)世界模型Emu3，無需擴(kuò)散模型或組合方法，即可完成文本、圖像、視頻三種模態(tài)數(shù)據(jù)的理解和生成。下一個(gè)token預(yù)測為構(gòu)建多模態(tài)AGI提供了一條前景廣闊的道路。

國內(nèi)文生視頻領(lǐng)域沒有跳脫舊模式

《AI光年》：今年國內(nèi)的文生視頻領(lǐng)域比較卷，你怎么看待這種現(xiàn)象？

王仲遠(yuǎn)：世界模型和文生視頻模型是兩碼事。當(dāng)前的 DiT 架構(gòu)能否走到世界模型，從技術(shù)路徑判斷上是有爭議的，因?yàn)樗奶旎ò迨怯邢薜�。Autoregressive 的技術(shù)路線天花板高很多。過去的這段時(shí)間，文生視頻模型國內(nèi)發(fā)布的越來越多，有點(diǎn)像去年大語言模型，因?yàn)橐呀?jīng)有一個(gè)機(jī)構(gòu)驗(yàn)證了這條技術(shù)路徑。國內(nèi)很多企業(yè)去跟進(jìn)，這種跟進(jìn)也有價(jià)值和意義。但國內(nèi)所發(fā)布的文生視頻模型并沒有跳脫舊模式，依然是技術(shù)跟隨。

《AI光年》：這么卷有沒有意義？

王仲遠(yuǎn)：短視頻賽道在過去幾年非�；穑纳曨l一定找得到它的業(yè)務(wù)產(chǎn)品和商業(yè)模式。當(dāng)這條技術(shù)路徑效果非常好的時(shí)候，值得去做，因?yàn)橛猩虡I(yè)需求，但是它并不一定是達(dá)到 AGI 的技術(shù)路線。從實(shí)現(xiàn)AGI的角度，當(dāng)前文生視頻的技術(shù)路線不一定是完美的技術(shù)路線。

《AI光年》：去年卷大模型，今年卷文生視頻，一級市場一直有聲音，現(xiàn)在出來了AI 泡沫論，你怎么看？

王仲遠(yuǎn)：任何一項(xiàng)技術(shù)，任何一個(gè)領(lǐng)域，有爭論是一件好事。當(dāng)前的技術(shù)能力、商業(yè)模式是否足以支持資本投入和市場期望？這中間存在分歧。如果僅從技術(shù)路線上來看，2023 年是一個(gè)轉(zhuǎn)折點(diǎn)，是一個(gè)通往通用人工智能時(shí)代的分界線，很有可能是第四次的工業(yè)革命。任何一次工業(yè)革命的周期會很長，技術(shù)突破到產(chǎn)業(yè)化需要周期，我相信這一次人工智能技術(shù)的發(fā)展和突破本身不是泡沫。AI 泡沫論是相對的。原來可能需要 5 - 10 年發(fā)生的事情，大家希望在一年內(nèi)發(fā)生，那么這就是泡沫。

《AI光年》：我之前問過一個(gè)著名投資人，這是不是意味著社會資源的浪費(fèi)？他說是，但也沒辦法�，F(xiàn)在大模型好像依然重復(fù)這條路徑，好像也是沒辦法。你怎么看？

王仲遠(yuǎn)：這證明在中國的這個(gè)市場上有了更加充分的競爭，人才濟(jì)濟(jì)。我們需要的是能夠突破核心技術(shù)的頂尖大模型，這樣會更利于應(yīng)用和產(chǎn)品的到來。大模型是對于算力資源、人才密度要求都非常高的賽道，所以我們希望最終能夠收斂為幾個(gè)基礎(chǔ)大模型，這樣會更利于生態(tài)的發(fā)展。

《AI光年》：你怎樣看待技術(shù)和產(chǎn)業(yè)的關(guān)聯(lián)？

王仲遠(yuǎn)：回顧互聯(lián)網(wǎng)信息技術(shù)、人工智能技術(shù)的發(fā)展，我們會發(fā)現(xiàn)每一次重大技術(shù)革命都有周期性。當(dāng)年的互聯(lián)網(wǎng)出現(xiàn)之后，要有基礎(chǔ)設(shè)施建設(shè)的過程，后面才會有像門戶網(wǎng)站、電子商務(wù)等應(yīng)用形態(tài)和商業(yè)模式的誕生。從 2007年 iPhone1發(fā)布，到2010年 iPhone 4推出，移動互聯(lián)網(wǎng)才真正進(jìn)入到成熟期，再配合當(dāng)時(shí) 4G 發(fā)展進(jìn)入到消費(fèi)級，移動互聯(lián)網(wǎng)的應(yīng)用開始大規(guī)模涌現(xiàn)。

大模型也類似，前幾年智源研發(fā)的悟道系列大模型，當(dāng)時(shí)還處在一個(gè)實(shí)驗(yàn)室階段。到過去這兩年，以 OpenAI 為代表的全球 AI 公司在大模型技術(shù)上不斷創(chuàng)新迭代，使其開始進(jìn)入到產(chǎn)業(yè)界。未來當(dāng)基座大模型進(jìn)入到相對成熟階段時(shí)，基于大模型的應(yīng)用就能迎來蓬勃的發(fā)展。不論是過去還是現(xiàn)在，這都是正常的發(fā)展階段。

《AI光年》：如果投資ChatGPT 、大語言模型或文生視頻模型，如何考慮從投資到實(shí)現(xiàn)商業(yè)化所需的時(shí)間跨度？

王仲遠(yuǎn)：如果是關(guān)注模式、應(yīng)用或產(chǎn)品創(chuàng)新的資本，應(yīng)該看準(zhǔn)時(shí)機(jī)再出手。如果是關(guān)注技術(shù)戰(zhàn)略型的投資，現(xiàn)在正是好時(shí)候。

《AI光年》：AI距離商用還有多遠(yuǎn)？

王仲遠(yuǎn)：在 B 端作為一個(gè)效率工具，已經(jīng)在很多領(lǐng)域有了明確的應(yīng)用，比如，文章摘要、會議紀(jì)要，把非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化，設(shè)計(jì)、廣告、電商等。大家更期待的是一個(gè)面向C端的殺手級應(yīng)用的誕生，這需要天時(shí)地利人和。模型能力提升，成本下降，場景出現(xiàn)，需求解決，當(dāng)這些條件同時(shí)滿足的時(shí)候，基于大模型的超級應(yīng)用才有可能會誕生。C 端用戶對于體驗(yàn)非常敏感，對于很輕微的幻覺問題，都會感知強(qiáng)烈，當(dāng)這些都被解決，殺手級應(yīng)用自然就出現(xiàn)了。

大模型能力提升會造成小模型的顛覆

《AI光年》：Sam Altman發(fā)起過一個(gè)7萬億的芯片計(jì)劃，您怎么看？

王仲遠(yuǎn)：傳言也好，真實(shí)事件也好，最大的問題還是算力成本。縱觀整個(gè)基于神經(jīng)網(wǎng)絡(luò)的人工智能發(fā)展歷程，每一次大的發(fā)展都是算法、數(shù)據(jù)、算力加模型參數(shù)的提升，一次量級的提升就會帶來模型效果的提升。這在過去一年被定義為Scaling law，廣泛傳播。

未來，模型要繼續(xù)擴(kuò)大十倍、百倍的參數(shù)規(guī)模，數(shù)據(jù)量需要十倍、百倍，算力資源也需要十倍、百倍，而當(dāng)下的算力還開不足以支撐。單個(gè)芯片的性能以及集群規(guī)模都需要提升，當(dāng)提升到一定程度，很可能我們會見證新的人工智能發(fā)展階段。

《AI光年》：大小模型之爭是另外一個(gè)技術(shù)維度的問題，還是卷或者競爭維度的問題？

王仲遠(yuǎn)：一方面我覺得大模型會越來越大。10 年后很可能我們今天的模型就已經(jīng)變成了小模型。2018 年 Bert 發(fā)布時(shí)，是億級的參數(shù)量，在那個(gè)時(shí)候幾乎就是世界上最大的模型，但在今天的時(shí)間節(jié)點(diǎn)來看就變成了小模型。所以未來 5 年、 10 年，算力、模型性能進(jìn)一步提升，大模型會越來越大。

但另一方面模型要做小，滿足性能和成本的要求，才能實(shí)現(xiàn)產(chǎn)業(yè)落地。將大模型做小，一種方式是通過技術(shù)的路徑，把同樣的性能壓縮在一個(gè)更小的模型上，另一種方式是推動計(jì)算性能本身的提升，讓算力去承載大模型時(shí)成本足夠低。

《AI光年》：一個(gè)大模型技術(shù)很強(qiáng)，做一些拆解和技術(shù)方面的切割，還是市場全面開花，出現(xiàn)很多大模型？

王仲遠(yuǎn)：如果將大模型比喻為人腦，這個(gè)世界有 70 億人，也就是70億個(gè)大模型。大模型進(jìn)入到各個(gè)領(lǐng)域，各個(gè)行業(yè)，各個(gè)企業(yè)，一定有他自己的領(lǐng)域。這個(gè)問題一直有技術(shù)路線之爭，在我看來，如果大模型的能力特別強(qiáng)，可以通過 API 的方式調(diào)用，但是如果進(jìn)入各行各業(yè)，每個(gè)行業(yè)都有自己獨(dú)特的數(shù)據(jù)，需要對大模型進(jìn)一步訓(xùn)練、對齊、Fine-tuning ，就會產(chǎn)生所謂的領(lǐng)域模型。更有可能的情況是有一個(gè)很強(qiáng)的基礎(chǔ)大模型，又壓縮成小模型，然后進(jìn)入到各個(gè)領(lǐng)域進(jìn)一步的訓(xùn)練，變成這個(gè)領(lǐng)域里面最強(qiáng)的模型，但這僅僅是一個(gè)技術(shù)路線的猜測和判斷。

《AI光年》：那就是強(qiáng)大的通用世界模型，可以取代了各種垂類小模型？

王仲遠(yuǎn)：每一次基礎(chǔ)大模型的能力提升確實(shí)可能帶來小模型的顛覆。但如果類比人，即使是博士畢業(yè)，他進(jìn)入到一個(gè)企業(yè)工作，也依然有學(xué)習(xí)和適應(yīng)的過程。

《AI光年》：那是不是從某種意思來講，只有通用模型才有很強(qiáng)的競爭力？小模型在中國這種市場環(huán)境還是蠻脆弱的？

王仲遠(yuǎn)：要看這個(gè)小模型怎么定義。如果這個(gè)小模型是當(dāng)年弱人工智能的產(chǎn)物，那它的競爭力一定是不穩(wěn)定的。如果這個(gè)小模型是基于大模型的一個(gè)產(chǎn)物，保留了大模型很多的推理能力，那么可能是非常強(qiáng)的。

其實(shí)在 AI 1.0 時(shí)代，已經(jīng)有很多小模型在各行各業(yè)里發(fā)揮作用，但是小模型因?yàn)閰?shù)量和訓(xùn)練語料的問題，能力的天花板是有限的。大模型將能力的天花板實(shí)現(xiàn)了重大提升，但不代表它在這個(gè)領(lǐng)域內(nèi)就能做得非常好，它進(jìn)入到這個(gè)領(lǐng)域依然需要去學(xué)習(xí)。就像我們從小學(xué)、中學(xué)、大學(xué)讀到碩士、博士，但我們進(jìn)入到企業(yè)依然也會接受企業(yè)的培訓(xùn)，再去適應(yīng)這個(gè)行業(yè)，適應(yīng)這個(gè)領(lǐng)域。

《AI光年》：面向未來，有一個(gè)疑問，Scaling law失效了嗎？下一代的模型性能能否有進(jìn)一步的提升？

王仲遠(yuǎn)：我們來看數(shù)據(jù)、算力、這幾個(gè)要素。數(shù)據(jù)方面，全互聯(lián)網(wǎng)的文本數(shù)據(jù)已經(jīng)被用來做模型訓(xùn)練，如果我們不能突破數(shù)據(jù)的局限，模型性能就會遇到瓶頸，目前在一些特定的領(lǐng)域，例如編程，通過模擬器、編譯器，它能驗(yàn)證結(jié)果，用合成的數(shù)據(jù)去模擬人類的思維找到確定答案反哺，也是在解決數(shù)據(jù)不足的問題。另外，全世界的多模態(tài)數(shù)據(jù)是文本數(shù)據(jù)的百倍、千倍，如何有效利用這些數(shù)據(jù)來進(jìn)一步提升模型的能力，也是一個(gè)待解的問題。

算力方面，國外已經(jīng)有 10 萬卡級別的集群，如果我們的參數(shù)要繼續(xù)擴(kuò)大十倍、百倍乃至千倍，10 萬卡依然不夠，算力進(jìn)一步提升，集群規(guī)模進(jìn)一步擴(kuò)大都會是下一波模型重大提升的必備條件之一。參數(shù)方面，行業(yè)里普遍認(rèn)為 GPT 4是 1.8 萬億參數(shù)，那么什么時(shí)候有十萬億、百萬億、千萬億的參數(shù)，當(dāng)模型參數(shù)到千萬億級別就和人類的大腦容量相似，甚至超越人類大腦。這樣參數(shù)的模型如果能被訓(xùn)練出來，數(shù)據(jù)被突破，算力被突破，它很有可能達(dá)到通用人工智能。

我們這一代人會見證AGI的誕生

《AI光年》：智源設(shè)有 AI 大模型安全研究中心，你怎么看 AI 安全問題？比如AI會不會失控？

王仲遠(yuǎn)：人工智能技術(shù)發(fā)展到今天，尤其大模型技術(shù)的發(fā)展，是有可能達(dá)到AGI的，這讓AI安全尤其重要。人類的歷史上，還沒有其他生物體或機(jī)器智能達(dá)到或者超越人類智能。當(dāng)大模型可能在未來幾年到幾十年實(shí)現(xiàn)AGI 時(shí)，我們需要更早的開始思考它的安全性。作為一家非營利機(jī)構(gòu)，智源有責(zé)任更早地思考，這也是我加入智源的初心之一。

我們這一代很有可能會見證 AGI 的誕生，我們的下一代很有可能會與 AGI 共存。那么如何確保AGI 是安全可控的，是為人類服務(wù)而不是管控人類的？這是我們要解決的問題。當(dāng)前的大模型技術(shù)已有可能對人類帶來各種危害，比如大模型的語言能力可能帶來不良的文字引導(dǎo)，文生圖、文生視頻的能力可能造成更多虛假信息的泛濫， AI安全已經(jīng)迫在眉睫。

智源研究院一直以來都非常關(guān)注AI安全。2023年智源大會，我們首次設(shè)立了 AI 安全的論壇，OpenAI CEO Sam Altman和圖靈獎獲得者Geoffrey Hinton教授（也是今年諾貝爾物理學(xué)獎獲得者）參加了。2024年 3 月，智源舉辦了北京 AI 安全國際對話，我們創(chuàng)始理事長張宏江博士和圖靈獎獲得者Yoshua Bengio教授擔(dān)任論壇主席，與會專家聯(lián)合簽署《北京AI安全國際共識》。2024年的智源大會上也繼續(xù)設(shè)立 AI 安全論壇。這也反映了國際最頂尖的專家學(xué)者對于 AI 安全的思考和重視程度。我相信只要我們從現(xiàn)在開始努力，還是有可能將 AI 控制在一個(gè)安全的，造福人類的范圍之內(nèi)。

《AI光年》：AGI 會完全替代哪些職業(yè)？如果 AGI 是一種賦能，未來會在哪些領(lǐng)域落地和應(yīng)用？

王仲遠(yuǎn)：這一波人工智能與以往最大的區(qū)別是越來越像人類的大腦，這就意味著所有人能做的事情，將來大模型或者人工智能都有可能發(fā)揮作用，幾乎會進(jìn)入各行各業(yè)。有些行業(yè)可能進(jìn)入得快一些，有些行業(yè)可能進(jìn)入得慢一些。

之前網(wǎng)絡(luò)上流傳一個(gè)玩笑話，我們原本以為人工智能會先取代藍(lán)領(lǐng)，沒想到先取代的是白領(lǐng)，原本以為創(chuàng)造力是人類所獨(dú)有的，結(jié)果生成式AI的創(chuàng)造能力比人類還強(qiáng)，想象力比人類還豐富。這一波人工智能的發(fā)展，不管有沒有達(dá)到AGI，對各行各業(yè)都會產(chǎn)生賦能。

《AI光年》：人類應(yīng)該怎樣接受被AI取代，用什么樣的心態(tài)去接受？

王仲遠(yuǎn)：如果我們看人類過去的發(fā)展歷程，每一次重大的技術(shù)變革最初是解決不了問題的，但是我們始終要去思考如何讓技術(shù)向善，這是我們這一代人的責(zé)任，尤其智源作為一個(gè)非營利性機(jī)構(gòu)，更有責(zé)任去確保人工智能是安全的。這不是說人工智能一定會失控，我相信它還是可控的。在原子彈剛發(fā)明出來的時(shí)候，大家也擔(dān)心世界要?dú)缌耍祟惿鐣欠浅Ｓ幸馑嫉娜后w，發(fā)展了幾千年，每一次危機(jī)最終都得到了控制。

《AI光年》：可以給年輕人什么建議？

王仲遠(yuǎn)：一定要選擇自己熱愛的事情。我回顧過去15年的工作經(jīng)歷，最重要的是一直在做自己最熱愛的事情。我之所以從企業(yè)又回到了智源研究院這樣的一個(gè)偏科研性質(zhì)的機(jī)構(gòu)，是因?yàn)槿斯ぶ悄苁俏乙恢睙釔鄣氖虑�。讓人工智能像人類一樣理解世界，推理世界，�?shí)現(xiàn)真正的通用人工智能，是我內(nèi)心一直以來的追求。

《AI光年》：您剛才說我們這一代人可能會見證 AGI 的到來，下一代可能會和 AGI 共存。那么，人和 AI 未來應(yīng)該是一個(gè)什么樣的關(guān)系？

王仲遠(yuǎn)：如果 AGI 真的誕生，我希望它與人類是良性互動和共存的，能為人類所用，造福人類。人類與動物的區(qū)別在于會發(fā)明和使用工具，人類歷史上，技術(shù)的突破和發(fā)明，最終都變成了人類的工具。

人工智能過去也一直都是人類的工具，但是當(dāng)它的智能化水平接近、達(dá)到或者超越人類的時(shí)候，還能不能繼續(xù)作為工具為人類使用？這是一個(gè)非常難以回答的問題，但我們希望它是可控的。

《AI光年》：AGI何時(shí)到來？

王仲遠(yuǎn)：這個(gè)問題行業(yè)里一直有不同的觀點(diǎn)。去年非常樂觀的時(shí)候，大家認(rèn)為 AGI 一兩年內(nèi)就能到來。GPT 5 遲遲沒有發(fā)布，大家又開始對 AGI 是否有泡沫，這一波人工智能是不是已經(jīng)見底展開爭論。

但如果我們回顧過去整個(gè)基于神經(jīng)網(wǎng)絡(luò)的人工智能發(fā)展，算力的提升，數(shù)據(jù)規(guī)模的提升，模型參數(shù)規(guī)模的提升，我認(rèn)為 AGI 有可能在未來 5 ~ 20 年到來。這是為什么我認(rèn)為我們這一代有可能會見證 AGI 的誕生，下一代很可能要與 AGI 共存。

上一篇：傳蘋果自研AI服務(wù)器，要求富士康在臺灣省生產(chǎn)

下一篇：歷史性轉(zhuǎn)折點(diǎn)，舊金山日均無人車服務(wù)單量超過出租車

專訪智源院長王仲遠(yuǎn)：當(dāng)模型參數(shù)超過千萬億級別就可能超越人類大腦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-07 12:19:35 瀏覽：0次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

專訪智源院長王仲遠(yuǎn)：當(dāng)模型參數(shù)超過千萬億級別 就可能超越人類大腦 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-07 12:19:35 瀏覽：0次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

專訪智源院長王仲遠(yuǎn)：當(dāng)模型參數(shù)超過千萬億級別就可能超越人類大腦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-07 12:19:35 瀏覽：0次