當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > 中國在這一波人工智能浪潮中處于什么位置？

中國在這一波人工智能浪潮中處于什么位置？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-26 13:40:29 瀏覽：9381次

導(dǎo)讀：《科學(xué)四十人》系列座談第八期（左起，薛瀾、李航、張宏江、周忠和）大家好，我是知識分子總編輯周忠和，自2022年11月30日ChatGPT發(fā)布以來，全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮。在過去短短的一年多時間里，ChatGPT4.0和文生視頻的大模型SORA...

《科學(xué)四十人》系列座談第八期（左起，薛瀾、李航、張宏江、周忠和）

大家好，我是知識分子總編輯周忠和，自2022年11月30日ChatGPT發(fā)布以來，全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮。

在過去短短的一年多時間里，ChatGPT4.0和文生視頻的大模型SORA相繼發(fā)布，就在不久前，Openai的競爭對手Anthropic發(fā)布的新一代大模型Claude 3甚至被認(rèn)為全面超越了GPT-4。

全球都在熱烈討論AGI也就是我們所說的通用人工智能何時能實現(xiàn)？突飛猛進(jìn)的人工智能究竟會給我們?nèi)祟惿顜硎裁礃拥挠绊�？比如說會不會迎來大規(guī)模的失業(yè)或者就業(yè)的重組？會不會從根本上改變我們?nèi)祟愇拿鞯男螒B(tài)？甚至于AI覺醒以后，硅基生命會不會超越以人類為代表的碳基生命？

我們請到了源碼資本投資合伙人、北京智源研究院創(chuàng)始理事長張宏江，清華大學(xué)蘇世民書院院長、人工智能國際治理研究院院長薛瀾，字節(jié)跳動研究部門負(fù)責(zé)人李航，來探討我們離通用人工智能究竟還有多遠(yuǎn)，OpenAI開源的可能性和開源生態(tài)，中國人工智能的發(fā)展機(jī)遇和挑戰(zhàn)。

Sora開始理解物理規(guī)律、懂得常識

周忠和：我們今天的第一個問題是關(guān)于Sora的，Open AI推出的Sora，究竟有哪些地方讓你感到真正的興奮，或者說Sora的最值得關(guān)注的地方是什么？Sora給你最大的觸動是什么？

薛瀾：我看到Sora的時候感覺很震驚。因為它不僅僅是文字交流，而且有了一定的想象力。Sora能夠根據(jù)一段簡短的文字描述，生成一系列連貫的動態(tài)畫面，這不僅僅是對文本的理解，更是對物理世界運作規(guī)律的一種把握。

過去我們討論AI的時候，總認(rèn)為想象力是人類的專利，但現(xiàn)在，Sora顯示出AI也能具備這樣的能力。這可能是Sora一個與眾不同的地方。

張宏江：首先，我想談?wù)凷ora這個大模型給我?guī)淼恼鸷场ora的發(fā)布實際上是演示性的，它發(fā)布演示視頻，并沒發(fā)布模型本身，但從40個演示視頻中，我們可以看到AI技術(shù)的巨大進(jìn)步，非常令人振奮。

我注意到幾個亮點：第一，它生成的是高分辨率視頻，過去的視頻生成沒有做到過這么高的分辨率；第二，視頻時長達(dá)到60秒，而過去在生成視頻方面表現(xiàn)比較好的Runway做了兩年，也只能做到幾秒鐘；第三，也是最讓人震撼的是其中一個場景，一輛越野吉普車在崎嶇的山路上狂奔。這種鏡頭以往需要有一臺設(shè)備在后面跟拍，因為路面顛簸難度很高，但生成的視頻效果非常逼真。包括車輛行駛的邏輯也很優(yōu)秀，一直是靠右行駛，轉(zhuǎn)彎表現(xiàn)也很自然。

智源研究院創(chuàng)始理事長張宏江

周忠和：我有個外行的問題。我們普通人看這些視頻，可能會覺得它們不過就是一些高質(zhì)量的影像。它的想象力和邏輯不也是人灌輸進(jìn)去的嗎？

張宏江：不，人并沒有明確地告知它要這么做。

在傳統(tǒng)圖形學(xué)模式下，制作視頻通常需要構(gòu)建詳細(xì)的物理模型。例如，我們想制作一個車輛行駛的視頻，需要先創(chuàng)建一個三維的車輛模型，以及一個包含道路和其他環(huán)境元素的場景模型。場景環(huán)境模型相當(dāng)于虛擬世界，車輛模型則是在這個世界中運動的物體。這些模型需要精確地定義動態(tài)行為和環(huán)境的交互方式，對各種物理規(guī)律、運動規(guī)則進(jìn)行明確編碼，確保車輛在轉(zhuǎn)彎或行駛時的表現(xiàn)符合現(xiàn)實世界的情況。

在使用Sora這樣的大模型時，我們并沒有直接告訴AI這些具體的物理規(guī)則。相反，是AI通過分析大量的視頻數(shù)據(jù)，自己學(xué)到的。我們沒有告訴它，世界上大部分地方車是靠右走的。也沒有告訴它，如果不跟隨路線轉(zhuǎn)彎，車會撞到山上。這種明確的規(guī)則我們都沒有告訴它。

這是讓我覺得非常震撼的。GPT 3.5、GPT 4.0以及Claude這些模型，它們主要擅長理解語言，也就是文字描述。但Sora所展示的不僅僅是理解語言，還能夠理解物理世界。

周忠和：你可以說它已經(jīng)理解物理規(guī)律、懂得常識了，但我總覺得這只是模仿。

張宏江：是模仿，但記得費曼曾說過一句名言，“我無法理解我不能創(chuàng)造的東西”�，F(xiàn)在我們能生成出來了，難道不就是理解了嗎？

薛瀾：說到智能，我們得先定義一下什么是人的智能。我們有認(rèn)知能力、推理能力、創(chuàng)造力，可能還有其他方面，比如情商。如果我們從這些方面看，有些方面，比如認(rèn)知和推理能力，AI可能已經(jīng)超過了常人，甚至可能超過最厲害的人。但在另一些維度上，人類可能還會保持優(yōu)勢。

另外，您雖然覺得人工智能只是模仿。但人類獲得這些能力的過程，本質(zhì)上不也是如此嗎？都是在不斷接收外部信息，逐步形成認(rèn)知和思維模式，二者在方法上沒有根本區(qū)別。

周忠和：李航老師，您是否也有同樣的感受？

李航：有些地方一樣，有些地方不一樣。我們自己開發(fā)的PixelDance系統(tǒng)，效果上超越了當(dāng)時最好的Runway等系統(tǒng)，但今年2月Sora發(fā)布，PixelDance又被Sora超越。我的一個感受是做事要快，因為現(xiàn)在的競爭非常激烈。

另外從Sora的技術(shù)報告和相關(guān)論文看，雖然它技術(shù)上有所創(chuàng)新，但并不是革命性的。主要的創(chuàng)新是將擴(kuò)散模型的Unet架構(gòu)改成了Transformer架構(gòu)，這讓模型能夠處理更多的數(shù)據(jù)，更好地學(xué)習(xí)物理現(xiàn)象。從科學(xué)的角度上看，我認(rèn)為AI大模型目前具有一個共同特點，就是它們都基于Transformer架構(gòu)，最基礎(chǔ)的東西是都一樣的。

周忠和：近幾年在基礎(chǔ)科學(xué)原理上并沒有太大突破？

李航：是的，雖然有所進(jìn)步，但自從2017年Transformer架構(gòu)出現(xiàn)以來，我們看到了不斷的收斂。Transformer最初是為自然語言處理開發(fā)的，現(xiàn)在，即使是計算機(jī)視覺領(lǐng)域也開始轉(zhuǎn)向使用Transformer架構(gòu)。

周忠和：那么，你有沒有張老師那樣的感覺，也認(rèn)為AI模型現(xiàn)在開始理解常識和物理規(guī)律了？

李航：是的，我同意張老師的觀點。但我認(rèn)為未來的空間仍然非常大。Sora還不是3D的。3D生成技術(shù)，能夠讓我們從不同角度看到物體的樣子。比如，從正面看到一個人，我們是有能力想象他的后腦勺是什么樣子的。3D生成能幫助我們看到人的后腦勺。

目前，3D生成技術(shù)還處于初級階段。去年的計算機(jī)視覺國際會議ICCV，是領(lǐng)域內(nèi)最頂級的會議之一，在會議上展示的論文，大家可以去看目前技術(shù)生成的效果，其實都是比較簡單的。比如一個物體，桌子或椅子，把它換一個角度是什么樣子。

再有，現(xiàn)在的生成模型并沒有物體的語義。我們看視頻時，能認(rèn)出這是汽車、那是道路，但在Sora的模型中，它并不準(zhǔn)確地理解這些，它只是對像素和數(shù)據(jù)進(jìn)行處理。未來如果我們能夠進(jìn)一步發(fā)展這項技術(shù)，讓它不僅能處理3D空間關(guān)系，還能理解物體的語義信息，那么我們就更接近于創(chuàng)造出類似人類的智能。在這方面，我們還有很多工作可以做。

Transformer是最佳路徑嗎？我們會不會過于路徑依賴了？

張宏江：李老師剛才提到的Transformer架構(gòu)確實非常關(guān)鍵。自2017年起，Transformer這條路徑給我們做AI的人或者做大模型的人指出了一條路。過去七年，行業(yè)內(nèi)已經(jīng)認(rèn)可它是大模型發(fā)展通向AGI的一條正道。

技術(shù)發(fā)展是有路徑依賴的。意味著一旦我們確定了正確的方向，所有的關(guān)注和資源都會隨之集中。回到七年前，Google的研究人員發(fā)明了Transformer架構(gòu)，但OpenAI才是真正認(rèn)識到其潛力并全力投入的一方。盡管Google也推出了許多模型，但很長一段時間沒有一個能夠超越GPT3.5的成就。

現(xiàn)在所有做大模型的人，都把重點放在Transformer架構(gòu)上，包括Sora也是這樣，過去生成視頻用Unet框架無法達(dá)到的，換成Transformer架構(gòu)就實現(xiàn)了突破。未來，無論是GPT4.5、GPT5、Claude還是Gemini，Transformer這條道路都會持續(xù)。

薛瀾：既然說到這兒，我插一個問題。我們是否會因為路徑依賴的原因，而忽視了其他可能更好的路徑？2017年的Transformer架構(gòu)確實很重要，但當(dāng)時也有其他路徑。我們現(xiàn)在是否確定這是最好的路徑？我們是否可能錯過了其他潛在的優(yōu)秀路徑？

清華大學(xué)蘇世民書院院長薛瀾

張宏江：您的問題正好給了我一個機(jī)會，我想說的是，這就像當(dāng)初電的發(fā)明，當(dāng)交流電成為主流后，直流電最終只用于電池。這種路徑依賴是非常關(guān)鍵的。

李航：我想補充的是，作為科學(xué)家，我們總是尋求更好的、顛覆性的技術(shù)來改變現(xiàn)有的Transformer。但目前大家做了很多努力，我也知道一些研究。盡管在小規(guī)模上有些模型看起來還不錯，可一旦擴(kuò)大規(guī)模，它們都無法超越Transformer。目前的結(jié)論是Transformer確實非常強(qiáng)大，其他模型，但到目前為止，還沒有能成功顛覆Transformer。

張宏江：這引出了另一個話題，也就是大模型的Scaling Law。Transformer架構(gòu)成為主流，我們驗證了它的強(qiáng)大。接下來，是把它的規(guī)模越做越大，給它喂越來越多的數(shù)據(jù)。這個領(lǐng)域從業(yè)者們大多認(rèn)為，這個架構(gòu)的潛力還沒有達(dá)到極限。

所以，你可以看到為什么現(xiàn)在大家都在急切地投資購買芯片、增強(qiáng)算力。當(dāng)我們在追求算力的時候，實際上也是在競爭數(shù)據(jù)中心（IDC）的資源。而在搶占IDC的過程中，我們又不得不去爭取電力供應(yīng)。這一連串的動作，實際上都是因為大家認(rèn)同一個觀點：Scaling Law相信隨著模型規(guī)模的增長，性能和能力也會相應(yīng)提升。

周忠和：剛才張老師認(rèn)為Sora生成的視頻是符合物理規(guī)律的，Sora能夠理解常識。不過也有不同的聲音，比如圖靈獎得主楊立昆（Yann Lecun），他說僅靠大量文本數(shù)據(jù)訓(xùn)練是達(dá)不到人類智能水平的。還有的人覺得這是個死胡同，認(rèn)為快到極限了。您剛才好像不太同意這種看法？

張宏江：我可能要得罪人了。我覺得那些說這種路線快到極限的人，其實并不是真正的從業(yè)人員，沒有參與其中。如果在做這件事，你會我們這些在一線的人一樣，非常相信Scaling Law。

如果大家對這個感興趣的話，可以看看清華大學(xué)清華大學(xué)交叉信息研究院的助理教授，也是月之暗面公司CEO楊植麟最近的采訪，他談到了Scaling Law，我覺得講得很好。他作為一個年輕學(xué)者，對Transformer和未來的看法，我覺得很有見地。我們離Transformer的極限還早著呢，現(xiàn)在的問題可能是數(shù)據(jù)不夠，我們應(yīng)該想辦法繼續(xù)擴(kuò)大數(shù)據(jù)規(guī)模。

周忠和：還有人提到電力和其他資源。

張宏江：Scaling Law會帶動很多相關(guān)的東西。比如芯片行業(yè)，英偉達(dá)的股票瘋漲，IDC公司也是，數(shù)據(jù)現(xiàn)在變得非常值錢。這些都是推動整個產(chǎn)業(yè)發(fā)展的生態(tài)因素。所以，我覺得極限還遠(yuǎn)著呢。像楊立昆這樣的學(xué)者，我非常尊重他，但在這個觀點上我不太認(rèn)同他。他認(rèn)為數(shù)據(jù)驅(qū)動的系統(tǒng)沒有真正的推理和學(xué)習(xí)能力，走不到AGI。這是他的定義，但按照我的定義，我們正在朝那個方向前進(jìn)。

周忠和：李航老師，你的觀點和張老師一樣嗎？

李航：我部分同意張老師的看法。我相信Scaling Law的潛力，也認(rèn)為我們還沒看到極限。不過，我的觀點也不完全一樣，我去年在香港開會時和楊立昆老師當(dāng)面聊過，他覺得現(xiàn)在的大模型缺乏世界模型。我理解的是，如果能夠?qū)⒁曈X、語言等多模態(tài)信息結(jié)合，就會更接近世界模型。就像我剛才說的，視頻生成的時候，也能生成語義信息和3D信息，那就更接近人類了。我覺得這方面還有很大的空間，我們會沿著Scaling Law的路走下去。

未來可能97%的人不工作，只有3%的人在工作

周忠和：人工智能發(fā)展如此迅猛，對我們生活和工作的影響，也是大家非常關(guān)注的。例如，自動駕駛、互聯(lián)網(wǎng)產(chǎn)業(yè)，甚至有人說它對白領(lǐng)工作的影響更大。薛老師，您認(rèn)為短期內(nèi)哪個領(lǐng)域會受到最大的沖擊，白領(lǐng)還是藍(lán)領(lǐng)？

薛瀾：我認(rèn)為所有涉及信息或數(shù)據(jù)獲娶處理和傳播的行業(yè)都將受到巨大沖擊。這不僅包括了傳播業(yè)，如電影和電視，還涵蓋了教育、藝術(shù)，甚至醫(yī)療服務(wù)。還包括文秘工作和法律行業(yè)的助理工作，所有與信息處理相關(guān)的領(lǐng)域，包括信息獲娶處理和傳播，都可能逐漸受到影響。

周忠和：這些變化會多快發(fā)生呢？5年還是10年？

薛瀾：影響的速度取決于兩個方面。首先是人工智能本身的效率提升有多快。其次是社會制度的變革，這些制度對傳統(tǒng)行業(yè)的保護(hù)非常強(qiáng)。所以這一方面是技術(shù)進(jìn)步的過程，一方面也是制度變遷，這兩個方面需要協(xié)調(diào)起來往前走。

周忠和：您提到教育也會受到影響，如果預(yù)計在未來5到10年內(nèi)，某些行業(yè)將不復(fù)存在，那我們現(xiàn)在為什么還要在大學(xué)里學(xué)習(xí)它們呢？這是一個緊迫的問題，因為變化來得太快，可能我們還沒有足夠的討論。

李航：很難預(yù)測，但有兩個明顯的趨勢。首先，會出現(xiàn)新的工作，比如數(shù)據(jù)標(biāo)注。數(shù)據(jù)非常重要，現(xiàn)在數(shù)學(xué)家陶哲軒等開始標(biāo)注數(shù)學(xué)定理證明的數(shù)據(jù)，使用新的編程語言Lean來描述這個過程。他就是利用他的經(jīng)驗，把證明的過程寫出來，讓AI學(xué)習(xí)。我估計未來數(shù)學(xué)定理的證明，AI也能做。

其次，各行各業(yè)，包括編程和AI領(lǐng)域，都會出現(xiàn)兩極分化，最優(yōu)秀和有創(chuàng)造力的人才將發(fā)揮更重要的作用。

薛瀾（左）和字節(jié)跳動研究部門負(fù)責(zé)人李航（右）

周忠和：那么對于普通人來說，哪些行業(yè)的影響最大？

李航：硬件領(lǐng)域的變化可能會慢一些，因為硬件迭代需要時間。至于軟件，發(fā)展會更快。但我認(rèn)為長期來看，軟件開發(fā)的形態(tài)也會發(fā)生變化。一些簡單的程序AI是能夠?qū)懙摹?/p>

周忠和：機(jī)器完全可以替代人的創(chuàng)造性嗎?

李航：就像薛老師剛才說過的，我認(rèn)為有三個方面人工智能目前難以取代人類：情感、創(chuàng)造力和自由意志。情感是人的本能，要在機(jī)器上實現(xiàn)情感就等同于造一個擁有生命的人了。創(chuàng)造力和自由意志同理，這三者不是單純的智能，而是生命現(xiàn)象。

如果一個事情是任務(wù)，能去評價完成它的好壞，AI基本都能完成。馮諾依曼說過這樣一句話，意思就是告訴我一個任務(wù)，不管是多復(fù)雜，把它定義清楚，我都能給你造一個機(jī)器，專門去完成你這個任務(wù)。

現(xiàn)在大家經(jīng)常談AGI，談通用人工智能，“通用”確實是有很大的革命性的，這個工具不像馮諾依曼說的，專門做某一樣事情。它變成很通用，完成很多很多的任務(wù)。但另一方面，只要這些任務(wù)能夠定義、能夠標(biāo)數(shù)據(jù)、能有評價標(biāo)準(zhǔn)，看樣子AI基本都能做。前面說到人類的幾個特點屬于生命現(xiàn)象，不是任務(wù)，AI做不了。但是AI做很多任務(wù)，能超過人，可能未來AI做大部分工作都超過人。

張宏江：我同意薛老師的觀點。人的智能有多個維度，在許多維度上，機(jī)器可能會超越人類。對于普通人來說，最擔(dān)心的可能是自己的工作。

我倒覺得白領(lǐng)工作可能會受到較快的沖擊。我上周和崔健談AI，談到未來可能是97%的人不工作，只有3%有職業(yè)。這不是我的觀點，而是《世界簡史》作者的觀點：平均技能水平的工作者可能會被替代，但頂尖藝術(shù)家不用擔(dān)心，因為他們是少數(shù)。

至于助理類工作，比如法務(wù)助理，或者分析師很大程度會被替代�，F(xiàn)在一些AI工具已經(jīng)能幫助我們更高效地工作，比如許多人還要通過微軟的Outlook手工安排會議，以后可能是AI來做這個工作，效率會提高很多。

另外我們不能停留在提高效率的階段，30年前國際象棋大師卡斯帕羅夫被深藍(lán)擊敗。當(dāng)時卡斯帕洛夫曾說，未來機(jī)器將在象棋領(lǐng)域給予我們巨大的幫助。然而，30年后的今天，我們看到的情況是，機(jī)器在象棋上已經(jīng)不需要人類的幫助。

周忠和：那么，藍(lán)領(lǐng)工作呢？

張宏江：我為什么對Sora如此激動，就在于它對物理世界的初步理解。當(dāng)一個系統(tǒng)能夠理解物理世界時，就能指揮機(jī)器人執(zhí)行任務(wù)。硬件的AI化進(jìn)展可能比軟件慢，但隨著機(jī)器人技術(shù)的進(jìn)步，比如靈巧手和機(jī)械能力的提升，AI對藍(lán)領(lǐng)工作的影響只是一個時間問題。

周忠和：人工智能對程序員有什么影響？

張宏江：軟件設(shè)計師的工作可能會被自動化工具，比如微軟的GitHubCopilot和Google的對應(yīng)產(chǎn)品所替代。這些工具已經(jīng)能夠做很多事情，通過大模型驅(qū)動，能完成很多常用程序的編寫，至少可以提高開發(fā)者的效率。其他重復(fù)性的工作也很容易被替代。

周忠和：那研究人工智能的行業(yè)，未來也還會需要那么多人嗎？

李航：需要更多的人，但也會兩級分化。比如數(shù)據(jù)標(biāo)注這項工作，從簡單的常識性的標(biāo)注，到我剛才說的專業(yè)性的標(biāo)注，差別是很大的。

周忠和：薛老師，針對我們國家的自然科學(xué)科研人員，尤其是那些在技術(shù)開發(fā)和基礎(chǔ)研究領(lǐng)域處于領(lǐng)先地位的研究人員，人工智能的發(fā)展會對他們的工作產(chǎn)生怎樣的影響？

薛瀾：我認(rèn)為肯定會有顯著的沖擊，科學(xué)研究也會出現(xiàn)兩極分化。但我們需要區(qū)分常規(guī)科研和科學(xué)革命這兩種情況，如果我們按照托馬斯庫恩的科學(xué)革命理論來看，科學(xué)研究可以分為常態(tài)科研和科學(xué)革命。在常態(tài)科研中，我們已經(jīng)對某個領(lǐng)域的基本范式有了清晰的理解，并且正在解決一些尚未解決的問題，這就像是在解謎。例如，當(dāng)前的蛋白結(jié)構(gòu)研究就是這樣的領(lǐng)域。

在這些領(lǐng)域，人工智能可能會替代很多工作，在現(xiàn)有范式下工作的科研人員，他們的工作可能會被人工智能所替代。但是對于那些能夠發(fā)現(xiàn)新問題，制造危機(jī)，挑戰(zhàn)現(xiàn)有范式的研究者，這些人的工作是人工智能難以替代的。這樣的研究者永遠(yuǎn)有需求。

我們距離真正的通用人工智能還有多遠(yuǎn)？

周忠和：當(dāng)下一個非常熱門的話題是，我們距離真正的通用人工智能（AGI）有多遠(yuǎn)，AGI的定義或者實現(xiàn)的標(biāo)志是什么？另外，目前Open AI引領(lǐng)的人工智能革命是比較公認(rèn)的，但是否有其他競爭者？比如Claude，有人說它超越了ChatGPT和Open AI，但這種說法是否夸張？

李航：目前還沒有一個嚴(yán)格的定義來界定什么是AGI。

大模型的通用性是一個顯著的特點，它們能做很多事情，發(fā)展空間非常大。但是，它和人在創(chuàng)造力、情感和自由意志等方面仍有區(qū)別，模型在這些方面的表現(xiàn)也只能近似人類智能，而不是完全實現(xiàn)人類智能。

像黃仁勛說的AGI可能在5年內(nèi)實現(xiàn)，也是基于特定的定義。我認(rèn)為，一旦我們能夠清楚地定義一個任務(wù)并評價它的完成情況，人工智能通常能夠完成得很好。但是，人類能理解世界，能夠遐想和想象，要想在這些方面追上人，我覺得十年二十年之內(nèi)人工智能還做不到。

張宏江：我想就李航老師提到的三點進(jìn)行爭論。我同意其中的兩點，但對于情感這一點，我認(rèn)為情感可以被視為人類的獎勵函數(shù)（rewarding function）。如果我們能夠?qū)W習(xí)人類的獎勵函數(shù)，提供足夠的數(shù)據(jù)，那么人工智能就有可能模擬情感。

這是一種高維度的復(fù)雜函數(shù)，在計算上會很復(fù)雜，而這正是大型模型的優(yōu)勢所在。例如，鄂維南老師做的AI for Science，在材料設(shè)計，簡單的材料結(jié)構(gòu)可以通過微分方程算出來，復(fù)雜的分子材料幾乎不可能算出來，利用大模型進(jìn)行模擬是更好的辦法。在材料設(shè)計、天氣預(yù)測和生命科學(xué)等領(lǐng)域，當(dāng)問題復(fù)雜到無法用數(shù)學(xué)方程來描述時，恰恰是大模型發(fā)揮作用的地方。

周忠和：有人說大模型只是AGI的一塊孤立的拼圖，還有很多拼圖沒找到，幾位老師認(rèn)同這個觀點嗎？

張宏江：這一定是哲學(xué)家說的。

周忠和：這是你所不認(rèn)同的，對吧。李老師，你覺得現(xiàn)在的大模型方向，就是通向AGI的充分條件嗎？

李航：在大部分情況下，我認(rèn)為現(xiàn)有的大模型方向是正確的，是通向AGI的重要途徑。但也可能存在一些人類智能無法用大模型實現(xiàn)。

周忠和：李老師，你曾經(jīng)提到過，深度學(xué)習(xí)在未來一段時間是主流，但長遠(yuǎn)來看，我們還是應(yīng)該從人腦計算中獲取啟發(fā)。

李航：我的觀點和現(xiàn)在的大模型路線其實不矛盾，只是希望將來能夠在更好地模仿人腦，實現(xiàn)更接近人的AGI。

計算存在功能、算法和物理實現(xiàn)三個層面�，F(xiàn)有的以Transformer為基礎(chǔ)的大模型主要是在功能層面上模仿人類，但在算法層面，AI和人的大腦的結(jié)構(gòu)還是完全不一樣的，所以我們可以在功能層面上更多借鑒人腦的機(jī)制。

薛瀾：我跟他們倆唱一個反調(diào)。路徑依賴確實存在，但錯過的道路，可能我們在很多年后會重新走回來。比如過去我們的技術(shù)和資金都投資在燃油動力汽車上，其實電動汽車上個世紀(jì)初就已經(jīng)被發(fā)現(xiàn)了，曾經(jīng)有一段時間也還是可以跟汽油車相競爭的，只是后來因為多種原因就被忽略掉了。多年以后的現(xiàn)在，電車又發(fā)展的很好，所以不排除錯過的道路在未來能有很好的發(fā)展。

周忠和：薛老師，考慮到人工智能目前的發(fā)展趨勢，您認(rèn)為我們最需要哪類人才？是更傾向于計算機(jī)專業(yè)的技術(shù)人才，還是需要更多跨學(xué)科的專家，比如腦科學(xué)、生命科學(xué)等領(lǐng)域的？

薛瀾：我認(rèn)為我們需要的人才首先要具備創(chuàng)造力，創(chuàng)造力在今后仍然至關(guān)重要。另外，傳統(tǒng)的、那種很強(qiáng)調(diào)專業(yè)細(xì)分的教育模式可能需要改變。我們需要從新的維度重新思考教育問題。

我們過去學(xué)習(xí)的知識和技能可以分為兩類：一類是為了在社會中生存所必需的，另一類則是提升我們認(rèn)知能力的學(xué)習(xí)。我估計，隨著人工智能的發(fā)展，第一類能力可能會被系統(tǒng)替代，這些東西也就沒有多大必要去學(xué)習(xí)。

相反，我們需要思考的是如何通過教育，提升受教育者的認(rèn)知能力和創(chuàng)造力�？赡苄枰环N全新的教育方式，與現(xiàn)有的教育體系完全不同。實際上，人工智能對教育系統(tǒng)的沖擊應(yīng)該是最大的，但我們恰恰是動的最慢的。

周忠和：李老師和張老師兩位都在公司里工作，你們希望招聘什么樣的人才？期待未來的教育系統(tǒng)能夠給你們輸出什么樣的人才？

李航：在人工智能領(lǐng)域，本科的教育是非常重要的。在美國，頂尖大學(xué)機(jī)器學(xué)習(xí)本科學(xué)生的作業(yè)難度非常高，甚至要熬夜來完成。計算機(jī)領(lǐng)域的一些基本技能培養(yǎng)，美國本科教育都已經(jīng)能做得很好，而國內(nèi)在這方面需要加強(qiáng)。就純計算機(jī)和人工智能的人才培養(yǎng)的角度來說，我是看到、感到有一定的差距的。

周忠和：人工智能變成熱門之后，很多人提議從中學(xué)開始學(xué)習(xí)人工智能。

張宏江：作為兩個孩子的父親，我可能對教育稍微多一點認(rèn)識。我認(rèn)為重要的是培養(yǎng)孩子們的思考能力，而不只是具體知識。

美國的學(xué)校，對14歲的學(xué)生就開設(shè)邏輯和批判性思維課程。這個課程是教孩子們怎么思考，而不是一門具體的專業(yè)知識。站在任何一個專業(yè)角度講，如果你想從事研究的話，邏輯和批判性思考能力是非常重要的。

未來的人才，最需要邏輯和批判性思考的能力。灌輸知識這樣的教育，實際上是培養(yǎng)就業(yè)能力，而且是過去的就業(yè)能力，未來是行不通的。從科研人才的角度講�；剡^頭看，在科學(xué)職業(yè)化之前、文藝復(fù)興之后的幾百年，也是沒有職業(yè)科學(xué)家的，需要的是他們思考的能力和觀察的能力。

薛瀾：我覺得越是在這種形勢下，人文素養(yǎng)也會變得非常重要。

開源和閉源，哪一種模式對人類更安全？

周忠和：最近有消息說馬斯克因OpenAI違背了其非盈利的宗旨，打算將其告上法庭。我們知道非盈利模式有其優(yōu)勢，但資金的缺乏也可能影響技術(shù)的發(fā)展。

薛瀾：現(xiàn)代科學(xué)和科技的發(fā)展，是希望在開放科學(xué)的道路上前進(jìn)的，尤其是人工智能這個領(lǐng)域。開源可以促進(jìn)技術(shù)的交流和發(fā)展。反對開源的人擔(dān)心安全隱患，但也有人認(rèn)為不開源可能更危險，這些方面的爭論一直存在。我覺得可以請其他兩位人工智能領(lǐng)域的專家，講下到底應(yīng)該怎么權(quán)衡這個問題？

李航：去年一個AI會議上沈向洋博士表達(dá)過一個觀點，我非常同意，是否開源取決于公司的商業(yè)地位和策略。行業(yè)的領(lǐng)導(dǎo)者可能不會選擇開源，第一名肯定不會開源，第二名想要和第一名競爭也不會開源，第三、第四名的公司可能會選擇開源以取得一些競爭優(yōu)勢。

我覺得至少從歷史的經(jīng)驗上看，這個觀點是有道理的。AI公司里，現(xiàn)在沒有開源的是OpenAI、Anthropic。開源的是Meta和Amazon。

周忠和：商業(yè)性之外，我們可能更關(guān)心開源爭論對技術(shù)發(fā)展的影響，以及安全問題。這方面您怎么看？

李航：實際上，從商業(yè)角度來看，Meta和其他公司選擇開源，并不是出于其他考慮，而是因為這樣做能在商業(yè)上帶來一定的利益。我同意沈向洋的觀點，他認(rèn)為這些公司開源是為了在商業(yè)利益上獲得優(yōu)勢。這涉及到一個更根本的問題：人工智能技術(shù)的研究和開發(fā)是否應(yīng)該以市場經(jīng)濟(jì)為導(dǎo)向。

字節(jié)跳動研究部門負(fù)責(zé)人李航

周忠和：薛老師您贊成AI公司以盈利為導(dǎo)向嗎？

薛瀾：我們現(xiàn)在進(jìn)行的關(guān)于人工智能的研究，實際上相當(dāng)于在從事科學(xué)技術(shù)的基礎(chǔ)研究。在科學(xué)技術(shù)領(lǐng)域里，基礎(chǔ)研究通常是開源的。不過，人工智能研究的回報機(jī)制與之略有不同。在學(xué)術(shù)領(lǐng)域，最先發(fā)表論文被認(rèn)可擁有優(yōu)先權(quán)，這就是所謂的回報制度，已經(jīng)被大家所公認(rèn)。而人工智能大公司之間，真正的競爭在于最終的應(yīng)用和產(chǎn)品層面。

從這個角度講，我認(rèn)為應(yīng)當(dāng)鼓勵開源。對于大公司來說，它們可以在商業(yè)應(yīng)用和產(chǎn)品層面尋找盈利模式，在那個領(lǐng)域開展競爭。從各個研究領(lǐng)域的實踐來看，這種在基礎(chǔ)研究階段開源、在產(chǎn)品化階段閉源并尋求商業(yè)化的模式，目前看來對于推動人類社會進(jìn)步是一種非常有效的做法。

張宏江：我非常贊同薛老師的觀點。開源是探索階段的重要工具，它鼓勵大家一起討論、交流和評估，這樣的話才能夠真正地推動一個領(lǐng)域的進(jìn)步。從這一點上來說，我非常贊同開源。開源能夠把真正地做研究的人帶到一塊。今天的AI領(lǐng)域，從方法論、架構(gòu)還有很多問題需要解決，開源是一個非常好的交流載體。

周忠和：您剛才提到了安全問題，那么我們應(yīng)該如何解決開源可能帶來的安全隱患？

張宏江：無論是開源還是閉源，安全問題都是不可避免的。但對于開源模型，我們更容易進(jìn)行驗證和審查。未來，任何發(fā)布的AI模型都應(yīng)該通過安全認(rèn)證。此外，如果AI是一個可以改變?nèi)祟惖募夹g(shù)，我們需要在AI安全研究上投入更多的資源。

我曾在一個AI安全閉門會上聽到一個觀點，讓我很吃驚，但我相信其中的數(shù)據(jù)是對的：核電站設(shè)備的研發(fā)費用中有95%用于安全，這對我們AI領(lǐng)域來說是一個啟示。我們是否也應(yīng)該在AI安全上投入更多的資源？如果核電投入95%，AI是不是應(yīng)該在安全上投入10%或者15%，因為這個技術(shù)也是可能導(dǎo)致人類滅絕的。

周忠和：薛老師，您在經(jīng)常在中國和國際舞臺上積極討論人工智能治理的問題。安全性顯然是大家非常關(guān)注的焦點。鑒于人工智能已經(jīng)達(dá)到了相當(dāng)高的智能水平，我們是否可以認(rèn)為開源在某種程度上也是一種保障措施呢？

薛瀾：是的，開源與閉源的討論實際上涉及到利弊的權(quán)衡。正如剛才所提到的，有人可能會擔(dān)心開源會讓極端組織或個人有機(jī)會濫用技術(shù)。不論開源還是閉源，只要有心作惡，總會找到途徑�，F(xiàn)有的各種技術(shù)，如果被濫用，都可能對人類社會造成破壞，生物技術(shù)就是個例子，它同樣存在被濫用的風(fēng)險。因此，更重要的是如何建立一套體系，來防范和制止任何個人或組織濫用技術(shù)危害社會。我們需要更多地考慮如何通過監(jiān)管機(jī)制來控制這些風(fēng)險。

假設(shè)從企業(yè)的商業(yè)角度出發(fā)，需要采取閉源等策略。在這種情況下，我們就需要建立一套監(jiān)管機(jī)制。這個監(jiān)管體系將對企業(yè)的閉源研究進(jìn)行規(guī)范和約束，以確保其合法合規(guī)。所以我認(rèn)為，企業(yè)的需求和監(jiān)管制度是相互促進(jìn)、相輔相成的。

中國在這一波人工智能浪潮中處于什么位置？

周忠和：中國在人工智能研究方面發(fā)表了大量的文章，并且在國際上也處于較為領(lǐng)先的位置。但具體來說，中國在人工智能方面有哪些優(yōu)勢和不足呢？比如有觀點認(rèn)為，中國缺乏高質(zhì)量、大規(guī)模的中文數(shù)據(jù)集，這可能會影響我們的人工智能發(fā)展？

李航：中國在人工智能的應(yīng)用和商業(yè)化方面確實還有很多機(jī)會。我們可以看到，在互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代，中國企業(yè)的表現(xiàn)非常出色，尤其是在過去的十年里。我們在互聯(lián)網(wǎng)商業(yè)化的應(yīng)用層面上很有特色。比如在大模型的實用場景中，不一定要追求像GPT-4那樣的大規(guī)模模型，即使是相對較小的模型，在特定的實用場景中也能發(fā)揮重要作用。

就我個人的觀點而言，未來人工智能的發(fā)展機(jī)遇主要集中在四大領(lǐng)域。首先是張老師之前提到的助理領(lǐng)域，也就是廣義上的助理和白領(lǐng)工作，這里有很大的應(yīng)用空間。其次，機(jī)器人的發(fā)展也非常關(guān)鍵，它們能夠幫助工人和普通人完成一般工作任務(wù)。再者，AI for Science，即利用人工智能推動科學(xué)研究，這在數(shù)學(xué)、物理、化學(xué)等科學(xué)領(lǐng)域都有潛力。最后，娛樂行業(yè)，無論是視頻制作、電影、游戲還是虛擬現(xiàn)實，人工智能的發(fā)展都有很多機(jī)會。

比如在硬件方面，當(dāng)大模型與硬件結(jié)合時，機(jī)器人技術(shù)就是一個應(yīng)用的典型例子。實際上，不僅限于機(jī)器人，自動駕駛等眾多領(lǐng)域也有著廣泛的發(fā)展機(jī)會。在應(yīng)用層面，我認(rèn)為中國整體上還有比較大的優(yōu)勢。

至于數(shù)據(jù)問題，目前高質(zhì)量的英文數(shù)據(jù)資源相對較多，而高質(zhì)量的中文數(shù)據(jù)資源則相對較少，尤其是在互聯(lián)網(wǎng)上。但通過機(jī)器翻譯或未來的一些新技術(shù)手段，我們是可以實現(xiàn)兩種語言數(shù)據(jù)之間互通的。所以，我不認(rèn)為語言數(shù)據(jù)的差距會是一個特別大的障礙。

不過，如果我們將人工智能的發(fā)展比作一場軍備競賽，那么可以說，Open AI在AGI方面確實領(lǐng)先一步，其他所有人都在努力追趕。對于中國而言，無論是企業(yè)界還是學(xué)術(shù)界，我們各個方面都需要加大努力，以縮小與領(lǐng)先者之間的差距。

我們剛才也討論到，中國的一些創(chuàng)業(yè)公司有很多做得不錯的�？梢哉f，中國公司已經(jīng)掌握了AI大模型的科學(xué)原理，因為這些科學(xué)原理基本上是公開的，大家都能學(xué)會。但現(xiàn)在的問題更多的是工程和產(chǎn)品開發(fā)。如果這些能夠叫技術(shù)的話，我們其實是沒有完全掌握這些技術(shù)的，中國的企業(yè)也好，研究機(jī)構(gòu)也好，還需要努力，把這些技術(shù)能夠盡快掌握，才能做出GPT4、Sora這樣水平的東西。

張宏江：我要補充一點。目前這一波深度學(xué)習(xí)驅(qū)動的人工智能浪潮，并不是一個新現(xiàn)象，今天的情況只是進(jìn)一步強(qiáng)化了這種觀點。這波浪潮是算法、算力和數(shù)據(jù)三者的結(jié)合。在很大程度上，算法反映了人才的實力，也就是我們所說的人才。所以也可以說，是人才、硬件和數(shù)據(jù)的組合。通過這三個點，我們可以清晰地知道自己在什么定位。

數(shù)據(jù)我們有很多方式彌補，接下來就是人才。斯坦福大學(xué)每年發(fā)布的AI指數(shù)報告。這份報告統(tǒng)計了全球AI領(lǐng)域的論文發(fā)表情況，你猜在前十名的機(jī)構(gòu)中，麻省理工學(xué)院（MIT）排名第幾？

周忠和：難道沒有排到第一？

張宏江：如果MIT排第一，我就不提這個問題了。實際上，MIT排在第十，而前九名全是中國的機(jī)構(gòu)。這說明我們從業(yè)的人才一定不少，無非就是我們需要把發(fā)表文章的數(shù)量變成質(zhì)量，把跟進(jìn)變成突破、引領(lǐng)。還有很多思路，我們使可以繼續(xù)沿著這三點思考的。

關(guān)于李航老師說的，中國在應(yīng)用方面有優(yōu)勢這一點，我也有不同觀點：這一次跟以前可能真是不太一樣�，F(xiàn)在AI領(lǐng)域的目標(biāo)是AGI，強(qiáng)調(diào)通用。以前是單點上的技能，現(xiàn)在是一個通用的智能。

這就跟以前不太一樣了，每一次OpenAI發(fā)一個新的版本或者加一個新的特性（feature），就是一片公司倒下。原來你認(rèn)為一個公司才可以做的事情，大模型加一個特性就覆蓋了。Sora出來后，Runway和其它做視頻生成的公司就很緊張，因為你就是一個工具，Sora是多模態(tài)大模型的一個部分。

如果大模型繼續(xù)沿著這個方向發(fā)展，它們的功能將變得越來越全面。當(dāng)幾句話就能在GPT 商店里產(chǎn)生一個新應(yīng)用，當(dāng)大模型的功能無所不包，是不是像上世紀(jì)90年代微軟的操作系統(tǒng)，給當(dāng)時其他軟件公司帶來的恐懼。而你還不能夠用反壟斷的方式來對抗它，因為大模型本身就這么強(qiáng)。

指望靠一個性能稍差的、70分專用小模型，去完成特定應(yīng)用，就怕人家做出90分的大模型，順手把這些功能都覆蓋，橫掃這些小模型。

那為什么自從ChatGPT問世以來，雖然已經(jīng)過去了一年多的時間，但在我們所說的AI原生應(yīng)用領(lǐng)域，并沒有看到太多新興公司的身影？一方面是大家都沒摸清楚，另一方面是大模型性能還沒好到那個地步，用在哪個領(lǐng)域，立刻讓用戶滿意。

因為用戶對于應(yīng)用的期望值非常高。比如，當(dāng)30年前語音識別技術(shù)不成熟的時候，蘋果做了一個手寫和語音識別產(chǎn)品叫Newton，但問題是語音識別的技術(shù)不過關(guān)，甚至手寫識別那時候也不過關(guān)，因為那時候神經(jīng)網(wǎng)絡(luò)還是三層的。最后用戶不認(rèn)可，這個產(chǎn)品行情大跌。當(dāng)一個技術(shù)撐不起一個產(chǎn)品，或者只能撐到60分，而用戶的實際期望值是90分時，這個產(chǎn)品就相當(dāng)于0分。

我們千萬不要有這種心態(tài)，說之前我們成功過，我們在應(yīng)用角度趕上了，就覺得新技術(shù)也就這樣。這一次可能真不一樣，這是我想要說的。

李航：我想再補充一點，我大部分同意張老師的觀點，但就像我們討論的互聯(lián)網(wǎng)搜索引擎，有Google這樣的巨頭，當(dāng)然還有其他的搜索引擎存在。即使Google占據(jù)了市場的主導(dǎo)地位，其他公司仍然有機(jī)會。

張宏江：但Google占據(jù)了90%的市場份額，而微軟努力了20多年也只獲得了3%的份額，這就是差別。

李航：我理解您的觀點，但我認(rèn)為在實際應(yīng)用中，大模型并不總是能夠完全取代小模型在一個具體的垂類上做的事情，GTP4也是90分，可能一個小模型也是90分。在特定領(lǐng)域，定制化的小型模型可能更有優(yōu)勢。因為它的性價比更高，商業(yè)上站得住腳。

張宏江：我不同意。我可以馬上舉個例子，ChatGPT出來之后，各種翻譯軟件都死掉了。

李航：但我了解到，GPT4在美國一些公司的實際場景里面，因為領(lǐng)域上的適配問題，其實成本很高，或者不很成功的例子也挺多。

張宏江：那是GPT4的問題，它還沒有達(dá)到90分的地步。

李航：無論是從經(jīng)濟(jì)角度還是工程實現(xiàn)的角度來看，盡管大模型可能在通用領(lǐng)域表現(xiàn)出色，但市場的需求并不總是集中在通用領(lǐng)域�？倳幸恍┨囟ǖ募�(xì)分領(lǐng)域，特定的小型模型或技術(shù)可能整體更有優(yōu)勢。我不太相信大模型一個東西能把什么事都做到。

但我也同意，Google占據(jù)了市場的主導(dǎo)地位，擁有高達(dá)90%的市場份額。在這種情況下，我們可以看到，盡管其他公司也在努力，但目前還沒有哪家能夠撼動Google的地位。我們現(xiàn)在使用的GPT-4，它的市場地位也非常穩(wěn)固，一旦用戶對其產(chǎn)生了依賴，就很難轉(zhuǎn)向其他服務(wù)。這種粘性使得通用技術(shù)領(lǐng)先的公司很難被取代。因此，在這個意義上，我同意超大模型有著廣泛的覆蓋能力和強(qiáng)大的市場影響力。但是其他企業(yè)也還是有機(jī)會的。

周忠和：這個問題看來還是值得討論。最后我們問一下薛老師，從政府的角度，如何更好地推進(jìn)我國人工智能事業(yè)?

薛瀾：人工智能政府的政策，一方面是推動，推動它的發(fā)展，另外一方面是規(guī)制它的風(fēng)險，所以這其實是兩個輪子同時轉(zhuǎn)。政府投入我覺得其實現(xiàn)在大家都想到了。但另外一點也非常重要，就是怎么樣去營造一種生態(tài)，能夠讓中國的企業(yè)跟研究機(jī)構(gòu)，包括跟高校等等，它能夠去形成一種很自然地融在一起，這個始終是中國要解決的問題。

這在中國人工智能領(lǐng)域尤其重要。就像剛才張老師講的，論文我們發(fā)得很多，專利也不少。我們最缺的還是生態(tài)，這是研究不出來的，需要領(lǐng)導(dǎo)們創(chuàng)造有利的條件，讓各種機(jī)構(gòu)和人才能夠在這樣的環(huán)境下發(fā)揮作用。像智源這樣的組織，正是在這樣支持性的環(huán)境中得以建立和發(fā)展的。

政府在推動人工智能發(fā)展的同時，也需要規(guī)制其風(fēng)險。此外，建立一個良好的生態(tài)系統(tǒng)，讓企業(yè)、研究機(jī)構(gòu)和高校能夠自然地融合在一起，這對于中國來說是一個需要解決的問題。在全球?qū)用嫔�，我們需要建立一個全球性的風(fēng)險防控機(jī)制，這需要政府、企業(yè)和研究機(jī)構(gòu)的共同努力。同時，我們也需要認(rèn)識到，人工智能的發(fā)展不僅僅是技術(shù)問題，更是社會問題。它涉及到倫理、法律、就業(yè)等多個方面，我們需要在這些方面進(jìn)行深入的研究和討論，以確保人工智能的健康發(fā)展。

關(guān)于風(fēng)險管理和規(guī)制，我想補充一點。這是一個多層次的問題。首先，我們需要在全球?qū)用嫔媳M快建立共識，制定一個全球性的風(fēng)險防控機(jī)制。這不僅僅是政府的責(zé)任，也需要全球的企業(yè)和研究機(jī)構(gòu)共同參與。雖然大家都在朝這個方向努力，但要真正讓這些措施落地也不容易。這是需要大家共同努力的。

觀眾提問

觀眾1：我是清華大學(xué)蘇世民書院2021級的畢業(yè)生，現(xiàn)在在智譜華章做產(chǎn)業(yè)生態(tài)方面的工作，非常謝謝各位老師，剛剛將近兩個小時的分享，非常有啟發(fā)。我有兩個問題，第一個問題，近來不少中國人工智能初創(chuàng)企業(yè)，尤其做C端應(yīng)用的企業(yè)，選擇出海開展業(yè)務(wù)。可能出于兩個考慮:一是希望借助海外最先進(jìn)的模型，二是海外付費市場相對更加成熟。與此同時，國內(nèi)大部分公司則專注B端，就是幫助本土企業(yè)降本增效。您怎么看待這種發(fā)展分野和趨勢?對中國人工智能的科研和產(chǎn)業(yè)化進(jìn)程會產(chǎn)生何種影響?

第二個問題，OpenAI的Sam Altman最近發(fā)布了一個計劃，他打算斥資7萬億美元來推動半導(dǎo)體行業(yè)的革新和變革。各位老師如何看待這樣作為私營企業(yè)去做這樣大規(guī)模的融資，對于整個產(chǎn)業(yè)界或者學(xué)術(shù)研究的影響？以及可能中國的生態(tài)如何受到它的啟發(fā)，或者我們怎么能夠另尋一條路徑，來跟這樣的生態(tài)匹配？

現(xiàn)場觀眾

張宏江：回答第一個問題。出海這件事兒，你們注意到的是面向消費者的企業(yè)（to C）在進(jìn)行海外擴(kuò)張，但實際上，面向企業(yè)的企業(yè)（to B）的出海活動更為頻繁，而且其實也非常有道理。

如果我們對比一下中美兩國的軟件市場和互聯(lián)網(wǎng)應(yīng)用市場，尤其是在軟件工具和云服務(wù)（SaaS）領(lǐng)域，我們會發(fā)現(xiàn)美國的企業(yè)市場（to B）遠(yuǎn)比中國成熟。因此，中國的企業(yè)級軟件出海戰(zhàn)略不僅合理，而且非常必要。經(jīng)過幾十年的發(fā)展，中國的軟件產(chǎn)業(yè)在toB領(lǐng)域相較于toC領(lǐng)域仍有較大的差距。如果我是企業(yè)決策者，特別是做toB業(yè)務(wù)，我會更傾向于出海，因為那里的市場對付費服務(wù)的接受度更高。

我還想多強(qiáng)調(diào)一下，toB軟件、工具類軟件或SaaS普及的重要性。toB軟件的核心在于為企業(yè)提供提高效率的工具，比如Office、SAP或飛書等都是提升生產(chǎn)力的工具。當(dāng)公司廣泛使用這些工具時，意味著它們在追求效率的提升。而我們很多公司還沒有充分利用這些生產(chǎn)力工具，這反映出我們的生產(chǎn)效率還不夠高，可能還在依賴人力來完成任務(wù)。所以，我希望大家不僅僅將這看作是一種商業(yè)模式，而是關(guān)乎我們是否能夠提升生產(chǎn)效率的關(guān)鍵問題。生產(chǎn)效率低，顯然對于產(chǎn)業(yè)是非常大的一個問題。

回到國內(nèi)這25年，我始終非常羨慕海外的toB的軟件市場，我希望這塊未來能夠有所突破，這樣我們才能真正提高人均生產(chǎn)力，因為人均收入的提升本質(zhì)上依賴于人均生產(chǎn)力的增長。否則，我們的人均效率將持續(xù)面臨問題。這就是我對第一個問題的看法。

李航：我來回答第二個問題。人工智能的發(fā)展確實需要大量的投資。我們剛才討論到基礎(chǔ)研究應(yīng)該是開源和公開的，這是AI技術(shù)發(fā)展的源泉。目前AI技術(shù)，特別是大型模型，更偏向于工程實現(xiàn)。我們觀察到，至少在某些領(lǐng)域，工業(yè)界的創(chuàng)新能力已經(jīng)超越了基礎(chǔ)研究機(jī)構(gòu)的創(chuàng)新能力。這是一個新現(xiàn)象，在人類科學(xué)研究史上前所未遇。

我相信開源的努力會繼續(xù)，因為許多學(xué)者都在這樣做，盡管他們的工作可能在某些方面落后于像Open AI這樣的領(lǐng)先企業(yè)。例如，Lambda等項目是開源的，但我們也要認(rèn)識到，即使是商業(yè)公司的開源，也有其特殊性質(zhì)，背后可能有其他考慮。從技術(shù)推進(jìn)的角度來看，開源可能仍然面臨挑戰(zhàn)，因為它需要大量的開發(fā)工作，更重要的是技術(shù)創(chuàng)新。

我也同意，如果是閉源的模型，政府應(yīng)該進(jìn)行一定程度的監(jiān)管，企業(yè)也應(yīng)該承擔(dān)起責(zé)任，做正確的事，這非常重要。AI研究一般是在大規(guī)模的環(huán)境下進(jìn)行的，AI的發(fā)展需要大量的投資，這是我們目前所面臨的現(xiàn)實。就像我們之前討論的，為了推動技術(shù)向前發(fā)展，我們需要大量的資金來擴(kuò)大模型的規(guī)模。

張宏江：我覺得7萬億這個數(shù)字跟閉源和開源不一定有直接關(guān)系。如果你認(rèn)同Scaling Law，并且考慮過我們距離實現(xiàn)AGI還有多遠(yuǎn)，還需要多少資源，那么你可能會得出這樣的數(shù)字。我們可能需要投入這么多資金，甚至更多，不僅是一家企業(yè)，可能還有其他企業(yè)也需要投入相似的資金量。這不是拍腦袋，而是基于Scaling Law的合理預(yù)測。隨著模型參數(shù)的增加，我們需要更強(qiáng)大的算力進(jìn)行訓(xùn)練和推理，更多的機(jī)房、更多的IDC設(shè)施和電力供應(yīng)。如果現(xiàn)在的模型擴(kuò)大1000倍，那么這樣的投資規(guī)�？赡芫褪潜匦璧�。為了搭建這個系統(tǒng)、實現(xiàn)這個目標(biāo)，就需要相應(yīng)的投資。我覺得這是他的思考，而且從Sam的角度來說，這家伙想問題常常都是往10年以后想。

觀眾2：我博士畢業(yè)于清華大學(xué)精密儀器系，目前是在中國信息通信研究院做人工智能方面的技術(shù)產(chǎn)業(yè)研究。我的問題是，首先，我們提到人工智能的發(fā)展依賴于三個核心要素：算法、計算能力和數(shù)據(jù)。目前，算法研究可能面臨研究力量分散的問題，算力方面受到美國對高端AI芯片出口禁令的影響，而數(shù)據(jù)方面，高質(zhì)量的中文數(shù)據(jù)集可能還不夠充足。面對這些挑戰(zhàn)，我們應(yīng)該如何權(quán)衡這三者的優(yōu)先級，有限發(fā)展哪一種。

其次，如果計算能力是目前制約我國發(fā)展像Sora這樣的先進(jìn)大型AI模型的主要因素，那么是否可以通過國家力量，整合國內(nèi)現(xiàn)有的高端計算資源，比如英偉達(dá)的芯片，來支持國內(nèi)科研人員的研發(fā)工作，從而實現(xiàn)我國在這一領(lǐng)域的突破？

李航：第一個問題，正如我之前提到的，從長遠(yuǎn)來看，人才培養(yǎng)是最關(guān)鍵的。雖然算力目前遇到了瓶頸，但這相對是一個短期問題。長期來看，人工智能的發(fā)展離不開人才的培養(yǎng)。

個人認(rèn)為，本科教育非常重要。大學(xué)的研究工作，如何與產(chǎn)業(yè)界結(jié)合，推動人工智能領(lǐng)域的研究，這也是重要的。對于長期發(fā)展，最核心的還是人才。短期問題，比如數(shù)據(jù)問題，相對容易解決，但人才培養(yǎng)需要全社會的共同努力。

周忠和：說到人才，我想到了一個問題。我們通常關(guān)注人數(shù)和發(fā)表論文的數(shù)量，就像張老師之前提到的排名一樣。但在中國科技領(lǐng)域，我們現(xiàn)在需要的是真正的創(chuàng)新的拔尖的人才，這不僅僅是數(shù)量上的問題，對吧？

張宏江：沒錯。特別是在未來，那些湊數(shù)的很可能會被AI取代。我們需要的是那種能夠進(jìn)行真正創(chuàng)新的人才。

薛瀾：我談?wù)劦诙䝼€問題。我覺得這是一個假設(shè)，這種假設(shè)是很難實現(xiàn)的。如果我們回到幾十年前，在舉國體制、計劃經(jīng)濟(jì)下，說不定還有點可能。今天的這種情況我覺得是非常難的，所以這個前提不存在，我們就沒有必要探討到后面的部分了。

觀眾3：我是理論物理專業(yè)的學(xué)生，從原理上來說，AI是否可能具備提出全新基礎(chǔ)理論的能力？比如像相對論或標(biāo)準(zhǔn)模型這樣的理論。如果AI真的可以做到這一點，那么我們是否可以得出結(jié)論，比如像現(xiàn)代的Transformer架構(gòu)，它是否能自我產(chǎn)生出比自己更先進(jìn)的架構(gòu)？如果是這樣，那是否意味著AI具有一種自我進(jìn)化的能力？

張宏江：如果你問的是AI能否設(shè)計出比自己更有效的工具，我認(rèn)為這是有可能的。關(guān)于AI是否能夠自我進(jìn)化，目前我還看不到這樣的能力，但我不認(rèn)為這在未來是不可能的。隨著我們構(gòu)建越來越大的模型，它們本質(zhì)上會變得更智能。設(shè)計更大的模型需要更高的效率，如果AI能夠設(shè)計出更好的編程模塊，使工程實施比人類更高效，那么在這一點上，我認(rèn)為AI是有可能實現(xiàn)自我超越的。

至于AI能否發(fā)現(xiàn)新的物理突破，我認(rèn)為這和問一個物理學(xué)家未來十年是否會有重大物理發(fā)現(xiàn)一樣，都是開放性的問題。不過有一個例子值得一提，那就是核聚變。核聚變本質(zhì)上是創(chuàng)造一個小型太陽，而要實現(xiàn)這一點，我們需要能夠包裹住核反應(yīng)的等離子體。核聚變主要的一種結(jié)構(gòu)，托卡馬克（Tokamak）內(nèi)部的等離子體，只能通過大型AI模型來完成設(shè)計。也就是說在核聚變這個領(lǐng)域，AI已經(jīng)幫上忙了，因為它能夠設(shè)計出之前人類無法設(shè)計的等離子體模型。所以，當(dāng)我們談?wù)摰?萬億美元的投資時，可以說AI也在幫助解決自己的能源問題。

現(xiàn)場觀眾提問正在提問

周忠和：那AI能夠提出原創(chuàng)性的科學(xué)問題嗎？

張宏江：如果它能做數(shù)學(xué)推理和證明，我覺得就不遠(yuǎn)了。

李航：我是這樣看待這個問題。AI目前還難以展現(xiàn)出真正的創(chuàng)造力，比如說那種顛覆性的創(chuàng)新，像相對論那樣我們從未想過的理論。雖然現(xiàn)在AI能夠發(fā)現(xiàn)新的定理、新的證明方法、新藥物和新材料，但它更像是在廣闊的搜索空間中尋找最佳答案。它能夠處理的規(guī)模是人類無法比擬的。

周忠和：也就是說，AI的發(fā)現(xiàn)是基于現(xiàn)有知識框架的，對嗎？

李航：可以這么說。AI實際上是在一個巨大的搜索空間中尋找正確的解答，人是做不到那么大規(guī)模的搜索的。從這個角度看，AI在未來的科學(xué)發(fā)現(xiàn)方面潛力巨大，我對AI for Science的未來發(fā)展非常樂觀，這個意義上的科學(xué)發(fā)現(xiàn)會非常多。

盡管我們還沒有完全解決AI for Science的數(shù)據(jù)問題，這不像互聯(lián)網(wǎng)數(shù)據(jù)相對豐富，但我認(rèn)為這個挑戰(zhàn)最終可以被克服。如果我們按照Scaling Law的思路來看，未來的發(fā)展空間是巨大的。但是，對于那些完全顛覆性的創(chuàng)新，比如相對論，我認(rèn)為AI目前還做不到。因為AI的發(fā)現(xiàn)是基于我們設(shè)定的數(shù)據(jù)和搜索空間，它在這個范圍內(nèi)進(jìn)行組合和搜索，而不是創(chuàng)造出我們從未想過的新概念。所以，至少在目前，我沒有看到AI能夠突破這一點。

觀眾4：我是來自天氣預(yù)報領(lǐng)域的，首先，當(dāng)AI模型能夠提供比傳統(tǒng)數(shù)理模型更準(zhǔn)確的預(yù)測時，我們是否應(yīng)該放棄那些我們熟悉且建立起來的數(shù)理模型，停止嘗試用它們?nèi)ダ斫馕锢頇C(jī)制的過程？還是說，我們會依賴AI來告訴我們這個世界是如何運作的？

其次，隨著AI逐漸取代了許多傳統(tǒng)的白領(lǐng)工作，我們可能會面臨一個社會現(xiàn)象，大量的人可能不再需要工作。如果按照97比3的比例，那么那97%的人將如何度過他們的生活？他們是否能夠發(fā)揮人類獨有的創(chuàng)造力？如果他們只是普通人，他們應(yīng)該如何適應(yīng)這樣的生活？社會又將如何看待這些不再從事傳統(tǒng)工作的人？我們對于“人應(yīng)該如何生活”的哲學(xué)是否會發(fā)生根本性的變化？

張宏江：我的回答是，人類將持續(xù)探索新的領(lǐng)域和方法，因為模型需要人來提供數(shù)據(jù)。這種數(shù)據(jù)包括新的方法。所以我覺得，人和模型會共存，而且互幫互助。但與此同時，模型的發(fā)展也會對人類提出越來越高的要求。想象一下，如果大部分事情模型都做得比人好，那對人類的能力和素質(zhì)就會有更高的期望和標(biāo)準(zhǔn)。

薛瀾：您剛才提出的問題非常重要。實際上，我認(rèn)為這里涉及到兩個方面的問題。首先，正如我們之前討論的，隨著人工智能的廣泛應(yīng)用，特別是那些能力出眾的人可能會變得更加高效，而其他人可能就不再被需要。在這種情況下，我們首先需要面對的是社會分配問題。現(xiàn)行的社會分配制度可能需要進(jìn)行重大的調(diào)整。否則，沒有工作的人可能會采取極端行動。因此，這個問題必須首先得到解決�，F(xiàn)在，人們正在討論普遍基本收入（UGI）和其他各種新的分配方式，這些都是我們社會需要探索的。

當(dāng)然，您提到的另一個問題也確實存在。在未來，我們目前所說的工作，可能不再需要如此大量的就業(yè)人口。這種情況下，未來人類生活的意義是什么？我們應(yīng)該如何創(chuàng)造新的方式，讓每個人都能在社會上生存并繼續(xù)過上有意義的生活？這也是我們整個現(xiàn)代社會需要積極探討的問題。不過，我相信技術(shù)進(jìn)步雖然迅速，但社會的演變和適應(yīng)能力也同樣強(qiáng)大。我們的認(rèn)知和社會的容忍度將會隨著技術(shù)的發(fā)展而調(diào)整。

所以我認(rèn)為不至于在短期內(nèi)，比如五年后，所有人都失業(yè)。但另一方面，我們需要有緊迫感。在適應(yīng)這些變化的同時，探討未來人類社會的形態(tài)，以及我們?nèi)绾尉S持有意義的生活是很重要的問題。這是需要我們大家共同努力的方向。

觀眾5：各位老師好，我是北航生物醫(yī)學(xué)工程專業(yè)的博士研究生，我現(xiàn)在的這個研究方向是人工智能在蛋白質(zhì)設(shè)計中的應(yīng)用。剛才幾位老師講得很清楚，現(xiàn)在人工智能已經(jīng)非常的強(qiáng)大了，在未來，我們相信AI是專家的時候，我們怎么去研判我們問它的問題，它反饋給我們的是正確的？

李航：這是一個開放性的問題。Open AI也在研究，當(dāng)超人類智能出現(xiàn)時會發(fā)生什么。這涉及到很多未知的問題。我個人觀點，我們現(xiàn)在不要過多地討論這些問題。

我們現(xiàn)在使用GPT-4，它有時會有機(jī)器幻覺，我們需要判斷它所說的是否正確。如果你了解它容易犯哪些錯誤，你就會更懂得如何使用它。我們需要掌握這種技巧。

周忠和：有人說有10%的錯誤率，真有這么高嗎？

李航：不止10%。比如你問北京五塔寺的地址是什么？GPT-4會回答錯誤。我試過，它會給出錯誤的答案。

周忠和：Sora也會犯錯吧？那個視頻看起來很吸引人，但里面似乎也有一些問題……

李航：Sora現(xiàn)在甚至還沒有公開，據(jù)說實際上犯的錯誤也很多。我們需要逐漸適應(yīng)這種工具的特性，了解什么問題可以問，什么時候問完后需要去核實。

未來還有很多這樣的開放性問題，比如剛才提到的科學(xué)發(fā)現(xiàn)，我們需要去驗證。我們需要確認(rèn)它是否正確，數(shù)學(xué)證明也是如此，如果它聲稱證明了一個新的定理，我們?nèi)匀恍枰ヲ炞C。這其中還有很多需要探索和研究的課題。我認(rèn)為這是一個新時代，科學(xué)研究也進(jìn)入了一個新的時代。

- 關(guān)于科學(xué)四十人 -

在創(chuàng)辦《知識分子》和《賽先生》等知名科學(xué)文化平臺的基礎(chǔ)上，智識學(xué)研社發(fā)起成立了民間科學(xué)交流平臺 “科學(xué)四十人”。“科學(xué)四十人” 的成員包括數(shù)學(xué)、物理、化學(xué)、生物、醫(yī)學(xué)等九個領(lǐng)域的領(lǐng)軍科學(xué)家。“科學(xué)四十人” 致力成為先進(jìn)的科學(xué)交流平臺，積極推進(jìn)國際科學(xué)交流和全球科技治理議題，匯聚各個領(lǐng)域的科學(xué)力量和專業(yè)知識、意見和影響力，推動人類可持續(xù)發(fā)展。“科學(xué)四十人” 得到了科匯致遠(yuǎn)公益基金會的大力支持。