展會信息港展會大全

中國在這一波人工智能浪潮中處于什么位置?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-26 13:40:29   瀏覽:9381次  

導(dǎo)讀:《科學(xué)四十人》系列座談第八期(左起,薛瀾、李航、張宏江、周忠和) 大家好,我是知識分子總編輯周忠和,自2022年11月30日ChatGPT發(fā)布以來,全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮。 在過去短短的一年多時間里,ChatGPT4.0和文生視頻的大模型SORA...

《科學(xué)四十人》系列座談第八期(左起,薛瀾、李航、張宏江、周忠和)

大家好,我是知識分子總編輯周忠和,自2022年11月30日ChatGPT發(fā)布以來,全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮。

在過去短短的一年多時間里,ChatGPT4.0和文生視頻的大模型SORA相繼發(fā)布,就在不久前,Openai的競爭對手Anthropic發(fā)布的新一代大模型Claude 3甚至被認(rèn)為全面超越了GPT-4。

全球都在熱烈討論AGI也就是我們所說的通用人工智能何時能實現(xiàn)?突飛猛進(jìn)的人工智能究竟會給我們?nèi)祟惿顜硎裁礃拥挠绊?比如說會不會迎來大規(guī)模的失業(yè)或者就業(yè)的重組?會不會從根本上改變我們?nèi)祟愇拿鞯男螒B(tài)?甚至于AI覺醒以后,硅基生命會不會超越以人類為代表的碳基生命?

我們請到了源碼資本投資合伙人、北京智源研究院創(chuàng)始理事長張宏江,清華大學(xué)蘇世民書院院長、人工智能國際治理研究院院長薛瀾,字節(jié)跳動研究部門負(fù)責(zé)人李航,來探討我們離通用人工智能究竟還有多遠(yuǎn),OpenAI開源的可能性和開源生態(tài),中國人工智能的發(fā)展機(jī)遇和挑戰(zhàn)。

Sora開始理解物理規(guī)律、懂得常識

周忠和:我們今天的第一個問題是關(guān)于Sora的,Open AI推出的Sora,究竟有哪些地方讓你感到真正的興奮,或者說Sora的最值得關(guān)注的地方是什么?Sora給你最大的觸動是什么?

薛瀾:我看到Sora的時候感覺很震驚。因為它不僅僅是文字交流,而且有了一定的想象力。Sora能夠根據(jù)一段簡短的文字描述,生成一系列連貫的動態(tài)畫面,這不僅僅是對文本的理解,更是對物理世界運作規(guī)律的一種把握。

過去我們討論AI的時候,總認(rèn)為想象力是人類的專利,但現(xiàn)在,Sora顯示出AI也能具備這樣的能力。這可能是Sora一個與眾不同的地方。

張宏江:首先,我想談?wù)凷ora這個大模型給我?guī)淼恼鸷场ora的發(fā)布實際上是演示性的,它發(fā)布演示視頻,并沒發(fā)布模型本身,但從40個演示視頻中,我們可以看到AI技術(shù)的巨大進(jìn)步,非常令人振奮。

我注意到幾個亮點:第一,它生成的是高分辨率視頻,過去的視頻生成沒有做到過這么高的分辨率;第二,視頻時長達(dá)到60秒,而過去在生成視頻方面表現(xiàn)比較好的Runway做了兩年,也只能做到幾秒鐘;第三,也是最讓人震撼的是其中一個場景,一輛越野吉普車在崎嶇的山路上狂奔。這種鏡頭以往需要有一臺設(shè)備在后面跟拍,因為路面顛簸難度很高,但生成的視頻效果非常逼真。包括車輛行駛的邏輯也很優(yōu)秀,一直是靠右行駛,轉(zhuǎn)彎表現(xiàn)也很自然。

智源研究院創(chuàng)始理事長張宏江

周忠和:我有個外行的問題。我們普通人看這些視頻,可能會覺得它們不過就是一些高質(zhì)量的影像。它的想象力和邏輯不也是人灌輸進(jìn)去的嗎?

張宏江:不,人并沒有明確地告知它要這么做。

在傳統(tǒng)圖形學(xué)模式下,制作視頻通常需要構(gòu)建詳細(xì)的物理模型。例如,我們想制作一個車輛行駛的視頻,需要先創(chuàng)建一個三維的車輛模型,以及一個包含道路和其他環(huán)境元素的場景模型。場景環(huán)境模型相當(dāng)于虛擬世界,車輛模型則是在這個世界中運動的物體。這些模型需要精確地定義動態(tài)行為和環(huán)境的交互方式,對各種物理規(guī)律、運動規(guī)則進(jìn)行明確編碼,確保車輛在轉(zhuǎn)彎或行駛時的表現(xiàn)符合現(xiàn)實世界的情況。

在使用Sora這樣的大模型時,我們并沒有直接告訴AI這些具體的物理規(guī)則。相反,是AI通過分析大量的視頻數(shù)據(jù),自己學(xué)到的。我們沒有告訴它,世界上大部分地方車是靠右走的。也沒有告訴它,如果不跟隨路線轉(zhuǎn)彎,車會撞到山上。這種明確的規(guī)則我們都沒有告訴它。

這是讓我覺得非常震撼的。GPT 3.5、GPT 4.0以及Claude這些模型,它們主要擅長理解語言,也就是文字描述。但Sora所展示的不僅僅是理解語言,還能夠理解物理世界。

周忠和:你可以說它已經(jīng)理解物理規(guī)律、懂得常識了,但我總覺得這只是模仿。

張宏江:是模仿,但記得費曼曾說過一句名言,“我無法理解我不能創(chuàng)造的東西”,F(xiàn)在我們能生成出來了,難道不就是理解了嗎?

薛瀾:說到智能,我們得先定義一下什么是人的智能。我們有認(rèn)知能力、推理能力、創(chuàng)造力,可能還有其他方面,比如情商。如果我們從這些方面看,有些方面,比如認(rèn)知和推理能力,AI可能已經(jīng)超過了常人,甚至可能超過最厲害的人。但在另一些維度上,人類可能還會保持優(yōu)勢。

另外,您雖然覺得人工智能只是模仿。但人類獲得這些能力的過程,本質(zhì)上不也是如此嗎?都是在不斷接收外部信息,逐步形成認(rèn)知和思維模式,二者在方法上沒有根本區(qū)別。

周忠和:李航老師,您是否也有同樣的感受?

李航:有些地方一樣,有些地方不一樣。我們自己開發(fā)的PixelDance系統(tǒng),效果上超越了當(dāng)時最好的Runway等系統(tǒng),但今年2月Sora發(fā)布,PixelDance又被Sora超越。我的一個感受是做事要快,因為現(xiàn)在的競爭非常激烈。

另外從Sora的技術(shù)報告和相關(guān)論文看,雖然它技術(shù)上有所創(chuàng)新,但并不是革命性的。主要的創(chuàng)新是將擴(kuò)散模型的Unet架構(gòu)改成了Transformer架構(gòu),這讓模型能夠處理更多的數(shù)據(jù),更好地學(xué)習(xí)物理現(xiàn)象。從科學(xué)的角度上看,我認(rèn)為AI大模型目前具有一個共同特點,就是它們都基于Transformer架構(gòu),最基礎(chǔ)的東西是都一樣的。

周忠和:近幾年在基礎(chǔ)科學(xué)原理上并沒有太大突破?

李航:是的,雖然有所進(jìn)步,但自從2017年Transformer架構(gòu)出現(xiàn)以來,我們看到了不斷的收斂。Transformer最初是為自然語言處理開發(fā)的,現(xiàn)在,即使是計算機(jī)視覺領(lǐng)域也開始轉(zhuǎn)向使用Transformer架構(gòu)。

周忠和:那么,你有沒有張老師那樣的感覺,也認(rèn)為AI模型現(xiàn)在開始理解常識和物理規(guī)律了?

李航:是的,我同意張老師的觀點。但我認(rèn)為未來的空間仍然非常大。Sora還不是3D的。3D生成技術(shù),能夠讓我們從不同角度看到物體的樣子。比如,從正面看到一個人,我們是有能力想象他的后腦勺是什么樣子的。3D生成能幫助我們看到人的后腦勺。

目前,3D生成技術(shù)還處于初級階段。去年的計算機(jī)視覺國際會議ICCV,是領(lǐng)域內(nèi)最頂級的會議之一,在會議上展示的論文,大家可以去看目前技術(shù)生成的效果,其實都是比較簡單的。比如一個物體,桌子或椅子,把它換一個角度是什么樣子。

再有,現(xiàn)在的生成模型并沒有物體的語義。我們看視頻時,能認(rèn)出這是汽車、那是道路,但在Sora的模型中,它并不準(zhǔn)確地理解這些,它只是對像素和數(shù)據(jù)進(jìn)行處理。未來如果我們能夠進(jìn)一步發(fā)展這項技術(shù),讓它不僅能處理3D空間關(guān)系,還能理解物體的語義信息,那么我們就更接近于創(chuàng)造出類似人類的智能。在這方面,我們還有很多工作可以做。

Transformer是最佳路徑嗎?我們會不會過于路徑依賴了?

張宏江:李老師剛才提到的Transformer架構(gòu)確實非常關(guān)鍵。自2017年起,Transformer這條路徑給我們做AI的人或者做大模型的人指出了一條路。過去七年,行業(yè)內(nèi)已經(jīng)認(rèn)可它是大模型發(fā)展通向AGI的一條正道。

技術(shù)發(fā)展是有路徑依賴的。意味著一旦我們確定了正確的方向,所有的關(guān)注和資源都會隨之集中。回到七年前,Google的研究人員發(fā)明了Transformer架構(gòu),但OpenAI才是真正認(rèn)識到其潛力并全力投入的一方。盡管Google也推出了許多模型,但很長一段時間沒有一個能夠超越GPT3.5的成就。

現(xiàn)在所有做大模型的人,都把重點放在Transformer架構(gòu)上,包括Sora也是這樣,過去生成視頻用Unet框架無法達(dá)到的,換成Transformer架構(gòu)就實現(xiàn)了突破。未來,無論是GPT4.5、GPT5、Claude還是Gemini,Transformer這條道路都會持續(xù)。

薛瀾:既然說到這兒,我插一個問題。我們是否會因為路徑依賴的原因,而忽視了其他可能更好的路徑?2017年的Transformer架構(gòu)確實很重要,但當(dāng)時也有其他路徑。我們現(xiàn)在是否確定這是最好的路徑?我們是否可能錯過了其他潛在的優(yōu)秀路徑?

清華大學(xué)蘇世民書院院長薛瀾

張宏江:您的問題正好給了我一個機(jī)會,我想說的是,這就像當(dāng)初電的發(fā)明,當(dāng)交流電成為主流后,直流電最終只用于電池。這種路徑依賴是非常關(guān)鍵的。

李航:我想補充的是,作為科學(xué)家,我們總是尋求更好的、顛覆性的技術(shù)來改變現(xiàn)有的Transformer。但目前大家做了很多努力,我也知道一些研究。盡管在小規(guī)模上有些模型看起來還不錯,可一旦擴(kuò)大規(guī)模,它們都無法超越Transformer。目前的結(jié)論是Transformer確實非常強(qiáng)大,其他模型,但到目前為止,還沒有能成功顛覆Transformer。

張宏江:這引出了另一個話題,也就是大模型的Scaling Law。Transformer架構(gòu)成為主流,我們驗證了它的強(qiáng)大。接下來,是把它的規(guī)模越做越大,給它喂越來越多的數(shù)據(jù)。這個領(lǐng)域從業(yè)者們大多認(rèn)為,這個架構(gòu)的潛力還沒有達(dá)到極限。

所以,你可以看到為什么現(xiàn)在大家都在急切地投資購買芯片、增強(qiáng)算力。當(dāng)我們在追求算力的時候,實際上也是在競爭數(shù)據(jù)中心(IDC)的資源。而在搶占IDC的過程中,我們又不得不去爭取電力供應(yīng)。這一連串的動作,實際上都是因為大家認(rèn)同一個觀點:Scaling Law相信隨著模型規(guī)模的增長,性能和能力也會相應(yīng)提升。

周忠和:剛才張老師認(rèn)為Sora生成的視頻是符合物理規(guī)律的,Sora能夠理解常識。不過也有不同的聲音,比如圖靈獎得主楊立昆(Yann Lecun),他說僅靠大量文本數(shù)據(jù)訓(xùn)練是達(dá)不到人類智能水平的。還有的人覺得這是個死胡同,認(rèn)為快到極限了。您剛才好像不太同意這種看法?

張宏江:我可能要得罪人了。我覺得那些說這種路線快到極限的人,其實并不是真正的從業(yè)人員,沒有參與其中。如果在做這件事,你會我們這些在一線的人一樣,非常相信Scaling Law。

如果大家對這個感興趣的話,可以看看清華大學(xué)清華大學(xué)交叉信息研究院的助理教授,也是月之暗面公司CEO楊植麟最近的采訪,他談到了Scaling Law,我覺得講得很好。他作為一個年輕學(xué)者,對Transformer和未來的看法,我覺得很有見地。我們離Transformer的極限還早著呢,現(xiàn)在的問題可能是數(shù)據(jù)不夠,我們應(yīng)該想辦法繼續(xù)擴(kuò)大數(shù)據(jù)規(guī)模。

周忠和:還有人提到電力和其他資源。

張宏江:Scaling Law會帶動很多相關(guān)的東西。比如芯片行業(yè),英偉達(dá)的股票瘋漲,IDC公司也是,數(shù)據(jù)現(xiàn)在變得非常值錢。這些都是推動整個產(chǎn)業(yè)發(fā)展的生態(tài)因素。所以,我覺得極限還遠(yuǎn)著呢。像楊立昆這樣的學(xué)者,我非常尊重他,但在這個觀點上我不太認(rèn)同他。他認(rèn)為數(shù)據(jù)驅(qū)動的系統(tǒng)沒有真正的推理和學(xué)習(xí)能力,走不到AGI。這是他的定義,但按照我的定義,我們正在朝那個方向前進(jìn)。

周忠和:李航老師,你的觀點和張老師一樣嗎?

李航:我部分同意張老師的看法。我相信Scaling Law的潛力,也認(rèn)為我們還沒看到極限。不過,我的觀點也不完全一樣,我去年在香港開會時和楊立昆老師當(dāng)面聊過,他覺得現(xiàn)在的大模型缺乏世界模型。我理解的是,如果能夠?qū)⒁曈X、語言等多模態(tài)信息結(jié)合,就會更接近世界模型。就像我剛才說的,視頻生成的時候,也能生成語義信息和3D信息,那就更接近人類了。我覺得這方面還有很大的空間,我們會沿著Scaling Law的路走下去。

未來可能97%的人不工作,只有3%的人在工作

周忠和:人工智能發(fā)展如此迅猛,對我們生活和工作的影響,也是大家非常關(guān)注的。例如,自動駕駛、互聯(lián)網(wǎng)產(chǎn)業(yè),甚至有人說它對白領(lǐng)工作的影響更大。薛老師,您認(rèn)為短期內(nèi)哪個領(lǐng)域會受到最大的沖擊,白領(lǐng)還是藍(lán)領(lǐng)?

薛瀾:我認(rèn)為所有涉及信息或數(shù)據(jù)獲娶處理和傳播的行業(yè)都將受到巨大沖擊。這不僅包括了傳播業(yè),如電影和電視,還涵蓋了教育、藝術(shù),甚至醫(yī)療服務(wù)。還包括文秘工作和法律行業(yè)的助理工作,所有與信息處理相關(guān)的領(lǐng)域,包括信息獲娶處理和傳播,都可能逐漸受到影響。

周忠和:這些變化會多快發(fā)生呢?5年還是10年?

薛瀾:影響的速度取決于兩個方面。首先是人工智能本身的效率提升有多快。其次是社會制度的變革,這些制度對傳統(tǒng)行業(yè)的保護(hù)非常強(qiáng)。所以這一方面是技術(shù)進(jìn)步的過程,一方面也是制度變遷,這兩個方面需要協(xié)調(diào)起來往前走。

周忠和:您提到教育也會受到影響,如果預(yù)計在未來5到10年內(nèi),某些行業(yè)將不復(fù)存在,那我們現(xiàn)在為什么還要在大學(xué)里學(xué)習(xí)它們呢?這是一個緊迫的問題,因為變化來得太快,可能我們還沒有足夠的討論。

李航:很難預(yù)測,但有兩個明顯的趨勢。首先,會出現(xiàn)新的工作,比如數(shù)據(jù)標(biāo)注。數(shù)據(jù)非常重要,現(xiàn)在數(shù)學(xué)家陶哲軒等開始標(biāo)注數(shù)學(xué)定理證明的數(shù)據(jù),使用新的編程語言Lean來描述這個過程。他就是利用他的經(jīng)驗,把證明的過程寫出來,讓AI學(xué)習(xí)。我估計未來數(shù)學(xué)定理的證明,AI也能做。

其次,各行各業(yè),包括編程和AI領(lǐng)域,都會出現(xiàn)兩極分化,最優(yōu)秀和有創(chuàng)造力的人才將發(fā)揮更重要的作用。

薛瀾(左)和字節(jié)跳動研究部門負(fù)責(zé)人李航(右)

周忠和:那么對于普通人來說,哪些行業(yè)的影響最大?

李航:硬件領(lǐng)域的變化可能會慢一些,因為硬件迭代需要時間。至于軟件,發(fā)展會更快。但我認(rèn)為長期來看,軟件開發(fā)的形態(tài)也會發(fā)生變化。一些簡單的程序AI是能夠?qū)懙摹?/p>

周忠和:機(jī)器完全可以替代人的創(chuàng)造性嗎?

李航:就像薛老師剛才說過的,我認(rèn)為有三個方面人工智能目前難以取代人類:情感、創(chuàng)造力和自由意志。情感是人的本能,要在機(jī)器上實現(xiàn)情感就等同于造一個擁有生命的人了。創(chuàng)造力和自由意志同理,這三者不是單純的智能,而是生命現(xiàn)象。

如果一個事情是任務(wù),能去評價完成它的好壞,AI基本都能完成。馮諾依曼說過這樣一句話,意思就是告訴我一個任務(wù),不管是多復(fù)雜,把它定義清楚,我都能給你造一個機(jī)器,專門去完成你這個任務(wù)。

現(xiàn)在大家經(jīng)常談AGI,談通用人工智能,“通用”確實是有很大的革命性的,這個工具不像馮諾依曼說的,專門做某一樣事情。它變成很通用,完成很多很多的任務(wù)。但另一方面,只要這些任務(wù)能夠定義、能夠標(biāo)數(shù)據(jù)、能有評價標(biāo)準(zhǔn),看樣子AI基本都能做。前面說到人類的幾個特點屬于生命現(xiàn)象,不是任務(wù),AI做不了。但是AI做很多任務(wù),能超過人,可能未來AI做大部分工作都超過人。

張宏江:我同意薛老師的觀點。人的智能有多個維度,在許多維度上,機(jī)器可能會超越人類。對于普通人來說,最擔(dān)心的可能是自己的工作。

我倒覺得白領(lǐng)工作可能會受到較快的沖擊。我上周和崔健談AI,談到未來可能是97%的人不工作,只有3%有職業(yè)。這不是我的觀點,而是《世界簡史》作者的觀點:平均技能水平的工作者可能會被替代,但頂尖藝術(shù)家不用擔(dān)心,因為他們是少數(shù)。

至于助理類工作,比如法務(wù)助理,或者分析師很大程度會被替代,F(xiàn)在一些AI工具已經(jīng)能幫助我們更高效地工作,比如許多人還要通過微軟的Outlook手工安排會議,以后可能是AI來做這個工作,效率會提高很多。

另外我們不能停留在提高效率的階段,30年前國際象棋大師卡斯帕羅夫被深藍(lán)擊敗。當(dāng)時卡斯帕洛夫曾說,未來機(jī)器將在象棋領(lǐng)域給予我們巨大的幫助。然而,30年后的今天,我們看到的情況是,機(jī)器在象棋上已經(jīng)不需要人類的幫助。

周忠和:那么,藍(lán)領(lǐng)工作呢?

張宏江:我為什么對Sora如此激動,就在于它對物理世界的初步理解。當(dāng)一個系統(tǒng)能夠理解物理世界時,就能指揮機(jī)器人執(zhí)行任務(wù)。硬件的AI化進(jìn)展可能比軟件慢,但隨著機(jī)器人技術(shù)的進(jìn)步,比如靈巧手和機(jī)械能力的提升,AI對藍(lán)領(lǐng)工作的影響只是一個時間問題。

周忠和:人工智能對程序員有什么影響?

張宏江:軟件設(shè)計師的工作可能會被自動化工具,比如微軟的GitHubCopilot和Google的對應(yīng)產(chǎn)品所替代。這些工具已經(jīng)能夠做很多事情,通過大模型驅(qū)動,能完成很多常用程序的編寫,至少可以提高開發(fā)者的效率。其他重復(fù)性的工作也很容易被替代。

周忠和:那研究人工智能的行業(yè),未來也還會需要那么多人嗎?

李航:需要更多的人,但也會兩級分化。比如數(shù)據(jù)標(biāo)注這項工作,從簡單的常識性的標(biāo)注,到我剛才說的專業(yè)性的標(biāo)注,差別是很大的。

周忠和:薛老師,針對我們國家的自然科學(xué)科研人員,尤其是那些在技術(shù)開發(fā)和基礎(chǔ)研究領(lǐng)域處于領(lǐng)先地位的研究人員,人工智能的發(fā)展會對他們的工作產(chǎn)生怎樣的影響?

薛瀾:我認(rèn)為肯定會有顯著的沖擊,科學(xué)研究也會出現(xiàn)兩極分化。但我們需要區(qū)分常規(guī)科研和科學(xué)革命這兩種情況,如果我們按照托馬斯庫恩的科學(xué)革命理論來看,科學(xué)研究可以分為常態(tài)科研和科學(xué)革命。在常態(tài)科研中,我們已經(jīng)對某個領(lǐng)域的基本范式有了清晰的理解,并且正在解決一些尚未解決的問題,這就像是在解謎。例如,當(dāng)前的蛋白結(jié)構(gòu)研究就是這樣的領(lǐng)域。

在這些領(lǐng)域,人工智能可能會替代很多工作,在現(xiàn)有范式下工作的科研人員,他們的工作可能會被人工智能所替代。但是對于那些能夠發(fā)現(xiàn)新問題,制造危機(jī),挑戰(zhàn)現(xiàn)有范式的研究者,這些人的工作是人工智能難以替代的。這樣的研究者永遠(yuǎn)有需求。

我們距離真正的通用人工智能還有多遠(yuǎn)?

周忠和:當(dāng)下一個非常熱門的話題是,我們距離真正的通用人工智能(AGI)有多遠(yuǎn),AGI的定義或者實現(xiàn)的標(biāo)志是什么?另外,目前Open AI引領(lǐng)的人工智能革命是比較公認(rèn)的,但是否有其他競爭者?比如Claude,有人說它超越了ChatGPT和Open AI,但這種說法是否夸張?

李航:目前還沒有一個嚴(yán)格的定義來界定什么是AGI。

大模型的通用性是一個顯著的特點,它們能做很多事情,發(fā)展空間非常大。但是,它和人在創(chuàng)造力、情感和自由意志等方面仍有區(qū)別,模型在這些方面的表現(xiàn)也只能近似人類智能,而不是完全實現(xiàn)人類智能。

像黃仁勛說的AGI可能在5年內(nèi)實現(xiàn),也是基于特定的定義。我認(rèn)為,一旦我們能夠清楚地定義一個任務(wù)并評價它的完成情況,人工智能通常能夠完成得很好。但是,人類能理解世界,能夠遐想和想象,要想在這些方面追上人,我覺得十年二十年之內(nèi)人工智能還做不到。

張宏江:我想就李航老師提到的三點進(jìn)行爭論。我同意其中的兩點,但對于情感這一點,我認(rèn)為情感可以被視為人類的獎勵函數(shù)(rewarding function)。如果我們能夠?qū)W習(xí)人類的獎勵函數(shù),提供足夠的數(shù)據(jù),那么人工智能就有可能模擬情感。

這是一種高維度的復(fù)雜函數(shù),在計算上會很復(fù)雜,而這正是大型模型的優(yōu)勢所在。例如,鄂維南老師做的AI for Science,在材料設(shè)計,簡單的材料結(jié)構(gòu)可以通過微分方程算出來,復(fù)雜的分子材料幾乎不可能算出來,利用大模型進(jìn)行模擬是更好的辦法。在材料設(shè)計、天氣預(yù)測和生命科學(xué)等領(lǐng)域,當(dāng)問題復(fù)雜到無法用數(shù)學(xué)方程來描述時,恰恰是大模型發(fā)揮作用的地方。

周忠和:有人說大模型只是AGI的一塊孤立的拼圖,還有很多拼圖沒找到,幾位老師認(rèn)同這個觀點嗎?

張宏江:這一定是哲學(xué)家說的。

周忠和:這是你所不認(rèn)同的,對吧。李老師,你覺得現(xiàn)在的大模型方向,就是通向AGI的充分條件嗎?

李航:在大部分情況下,我認(rèn)為現(xiàn)有的大模型方向是正確的,是通向AGI的重要途徑。但也可能存在一些人類智能無法用大模型實現(xiàn)。

周忠和:李老師,你曾經(jīng)提到過,深度學(xué)習(xí)在未來一段時間是主流,但長遠(yuǎn)來看,我們還是應(yīng)該從人腦計算中獲取啟發(fā)。

李航:我的觀點和現(xiàn)在的大模型路線其實不矛盾,只是希望將來能夠在更好地模仿人腦,實現(xiàn)更接近人的AGI。

計算存在功能、算法和物理實現(xiàn)三個層面,F(xiàn)有的以Transformer為基礎(chǔ)的大模型主要是在功能層面上模仿人類,但在算法層面,AI和人的大腦的結(jié)構(gòu)還是完全不一樣的,所以我們可以在功能層面上更多借鑒人腦的機(jī)制。

薛瀾:我跟他們倆唱一個反調(diào)。路徑依賴確實存在,但錯過的道路,可能我們在很多年后會重新走回來。比如過去我們的技術(shù)和資金都投資在燃油動力汽車上,其實電動汽車上個世紀(jì)初就已經(jīng)被發(fā)現(xiàn)了,曾經(jīng)有一段時間也還是可以跟汽油車相競爭的,只是后來因為多種原因就被忽略掉了。多年以后的現(xiàn)在,電車又發(fā)展的很好,所以不排除錯過的道路在未來能有很好的發(fā)展。

周忠和:薛老師,考慮到人工智能目前的發(fā)展趨勢,您認(rèn)為我們最需要哪類人才?是更傾向于計算機(jī)專業(yè)的技術(shù)人才,還是需要更多跨學(xué)科的專家,比如腦科學(xué)、生命科學(xué)等領(lǐng)域的?

薛瀾:我認(rèn)為我們需要的人才首先要具備創(chuàng)造力,創(chuàng)造力在今后仍然至關(guān)重要。另外,傳統(tǒng)的、那種很強(qiáng)調(diào)專業(yè)細(xì)分的教育模式可能需要改變。我們需要從新的維度重新思考教育問題。

我們過去學(xué)習(xí)的知識和技能可以分為兩類:一類是為了在社會中生存所必需的,另一類則是提升我們認(rèn)知能力的學(xué)習(xí)。我估計,隨著人工智能的發(fā)展,第一類能力可能會被系統(tǒng)替代,這些東西也就沒有多大必要去學(xué)習(xí)。

相反,我們需要思考的是如何通過教育,提升受教育者的認(rèn)知能力和創(chuàng)造力?赡苄枰环N全新的教育方式,與現(xiàn)有的教育體系完全不同。實際上,人工智能對教育系統(tǒng)的沖擊應(yīng)該是最大的,但我們恰恰是動的最慢的。

周忠和:李老師和張老師兩位都在公司里工作,你們希望招聘什么樣的人才?期待未來的教育系統(tǒng)能夠給你們輸出什么樣的人才?

李航:在人工智能領(lǐng)域,本科的教育是非常重要的。在美國,頂尖大學(xué)機(jī)器學(xué)習(xí)本科學(xué)生的作業(yè)難度非常高,甚至要熬夜來完成。計算機(jī)領(lǐng)域的一些基本技能培養(yǎng),美國本科教育都已經(jīng)能做得很好,而國內(nèi)在這方面需要加強(qiáng)。就純計算機(jī)和人工智能的人才培養(yǎng)的角度來說,我是看到、感到有一定的差距的。

周忠和:人工智能變成熱門之后,很多人提議從中學(xué)開始學(xué)習(xí)人工智能。

張宏江:作為兩個孩子的父親,我可能對教育稍微多一點認(rèn)識。我認(rèn)為重要的是培養(yǎng)孩子們的思考能力,而不只是具體知識。

美國的學(xué)校,對14歲的學(xué)生就開設(shè)邏輯和批判性思維課程。這個課程是教孩子們怎么思考,而不是一門具體的專業(yè)知識。站在任何一個專業(yè)角度講,如果你想從事研究的話,邏輯和批判性思考能力是非常重要的。

未來的人才,最需要邏輯和批判性思考的能力。灌輸知識這樣的教育,實際上是培養(yǎng)就業(yè)能力,而且是過去的就業(yè)能力,未來是行不通的。從科研人才的角度講;剡^頭看,在科學(xué)職業(yè)化之前、文藝復(fù)興之后的幾百年,也是沒有職業(yè)科學(xué)家的,需要的是他們思考的能力和觀察的能力。

薛瀾:我覺得越是在這種形勢下,人文素養(yǎng)也會變得非常重要。

開源和閉源,哪一種模式對人類更安全?

周忠和:最近有消息說馬斯克因OpenAI違背了其非盈利的宗旨,打算將其告上法庭。我們知道非盈利模式有其優(yōu)勢,但資金的缺乏也可能影響技術(shù)的發(fā)展。

薛瀾:現(xiàn)代科學(xué)和科技的發(fā)展,是希望在開放科學(xué)的道路上前進(jìn)的,尤其是人工智能這個領(lǐng)域。開源可以促進(jìn)技術(shù)的交流和發(fā)展。反對開源的人擔(dān)心安全隱患,但也有人認(rèn)為不開源可能更危險,這些方面的爭論一直存在。我覺得可以請其他兩位人工智能領(lǐng)域的專家,講下到底應(yīng)該怎么權(quán)衡這個問題?

李航:去年一個AI會議上沈向洋博士表達(dá)過一個觀點,我非常同意,是否開源取決于公司的商業(yè)地位和策略。行業(yè)的領(lǐng)導(dǎo)者可能不會選擇開源,第一名肯定不會開源,第二名想要和第一名競爭也不會開源,第三、第四名的公司可能會選擇開源以取得一些競爭優(yōu)勢。

我覺得至少從歷史的經(jīng)驗上看,這個觀點是有道理的。AI公司里,現(xiàn)在沒有開源的是OpenAI、Anthropic。開源的是Meta和Amazon。

周忠和:商業(yè)性之外,我們可能更關(guān)心開源爭論對技術(shù)發(fā)展的影響,以及安全問題。這方面您怎么看?

李航:實際上,從商業(yè)角度來看,Meta和其他公司選擇開源,并不是出于其他考慮,而是因為這樣做能在商業(yè)上帶來一定的利益。我同意沈向洋的觀點,他認(rèn)為這些公司開源是為了在商業(yè)利益上獲得優(yōu)勢。這涉及到一個更根本的問題:人工智能技術(shù)的研究和開發(fā)是否應(yīng)該以市場經(jīng)濟(jì)為導(dǎo)向。

字節(jié)跳動研究部門負(fù)責(zé)人李航

周忠和:薛老師您贊成AI公司以盈利為導(dǎo)向嗎?

薛瀾:我們現(xiàn)在進(jìn)行的關(guān)于人工智能的研究,實際上相當(dāng)于在從事科學(xué)技術(shù)的基礎(chǔ)研究。在科學(xué)技術(shù)領(lǐng)域里,基礎(chǔ)研究通常是開源的。不過,人工智能研究的回報機(jī)制與之略有不同。在學(xué)術(shù)領(lǐng)域,最先發(fā)表論文被認(rèn)可擁有優(yōu)先權(quán),這就是所謂的回報制度,已經(jīng)被大家所公認(rèn)。而人工智能大公司之間,真正的競爭在于最終的應(yīng)用和產(chǎn)品層面。

從這個角度講,我認(rèn)為應(yīng)當(dāng)鼓勵開源。對于大公司來說,它們可以在商業(yè)應(yīng)用和產(chǎn)品層面尋找盈利模式,在那個領(lǐng)域開展競爭。從各個研究領(lǐng)域的實踐來看,這種在基礎(chǔ)研究階段開源、在產(chǎn)品化階段閉源并尋求商業(yè)化的模式,目前看來對于推動人類社會進(jìn)步是一種非常有效的做法。

張宏江:我非常贊同薛老師的觀點。開源是探索階段的重要工具,它鼓勵大家一起討論、交流和評估,這樣的話才能夠真正地推動一個領(lǐng)域的進(jìn)步。從這一點上來說,我非常贊同開源。開源能夠把真正地做研究的人帶到一塊。今天的AI領(lǐng)域,從方法論、架構(gòu)還有很多問題需要解決,開源是一個非常好的交流載體。

周忠和:您剛才提到了安全問題,那么我們應(yīng)該如何解決開源可能帶來的安全隱患?

張宏江:無論是開源還是閉源,安全問題都是不可避免的。但對于開源模型,我們更容易進(jìn)行驗證和審查。未來,任何發(fā)布的AI模型都應(yīng)該通過安全認(rèn)證。此外,如果AI是一個可以改變?nèi)祟惖募夹g(shù),我們需要在AI安全研究上投入更多的資源。

我曾在一個AI安全閉門會上聽到一個觀點,讓我很吃驚,但我相信其中的數(shù)據(jù)是對的:核電站設(shè)備的研發(fā)費用中有95%用于安全,這對我們AI領(lǐng)域來說是一個啟示。我們是否也應(yīng)該在AI安全上投入更多的資源?如果核電投入95%,AI是不是應(yīng)該在安全上投入10%或者15%,因為這個技術(shù)也是可能導(dǎo)致人類滅絕的。

周忠和:薛老師,您在經(jīng)常在中國和國際舞臺上積極討論人工智能治理的問題。安全性顯然是大家非常關(guān)注的焦點。鑒于人工智能已經(jīng)達(dá)到了相當(dāng)高的智能水平,我們是否可以認(rèn)為開源在某種程度上也是一種保障措施呢?

薛瀾:是的,開源與閉源的討論實際上涉及到利弊的權(quán)衡。正如剛才所提到的,有人可能會擔(dān)心開源會讓極端組織或個人有機(jī)會濫用技術(shù)。不論開源還是閉源,只要有心作惡,總會找到途徑,F(xiàn)有的各種技術(shù),如果被濫用,都可能對人類社會造成破壞,生物技術(shù)就是個例子,它同樣存在被濫用的風(fēng)險。因此,更重要的是如何建立一套體系,來防范和制止任何個人或組織濫用技術(shù)危害社會。我們需要更多地考慮如何通過監(jiān)管機(jī)制來控制這些風(fēng)險。

假設(shè)從企業(yè)的商業(yè)角度出發(fā),需要采取閉源等策略。在這種情況下,我們就需要建立一套監(jiān)管機(jī)制。這個監(jiān)管體系將對企業(yè)的閉源研究進(jìn)行規(guī)范和約束,以確保其合法合規(guī)。所以我認(rèn)為,企業(yè)的需求和監(jiān)管制度是相互促進(jìn)、相輔相成的。

中國在這一波人工智能浪潮中處于什么位置?

周忠和:中國在人工智能研究方面發(fā)表了大量的文章,并且在國際上也處于較為領(lǐng)先的位置。但具體來說,中國在人工智能方面有哪些優(yōu)勢和不足呢?比如有觀點認(rèn)為,中國缺乏高質(zhì)量、大規(guī)模的中文數(shù)據(jù)集,這可能會影響我們的人工智能發(fā)展?

李航:中國在人工智能的應(yīng)用和商業(yè)化方面確實還有很多機(jī)會。我們可以看到,在互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代,中國企業(yè)的表現(xiàn)非常出色,尤其是在過去的十年里。我們在互聯(lián)網(wǎng)商業(yè)化的應(yīng)用層面上很有特色。比如在大模型的實用場景中,不一定要追求像GPT-4那樣的大規(guī)模模型,即使是相對較小的模型,在特定的實用場景中也能發(fā)揮重要作用。

就我個人的觀點而言,未來人工智能的發(fā)展機(jī)遇主要集中在四大領(lǐng)域。首先是張老師之前提到的助理領(lǐng)域,也就是廣義上的助理和白領(lǐng)工作,這里有很大的應(yīng)用空間。其次,機(jī)器人的發(fā)展也非常關(guān)鍵,它們能夠幫助工人和普通人完成一般工作任務(wù)。再者,AI for Science,即利用人工智能推動科學(xué)研究,這在數(shù)學(xué)、物理、化學(xué)等科學(xué)領(lǐng)域都有潛力。最后,娛樂行業(yè),無論是視頻制作、電影、游戲還是虛擬現(xiàn)實,人工智能的發(fā)展都有很多機(jī)會。

比如在硬件方面,當(dāng)大模型與硬件結(jié)合時,機(jī)器人技術(shù)就是一個應(yīng)用的典型例子。實際上,不僅限于機(jī)器人,自動駕駛等眾多領(lǐng)域也有著廣泛的發(fā)展機(jī)會。在應(yīng)用層面,我認(rèn)為中國整體上還有比較大的優(yōu)勢。

至于數(shù)據(jù)問題,目前高質(zhì)量的英文數(shù)據(jù)資源相對較多,而高質(zhì)量的中文數(shù)據(jù)資源則相對較少,尤其是在互聯(lián)網(wǎng)上。但通過機(jī)器翻譯或未來的一些新技術(shù)手段,我們是可以實現(xiàn)兩種語言數(shù)據(jù)之間互通的。所以,我不認(rèn)為語言數(shù)據(jù)的差距會是一個特別大的障礙。

不過,如果我們將人工智能的發(fā)展比作一場軍備競賽,那么可以說,Open AI在AGI方面確實領(lǐng)先一步,其他所有人都在努力追趕。對于中國而言,無論是企業(yè)界還是學(xué)術(shù)界,我們各個方面都需要加大努力,以縮小與領(lǐng)先者之間的差距。

我們剛才也討論到,中國的一些創(chuàng)業(yè)公司有很多做得不錯的?梢哉f,中國公司已經(jīng)掌握了AI大模型的科學(xué)原理,因為這些科學(xué)原理基本上是公開的,大家都能學(xué)會。但現(xiàn)在的問題更多的是工程和產(chǎn)品開發(fā)。如果這些能夠叫技術(shù)的話,我們其實是沒有完全掌握這些技術(shù)的,中國的企業(yè)也好,研究機(jī)構(gòu)也好,還需要努力,把這些技術(shù)能夠盡快掌握,才能做出GPT4、Sora這樣水平的東西。

張宏江:我要補充一點。目前這一波深度學(xué)習(xí)驅(qū)動的人工智能浪潮,并不是一個新現(xiàn)象,今天的情況只是進(jìn)一步強(qiáng)化了這種觀點。這波浪潮是算法、算力和數(shù)據(jù)三者的結(jié)合。在很大程度上,算法反映了人才的實力,也就是我們所說的人才。所以也可以說,是人才、硬件和數(shù)據(jù)的組合。通過這三個點,我們可以清晰地知道自己在什么定位。

數(shù)據(jù)我們有很多方式彌補,接下來就是人才。斯坦福大學(xué)每年發(fā)布的AI指數(shù)報告。這份報告統(tǒng)計了全球AI領(lǐng)域的論文發(fā)表情況,你猜在前十名的機(jī)構(gòu)中,麻省理工學(xué)院(MIT)排名第幾?

周忠和:難道沒有排到第一?

張宏江:如果MIT排第一,我就不提這個問題了。實際上,MIT排在第十,而前九名全是中國的機(jī)構(gòu)。這說明我們從業(yè)的人才一定不少,無非就是我們需要把發(fā)表文章的數(shù)量變成質(zhì)量,把跟進(jìn)變成突破、引領(lǐng)。還有很多思路,我們使可以繼續(xù)沿著這三點思考的。

關(guān)于李航老師說的,中國在應(yīng)用方面有優(yōu)勢這一點,我也有不同觀點:這一次跟以前可能真是不太一樣,F(xiàn)在AI領(lǐng)域的目標(biāo)是AGI,強(qiáng)調(diào)通用。以前是單點上的技能,現(xiàn)在是一個通用的智能。

這就跟以前不太一樣了,每一次OpenAI發(fā)一個新的版本或者加一個新的特性(feature),就是一片公司倒下。原來你認(rèn)為一個公司才可以做的事情,大模型加一個特性就覆蓋了。Sora出來后,Runway和其它做視頻生成的公司就很緊張,因為你就是一個工具,Sora是多模態(tài)大模型的一個部分。

如果大模型繼續(xù)沿著這個方向發(fā)展,它們的功能將變得越來越全面。當(dāng)幾句話就能在GPT 商店里產(chǎn)生一個新應(yīng)用,當(dāng)大模型的功能無所不包,是不是像上世紀(jì)90年代微軟的操作系統(tǒng),給當(dāng)時其他軟件公司帶來的恐懼。而你還不能夠用反壟斷的方式來對抗它,因為大模型本身就這么強(qiáng)。

指望靠一個性能稍差的、70分專用小模型,去完成特定應(yīng)用,就怕人家做出90分的大模型,順手把這些功能都覆蓋,橫掃這些小模型。

那為什么自從ChatGPT問世以來,雖然已經(jīng)過去了一年多的時間,但在我們所說的AI原生應(yīng)用領(lǐng)域,并沒有看到太多新興公司的身影?一方面是大家都沒摸清楚,另一方面是大模型性能還沒好到那個地步,用在哪個領(lǐng)域,立刻讓用戶滿意。

因為用戶對于應(yīng)用的期望值非常高。比如,當(dāng)30年前語音識別技術(shù)不成熟的時候,蘋果做了一個手寫和語音識別產(chǎn)品叫Newton,但問題是語音識別的技術(shù)不過關(guān),甚至手寫識別那時候也不過關(guān),因為那時候神經(jīng)網(wǎng)絡(luò)還是三層的。最后用戶不認(rèn)可,這個產(chǎn)品行情大跌。當(dāng)一個技術(shù)撐不起一個產(chǎn)品,或者只能撐到60分,而用戶的實際期望值是90分時,這個產(chǎn)品就相當(dāng)于0分。

我們千萬不要有這種心態(tài),說之前我們成功過,我們在應(yīng)用角度趕上了,就覺得新技術(shù)也就這樣。這一次可能真不一樣,這是我想要說的。

李航:我想再補充一點,我大部分同意張老師的觀點,但就像我們討論的互聯(lián)網(wǎng)搜索引擎,有Google這樣的巨頭,當(dāng)然還有其他的搜索引擎存在。即使Google占據(jù)了市場的主導(dǎo)地位,其他公司仍然有機(jī)會。

張宏江:但Google占據(jù)了90%的市場份額,而微軟努力了20多年也只獲得了3%的份額,這就是差別。

李航:我理解您的觀點,但我認(rèn)為在實際應(yīng)用中,大模型并不總是能夠完全取代小模型在一個具體的垂類上做的事情,GTP4也是90分,可能一個小模型也是90分。在特定領(lǐng)域,定制化的小型模型可能更有優(yōu)勢。因為它的性價比更高,商業(yè)上站得住腳。

張宏江:我不同意。我可以馬上舉個例子,ChatGPT出來之后,各種翻譯軟件都死掉了。

李航:但我了解到,GPT4在美國一些公司的實際場景里面,因為領(lǐng)域上的適配問題,其實成本很高,或者不很成功的例子也挺多。

張宏江:那是GPT4的問題,它還沒有達(dá)到90分的地步。

李航:無論是從經(jīng)濟(jì)角度還是工程實現(xiàn)的角度來看,盡管大模型可能在通用領(lǐng)域表現(xiàn)出色,但市場的需求并不總是集中在通用領(lǐng)域?倳幸恍┨囟ǖ募(xì)分領(lǐng)域,特定的小型模型或技術(shù)可能整體更有優(yōu)勢。我不太相信大模型一個東西能把什么事都做到。

但我也同意,Google占據(jù)了市場的主導(dǎo)地位,擁有高達(dá)90%的市場份額。在這種情況下,我們可以看到,盡管其他公司也在努力,但目前還沒有哪家能夠撼動Google的地位。我們現(xiàn)在使用的GPT-4,它的市場地位也非常穩(wěn)固,一旦用戶對其產(chǎn)生了依賴,就很難轉(zhuǎn)向其他服務(wù)。這種粘性使得通用技術(shù)領(lǐng)先的公司很難被取代。因此,在這個意義上,我同意超大模型有著廣泛的覆蓋能力和強(qiáng)大的市場影響力。但是其他企業(yè)也還是有機(jī)會的。

周忠和:這個問題看來還是值得討論。最后我們問一下薛老師,從政府的角度,如何更好地推進(jìn)我國人工智能事業(yè)?

薛瀾:人工智能政府的政策,一方面是推動,推動它的發(fā)展,另外一方面是規(guī)制它的風(fēng)險,所以這其實是兩個輪子同時轉(zhuǎn)。政府投入我覺得其實現(xiàn)在大家都想到了。但另外一點也非常重要,就是怎么樣去營造一種生態(tài),能夠讓中國的企業(yè)跟研究機(jī)構(gòu),包括跟高校等等,它能夠去形成一種很自然地融在一起,這個始終是中國要解決的問題。

這在中國人工智能領(lǐng)域尤其重要。就像剛才張老師講的,論文我們發(fā)得很多,專利也不少。我們最缺的還是生態(tài),這是研究不出來的,需要領(lǐng)導(dǎo)們創(chuàng)造有利的條件,讓各種機(jī)構(gòu)和人才能夠在這樣的環(huán)境下發(fā)揮作用。像智源這樣的組織,正是在這樣支持性的環(huán)境中得以建立和發(fā)展的。

政府在推動人工智能發(fā)展的同時,也需要規(guī)制其風(fēng)險。此外,建立一個良好的生態(tài)系統(tǒng),讓企業(yè)、研究機(jī)構(gòu)和高校能夠自然地融合在一起,這對于中國來說是一個需要解決的問題。在全球?qū)用嫔,我們需要建立一個全球性的風(fēng)險防控機(jī)制,這需要政府、企業(yè)和研究機(jī)構(gòu)的共同努力。同時,我們也需要認(rèn)識到,人工智能的發(fā)展不僅僅是技術(shù)問題,更是社會問題。它涉及到倫理、法律、就業(yè)等多個方面,我們需要在這些方面進(jìn)行深入的研究和討論,以確保人工智能的健康發(fā)展。

關(guān)于風(fēng)險管理和規(guī)制,我想補充一點。這是一個多層次的問題。首先,我們需要在全球?qū)用嫔媳M快建立共識,制定一個全球性的風(fēng)險防控機(jī)制。這不僅僅是政府的責(zé)任,也需要全球的企業(yè)和研究機(jī)構(gòu)共同參與。雖然大家都在朝這個方向努力,但要真正讓這些措施落地也不容易。這是需要大家共同努力的。

觀眾提問

觀眾1:我是清華大學(xué)蘇世民書院2021級的畢業(yè)生,現(xiàn)在在智譜華章做產(chǎn)業(yè)生態(tài)方面的工作,非常謝謝各位老師,剛剛將近兩個小時的分享,非常有啟發(fā)。我有兩個問題,第一個問題,近來不少中國人工智能初創(chuàng)企業(yè),尤其做C端應(yīng)用的企業(yè),選擇出海開展業(yè)務(wù)。可能出于兩個考慮:一是希望借助海外最先進(jìn)的模型,二是海外付費市場相對更加成熟。與此同時,國內(nèi)大部分公司則專注B端,就是幫助本土企業(yè)降本增效。您怎么看待這種發(fā)展分野和趨勢?對中國人工智能的科研和產(chǎn)業(yè)化進(jìn)程會產(chǎn)生何種影響?

第二個問題,OpenAI的Sam Altman最近發(fā)布了一個計劃,他打算斥資7萬億美元來推動半導(dǎo)體行業(yè)的革新和變革。各位老師如何看待這樣作為私營企業(yè)去做這樣大規(guī)模的融資,對于整個產(chǎn)業(yè)界或者學(xué)術(shù)研究的影響?以及可能中國的生態(tài)如何受到它的啟發(fā),或者我們怎么能夠另尋一條路徑,來跟這樣的生態(tài)匹配?

現(xiàn)場觀眾

張宏江:回答第一個問題。出海這件事兒,你們注意到的是面向消費者的企業(yè)(to C)在進(jìn)行海外擴(kuò)張,但實際上,面向企業(yè)的企業(yè)(to B)的出海活動更為頻繁,而且其實也非常有道理。

如果我們對比一下中美兩國的軟件市場和互聯(lián)網(wǎng)應(yīng)用市場,尤其是在軟件工具和云服務(wù)(SaaS)領(lǐng)域,我們會發(fā)現(xiàn)美國的企業(yè)市場(to B)遠(yuǎn)比中國成熟。因此,中國的企業(yè)級軟件出海戰(zhàn)略不僅合理,而且非常必要。經(jīng)過幾十年的發(fā)展,中國的軟件產(chǎn)業(yè)在toB領(lǐng)域相較于toC領(lǐng)域仍有較大的差距。如果我是企業(yè)決策者,特別是做toB業(yè)務(wù),我會更傾向于出海,因為那里的市場對付費服務(wù)的接受度更高。

我還想多強(qiáng)調(diào)一下,toB軟件、工具類軟件或SaaS普及的重要性。toB軟件的核心在于為企業(yè)提供提高效率的工具,比如Office、SAP或飛書等都是提升生產(chǎn)力的工具。當(dāng)公司廣泛使用這些工具時,意味著它們在追求效率的提升。而我們很多公司還沒有充分利用這些生產(chǎn)力工具,這反映出我們的生產(chǎn)效率還不夠高,可能還在依賴人力來完成任務(wù)。所以,我希望大家不僅僅將這看作是一種商業(yè)模式,而是關(guān)乎我們是否能夠提升生產(chǎn)效率的關(guān)鍵問題。生產(chǎn)效率低,顯然對于產(chǎn)業(yè)是非常大的一個問題。

回到國內(nèi)這25年,我始終非常羨慕海外的toB的軟件市場,我希望這塊未來能夠有所突破,這樣我們才能真正提高人均生產(chǎn)力,因為人均收入的提升本質(zhì)上依賴于人均生產(chǎn)力的增長。否則,我們的人均效率將持續(xù)面臨問題。這就是我對第一個問題的看法。

李航:我來回答第二個問題。人工智能的發(fā)展確實需要大量的投資。我們剛才討論到基礎(chǔ)研究應(yīng)該是開源和公開的,這是AI技術(shù)發(fā)展的源泉。目前AI技術(shù),特別是大型模型,更偏向于工程實現(xiàn)。我們觀察到,至少在某些領(lǐng)域,工業(yè)界的創(chuàng)新能力已經(jīng)超越了基礎(chǔ)研究機(jī)構(gòu)的創(chuàng)新能力。這是一個新現(xiàn)象,在人類科學(xué)研究史上前所未遇。

我相信開源的努力會繼續(xù),因為許多學(xué)者都在這樣做,盡管他們的工作可能在某些方面落后于像Open AI這樣的領(lǐng)先企業(yè)。例如,Lambda等項目是開源的,但我們也要認(rèn)識到,即使是商業(yè)公司的開源,也有其特殊性質(zhì),背后可能有其他考慮。從技術(shù)推進(jìn)的角度來看,開源可能仍然面臨挑戰(zhàn),因為它需要大量的開發(fā)工作,更重要的是技術(shù)創(chuàng)新。

我也同意,如果是閉源的模型,政府應(yīng)該進(jìn)行一定程度的監(jiān)管,企業(yè)也應(yīng)該承擔(dān)起責(zé)任,做正確的事,這非常重要。AI研究一般是在大規(guī)模的環(huán)境下進(jìn)行的,AI的發(fā)展需要大量的投資,這是我們目前所面臨的現(xiàn)實。就像我們之前討論的,為了推動技術(shù)向前發(fā)展,我們需要大量的資金來擴(kuò)大模型的規(guī)模。

張宏江:我覺得7萬億這個數(shù)字跟閉源和開源不一定有直接關(guān)系。如果你認(rèn)同Scaling Law,并且考慮過我們距離實現(xiàn)AGI還有多遠(yuǎn),還需要多少資源,那么你可能會得出這樣的數(shù)字。我們可能需要投入這么多資金,甚至更多,不僅是一家企業(yè),可能還有其他企業(yè)也需要投入相似的資金量。這不是拍腦袋,而是基于Scaling Law的合理預(yù)測。隨著模型參數(shù)的增加,我們需要更強(qiáng)大的算力進(jìn)行訓(xùn)練和推理,更多的機(jī)房、更多的IDC設(shè)施和電力供應(yīng)。如果現(xiàn)在的模型擴(kuò)大1000倍,那么這樣的投資規(guī)?赡芫褪潜匦璧。為了搭建這個系統(tǒng)、實現(xiàn)這個目標(biāo),就需要相應(yīng)的投資。我覺得這是他的思考,而且從Sam的角度來說,這家伙想問題常常都是往10年以后想。

觀眾2:我博士畢業(yè)于清華大學(xué)精密儀器系,目前是在中國信息通信研究院做人工智能方面的技術(shù)產(chǎn)業(yè)研究。我的問題是,首先,我們提到人工智能的發(fā)展依賴于三個核心要素:算法、計算能力和數(shù)據(jù)。目前,算法研究可能面臨研究力量分散的問題,算力方面受到美國對高端AI芯片出口禁令的影響,而數(shù)據(jù)方面,高質(zhì)量的中文數(shù)據(jù)集可能還不夠充足。面對這些挑戰(zhàn),我們應(yīng)該如何權(quán)衡這三者的優(yōu)先級,有限發(fā)展哪一種。

其次,如果計算能力是目前制約我國發(fā)展像Sora這樣的先進(jìn)大型AI模型的主要因素,那么是否可以通過國家力量,整合國內(nèi)現(xiàn)有的高端計算資源,比如英偉達(dá)的芯片,來支持國內(nèi)科研人員的研發(fā)工作,從而實現(xiàn)我國在這一領(lǐng)域的突破?

李航:第一個問題,正如我之前提到的,從長遠(yuǎn)來看,人才培養(yǎng)是最關(guān)鍵的。雖然算力目前遇到了瓶頸,但這相對是一個短期問題。長期來看,人工智能的發(fā)展離不開人才的培養(yǎng)。

個人認(rèn)為,本科教育非常重要。大學(xué)的研究工作,如何與產(chǎn)業(yè)界結(jié)合,推動人工智能領(lǐng)域的研究,這也是重要的。對于長期發(fā)展,最核心的還是人才。短期問題,比如數(shù)據(jù)問題,相對容易解決,但人才培養(yǎng)需要全社會的共同努力。

周忠和:說到人才,我想到了一個問題。我們通常關(guān)注人數(shù)和發(fā)表論文的數(shù)量,就像張老師之前提到的排名一樣。但在中國科技領(lǐng)域,我們現(xiàn)在需要的是真正的創(chuàng)新的拔尖的人才,這不僅僅是數(shù)量上的問題,對吧?

張宏江:沒錯。特別是在未來,那些湊數(shù)的很可能會被AI取代。我們需要的是那種能夠進(jìn)行真正創(chuàng)新的人才。

薛瀾:我談?wù)劦诙䝼問題。我覺得這是一個假設(shè),這種假設(shè)是很難實現(xiàn)的。如果我們回到幾十年前,在舉國體制、計劃經(jīng)濟(jì)下,說不定還有點可能。今天的這種情況我覺得是非常難的,所以這個前提不存在,我們就沒有必要探討到后面的部分了。

觀眾3:我是理論物理專業(yè)的學(xué)生,從原理上來說,AI是否可能具備提出全新基礎(chǔ)理論的能力?比如像相對論或標(biāo)準(zhǔn)模型這樣的理論。如果AI真的可以做到這一點,那么我們是否可以得出結(jié)論,比如像現(xiàn)代的Transformer架構(gòu),它是否能自我產(chǎn)生出比自己更先進(jìn)的架構(gòu)?如果是這樣,那是否意味著AI具有一種自我進(jìn)化的能力?

張宏江:如果你問的是AI能否設(shè)計出比自己更有效的工具,我認(rèn)為這是有可能的。關(guān)于AI是否能夠自我進(jìn)化,目前我還看不到這樣的能力,但我不認(rèn)為這在未來是不可能的。隨著我們構(gòu)建越來越大的模型,它們本質(zhì)上會變得更智能。設(shè)計更大的模型需要更高的效率,如果AI能夠設(shè)計出更好的編程模塊,使工程實施比人類更高效,那么在這一點上,我認(rèn)為AI是有可能實現(xiàn)自我超越的。

至于AI能否發(fā)現(xiàn)新的物理突破,我認(rèn)為這和問一個物理學(xué)家未來十年是否會有重大物理發(fā)現(xiàn)一樣,都是開放性的問題。不過有一個例子值得一提,那就是核聚變。核聚變本質(zhì)上是創(chuàng)造一個小型太陽,而要實現(xiàn)這一點,我們需要能夠包裹住核反應(yīng)的等離子體。核聚變主要的一種結(jié)構(gòu),托卡馬克(Tokamak)內(nèi)部的等離子體,只能通過大型AI模型來完成設(shè)計。也就是說在核聚變這個領(lǐng)域,AI已經(jīng)幫上忙了,因為它能夠設(shè)計出之前人類無法設(shè)計的等離子體模型。所以,當(dāng)我們談?wù)摰?萬億美元的投資時,可以說AI也在幫助解決自己的能源問題。

現(xiàn)場觀眾提問正在提問

周忠和:那AI能夠提出原創(chuàng)性的科學(xué)問題嗎?

張宏江:如果它能做數(shù)學(xué)推理和證明,我覺得就不遠(yuǎn)了。

李航:我是這樣看待這個問題。AI目前還難以展現(xiàn)出真正的創(chuàng)造力,比如說那種顛覆性的創(chuàng)新,像相對論那樣我們從未想過的理論。雖然現(xiàn)在AI能夠發(fā)現(xiàn)新的定理、新的證明方法、新藥物和新材料,但它更像是在廣闊的搜索空間中尋找最佳答案。它能夠處理的規(guī)模是人類無法比擬的。

周忠和:也就是說,AI的發(fā)現(xiàn)是基于現(xiàn)有知識框架的,對嗎?

李航:可以這么說。AI實際上是在一個巨大的搜索空間中尋找正確的解答,人是做不到那么大規(guī)模的搜索的。從這個角度看,AI在未來的科學(xué)發(fā)現(xiàn)方面潛力巨大,我對AI for Science的未來發(fā)展非常樂觀,這個意義上的科學(xué)發(fā)現(xiàn)會非常多。

盡管我們還沒有完全解決AI for Science的數(shù)據(jù)問題,這不像互聯(lián)網(wǎng)數(shù)據(jù)相對豐富,但我認(rèn)為這個挑戰(zhàn)最終可以被克服。如果我們按照Scaling Law的思路來看,未來的發(fā)展空間是巨大的。但是,對于那些完全顛覆性的創(chuàng)新,比如相對論,我認(rèn)為AI目前還做不到。因為AI的發(fā)現(xiàn)是基于我們設(shè)定的數(shù)據(jù)和搜索空間,它在這個范圍內(nèi)進(jìn)行組合和搜索,而不是創(chuàng)造出我們從未想過的新概念。所以,至少在目前,我沒有看到AI能夠突破這一點。

觀眾4:我是來自天氣預(yù)報領(lǐng)域的,首先,當(dāng)AI模型能夠提供比傳統(tǒng)數(shù)理模型更準(zhǔn)確的預(yù)測時,我們是否應(yīng)該放棄那些我們熟悉且建立起來的數(shù)理模型,停止嘗試用它們?nèi)ダ斫馕锢頇C(jī)制的過程?還是說,我們會依賴AI來告訴我們這個世界是如何運作的?

其次,隨著AI逐漸取代了許多傳統(tǒng)的白領(lǐng)工作,我們可能會面臨一個社會現(xiàn)象,大量的人可能不再需要工作。如果按照97比3的比例,那么那97%的人將如何度過他們的生活?他們是否能夠發(fā)揮人類獨有的創(chuàng)造力?如果他們只是普通人,他們應(yīng)該如何適應(yīng)這樣的生活?社會又將如何看待這些不再從事傳統(tǒng)工作的人?我們對于“人應(yīng)該如何生活”的哲學(xué)是否會發(fā)生根本性的變化?

張宏江:我的回答是,人類將持續(xù)探索新的領(lǐng)域和方法,因為模型需要人來提供數(shù)據(jù)。這種數(shù)據(jù)包括新的方法。所以我覺得,人和模型會共存,而且互幫互助。但與此同時,模型的發(fā)展也會對人類提出越來越高的要求。想象一下,如果大部分事情模型都做得比人好,那對人類的能力和素質(zhì)就會有更高的期望和標(biāo)準(zhǔn)。

薛瀾:您剛才提出的問題非常重要。實際上,我認(rèn)為這里涉及到兩個方面的問題。首先,正如我們之前討論的,隨著人工智能的廣泛應(yīng)用,特別是那些能力出眾的人可能會變得更加高效,而其他人可能就不再被需要。在這種情況下,我們首先需要面對的是社會分配問題。現(xiàn)行的社會分配制度可能需要進(jìn)行重大的調(diào)整。否則,沒有工作的人可能會采取極端行動。因此,這個問題必須首先得到解決,F(xiàn)在,人們正在討論普遍基本收入(UGI)和其他各種新的分配方式,這些都是我們社會需要探索的。

當(dāng)然,您提到的另一個問題也確實存在。在未來,我們目前所說的工作,可能不再需要如此大量的就業(yè)人口。這種情況下,未來人類生活的意義是什么?我們應(yīng)該如何創(chuàng)造新的方式,讓每個人都能在社會上生存并繼續(xù)過上有意義的生活?這也是我們整個現(xiàn)代社會需要積極探討的問題。不過,我相信技術(shù)進(jìn)步雖然迅速,但社會的演變和適應(yīng)能力也同樣強(qiáng)大。我們的認(rèn)知和社會的容忍度將會隨著技術(shù)的發(fā)展而調(diào)整。

所以我認(rèn)為不至于在短期內(nèi),比如五年后,所有人都失業(yè)。但另一方面,我們需要有緊迫感。在適應(yīng)這些變化的同時,探討未來人類社會的形態(tài),以及我們?nèi)绾尉S持有意義的生活是很重要的問題。這是需要我們大家共同努力的方向。

觀眾5:各位老師好,我是北航生物醫(yī)學(xué)工程專業(yè)的博士研究生,我現(xiàn)在的這個研究方向是人工智能在蛋白質(zhì)設(shè)計中的應(yīng)用。剛才幾位老師講得很清楚,現(xiàn)在人工智能已經(jīng)非常的強(qiáng)大了,在未來,我們相信AI是專家的時候,我們怎么去研判我們問它的問題,它反饋給我們的是正確的?

李航:這是一個開放性的問題。Open AI也在研究,當(dāng)超人類智能出現(xiàn)時會發(fā)生什么。這涉及到很多未知的問題。我個人觀點,我們現(xiàn)在不要過多地討論這些問題。

我們現(xiàn)在使用GPT-4,它有時會有機(jī)器幻覺,我們需要判斷它所說的是否正確。如果你了解它容易犯哪些錯誤,你就會更懂得如何使用它。我們需要掌握這種技巧。

周忠和:有人說有10%的錯誤率,真有這么高嗎?

李航:不止10%。比如你問北京五塔寺的地址是什么?GPT-4會回答錯誤。我試過,它會給出錯誤的答案。

周忠和:Sora也會犯錯吧?那個視頻看起來很吸引人,但里面似乎也有一些問題……

李航:Sora現(xiàn)在甚至還沒有公開,據(jù)說實際上犯的錯誤也很多。我們需要逐漸適應(yīng)這種工具的特性,了解什么問題可以問,什么時候問完后需要去核實。

未來還有很多這樣的開放性問題,比如剛才提到的科學(xué)發(fā)現(xiàn),我們需要去驗證。我們需要確認(rèn)它是否正確,數(shù)學(xué)證明也是如此,如果它聲稱證明了一個新的定理,我們?nèi)匀恍枰ヲ炞C。這其中還有很多需要探索和研究的課題。我認(rèn)為這是一個新時代,科學(xué)研究也進(jìn)入了一個新的時代。

- 關(guān)于科學(xué)四十人 -

在創(chuàng)辦《知識分子》和《賽先生》等知名科學(xué)文化平臺的基礎(chǔ)上,智識學(xué)研社發(fā)起成立了民間科學(xué)交流平臺 “科學(xué)四十人”。“科學(xué)四十人” 的成員包括數(shù)學(xué)、物理、化學(xué)、生物、醫(yī)學(xué)等九個領(lǐng)域的領(lǐng)軍科學(xué)家。“科學(xué)四十人” 致力成為先進(jìn)的科學(xué)交流平臺,積極推進(jìn)國際科學(xué)交流和全球科技治理議題,匯聚各個領(lǐng)域的科學(xué)力量和專業(yè)知識、意見和影響力,推動人類可持續(xù)發(fā)展。“科學(xué)四十人” 得到了科匯致遠(yuǎn)公益基金會的大力支持。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港