胡璇騰訊研究院高級(jí)研究員
黃詩宜騰訊游戲商業(yè)分析經(jīng)理
宋巧玲騰訊游戲社會(huì)價(jià)值探索中心項(xiàng)目經(jīng)理
2024年的諾貝爾化學(xué)獎(jiǎng)被授予三名科學(xué)家,美國華盛頓大學(xué)教授大衛(wèi)貝克(David Baker)及谷歌Deepmind公司的德米斯哈薩比斯(Demis Hassabis)與約翰 江珀(John Jumper),以表彰他們對破解蛋白質(zhì)結(jié)構(gòu)之謎的卓越貢獻(xiàn)。
蛋白質(zhì)結(jié)構(gòu)問題一直是諾貝爾化學(xué)獎(jiǎng)的熱門領(lǐng)域,1958年來共有十余次獎(jiǎng)項(xiàng)與之相關(guān),既包括重要結(jié)構(gòu)的發(fā)現(xiàn),也包括工具和方法的改進(jìn),如晶體電子顯微鏡和冷凍電鏡的發(fā)展。計(jì)算機(jī)和人工智能方法的成功引入,不僅預(yù)測了幾乎全部人類已知的蛋白質(zhì)結(jié)構(gòu),更能創(chuàng)造全新的蛋白質(zhì)分子,為生物醫(yī)藥打開更多可能。
三名獲獎(jiǎng)?wù)咧,貝克教授是以?jì)算預(yù)測蛋白質(zhì)結(jié)構(gòu)這一工作的領(lǐng)軍者,而吸引Deepmind兩名AI專家加入的“接力棒”,則是一款叫做Foldit的游戲。
Foldit游戲聚合“人工的智能”蛋白質(zhì)是生命的基石,其結(jié)構(gòu)決定了功能。雖然組成蛋白質(zhì)的氨基酸只有20種,但它們在三維空間中的組合方式卻近乎無限。因此,對蛋白質(zhì)結(jié)構(gòu)的精準(zhǔn)描繪困擾了科學(xué)家們數(shù)十年。傳統(tǒng)方法是觀測已有的蛋白質(zhì),準(zhǔn)確但需要借助大型精密儀器,因此又慢又貴。從1971到2006的40年間,全球蛋白質(zhì)數(shù)據(jù)銀行(Protein Data Bank)也僅收集了4萬個(gè)結(jié)構(gòu)數(shù)據(jù),相比上億的總數(shù)可謂九牛一毛。
《環(huán)球科學(xué)》2024年10月刊中“AI重塑結(jié)構(gòu)生物學(xué)”專題配圖于是科學(xué)家們逆轉(zhuǎn)思路,從觀測變?yōu)轭A(yù)測,并希望借助性能不斷進(jìn)化的計(jì)算機(jī),準(zhǔn)確找到更多的蛋白質(zhì)結(jié)構(gòu)。蛋白質(zhì)通常會(huì)折疊到能量最低的狀態(tài),而科學(xué)家也知道如何去計(jì)算它的能量;诖耍惪私淌趫F(tuán)隊(duì)在1998年發(fā)布了重要的計(jì)算平臺(tái)羅塞塔(RoseTTA),它能進(jìn)行蛋白質(zhì)的預(yù)測乃至設(shè)計(jì)。計(jì)算機(jī)雖然擅長運(yùn)算,但缺乏人類的空間想象能力,加上單臺(tái)設(shè)備算力有限,因此進(jìn)展不算迅速。
貝克團(tuán)隊(duì)發(fā)現(xiàn),蛋白質(zhì)折疊這項(xiàng)工作具有有明確的目標(biāo)、規(guī)則和打分,恰好構(gòu)成了一項(xiàng)游戲的全部要素。那為什么不用這一點(diǎn)吸引更多人參與進(jìn)來呢?他們進(jìn)行了一項(xiàng)大膽嘗試游戲化科學(xué)眾包。2008年,基于羅塞塔構(gòu)建的功能游戲Foldit應(yīng)運(yùn)而生,允許用戶以闖關(guān)形式,將氨基酸的“鏈”折疊成適當(dāng)?shù)娜S形狀,再由科學(xué)家檢驗(yàn)結(jié)果。它富有趣味,簡潔易懂,很快吸引了全球幾十萬沒有科學(xué)背景的普通用戶加入。
Foldit通過在線平臺(tái)將科學(xué)問題和普通人連接起來并聚合智慧
很快,人類在模式識(shí)別上的優(yōu)勢就顯現(xiàn)出來,不僅準(zhǔn)確度超過了計(jì)算機(jī),也在多個(gè)科研難點(diǎn)中發(fā)力。比如玩家曾在10天內(nèi)破解了艾滋病逆轉(zhuǎn)錄酶的晶體結(jié)構(gòu),一個(gè)存在了15年的科學(xué)難題。2010年,57000名“Foldit players”作為論文作者登上《Nature》,這是“人工的智能”在蛋白質(zhì)結(jié)構(gòu)預(yù)測中的里程碑。新冠疫情爆發(fā)后,20萬人共同尋找阻止新冠病毒傳播的蛋白質(zhì)結(jié)構(gòu)。這些公民科學(xué)家們還為包括癌癥、阿爾茨海默病和埃博拉病毒在內(nèi)的廣泛醫(yī)療挑戰(zhàn)的研究做出了貢獻(xiàn)。
“超級(jí)玩家”哈薩比斯接棒AI通關(guān)蛋白質(zhì)折疊游戲Foldit這顆子彈,將在多年后擊中Deepmind創(chuàng)始人、游戲人工智能專家哈薩比斯的眉心。
他是一名不折不扣的“超級(jí)玩家”,棋類和Foldit點(diǎn)亮了他對游戲和智能的關(guān)系的思考:12歲成為國際象棋世界亞軍,編寫了自己的第一個(gè)人工智能下棋程序;15歲和畢業(yè)后設(shè)計(jì)的《主題公園》《黑與白》等作品“都以AI為核心”。在MIT做博后時(shí),他接觸到了Foldit,驚訝于人類直覺在游戲中發(fā)現(xiàn)新模式的巨大潛力。
成立Deepmind,是他從游戲智能出發(fā)、追尋通用智能的重要一步。他在接受采訪時(shí)說到:“從一開始,我們就將游戲作為證明和開放 AI 算法的試驗(yàn)常因?yàn)橛螒蚍浅8咝,也很容易有指?biāo)來查看 AI 系統(tǒng)如何思考和改進(jìn)。”同時(shí),“最終目標(biāo)是使用游戲中訓(xùn)練的智能來引導(dǎo)通用學(xué)習(xí)系統(tǒng),并應(yīng)對現(xiàn)實(shí)世界的挑戰(zhàn)”。圍棋智能AlphaGo和AlphaZero獲得巨大成功,后者甚至僅靠自學(xué)就在數(shù)天內(nèi)獲得人類數(shù)千年的知識(shí),開發(fā)出全新的策略,擊敗人類冠軍。這證實(shí)了深度學(xué)習(xí)算法在處理復(fù)雜問題上的強(qiáng)大能力。
AlphaGo和AlphaZero尋找最優(yōu)策略并獲得勝利
繼續(xù)挑戰(zhàn)更復(fù)雜、更綜合的游戲,比如《星際爭霸》《我的世界》,自然是一種路徑。那有沒有一個(gè)規(guī)模和條件都合適的現(xiàn)實(shí)問題,能夠快速遷移團(tuán)隊(duì)在圍棋上的成果呢?
游玩Foldit的經(jīng)歷在哈薩比斯腦海中閃現(xiàn)。他在目睹AlphaGo戰(zhàn)勝圍棋世界冠軍李世石的那一刻想到:如果人工智能可以從0知識(shí)開始訓(xùn)練,并擊敗人類頂尖選手;那同樣可以像Foldit的玩家那樣,不具備生物化學(xué)知識(shí)卻完成科學(xué)家的工作。游戲固定的規(guī)則和無窮的可能性之間,形成了極大的張力;找到通向勝利的路徑和解法,就是智能的體現(xiàn)。
于是,蛋白質(zhì)折疊問題,成為Deepmind團(tuán)隊(duì)從游戲智能邁向解決現(xiàn)實(shí)問題的關(guān)鍵一步。他們著手設(shè)計(jì)AI蛋白質(zhì)折疊算法AlphaFold,基于蛋白質(zhì)銀行中已有的14萬條結(jié)構(gòu)數(shù)據(jù),像游戲中找最優(yōu)解一樣分析數(shù)據(jù)、尋找規(guī)律,反復(fù)訓(xùn)練提高預(yù)測準(zhǔn)確性。AlphaFold于2018年在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的“奧運(yùn)會(huì)”CASP上首次亮相,取得了2.5倍于第二名的好成績。但這距離準(zhǔn)確預(yù)測還遠(yuǎn)遠(yuǎn)不夠。
第三位主角約翰 江珀在此時(shí)加入Deepmind,牽頭設(shè)計(jì)了新的transformer架構(gòu)和許多革新。2022年發(fā)布的AlphaFold2真正改變了這一領(lǐng)域,大部分預(yù)測超過了百分制的90分。隨后,Deepmind一舉公布了2.18億個(gè)人類已知的蛋白質(zhì)結(jié)構(gòu),宣告50年來蛋白質(zhì)三維結(jié)構(gòu)預(yù)測問題的解決。
AlphaFold基于數(shù)據(jù)庫訓(xùn)練和改進(jìn)預(yù)測結(jié)果
自此,不僅蛋白質(zhì)折疊問題得到突破,用AI解決科學(xué)問題的方法更逐步深入人心。新版本AlphaFold3在2024年5月上線,引領(lǐng)生物學(xué)預(yù)測技術(shù)進(jìn)入下一階段:構(gòu)建蛋白質(zhì)與其他分子(如DNA或者RNA)結(jié)合的復(fù)合體結(jié)構(gòu)。AlphaFold已被來自190個(gè)國家的200多萬研究人員用于推進(jìn)關(guān)鍵工作,包括了解抗生素耐藥性和開發(fā)可分解塑料的酶等重要應(yīng)用。META也跟進(jìn)發(fā)布了ESMFold的研究成果:由機(jī)器學(xué)習(xí)創(chuàng)建的6.17億個(gè)宏基因組蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù)庫,包括土壤、海洋和人體中的微生物。
下半場:科學(xué)眾包和游戲人工智能加速前進(jìn)Foldit仍在不斷迭代,逐步成為了科研人員和普通公眾互動(dòng)的社區(qū)。游戲不僅持續(xù)將前沿問題轉(zhuǎn)化為游戲關(guān)卡,收集玩家的高分解答并吸收到成果中,也鼓勵(lì)用戶間對解題策略的討論。游戲功能同樣與時(shí)俱進(jìn),2019年時(shí)加入了蛋白質(zhì)設(shè)計(jì)模塊,后續(xù)更引入了AlphaFold幫忙給玩家的作業(yè)打分。
更多科研項(xiàng)目采用了類似的眾包機(jī)制,科學(xué)家們甚至搭建了專門的公眾科學(xué)游戲發(fā)布平臺(tái),如Kaggle和Zooniverse,以供科研人員和機(jī)構(gòu)發(fā)布游戲并招募志愿玩家。從生物學(xué)、神經(jīng)科學(xué)、天文學(xué)、高能物理學(xué)到語言學(xué)、藝術(shù)史學(xué),都已有成千上萬的普通玩家的參與。例如,在Eye Wire中,玩家通過簡單有趣的操作即可映射神經(jīng)視網(wǎng)膜通路;在《星系挑戰(zhàn)》(Galaxy Challenge)中,玩家能夠給星系形態(tài)分類;Metropolitana和 ARTigo則允許玩家為社會(huì)語言、藝術(shù)作品打標(biāo)簽。
同時(shí),游戲AI也在《星際爭霸》《王者榮耀》等復(fù)雜游戲中獲得更全面的能力后,助力解決機(jī)器人訓(xùn)練,能源和交通調(diào)度等現(xiàn)實(shí)問題;更有望讓AI進(jìn)一步理解我們所處的真實(shí)世界,獲得空間智能。微軟、Deepmind、Meta、騰訊等科技公司都是參與者。騰訊開悟游戲 AI 研究開放平臺(tái)依托騰訊在算法、算力、實(shí)驗(yàn)場景方面的核心優(yōu)勢,為學(xué)術(shù)研究人員和算法開發(fā)者開放研究與應(yīng)用探索的資源及工具。
國內(nèi)的游戲人工智能人才培養(yǎng),在產(chǎn)學(xué)研各界合力下加速前行。2024年,川渝政府聯(lián)合騰訊,共同發(fā)起川渝大學(xué)生人工智能大賽暨騰訊開悟人工智能全球公開賽,吸引國內(nèi)及17個(gè)海外國家超過5200名學(xué)生參賽,并協(xié)同燧原、Intel、Vivo、成都智慧交通集團(tuán),聯(lián)合開發(fā)芯片算子開發(fā)、交通應(yīng)用場景、算法與工程等產(chǎn)業(yè)賽道。2023世界人工智能大會(huì)期間,廈門大學(xué)聯(lián)合中國傳媒大學(xué)、北京理工大學(xué)、上海交通大學(xué)等多所高校,籌備成立“游戲人工智能高校聯(lián)合研究中心”,持續(xù)深化游戲人工智能的研究。
未來的科研新星和下一個(gè)Deepmind,會(huì)不會(huì)從這些創(chuàng)新青年中誕生?
AI&Game for Science的更多想象力盡管今年的諾貝爾物理與化學(xué)獎(jiǎng)被調(diào)侃為“理科綜合”“圖靈獎(jiǎng)”,但這恰恰反映出學(xué)科間的交叉融合越來越廣泛深刻。一方面,物理、化學(xué)等基礎(chǔ)學(xué)科受到人工智能等新的研究方法影響,發(fā)展出全新的、數(shù)據(jù)驅(qū)動(dòng)的研究范式。另一方面,人工智能本身也是計(jì)算機(jī)和數(shù)學(xué)、神經(jīng)科學(xué)等領(lǐng)域交叉的產(chǎn)物,神經(jīng)網(wǎng)絡(luò)、貝葉斯都極大推動(dòng)了人工智能的演進(jìn)。
袁越等學(xué)者指出,科學(xué)研究和創(chuàng)新正從因果關(guān)系走向“復(fù)雜系統(tǒng)”。例如,獲得醫(yī)學(xué)或生理學(xué)獎(jiǎng)的microRNA背后所代表的基因調(diào)控就是一個(gè)龐雜到無以復(fù)加的復(fù)雜系統(tǒng),難以用簡單的因果鏈條加以解釋。神經(jīng)網(wǎng)絡(luò)也是復(fù)雜系統(tǒng)的計(jì)算機(jī)模擬,呈現(xiàn)出“黑箱”狀態(tài)。
在大融合、大系統(tǒng)的背景下,AI for Science已帶來科學(xué)界的新潮流,此次諾貝爾獎(jiǎng)的“風(fēng)向”指引性也很明顯。2024年5月,英國皇家學(xué)會(huì)發(fā)布了《人工智能時(shí)代的科學(xué):人工智能如何改變科學(xué)研究的性質(zhì)和方法》報(bào)告?茖W(xué)家們正扮演著導(dǎo)師、同伴或助手的角色,利用人工智能以史無前例的速度和規(guī)模執(zhí)行任務(wù);AI則幫助識(shí)別大型數(shù)據(jù)集中的新模式和關(guān)系,預(yù)測新內(nèi)容。除了AlphaFold等標(biāo)志性案例外,AI應(yīng)用可見于所有STEM領(lǐng)域,包括醫(yī)學(xué)、材料科學(xué)、機(jī)器人技術(shù)、農(nóng)業(yè)、遺傳學(xué)和計(jì)算機(jī)科學(xué)等。過去十年,與科學(xué)相關(guān)的人工智能專利申請激增,中國、美國、日本和韓國提交的專利數(shù)量占據(jù)主導(dǎo)地位,其中中國貢獻(xiàn)了約62%的專利。
英國皇家學(xué)會(huì)2024年《人工智能時(shí)代的科學(xué)》報(bào)告插圖
正如哈薩比斯在獲獎(jiǎng)后表示,“AlphaFold應(yīng)該被視為人工智能加速科學(xué)發(fā)現(xiàn)和造福社會(huì)潛力的證據(jù)”!吨R(shí)分子》總結(jié),應(yīng)用人工智能方法分析數(shù)據(jù)、構(gòu)建復(fù)雜生物現(xiàn)象的強(qiáng)大模型用例包括:用AI識(shí)別新的抗生素、揭示希格斯玻色子,建模和分析星系形成,篩選粒子對撞機(jī)或機(jī)器人望遠(yuǎn)鏡產(chǎn)生的大量數(shù)據(jù)、尋找其中的規(guī)律,識(shí)別具有電池或太陽能電池所需特性的材料等等。
Game for science 同樣值得期待。科學(xué)研究過程呈現(xiàn)出復(fù)雜性和不確定性。不同領(lǐng)域間的相互啟發(fā)有如“蝴蝶效應(yīng)”,而游戲正扮演那只扇動(dòng)翅膀的蝴蝶。游戲是科技的產(chǎn)物,同時(shí)推動(dòng)科技發(fā)展。如果沒有3D游戲,或許先進(jìn)GPU開啟的人工智能時(shí)代不會(huì)這么快到來。游戲更與智能有著非常緊密的連接,也是科技人才的搖籃,馬斯克、喬布斯、林納斯,許多領(lǐng)軍人物都受游戲啟發(fā)而走進(jìn)編程世界,探索創(chuàng)新邊界。
AI、游戲與科學(xué)的故事,未完待續(xù)。
參考文獻(xiàn)來源:
AlphaFold開發(fā)者獲2024諾貝爾化學(xué)獎(jiǎng),AI搶奪科學(xué)家的最重要榮譽(yù),知識(shí)分子
今年的諾貝爾化學(xué)獎(jiǎng),意味著我們從此不需要科學(xué)家了?
DeepMind 創(chuàng)始人 Demis Hassabis:AI 的強(qiáng)大,超乎我們的想象,經(jīng)緯創(chuàng)投
騰訊游戲年度發(fā)布會(huì)上提到的這款游戲,你聽過嗎?, 騰訊互娛社會(huì)價(jià)值探索
玩游戲玩出來的Nature?,果殼-未來光錐
The challenge of designing scientific discovery games
Demis Hassabis:from video game designer to Nobel Prize winner
AlphaFold 2: Why It Works and Its Implications for Understanding the Relationships of Protein Sequence, Structure, and Function
Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research