劃重點(diǎn)
012024年諾貝爾化學(xué)獎(jiǎng)授予了John Jumper、Demis Hassabis和David Baker,以表彰他們開發(fā)可預(yù)測(cè)和設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的計(jì)算工具AlphaFold。
02AlphaFold在短短幾年內(nèi)帶來了革命性的變化,使研究人員能夠一鍵輕松解析蛋白質(zhì)結(jié)構(gòu)。
03除此之外,華盛頓大學(xué)的David Baker因在計(jì)算蛋白質(zhì)設(shè)計(jì)領(lǐng)域的貢獻(xiàn)而獲獎(jiǎng)。
04三位獲獎(jiǎng)?wù)邔⒎窒?100萬瑞典克朗(約合100萬美元)的獎(jiǎng)金。
05目前,AlphaFold已對(duì)科學(xué)界產(chǎn)生了全面影響,引領(lǐng)醫(yī)學(xué)領(lǐng)域的變革。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
原文作者:Ewen Callaway
今年的獎(jiǎng)項(xiàng)表彰了改變生物學(xué)發(fā)展,并且有潛力為藥物開發(fā)帶來新一輪革命的計(jì)算工具。
David Baker, Demis Hassabis和John Jumper(從左至右)因開發(fā)可被用于預(yù)測(cè)和設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的計(jì)算工具被授予諾貝爾化學(xué)獎(jiǎng)。來源: BBVA Foundation
歷史上首次(可能不是最后一次),由人工智能(AI)實(shí)現(xiàn)的科學(xué)突破獲得了諾貝爾獎(jiǎng)的認(rèn)可。2024年諾貝爾化學(xué)獎(jiǎng)授予了倫敦谷歌DeepMind的John Jumper和Demis Hassabis,以表彰他們開發(fā)出了一個(gè)顛覆性的可預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的AI工具AlphaFold;此外,西雅圖的華盛頓大學(xué)的David Baker也因其在計(jì)算蛋白質(zhì)設(shè)計(jì)領(lǐng)域的貢獻(xiàn)而獲獎(jiǎng)。該領(lǐng)域在近年因?yàn)锳I技術(shù)而興旺發(fā)展。
“我希望當(dāng)我們回顧AlphaFold時(shí),它將成為第一個(gè)證明點(diǎn),展現(xiàn)出AI加速科學(xué)發(fā)現(xiàn)的不可思議的能力。”Hassabis在10月9日的DeepMind新聞發(fā)布會(huì)上說。“這一刻感覺太不真實(shí)了。”
AlphaFold問世短短幾年已經(jīng)帶來了革命性的變化。此工具讓研究人員可以一鍵輕松解析蛋白質(zhì)結(jié)構(gòu)(不是所有時(shí)候,但大多數(shù)情況下極為精確),并且讓十年前難以想象的實(shí)驗(yàn)變得可能。“這是一場(chǎng)重大革命。”倫敦大學(xué)學(xué)院的計(jì)算生物學(xué)家Christine Orengo說道。她的實(shí)驗(yàn)室利用AlphaFold預(yù)測(cè)的結(jié)構(gòu)揭示了新的蛋白質(zhì)。
諾貝爾委員會(huì)主席、瑞典隆德大學(xué)的納米科學(xué)研究員Heiner Linke在頒獎(jiǎng)典禮上說:“長(zhǎng)期以來,我們一直夢(mèng)想能夠通過氨基酸序列來預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)……在數(shù)十年里,這一直被認(rèn)為是不可能的。”而今年的獲獎(jiǎng)?wù)?ldquo;破解了這個(gè)密碼”。三位獲獎(jiǎng)?wù)邔⒎窒?100萬瑞典克朗(約合100萬美元)的獎(jiǎng)金。
獲獎(jiǎng)的人工智能
DeepMind于2018年首次推出AlphaFold,當(dāng)時(shí)該工具贏得了一項(xiàng)兩年一度的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽,“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)的關(guān)鍵測(cè)試(CASP)”。但真正令生命科學(xué)界震撼的是2020年底發(fā)布的第二代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)AlphaFold2。在CASP競(jìng)賽中,許多AlphaFold2的預(yù)測(cè)非常準(zhǔn)確,與實(shí)驗(yàn)確定的蛋白質(zhì)結(jié)構(gòu)幾乎難以區(qū)分。
DeepMind的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Hassabis與AlphaFold團(tuán)隊(duì)負(fù)責(zé)人Jumper領(lǐng)導(dǎo)了AlphaFold2的開發(fā)。為了預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),這個(gè)神經(jīng)網(wǎng)絡(luò)融合了數(shù)十萬種結(jié)構(gòu)和數(shù)百萬種相關(guān)蛋白質(zhì)序列庫的數(shù)據(jù),這些數(shù)據(jù)包含著與它們形狀相關(guān)的信息。
AlphaFold的成功很大程度上得益于蛋白質(zhì)數(shù)據(jù)庫(Protein Data Bank)。這是一個(gè)開放資源庫,包含超過20萬種蛋白質(zhì)結(jié)構(gòu),通過X射線晶體學(xué)和冷凍電子顯微鏡等方法確定。Jumper在DeepMind的新聞發(fā)布會(huì)上表示:“每當(dāng)我們用多年的努力成果來訓(xùn)練[AlphaFold]時(shí),都令人感到謙卑。每一個(gè)數(shù)據(jù)點(diǎn)都是某人多年的心血。”
2021年,DeepMind將AlphaFold2的底層代碼與訓(xùn)練模型所需的數(shù)據(jù)一并免費(fèi)公開。此外,DeepMind與位于英國(guó)欣克斯頓的歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)下屬歐洲生物信息學(xué)研究所合作創(chuàng)建了AlphaFold數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫現(xiàn)在包含了基因數(shù)據(jù)庫中每個(gè)生物體的幾乎所有蛋白質(zhì)結(jié)構(gòu),總計(jì)約2.14億個(gè)預(yù)測(cè)結(jié)構(gòu)。今年,該公司發(fā)布了第三代AlphaFold,能夠模擬能與蛋白質(zhì)相互作用的其他分子,如藥物。
Jumper、Hassabis及其團(tuán)隊(duì)引發(fā)的革命尚處于早期階段,而AlphaFold對(duì)科學(xué)的全面影響可能還需要數(shù)年才能顯現(xiàn)。然而這個(gè)工具已在幫助科學(xué)家們獲得新的見解。
一個(gè)開創(chuàng)性的團(tuán)隊(duì)利用該工具及實(shí)驗(yàn)數(shù)據(jù)繪制了細(xì)胞核孔復(fù)合體,這是將分子運(yùn)輸進(jìn)出細(xì)胞核的最大細(xì)胞結(jié)構(gòu)。去年,有兩個(gè)團(tuán)隊(duì)深入研究了整個(gè)AlphaFold數(shù)據(jù)庫并揭示了蛋白質(zhì)世界的隱秘之地,識(shí)別了新的蛋白質(zhì)家族和折疊結(jié)構(gòu),并發(fā)現(xiàn)了生命機(jī)器中的意外聯(lián)系。
許多研究人員希望AlphaFold及受其啟發(fā)的其他AI工具將引領(lǐng)醫(yī)學(xué)領(lǐng)域的變革,盡管目前尚不清楚AlphaFold是否會(huì)簡(jiǎn)化開發(fā)安全藥物這一昂貴且步驟繁多的過程。正在新疫苗開發(fā)階段的科學(xué)家們發(fā)現(xiàn)AlphaFold極為有用,有時(shí)候甚至是顛覆性的。然而對(duì)于疫苗領(lǐng)域來說,AlphaFold還只是補(bǔ)充了實(shí)驗(yàn)研究結(jié)果和其他映射和調(diào)整病毒蛋白結(jié)構(gòu)的方法。
德國(guó)的歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)結(jié)構(gòu)模型專家Jan Kosinski認(rèn)為,預(yù)測(cè)的結(jié)構(gòu)對(duì)于大多數(shù)研究人員來說只是研究的起點(diǎn),而非終點(diǎn)。他補(bǔ)充道:“起初,人們擔(dān)心它會(huì)取代結(jié)構(gòu)生物學(xué),人們會(huì)失業(yè)什么的。實(shí)際上結(jié)果恰恰相反。”
自2016年起與DeepMind合作開發(fā)AlphaFold初代的倫敦大學(xué)學(xué)院生物信息學(xué)家David Jones表示,這一工具的最大影響之一是改變了生物學(xué)家的思維方式:“計(jì)算機(jī)能夠生成有用假設(shè),這些假設(shè)能在實(shí)驗(yàn)室中測(cè)試。”
創(chuàng)造新蛋白質(zhì)
在DeepMind開始致力于研究AlphaFold的二十多年前,計(jì)算生物物理學(xué)家David Baker和他的同事們開發(fā)了一個(gè)名為Rosetta的軟件工具,它可以利用物理原理來模擬蛋白質(zhì)結(jié)構(gòu)。該工具通過比較多個(gè)現(xiàn)有蛋白質(zhì)結(jié)構(gòu)和序列的小片段,識(shí)別出能折疊成特定形狀的蛋白質(zhì)序列。
最初,Rosetta被用于預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),并于AlphaFold崛起之前在許多CASP競(jìng)賽中名列前茅。但Baker很快意識(shí)到這一模型也可以反過來用,設(shè)計(jì)出全新的蛋白質(zhì)。
這一工具早期在設(shè)計(jì)新型蛋白質(zhì)方面取得了成功,包括設(shè)計(jì)出新型酶,能夠與其他分子緊密結(jié)合的蛋白質(zhì),以及類似病毒的自組裝蛋白納米顆粒(其中一種成為了一例已獲批準(zhǔn)的COVID-19疫苗的基礎(chǔ))。
在AlphaFold2宣布(但尚未發(fā)布)的時(shí)候,Baker及其團(tuán)隊(duì)(包括現(xiàn)就職于韓國(guó)首爾大學(xué)的計(jì)算化學(xué)家Minkyung Baek)開始研究該軟件,將其中一些技術(shù)應(yīng)用于過去AI驅(qū)動(dòng)版本的Rosetta。由此產(chǎn)生的第一個(gè)RoseTTAFold網(wǎng)絡(luò)表現(xiàn)幾乎能與AlphaFold2相媲美。自2021年以來,這兩個(gè)網(wǎng)絡(luò)不斷被其開發(fā)者和其他科學(xué)家改進(jìn)以應(yīng)對(duì)新的挑戰(zhàn),例如預(yù)測(cè)多種不同相互作用蛋白質(zhì)復(fù)合體的結(jié)構(gòu)。
近年來,Baker的團(tuán)隊(duì)特別專注于將機(jī)器學(xué)習(xí)應(yīng)用于實(shí)驗(yàn)室的核心使命:創(chuàng)造自然界中從未見過的新型蛋白質(zhì)。Baker團(tuán)隊(duì)最近開發(fā)的一種工具結(jié)合了RoseTTAFold與圖像生成擴(kuò)散神經(jīng)網(wǎng)絡(luò),將研究人員設(shè)計(jì)蛋白質(zhì)的能力提升了一大步。
進(jìn)展迅速
在Baker的實(shí)驗(yàn)室完成博士學(xué)位的麻省理工學(xué)院(MIT)進(jìn)化生物學(xué)家Sergey Ovchinnikov說,這些工具極大地加速了蛋白質(zhì)設(shè)計(jì)的發(fā)展,并使其更具普及性。過去,Rosetta需要在數(shù)百個(gè)處理器上運(yùn)行數(shù)周才能設(shè)計(jì)出一種蛋白質(zhì),而現(xiàn)在的新型AI工具僅需幾秒即可完成這一任務(wù)。Ovchinnikov 說:“現(xiàn)在世界上的每個(gè)人都可以進(jìn)行蛋白質(zhì)設(shè)計(jì)了。”
“我深受該領(lǐng)域其他研究者及合作者的啟發(fā)。”Baker在諾貝爾獎(jiǎng)?lì)C獎(jiǎng)發(fā)布會(huì)上通過電話說道:“我站在巨人的肩膀上。”
韓國(guó)首爾國(guó)立大學(xué)的計(jì)算生物學(xué)家Martin Steinegger將AlphaFold、RoseTTAFold以及其他生物AI工具的影響比作阿波羅登月計(jì)劃,認(rèn)為它們展示了工程可以實(shí)現(xiàn)的成就。他說:“這對(duì)結(jié)構(gòu)預(yù)測(cè)和結(jié)構(gòu)生物學(xué)領(lǐng)域來說是一個(gè)類似的時(shí)刻,讓我們看到了究竟什么是可能的。”
對(duì)于諾貝爾委員會(huì)的決定,幾乎沒有人感到意外。Jones表示對(duì)于Baker來說:“鑒于他在這個(gè)領(lǐng)域完成的大量工作,大多數(shù)人認(rèn)為這是遲早的事情。”Jumper在新聞發(fā)布會(huì)上表示,他知道自己和Hassabis在許多人的候選名單上,因此宣布結(jié)果的前一晚難以入睡。
對(duì)于Jumper來說,AlphaFold提供的預(yù)測(cè)結(jié)構(gòu)為科學(xué)發(fā)現(xiàn)創(chuàng)造了新的機(jī)遇。數(shù)百萬科學(xué)家已經(jīng)使用了這些工具,他希望其中哪位不久后也會(huì)接到從瑞典打來的電話。他說:“要是諾貝爾獎(jiǎng)涉及了用AlphaFold做的工作,那會(huì)是讓我?guī)缀跬瑯蛹?dòng)的時(shí)刻。”
原文以Chemistry Nobel goes to developers of AlphaFold AI that predicts protein structures標(biāo)題發(fā)表在2024年10月9日《自然》的新聞版塊上
nature
Doi:10.1038/d41586-024-03214-7