展會(huì)信息港展會(huì)大全

DeepMind最新成果劍指量子力學(xué),F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-05 09:06:24   瀏覽:2345次  

導(dǎo)讀:新智元報(bào)道 編輯:?jiǎn)虠?【新智元導(dǎo)讀】 DeepMind聯(lián)合帝國(guó)理工學(xué)院的學(xué)者,專(zhuān)注于用神經(jīng)網(wǎng)絡(luò)方法對(duì)量子力學(xué)中經(jīng)典的薛定諤方程進(jìn)行近似求解。繼2020年提出FermiNet后,團(tuán)隊(duì)的最新成果求解量子激發(fā)態(tài),登上Science。 繼AlphaFold 3掀起生物學(xué)革命后,DeepMind...

新智元報(bào)道

編輯:?jiǎn)虠?strong style="box-sizing: border-box !important; margin: 0px; max-width: 100%; outline: 0px; overflow-wrap: break-word !important; padding: 0px; visibility: visible">【新智元導(dǎo)讀】DeepMind聯(lián)合帝國(guó)理工學(xué)院的學(xué)者,專(zhuān)注于用神經(jīng)網(wǎng)絡(luò)方法對(duì)量子力學(xué)中經(jīng)典的薛定諤方程進(jìn)行近似求解。繼2020年提出FermiNet后,團(tuán)隊(duì)的最新成果求解量子激發(fā)態(tài),登上Science。繼AlphaFold 3掀起生物學(xué)革命后,DeepMind又要開(kāi)始發(fā)力量子力學(xué)了。

8月22日,他們最新的研究成果FermiNet登上了Science,使用神經(jīng)網(wǎng)絡(luò)對(duì)量子激發(fā)態(tài)進(jìn)行準(zhǔn)確計(jì)算。

而是將問(wèn)題轉(zhuǎn)化為尋找擴(kuò)展系統(tǒng)的基態(tài)問(wèn)題。論文介紹了一種通過(guò)變分蒙特卡羅(variational Monte Carlo)估計(jì)量子系統(tǒng)激發(fā)態(tài)的算法,而是將問(wèn)題轉(zhuǎn)化為尋找擴(kuò)展系統(tǒng)基態(tài)的問(wèn)題,因此非常適用于神經(jīng)網(wǎng)絡(luò)分析。

通過(guò)在兩種不同的神經(jīng)網(wǎng)絡(luò):FermiNet和Psiformer上運(yùn)行,作者驗(yàn)證了這種方法的準(zhǔn)確性。

其中FerminNet同樣由DeepMind和帝國(guó)理工學(xué)院于2020年聯(lián)名提出,論文發(fā)表在期刊《Physical Review Research》上。

這篇論文展示了深度學(xué)習(xí)如何幫助求解量子力學(xué)基本方程,提出的創(chuàng)新網(wǎng)絡(luò)架構(gòu)FermiNet非常適合對(duì)大量電子集合(即化學(xué)鍵的基本構(gòu)建塊)的量子態(tài)進(jìn)行建模。

更重要的是,F(xiàn)ermiNet首次展示了,如何用深度學(xué)習(xí)方法、根據(jù)第一性原理計(jì)算原子和分子的能量,其準(zhǔn)確度足以發(fā)揮實(shí)際作用。

這不僅是一個(gè)重要的基礎(chǔ)科學(xué)問(wèn)題,而且還可能在未來(lái)產(chǎn)生實(shí)際用途,比如在制造新材料和化學(xué)合成物之前,使用計(jì)算機(jī)進(jìn)行模擬或原型制作。

此外,F(xiàn)ermiNet在蛋白質(zhì)折疊、玻璃動(dòng)力學(xué)、晶格量子色動(dòng)力學(xué)等領(lǐng)域都可能有廣泛的用途。

FeimiNet相關(guān)代碼已經(jīng)公布在GitHub上,方便計(jì)算物理和計(jì)算化學(xué)領(lǐng)域相關(guān)研究的參考。

除了FermiNet,DeepMind在2022年發(fā)布的基于自注意力的架構(gòu)Psiformer仍然是迄今為止用于求解量子力學(xué)方程的最準(zhǔn)確的AI方法。

量子力學(xué)簡(jiǎn)史

沒(méi)有什么比「量子力學(xué)」這四個(gè)字更能讓人困惑的了,畢竟這是讓普朗克都為之頭禿的領(lǐng)域。

比如薛定諤思維實(shí)驗(yàn)里那只又死又活的貓,還有經(jīng)典物理完全無(wú)法描述的粒子和波的性質(zhì)同時(shí)存在。

在經(jīng)典模型中,原子核位于中間,固定數(shù)量的電子繞著固定的軌道運(yùn)行,如同太陽(yáng)系一般嚴(yán)謹(jǐn)有序。

但在量子系統(tǒng)中,電子等粒子完全沒(méi)有這種精確的軌道,它們的位置是由「概率云」描述的。

「概率云」是什么意思?

這個(gè)模型告訴我們,原子中的電子沒(méi)有固定的運(yùn)動(dòng)軌跡,也沒(méi)有確切的位置,只能用「電子概率密度」描述它們?cè)谀硞(gè)區(qū)域出現(xiàn)的概率。

然而,概率云模型給我們的僅僅是「概率」而已,無(wú)法真正判斷電子在任何特定時(shí)刻是否位于某個(gè)區(qū)域。

這種情況已經(jīng)超出了一般人類(lèi)能理解的范疇,因此著名物理學(xué)家Richard Feynman才會(huì)宣稱(chēng):「如果你認(rèn)為自己理解量子力學(xué),那你就根本不理解量子力學(xué)!

雖然直覺(jué)無(wú)法理解,語(yǔ)言解釋起來(lái)也很困難,但是理論的核心內(nèi)容可以用非常簡(jiǎn)潔的數(shù)學(xué)語(yǔ)言描述。

所以計(jì)算機(jī)科學(xué)領(lǐng)域常聽(tīng)到的「Talk is cheap, show me your code」,在理論物理也有類(lèi)似的一句話「Shut up and calculate」。

在核心的幾個(gè)方程中,最著名的是薛定諤方程,足以描述所有熟悉物質(zhì)在原子和原子核水平上的行為。

化學(xué)中的共價(jià)鍵,或者超導(dǎo)體、超流體、激光和半導(dǎo)體的各種反直覺(jué)性質(zhì),都是電子間量子相互作用的結(jié)果,也都可以用薛定諤方程來(lái)描述。

上世紀(jì)20年代,量子力學(xué)的相關(guān)規(guī)則出現(xiàn)后,科學(xué)家們第一次可以用詳細(xì)理論描述化學(xué)反應(yīng)的最底層原理。

比如,對(duì)不同分子建立相應(yīng)方程,求解系統(tǒng)的能量,就可以找出哪些分子處于穩(wěn)定態(tài),哪些分子間會(huì)自發(fā)地發(fā)生反應(yīng)。

然而,理想很美好,現(xiàn)實(shí)很骨感。

當(dāng)科學(xué)家們實(shí)際開(kāi)始計(jì)算時(shí),他們發(fā)現(xiàn),只有氫原子的方程可以求解其他的都太復(fù)雜了,算不出來(lái)。

因此,量子力學(xué)奠基人之一、物理學(xué)家Paul Dirac在1929年說(shuō)了這樣一句話,到今天依舊適用

「要描述大部分物理學(xué)和整個(gè)化學(xué)的數(shù)學(xué)理論,所必需的基本物理定律是完全已知的。困難只在于,要精確應(yīng)用這些定律的話,會(huì)導(dǎo)致方程過(guò)于復(fù)雜而無(wú)法求解。」

「所以,我們需要開(kāi)發(fā)能應(yīng)用量子力學(xué)的近似方法!

Dirac之后,物理學(xué)家使用了一種近似方法,將電子分配到一個(gè)特定的軌道,每個(gè)軌道的形狀由所有其他軌道平均得到。

這種「平均徹方法只給每個(gè)電子分配一個(gè)軌道,因此對(duì)電子實(shí)際行為的描述非常不完整,但依然是一個(gè)可行的方法,對(duì)分子總能量的估算誤差在0.5%左右

原子軌道示意圖,藍(lán)色或紫色區(qū)域的表面表示最有可能找到電子的區(qū)域;藍(lán)色區(qū)域波函數(shù)為正,紫色區(qū)域波函數(shù)為負(fù)然而,誤差為0.5%的方法依舊不夠。

要知道,分子鍵能量?jī)H僅占系統(tǒng)總能量中的微小部分,想正確預(yù)測(cè)分子是否處于穩(wěn)定態(tài),要依靠占比0.001%的能量差值來(lái)判斷,或剩余相關(guān)能量中的0.02%。

相比電子平均場(chǎng),近幾十年開(kāi)發(fā)的多種計(jì)算方法都取得了進(jìn)步,但總是不能在同時(shí)達(dá)到令人滿意的準(zhǔn)確率和計(jì)算效率。

為費(fèi)米子量身定做神經(jīng)網(wǎng)絡(luò)

表示量子系統(tǒng)的挑戰(zhàn)之處在于,必需為每種可能的電子位置分配相應(yīng)概率,這就構(gòu)成了一個(gè)極其龐大的構(gòu)型空間。

比如,單單是硅原子,其可能的電子構(gòu)型數(shù)量就會(huì)比宇宙中所有原子的數(shù)量加起來(lái)還要多。而這正是深度神經(jīng)網(wǎng)絡(luò)的用武之地。

過(guò)去幾年中,神經(jīng)網(wǎng)絡(luò)在表示復(fù)雜的高維概率分布方面取得了巨大的進(jìn)步,而且能以有效、可擴(kuò)展的方式進(jìn)行訓(xùn)練。它們?cè)贏I領(lǐng)域中擬合高維函數(shù)的能力,或許也能用于表示量子的波函數(shù)。

泡利不相容原理處理電子時(shí),還需要考慮一個(gè)問(wèn)題電子必須遵守泡利不相容原理(Pauli exclusion principle),這意味著它們不能同時(shí)處于同一空間。

因?yàn)殡娮訉儆凇纲M(fèi)米子」,其波函數(shù)必須是反對(duì)稱(chēng)(antisymmetric)的。如果交換兩個(gè)電子的位置,波函數(shù)就會(huì)乘以-1。這意味著如果兩個(gè)電子彼此重疊,則波函數(shù)(以及該構(gòu)型的概率)將為零。

這意味著我們需要開(kāi)發(fā)一種新的神經(jīng)網(wǎng)絡(luò),接受反對(duì)稱(chēng)結(jié)構(gòu)的輸入這就是FermiNet。

矩陣的行列式恰好具有這種「反對(duì)稱(chēng)」屬性:如果交換兩行,輸出就會(huì)乘以-1,就像費(fèi)米子的波函數(shù)一樣。因此在大多數(shù)量子化學(xué)方法中,「反對(duì)稱(chēng)性」是通過(guò)行列式引入的。

Slater行列式就采用了這種思路:使用單電子函數(shù)對(duì)系統(tǒng)中的每個(gè)電子進(jìn)行評(píng)估,并將所有結(jié)果打包到一個(gè)矩陣中,該矩陣的行列式就是反對(duì)稱(chēng)波函數(shù)。

Slater行列式的動(dòng)畫(huà)演示:每條曲線都是上面所示軌道之一的切片當(dāng),電子1和2交換位置時(shí),對(duì)應(yīng)于Slater行列式發(fā)生行交換,波函數(shù)乘以-1,保證遵循泡利不相容原理在表示復(fù)雜函數(shù)方面,深度神經(jīng)網(wǎng)絡(luò)通常比基函數(shù)的線性組合更有效。

在FermiNet中,進(jìn)入行列式的每個(gè)函數(shù)都是所有電子的函數(shù),這遠(yuǎn)遠(yuǎn)超出了僅使用單個(gè)電子或兩個(gè)電子構(gòu)建函數(shù)的方法(如Slater行列式)。

此外,F(xiàn)ermiNet中每個(gè)電子都對(duì)應(yīng)單獨(dú)的信息流。但如果這些流之間沒(méi)有任何交互,F(xiàn)ermiNet的表達(dá)能力也不會(huì)比Slater行列式有所提升。

因此,網(wǎng)絡(luò)中每一層所有流的信息都被平均后,才會(huì)傳遞到下一層的信息流中,這類(lèi)似于圖神經(jīng)網(wǎng)絡(luò)在每一層聚合信息的方式。

因此,與Slater行列式不同,如果神經(jīng)網(wǎng)絡(luò)層變得足夠?qū),F(xiàn)ermiNet就可以作為通用函數(shù)逼近器。這意味著,如果得到正確訓(xùn)練,F(xiàn)ermiNet就能夠擬合薛定諤方程的近似精確解。

FermiNet的動(dòng)畫(huà)演示:網(wǎng)絡(luò)的單個(gè)流(藍(lán)色、紫色或粉色)的功能與傳統(tǒng)軌道非常相似。FermiNet引入了流之間的對(duì)稱(chēng)交互,使波函數(shù)更加通用、表達(dá)能力更強(qiáng),且保留了Slater行列式的反對(duì)稱(chēng)特性

變分量子蒙特卡羅如果要準(zhǔn)確地通過(guò)最小化系統(tǒng)能量來(lái)擬合FermiNet,就需要評(píng)估所有可能出現(xiàn)的電子構(gòu)型的波函數(shù)。顯然,我們不能直接計(jì)算其精確值,只能估算其近似值。

我們隨機(jī)選擇電子配置,評(píng)估每種電子排布的局部能量,將其相加后進(jìn)行最小化。

與直接計(jì)算真實(shí)的能量最小值不同,這種估算方法被稱(chēng)為蒙特卡羅方法(Monte Carlo method),有點(diǎn)像賭徒一遍又一遍地?cái)S骰子。雖然得到的只是近似值,但如果需要使其更精確,我們隨時(shí)可以再次擲骰子。

這些電子排布的樣本從何而來(lái)呢?

由于波函數(shù)的平方給出了在任何位置觀察到某種特定粒子排布的概率,因此從波函數(shù)本身生成樣本是最方便的本質(zhì)上是模擬觀察粒子的行為。

雖然大多數(shù)神經(jīng)網(wǎng)絡(luò)根據(jù)外部數(shù)據(jù)進(jìn)行訓(xùn)練,但在FermiNet中,用于訓(xùn)練的輸入數(shù)據(jù)由神經(jīng)網(wǎng)絡(luò)本身生成的。這意味著,除了指定原子核的結(jié)構(gòu)和位置,我們不需要任何額外的訓(xùn)練數(shù)據(jù)。

這種思想被稱(chēng)為「變分量子蒙特卡羅」(variational quantum Monte Carlo, VMC)。雖然60年代就被提出,但通常被認(rèn)為是一種低成本且不精確的計(jì)算方法。

通過(guò)用FermiNet替換Slater行列式,VMC成功「改頭換面」,準(zhǔn)確率得到了極大的提升。

從FermiNet采樣:模擬電子圍繞雙環(huán)丁烷分子移動(dòng)

實(shí)驗(yàn)結(jié)果

我們首先從簡(jiǎn)單的、經(jīng)過(guò)充分研究的系統(tǒng)開(kāi)始:元素周期表第一行中的原子(氫到氖)。

這些都是小型系統(tǒng),電子數(shù)≤10個(gè),而且足夠簡(jiǎn)單甚至簡(jiǎn)單到可以用最準(zhǔn)確且最昂貴(指數(shù)擴(kuò)展)的方法來(lái)處理它們。

結(jié)果發(fā)現(xiàn),F(xiàn)ermiNet的性能遠(yuǎn)遠(yuǎn)優(yōu)于類(lèi)似的VMC方法相對(duì)于計(jì)算量以指數(shù)級(jí)別增長(zhǎng)的方法,誤差通常能降低一半或更多。

在較大的系統(tǒng)上,指數(shù)擴(kuò)展的方法過(guò)于復(fù)雜,因此使用耦合聚類(lèi)方法(coupled cluster method)作為基線。

耦合聚類(lèi)方法對(duì)于穩(wěn)定構(gòu)型的分子效果很好,但很難應(yīng)對(duì)化學(xué)鍵拉伸或斷裂時(shí)的情況,而后者對(duì)于理解化學(xué)反應(yīng)恰恰至關(guān)重要。

另外,雖然這種方法的計(jì)算效率比指數(shù)擴(kuò)展的方法要好得多,但實(shí)驗(yàn)所用方法的計(jì)算量仍以電子數(shù)量的七次方的速度增加,因此也只能用于中等大小的分子。

下一階段,將FermiNet應(yīng)用于逐漸變大的分子,從氫化鋰到雙環(huán)丁烷。

對(duì)于最小的分子,F(xiàn)ermiNet捕獲了耦合簇能量和單個(gè)Slater行列式獲得的能量之間的99.8%的差異。

雙環(huán)丁烷是我們研究過(guò)的最大的系統(tǒng),有 30 個(gè)電子,F(xiàn)ermiNet仍然捕獲了97%或更多的相關(guān)能量(correlation energy),考慮到我們應(yīng)用的方法非常簡(jiǎn)單,這是一個(gè)巨大的成就。

FermiNet在分子上捕獲的相關(guān)能量比例:紫色表示99%的相關(guān)能量,從左到右:氫化鋰、氮?dú)、乙烯、臭氧、乙醇和雙環(huán)丁烷。計(jì)算激發(fā)態(tài)的新方法

除了2020年提出的FermiNet,在Science上最新發(fā)表的成果中,DeepMind為計(jì)算量子化學(xué)領(lǐng)域中最困難挑戰(zhàn)之一提出了解決方案了解分子如何在激發(fā)態(tài)之間轉(zhuǎn)變。

FermiNet最初專(zhuān)注于分子的基態(tài),即給定一組原子核,找到其周?chē)娮拥淖畹湍芰颗挪肌?/p>

但是,當(dāng)分子和材料受到大量能量的激發(fā)時(shí),例如光照或高溫,電子可能會(huì)進(jìn)入更高的能量狀態(tài)激發(fā)態(tài)。

激發(fā)態(tài)是理解物質(zhì)與光相互作用的基礎(chǔ),不同的分子和材料會(huì)吸收/釋放確切數(shù)量的能量,這相當(dāng)于它們獨(dú)特的指紋。

對(duì)這方面原理的理解影響著太陽(yáng)能電池板、LED、半導(dǎo)體、光催化劑等技術(shù)的性能,也在涉及光的生物過(guò)程中發(fā)揮著關(guān)鍵作用,例如光合作用和視覺(jué)。

準(zhǔn)確計(jì)算激發(fā)態(tài)能量比計(jì)算基態(tài)能量更具挑戰(zhàn)性。即使是基態(tài)化學(xué)的黃金基準(zhǔn)方法,如上面提到的耦合簇,在計(jì)算激發(fā)態(tài)能量時(shí)也會(huì)有大數(shù)十倍的誤差。

雖然我們希望將FermiNet的工作擴(kuò)展到激發(fā)態(tài),但目前來(lái)看,神經(jīng)網(wǎng)絡(luò)還不能與與最先進(jìn)的方法競(jìng)爭(zhēng)。

因此,這篇論文提出了一種計(jì)算激發(fā)態(tài)的新方法,比以前的方法更強(qiáng)大、更通用,可以應(yīng)用于任何類(lèi)型的數(shù)學(xué)模型,包括FermiNet和其他神經(jīng)網(wǎng)絡(luò)。

其工作原理是找到具有額外粒子的擴(kuò)展系統(tǒng)的基態(tài),因此對(duì)現(xiàn)有的優(yōu)化算法進(jìn)行少量修改即可使用。

論文在廣泛的基準(zhǔn)上進(jìn)行了驗(yàn)證,并取得了非常理想的實(shí)驗(yàn)結(jié)果。carbon dimer

在雙原子碳(carbon dimer)這種小而復(fù)雜的分子上,該方法實(shí)現(xiàn)了4meV的平均絕對(duì)誤差 (MAE),而之前的gold standard方法,誤差為20meV,相當(dāng)于五倍更接近實(shí)驗(yàn)結(jié)果。

雙原子碳示意圖此外,作者還在計(jì)算化學(xué)中一些最具挑戰(zhàn)性的系統(tǒng)上進(jìn)行了測(cè)試,比如兩個(gè)電子同時(shí)被激發(fā)。結(jié)果發(fā)現(xiàn)。與迄今為止完成的最苛刻、最復(fù)雜的計(jì)算相比,誤差僅在0.1 eV。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港