機(jī)器之心報(bào)道
編輯:佳琪、陳陳
陶哲軒強(qiáng)調(diào)了在數(shù)學(xué)應(yīng)用和問題解決中需要找到合適的平衡點(diǎn):既不過度簡(jiǎn)化,也不過度復(fù)雜化,避免過度優(yōu)化和過度抽象導(dǎo)致的反效果。
剛剛,著名數(shù)學(xué)家陶哲軒在個(gè)人社交平臺(tái)更新的幾篇帖子,引起大家廣泛的共鳴。
陶哲軒用淺顯易懂的語言表達(dá)了自己對(duì)數(shù)學(xué)的理解與思考心得。
文中談到了一個(gè)關(guān)于「度」的問題,陶哲軒表示在設(shè)計(jì)系統(tǒng)時(shí),缺乏或者過度的數(shù)學(xué)分析可能都會(huì)適得其反,所以要適度。
有時(shí),我們不需要太過復(fù)雜精深的專業(yè)知識(shí),大道至簡(jiǎn)。
對(duì)于大多數(shù)任務(wù),使用一些相對(duì)簡(jiǎn)單但通用的數(shù)學(xué)方法,往往比專門設(shè)計(jì)的算法效果更好。
陶哲軒還提到,在純數(shù)學(xué)中,故意忽略一些直覺上看似非常重要的信息非常有幫助。
接下來是陶哲軒帖子全部?jī)?nèi)容。
掌握一點(diǎn)點(diǎn)的數(shù)學(xué)知識(shí)就能大有裨益。系統(tǒng)的設(shè)計(jì)不僅僅會(huì)因?yàn)槿狈ψ銐虻臄?shù)學(xué)分析而受到限制,同樣也可能因?yàn)檫^度的數(shù)學(xué)分析而受到阻礙。
一個(gè)常見的例子是網(wǎng)絡(luò)安全中對(duì)密碼的要求。從數(shù)學(xué)上講,密碼要求越復(fù)雜(例如,規(guī)定最小長度、特殊字符或不重復(fù)使用密碼),密碼就越安全。
然而,如果要求過于復(fù)雜,用戶和服務(wù)提供商可能會(huì)尋找繞過復(fù)雜要求的方法,比如尋找簡(jiǎn)單的密碼重置或恢復(fù)方式,或者將密碼存儲(chǔ)在不安全的系統(tǒng)中。這些做法反而可能降低整體系統(tǒng)的安全性,而不是提升它。
另一方面,只對(duì)單一指標(biāo)(如用戶使用密碼直接登錄系統(tǒng))進(jìn)行過度優(yōu)化,可能會(huì)損害更廣泛的目標(biāo)。就如古德哈特定律(Goodhart's law)中所說的,「當(dāng)壓力施于其上以進(jìn)行控制時(shí),任何觀測(cè)到的統(tǒng)計(jì)恒性都傾向消散!
粗略的講,在設(shè)計(jì)安全性時(shí),直接輸入方式的安全性應(yīng)該加強(qiáng)到與其他輸入方式的安全性相當(dāng),但超過這個(gè)程度的加強(qiáng)反而可能適得其反。
舉個(gè)例子來說,如果一棟建筑的前門有鎖,但窗戶沒有防護(hù),那么再給前門加更多的鎖就沒有太大意義,這樣做甚至可能導(dǎo)致一種危險(xiǎn)的虛假安全感。另一方面,如果窗戶比前門更難進(jìn)入,那么在前門上至少加一把鎖就很合理。
在人工智能領(lǐng)域,強(qiáng)化學(xué)習(xí)之父 Rick Sutton 的「苦澀的教訓(xùn)」(Bitter Lesson)就是這一原則的一個(gè)例子。
從直覺上來看,大家往往會(huì)認(rèn)為針對(duì)具體任務(wù)量身定制算法是最自然的選擇,在某些情況下,確實(shí)能取得不錯(cuò)的效果。
其實(shí),對(duì)于大多數(shù)任務(wù),使用一些相對(duì)簡(jiǎn)單但通用的數(shù)學(xué)方法,如梯度下降和反向傳播,往往比專門設(shè)計(jì)的算法效果更好。通用方法不依賴于特定任務(wù)的領(lǐng)域知識(shí),而是通過大量的數(shù)據(jù)和計(jì)算資源來訓(xùn)練模型,通常能帶來更大的進(jìn)展。
最近,我看到了有人為傳感器網(wǎng)絡(luò)開發(fā)更實(shí)惠的模數(shù)轉(zhuǎn)換器(ADC),就是這條發(fā)現(xiàn)的證明。
傳統(tǒng)上,ADC 電路基于經(jīng)典電氣工程原理設(shè)計(jì),采用常微分方程(ODE)、共振、傅里葉變換等數(shù)學(xué)工具來構(gòu)建高效電路。然而,在一些特定環(huán)境(如傳感器網(wǎng)絡(luò))中,我們的目標(biāo)是大規(guī)模、快速且成本低的方式實(shí)現(xiàn)模數(shù)轉(zhuǎn)換,同時(shí)可以容忍一定的故障率。
在這種情況下,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來設(shè)計(jì) ADC 電路,不依賴任何專業(yè)領(lǐng)域的知識(shí)(如傅里葉分析),反而是更好的方法。
這并不是說領(lǐng)域知識(shí)毫無用處 例如,物理信息神經(jīng)網(wǎng)絡(luò)在許多物理領(lǐng)域的表現(xiàn)可以遠(yuǎn)超標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò) 關(guān)鍵在于了解在什么情況下,應(yīng)該運(yùn)用多少領(lǐng)域知識(shí)。
在純數(shù)學(xué)中,一個(gè)有效的解題方法是故意忽略一些直覺上看似非常重要的信息。比如,在分析數(shù)論中,許多進(jìn)展都是通過把像素?cái)?shù)這樣的「重要」數(shù)學(xué)對(duì)象轉(zhuǎn)化為看起來更加簡(jiǎn)單、結(jié)構(gòu)較少的形式來實(shí)現(xiàn)的。這樣做可以讓我們更容易找到解決問題的途徑。
但抽象也需要把握一個(gè)度。如果抽象得過頭,就會(huì)丟失關(guān)鍵信息,反而無法解決問題;而如果抽象得恰到好處,問題就會(huì)變得更加清晰,從而找到合適的技巧去解決它。在此過程中甚至可以做出一些看似不太合理的變換,讓解題思路更加靈活起來。
我有時(shí)會(huì)開玩笑說,應(yīng)用數(shù)學(xué)家只需要掌握每本純數(shù)學(xué)研究生教材的前兩章,之后的章節(jié)對(duì)他們可能幫助不大(甚至可能有負(fù)面作用)。
另一方面,正是尋找第 3 到第 12 章的過程,才使得前兩章至臻完美、具有廣泛實(shí)用性的瑰寶。
在讀完陶哲軒的這段見解后,有人評(píng)論道:這些建議非常有價(jià)值,不論是對(duì)于哪種問題,都要做到:
簡(jiǎn)化細(xì)節(jié),直到看到更宏觀的問題結(jié)構(gòu)。
判斷是否已有針對(duì)同類問題的解決方案。
或者判斷這個(gè)一般性問題類是否過于籠統(tǒng),或者是否過于具體。
參考鏈接:
https://mathstodon.xyz/@tao/113482950431855749