展會(huì)信息港展會(huì)大全

陶哲軒:計(jì)算機(jī)通用方法,往往比深?yuàn)W的純數(shù)學(xué)更能解決問題
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-15 18:44:35   瀏覽:0次  

導(dǎo)讀:機(jī)器之心報(bào)道編輯:佳琪、陳陳陶哲軒強(qiáng)調(diào)了在數(shù)學(xué)應(yīng)用和問題解決中需要找到合適的平衡點(diǎn):既不過度簡(jiǎn)化,也不過度復(fù)雜化,避免過度優(yōu)化和過度抽象導(dǎo)致的反效果。剛剛,著名數(shù)學(xué)家陶哲軒在個(gè)人社交平臺(tái)更新的幾篇帖子,引起大家廣泛的共鳴。陶哲軒用淺顯易懂的語言表達(dá)了自己對(duì)數(shù)學(xué)的理解與思考心得。文中談到了一個(gè)關(guān)于「度」的問題,陶哲軒表示在設(shè)計(jì)系統(tǒng)時(shí),缺乏或者過度的數(shù) ......

機(jī)器之心報(bào)道

編輯:佳琪、陳陳

陶哲軒強(qiáng)調(diào)了在數(shù)學(xué)應(yīng)用和問題解決中需要找到合適的平衡點(diǎn):既不過度簡(jiǎn)化,也不過度復(fù)雜化,避免過度優(yōu)化和過度抽象導(dǎo)致的反效果。

剛剛,著名數(shù)學(xué)家陶哲軒在個(gè)人社交平臺(tái)更新的幾篇帖子,引起大家廣泛的共鳴。

陶哲軒用淺顯易懂的語言表達(dá)了自己對(duì)數(shù)學(xué)的理解與思考心得。

文中談到了一個(gè)關(guān)于「度」的問題,陶哲軒表示在設(shè)計(jì)系統(tǒng)時(shí),缺乏或者過度的數(shù)學(xué)分析可能都會(huì)適得其反,所以要適度。

有時(shí),我們不需要太過復(fù)雜精深的專業(yè)知識(shí),大道至簡(jiǎn)。

對(duì)于大多數(shù)任務(wù),使用一些相對(duì)簡(jiǎn)單但通用的數(shù)學(xué)方法,往往比專門設(shè)計(jì)的算法效果更好。

陶哲軒還提到,在純數(shù)學(xué)中,故意忽略一些直覺上看似非常重要的信息非常有幫助。

接下來是陶哲軒帖子全部?jī)?nèi)容。

掌握一點(diǎn)點(diǎn)的數(shù)學(xué)知識(shí)就能大有裨益。系統(tǒng)的設(shè)計(jì)不僅僅會(huì)因?yàn)槿狈ψ銐虻臄?shù)學(xué)分析而受到限制,同樣也可能因?yàn)檫^度的數(shù)學(xué)分析而受到阻礙。

一個(gè)常見的例子是網(wǎng)絡(luò)安全中對(duì)密碼的要求。從數(shù)學(xué)上講,密碼要求越復(fù)雜(例如,規(guī)定最小長度、特殊字符或不重復(fù)使用密碼),密碼就越安全。

然而,如果要求過于復(fù)雜,用戶和服務(wù)提供商可能會(huì)尋找繞過復(fù)雜要求的方法,比如尋找簡(jiǎn)單的密碼重置或恢復(fù)方式,或者將密碼存儲(chǔ)在不安全的系統(tǒng)中。這些做法反而可能降低整體系統(tǒng)的安全性,而不是提升它。

另一方面,只對(duì)單一指標(biāo)(如用戶使用密碼直接登錄系統(tǒng))進(jìn)行過度優(yōu)化,可能會(huì)損害更廣泛的目標(biāo)。就如古德哈特定律(Goodhart's law)中所說的,「當(dāng)壓力施于其上以進(jìn)行控制時(shí),任何觀測(cè)到的統(tǒng)計(jì)恒性都傾向消散!

粗略的講,在設(shè)計(jì)安全性時(shí),直接輸入方式的安全性應(yīng)該加強(qiáng)到與其他輸入方式的安全性相當(dāng),但超過這個(gè)程度的加強(qiáng)反而可能適得其反。

舉個(gè)例子來說,如果一棟建筑的前門有鎖,但窗戶沒有防護(hù),那么再給前門加更多的鎖就沒有太大意義,這樣做甚至可能導(dǎo)致一種危險(xiǎn)的虛假安全感。另一方面,如果窗戶比前門更難進(jìn)入,那么在前門上至少加一把鎖就很合理。

陶哲軒:計(jì)算機(jī)通用方法,往往比深?yuàn)W的純數(shù)學(xué)更能解決問題

在人工智能領(lǐng)域,強(qiáng)化學(xué)習(xí)之父 Rick Sutton 的「苦澀的教訓(xùn)」(Bitter Lesson)就是這一原則的一個(gè)例子。

從直覺上來看,大家往往會(huì)認(rèn)為針對(duì)具體任務(wù)量身定制算法是最自然的選擇,在某些情況下,確實(shí)能取得不錯(cuò)的效果。

其實(shí),對(duì)于大多數(shù)任務(wù),使用一些相對(duì)簡(jiǎn)單但通用的數(shù)學(xué)方法,如梯度下降和反向傳播,往往比專門設(shè)計(jì)的算法效果更好。通用方法不依賴于特定任務(wù)的領(lǐng)域知識(shí),而是通過大量的數(shù)據(jù)和計(jì)算資源來訓(xùn)練模型,通常能帶來更大的進(jìn)展。

最近,我看到了有人為傳感器網(wǎng)絡(luò)開發(fā)更實(shí)惠的模數(shù)轉(zhuǎn)換器(ADC),就是這條發(fā)現(xiàn)的證明。

傳統(tǒng)上,ADC 電路基于經(jīng)典電氣工程原理設(shè)計(jì),采用常微分方程(ODE)、共振、傅里葉變換等數(shù)學(xué)工具來構(gòu)建高效電路。然而,在一些特定環(huán)境(如傳感器網(wǎng)絡(luò))中,我們的目標(biāo)是大規(guī)模、快速且成本低的方式實(shí)現(xiàn)模數(shù)轉(zhuǎn)換,同時(shí)可以容忍一定的故障率。

在這種情況下,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來設(shè)計(jì) ADC 電路,不依賴任何專業(yè)領(lǐng)域的知識(shí)(如傅里葉分析),反而是更好的方法。

這并不是說領(lǐng)域知識(shí)毫無用處  例如,物理信息神經(jīng)網(wǎng)絡(luò)在許多物理領(lǐng)域的表現(xiàn)可以遠(yuǎn)超標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)  關(guān)鍵在于了解在什么情況下,應(yīng)該運(yùn)用多少領(lǐng)域知識(shí)。

陶哲軒:計(jì)算機(jī)通用方法,往往比深?yuàn)W的純數(shù)學(xué)更能解決問題

在純數(shù)學(xué)中,一個(gè)有效的解題方法是故意忽略一些直覺上看似非常重要的信息。比如,在分析數(shù)論中,許多進(jìn)展都是通過把像素?cái)?shù)這樣的「重要」數(shù)學(xué)對(duì)象轉(zhuǎn)化為看起來更加簡(jiǎn)單、結(jié)構(gòu)較少的形式來實(shí)現(xiàn)的。這樣做可以讓我們更容易找到解決問題的途徑。

抽象也需要把握一個(gè)度。如果抽象得過頭,就會(huì)丟失關(guān)鍵信息,反而無法解決問題;而如果抽象得恰到好處,問題就會(huì)變得更加清晰,從而找到合適的技巧去解決它。在此過程中甚至可以做出一些看似不太合理的變換,讓解題思路更加靈活起來。

我有時(shí)會(huì)開玩笑說,應(yīng)用數(shù)學(xué)家只需要掌握每本純數(shù)學(xué)研究生教材的前兩章,之后的章節(jié)對(duì)他們可能幫助不大(甚至可能有負(fù)面作用)。

另一方面,正是尋找第 3 到第 12 章的過程,才使得前兩章至臻完美、具有廣泛實(shí)用性的瑰寶。

陶哲軒:計(jì)算機(jī)通用方法,往往比深?yuàn)W的純數(shù)學(xué)更能解決問題

在讀完陶哲軒的這段見解后,有人評(píng)論道:這些建議非常有價(jià)值,不論是對(duì)于哪種問題,都要做到:

簡(jiǎn)化細(xì)節(jié),直到看到更宏觀的問題結(jié)構(gòu)。

判斷是否已有針對(duì)同類問題的解決方案。

或者判斷這個(gè)一般性問題類是否過于籠統(tǒng),或者是否過于具體。

陶哲軒:計(jì)算機(jī)通用方法,往往比深?yuàn)W的純數(shù)學(xué)更能解決問題

參考鏈接:

https://mathstodon.xyz/@tao/113482950431855749

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港