展會信息港展會大全

SpaceX天才實(shí)習(xí)生課余用AI破解上古卷軸,獲Nature頭版關(guān)注
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-06 18:31:33   瀏覽:7665次  

導(dǎo)讀:克雷西 發(fā)自 凹非寺 量子位 | 公眾號 QbitAI Nature官網(wǎng)頭版,最新刊發(fā)的是最新考古成果,轟動全球的成果 時隔2000年,上古卷軸(赫庫蘭尼姆卷軸)的神秘面紗,終于被揭開! 而且,這項(xiàng)研究還是AI完成的,背后的背后則是一名年僅21歲的天才少年,馬斯克點(diǎn)贊...

克雷西 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

Nature官網(wǎng)頭版,最新刊發(fā)的是最新考古成果,轟動全球的成果

時隔2000年,上古卷軸(赫庫蘭尼姆卷軸)的神秘面紗,終于被揭開!

而且,這項(xiàng)研究還是AI完成的,背后的背后則是一名年僅21歲的天才少年,馬斯克點(diǎn)贊的SpaceX實(shí)習(xí)生。

不同于一般的密碼破解,分析這份卷軸之難,無異于解讀一本“無字天書”

因?yàn)樵诠?9年,這組卷軸在一次火山爆發(fā)中被燒成了碳,1752年才被挖掘出土。只要稍有不慎,脆弱的卷軸就會分分鐘變成殘片,想要通過物理方式展開,難如登天。

直到今時今日,三名大學(xué)生,終于借助AI的力量,成功破譯了其中的段落,打開了全新的考古研究范式。

他們通過給卷軸拍攝CT影像并借助機(jī)器學(xué)習(xí)技術(shù)分割識別,把卷軸中的2000余個字符,揭示開來。

這一消息也迅速引發(fā)了全球轟動,目前為止,瀏覽量已經(jīng)超過了1500萬次,轉(zhuǎn)評贊接近6萬。

馬斯克也給三人團(tuán)隊(duì)點(diǎn)了贊,表示這實(shí)在是泰褲辣。

DeepMind的創(chuàng)始人Demis也大為贊嘆,還表示自己已經(jīng)迫不及待地想要讀一讀這段神秘的文字了。

那么,這份神秘的卷軸是如何一步步被破譯的呢?

不用打開,也能破譯內(nèi)容

交出這份成果的,是三名學(xué)生組成的隊(duì)伍,他們分別是:

Youssef Nader,來自埃及,在德國柏林的一家院校攻讀博士

Luke Farritor,SpaceX 實(shí)習(xí)生,在內(nèi)布拉斯加大學(xué)林肯分校計(jì)算機(jī)專業(yè)讀本科

Julian Schilliger,瑞士蘇黎世聯(lián)邦理工學(xué)院機(jī)器人專業(yè)碩士

想要在沒有損傷的前提下破譯這團(tuán)被燒成碳的卷軸,打開看幾乎是不可能的。

1865年,有人嘗試用物理方式把卷軸打開,結(jié)果以失敗告終,一部分卷軸直接成為了碎片。

此后近兩百年,便再也沒有人敢嘗試物理展開了。

直到2019年,肯塔基大學(xué)EduceLab的Brent Seales教授通過粒子加速器給卷軸拍攝了分辨率高達(dá)4μm的三維CT影像。

Seales教授的博士生Stephen Parsons長期致力于使用機(jī)器學(xué)習(xí)模型檢測CT圖像中的墨水,他利用已經(jīng)展開的部分帶有可見墨水的卷軸碎片,建立了一個ground-truth數(shù)據(jù)集。

網(wǎng)友們對此事展開了熱烈討論,并通過一場播客中傳到了Luke的耳朵。

這引起了他極大興趣,開始利用空余時間訓(xùn)練機(jī)器學(xué)習(xí)模型,以便對墨跡進(jìn)行分析。

最終,Luke的模型成功分析出了卷軸中肉眼不可見的符號,并發(fā)現(xiàn)了一個完整的單詞。

這個詞是希臘語的“ΠΟΡΦΥΡΑ”(小寫:πορφυρα,拉丁轉(zhuǎn)寫:porphyras),意思與“紫色”相關(guān)。

這一發(fā)現(xiàn),讓他成為歷史上第一個從赫庫蘭尼姆古卷內(nèi)部讀出整個單詞的人。

Youssef是第二個破譯出這個單詞的人,他采用了不同的方法,但得到了內(nèi)容相同且更為清晰的結(jié)果。

也正是看到Y(jié)oussef提交的結(jié)果之后,專家們對Luke的發(fā)現(xiàn),更加確認(rèn)了。

Julian則參與研發(fā)了EduceLab的3D模型分割工具Volume Cartographer。

Volume Cartographer將三維CT圖像沿卷軸展開,并映射到了二維平面,為Luke和Youssef的破譯工作奠定了基矗

此后,Julian又提出了新的分割方法ThaumatoAnakalyptor,通過重新分割的方式對已破解區(qū)域進(jìn)行了驗(yàn)證,并探索了更多未知片段。

此后,為了更快破譯出更多內(nèi)容,三人組成了超級團(tuán)隊(duì),最終成功解讀出了2000多個字符。

他們使用了三種不同模型架構(gòu)進(jìn)行了分析,之間的結(jié)果可以相互印證,墨水檢測程序代碼還直接在GitHub上做了開源。

他們分析出的這兩千多個字符,位于其中一卷的結(jié)尾,篇幅大約是該卷的5%,內(nèi)容被認(rèn)為與伊壁鳩魯哲學(xué)有關(guān)。伊壁鳩魯(Epicurus)是古希臘哲學(xué)家,主要關(guān)注個人的幸福和心靈的平靜,但講理性、在自然科學(xué)領(lǐng)域提出了原子論,對后世的倫理學(xué)和心理學(xué)發(fā)展都產(chǎn)生了重要影響。

而在這個卷軸的兩個連續(xù)片段中,作者提及了商品(例如食物)的可獲得性(availability)是否以及如何影響它們能帶來的快樂(pleasure)。

所以這次考古發(fā)現(xiàn),實(shí)際上或許能進(jìn)一步幫助了解古人對于世界的認(rèn)知和探究。

一場挑戰(zhàn)賽,三名學(xué)生,500萬獎金

而讓這三名學(xué)生走到一起的,是一場名為“維蘇威火山”的挑戰(zhàn)賽。

在Stephen建立了數(shù)據(jù)集之后,硅谷企業(yè)家、GitHub前CEONat Friedman對此產(chǎn)生了濃厚興趣,并出資贊助了這場比賽。

主辦方于去年3月公布了評選標(biāo)準(zhǔn),參賽者需要破譯至少4個段落,每個段落140個字符,其中至少85%的字符可恢復(fù)。

當(dāng)時,專家組普遍認(rèn)為一年之內(nèi)有人挑戰(zhàn)成功的概率還不到三成,但結(jié)果卻出乎意料

據(jù)介紹,比賽的消息發(fā)布后他們收到了許多作品,直到ddl之前幾分鐘還有團(tuán)隊(duì)交出成果。

經(jīng)過為期一個月的審查,這份包含了2000個字符的文本,被認(rèn)定破譯成功。

這三位獲獎?wù)邔⒐戏?0萬美元的獎金,折合人民幣500多萬。

此外,還有三個團(tuán)隊(duì)因提交的結(jié)果具有顯著可讀性,獲得了二等獎,這三個團(tuán)隊(duì)將各獲得5萬美元的獎勵。

其中就包括谷歌華人工程師Shao-Qian Mah所帶領(lǐng)的團(tuán)隊(duì)。

下一步,比賽主辦方希望在一年的時間內(nèi)破譯四組卷軸的90%,后續(xù)比賽信息也將在3月份公布。

當(dāng)然,這樣的挑戰(zhàn)賽獎金只是一方面,更重要的是展現(xiàn)了如何用AI解決各行各業(yè)挑戰(zhàn)的可能性和可行性,包括考古這樣的學(xué)科。

或許你也有所耳聞,更早之前,AI對于甲骨文的研究也開始了。你要還知道其他的項(xiàng)目?也歡迎分享分享~~

參考鏈接:

[1]https://scrollprize.org/grandprize

[2]https://twitter.com/natfriedman/status/1754519304471814555

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港