展會(huì)信息港展會(huì)大全

DeepMind AI寫的排序代碼快過人類版本
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-27 14:38:40   瀏覽:8774次  

導(dǎo)讀:原文作者:Matthew Hutson DeepMind開發(fā)的技術(shù)能玩圍棋和國(guó)際象棋,也會(huì)幫忙寫代碼。 基于谷歌DeepMind AlphaZero AI的一個(gè)人工智能系統(tǒng)創(chuàng)建了算法,翻譯成標(biāo)準(zhǔn)編程語(yǔ)言C++后可將數(shù)據(jù)排序速度提升到人類生成版本的3倍以上。 我們有點(diǎn)吃驚,Daniel Mankowitz...

原文作者:Matthew Hutson

DeepMind開發(fā)的技術(shù)能玩圍棋和國(guó)際象棋,也會(huì)幫忙寫代碼。

基于谷歌DeepMind AlphaZero AI的一個(gè)人工智能系統(tǒng)創(chuàng)建了算法,翻譯成標(biāo)準(zhǔn)編程語(yǔ)言C++后可將數(shù)據(jù)排序速度提升到人類生成版本的3倍以上。

“我們有點(diǎn)吃驚,”Daniel Mankowitz說,他是領(lǐng)導(dǎo)這項(xiàng)工作的DeepMind計(jì)算機(jī)科學(xué)家,“我們一開始都不敢相信。”

DeepMind用AlphaZero(玩桌面游戲的人工智能系統(tǒng))背后的技術(shù)產(chǎn)生了排序算法。來源:Ed Jones/AFP via Getty

計(jì)算機(jī)科學(xué)家?guī)资陙矶荚趦?yōu)化計(jì)算機(jī)的數(shù)據(jù)排序方式,力求在返回搜索結(jié)果或按字母順序排序聯(lián)系人列表時(shí)優(yōu)化關(guān)鍵的幾毫秒。現(xiàn)在,位于倫敦的DeepMind利用AlphaZero(玩桌面游戲國(guó)際象棋、圍棋和象棋的AI系統(tǒng))背后的技術(shù),以之構(gòu)建排序算法,極大改進(jìn)了排序速度。“這是個(gè)振奮人心的結(jié)果。”斯坦福大學(xué)的計(jì)算機(jī)科學(xué)家Emma Brunskill說。

《自然》發(fā)表的一篇論文[1]描述了這個(gè)名為AlphaDev的系統(tǒng),它開發(fā)了更快的算法,這些算法已經(jīng)被加入兩個(gè)標(biāo)準(zhǔn)C++代碼庫(kù),每天被全世界的編程者使用數(shù)萬億次。

從小處開始

研究人員一開始將AlphaDev應(yīng)用于按規(guī)模排序數(shù)字。他們從小處開始,讓算法一次只排3個(gè)、4個(gè)或5個(gè)數(shù)字,但這很重要,因?yàn)樗鼈儽慌判蜉^長(zhǎng)列表的算法使用。AlphaDev在匯編指令的層面上運(yùn)行:代碼由自動(dòng)編譯器從程序員用C++寫的代碼中生成,隨后翻譯成1和0的機(jī)器代碼。

AlphaDev的工作方式和它的前身AlphaZero相似,AlphaZero結(jié)合計(jì)算機(jī)版本的“思考”和直覺在桌面游戲中選擇棋步[2]。AlphaDev不選擇行動(dòng),而是選擇指令加入一個(gè)程式中(DeepMind工程師稱之為“匯編游戲”。)

當(dāng)使用思考時(shí),在每一個(gè)決策點(diǎn),AlphaZero會(huì)考慮可能的棋步、在這些行動(dòng)之后的可能棋步,以此類推,以分支的方式計(jì)算哪些行動(dòng)最有可能最終獲勝。但思考所有可能的分支花的時(shí)間可能比宇宙年齡還長(zhǎng),所以它會(huì)使用一些類似直覺的東西來縮小搜索范圍。在每一步上,計(jì)算機(jī)程序會(huì)將游戲狀態(tài)輸入神經(jīng)網(wǎng)絡(luò)(復(fù)雜、可調(diào)的數(shù)學(xué)函數(shù)),突出最有希望的棋步。在訓(xùn)練中,它不斷根據(jù)游戲結(jié)果來更新網(wǎng)絡(luò)。它還通過不總是選擇當(dāng)前評(píng)分最高的一步,來探索棋步。

獲得獎(jiǎng)賞

AlphaDev可以選擇四類行動(dòng)之一,包括比較數(shù)值、在不同位置移動(dòng)數(shù)值、跳到程序的不同部分。在每一步之后,它會(huì)嘗試排序一系列列表,并根據(jù)在列表中多少個(gè)項(xiàng)目得到正確排序而獲得獎(jiǎng)勵(lì)。它會(huì)一直繼續(xù),直到完美排序所有列表,或達(dá)到程序長(zhǎng)度限制,然后再?gòu)念^開始一個(gè)新程序。

神經(jīng)網(wǎng)絡(luò)不僅根據(jù)正確性來評(píng)估和獎(jiǎng)賞程序,也考慮速度。Mankowitz的團(tuán)隊(duì)訓(xùn)練這個(gè)系統(tǒng)基于指令總數(shù)或處理時(shí)間來評(píng)估速度。根據(jù)所用的處理器和排序的數(shù)值數(shù)量,AlphaDev最佳算法比人類的算法節(jié)省4%-71%的時(shí)間。但當(dāng)算法多次調(diào)用,對(duì)25萬個(gè)值排序時(shí),總共節(jié)省的時(shí)間只有1-2%,因?yàn)槠渌a未經(jīng)優(yōu)化。

DeepMind還將AlphaDev應(yīng)用于非排序算法。在一個(gè)用于將特定格式存儲(chǔ)的數(shù)據(jù)轉(zhuǎn)化為字節(jié)的算法上,它的版本比標(biāo)準(zhǔn)版本花的時(shí)間少67%。而它的哈希算法(用于數(shù)據(jù)存儲(chǔ)和檢索)比標(biāo)準(zhǔn)算法節(jié)省30%的時(shí)間。

為了了解AlphaDev在哪里省出時(shí)間,研究團(tuán)隊(duì)仔細(xì)研究了它的算法。在排序上,他們發(fā)現(xiàn)了兩個(gè)新技巧,他們稱之為AlphaDev交換和AlphaDev復(fù)制。Mankowitz將之與“棋步37”AlphaZero 前身AlphaGo在首爾一次表演賽上與人類圍棋冠軍李世石比賽時(shí)出人意料的棋步作了比較。“事后看來,這是贏得比賽的一個(gè)根本動(dòng)作,影響了我們對(duì)戰(zhàn)略的思考。”他說。

就科學(xué)上來說,“我不知道這里有什么特別深?yuàn)W的東西。”布朗大學(xué)的計(jì)算機(jī)科學(xué)家Michael Littman說,他指出AlphaZero已經(jīng)存在6年了。“但這項(xiàng)開發(fā)意義重大。”他補(bǔ)充說,DeepMind的研究者們善于將方法用于新問題。去年DeepMind也修改了AlphaZero,創(chuàng)造出了AlphaTensor[3],它發(fā)明了更快的矩陣乘法方法。

未來,DeepMind團(tuán)隊(duì)可能會(huì)將AlphaZero這類算法應(yīng)用于更多種問題,甚至自行設(shè)計(jì)硬件,Mankowitz說。“我們確實(shí)想全棧都試試。”

參考文獻(xiàn):

1.Mankowitz, D. L. et al. Nature 618, 257263 (2023).

2.Silver, D. et al. Science 362, 11401144 (2018).

3.Fawzi, A. et al. Nature610, 4753 (2022).

原文以DeepMind AI creates algorithms that sort data faster than those built by people標(biāo)題發(fā)表在2023年6月7日《自然》的新聞版塊上

nature

doi:10.1038/d41586-023-01883-4

點(diǎn)擊閱讀原文查看英文原文

點(diǎn)擊文字或圖片閱讀相關(guān)文章

DeepMind開發(fā)出能讓數(shù)學(xué)計(jì)算更快的AlphaTensor

ChatGPT等AI科研工具興起,它們好用嗎?

人工智能會(huì)率先發(fā)現(xiàn)外星生命嗎?

點(diǎn)亮“星標(biāo)”是您對(duì)我們最大的支持!

版權(quán)聲明:

本文由施普林格自然上海辦公室負(fù)責(zé)翻譯。中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。歡迎轉(zhuǎn)發(fā)至朋友圈,如需轉(zhuǎn)載,請(qǐng)郵件China@nature.com。未經(jīng)授權(quán)的翻譯是侵權(quán)行為,版權(quán)方將保留追究法律責(zé)任的權(quán)利。

2023 Springer Nature Limited.All Rights Reserved

星標(biāo)我們,記得點(diǎn)贊、在看+轉(zhuǎn)發(fā)哦!

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港