展會信息港展會大全

GPT-4打擂臺!優(yōu)化排序算法,和DeepMind新AI方法一致
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-12 09:00:10   瀏覽:7053次  

導(dǎo)讀:明敏 發(fā)自 凹非寺 量子位 | 公眾號 QbitAI DeepMind新AI登上Nature才一天,GPT-4就來打擂臺了! 只通過兩段提示 ,GPT-4就給出了和AlphaDev如出一轍的排序算法優(yōu)化方法。 而AlphaDev被DeepMind稱作是重現(xiàn)AlphaGo神來之筆,發(fā)現(xiàn)了提速70%的排序算法。 哦豁,...

明敏 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

DeepMind新AI登上Nature才一天,GPT-4就來打擂臺了!

只通過兩段提示,GPT-4就給出了和AlphaDev如出一轍的排序算法優(yōu)化方法。

而AlphaDev被DeepMind稱作是“重現(xiàn)AlphaGo神來之筆”,發(fā)現(xiàn)了提速70%的排序算法。

哦豁,這下AlphaDev更尷尬了。

讓GPT-4“發(fā)現(xiàn)”同樣操作的老哥直接陰陽:

完全不需要強(qiáng)化學(xué)習(xí)埃我能將這個發(fā)現(xiàn)登在Nature上嗎?

馬斯克“路過看到”,也留下了句“因吹斯聽”。

所以GPT-4怎么做到的?

2段提示就搞定

帶來這個新發(fā)現(xiàn)的是一位來自威斯康星大學(xué)麥迪遜分校的副教授,名叫Dimitris Papailiopoulos(下面簡稱D教授)。

他讓GPT-4實現(xiàn)這一操作的步驟非常簡單,一共就輸入了兩次提示。

首先,他和GPT-4說:

這有一段排序算法,我覺得它還能進(jìn)一步優(yōu)化。你能不能在下面幾行,用*注明哪些指令可以刪除或者改進(jìn)?如果不需要修改,就什么都不動。一步一步解釋原因,然后回去驗證它是對的。

第一步的時候他還強(qiáng)調(diào)說,如果有什么新發(fā)現(xiàn),先不要做改變,只是“看著”就好,寫出來一些書面改進(jìn)建議。

要非常詳細(xì)、非常小心。

然后GPT-4對給出的代碼做出了詳細(xì)解釋。

然后D教授給了第二條提示:

繼續(xù)。如果你有很大的把握,按照上面的提示去做。Temperatur=0(讓生成結(jié)果確定且一致),盡量簡要避免混淆。

然后GPT-4給出了詳細(xì)的步驟,最后總結(jié)說:

我們發(fā)現(xiàn)指令“mov S P”多余可以去掉,其他指令都是必需的。但在刪除之后,應(yīng)將P替換成S。

對比DeepMind新工作AlphaDev在處理同樣問題上的思路,不能說毫無關(guān)系,只能說一模一樣:

DeepMind方面對AlphaDev這通操作,讓人想起當(dāng)年AlphaGo的“第37步”一種違反直覺的下法卻直接擊敗傳奇圍棋選手李世石,讓觀眾全都震驚不已。

同樣,AlphaDev則是通過交換和復(fù)制移動,跳過了一個步驟,以一種看似錯誤但實際上是捷徑的方式達(dá)成目標(biāo)

據(jù)介紹,AlphaDev是一種強(qiáng)化學(xué)習(xí)算法、基于AlphaZero打造,它的發(fā)現(xiàn)并非基于現(xiàn)有算法,而是從最底層的匯編指令開始摸索的。

它的創(chuàng)新主要在于兩種指令序列:

(1)AlphaDev Swap Move(交換移動)

(2)AlphaDev Copy Move(復(fù)制移動)

原理上,DeepMind的研究員給它設(shè)計了一種單人“組裝”游戲:

只要能夠搜索并選擇出合適的指令(下圖A流程),正確且快速地排好數(shù)據(jù)(下圖B流程),就能獲得獎勵。

但這個游戲的挑戰(zhàn)不僅在于搜索空間的大小(可組合指令數(shù)相當(dāng)于宇宙中的粒子數(shù)),也在于獎勵函數(shù)的性質(zhì),因為一條錯誤指令就可能會使整個算法失效。

網(wǎng)友:我們總是低估GPT-4的能力

對于GPT-4的“騷操作”,有人表示:即便是資深開發(fā)者也低估GPT-4了。

有人感慨說,D教授的操作進(jìn)一步驗證,只要有耐心、懂提示工程,GPT-4能做到的事還有很多。

也有人提出質(zhì)疑,表示GPT-4能這么做會不會是因為它的訓(xùn)練數(shù)據(jù)中包含了一些排序算法的優(yōu)化方法?

不過話說回來,之所以這件事能夠引起這么大的關(guān)注和討論,很大一部分原因是AlphaDev登上Nature存在爭議。

不少人覺得這也不是什么開創(chuàng)性的研究,DeepMind夸大其詞。

不僅是D教授陰陽說“我是不是也能登Nature”,還有網(wǎng)友說自己十幾歲的時候優(yōu)化了快排,這也應(yīng)該發(fā)論文的。

當(dāng)然也有人認(rèn)為,AlphaDev本身的創(chuàng)新點(diǎn)更在于,它是利用強(qiáng)化學(xué)習(xí)來發(fā)現(xiàn)新算法的。

你覺得呢?

參考鏈接:

[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c

[2]https://twitter.com/DimitrisPapail/status/1666843952824168465

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港