當(dāng)前位置：人工智能實驗室> 人物報道 > 強化學(xué)習(xí)之父入局AGI創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，不依賴大模型

強化學(xué)習(xí)之父入局AGI創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，不依賴大模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-10-08 13:57:17 瀏覽：6368次

導(dǎo)讀：夢晨發(fā)自凹非寺量子位 | 公眾號 QbitAI 傳奇程序員卡馬克（John Carmack），與強化學(xué)習(xí)之父薩頓（Richard Sutton）強強聯(lián)手了， All in AGI 。 2030年向公眾展示通用人工智能的目標(biāo)是可行的。并且與主流方法不同，不依賴大模型范式，更追求實時的...

夢晨發(fā)自凹非寺

量子位 | 公眾號 QbitAI

傳奇程序員卡馬克（John Carmack），與強化學(xué)習(xí)之父薩頓（Richard Sutton）強強聯(lián)手了，All in AGI。

2030年向公眾展示通用人工智能的目標(biāo)是可行的。

并且與主流方法不同，不依賴大模型范式，更追求實時的在線學(xué)習(xí)。

兩人在薩頓任教的阿爾伯塔大學(xué)機器智能研究所（Amii）特別活動上宣布了這一消息。

薩頓會加入卡馬克的AI創(chuàng)業(yè)公司Keen Technologies，同時保持在阿爾伯塔的教職。

兩人在活動中都承認(rèn)，與擁有成百上千員工的大公司相比，Keen Technologies的團隊規(guī)模很校

目前還在剛起步階段，公司整個技術(shù)團隊都到了現(xiàn)場

只有站著的這4個人。

其融資規(guī)模2000萬美元，與OpenAI、Anthropic這樣動輒幾十億的也沒法比。

但他們相信，最終AGI的源代碼是一個人就能編寫的量級，可能只有幾萬行。

而且當(dāng)前AI領(lǐng)域正處在杠桿效應(yīng)最大的特殊時刻，小團隊也有機會做出大貢獻(xiàn)。

傳奇程序員與強化學(xué)習(xí)之父

卡馬克的傳奇經(jīng)歷，從開發(fā)世界第一款3D游戲，到轉(zhuǎn)型造火箭，再到加入Oculus成為后來Meta VR關(guān)鍵人物的故事都已被人熟知。

后來他與AI結(jié)緣，還和OpenAI有關(guān)。

他曾在另一場訪談中透露，Sam Altman曾邀他加入OpenAI，認(rèn)為他能在系統(tǒng)優(yōu)化方面發(fā)揮重要作用。

但卡馬克當(dāng)時認(rèn)為自己對機器學(xué)習(xí)范式的現(xiàn)代AI沒有任何了解，也就沒有答應(yīng)。

這卻成了他開始了解AI的一個契機。

他向OpenAI的首席科學(xué)家Ilya Sutskever要了一個入門必讀清單，從頭開始自學(xué)，先對傳統(tǒng)機器學(xué)習(xí)算法有了基本的了解。

等有了空閑，打算繼續(xù)涉足深度學(xué)習(xí)的時候，他來了個一周編程挑戰(zhàn)：

打印幾篇LeCun的經(jīng)典論文，在斷網(wǎng)情況下動手實踐，從推反向傳播公式開始。

一周過去后，他帶著用C++手搓的卷積神經(jīng)網(wǎng)絡(luò)結(jié)束閉關(guān)，沒有借助Python上的現(xiàn)代深度學(xué)習(xí)框架。

只能說佩服大神了。

此時他的主業(yè)還是在Facebook（后改名Meta）旗下Oculus研究VR，帶領(lǐng)團隊推出了Ouclus Go和Quest等產(chǎn)品。

不過這個過程中，他與公司管理層之間也逐漸產(chǎn)生矛盾和分歧，認(rèn)為公司內(nèi)部效率低下，也曾公開發(fā)表不滿。

2019年，他辭去Oculus CTO職位轉(zhuǎn)而擔(dān)任“顧問CTO”，開始把更多精力轉(zhuǎn)向AI。

2022年8月，他宣布新AI創(chuàng)業(yè)公司Keen Technologies宣布融資2000萬美元，投資者包括紅杉資本，GitHub前CEO Nat Friedman等。

后續(xù)他也透露，其實區(qū)區(qū)2000萬美元，自己就拿得出手。

但是從別人那里拿錢能給他一種危機和緊迫感，有更強烈的決心把事情做好。

2022年底，他正式離開Meta，并將VR視為已經(jīng)過去的一個人生階段，接下來完全轉(zhuǎn)向AI。

除了這條明面上的主線之外，卡馬克與AI還有一些莫名的緣分。

當(dāng)年他的3D游戲激發(fā)了對圖形計算的需求，GPU也是從游戲領(lǐng)域開始發(fā)展壯大。

到如今正是GPU的算力支持了AI的爆發(fā)，他談到這些時仍為自己的貢獻(xiàn)感到自豪。

……

今天的另一位主角薩頓也同樣是位傳奇人物。

他被譽為強化學(xué)習(xí)之父，為強化時間差異學(xué)習(xí)和策略梯度等方法做出重要貢獻(xiàn)，也是強化學(xué)習(xí)標(biāo)準(zhǔn)教科書的合著者。

2017年他以杰出科學(xué)家身份加入DeepMind，參與了AlphaGo系列研究，他的學(xué)生David Silver則是AlphaGo主要負(fù)責(zé)人之一。

薩頓寫過一篇著名短文The Bitter Lesson，認(rèn)為試圖把人類經(jīng)驗教給AI是行不通的，至今為止所有突破都是依靠算力提升，繼續(xù)利用算力的規(guī)模效應(yīng)才是正確道路。

兩人正式交流之前，卡馬克就曾表達(dá)過對這篇文章的關(guān)注和認(rèn)同。

但兩人真正直接交流，是薩頓主動聯(lián)系的。

幾個月前，卡馬克宣布AGI創(chuàng)業(yè)公司融資之后，收到了薩頓的郵件。

薩頓想要問他他在研究的道路上應(yīng)該走純學(xué)術(shù)、商業(yè)化還是非盈利組織路線的問題。

但在后續(xù)郵件交流中，兩人發(fā)現(xiàn)在AI研究方向和理念上存在驚人的一致性，漸漸確立了合作關(guān)系。

具體來說，兩人達(dá)成了4個共識：

都認(rèn)為當(dāng)前AGI發(fā)展被限制在很窄的幾個方向上，過多依賴大數(shù)據(jù)和大算力而忽視了創(chuàng)新

都認(rèn)為太早商業(yè)化會阻礙AGI的發(fā)展

都認(rèn)為最終AGI不會太復(fù)雜，一個人就能掌握全部原理，甚至一個人就能寫出主要的代碼。

都認(rèn)為2030年出現(xiàn)AGI原型是一個可行的目標(biāo)。

不只依賴大模型，小團隊也有機會

很大膽的目標(biāo)，現(xiàn)場觀眾也是這么認(rèn)為的。

面對“小團隊如何搞定這么宏大的目標(biāo)”的提問，卡馬克認(rèn)為實現(xiàn)AGI所需的數(shù)據(jù)量和算力需求可能沒有想象中那么大。

把人類一整年眼中所見拍成每秒30幀的視頻，可以裝在拇指大小的U盤里。

而1歲兒童只擁有這么多經(jīng)驗數(shù)據(jù)，已經(jīng)展現(xiàn)出明顯的智能。

如果算法對了，就不需要用整個互聯(lián)網(wǎng)的數(shù)據(jù)讓AGI去學(xué)習(xí)。

對于算力需求，他也是用這種直覺式的思維去考慮：人腦的計算能力也有限，遠(yuǎn)遠(yuǎn)達(dá)不到一個大型算力集群的程度。

比一個服務(wù)器節(jié)點（node）要大，也比一個機柜（rack）要大，但最大也就再高出一個數(shù)量級。

而且隨著時間推移，算法會更加高效，所需的算力還會持續(xù)下降。

如果說卡馬克在3D游戲、火箭和VR，這些看似不搭邊的工作領(lǐng)域上有什么共同點，那就是對大型實時反饋系統(tǒng)的優(yōu)化。

這也是當(dāng)初Sam Altman邀請他加入OpenAI時看中的地方。

他設(shè)想中的AGI架構(gòu)應(yīng)該是模塊化和分布式的，而不是一個巨大的集中模型。

學(xué)習(xí)也應(yīng)該是持續(xù)的在線學(xué)習(xí)，而不是現(xiàn)在的預(yù)訓(xùn)練之后大部分參數(shù)就不再更新。

我的底線是，如果一個系統(tǒng)不能以30hz的頻率運行，也就是訓(xùn)練時33毫秒左右更新一次，我就不會用它。

他進(jìn)一步表示，作為能自己寫原始Cuda代碼和能自己管理網(wǎng)絡(luò)通信的底層系統(tǒng)程序員，可能會去做一些其他人根本不會考慮的工作。

甚至不僅局限于現(xiàn)有的深度學(xué)習(xí)框架，會嘗試更高效的網(wǎng)絡(luò)架構(gòu)和計算方法。

總體目標(biāo)是模擬一個具有內(nèi)在動機和持續(xù)學(xué)習(xí)能力的虛擬智能體，在虛擬環(huán)境中持續(xù)學(xué)習(xí)。

不要機器人，因為制造火箭的經(jīng)歷讓他認(rèn)為打交道的物理對象越少越好。

與卡馬克剛涉足AGI不久相比，薩頓在這個問題上已經(jīng)花費了幾十年，他有更具體的研究計劃。

雖然這次活動上沒有說太多，但主體部分已經(jīng)以“阿爾伯塔計劃”的形式寫在一篇arXiv論文里。

阿爾伯塔計劃提出了一個統(tǒng)一的智能體框架，強調(diào)普遍經(jīng)驗而不是特殊的訓(xùn)練集，關(guān)注時間一致性，優(yōu)先考慮能隨算力產(chǎn)生規(guī)模效應(yīng)的方法，以及多智能體交互。

還提出了一個分為12步的路線圖。

前6步專注于設(shè)計model-free的持續(xù)學(xué)習(xí)方法，后6步引入環(huán)境模型和規(guī)劃。

其中最后一步稱為智能增強（Intelligence Amplification），一個智能體可以根據(jù)一些通用原則，利用它所學(xué)到的知識來放大和增強另一個智能體的行動、感知和認(rèn)知。

薩頓認(rèn)為這種增強是充分發(fā)揮人工智能潛力的重要組成部分。

在這個過程中，確定評估AI進(jìn)步的指標(biāo)非常重要但也十分困難，團隊正在探索不同的發(fā)展。

另外，卡馬克一直是開源的倡導(dǎo)者，但在AGI的問題上他表示會保持一定開放性，但不會全部公開算法細(xì)節(jié)。

作為一個小團隊，卡馬克認(rèn)為需要保持開拓精神，關(guān)注長遠(yuǎn)發(fā)展而不是短期利益，

不會過早考慮商業(yè)化，沒有像ChatGPT這樣可以公開發(fā)布的中間形態(tài)。

對于2030年能做到什么地步，卡馬克認(rèn)為“有可以向公眾展示的AGI”，薩頓的表述是“AI原型可以顯示出生命跡象（signs of life）”。

2030成關(guān)鍵節(jié)點

2030與AGI，并不是第一次同時出現(xiàn)。

頂尖AI團隊不約而同都把2030年前后作為實現(xiàn)AGI的關(guān)鍵節(jié)點。

比如OpenAI，在拿出20%總算力成立超級智能對齊部門的公告里寫著，我們相信超級智能在這個十年段到來。

甚至投資界也出現(xiàn)類似的觀點，孫正義剛剛在軟銀世界企業(yè)大會上也拿出來這樣一張PPT。

除了OpenAI和Keen Technologies，致力于開發(fā)AGI的組織并不多。

OpenAI最大的競爭對手，剛剛拿40億美元融資的Anthropic，其CEO Dario Amodei在最近一次訪談中提到，兩三年內(nèi)AI能表現(xiàn)得像一個受過良好教育的人類。

Transformer作者Vaswani與Palmer離開谷歌時，創(chuàng)辦了AdeptAI，目標(biāo)也是打造通用智能。

不過目前兩人今年初突然離開這家公司，聯(lián)合創(chuàng)始人中只留下一位David Luan（最右）。

兩位Transformer作者另外創(chuàng)辦了一家Essential AI，這家公司的愿景就沒那么“仰望星空”了，是比較務(wù)實的大模型商業(yè)化。

國內(nèi)方面明確喊出AGI目標(biāo)的同樣也不多，主要有MiniMax和楊植麟新創(chuàng)辦的月之暗面。

參考鏈接：

[1]https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/

[2]https://www.youtube.com/watch?v=uTMtGT1RjlY

[3]https://arxiv.org/abs/2208.11173

上一篇：小米又一智能穿戴設(shè)備上市，旗下爆款這么選才對

下一篇：蘋果已拿下中國智能手機市場份額第一華為排名第二

AiLab云推薦

強化學(xué)習(xí)之父入局AGI創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，不依賴大模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-10-08 13:57:17 瀏覽：6368次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

強化學(xué)習(xí)之父入局AGI創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，不依賴大模型 來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-10-08 13:57:17 瀏覽：6368次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

強化學(xué)習(xí)之父入局AGI創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，不依賴大模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-10-08 13:57:17 瀏覽：6368次