劃重點
01DeepMind創(chuàng)始人哈薩比斯表示,僅僅將AI視作一種技術(shù)是錯誤的,認為AI將是“劃時代的定義性”技術(shù)。
02他強調(diào),要達到AGI,還需要約10年的時間,且需要實現(xiàn)兩三個重大創(chuàng)新。
03哈薩比斯認為,現(xiàn)在的AI研究進展正在逐步接近AGI,但仍存在其他更復雜的問題需要解決。
04他表示,DeepMind的目標從開始到今天仍是達到AGI,盡管現(xiàn)在的產(chǎn)品已經(jīng)相當成熟。
05此外,哈薩比斯認為,AGI將帶來巨大的影響,但必須小心處理,因為這些系統(tǒng)存在風險。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
西風 整理自 凹非寺
量子位 | 公眾號 QbitAI
新晉諾貝爾化學獎得主、DeepMind創(chuàng)始人哈薩比斯的最新訪談來了~
聊了DeepMind的初衷以及正在做的事,聊了AGI,還聊了AI的未來。
對于AGI,此前奧特曼曾表示可能5年內(nèi)到來,馬斯克也曾預測很快將實現(xiàn),而哈薩比斯則認為沒那么快。
他認為要達到AGI,還需要約10年的時間,而且還需要實現(xiàn)兩三個重大創(chuàng)新才能AGI。
而且將人工智能僅僅視為另一種技術(shù)是錯誤的,這將比互聯(lián)網(wǎng)等帶來的影響要大得多,AI將是“劃時代的定義性”技術(shù)。
……
哈薩比斯這次還明確表明“DeepMind的目標從開始到今天仍是達到AGI”、“DeepMind仍然是一家以研究為主導的機構(gòu)”。
不過有意思的是,在被問到他個人是如何保持持續(xù)研究的?哈薩比斯回答道:
之前通常會在午夜到凌晨3點間閱讀思考,但現(xiàn)在很多原本用于思考的時間現(xiàn)在都用來處理電話會議了。所以,需要考慮如何重新規(guī)劃時間。
總之,網(wǎng)友們整個訪談看下來,那叫一個津津有味:
還有網(wǎng)友認真記筆記:
關(guān)鍵點:AGI仍然是10年后的事。當前的AI炒作階段是關(guān)于讓Agent執(zhí)行在線/離線任務的故事.這一切將如何發(fā)展,你將擁有一個主要的通用智能系統(tǒng),它將調(diào)用多個擅長特定任務的AI Agent進行協(xié)作處理任務.
個別網(wǎng)友的關(guān)注點那可就不一樣了,不在發(fā)言上,而在:
話不多說,量子位在不改變原意的基礎(chǔ)上對這次訪談的內(nèi)容進行了翻譯整理,各位看官們請享用~
訪談內(nèi)容整理Q:你2010年左右開始創(chuàng)業(yè),那時已有一些早期想法,但之前AI經(jīng)歷了幾十年寒冬,人工智能似乎并未取得顯著進展。為什么那時你會選擇創(chuàng)立DeepMind?
哈薩比斯:
實際上,我從事AI研究已經(jīng)超過30年了。
首先是在游戲領(lǐng)域,制作游戲AI和模擬游戲。然后我學習了計算機科學和神經(jīng)科學。我一直在觀察AI領(lǐng)域的發(fā)展。
在90年代,就是你所說的AI寒冬期間,主要是邏輯系統(tǒng),被稱為專家系統(tǒng)。許多人可能還記得深藍擊敗國際象棋大師加里卡斯帕羅夫,這些都是預先編程的系統(tǒng),程序員和系統(tǒng)設計師解決問題并將其規(guī)則化。
然而,計算機或AI系統(tǒng)實際上并不智能,它只是機械地執(zhí)行這些啟發(fā)式規(guī)則,問題在于這會導致系統(tǒng)脆弱。它們無法學習新事物,當然也無法發(fā)現(xiàn)新事物,因為它們的能力顯然受限于設計者或程序員已經(jīng)知道的內(nèi)容。
對我來說,在90年代,無論是在劍橋還是麻省理工學院,我所學習的地方,普遍都認為邏輯系統(tǒng)是正確的方向。
我認為這就是人工智能寒冬的原因之一,因為它們本質(zhì)上是脆弱且有限的。
所以到了2010年,隨著深度學習在學術(shù)界誕生,我們看到了新的可能。我們還發(fā)現(xiàn)大腦中的多巴胺系統(tǒng)也使用了強化學習,動物包括人類都是通過強化學習來學習。
因此,我明白我們需要構(gòu)建的是一個能夠自我學習并具有通用性的系統(tǒng),這就是DeepMind的起源。
我們也看到了像GPU這樣的硬件正在加速發(fā)展。我在GPU最初用于計算機圖形和電腦游戲時就開始使用它們,但它們非常通用。
事實證明,世界上所有東西都可以歸結(jié)為矩陣乘法。
所以,我們很早就感覺到,將這些初生的想法和成分集合起來需要一種類似執(zhí)行阿波羅計劃的努力,能夠迅速推動技術(shù)進步,最終也確實實現(xiàn)了這一點。
Q:這是你當初在2010年設想的未來嗎?你是否曾想象過,15年后,會在這里向眾多聽眾講述AI的重要性,并且已經(jīng)解決了蛋白質(zhì)折疊問題?
哈薩比斯:
實際上,一切大致按照我們的計劃進行。當然,途中有些小波折和意外。但當我們在2010年開始時,我們認為大約需要20年的時間才能實現(xiàn)AGI。
我認為我們可能還有大約10年就能達到這個目標。
所以,大致上是按照這個時間線進行的。而且,蛋白質(zhì)折疊以及在通向AGI的過程中使用AI系統(tǒng)進行科學研究一直是我的熱情所在。
蛋白質(zhì)折疊一直是我希望解決的科學問題列表中的首位,如果我們能找到突破,這將是革命性的。
Q:我們來談談AGI。有趣的是,自ChatGPT出現(xiàn)以來,大家對AI的討論非常激烈,這與你所做的AI完全不同。到目前為止,作為一個觀察者來看,你的AI都是非常具體的,看起來有點奇怪,你開始做一些看似無意義的事情,你在電腦游戲上變得非常擅長……
哈薩比斯:
我不會說它們毫無意義,但更多的是為了娛樂,也許你可以這么說。
我們從游戲開始,部分原因是因為我在制作游戲和在象棋等方面的背景。
自圖靈時代以來,游戲一直與AI發(fā)展密切相關(guān),像香農(nóng)這樣的偉人,他們從象棋程序開始,這幾乎是每個AI先驅(qū)所做的。
象棋被認為是AI系統(tǒng)的訓練常
你的算法想法能否快速取得進展?通過它很容易就能benchmark你的位置,你知道,如果你打敗了世界冠軍或最好的計算機,那你就做得很好。
但重點是,這些總是達到目的的手段,而不是目的本身。
所以,想法總是要發(fā)展,不僅僅是成為圍棋或象棋的世界冠軍,而是以一種通用的方式進行,這種方式可以轉(zhuǎn)移到其他領(lǐng)域,包括科學和商業(yè)應用。
這就是我們使用深度強化學習所做的,也是我們與AlphaGo所做的。所有這些都是非常通用的系統(tǒng)和技術(shù),我們今天仍在使用。
當涉及到像AlphaFold解決蛋白質(zhì)折疊之類的問題時,你真正感興趣的是解決方案本身。
你知道,如果你有治療癌癥的方法,你不在乎它是如何完成的,你只想要治療癌癥的方法。所以你真的會想盡一切辦法去嘗試。
所以最開始是以所擁有的所有通用技術(shù)作為基線,然后觀察領(lǐng)域本身,如果這個領(lǐng)域?qū)ι鐣蛏虡I(yè)來說足夠有價值,那么你在上面添加定制的東西,這就是如何得到像AlphaFold這樣的突破性程序。
但最終,DeepMind的目標從開始到今天仍是達到AGI,這意味著一個通用系統(tǒng),能夠開箱即用地完成人類能做的任何認知任務。
完全通用的圖靈機,正如艾倫圖靈在50年代指定的,能夠計算任何可計算的東西。這是AI領(lǐng)域的最初目標,也是DeepMind的目標。
當然,你最近看到的是像這些語言模型這樣的東西。顯然,ChatGPT觸及了每個人,實際上所有頂尖實驗室,包括谷歌和DeepMind都在研究語言模型。
我們有自己的內(nèi)部模型,叫做Chinchilla,谷歌也有他們的。當然,這一切都基于谷歌研究院發(fā)明的Transformer架構(gòu),所有當前的模型都基于此。
這是一個令人興奮的時期,因為語言顯然是一種通用能力。
所以這就是每個人都對聊天機器人感到非常興奮的原因,這種技術(shù)能夠擴展到如此廣的程度,真是既有趣又出人意料。
我認為我們比以往任何時候都更接近于構(gòu)建這種通用系統(tǒng),但目前仍然需要專門的系統(tǒng)來在特定領(lǐng)域達到最高水平。
Q:LLM是否更接近于AGI?我的感覺是,它更像是與人類互動。但實際上是這樣嗎?
哈薩比斯:
我認為現(xiàn)在甚至連“大語言模型(LLMs)”這個詞都不夠準確了,因為它們不僅僅是大語言模型,還是多模態(tài)的。
例如,我們的模型Gemini從一開始就是多模態(tài)的。因此,它可以處理任何輸入,比如視覺、音頻、視頻、代碼以及文本。
我認為這將是AGI系統(tǒng)的一個關(guān)鍵組成部分,但可能本身還不夠。我認為從現(xiàn)在到我們實現(xiàn)AGI還需要兩到三個重大創(chuàng)新。
這也是為什么我提出10年的時間框架,一些同行、競爭對手的時間線比這更短,但我認為10年大致合適。
Q:現(xiàn)在你們正在進行一些非常實用的項目,比如我們提到的蛋白質(zhì)折疊和天氣預報。你們最近在國際數(shù)學奧林匹克競賽中獲得了銀牌,如果努力的話,或許還能獲得金牌。
你們還在開展其它多種活動,但我想知道,你們是否也在幕后考慮如何繼續(xù)推動AGI的發(fā)展?你們是否有團隊在致力于這一目標?
哈薩比斯:
我們確實是一個大型組織,正如你所說,我們最初是以貝爾實驗室的模式建立的,這是世界上最優(yōu)秀的工業(yè)實驗室之一,能夠發(fā)明未來并進行長期規(guī)劃。
我們已經(jīng)展示了這種模式的效力,特別是在為現(xiàn)今你所見的技術(shù)奠定基礎(chǔ)方面。
所以我認為任何深科技初創(chuàng)公司,都需要時間來發(fā)展和成熟其技術(shù)。我們現(xiàn)在處于一個非常激動人心的時刻,在過去的兩三年中,這些技術(shù)已經(jīng)相當成熟,準備應用于各種事物。
這不僅包括科學、數(shù)學和醫(yī)學等領(lǐng)域的進步,也包括生產(chǎn)力和商業(yè)應用,例如聊天機器人或是重新設計的工作流程和電子郵件系統(tǒng)。
這些都還處于初期階段,我們也在所有這些方面進行工作。
我認為谷歌擁有超十五億用戶的服務和產(chǎn)品,AI是所有這些事物的核心,新功能不斷加入,這些都源自我們在DeepMind開發(fā)的技術(shù)。
從某種意義上說這很棒,因為針對產(chǎn)品的技術(shù)需求與我們朝向AGI所做的研究大約90%相似,這些領(lǐng)域已經(jīng)大幅融合。
如果是五年或十年前,如果你想在產(chǎn)品中構(gòu)建AI,你必須回到邏輯網(wǎng)絡、專家系統(tǒng),因為通用系統(tǒng)和學習系統(tǒng)還不夠好。就像Alexa時代的助手,仍然基于那種舊技術(shù),它們脆弱且不具有普適性,最終并不那么有用。
而新一代助手會更加有能力,所以這實際上非常令人興奮。
我實際上看到像Gemini以及我們自己對未來多模型助手的設想,比如Astra項目,在通往AGI系統(tǒng)的關(guān)鍵路徑上,它們實際上推動了朝那個方向的研究。
我們有一個展示Astra的視頻:
這只是一個基本的全能助手的開始,它可以在你的日常生活中幫助你。還會有不同的形式,你可以在手機上看,你可以在眼鏡等設備上看,我無法告訴你這會有多么驚人。
如果我們回到五年前,你告訴我我們會達到現(xiàn)在這個地步,你只需要用相機指向某物,它就能完全理解你周圍的空間環(huán)境,這相當不可思議。
它有點像是已經(jīng)掌握了概念,并且理解什么是物體,甚至能通過窗外隨機的一瞥認出我們所在的位置。像記憶這樣的功能,它能記住你把東西放在哪里,這對助手來說也非常有用,還有個性化,所有這些都是我所說的下一代助手的一部分,我稱之為通用助手。
因為我想象你會帶著它到處走,使用不同的設備,無論它是在和你玩游戲,還是在你的桌面上幫助你工作,或者在移動設備上隨你一起旅行,都是同一個助手。
Q:一些人可能認為當前的進展是向AGI邁進的一步,而另一些人則認為現(xiàn)在的方法存在本質(zhì)的局限,這種局限是目前的方法無法克服的。
你認為這種進展是正在逐步接近目標,還是存在其他更復雜的問題需要解決?
哈薩比斯:
我們確實需要這些系統(tǒng),我相信你們都體驗過各種先進的聊天機器人。
這些系統(tǒng)目前還比較被動,主要是問答系統(tǒng)。雖然它們在回答問題、進行基本研究或文本總結(jié)方面頗有用處。
我們接下來想要的是更多基于Agent的系統(tǒng),能夠完成你指派的具體任務。這正是一個高效的數(shù)字助手應該提供的功能,例如規(guī)劃假期、安排城市行程、購買活動門票等。
因此,這些系統(tǒng)需要能夠在現(xiàn)實世界中進行行動、執(zhí)行計劃和推理。我們需要更好的規(guī)劃能力、推理、行動執(zhí)行能力,更強的記憶力,以及更精準的個性化,使系統(tǒng)能夠理解用戶的偏好并記住用戶的指示和喜好,所有這些技術(shù)都是必需的。
我們的一些游戲程序,比如在圍棋上擊敗世界冠軍的AlphaGo,就包含了規(guī)劃和推理,雖然這些都是在游戲這一狹窄領(lǐng)域內(nèi)。我們必須將這些技術(shù)現(xiàn)在應用到像Gemini這樣的模型上,正如你所見,它能理解其周圍的世界。
但如何在游戲之外的混亂的現(xiàn)實世界中進行規(guī)劃,我認為這是需要實現(xiàn)的下一個重大突破。
Q:那個助手也能達到像AlphaGo那樣的國際象棋水平嗎?
哈薩比斯:
是的。
所以,確切地說,目前研究界正在進行一場非常有趣的討論,關(guān)于這個問題有兩種可能的解決方式。
你可以想象,你的通用Agent系統(tǒng)能夠使用工具,這些工具可能是物理硬件如機器人,或者是軟件,比如計算器,甚至是其它AI系統(tǒng)。
例如,你可以設想一個通用AI系統(tǒng),類似于人類大腦,它可以調(diào)用AlphaFold或AlphaGo來折疊蛋白質(zhì)或下圍棋。由于這些功能都是數(shù)字化的,你也可以考慮將這些能力集成到一個通用大腦系統(tǒng)中,如Gemini。
但這樣做需要權(quán)衡,因為這可能導致系統(tǒng)過載特定信息,例如過多的棋局信息可能會削弱其在語言處理方面的能力。
這是一個開放的研究問題:是將這些工具保留為獨立的AI工具,供通用AI在特定情境下使用,還是將它們整合到主系統(tǒng)中?
對于一些功能,如編程和數(shù)學,整合到主系統(tǒng)可能更有益,因為這可以提升系統(tǒng)的整體性能。因此,我們也在研究學習理論、小孩子的發(fā)展等,來深入理解哪些功能最適合作為通用工具集成在主系統(tǒng)中。
Q:你們是否仍在努力追求成為類似貝爾實驗室那樣的研究機構(gòu)?
哈薩比斯:
我們?nèi)匀皇且患?strong>以研究為主導的機構(gòu),這就是我們在Google DeepMind的工作方式。
但是,我們逐漸擁有越來越大的產(chǎn)品供應組,與谷歌的其它部分進行交互。盡管如此,我們?nèi)匀粐L試保護我們的基礎(chǔ)研究,使其能夠根據(jù)我們自己的研究路線圖進行更長遠和更開放的思考,而不僅僅是被產(chǎn)品路線圖所引導。
Q:你個人是如何跟上這些的?
哈薩比斯:
我之前常常把晚上的時間留給自己,我一直試圖保持這樣的習慣,作為一個夜貓子,我通常會在午夜到凌晨3點之間思考、閱讀研究論文和產(chǎn)生新想法。
但隨著時間的推移,盡管我仍然在倫敦,但我在加利福尼亞有了更多的團隊。因此,很多原本用于思考的時間現(xiàn)在都用來處理電話會議了。所以,我需要考慮如何重新規(guī)劃這段時間。
Q:我知道你是簽署了關(guān)于真實存在性風險警告的公開信的人之一,雖然這種風險沒有具體定義。你對希望與災難論持何種態(tài)度?
哈薩比斯:
我認為這個問題的兩端都存在很多瘋狂的炒作。
一邊是現(xiàn)在所謂的“災難陣營”,人們認為事情肯定會出錯。另一邊是“Pollyanna陣營”,他們認為這只是另一種技術(shù)。
我們在移動互聯(lián)網(wǎng)的發(fā)展中已經(jīng)見過這種情況。作為一個社會,作為人類,我們具有極強的適應能力,這些變化似乎并不特別。
然而,我堅信這種看法是錯誤的。我認為這將比互聯(lián)網(wǎng)或移動互聯(lián)網(wǎng)等技術(shù)的影響要大得多,這是一個劃時代的定義。
我認為越來越多的人開始意識到這一點,我從小就有這種想法,這也是我為什么一生都在從事這一領(lǐng)域工作。我相信這將帶來巨大的影響。
當然,我之所以全身心投入,是因為我相信AI將對世界產(chǎn)生極其正面的影響。借助AI,我們即將能夠治愈所有疾病,通過材料科學和新能源幫助解決氣候問題,以及在我們?nèi)粘I钪刑岣呱a(chǎn)力,豐富我們的生活,并自動處理日常任務。
我認為這些都是令人驚奇的,而且即將到來。
但這些系統(tǒng)存在風險,這些是新系統(tǒng),是新技術(shù),它們非常強大。我在游戲的微觀世界中見證了這一點。
比如下棋,你從一個早上還是隨機的系統(tǒng)AlphaZero開始,到上午的咖啡休息時間,它就已經(jīng)變得比我強了。到了午餐時間,它已經(jīng)比世界冠軍還要強。然后到了下午,在八小時內(nèi),它已經(jīng)超越了世界上最好的固定編程的國際象棋計算機。
在八小時內(nèi)從隨機狀態(tài)變成世界上最棒的國際象棋實體,我實際上觀察了那個過程,這是相當不可思議的。
當然,那只是一個游戲,范圍很窄,但我看不出為什么那種能力不能被推廣到更通用的系統(tǒng)、語言和世界模型等領(lǐng)域。
因此,它將非常強大,但必須小心處理。
我認為我們現(xiàn)在還不知道。所以我簽署那封信的原因是我想對那種“這里沒什么可看的”的Pollyanna主義提出一些反對意見,實際上存在一些未知的風險,我們需要定義它們,我認為我們還有時間,但對于這樣重大的事情來說,十年并不是很長的時間。
因此,我們需要在可控性、在理論層面上理解這些系統(tǒng)的行為等方面進行更多的研究,還有非常重要的事情,比如如何為這些系統(tǒng)定義目標和價值觀,以及如何確保它們堅持這些目標和價值觀。
這些都是當前新興技術(shù)中的未知數(shù)。
所以我會說我是一個謹慎的樂觀主義者。我認為如果我們能團結(jié)起來,國際上合作,集中最好的智力,現(xiàn)在就開始行動,我們將能解決這個問題。
因此,我只是在鼓勵這種事情發(fā)生。我相信,只要有足夠的時間和智力,我們可以做對。但是,存在風險,我們不能走捷徑。我們需要以應有的尊重和敬畏來對待這項技術(shù)。
因為我們正處于這項技術(shù)的風口浪尖。
Q:你所說的讓我有些不安。你描述的系統(tǒng),似乎有可能在很大程度上取代人類的價值。
哈薩比斯:
我不這么認為。我認為即將出現(xiàn)一些重要的哲學討論。這些討論很快就會展開。比如,我們應該如何擴散?
如果AGI起作用,我們應該處于一個極大豐富的時代,像能源這樣的資源不應該存在短缺的情況。所以我認為這確實會改變經(jīng)濟的動態(tài)。
我說的是長遠來看。因此,我們現(xiàn)在需要開始思考這個問題,為此做準備。比如,我們想如何分配那額外的豐富和財富,我們現(xiàn)在就需要開始考慮這些問題。
參考鏈接:[1]https://x.com/GoogleDeepMind/status/1846974292963066199[2]https://x.com/tsarnick/status/1846994737527771642