劃重點
01OpenAI創(chuàng)始人Sam Altman表示,公司正專注于開發(fā)能夠推理的模型,以推動重大進展。
02他認(rèn)為,AI智能體在人類無法完成的大規(guī)模并行任務(wù)方面具有巨大潛力。
03然而,Sam Altman指出,模型確實是會貶值的資產(chǎn),但投資這些模型的價值是值得的。
04此外,他強調(diào)在AI領(lǐng)域,缺乏經(jīng)驗并不意味著缺乏價值,應(yīng)該招聘具有多樣性的年輕人才。
05最后,Sam Altman預(yù)測,科技進步將不斷超越所有人的預(yù)期,但社會本身的變化程度可能會出人意料地小。
以上內(nèi)容由大模型生成,僅供參考
“模型確實是會貶值的資產(chǎn),這一點毋庸置疑。但說它們不值得投入訓(xùn)練成本,這種觀點似乎完全錯誤!
譯| Eric Harrington出品丨AI 科技大本營(ID:rgznai100)2024 年,OpenAI 規(guī)劃了三場重要的開發(fā)者大會(DevDay),分別在 OpenAI 總部的美國舊金山(10 月 1 日)、英國倫敦(10 月 30 日)和新加坡(11 月 21 日)舉辦。我們可以簡單理解為美洲站、歐洲站和亞洲站。隨著歐洲站在倫敦的圓滿落幕,AI 技術(shù)的未來圖景變得愈發(fā)清晰。
本次開發(fā)者大會雖然看起來還是在“畫餅”,但仍帶來了許多令人印象深刻的現(xiàn)場實機演示環(huán)節(jié):一臺搭載 o1-mini 的無人機在舞臺上完成了從編程到起飛的全過程,展示了 OpenAI 最新模型對復(fù)雜設(shè)備的實時控制能力;緊接著,開發(fā)團隊僅用 30 秒就在觀眾面前完成了一款 iPhone 應(yīng)用的構(gòu)建,讓全場發(fā)出陣陣驚嘆:
此外,OpenAI CEO山姆阿爾特曼(Sam Altman)也在大會期間接受了 20VC 創(chuàng)始人 Harry Stebbings 的專訪。值得一提的是,這一次 Altman 沒有像以往一樣“打太極”(可以回顧我們往期的許多采訪整理),而是真的分享了不少他對 AI 發(fā)展的深刻見解,涵蓋了從模型演進到企業(yè)戰(zhàn)略的諸多關(guān)鍵話題:
談及推理能力的重要性:“推理能力是我們目前最重要的關(guān)注領(lǐng)域。我認(rèn)為這將解鎖下一個重大的價值創(chuàng)造飛躍!
關(guān)于智能體的定義:“你可以交給它一個長期任務(wù),在執(zhí)行過程中只需要最少的監(jiān)督。”
對于未來定價的暢想:“不是按座位收費,甚至不是按智能體收費,而是基于持續(xù)為你工作的計算資源量來定價。”
對人才發(fā)展的思考:“世界上有很多非常有才華的人,他們沒有發(fā)揮出全部潛力,因為他們在一個糟糕的公司工作,或者他們生活在一個不支持任何好公司的國家!
對模型商業(yè)化的看法:“模型確實是會貶值的資產(chǎn),這一點毋庸置疑。但說它們不值得投入訓(xùn)練成本,這種觀點似乎完全錯誤。”
獨有的人才招聘策略:“缺乏經(jīng)驗并不意味著沒有價值!
AI 革命不應(yīng)該比喻為互聯(lián)網(wǎng),而是比作晶體管:“它具有令人難以置信的擴展性,迅速滲透到了各個領(lǐng)域。如今你使用的產(chǎn)品和服務(wù)背后都包含著大量的晶體管技術(shù),但你不會把這些公司看作是'晶體管公司'!
談及智能體的未來應(yīng)用:“我認(rèn)為更有意思的不是人們常說的那種'幫你訂餐打電話'的智能體,而是那種像一位聰明的資深同事一樣,能與你在項目中真正協(xié)作的智能體!
對未來的預(yù)測:“社會本身的變化程度可能會出人意料地小!
以下是這場深度對話的主要內(nèi)容,經(jīng) CSDN 精編整理。
明年是 OAI 進軍下一代系統(tǒng)的關(guān)鍵之年主持人:大家好,歡迎來到 OpenAI DevDay。在現(xiàn)場我們收到了眾多觀眾的提問,就讓我們從其中一個問題開始。
縱觀 OpenAI 的發(fā)展路線,未來是會專注于開發(fā)更多類似 o1 這樣的精簡模型,還是會繼續(xù)追求更大規(guī)模的模型?您是如何思考這個技術(shù)路線的選擇的?
Sam Altman:事實上,我們希望能在各個方面都取得突破,但目前我們特別關(guān)注模型的推理能力。我相信,也希望這種推理能力能夠幫助我們實現(xiàn)許多長期以來的突破性目標(biāo)。比如說,這樣的模型能夠為科學(xué)研究做出新的貢獻,能夠編寫更復(fù)雜的代碼,我相信這些都將推動重大進展。因此你會看到 o 系列模型的快速迭代,這對我們的戰(zhàn)略布局來說至關(guān)重要。
主持人:關(guān)于 OpenAI 的未來規(guī)劃,還有一個我認(rèn)為很重要的問題:你們?nèi)绾慰创秊榉羌夹g(shù)背景的創(chuàng)始人開發(fā)無代碼工具,幫助他們構(gòu)建和擴展 AI 應(yīng)用?你們對這個方向有什么思考?
Sam Altman:這個目標(biāo)一定會實現(xiàn),但我認(rèn)為第一步是開發(fā)工具來提升已經(jīng)掌握編程技能的人的生產(chǎn)力。當(dāng)然,最終我們相信能夠提供真正高質(zhì)量的無代碼工具,現(xiàn)在市面上已經(jīng)出現(xiàn)了一些不錯的嘗試。但目前你還不能直接向 AI 要求說“我要構(gòu)建一個完整的創(chuàng)業(yè)項目”,這還需要一段時間。
主持人:在目前的技術(shù)棧中,OpenAI 處于某個特定位置。OpenAI 會在技術(shù)棧中走多遠?這是個很好的問題。如果現(xiàn)在有創(chuàng)始人正在投入大量時間調(diào)試他們的 RAG 系統(tǒng),這算不算是在浪費時間?因為從長遠來看,OpenAI 可能會開發(fā)這部分應(yīng)用層的功能。對于有這種擔(dān)憂的創(chuàng)始人,你會如何回應(yīng)?
Sam Altman:我們通常是這樣回答的:我們會全力以赴,而且我們相信能夠持續(xù)提升模型的能力。如果你現(xiàn)在建立的業(yè)務(wù)主要是為了彌補當(dāng)前模型的某些小缺陷,那么假設(shè)我們做得對,這些業(yè)務(wù)在未來可能就變得不那么重要了。
但另一方面,如果你建立的公司能夠從模型的持續(xù)進步中受益 比如說,如果現(xiàn)在有個預(yù)言家告訴你,o4 模型將會變得異常強大,能做到現(xiàn)在看來不可能的事情,而你對此感到振奮,那雖然我們可能會判斷錯誤,但至少這與我們的愿景是一致的。
如果你說“好,這里有很多領(lǐng)域供我選擇”,但你選擇了其中一個讓o1-review 表現(xiàn)不佳的領(lǐng)域,然后說“我要修補這個問題,勉強讓它工作”,那么你其實是在假設(shè)模型的下一次迭代不會像我們預(yù)期的那么好。
這就是我們試圖傳達給創(chuàng)業(yè)公司的核心理念:我們相信我們正處于一個相當(dāng)陡峭的進步軌道上,今天模型存在的這些缺陷將會被未來的版本解決。我建議大家要認(rèn)同這一點。
主持人:對于某些領(lǐng)域,確實存在被 o1 模型“碾壓”的可能性。如果站在今天創(chuàng)業(yè)者的角度,OpenAI 可能會在哪些領(lǐng)域形成碾壓之勢,哪些領(lǐng)域則不會?另外,作為投資人,我也想投資那些不會受到?jīng)_擊的領(lǐng)域。創(chuàng)業(yè)者和投資人應(yīng)該如何思考這個問題?
Sam Altman:利用 AI 構(gòu)建那些此前難以實現(xiàn)或根本不可能的產(chǎn)品和服務(wù),這將創(chuàng)造出數(shù)萬億美元的新市值。確實有一些領(lǐng)域我們會努力參與,那就是讓模型變得極其強大,這樣你就不用那么費力就能讓它們完成你想要的任務(wù)。但其他所有的事情,比如在這項新技術(shù)之上構(gòu)建創(chuàng)新的產(chǎn)品和服務(wù),我們認(rèn)為這只會變得越來越好。
有一件事在早期讓我感到驚訝 現(xiàn)在已經(jīng)不是這種情況了,但在 GPT-3.5 時代,感覺有 95% 的創(chuàng)業(yè)公司都在押注模型不會有太大進步。他們在做這些事情的時候,我們已經(jīng)能看到 GPT-4 即將到來,我們想“天啊,它會變得非常強大,這些問題都將不復(fù)存在!如果你只是在開發(fā)工具來規(guī)避模型的某個缺陷,這種價值將會越來越小。
我們總是容易忘記幾年前的模型有多么原始。從時間跨度來看并不算太久,但當(dāng)時確實存在很多局限。所以看起來有很多機會可以構(gòu)建工具來填補這些空白,而不是去打造一個真正出色的 AI 導(dǎo)師、AI 醫(yī)療顧問之類的產(chǎn)品。所以我感覺當(dāng)時 95% 的人在押注模型不會變得更好,只有 5% 的人在押注模型會變得更好。我認(rèn)為現(xiàn)在這個比例已經(jīng)完全顛倒過來了。我認(rèn)為人們已經(jīng)意識到了這種進步的速度,也聽到了我們想要實現(xiàn)的目標(biāo)。所以這不再是一個問題,但這曾經(jīng)是我們經(jīng)常擔(dān)心的事情,因為我們能預(yù)見這將給所有這些非常努力的人帶來什么影響。
主持人:你提到將創(chuàng)造數(shù)萬億美元的價值。近期,軟銀集團的孫正義在一次演講中指出,超級人工智能每年能夠產(chǎn)生 9 萬億美元的價值,這正好與他預(yù)計的 9 萬億美元資本支出口吻合。當(dāng)你聽到這樣的預(yù)測時,你的看法是什么?你對這種觀點持何態(tài)度?Sam Altman:我認(rèn)為即使我們能達到這一預(yù)測值的一個零頭,那也已經(jīng)是非常顯著的成績了。確實,這個行業(yè)需要巨額的資本投資,同時也將帶來巨大的經(jīng)濟收益。歷史上每次重大的技術(shù)革新都是如此,而 AI 無疑正是一場這樣的革命。明年對我們來說將是進軍下一代系統(tǒng)的關(guān)鍵之年。關(guān)于無代碼軟件時代的到來時間,我無法給出確切的時間表。但是,我們可以想象一下未來的場景:當(dāng)每個人都能輕松地描述出他們想要的公司軟件系統(tǒng)時,這將帶來多大的經(jīng)濟效益。盡管這一目標(biāo)的實現(xiàn)仍需時日,但如果真的實現(xiàn)了,考慮到目前構(gòu)建此類系統(tǒng)所需的巨大難度和高昂成本,這將是一個顛覆性的進步。
同樣,我也認(rèn)為在醫(yī)療和教育等領(lǐng)域,AI 的應(yīng)用將以創(chuàng)新的方式推動發(fā)展,從而創(chuàng)造出數(shù)萬億美元的價值。我不認(rèn)為具體數(shù)字是重點。確實有人在爭論是 9 萬億還是 1 萬億或是其他數(shù)字。你知道,比我聰明的人也在研究這個問題。但是這里的價值創(chuàng)造潛力確實令人難以置信。
智能體的真正用途:人類因為帶寬限制無法完成的大規(guī)模并行任務(wù)主持人:我們待會兒會談到 AI 智能體,討論這些價值是如何實現(xiàn)的。就價值傳遞的機制而言,開源是一種非常重要的方式。你如何看待開源在 AI 未來的角色?當(dāng)遇到“我們是否應(yīng)該開源任何模型或某些模”這個問題時,你們內(nèi)部是如何討論的?
Sam Altman:在生態(tài)系統(tǒng)中,開源模型顯然有其重要地位,F(xiàn)在已經(jīng)有一些非常優(yōu)秀的開源模型。同時,也需要有精心設(shè)計的、集成度高的服務(wù)和 API。我認(rèn)為這些都有其存在的價值,用戶會根據(jù)自己的需求做出選擇。
主持人:作為一種價值傳遞機制,我們一方面有面向客戶的開源方式,另一方面可以通過 AI 智能體。我注意到關(guān)于智能體的定義存在很多概念混淆。你是如何定義智能體的?在你看來,什么是智能體,什么不是?
Sam Altman:這只是我的即興想法,沒有深思熟慮過但在我看來,AI 智能體就是能夠接受長期任務(wù),且在執(zhí)行過程中幾乎不需要督導(dǎo)的存在。
主持人:你認(rèn)為人們對智能體有什么誤解?
Sam Altman:更準(zhǔn)確地說,我認(rèn)為我們都還沒有對這項技術(shù)最終會呈現(xiàn)什么樣子形成直觀認(rèn)識。我們都在暗示某些看起來很重要的東西。也許我可以舉個例子:當(dāng)人們談?wù)?AI 智能體代理時,他們經(jīng)常給出的典型例子是:“哦,你可以讓智能體幫你預(yù)訂餐廳,它可以使用 OpenTable 或者直接給餐廳打電話。好吧,這確實能幫你省去一些麻煩。” 但我認(rèn)為,更有意思的是那些人類做不到或不會去做的事情。
假設(shè)不是給一家餐廳打電話預(yù)訂,而是讓我的智能體同時聯(lián)系 300 家餐廳,找出哪家能提供最適合我的餐食或者有什么特別優(yōu)惠。你可能會說:“讓你的智能體騷擾 300 家餐廳,這太過分了!钡绻与娫挼囊彩侵悄荏w,那就完全不是問題了。這可以是一個人類因為帶寬限制無法完成的大規(guī)模并行任務(wù)。這只是一個微不足道的例子,但它說明了人類在處理能力上的局限,而這些限制可能對智能體來說并不存在。
我認(rèn)為更有意思的不是人們常說的那種“幫你訂餐打電話”的智能體,而是那種像一位聰明的資深同事一樣,能與你在項目中真正協(xié)作的智能體。它可以獨立完成一個為期兩天或兩周的任務(wù),在遇到問題時會來請教你,最終能給你帶來高質(zhì)量的工作成果。
主持人:從根本上說,這是否會改變 SaaS 的定價模式?坦白說,當(dāng)談到價值獲取時,傳統(tǒng)上都是按座位收費,但現(xiàn)在你實際上是在替代勞動力。當(dāng) AI 成為企業(yè)勞動力的核心組成部分時,你是如何看待未來的定價問題的?
Sam Altman:我只會做一些有趣的推測,因為我們確實還不太確定這個問題。想象這樣一個場景:你可以說“我需要一個 GPU、10個 GPU 或者 100個 GPU 持續(xù)處理我的任務(wù)! 這不是按座位收費,甚至不是按智能體收費,而是基于持續(xù)為你工作的計算資源量來定價。
主持人:我們需要為智能體應(yīng)用專門構(gòu)建模型嗎?你是怎么看這個問題的?
Sam Altman:確實需要構(gòu)建大量的基礎(chǔ)設(shè)施和框架支持,但我認(rèn)為 o1 已經(jīng)為我們指明了方向,展示了一個能夠出色完成智能體任務(wù)的模型應(yīng)該是什么樣子。
模型確實是會貶值的資產(chǎn),但并非不值得投入主持人:談到模型,業(yè)界普遍認(rèn)為模型是會貶值的資產(chǎn),模型的商品化趨勢如此明顯。你如何看待這種說法?考慮到訓(xùn)練模型所需的資本投入越來越大,我們是否正在看到這種趨勢的逆轉(zhuǎn),因為可能只有極少數(shù)機構(gòu)能夠負擔(dān)得起如此龐大的投入?
Sam Altman:模型確實是會貶值的資產(chǎn),這一點毋庸置疑。但說它們不值得投入訓(xùn)練成本,這種觀點似乎完全錯誤。更不用說,當(dāng)你在訓(xùn)練這些模型時會產(chǎn)生一個正向的復(fù)合效應(yīng),你會在訓(xùn)練下一個模型時變得更加熟練。從模型實際能帶來的收入來看,我認(rèn)為這些投資是值得的。
不過公平地說,這種情況并不適用于所有人?赡墁F(xiàn)在有太多機構(gòu)在訓(xùn)練非常相似的模型。如果你在技術(shù)上落后,或者你的產(chǎn)品缺乏那些能夠保持其粘性和價值的基本商業(yè)要素,那么確實可能很難獲得投資回報。我們很幸運擁有 ChatGPT 和數(shù)億用戶使用我們的模型,所以即使成本很高,我們也能在龐大的用戶基礎(chǔ)上分?jǐn)傔@些成本。
主持人:你如何看待 OpenAI 模型未來的差異化發(fā)展,以及你們最想在哪些方面擴大這種差異化?
Sam Altman:推理能力是我們目前最關(guān)注的核心領(lǐng)域。我相信這將開啟下一個重大的價值創(chuàng)造飛躍。當(dāng)然,我們會在多個維度改進模型,包括開展多模態(tài)方面的工作,以及在模型中加入其他我們認(rèn)為對用戶極其重要的功能。
主持人:你是如何看待推理能力在多模態(tài)領(lǐng)域的應(yīng)用?這方面有什么挑戰(zhàn),你們想要實現(xiàn)什么目標(biāo)?
Sam Altman:特別談到推理能力在多模態(tài)中的應(yīng)用,我希望這會是一個水到渠成的過程。顯然,實現(xiàn)這一目標(biāo)需要付出很多努力。但你看,就像人類一樣,在嬰兒和幼兒時期,即使語言能力還不夠成熟,也已經(jīng)能夠進行相當(dāng)復(fù)雜的視覺推理。所以這顯然是可以實現(xiàn)的。
主持人:確實如此。隨著 o1 為推理時間設(shè)定了新的標(biāo)準(zhǔn),視覺能力將如何發(fā)展?
Sam Altman:在不透露太多細節(jié)的前提下,我保證基于圖像的模型會有顯著的進步。
缺乏經(jīng)驗并不意味著缺乏價值主持人:OpenAI 是如何在核心推理能力上取得突破的?我們是否需要開始推進強化學(xué)習(xí)作為一個新方向,或者在 Transformer 架構(gòu)之外探索其他新技術(shù)?
Sam Altman:這里面其實包含兩個問題:一個是我們?nèi)绾巫龅降模硪粋是每個人都很關(guān)心的問題 Transformer 之后會是什么。關(guān)于我們?nèi)绾巫龅降,這是我們的特殊秘訣。復(fù)制已知可行的東西相對容易,其中一個原因是你已經(jīng)確信這是可能的。所以在一個研究實驗室取得某項突破之后,即使你不完全清楚他們是如何做到的,去復(fù)制它也是可行的。你可以在 GPT-4 的復(fù)制品中看到這一點,我相信你也會在 o1 的復(fù)制品中看到這一點。
最難能可貴的,也是讓我最引以為豪的,是我們的文化孕育出了一種能力:持續(xù)探索全新且未經(jīng)驗證的領(lǐng)域。很多組織我不是在說 AI 研究人員,而是一般而言很多組織都聲稱自己具備這種能力。但在任何領(lǐng)域,真正能做到的都很少。從某種意義上說,我認(rèn)為這是推動人類進步最重要的要素之一。這也是為什么我幻想退休后要寫一本書,記錄下我所學(xué)到的關(guān)于如何建立這樣一個組織和文化的所有經(jīng)驗。
這不是要建立一個只會復(fù)制他人成果的組織。因為我認(rèn)為世界需要更多這樣的創(chuàng)新文化。雖然這受限于人才,但現(xiàn)實是有大量人才被浪費了,因為我們都不太擅長建立這種組織風(fēng)格、文化,或者不管你想怎么稱呼它。所以我希望能看到更多這樣的嘗試。這正是我認(rèn)為我們最與眾不同的地方。
主持人:人才是如何被浪費的?
Sam Altman:這個世界上有太多極具天賦的人,但他們無法充分發(fā)揮自己的潛力,可能是因為他們在一個管理不善的公司工作,或者生活在一個缺乏優(yōu)秀企業(yè)的國家,又或者是其他諸多原因。說到 AI 最讓我興奮的一點是,我希望它能幫助我們比現(xiàn)在做得更好,幫助每個人充分發(fā)揮自己的潛能,而我們現(xiàn)在離這個目標(biāo)還很遙遠。世界上有很多人,我相信如果他們的人生軌跡稍有不同,本可以成為杰出的 AI 研究員。
主持人:近幾年,你經(jīng)歷了令人難以置信的超高速增長。你剛才提到要在退休后寫一本書,回顧過去 10 年你在領(lǐng)導(dǎo)力方面的轉(zhuǎn)變,你認(rèn)為自己最顯著的改變是什么?
Sam Altman:對我來說,這幾年最不尋常的是事物變化的速度。在一般公司,你有時間經(jīng)歷從零到 1 億美元收入,從 1 億到 10 億,從 10 億到 100 億的過程。你不必在短短兩年內(nèi)完成所有這些。而且你也不必同時建立公司。我們必須進行研究,但我們并不是一個傳統(tǒng)意義上的硅谷創(chuàng)業(yè)公司,你知道,那種在擴張和服務(wù)大量客戶的公司。不得不這么快地完成這一切,意味著有很多東西我本應(yīng)該有更多時間去學(xué)習(xí),但我沒有得到這個機會。
主持人:你希望能有更多時間學(xué)習(xí)什么?
Sam Altman:我反倒想問問自己我到底知道些什么?在腦海中浮現(xiàn)的眾多例子中,有一個是:要讓公司專注于如何實現(xiàn)下一個 10 倍而不是下一個 10% 的增長,這需要多少積極的努力。追求下一個 10% 的增長,基本上就是重復(fù)過去行之有效的方法。但要讓一個公司從比如說 10 億美元收入增長到 100 億美元,需要進行徹底的變革。這不是簡單地“讓我們這周重復(fù)上周的工作”的思維模式。
在一個增長如此迅速以至于人們甚至沒有時間掌握基礎(chǔ)知識的環(huán)境中,我嚴(yán)重低估了保持向前沖刺所需的工作量。這涉及大量的內(nèi)部溝通工作,關(guān)于如何分享信息,如何建立結(jié)構(gòu),讓公司能夠每隔 8 個月、12 個月就思考更大規(guī)模、更復(fù)雜的目標(biāo)。其中很大一部分是關(guān)于規(guī)劃,如何平衡當(dāng)下和下個月必須完成的事情,以及為一年或兩年后的執(zhí)行做好準(zhǔn)備的長期工作,比如計算資源的構(gòu)建,甚至是一些看似普通的事情,像在舊金山這樣的城市提前規(guī)劃足夠的辦公空間,在這種增長速度下都變得異常困難。
所以我認(rèn)為,要么是沒有這樣的操作手冊,要么是有人掌握著一本秘密手冊但沒有分享給我;蛘呖赡芪覀兯腥硕贾皇窃诿髦斑M。但確實有很多東西需要在過程中不斷學(xué)習(xí)。
主持人:硅谷投資人Keith Rabois 在一次演講中說,你應(yīng)該招聘 30 歲以下的年輕人,這是另一位投資大神 Peter Thiel 教給他的,這是建立偉大公司的秘訣?紤]到你退休后要寫的這本書和這個建議,我很好奇:通過招聘這些充滿熱情和雄心的 30 歲以下的年輕人來建立偉大的公司,你對這個說法有什么看法?
Sam Altman:我們創(chuàng)立 OpenAI 的時候我也就 30 歲,或者差不多那個年紀(jì)。所以,你看,我自己也不算特別年輕。但看起來效果還不錯。
主持人:確實值得一試。那么問題是,你如何看待這個權(quán)衡:是招聘極其年輕的 30 歲以下人才,他們帶來年輕、活力和雄心,但經(jīng)驗較少,還是招聘那些經(jīng)驗豐富、知道如何做事的人?
Sam Altman:顯然,這兩類人都能帶來成功。就像,我剛才還在給某人發(fā) Slack 消息,談到我們最近在一個團隊招聘了一個人。我不確定他具體多大,但可能二十出頭,他的工作表現(xiàn)令人難以置信。我說,“我們能找到更多這樣的人嗎?這簡直太棒了!蔽艺娴暮茈y理解這些年輕人是如何做到這么優(yōu)秀的。
但這確實會發(fā)生。當(dāng)你能找到這樣的人才時,他們會帶來令人驚嘆的全新視角、能量和其他獨特價值。另一方面,當(dāng)你在設(shè)計人類歷史上最復(fù)雜和最昂貴的計算機系統(tǒng),或者說各種類型的基礎(chǔ)設(shè)施時,我不會對剛剛起步的人完全放心,因為風(fēng)險實在太高了。所以你需要兩者都有。我認(rèn)為真正需要的是在任何年齡段都要堅持極高的人才標(biāo)準(zhǔn)。“我只招年輕人”或“我只招有經(jīng)驗的人”的策略在我看來都是有失偏頗的。
這個框架對我來說不太恰當(dāng)。但其中確實有一個重要的觀點,這也是我對 Y Combinator 最感激的一點:缺乏經(jīng)驗并不意味著缺乏價值。有些人在職業(yè)生涯開始時就展現(xiàn)出令人難以置信的潛力,他們能創(chuàng)造巨大的價值。作為一個社會,我們應(yīng)該對這些人投下信任票。這是一件很棒的事情。
Sam Altman 也懷疑過 Scaling Law主持人:業(yè)界普遍認(rèn)為 Anthropic 的模型在編程任務(wù)上有時表現(xiàn)更出色。這是為什么?你認(rèn)為這個說法公平嗎?開發(fā)者在選擇使用 OpenAI 還是其他供應(yīng)商時應(yīng)該如何權(quán)衡?
Sam Altman:確實,他們有一個在編程方面表現(xiàn)出色的模型,這是非常令人印象深刻的工作。我認(rèn)為開發(fā)者在大多數(shù)情況下會使用多個模型。我不確定隨著我們進入這個更加智能體化的世界,這種格局會如何演變。但我覺得未來會是 AI 無處不在的景象。我們現(xiàn)在談?wù)摵退伎妓姆绞礁杏X有些不太對。也許用我的話來說,我們會從關(guān)注單個模型轉(zhuǎn)向關(guān)注整個系統(tǒng)。當(dāng)然,這需要一定時間。
主持人:談到模型的擴展,你認(rèn)為擴展定律(Scaling Law)還能在多少次模型迭代中保持有效?業(yè)界普遍認(rèn)為這不會持續(xù)太久,但似乎比人們預(yù)期的持續(xù)時間更長。
Sam Altman:你真正想問的其實是「模型能力提升的軌跡是否會保持目前這樣的勢頭?」在不透露具體細節(jié)的情況下,我相信答案是肯定的,而且這種趨勢會持續(xù)相當(dāng)長的時間。
主持人:你有懷疑過這一點嗎?
Sam Altman:當(dāng)然有過。為什么?我們遇到過很多挑戰(zhàn),比如一些我們無法理解的模型行為,一些失敗的訓(xùn)練過程,各種各樣的問題。當(dāng)我們接近一個技術(shù)范式的盡頭,必須尋找下一個突破口時,我們不得不探索新的方向。最困難的是什么?當(dāng)我們開始研究 GPT-4 時,遇到了一些讓我們非常困擾的問題,我們真的不知道該如何解決。我們最終找到了解決方案,但確實有一段時間我們完全不知道該如何構(gòu)建那個模型。然后在轉(zhuǎn)向 o1 和推理模型的構(gòu)想時,雖然這是我們很早就熱切期待的方向,但這確實是一段漫長而曲折的研究之路。
主持人:在面對這些漫長而曲折的道路,當(dāng)訓(xùn)練過程可能失敗時,保持士氣是否困難?你是如何在這些時期維持團隊士氣的?
Sam Altman:你知道,我們這里有很多人都對構(gòu)建通用人工智能充滿熱情,這本身就是一個強大的激勵因素。沒有人期望這會是一條輕松的、直達成功的道路。有一句歷史名言,我可能會引述得不夠準(zhǔn)確,但其內(nèi)核是這樣的:“我從不祈求上帝站在我這一邊,而是祈求我能站在上帝那一邊。” 在深度學(xué)習(xí)領(lǐng)域進行探索就有這樣一種感覺 仿佛是在追隨某種正確的方向。你只需要堅持,它最終似乎都會有效,盡管在途中會遇到一些重大障礙。對此的深刻信念一直支撐著我們。
主持人:我能問你一個特別的問題嗎?我最近聽到一句很棒的話:“生活中最沉重的不是鐵或金,而是那些未作出的決定!睂δ銇碚f,什么樣的未決定事項最令你感到沉重?
Sam Altman:這每天都在變化。不是說有一個特別重大的決定。當(dāng)然,確實有一些重要的決定,比如我們是否要在這個還是那個產(chǎn)品方向上投入,或者我們要用哪種方式構(gòu)建下一代計算系統(tǒng)。這些都是非常關(guān)鍵的、單向門式的決定,就像其他人一樣,我可能推遲它們的時間過長了。但最大的挑戰(zhàn)在于日常決策。每天都會遇到一些模棱兩可的決定,它們之所以會上報到我這里,正是因為都是些難以權(quán)衡的事情。我并不覺得自己特別可能比其他人做得更好,但我還是得做出決定。困擾我的不是某一個特定的決定,而是這些決定的數(shù)量。
主持人:當(dāng)面臨這些左右為難的決定時,你會特別傾向于咨詢某些人嗎?這些人有什么共同特點?
Sam Altman:不會。我認(rèn)為錯誤的做法是依賴某一個人來處理所有事情。至少對我來說,正確的方式是擁有 15 到 20 個值得信賴的人,你相信他們每個人在特定領(lǐng)域都有獨到的見解和豐富的經(jīng)驗。你可以像“打電話求助朋友”一樣,找到在具體問題上最有經(jīng)驗的專家,而不是試圖找一個在所有方面都精通的人。
AI 革命不應(yīng)該比喻為互聯(lián)網(wǎng),而是晶體管主持人:說到艱難的決策,我想談?wù)劙雽?dǎo)體供應(yīng)鏈。你現(xiàn)在對半導(dǎo)體供應(yīng)鏈的擔(dān)憂程度如何?
Sam Altman:我不太清楚該如何量化這種擔(dān)憂。當(dāng)然是會擔(dān)心的。這可能不是...好吧,我可以這樣說:它不是我最擔(dān)心的問題,但確實位列所有憂慮的前 10%。
主持人:我能問問你最擔(dān)心的是什么嗎?我覺得問這個問題已經(jīng)超出了會惹麻煩的程度。
Sam Altman:這關(guān)系到我們整個領(lǐng)域正在嘗試做的事情的普遍復(fù)雜性。這感覺像是一個……我認(rèn)為最終一切都會沒問題,但確實是一個極其復(fù)雜的系統(tǒng)。而且,這種復(fù)雜性現(xiàn)在在每個層面都呈現(xiàn)出瘋狂的狀態(tài)。你可以說這種情況在 OpenAI 內(nèi)部也存在,在任何一個團隊內(nèi)部也是如此。
舉個例子,既然你剛才談到半導(dǎo)體:你必須在電力供應(yīng)、網(wǎng)絡(luò)架構(gòu)決策、及時獲取足夠芯片等方面取得平衡,還要考慮可能出現(xiàn)的各種風(fēng)險,同時確保研究進度能夠及時跟上,這樣你就不會完全措手不及,或者最終得到一個無法充分利用的系統(tǒng)。還要有合適的產(chǎn)品能夠利用這些研究成果,進而支付這個系統(tǒng)令人瞠目結(jié)舌的成本。
說“供應(yīng)鏈”可能讓它聽起來太像一個簡單的管道系統(tǒng)了。整個生態(tài)系統(tǒng)在每個層面的復(fù)雜性,就像是分形一樣,是我在任何行業(yè)都未曾見過的。某種程度上說,這可能是我最擔(dān)心的問題。
主持人:你說“前所未見”。很多人把這波浪潮比作互聯(lián)網(wǎng)泡沫時期,就熱情和興奮程度而言。我認(rèn)為不同的是人們投入的資金規(guī)模。甲骨文創(chuàng)始人 Larry Ellison 曾說,要進入基礎(chǔ)模型競賽,起步就需要 1000 億美元。你同意這個說法嗎?當(dāng)你看到這個數(shù)字時,你覺得這說得通嗎?
Sam Altman:不,我認(rèn)為實際所需資金會比這少。但這里有一個有趣的觀點:每個人都喜歡用之前的技術(shù)革命來類比,試圖將新技術(shù)革命放在一個更熟悉的背景下理解。首先,我認(rèn)為總的來說這是一個不太好的習(xí)慣,盡管我理解為什么人們會這樣做。其次,我認(rèn)為人們選擇用來類比 AI 的例子往往都不太恰當(dāng)。
互聯(lián)網(wǎng)顯然與 AI 有很大的不同。你提到了這一點,比如說成本問題,不管是需要 100 億還是 1000 億美元才能具有競爭力。互聯(lián)網(wǎng)革命的一個顯著特征是入門門檻其實很低,F(xiàn)在,還有一點更接近互聯(lián)網(wǎng)的是,對于許多公司來說,這只會像是互聯(lián)網(wǎng)的延續(xù)。就像是別人制造這些 AI 模型,你可以用它們來構(gòu)建各種精彩的產(chǎn)品。它就像是構(gòu)建技術(shù)的一個新的基礎(chǔ)要素。但如果你試圖構(gòu)建 AI 本身,那就是完全不同的故事了。
人們使用的另一個例子是電力,我認(rèn)為這個比喻因為很多原因都不太恰當(dāng)。我最喜歡的類比,盡管我之前說過不應(yīng)該過度使用這些比喻,是晶體管。它是物理學(xué)上的一個全新發(fā)現(xiàn),具有令人難以置信的擴展性,并且迅速滲透到了各個領(lǐng)域。
我們以前有摩爾定律這樣的規(guī)律,現(xiàn)在我們可以想象一系列關(guān)于 AI 的定律,告訴我們它會以怎樣的速度變得更好。整個科技行業(yè)都從中受益。在你使用的產(chǎn)品和服務(wù)中都包含著大量的晶體管技術(shù),但你不會把這些公司看作是“晶體管公司”。這背后有著極其復(fù)雜且昂貴的工業(yè)流程,以及龐大的供應(yīng)鏈體系;谶@個看似簡單的物理發(fā)現(xiàn),帶來了驚人的進步,為整個經(jīng)濟帶來了長期的巨大提升。盡管大多數(shù)時候你都不會去想它,你不會說“哦,這是一個晶體管產(chǎn)品”。它就像是,好吧,這個東西可以為我處理信息。你甚至不會去思考這一點,這已經(jīng)成為理所當(dāng)然的事情。
社會本身的變化程度可能會出人意料地小主持人:接下來我想和你玩?zhèn)快問快答的游戲,請你直接給出下意識的答案。
如果你現(xiàn)在是一個 23、24 歲的年輕人,擁有如今的基礎(chǔ)設(shè)施,你會選擇構(gòu)建什么?
Sam Altman:我會選擇某個由 AI 賦能的垂直領(lǐng)域。我想用教育輔導(dǎo)作為例子,可能是打造最好的 AI 輔導(dǎo)產(chǎn)品,或者是我能想象到的最出色的教學(xué)系統(tǒng)。類似的領(lǐng)域都可以,可以是 AI 律師,可以是 AI CAD 工程師,或者其他類似的方向。
主持人:你以前提到過寫書的計劃。你打算給這本書起什么名字?
Sam Altman:我還沒有想好具體的書名。除了覺得這樣一本書應(yīng)該存在,因為它能幫助釋放很多人的潛能之外,我還沒有深入思考過這本書的其他細節(jié)。所以也許會是關(guān)于人類潛能的主題。
主持人:在 AI 領(lǐng)域,有什么是目前沒人關(guān)注但每個人都應(yīng)該投入更多精力的方向?
Sam Altman:我特別期待看到,這個問題其實有很多不同的解決方案,但我想說的是某種能夠理解你整個生活的 AI。它不需要真的擁有無限的上下文理解能力,但是要有某種方式讓你能擁有一個 AI 智能體,它了解關(guān)于你的一切,能訪問你所有的數(shù)據(jù)等等。
主持人:在過去的一個月里,有什么事情讓你特別驚訝的嗎?
Sam Altman:是一個我現(xiàn)在還不能討論的研究成果,但它確實令人驚嘆。
主持人:你最尊重哪個競爭對手?為什么是他們?
Sam Altman:說實話,我現(xiàn)在基本上尊重這個領(lǐng)域的每一個參與者。我認(rèn)為整個領(lǐng)域都在進行著令人驚嘆的工作,有著才華橫溢、工作極其努力的人。我不是在回避這個問題,而是我確實能在這個領(lǐng)域的各個角落看到非常有才華的人在做出色的工作。有特別突出的一個嗎?不太容易說。
主持人:告訴我,你最喜歡的 OpenAI API 是什么?
Sam Altman:我認(rèn)為新的實時 API(Real-time API)非常出色。當(dāng)然,我們現(xiàn)在已經(jīng)建立起了相當(dāng)規(guī)模的 API 業(yè)務(wù),其中有很多出色的功能。
主持人:在 AI 領(lǐng)域,你現(xiàn)在最敬佩的是誰?
Sam Altman:讓我特別表揚一下 Cursor 團隊。當(dāng)然,AI 領(lǐng)域有很多人在做著令人難以置信的工作,但我認(rèn)為 Cursor 團隊真正做到了將愿景變?yōu)楝F(xiàn)實。我本可以列舉很多值得稱贊的研究人員,但就利用 AI 來創(chuàng)造真正令人驚嘆的用戶體驗,以一種前所未有的方式創(chuàng)造價值而言,我認(rèn)為他們的成就確實非常突出。在思考這個問題時,我特意把 OpenAI 的任何人都排除在外,否則首先就會是一長串 OpenAI 的人員名單。
主持人:你如何看待延遲和準(zhǔn)確性之間的權(quán)衡?
Sam Altman:你需要一個可以在兩者之間靈活調(diào)節(jié)的機制。就像現(xiàn)在我們在做快問快答一樣,我其實回答得還不夠快,但我在努力不過分思考。在這種場景下,你需要的是低延遲。但如果你說:“嘿,Sam,我希望你能在物理學(xué)領(lǐng)域有重大發(fā)現(xiàn)”,那么你可能會很樂意等待準(zhǔn)確性再發(fā)展個幾年。關(guān)鍵是,這種權(quán)衡應(yīng)該由用戶來控制。
主持人:我想問問關(guān)于領(lǐng)導(dǎo)力中的不安全感,我認(rèn)為這是每個人都會有的感受,但我們很少談?wù)。?dāng)你思考領(lǐng)導(dǎo)力方面的不安全感,作為一個領(lǐng)導(dǎo)者你想要改進的方面,你今天最想在作為領(lǐng)導(dǎo)者和 CEO 的哪些方面有所提升?
Sam Altman:這周讓我最困擾的是,我對我們的產(chǎn)品策略細節(jié)感到比以往任何時候都更加不確定。我認(rèn)為產(chǎn)品總的來說是我的一個弱項。而現(xiàn)在公司正需要我在這方面提供更強有力和清晰的愿景。我們有一位出色的產(chǎn)品主管和一個很棒的產(chǎn)品團隊,但這是一個我希望自己能做得更好的領(lǐng)域,而且我現(xiàn)在正急切地感受到這種不足。
主持人:你招聘了 Kevin Weil 作為 CPO(首席產(chǎn)品官)。我認(rèn)識 Kevin 很多年了,他確實很出色。
Sam Altman:Kevin 太棒了。
主持人:在你看來,是什么讓 Kevin 成為一位世界級的產(chǎn)品領(lǐng)導(dǎo)者?
Sam Altman:我首先想到的詞是紀(jì)律性。
主持人:是在關(guān)注重點這方面嗎?
Sam Altman:是的,包括什么該做什么不該做、真正站在用戶角度來思考我們?yōu)槭裁匆龌虿蛔瞿臣拢约笆冀K保持嚴(yán)謹(jǐn)務(wù)實的態(tài)度,不輕易被天馬行空的想象所左右。
主持人:如果你有一根魔法棒,可以為 OpenAI 五年和十年內(nèi)的愿景描繪藍圖嗎?
Sam Altman:坦白說,我可以輕松地規(guī)劃接下來的兩年。但如果我們的判斷是正確的,如果我們開始打造的系統(tǒng)真的能在科學(xué)進步等方面發(fā)揮巨大作用……實際上,我想說的是,我認(rèn)為在五年內(nèi),我們會看到技術(shù)本身以一個令人難以置信的速度不斷進步。人們可能會說:“哇,通用人工智能的時代來了又走了,不管怎樣,這個進步的步伐簡直瘋狂! 我們在不斷發(fā)現(xiàn)新的東西,不僅是關(guān)于 AI 研究,還有其他所有科學(xué)領(lǐng)域。如果我們現(xiàn)在能坐在這里預(yù)見到那個場景,它看起來應(yīng)該會讓人覺得難以置信。
我的預(yù)測的第二個部分是,社會本身的變化程度可能會出人意料地小。舉個例子:我認(rèn)為如果你五年前問人們,計算機是否會通過圖靈測試,他們會說不可能。然后如果你說,假設(shè)有個預(yù)言家告訴你它一定會通過,他們會說,那將會給社會帶來翻天覆地的變化。而事實上,我們確實在某種程度上滿足了圖靈測試的要求,但社會并沒有發(fā)生太大的改變。這個突破就這樣悄然而過。這就是我預(yù)期會繼續(xù)發(fā)生的情況:科技進步,特別是科學(xué)進步會不斷超越所有人的預(yù)期,而社會本身則以一種我認(rèn)為是健康的方式,保持相對穩(wěn)定。當(dāng)然,從更長遠來看,變革終將到來,而且會是巨大的變革。