當(dāng)前位置：人工智能實驗室> 企業(yè)新聞 > 谷歌這一年：從恐慌到豪賭，All In AI大戰(zhàn)

谷歌這一年：從恐慌到豪賭，All In AI大戰(zhàn)
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-20 09:56:25 瀏覽：4529次

導(dǎo)讀：今年年初OpenAI的崛起令全球震驚，而微軟將ChatGPT嵌入必應(yīng)更是令谷歌倍感威脅，谷歌是如何用一年時間在AI競賽中重新站穩(wěn)腳跟？根據(jù)媒體發(fā)布的一篇文章，這家科技巨頭首先平息內(nèi)斗，合并兩大人工智能部門，其次加速研發(fā)AI模型，推出多模態(tài)模型意圖趕超OpenA...

今年年初OpenAI的崛起令全球震驚，而微軟將ChatGPT嵌入必應(yīng)更是令谷歌倍感威脅，谷歌是如何用一年時間在AI競賽中重新站穩(wěn)腳跟？

根據(jù)媒體發(fā)布的一篇文章，這家科技巨頭首先平息內(nèi)斗，合并兩大人工智能部門，其次加速研發(fā)AI模型，推出多模態(tài)模型意圖趕超OpenAI，最后憑借在芯片、模型框架等全方位布局，推出強(qiáng)大的Gemini模型開始反攻。

現(xiàn)在，谷歌走到了最困難一步將Gemini大模型整合進(jìn)旗下產(chǎn)品。

以下為華爾街見聞編譯的原文：

不管是谷歌還是其他公司，這都是一個值得回顧的時刻，他們顯然戰(zhàn)勝了那些末日論者。

上周，谷歌發(fā)布了備受期待的新人工智能模型Gemini，而在此近一年前，一些評論家曾預(yù)測OpenAI 的 ChatGPT 可能會挑戰(zhàn)谷歌在搜索領(lǐng)域的領(lǐng)導(dǎo)地位。谷歌積極應(yīng)戰(zhàn)OpenAI，領(lǐng)導(dǎo)層設(shè)法讓公司內(nèi)部相互競爭的部門開始合作，共同制定應(yīng)對方案，從而擊退了那些認(rèn)為谷歌變得過于優(yōu)柔寡斷和官僚主義的人。如今谷歌在搜索領(lǐng)域的主導(dǎo)地位依舊，就連其股票也在今年一路上漲。

現(xiàn)在艱苦的工作開始了，在接下來的幾個月里，谷歌必須證明自己能夠?qū)emini整合到旗下的產(chǎn)品中，同時又不蠶食搜索等現(xiàn)有業(yè)務(wù)份額。

該公司已經(jīng)將一個簡化版本的Gemini應(yīng)用到Bard中，該聊天機(jī)器人是該谷歌為與ChatGPT競爭而創(chuàng)建的，但迄今為止使用率似乎有限。兩位熟知內(nèi)情的人士說，未來，該公司計劃將Gemini應(yīng)用于幾乎整個產(chǎn)品線，從搜索引擎到生產(chǎn)力應(yīng)用軟件，以及Pixel設(shè)備獨有的AI助手Pixie。據(jù)一位了解內(nèi)部討論情況的人士說，產(chǎn)品還可能包括可穿戴設(shè)備，比如眼鏡，它可以利用人工智能識別佩戴者看到的物體的能力，然后該設(shè)備可以向佩戴者提供建議，比如如何使用工具、解決數(shù)學(xué)問題或演奏樂器。

谷歌在做這些事情的同時，還必須小心翼翼地與監(jiān)管機(jī)構(gòu)周旋。該公司正處于兩場關(guān)于其搜索引擎和廣告業(yè)務(wù)的反壟斷斗爭中。反壟斷官員正密切關(guān)注谷歌的人工智能工作，并將其視為谷歌如何利用在某一領(lǐng)域的優(yōu)勢在另一領(lǐng)域取勝的范例。在這種情況下，谷歌利用其搜索中的網(wǎng)站數(shù)據(jù)以及數(shù)十億客戶的數(shù)據(jù)來訓(xùn)練新的人工智能。

人工智能的成功對于谷歌的云計算業(yè)務(wù)也至關(guān)重要，對計算要求極高的人工智能模型正在激發(fā)對云服務(wù)的需求。微軟與OpenAI 建立了緊密的合作關(guān)系，其云業(yè)務(wù)的增長速度已經(jīng)超過了谷歌和亞馬遜。

雖然ChatGPT因其對話式AI而聞名，但其背后的技術(shù)已被證明在整個商業(yè)領(lǐng)域都非常有效，從自動化客戶服務(wù)和軟件編碼，到快速生成營銷方案，以及幫助華爾街公司理解大量數(shù)據(jù)。谷歌面臨的問題是，OpenAI 和微軟在向消費者和企業(yè)銷售這項技術(shù)方面已經(jīng)占得先機(jī)，為他們提供了寶貴的數(shù)據(jù)和反饋，他們可以利用這些數(shù)據(jù)和反饋來改進(jìn)產(chǎn)品。

“只有親試了之后，才能夠判定是人們能用它創(chuàng)造出什么，我們才剛剛開始看到這一點，但已經(jīng)看到的是非常了不起”，Madrona Venture Group 的合伙人Jon Turow指出，他曾在亞馬遜云計算部門負(fù)責(zé)人工智能產(chǎn)品。

Gemini是谷歌25年歷史上投入最大的努力之一，隨著谷歌步入中年，其核心廣告業(yè)務(wù)繼續(xù)創(chuàng)造巨額利潤，這也為其母公司Alphabet在自動駕駛汽車、健康保險和生物技術(shù)等新業(yè)務(wù)上的一系列押注提供了資金，但是這些下了十年的賭注都沒有得到回報。

因此，越來越多的投資者要求谷歌領(lǐng)導(dǎo)層削減18.2萬人的成本，今年的大規(guī)模裁員打擊了員工士氣。同時，谷歌正準(zhǔn)備在新的一年里進(jìn)行更多的裁員，但目前還不清楚裁員的范圍是廣泛的還是針對特定群體。

人工智能是另一個賭注，需要公司投入巨額資金，支付從人員到硬件的一切費用。一位與Gemini團(tuán)隊關(guān)系密切的人士表示，谷歌需要投入巨資來抵御人工智能團(tuán)隊向OpenAI倒戈的威脅。

谷歌還選擇了一種特別昂貴的技術(shù)方法，即設(shè)計自己的人工智能芯片。這一決定使谷歌在硬件上獨立于英偉達(dá)，后者是人工智能服務(wù)器芯片的主要供應(yīng)商。OpenAI等競爭對手依賴于英偉達(dá)和其他公司生產(chǎn)的硬件。

谷歌還希望消除人們對它的看法，即它的成果不過是靠幾十年前的創(chuàng)新成果。多年來，谷歌通過 Google Brain 和 DeepMind 兩個獨立的部門為人工智能研究投入了大量資金。谷歌甚至還發(fā)明了transformer的底層技術(shù)，該技術(shù)是OpenAI創(chuàng)建的GPT系列人工智能模型的核心。

但是，OpenAI的崛起讓人們擔(dān)心，谷歌可能會像之前的許多其他老牌科技巨頭一樣，在技術(shù)上失去領(lǐng)先地位。據(jù)一位直接了解谷歌與微軟討論情況的人士透露，在谷歌內(nèi)部，微軟在今年2月將 ChatGPT納入必應(yīng)搜索引擎，這讓谷歌的高管們尤其感到不安。

谷歌發(fā)言人未就此事發(fā)表評論。

AI部門內(nèi)斗

多年來，谷歌和 Alphabet 的首席執(zhí)行官桑達(dá)爾-皮查伊一直向同事抱怨，他無法讓旗下的兩個人工智能研究部門進(jìn)行合作。谷歌2014 年收購了DeepMind，該公司首席執(zhí)行官Demis Hassabis長期以來一直堅持獨立于母公司，他認(rèn)為這樣的安排可以讓公司更好地實現(xiàn)開發(fā)通用人工智能的目標(biāo)。

與此同時，DeepMind的姊妹部門Google Brain專注于研究如何將AI應(yīng)用于谷歌的產(chǎn)品，并孵化了機(jī)器學(xué)習(xí)領(lǐng)域的重要進(jìn)展，如transformer，這一發(fā)明為谷歌和其他公司訓(xùn)練更復(fù)雜的模型鋪平了道路。該部門由Jeff Dean領(lǐng)導(dǎo)，他是一名資深工程師，在谷歌成立初期，他的編碼工作幫助谷歌將搜索引擎擴(kuò)展到數(shù)十億用戶。

兩個部門之間的分歧很深，Google Brain的總部位于加州山景城的谷歌總部，而Hassabis和他的團(tuán)隊則在倫敦國王十字車站附近的辦公室。

一位曾在DeepMind工作過的人士說，隨著公司規(guī)模的擴(kuò)大，DeepMind不遺余力地避免與谷歌大腦合作。例如，在谷歌大腦當(dāng)時沒有主要業(yè)務(wù)的城市，如巴黎和阿爾伯塔省的埃德蒙頓等地開設(shè)辦事處。DeepMind的研究人員可以訪問Google Brain編寫的代碼，但反之不行。一些員工認(rèn)為這是 DeepMind 過度保密的表現(xiàn)，甚至在谷歌員工中也是如此。當(dāng)Hassabis想采取措施保持 DeepMind 的獨立性時，他會直接與聯(lián)合創(chuàng)始人Larry Page溝通，后者與聯(lián)合創(chuàng)始人Sergey Brin一起主導(dǎo)了收購，并擁有 Alphabet的控股權(quán)。

一位知情人士說，隨著時間的推移，Hassabis希望將DeepMind 與谷歌更徹底地分開，因為他越來越擔(dān)心這家龐大的公司會如何使用這項技術(shù)，包括將其出售給軍方。他萌生了創(chuàng)建一家獨立公司的想法，該公司將擁有DeepMind 的知識產(chǎn)權(quán)。但在2021年，Hassabis告訴DeepMind的員工，在皮查伊承諾向該公司提供更多資金用于包括人工智能倫理在內(nèi)的目的后，脫離谷歌的努力已經(jīng)結(jié)束。

多年來，對資源的爭奪加劇了兩家公司之間的緊張關(guān)系。谷歌向其人工智能研究人員發(fā)放的服務(wù)器芯片數(shù)量有限。隨著全行業(yè)對人工智能的狂熱促進(jìn)了對芯片的需求，這些芯片變得更加稀缺。

與此同時，隨著谷歌高管深陷內(nèi)部政治泥潭，公司的著名人工智能研究人員也開始紛紛出走。其中一些人成立了自己的公司，他們對谷歌的官僚文化感到沮喪，因為在 OpenAI推出類似ChatGPT的服務(wù)之前，谷歌的官僚文化早已阻礙了ChatGPT的發(fā)布。還有一些人則被OpenAI收購，OpenAI是馬斯克和其他知名人士于2015年以非營利形式創(chuàng)辦的一家初創(chuàng)公司，部分原因是他們擔(dān)心谷歌將擁有人工智能的未來。OpenAI的創(chuàng)始人之一是Ilya Sutskever，他是谷歌大腦的一名重要工程師，后來領(lǐng)導(dǎo)了多項進(jìn)展，比如創(chuàng)造出可以通過推理解決未曾遇到過的問題的人工智能。

去年11月，當(dāng) OpenAI 發(fā)布 ChatGPT 時，公眾的反應(yīng)在整個谷歌引起了震動。這家400人的初創(chuàng)公司竟然擊敗了谷歌，推出了一個可以令人信服地回答各種主題問題的聊天機(jī)器人，這讓谷歌的競爭力受到了質(zhì)疑。

不過，谷歌的一些領(lǐng)導(dǎo)似乎并沒有被這個互聯(lián)網(wǎng)新寵兒嚇到。一位知情人士說，在 ChatGPT 推出幾周后的一次員工會議上，Dean在回答有關(guān)聊天機(jī)器人的問題時說，谷歌不會對其他初創(chuàng)公司的做法做出反應(yīng)。

但到了二月份，微軟宣布將在其必應(yīng)搜索引擎中應(yīng)用ChatGPT是。一些投資者認(rèn)為，聊天機(jī)器人可能會削弱谷歌在搜索領(lǐng)域的主導(dǎo)地位，這一觀點令谷歌的高管們感到危險。

思想的融合

谷歌需要做一些事情，而且要快。

于是，谷歌在短短幾個月內(nèi)拼湊出了Bard聊天機(jī)器人，并于今年3月正式發(fā)布。在谷歌內(nèi)部，這項工作引起了軒然大波，因為谷歌的一位著名研究員Jacob Devlin向皮查伊和其他高管提出了對谷歌使用 ChatGPT 的數(shù)據(jù)來訓(xùn)練人工智能模型的擔(dān)憂，隨后他辭職了。他立即加入了 OpenAI，但僅僅幾個月后，他又回到了谷歌，原因不得而知。

谷歌的另一個回應(yīng)是最終結(jié)束了DeepMind和Google Brain之間的內(nèi)斗。谷歌從這兩個團(tuán)隊中選拔研究人員，建立了一個新的模型：Gemini模型由Dean和DeepMind高級研究員Oriol Vinyals領(lǐng)導(dǎo)，后者曾與Dean在大腦共事。

今年4月，谷歌宣布合并Google Brain和DeepMind。Hassabis接管了新實體--谷歌 DeepMind，而Dean則退居二線，成為谷歌的首席科學(xué)家。這一舉動讓許多谷歌工程師感到震驚，他們認(rèn)為，鑒于Dean的成就和在公司工作已久，他本應(yīng)成為該部門的領(lǐng)導(dǎo)者。

領(lǐng)導(dǎo)者們試圖把合并說成是合并后部門的勝利，Google Brain負(fù)責(zé)研究的副總裁Zoubin Ghahramani訪問了 DeepMind 的倫敦辦公室，在宣布變革的那一周召開的全體會議上向員工解釋了重組的原因。Google Brain為自己的員工單獨召開了一次會議。Hassabis告訴員工們，谷歌DeepMind將匯集世界上最好的兩個人工智能研究團(tuán)隊。

但谷歌的人工智能員工很快就意識到，工作重點也在發(fā)生變化。谷歌DeepMind的領(lǐng)導(dǎo)層縮減了對打造有競爭力的人工智能產(chǎn)品并不重要的研究項目。這些人說，失去資源的項目包括一個名為Gato的多模態(tài)模型以及一個名為GenRL的研究團(tuán)隊，該團(tuán)隊建立的人工智能系統(tǒng)能夠在虛擬環(huán)境中導(dǎo)航，就像雅達(dá)利游戲中的虛擬環(huán)境一樣。

高管們說，這些變化還有一個額外的好處，減少工作重疊，削減優(yōu)先級較低的項目，意味著員工們不必再為獲得用于研究的芯片而爭得頭破血流。

在山景城，分布在公司園區(qū)多棟大樓的人工智能員工搬到了位于園區(qū)中心的一間辦公室，目的是加強(qiáng)研究人員之間的合作。

隨著OpenAI爆炸性崛起的沖擊逐漸消退，谷歌終于迎來了反擊的機(jī)會。

“秘密武器”

盡管如此，谷歌仍然面臨著一個巨大的挑戰(zhàn)：建立一個表現(xiàn)優(yōu)于OpenAI最先進(jìn)模型GPT-4的模型。

從一開始，這就意味著研究人員必須在最后期限前完成模型開發(fā)。為了在緊迫的時間內(nèi)完成任務(wù)，員工們不分晝夜地工作，這種自上而下的工作方式與谷歌以往對研究實驗室放手不管的做法大相徑庭。一位與這項工作關(guān)系密切的人士說，一些員工每周工作80小時已成為常態(tài)。

即使在公司的人工智能之外，谷歌員工也被要求迅速掌握這項技術(shù)。據(jù)兩位知情人士透露，在這一年里，谷歌云要求員工通過人工智能方面的測試，并為銷售等非技術(shù)崗位的員工提供額外的材料，從而推動員工提高人工智能知識水平。

谷歌的目標(biāo)是通過賦予Gemini理解各種不同媒體（包括文本、圖像、視頻和音頻）的能力，從而較OpenAI更有優(yōu)勢，例如，人工智能可以用通俗易懂的英語解釋和說明復(fù)雜圖表的內(nèi)容。皮查伊后來說，Gemini將從頭開始根據(jù)這些類型的數(shù)據(jù)進(jìn)行訓(xùn)練。皮查伊很清楚，今年3 月，OpenAI 曾宣布為GPT-4 提供類似的圖像識別功能，但最初并沒有廣泛提供這些功能。這讓谷歌有機(jī)會在 OpenAI 發(fā)布之前，通過Gemini發(fā)布一套廣泛的多模態(tài)模式。

谷歌還有一個秘密武器：YouTube。兩位熟知內(nèi)情的人士說，谷歌研究人員在很大程度上依賴于谷歌擁有的流媒體服務(wù)，這些數(shù)據(jù)包括圖像、視頻和音頻字幕文本，對于訓(xùn)練人工智能模型非常寶貴。

這讓谷歌獲得了比OpenAI和AI圖像初創(chuàng)公司Midjourney等競爭對手豐富得多的信息庫。這些人說，這也意味著谷歌必須滿足法律部門的要求，比如確保如果YouTube用戶刪除了視頻，谷歌也會從其模型使用的數(shù)據(jù)集中刪除該內(nèi)容。

谷歌的另一個優(yōu)勢是計算能力，與依賴微軟服務(wù)器的OpenAI 不同，谷歌擁有自己的數(shù)據(jù)中心。為了更高效地運行軟件，谷歌甚至打造了自己的專用人工智能芯片張量處理單元（TPU）。谷歌為 Gemini計劃積累了數(shù)量驚人的芯片--7.7 萬個代號為Pufferfish的第四代張量處理單元。第三季度，谷歌未分配的企業(yè)成本（包括在 DeepMind 上的支出）猛增近 40%，達(dá)到16億美元。

當(dāng)倫敦的員工結(jié)束一天的工作，而山景城的員工開始一天的工作時，Gemini的領(lǐng)導(dǎo)者通過每天與監(jiān)督項目部分工作的員工舉行會議，隨時了解研究人員的進(jìn)展情況。一位人士說，主持會議的有Dean、Vinyals和研究副總裁Koray Kavukcuoglu。

高級管理人員也在戰(zhàn)壕里工作，Dean率先改進(jìn)軟件，幫助公司的算法處理海量數(shù)據(jù)。聯(lián)合創(chuàng)始人Sergey Brin曾因辦公室戀情丑聞而與谷歌保持距離，但他在山景城與Gemini研究人員并肩工作，定期在公司食堂與他們共進(jìn)午餐。

一路上也有一些尷尬的時刻，在今年 2 月為 Bard 公司做的一次演示中，聊天機(jī)器人在詹姆斯-韋伯太空望遠(yuǎn)鏡的問題上犯了一個事實錯誤，這讓正努力追趕 OpenAI 的谷歌十分尷尬。兩天后，當(dāng)這個錯誤廣為人知時，谷歌股價下跌了 9%。

今年 5 月，谷歌在年度開發(fā)者大會上的一次演講中首次披露了Gemini的存在，華爾街對此印象深刻：公司股價當(dāng)天躍升了 4% 以上。

蓄力趕超

在接下來的幾個月里，谷歌逐漸接近發(fā)布 Gemini，9 月份谷歌讓一些開發(fā)人員使用了較小版本的Gemini進(jìn)行測試。

但就在同一個月，OpenAI推出了GPT-4 with Vision，在多模態(tài)功能上擊敗了谷歌，這也為其技術(shù)帶來了更多的關(guān)注，同時也帶來了新的業(yè)務(wù)。一位與該團(tuán)隊關(guān)系密切的人士說，消費者對 Bard 的使用讓團(tuán)隊內(nèi)部的一些高管感到失望。就在微軟宣布其 Azure 云計算部門收入增長 29%，令人印象深刻的同一天，谷歌在10月份披露其云計算部門第三季度收入增長乏力，僅為 22%。這只會增加Gemini團(tuán)隊的壓力，迫使他們拿出大手筆。

然后，大約在11月，在對新產(chǎn)品進(jìn)行行政審查時，本應(yīng)與GPT-4 競爭的最先進(jìn)的Gemini模型在英語以外的語言中難以正常工作。

讓谷歌稍感安心的是，OpenAI 也在處理自己的問題。2023 年中期OpenAI廢棄了一個名為 Arrakis 的重要新模型，因為它在訓(xùn)練中表現(xiàn)不佳。11月底，OpenAI 董事會解雇了首席執(zhí)行官Sam Altman，OpenAI 幾近崩潰。Altman在這一事件后重返OpenAI，似乎暫時穩(wěn)住了這艘船。

最后，在12月初，谷歌拉開了 Gemini 的帷幕。它公布的測試結(jié)果顯示，性能最強(qiáng)的版本 Gemini Ultra 在多項行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測試中的表現(xiàn)優(yōu)于 GPT-4，盡管許多研究人員對這些說法提出了質(zhì)疑。谷歌公司自己也承認(rèn)，該視頻夸大了Gemini的功能。該視頻的發(fā)布讓公司一些事先沒有看過視頻的普通員工感到沮喪，但一連串的聲明傳遞了一個強(qiáng)烈的信息：谷歌已經(jīng)做好了競爭的準(zhǔn)備。

一位高管甚至發(fā)起了攻勢，抨擊微軟依賴 OpenAI 開發(fā)其尖端技術(shù)。谷歌和Alphabet 全球事務(wù)總裁Kent Walker在新聞媒體 Semafor 舉辦的一次活動上說，公司不相信“外包”人工智能開發(fā)。

現(xiàn)在，谷歌面臨的考驗是將Gemini到各個產(chǎn)品應(yīng)用中，就像微軟對 OpenAI 技術(shù)所做的那樣。但谷歌有一個對手不具備的優(yōu)勢：Pixel 硬件設(shè)備組合，包括手機(jī)、手表和耳塞，都能從人工智能中受益。其中一個版本的 Gemini 就是專門為在 Pixel 手機(jī)上運行而設(shè)計的，Pixel手機(jī)使用的是谷歌定制的人工智能芯片。

在科技公司競相將自己的硬件與新的人工智能功能整合在一起的時候，Pixel設(shè)備專用的人工智能助手的推出可能會促進(jìn)谷歌硬件業(yè)務(wù)的發(fā)展。據(jù)一位知情人士透露，Pixie 將使用客戶手機(jī)上的信息，包括來自谷歌地圖和 Gmail 等產(chǎn)品的數(shù)據(jù)，進(jìn)化成更加個性化的谷歌助手。這位知情人士稱，該功能最快將于明年在Pixel 9和9 Pro上推出。

最終，谷歌希望把這項功能帶到普通手機(jī)和手表等設(shè)備上，該公司將需要越來越先進(jìn)的機(jī)型來支持其所有的產(chǎn)品理念。不過，谷歌似乎正在抓緊時間，確保自己不會再次陷入困境。據(jù)一位熟知內(nèi)情的人士透露，谷歌已經(jīng)在訓(xùn)練下一代大模型Gemini 2。