展會信息港展會大全

谷歌推出其最先進AI模型Gemini,希望擊敗GPT-4
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-07 13:12:16   瀏覽:4277次  

導(dǎo)讀:谷歌宣布推出其規(guī)模最大、功能最強大的新大型語言模型Gemini,其最強大的TPUCloud TPU v5p以及來自谷歌云的人工智能超級計算機。 谷歌運行了32個完善的基準(zhǔn)測試來比較Gemini和GPT-4,從廣泛的整體測試(如多任務(wù)語言理解基準(zhǔn)測試)到比較兩個模型生成Python...

谷歌宣布推出其規(guī)模最大、功能最強大的新大型語言模型Gemini,其最強大的TPU“Cloud TPU v5p”以及來自谷歌云的人工智能超級計算機。

“谷歌運行了32個完善的基準(zhǔn)測試來比較Gemini和GPT-4,從廣泛的整體測試(如多任務(wù)語言理解基準(zhǔn)測試)到比較兩個模型生成Python代碼的能力。”谷歌DeepMind首席執(zhí)行官德米斯哈薩比斯表示,“我認(rèn)為我們在32項基準(zhǔn)中的30項中大幅領(lǐng)先。”

當(dāng)?shù)貢r間12月6日,谷歌公司宣布推出其規(guī)模最大、功能最強大的新大型語言模型Gemini,其最強大的TPU(張量處理單元)系統(tǒng)“Cloud TPU v5p”以及來自谷歌云的人工智能超級計算機。v5p是今年早些時候全面推出的Cloud TPU v5e的更新版本,谷歌承諾其速度明顯快于v4 TPU。

一年前,在人工智能開發(fā)機構(gòu)OpenAI發(fā)布聊天機器人ChatGPT后,創(chuàng)造了當(dāng)前人工智能熱潮背后大部分基礎(chǔ)技術(shù)的谷歌措手不及,一度發(fā)布了內(nèi)部“紅色警報”(red code)。一年零一周后,谷歌似乎準(zhǔn)備好了反擊。

谷歌DeepMind首席執(zhí)行官、Gemini團隊代表德米斯哈薩比斯(Demis Hassabis)在發(fā)布會上正面談及GPT-4與Gemini的對比,“我們對系統(tǒng)進行了非常徹底的分析,并進行了基準(zhǔn)測試。谷歌運行了32個完善的基準(zhǔn)測試來比較這兩個模型,從廣泛的整體測試(如多任務(wù)語言理解基準(zhǔn)測試)到比較兩個模型生成Python代碼的能力。”哈薩比斯略帶微笑地表示,“我認(rèn)為我們在32項基準(zhǔn)中的30項中大幅領(lǐng)先。”

從發(fā)布日起,Gemini可開始應(yīng)用于Bard和Pixel 8 Pro智能手機,并將很快與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。

“Gemini Pro性能優(yōu)于GPT-3.5”

大型語言模型Gemini包括一套三種不同規(guī)模的模型:Gemini Ultra是最大、功能最強大的類別,被定位為GPT-4的競爭對手;Gemini Pro是一款中端型號,能夠擊敗GPT-3.5,可擴展多種任務(wù);Gemini Nano用于特定任務(wù)和移動設(shè)備。

Gemini包括一套三種不同規(guī)模的模型。

目前,谷歌計劃通過谷歌云將Gemini授權(quán)給客戶,供他們在自己的應(yīng)用程序中使用。12月13日開始,開發(fā)者和企業(yè)客戶可以通過谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應(yīng)用程序編程接口)訪問Gemini Pro,安卓開發(fā)人員可以使用Gemini Nano完成構(gòu)建。

從發(fā)布會當(dāng)天開始,谷歌聊天機器人Bard將使用Gemini Pro來實現(xiàn)高級推理、規(guī)劃、理解和其他功能。明年初,谷歌將推出Bard Advanced,其將使用Gemini Ultra,這代表了Bard發(fā)布以來的最大更新。

從發(fā)布會當(dāng)天開始,Pixel 8 Pro手機的兩項功能將由Gemini Nano提供支持:錄音機應(yīng)用中的自動摘要功能以及Gboard鍵盤的智能回復(fù)部分。由于模型在手機中運行,因此兩者都可以離線工作,因此應(yīng)該能擁有快速且原生的體驗。谷歌表示,Nano的目標(biāo)是創(chuàng)建一個盡可能強大的Gemini版本,但同時不會占用手機的存儲空間或使處理器過熱。

據(jù)介紹,Gemini Ultra是第一個在MMLU(大規(guī)模多任務(wù)語言理解)方面超越人類專家的模型,該模型綜合使用數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)等57個科目來測試世界知識和解決問題的能力,谷歌在一篇博客文章中表示,它可以理解復(fù)雜主題中的細(xì)微差別和推理。

據(jù)哈薩比斯介紹,在對比Gemini和GPT-4的基準(zhǔn)測試中,Gemini最明顯的優(yōu)勢來自于它理解視頻和音頻并與之交互的能力。這很大程度上是設(shè)計使然:多模態(tài)在最開始就是Gemini計劃的一部分。谷歌沒有像OpenAI構(gòu)建DALLE(文生圖模型)和Whisper(語音識別模型)那樣單獨訓(xùn)練圖像和語音模型,而是從一開始就建立為一個多感官模型。

而據(jù)CNBC報道,谷歌高管們在新聞發(fā)布會上表示Gemini Pro的表現(xiàn)優(yōu)于GPT-3.5,但回避了與GPT-4相比如何的問題。對于谷歌是否計劃對Bard Advanced的訪問收費,Bard總經(jīng)理蕭茜茜(Sissie Hsiao)表示,谷歌專注于創(chuàng)造良好的體驗,目前還沒有任何相關(guān)盈利的細(xì)節(jié)。

“我們一直對非常通用的系統(tǒng)感興趣。”哈薩比斯說,他對如何混合所有這些模態(tài)特別感興趣,“從任意數(shù)量的輸入和感知中收集盡可能多的數(shù)據(jù),然后給出盡可能多的響應(yīng)。”

Gemini最基本的模型是文本輸入和文本輸出,但更強大的模型(如Gemini Ultra)可以處理圖像、視頻和音頻。哈薩比斯說,它甚至?xí)兊酶油ㄓ茫邢駝幼骱陀|摸之類更像機器人類型的東西。他認(rèn)為,隨著時間的推移,Gemini將獲得更多的感知,變得更有意識,并在這個過程中變得更加準(zhǔn)確和穩(wěn)定。“這些模型只是更好地了解周圍的世界。當(dāng)然,這些模型仍然存在幻覺,并且仍然存在偏見和其他問題。”但哈薩比斯表示,它們知道的越多,就會做得越好。

最新的演示里,Gemini能聽能說能看,還能教人類說中文。(02:35)

谷歌似乎特別將編程視為Gemini的殺手級應(yīng)用程序,它使用了一種名為AlphaCode 2的新代碼生成系統(tǒng),據(jù)稱該系統(tǒng)的性能優(yōu)于85%的編程競賽參與者,而原始AlphaCode的這一比例為50%。

谷歌首席執(zhí)行官桑達爾皮查伊(Sundar Pichai)表示,用戶會注意到模型涉及的幾乎所有方面都有所改進。

“不愿為了跟上步伐而走得太快”

值得注意的是,今年5月,包括哈薩比斯在內(nèi)的500多名著名學(xué)者和行業(yè)領(lǐng)袖簽署的一份聲明稱,“與流行病和核戰(zhàn)爭等其他社會規(guī)模風(fēng)險一樣,減輕人工智能帶來的滅絕風(fēng)險應(yīng)該成為全球優(yōu)先事項。”

在這次發(fā)布會中,哈薩比斯和皮查伊對于谷歌似乎步調(diào)緩慢的說法回應(yīng)道,他們不愿意為了跟上步伐而走得太快,“尤其是當(dāng)我們越來越接近人工智能的終極夢想‘通用人工智能’時”。“當(dāng)我們接近通用人工智能時,事情將會有所不同。”哈薩比斯說,“這是某種具有主動性的技術(shù),所以我認(rèn)為我們必須謹(jǐn)慎對待,謹(jǐn)慎但樂觀。”

谷歌表示,通過內(nèi)部和外部測試以及警示團隊(red-teaming),它一直在努力確保Gemini的安全和責(zé)任。皮查伊指出,確保數(shù)據(jù)的安全性和可靠性對于企業(yè)優(yōu)先的產(chǎn)品尤為重要,這也是大多數(shù)生成式人工智能利潤的來源。與此同時,哈薩比斯也承認(rèn),推出最先進的人工智能系統(tǒng)的風(fēng)險之一就是,它會出現(xiàn)沒人能預(yù)測到的問題和攻擊向量(attack vector)。“這就是為什么你必須釋放一些東西,去觀察和學(xué)習(xí)。”他說。

谷歌發(fā)布Gemini Ultra的速度較慢,哈薩比斯把它比作一個可控的測試版,為這個谷歌最強大、最不受約束的模型提供了一個“更安全的試驗區(qū)”。“基本上,如果Gemini有一個破壞婚姻的另類人格,谷歌會在你之前找到它。”這番話影射了此前微軟必應(yīng)聊天機器人向《紐約時報》專欄作家凱文盧斯(Kevin Roose)求婚,并試圖拆散他的婚姻。

上周,The Information報道稱,因為人工智能“無法可靠地處理一些非英語查詢”,所以谷歌原定于本周舉行的Gemini現(xiàn)場演示被無限期推遲。在回答有關(guān)外語問題的問題時,谷歌DeepMind產(chǎn)品副總裁艾力柯林斯(Eli Collins)表示:“事實上,Gemini在多語言能力方面表現(xiàn)相當(dāng)出色。”

谷歌最強TPU與AI超級計算機

與新模型一起亮相的,還有新版本的TPU芯片TPU v5p,旨在減少訓(xùn)練大語言模型相關(guān)的時間投入。TPU是谷歌為神經(jīng)網(wǎng)絡(luò)設(shè)計的專用芯片,經(jīng)過優(yōu)化可加快機器學(xué)習(xí)模型的訓(xùn)練和推斷速度,谷歌于2016年起開始推出第一代TPU。

谷歌TPU芯片參數(shù)比較。

據(jù)谷歌介紹,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,在高帶寬內(nèi)存方面提高了3倍。使用谷歌的600 GB/s芯片間互連,可以將8960個v5p加速器耦合在一個Pod(通常指一個包含多個芯片的集群或模塊)中,從而更快或更高精度地訓(xùn)練模型。作為參考,該值比TPU v5e大35倍,是TPU v4的兩倍多。

谷歌稱,TPU v5p是其迄今為止最強大的,能夠提供459 teraFLOPS(每秒可執(zhí)行459萬億次浮點運算)的bfloat16(16位浮點數(shù)格式)性能或918 teraOPS(每秒可執(zhí)行918萬億次整數(shù)運算)的Int8(執(zhí)行8位整數(shù))性能,支持95GB的高帶寬內(nèi)存,能夠以2.76 TB/s的速度傳輸數(shù)據(jù)。

谷歌表示,所有這些意味著TPU v5p可以比TPU v4更快地訓(xùn)練大型語言模型,如訓(xùn)練GPT-3(1750億參數(shù))這樣的大語言模型速度比TPU v4快2.8倍。

不過,這種更高的性能和可擴展性也是有代價的。每個TPU v5p加速器的運行費用為每小時4.2美元,而TPU v4加速器為每小時3.22美元,TPU v5e加速器每小時1.2美元。

谷歌TPU芯片訓(xùn)練大模型的參數(shù)比較。

“在我們的早期使用階段,谷歌DeepMind和谷歌Research觀察到,與我們的TPU v4芯片相比,使用TPU v5p芯片的大語言模型(LLM)訓(xùn)練工作負(fù)載的速度提高了兩倍。”谷歌DeepMind首席科學(xué)家杰夫迪恩(Jeff Dean)寫道,“對機器學(xué)習(xí)框架(JAX、PyTorch、TensorFlow)和編排工具的強大支持使我們能夠在v5p上更高效地擴展。通過第二代SparseCores,我們還看到嵌入密集型工作負(fù)載的性能有了顯著提高。TPU對于我們在Gemini等尖端模型上進行最大規(guī)模的研究和工程工作至關(guān)重要。”

除了新硬件之外,谷歌還引入了“人工智能超級計算機”的概念。谷歌云將其描述為一種超級計算架構(gòu),包括一個集成系統(tǒng),具有開放軟件、性能優(yōu)化硬件、機器學(xué)習(xí)框架和靈活的消費模型。

谷歌計算和機器學(xué)習(xí)基礎(chǔ)設(shè)施部門副總裁馬克洛邁爾(Mark Lohmeyer)在博客文章中解釋道,“傳統(tǒng)方法通常通過零碎的組件級增強來解決要求苛刻的人工智能工作負(fù)載,這可能會導(dǎo)致效率低下和瓶頸。”“相比之下,人工智能超級計算機采用系統(tǒng)級協(xié)同設(shè)計來提高人工智能訓(xùn)練、調(diào)整和服務(wù)的效率和生產(chǎn)力。”這可以理解為,與單獨看待每個部分相比,這種合并將提高生產(chǎn)力和效率。換句話說,超級計算機是一個系統(tǒng),其中任何可能導(dǎo)致性能低下的變量(硬件或軟件)都受到控制和優(yōu)化。

贊助本站

人工智能實驗室
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港