展會(huì)信息港展會(huì)大全

AI算力大戰(zhàn)開(kāi)啟:英特爾AI芯片性能超越H100,谷歌云推出最強(qiáng)ARM芯片|鈦媒體AGI
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-10 16:43:29   瀏覽:7246次  

導(dǎo)讀:北京時(shí)間4月10日凌晨 ,美國(guó)亞利桑那州Intel Vision 2024會(huì)議上,芯片巨頭英特爾(Intel)發(fā)布性能最強(qiáng)的新一代Gaudi3 AI 加速芯片,以及全新的下一代英特爾至強(qiáng)6處理器等產(chǎn)品。 其中,英特爾Gaudi 3 AI芯片采用臺(tái)積電5nm工藝,支持128GB HBMe2內(nèi)存。相比上...

北京時(shí)間4月10日凌晨,美國(guó)亞利桑那州Intel Vision 2024會(huì)議上,芯片巨頭英特爾(Intel)發(fā)布性能最強(qiáng)的新一代Gaudi3 AI 加速芯片,以及全新的下一代英特爾至強(qiáng)6處理器等產(chǎn)品。

其中,英特爾Gaudi 3 AI芯片采用臺(tái)積電5nm工藝,支持128GB HBMe2內(nèi)存。相比上代產(chǎn)品,英特爾Gaudi 3帶來(lái)4倍(400%)的BF16 AI計(jì)算能力提升,1.5 倍的內(nèi)存帶寬以及 2 倍的網(wǎng)絡(luò)帶寬提升。同時(shí),在AI模型算力中,相比于英偉達(dá)H100 GPU,Gaudi3 AI芯片的模型訓(xùn)練速度、推理速度分別提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本僅為H100的一小部分。

英特爾預(yù)計(jì),Gaudi 3將于2024年第二季度起出貨,戴爾、惠普、聯(lián)想、超微電腦等企業(yè)將成為首批客戶。

與此同時(shí),今晨舉行的谷歌云年度大會(huì)Cloud Next 2024上宣布推出一款基于ARM架構(gòu)的服務(wù)器芯片Axion,其性能比通用ARM芯片高30%,比英特爾生產(chǎn)的x86最新芯片性能提高50%。谷歌旨在減少對(duì)英特爾和AMD x86芯片的依賴。

全球圍繞 AI 算力戰(zhàn)爭(zhēng)已經(jīng)拉開(kāi)帷幕。

“現(xiàn)在的半導(dǎo)體競(jìng)爭(zhēng)是一場(chǎng)產(chǎn)業(yè)戰(zhàn)爭(zhēng),也是一場(chǎng)全面的國(guó)家戰(zhàn)爭(zhēng)。”韓國(guó)總統(tǒng)尹錫悅4月9日宣布該國(guó)全面押注 AI 半導(dǎo)體發(fā)展,投入9.4萬(wàn)億韓元(約合500億元人民幣),以幫助韓國(guó)成為與中國(guó)、美國(guó)并駕齊驅(qū)的全球三大AI半導(dǎo)體國(guó)家之一。

英特爾突襲英偉達(dá)H100,新AI芯片訓(xùn)練快40%,推理快50%

就在深夜,英特爾CEO帕特基辛格(Pat Gelsinger)手舞足蹈地亮出了最新AI芯片Gaudi3。

新一代Gaudi 3 AI加速器專(zhuān)為高性能、高效率的生成式 AI 計(jì)算而構(gòu)建,每個(gè)加速器都具有獨(dú)特的異構(gòu)計(jì)算引擎,由 64 個(gè) AI 定制和可編程TPC和 8 個(gè) MME 組成,每個(gè)Gaudi 3 MME 都能夠執(zhí)行 64000個(gè)并行運(yùn)算,支持128 GB HBMe2 內(nèi)存容量、3.7 TB 內(nèi)存帶寬和 96 MB 板載靜態(tài)隨機(jī)存取內(nèi)存 (SRAM) 。

同時(shí),每個(gè)Gaudi 3當(dāng)中都集成24個(gè)200 Gb以太網(wǎng)端口,提供靈活且開(kāi)放標(biāo)準(zhǔn)的網(wǎng)絡(luò)。而Gaudi 3 的PCIe 功率為600w,帶寬為每秒 3.7TB。

性能方面,模型訓(xùn)練層面,Gaudi3比英偉達(dá)H100快40%;推理層面Gaudi3比英偉達(dá)H100快50%。即便相比最新英偉達(dá)H200,Gaudi3 AI芯片的推理速度竟然也提升了高達(dá)30%。

英特爾CEO帕特基辛格(Pat Gelsinger)

實(shí)際上,隨著ChatGPT爆火,AI 模型、數(shù)據(jù)、算力基礎(chǔ)設(shè)施成為生成式 AI 技術(shù)發(fā)展的三大要素。

據(jù)Gartner數(shù)據(jù)顯示,2024年,企業(yè)在生成式 AI 方向上預(yù)期支出達(dá)400億美元,到2027年這一數(shù)據(jù)增至1510億美元。與此同時(shí),到2026年,企業(yè)對(duì)生成式 AI 使用程度達(dá)80%,同時(shí)至少有50%的邊緣計(jì)算部署將與AI、機(jī)器學(xué)習(xí)(ML)等方向有關(guān)。

然而,AI 技術(shù)的全部潛力并沒(méi)有完全釋放出來(lái)。僅10%的企業(yè)組織去年推出面向生產(chǎn)的生成式 AI 方案;同時(shí),有46%的的專(zhuān)家指出,基礎(chǔ)設(shè)施是將大模型產(chǎn)品化的最大挑戰(zhàn)。

因此,英特爾希望能夠利用長(zhǎng)期的 AI 技術(shù)積累,通過(guò)開(kāi)放生態(tài)系統(tǒng)的力量,乘上 AI 熱潮。與英偉達(dá)部分類(lèi)似,英特爾也將提供一整套 AI 算力基礎(chǔ)設(shè)施方案,從而“解鎖”企業(yè) AI,推動(dòng)生成式 AI 的廣泛應(yīng)用和快速商業(yè)化,有望幫助企業(yè)應(yīng)對(duì) AI 項(xiàng)目時(shí)所面臨的挑戰(zhàn)。

基辛格在會(huì)上表示,到2030年,半導(dǎo)體市場(chǎng)規(guī)模將達(dá)1萬(wàn)億美元,而 AI 是其中的主要推動(dòng)力。

從整體路線圖來(lái)看,AI PC、Edge AI(邊緣)、Data Center AI(數(shù)據(jù)中心)將成為英特爾三大重要的計(jì)算生態(tài)系統(tǒng),比英偉達(dá)覆蓋面積更廣,加上其開(kāi)放、可擴(kuò)展的軟件和算法特性,廣泛適用于多個(gè) AI 領(lǐng)域,從而推動(dòng)英特爾持續(xù)為企業(yè)客戶打造全新 AI 方案。

具體到技術(shù)產(chǎn)品層面,除了英特爾Gaudi3之外,此次開(kāi)幕活動(dòng)上還公布了其他四個(gè)方向的重要進(jìn)展:

1、全新英特爾至強(qiáng)6處理器品牌,應(yīng)用于數(shù)據(jù)中心、云和邊緣場(chǎng)景。

其中,與第二代至強(qiáng)處理器相比,配備能效核(此前代號(hào)為Sierra Forest)的全新至強(qiáng)6處理器每瓦性能提高2.4倍,機(jī)架密度提高2.7倍,客戶能以近3:1的比例替換舊系統(tǒng),大幅降低能耗,預(yù)計(jì)將于2024年第二季度推出;而配備性能核的英特爾至強(qiáng)6處理器,可將下一個(gè)令牌(token)的延遲時(shí)間最多縮短6.5倍,能運(yùn)行700億參數(shù)的Llama2模型,預(yù)計(jì)不久后推出。

2、預(yù)覽下一代英特爾酷睿Ultra處理器。英特爾宣布將推出下一代酷睿Ultra客戶端處理器家族(代號(hào)Lunar Lake),將具備超過(guò)100 TOPS平臺(tái)算力,以及在神經(jīng)網(wǎng)絡(luò)處理單元(NPU)上帶來(lái)超過(guò)46 TOPS的算力,從而為下一代AI PC提供強(qiáng)大支持。據(jù)悉,英特爾預(yù)計(jì)將于2024年出貨4000萬(wàn)臺(tái)AI PC設(shè)備。

3、面向網(wǎng)絡(luò)互連層面的新品部署。與NVLink一樣重要,通過(guò)超以太網(wǎng)聯(lián)盟(UEC),英特爾公布面向AI高速互聯(lián)技術(shù)(AI Fabrics)開(kāi)放技術(shù)的以太網(wǎng)解決方案,利用高速互聯(lián)技術(shù)支持AI模型訓(xùn)練和推理,產(chǎn)品組合包括英特爾AI網(wǎng)絡(luò)連接卡(AI NIC)、集成到XPU的AI連接芯粒(Chiplet)、基于Gaudi加速器的系統(tǒng),以及一系列面向英特爾代工的AI互聯(lián)軟硬件參考設(shè)計(jì)。

4、全面更新的邊緣計(jì)算和Tiber業(yè)務(wù)組合。英特爾還發(fā)布新的Edge芯片產(chǎn)品,包括酷睿TM Ultra、酷睿TM、凌動(dòng)處理器以及面向Edge的英特爾ArcTM GPU,預(yù)計(jì)所有新品將于本季度上市,應(yīng)用于包括零售、工業(yè)制造、醫(yī)療保健等關(guān)鍵領(lǐng)域,并將于今年獲得英特爾Tiber邊緣平臺(tái)的支持。另外,英特爾還發(fā)布Tiber業(yè)務(wù)解決方案組合,以簡(jiǎn)化企業(yè)對(duì)生成式 AI 軟件服務(wù)的部署工作,預(yù)計(jì)Tiber方案將于今年第三季度全面推出。

英特爾披露,截至目前,英特爾邊緣計(jì)算處理器銷(xiāo)量達(dá)2億塊,已邊緣部署超過(guò)9萬(wàn)個(gè)解決方案。

另外,英特爾還宣布聯(lián)合Hugging Face、RedHat、SAP、VMware等15家公司,將共同創(chuàng)建一個(gè)開(kāi)放、多供應(yīng)商的生成式AI系統(tǒng)平臺(tái),通過(guò)RAG(檢索增強(qiáng)生成)技術(shù),提供運(yùn)行大量現(xiàn)存專(zhuān)有數(shù)據(jù)源得到增強(qiáng)版開(kāi)放大模型。

英特爾強(qiáng)調(diào),公司不僅將提供包括硬件、軟件、框架和工具,而且希望設(shè)備制造商、數(shù)據(jù)庫(kù)提供商、系統(tǒng)集成商、軟件和服務(wù)提供商等參與其中,推動(dòng)英特爾AI開(kāi)放生態(tài)系統(tǒng)的構(gòu)建,以及將生成式AI技術(shù)進(jìn)行場(chǎng)景落地。

總體來(lái)說(shuō),基于英特爾5nm Gaudi3 AI芯片,以及至強(qiáng)6處理器和軟件棧,該公司正逐步構(gòu)建 AI 領(lǐng)域的算力基礎(chǔ)設(shè)施生態(tài),全面挑戰(zhàn)英偉達(dá)以及現(xiàn)有 AI 芯片市場(chǎng)格局。

英特爾方面去年7月對(duì)鈦媒體App表示,市場(chǎng)需要替代品。客戶非常歡迎英特爾Gaudi方案在向大眾部署 AI 方面發(fā)揮重要的領(lǐng)導(dǎo)作用。“幾十年來(lái),英特爾一直致力于把新的技術(shù)普及、普惠到各行各業(yè)。通過(guò)降低進(jìn)入門(mén)檻,提高市場(chǎng)參與度,從而加快創(chuàng)新速度。”

基辛格在會(huì)上強(qiáng)調(diào),“創(chuàng)新技術(shù)正在以前所未有的速度發(fā)展,每家公司都在加速成為AI公司,這一切都需要半導(dǎo)體技術(shù)提供支持。從PC到數(shù)據(jù)中心再到邊緣,英特爾正在讓AI走進(jìn)千行百業(yè)。”

為減少對(duì)英偉達(dá)依賴,谷歌推出ARM服務(wù)器芯片

與微軟、亞馬遜一樣,谷歌也推出了多款自研芯片,以減少對(duì)英偉達(dá)GPU芯片的依賴。

美東時(shí)間4月9日周二,谷歌在今年的年度云計(jì)算大會(huì)Cloud Next 2024上宣布推出一款基于Arm架構(gòu)的數(shù)據(jù)中心芯片Google Axion,以及更新TPU v5p芯片。

谷歌表示表示,Google Axion處理器基于Arm Neoverse V2 CPU構(gòu)建,以Titanium為基礎(chǔ),性能比通用ARM芯片高30%,而且比英特爾生產(chǎn)的當(dāng)前一代 x86芯片高50%。預(yù)計(jì)Axion用于多種谷歌服務(wù),并在“今年晚些時(shí)候”向公眾開(kāi)放。

谷歌云副總裁兼計(jì)算和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施總經(jīng)理 Mark Lohmeyer 表示:“我們正在讓客戶輕松地將現(xiàn)有工作負(fù)載轉(zhuǎn)移到 ARM。Axion 建立在開(kāi)放基礎(chǔ)之上,在任何地方使用ARM的客戶都可以輕松采用 Axion,而無(wú)需重新架構(gòu)或重新編寫(xiě)應(yīng)用程序。”

“谷歌推出的新型 Axion CPU 標(biāo)志著交付定制芯片的一個(gè)重要里程碑,該芯片針對(duì)谷歌的基礎(chǔ)設(shè)施進(jìn)行了優(yōu)化,并構(gòu)建在我們的高性能 Arm Neoverse V2 平臺(tái)上。數(shù)十年的生態(tài)系統(tǒng)投資,再加上 Google 的持續(xù)創(chuàng)新和開(kāi)源軟件貢獻(xiàn),確保為在各地運(yùn)行 Arm 的客戶最重要的工作負(fù)載提供最佳體驗(yàn)。”Arm 首席執(zhí)行官 Rene Haas表示。

事實(shí)上,Axion 只是眾多定制發(fā)一份芯片中的最新產(chǎn)品。自2015年以來(lái),谷歌已經(jīng)發(fā)布了五代張量處理單元(TPU);同時(shí),2018年,谷歌發(fā)布了第一個(gè)視頻編碼單元 (VCU),視頻轉(zhuǎn)碼效率提高了33 倍;另外,2021年,谷歌通過(guò)投資“片上系統(tǒng)”(SoC) 設(shè)計(jì),加大了定制計(jì)算的投入,并發(fā)布了用于移動(dòng)設(shè)備的三代Tensor芯片中的第一款。

如今,谷歌推出新的芯片意味著,該公司正在追趕亞馬遜和微軟這些云領(lǐng)域競(jìng)爭(zhēng)對(duì)手的步伐。亞馬遜和微軟2021年就已經(jīng)推出Arm架構(gòu)的CPU,作為提供差異化計(jì)算服務(wù)的一種方式。而谷歌之前為YouTube、AI及其智能手機(jī)推出過(guò)定制芯片,但還沒(méi)有打造過(guò)CPU。

具體來(lái)說(shuō),Axion將適用于一系列任務(wù),包括支持谷歌的搜索引擎和 AI 相關(guān)的工作。谷歌表示,該芯片可以通過(guò)幫助處理大量數(shù)據(jù)并為數(shù)十億用戶部署服務(wù),在AI領(lǐng)域發(fā)揮重要的支持作用。同時(shí),未來(lái)谷歌逐步轉(zhuǎn)移到基于Arm云服務(wù)器用例上使用,Datadog、Elastic、OpenX 和 Snap都計(jì)劃采用 Axion。

除了Axion之外,谷歌還宣布全面推出 TPU v5p,用于訓(xùn)練和推理的最強(qiáng)大、可擴(kuò)展且靈活的 AI 加速器,其計(jì)算能力是上一代的 4 倍(400%)。

谷歌CEO桑達(dá)爾皮查伊表示,生成式 AI的進(jìn)步需要強(qiáng)大的底層基礎(chǔ)設(shè)施。谷歌 AI 超級(jí)計(jì)算機(jī)結(jié)合了我們的 TPU、GPU、AI 軟件等,為訓(xùn)練和服務(wù)模型提供性能和成本優(yōu)勢(shì)。如今,領(lǐng)先 AI 公司和 Google Cloud 客戶(例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI)正在使用其基礎(chǔ)設(shè)施。

數(shù)據(jù)顯示,雖然廣告依然是谷歌最大收入源,但云計(jì)算的增長(zhǎng)更快,在谷歌的收入中占比不斷提高,已接近占公司總收入的11%。據(jù)Gartner估算,2022 年,谷歌占云基礎(chǔ)設(shè)施市場(chǎng) 7.5% 的份額,而亞馬遜和微軟合計(jì)控制著 62% 左右的份額。

谷歌表示,現(xiàn)在已經(jīng)有超過(guò) 90% 的 AI 獨(dú)角獸企業(yè)在使用谷歌的計(jì)算資源、模型和開(kāi)發(fā)環(huán)境。

如今,谷歌成為繼微軟和亞馬遜之后,第三家用ARM架構(gòu)推出數(shù)據(jù)中心CPU的科技巨頭,這顯示了新的趨勢(shì)。而且,谷歌還利用TPU優(yōu)勢(shì),全面提供服務(wù)器和數(shù)據(jù)中心閉環(huán)服務(wù),降低英偉達(dá)、英特爾、AMD芯片的依賴。

有評(píng)論稱(chēng),谷歌開(kāi)發(fā)新芯片是在 AI 競(jìng)賽白熱化之際減少對(duì)外部廠商的依賴。不過(guò),谷歌的官員并沒(méi)有將芯片新品視為一種競(jìng)爭(zhēng)之舉。谷歌負(fù)責(zé)自研芯片業(yè)務(wù)的副總Amin Vahdat說(shuō):“我覺(jué)得這是做大蛋糕的基矗”

從整體來(lái)說(shuō),Google Next 2024上展現(xiàn)了整個(gè)谷歌云構(gòu)建的 AI 開(kāi)放和垂直優(yōu)化技術(shù)棧。

AI Hypercomputer (算力層):TPU v5,Axion,2025年將上線的英偉達(dá)Blackwell GB200,以及新增 A3 Mega 計(jì)算單元。Gemini Models(模型層):今天谷歌正式開(kāi)發(fā) Gemini 1.5 Pro API,新增語(yǔ)音模態(tài)理解能力、文件訪問(wèn) API、系統(tǒng)指令以及 JSON 模式等功能。Vertex AI(容器環(huán)境層):最方便的 AI 應(yīng)用開(kāi)發(fā)和運(yùn)行環(huán)境,集成了除 OpenAI 之外的所有模型,方便調(diào)用、微調(diào)和各種開(kāi)發(fā)測(cè)試。應(yīng)用層:谷歌提供Gemini for Cloud、Workspace & Agent等產(chǎn)品組合中,即Gemini AI 產(chǎn)品將全面集成到 Cloud 與 Workspace 兩大產(chǎn)品線,而且還預(yù)開(kāi)發(fā)了一堆 AI Agent(代理),支持客服、雇員、創(chuàng)意、代碼、數(shù)據(jù)、安全代理等等。

英偉達(dá)真的危險(xiǎn)了嗎?黃仁勛:依然很穩(wěn)

那么,前有谷歌、微軟、亞馬遜“造芯”,后有英特爾“彎道超車(chē)”,英偉達(dá)真的危險(xiǎn)了嗎?

2023年12月初,AMD高調(diào)推出了MI300系列產(chǎn)品。據(jù)介紹,MI300X芯片擁有超過(guò)1500億個(gè)晶體管,內(nèi)存密度是目前英偉達(dá)H100的2.4倍,內(nèi)存帶寬是其1.6倍。AMD首席執(zhí)行官蘇姿豐稱(chēng),這款新芯片在訓(xùn)練 AI 軟件的能力方面與英偉達(dá)的H100相當(dāng),并且在推理方面表現(xiàn)得更好,不過(guò)這一說(shuō)法也未得到獨(dú)立驗(yàn)證。

今年3月底,英偉達(dá)正式發(fā)布了新一代人工智能計(jì)算芯片B200。英偉達(dá)CEO黃仁勛表示,B200 GPU的AI運(yùn)算性能在FP8及新的FP6上都可達(dá)20 petaflops,是前一代H100運(yùn)算性能的2.5倍。

如今,隨著Gaudi 3的正式發(fā)布,當(dāng)前AI芯片市場(chǎng)呈現(xiàn)出英偉達(dá)B200、AMD MI300系列和英特爾Gaudi 3"三巨頭"競(jìng)爭(zhēng)的格局。英偉達(dá)在AI芯片領(lǐng)域"一家獨(dú)大"的局面面臨來(lái)自另外兩家廠商的挑戰(zhàn)。

不過(guò),從黃仁勛角度來(lái)看,英偉達(dá)的生態(tài)系統(tǒng)很穩(wěn)定,在當(dāng)前AI算力"軍備競(jìng)賽"中,英偉達(dá)依舊暫時(shí)是市場(chǎng)的佼佼者。

黃仁勛前段時(shí)間這段話其實(shí)表達(dá)的非常明確:“數(shù)據(jù)中心需要你運(yùn)營(yíng)它。購(gòu)買(mǎi)和銷(xiāo)售芯片的人考慮的是芯片價(jià)格。運(yùn)營(yíng)數(shù)據(jù)中心的人考慮的是成本,我們總擁有成本(TCO)非常好。即使競(jìng)爭(zhēng)對(duì)手芯片是免費(fèi)的,他們也不如我們,客戶也不會(huì)買(mǎi)。我們的目標(biāo)是增加更多的價(jià)值。但這背后需要很多努力,我們必須不斷創(chuàng)新、我們不能把任何事情視為理所當(dāng)然、我們有很多競(jìng)爭(zhēng)對(duì)手。”

事實(shí)上,AI 芯片是一個(gè)不斷向前“奔跑”的高技術(shù)行業(yè)。它沒(méi)有壟斷,只有不斷創(chuàng)新提供更大價(jià)值,才有可能讓企業(yè)持續(xù)保持領(lǐng)先地位。因此,無(wú)論是英偉達(dá)還是英特爾,他們都有非常強(qiáng)大的市場(chǎng)競(jìng)爭(zhēng)力,也都有望成為 AI 加速計(jì)算市場(chǎng)的“領(lǐng)先者”。

如今,在服務(wù)器市場(chǎng),AMD正在逐漸蠶食該公司的市場(chǎng)份額。據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)Mercury Research所公布的2023年第四季度AMD處理器市場(chǎng)份額統(tǒng)計(jì)數(shù)據(jù),AMD EPYC已經(jīng)拿下了23.1%服務(wù)器市場(chǎng)份額,份額占比再次擴(kuò)大。盡管EPYC作為通用處理器,算力上不如GPU加速器,不過(guò)該產(chǎn)品可與GPU加速器、AI加速器等協(xié)同工作,實(shí)現(xiàn)效率的最大化。

而全新英特爾 AI 芯片Gaudi,預(yù)計(jì)將不太會(huì)在中國(guó)大陸市場(chǎng)銷(xiāo)售。但從全球來(lái)看,它是否真的能如其所言的,憑借性能優(yōu)勢(shì)、極具競(jìng)爭(zhēng)力定價(jià)優(yōu)勢(shì)而占領(lǐng)更大的市場(chǎng)份額,一切還有待時(shí)間的檢測(cè)。

(本文首發(fā)鈦媒體App,作者|林志佳)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港