展會信息港展會大全

英特爾推定制版AI芯片,中國客戶會買單嗎?|焦點分析
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-13 09:45:54   瀏覽:5803次  

導(dǎo)讀:作者 |楊逍 采訪 |周鑫雨 楊逍 編輯 |鄧詠儀 蘇建勛 英特爾正對人工智能市場發(fā)起猛烈進攻。 7月11日,英特爾召開芯片發(fā)布會,針對中國市場推出高端AI處理器Gaudi 2,一款支持加速AI訓(xùn)練和推理任務(wù)的芯片。 自大模型和生成式AI興起后,尚未出現(xiàn)能與英偉達G...

作者 |楊逍

采訪 |周鑫雨 楊逍

編輯 |鄧詠儀 蘇建勛

英特爾正對人工智能市場發(fā)起猛烈進攻。

7月11日,英特爾召開芯片發(fā)布會,針對中國市場推出高端AI處理器Gaudi 2,一款支持加速AI訓(xùn)練和推理任務(wù)的芯片。

自大模型和生成式AI興起后,尚未出現(xiàn)能與英偉達GPU一較高下的產(chǎn)品。今年6月,AMD推出了針對AI需求的Instinct MI300,但芯片發(fā)布后,AMD股價反而下跌。

Gaudi 2的推出意味著英特爾的新一輪進攻開始。發(fā)布會上,英特爾沒有介紹Gaudi 2的具體參數(shù),但從訓(xùn)練時間、性價比、可擴展性、易用性等多個角度,將Gaudi 2和英偉達的A100、H100一一作對比,只為凸顯一個主題Gaudi 2可用,Gaudi 2具有性價比,Gaudi 2很強。

Gaudi 2出自以色列人工智能公司Habana Labs團隊,該公司在2019年被英特爾收購,之后獨立運營。

Habana Labs首席運營官Eitan Medina表示,在2023年6月的國際性AI芯片測試MLPerf上“Gaudi2是目前僅有的兩個提交GPT-3模型訓(xùn)練結(jié)果的半導(dǎo)體解決方案之一,另一個是Nvidia H100。”

發(fā)布會上,英特爾還帶來了浪潮基于Gaudi2的新一代AI服務(wù)器NF5698G7,并表示在未來,國內(nèi)的新華三、超聚變等公司也會參與合作。

英特爾的產(chǎn)品性能具體如何,市場是否會買單,中國作為最大的人工智能芯片市場,對其接受度如何呢?

比H100有性價比,比A100性能強?

自AI大模型火熱以來,英偉達一家獨大。對于英特爾在人工智能領(lǐng)域的策略,市場期待已久。

2023年年初,英特爾中國區(qū)董事長王銳就在戰(zhàn)略媒體溝通會上回應(yīng),英特爾高層正認真對待人工智能浪潮,并適時推出產(chǎn)品。

本次發(fā)布Gaudi 2芯片是由Habana團隊制作的產(chǎn)品。事實上,該芯片曾于去年在海外發(fā)布,此次發(fā)布的是針對中國市場的定制版本。

Gaudi 2采用7nm制程,有24個張量處理器核心,集成了96GB的HBM高性能存儲和48MB的SRAM靜態(tài)隨機存儲器,是專門為訓(xùn)練大語言模型而生的產(chǎn)品。

Gaudi 2產(chǎn)品性能

針對不同精度的峰值數(shù)據(jù),英特爾并未做過多介紹。Eitan Medina告訴36氪,英特爾并不希望專門比算力或者數(shù)字,而是將重心放在應(yīng)用上,“我們的產(chǎn)品和整體解決方案能為客戶提供很好的性能。”

在發(fā)布會上,Eitan Medina通過MLPerf基準測試結(jié)果來展現(xiàn)Gaudi 2的性能。MLPerf基準測試是一個專門針對AI芯片進行測評的國際測試,此前,壁仞科技就曾參與該測試,與英偉達一較高下。

MLPerf每年會進行兩次測評,在距離最近的2023年6月測評中,Gaudi 2是除了Nvidia H100以外,唯一提供了GPT-3模型訓(xùn)練結(jié)果的半導(dǎo)體解決方案。

Gaudi2與H100對比

根據(jù)英特爾提供的信息,Gaudi2的性能低于H100,但高于A100。

Gaudi2在384個加速器上訓(xùn)練GPT-3需要311分鐘,而英偉達用512個H100 GPU訓(xùn)練GPT-3的時間只需要64分鐘,也就是說,H100的性能領(lǐng)先于Gaudi2芯片3.6倍。

在8個加速器情況下,Gaudi2跑計算機視覺模型ResNet-50和Unet3D的效果不錯,和H100的差距會比運行GPT-3時小很多。

針對和H100的差距,英特爾認為,Gaudi2的優(yōu)勢在于性價比。Gaudi2服務(wù)器的成本要比H100低得多。

相較A100,Eitan Medina表示,根據(jù)MLPerf的報告,Gaudi2在每個模型上的訓(xùn)練效果都優(yōu)于A100。且Gaudi2具有成本優(yōu)勢,它運行ResNet-50的每瓦性能約是英偉達A100的2倍,運行1760億參數(shù)BLOOMZ模型的每瓦性能約達A100的1.6倍。

Gaudi2與A100性能對比

為了合規(guī),Gaudi 2與國際版存在區(qū)別。但英特爾Habana Labs首席運營官Eltan Medina告訴36氪,相比于國際版Gaudi2,中國版Gaudi 2推出的加速卡在性能上差別不會很大,只是以太網(wǎng)端口數(shù)量從24個改為21個,整體計算性能未有下降。未來,Gaudi2及下一代5nm的Gaudi3都會在合法合規(guī)的情況下繼續(xù)支持中國客戶。

目前,英特爾內(nèi)部有多款可用于人工智能市場的產(chǎn)品,如何看待不同產(chǎn)品的功能和市場?

英特爾公司執(zhí)行副總裁 數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera認為,客戶有不同的產(chǎn)品需求,中小型模型客戶可以選擇至強作推理,生成一張圖片只需要5秒鐘;而客戶做千億級新模型的訓(xùn)練需要更大算力,可以采用Gaudi芯片。

在發(fā)布會上,Sandra Rivera也對至強芯片做了介紹。在AI推理工作負載中,至強的推理性能與英偉達A100 GPU相比可超5倍,與AMD的64核EPYC CPU相比可超2倍。在執(zhí)行訓(xùn)練工作時,至強CPU的性能較英偉達A100 GPU有近3倍的性能提升,可以在幾秒鐘或幾分鐘內(nèi)完成訓(xùn)練,能降低客戶成本。

發(fā)布會上,英特爾還展示了至強芯片對于Stable Diffusion模型的生成效果。Stable Diffusion模型能夠文生圖和圖生圖,結(jié)果顯示基于至強芯片運轉(zhuǎn)后,該模型在5.34秒生成了一張圖像。

為更好抓住推理市場,英特爾正優(yōu)化基于至強的推理平臺,以便在云、網(wǎng)絡(luò)或智能邊緣部署多樣化的AI應(yīng)用程序。

英特爾Habana的GPU,客戶會買單嗎?

沒有一家AI芯片公司,愿意錯過大模型和生成式AI帶來的巨大市常

從大模型熱潮以來,國內(nèi)的GPU公司紛紛加強在生成式AI相關(guān)能力上的投入和研發(fā)。然而,至今沒有出現(xiàn)一款能和A100、H100對打的產(chǎn)品。

英特爾內(nèi)部有GPU MAX產(chǎn)品,但英特爾選擇將Habana的產(chǎn)品作為王牌推向市場,希望以此逐鹿人工智能市常

Habana可能更能給市場信心。2019年,英特爾以20億美元高價收購了以色列AI芯片制造商Habana Labs,Habana作為獨立業(yè)務(wù)部門運營,希望在數(shù)據(jù)中心AI領(lǐng)域挑戰(zhàn)英偉達。

Habana同時有面向數(shù)據(jù)中心的AI訓(xùn)練芯片Gaudi(高迪)和AI推理芯片Goya(戈雅),以及完整的SynapseAI軟件棧,且其第一代產(chǎn)品就體現(xiàn)出了能耗與時延的優(yōu)勢。

它的創(chuàng)始人Avigdo是一個技術(shù)大牛,曾成立了交換機芯片公司Galileo,后來賣給了Marvel;2011,Avigdor又成立了網(wǎng)絡(luò)智能公司Annapurna Labs,2015年以3.7億美元的價格被亞馬遜收購。

這樣的基因,讓Habana的產(chǎn)品在性能上能有所保障。不過,Habana lab被收購后,需要融合進英特爾公司,在一段時間內(nèi)后繼表現(xiàn)相對乏力。

除了硬件產(chǎn)品,另一個構(gòu)成英偉達壁壘的,是其Cuda軟件生態(tài)。英特爾的產(chǎn)品如何應(yīng)對Cuda生態(tài)?

Sandra Rivera認為,在數(shù)據(jù)中心的軟件生態(tài)中,一個是X86的軟件生態(tài),一個是CUDA。在做人工智能或者是AI運算時,大部分的開發(fā)者不會做那么底層的開發(fā),更多在PyTorch、TensorFlow上做創(chuàng)新。Gaudi2的軟件生態(tài)本身支持PyTorch、TensorFlow這兩個深度學(xué)習(xí)最常見的兩個框架,同時支持Megatron和DeepSpeed這兩個當(dāng)今在大模型當(dāng)中最主流的大模型訓(xùn)練框架。

為適配更多大模型,英特爾與專門做大模型的開源社區(qū)叫Hugging Face達成合作,可以在幾十秒時間內(nèi)調(diào)通現(xiàn)有模型。

浪潮信息AI&HPC產(chǎn)品線總經(jīng)理劉軍也在發(fā)布會上表示,“按照我們算法工程師實際使用的體驗,使用Gaudi2和在GPU上使用基本上沒有太大區(qū)別,客戶可以非常絲滑地把自己的訓(xùn)練負載運行在Gaudi2的訓(xùn)練集群上。”

浪潮信息也在會上發(fā)布了支持8顆Gaudi2深度學(xué)習(xí)加速器進行高速互連的加速的基板,新一代AI服務(wù)器NF5698G7。

浪潮AI服務(wù)器NF5698G7

英特爾還透露,Gaudi2國內(nèi)首批還將與百度智能云、紫光新華三、超聚變等公司合作。

中國有著龐大的AI計算市場,國內(nèi)大模型公司是否愿意買單?

某AI模型層創(chuàng)企的CTO告訴36氪,目前存在顧慮。“在訓(xùn)練100億參數(shù)規(guī)模模型10輪情況下,其他公司的芯片訓(xùn)練速度,普遍比A100多出10幾天,寧愿多花錢買點A100或H100,也不想耽誤訓(xùn)練的時間。而英特爾披露的信息主要宣傳在ResNet模型上的性能提高,但ResNet和Transformer類模型存在較大區(qū)別。且Gaudi2在2022年已經(jīng)發(fā)布,市場的選擇已經(jīng)說明問題。”

另一家大模型公司則表示,已與國內(nèi)GPU產(chǎn)品達成合作,如果采用英特爾的產(chǎn)品,還需要重新測試,暫時無法確定是否會采購英特爾的產(chǎn)品。

在人工智能計算市場,英偉達獨占鰲頭,要么一卡難求,要么難以購買,無論是從產(chǎn)品供應(yīng)角度,還是從能使用更優(yōu)秀產(chǎn)品,縮減與國外大模型廠商的算力支持角度,市場期待第二款A(yù)I芯片。

英特爾、AMD躍躍欲試,國內(nèi)的GPU公司也紛紛抓住訓(xùn)練市場,或通過大型集群的方式希望支持國內(nèi)公司發(fā)展。

HabanaGaudi 2是否會成為下一個A100,仍需市場的回應(yīng)。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港