展會(huì)信息港展會(huì)大全

英偉達(dá)也在下一盤AI PC的大棋
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-16 09:16:47   瀏覽:8099次  

導(dǎo)讀:出品|虎嗅科技組 作者|齊健 編輯|王一鵬 頭圖|DALL-E 3 2023年,英偉達(dá)幾乎一整年都在關(guān)注高端顯卡、AI大模型、超級(jí)計(jì)算等數(shù)據(jù)中心業(yè)務(wù),以至于市場(chǎng)都快要忘記英偉達(dá)在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件軍火商。 事實(shí)上,在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同...

出品|虎嗅科技組

作者|齊健

編輯|王一鵬

頭圖|DALL-E 3

2023年,英偉達(dá)幾乎一整年都在關(guān)注高端顯卡、AI大模型、超級(jí)計(jì)算等數(shù)據(jù)中心業(yè)務(wù),以至于市場(chǎng)都快要忘記英偉達(dá)在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件“軍火商”。

事實(shí)上,在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同時(shí),英偉達(dá)并沒有忘本,黃仁勛早已開始盤算,如何用AI到“電競(jìng)椅和辦公桌”上去賺錢了。

在剛剛結(jié)束的2024 CES上英偉達(dá)發(fā)布了大量聚集PC端的AI應(yīng)用和GPU新品。包括GeForce RTX 40 SUPER系列顯卡,NVIDIA AI Workbench,開源庫(kù)TensorRT-LLM,以及生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù)。

一系列PC端的GPU產(chǎn)品和應(yīng)用,全部圍繞本屆CES上PC廠商們最關(guān)注的話題AIPC。然而,對(duì)于一心撲在AI上的英偉達(dá)來(lái)說(shuō),對(duì)PC用戶的“關(guān)心”,還保留了多少呢?英偉達(dá)對(duì)業(yè)界熱炒的AIPC到底是什么態(tài)度?

PC業(yè)務(wù)的前景不如數(shù)據(jù)中心

事實(shí)上,在2023年AI大模型爆發(fā)以前,英偉達(dá)最大的市場(chǎng)一直是PC端的“游戲”板塊。

英偉達(dá)從2015年開始把主營(yíng)業(yè)務(wù)分為游戲(Gaming)、企業(yè)(Enterprise)、高性能計(jì)算和云(HPC & Cloud)、自動(dòng)駕駛(Automotive)幾個(gè)板塊。也是自2015年起,超算和云,也就是未來(lái)的數(shù)據(jù)中心業(yè)務(wù),開始在英偉達(dá)的營(yíng)收中一步步走向高位。

2016年,英偉達(dá)對(duì)其業(yè)務(wù)板塊進(jìn)行了調(diào)整,去掉了Enterprise和HPC & Cloud兩個(gè)板塊,取而代之的是今天的專業(yè)可視化(Professional Visualization)和數(shù)據(jù)中心(Datacenter)。英偉達(dá)還首次單獨(dú)公布了這幾個(gè)業(yè)務(wù)板塊的營(yíng)收情況。游戲業(yè)務(wù)的目標(biāo)用戶就是個(gè)人電腦,專業(yè)可視化的用戶則多數(shù)是商業(yè)客戶使用的工作站。

2016年英偉達(dá)全年的總收入為50.10億美元。在2016年1月31日結(jié)束的財(cái)年中,英偉達(dá)的游戲業(yè)務(wù)收入為28.18億美元;專業(yè)可視化業(yè)務(wù)的收入為7.50億美元;數(shù)據(jù)中心業(yè)務(wù)的收入為3.39億美元;自動(dòng)駕駛業(yè)務(wù)收入為3.20億美元。

其中游戲業(yè)務(wù)和專業(yè)可視化分別占總收入的56.25%和14.97%,今天如日中天的數(shù)據(jù)中心,在當(dāng)時(shí)只占總收入的6.77%。

個(gè)人電腦市場(chǎng)雖然穩(wěn)定,但市場(chǎng)似乎已經(jīng)能夠看到天花板了,不僅增長(zhǎng)速度有限,且由于技術(shù)門檻不高,這一領(lǐng)域的市場(chǎng)競(jìng)爭(zhēng)也日益激烈。

2017、2018年,AI技術(shù)首次爆發(fā)。給英偉達(dá)帶來(lái)了一條新的增長(zhǎng)曲線。

2018財(cái)年,GPU加速計(jì)算對(duì)于深度學(xué)習(xí)的支持使得英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)快速增長(zhǎng),當(dāng)年數(shù)據(jù)中心業(yè)務(wù)的收入為193.2億美元,專業(yè)可視化為93.4億美元。數(shù)據(jù)中心的營(yíng)收和增幅都遠(yuǎn)超專業(yè)可視化。

數(shù)據(jù)中心業(yè)務(wù)的飛速發(fā)展,可以說(shuō)是把英偉達(dá)從傳統(tǒng)游戲硬件供應(yīng)商,帶上了多元化技術(shù)公司的軌道。

市調(diào)機(jī)構(gòu)TBRC在2024年1月發(fā)布的最新報(bào)告中預(yù)測(cè),2023年全球個(gè)人電腦市場(chǎng)規(guī)模約為2040.9億美元,預(yù)計(jì)到2024年將增長(zhǎng)到2123.8億美元,復(fù)合年增長(zhǎng)率(CAGR)為4.1%。個(gè)人電腦市場(chǎng)規(guī)模預(yù)計(jì)在未來(lái)幾年將保持增長(zhǎng)。到2028年,或?qū)⒃鲋?677.1億美元,復(fù)合年增長(zhǎng)率為6.0%。

數(shù)據(jù)中心的市場(chǎng)規(guī)模和增長(zhǎng)潛力則比個(gè)人電腦更大。2023年的全球數(shù)據(jù)中心市場(chǎng)規(guī)模約2526.8億美元,比個(gè)人電腦市場(chǎng)規(guī)模大了約20%。預(yù)計(jì)到2024年將增至2749.8億美元,復(fù)合年增長(zhǎng)率(CAGR)為8.8%。未來(lái)幾年數(shù)據(jù)中心市場(chǎng)規(guī)模的增長(zhǎng)也更為強(qiáng)勁。TBRC預(yù)計(jì),到2028年,這一市場(chǎng)的規(guī)模將增至3884.1億美元,復(fù)合年增長(zhǎng)率(CAGR)為9.0%。

相比于個(gè)人電腦業(yè)務(wù),數(shù)據(jù)中心無(wú)論是市場(chǎng)規(guī)模、市場(chǎng)競(jìng)爭(zhēng)格局,還是用戶需求、技術(shù)發(fā)展趨勢(shì),不管當(dāng)下還是未來(lái),都明顯更好做,也更賺錢。

數(shù)據(jù)中心有多賺錢?

在英偉達(dá)最新的2024財(cái)年第三季度財(cái)報(bào)中,快速上升的數(shù)據(jù)中心業(yè)務(wù)營(yíng)收1451.4億美元,占總營(yíng)收的80%,完全碾壓了英偉達(dá)在PC端的傳統(tǒng)核心業(yè)務(wù)“游戲”。對(duì)于英偉達(dá)來(lái)說(shuō),數(shù)據(jù)中心業(yè)務(wù)不管是當(dāng)下還是未來(lái),都是最能賺錢,賺錢最快,賺錢最簡(jiǎn)單的業(yè)務(wù)。

今天的技術(shù)趨勢(shì)強(qiáng)烈指向云計(jì)算、大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域,這些都是數(shù)據(jù)中心業(yè)務(wù)的關(guān)鍵驅(qū)動(dòng)力。

AI推動(dòng)著各家公司對(duì)高算力、超級(jí)算力的需求持續(xù)上漲。2023年年中,科技博客GPU Utils對(duì)GPU短缺問(wèn)題做了一次調(diào)查,博主Clay Pascal給出的調(diào)查結(jié)果稱,彼時(shí)谷歌云擁有大約2.5萬(wàn)塊H100,微軟云服務(wù)Azure可能有1萬(wàn)-4萬(wàn)塊H100,甲骨文的情況應(yīng)該類似。Azure的大部分容量都將流向OpenAI。

Clay Pascal預(yù)測(cè)對(duì)于H100的需求,OpenAI可能需要5萬(wàn)塊,Meta可能需要2.5萬(wàn)塊,大型云廠商可能每家都需要3萬(wàn)塊,加上其他一些初創(chuàng)企業(yè),可能總共需要大約43.2萬(wàn)塊H100。以每塊約3.5萬(wàn)美元計(jì)算,所需GPU的價(jià)值約為150億美元。這還不包括中國(guó)公司。

Clay Pascal在博客中寫道:我被告知,對(duì)于需要100或1000塊(英偉達(dá)GPU)H100的公司來(lái)說(shuō),Azure(微軟云服務(wù))和GCP(谷歌云服務(wù))實(shí)際上已經(jīng)沒有容量了,亞馬遜也接近沒有容量了。

研究機(jī)構(gòu)Omdia的調(diào)研結(jié)果則稱,英偉達(dá)在2023年第三季度售出了近50萬(wàn)個(gè)A100和H100 GPU,基于H100的服務(wù)器的交付周期已延長(zhǎng)至36到52周。雖然不知道目前英偉達(dá)的補(bǔ)貨情況,不過(guò)從OpenAI近期接連發(fā)生的斷網(wǎng),停賬號(hào),以及新功能升級(jí)來(lái)看,不管補(bǔ)貨能力如何,需求的巨大缺口仍在。

在巨大的需求面前,英偉達(dá)也開始了坐地起價(jià)。在芯片行業(yè)中,高端產(chǎn)品的利潤(rùn)率通常較高,不少高端產(chǎn)品的利潤(rùn)率可達(dá)50%以上。而英偉達(dá)的高端GPU利潤(rùn)率高得可怕,投資銀行Raymond James的消息稱H100 GPU的成本只有3320美元,但英偉達(dá)賣出的價(jià)格為2.5-3萬(wàn)美元,利潤(rùn)率高達(dá)1000%。

如今英偉達(dá)a100和H100服務(wù)器的價(jià)格,在國(guó)內(nèi)更是炒得離譜,2023年最后三個(gè)月,8卡H100服務(wù)器的價(jià)格上浮一度達(dá)到300萬(wàn)元人民幣。

英偉達(dá)有多需要AIPC?

數(shù)據(jù)中心這么好賺,那是否意味著英偉達(dá)會(huì)就此減弱對(duì)PC市場(chǎng)的關(guān)注呢?

短期來(lái)看恐怕還不會(huì),畢竟在過(guò)去30年里,PC一直是英偉達(dá)的主戰(zhàn)常在這里,英偉達(dá)不僅有優(yōu)勢(shì),有經(jīng)驗(yàn),更重要的是有信心。

個(gè)人電腦市場(chǎng),特別是游戲和專業(yè)圖形處理領(lǐng)域,在今天仍然是英偉達(dá)重要的收入來(lái)源。英偉達(dá)2024財(cái)年第三季度業(yè)績(jī)顯示,游戲業(yè)務(wù)營(yíng)收為285.6億美元,同比增長(zhǎng)超80%。隨著游戲行業(yè)的發(fā)展和虛擬現(xiàn)實(shí)技術(shù)的進(jìn)步,PC市場(chǎng)的增長(zhǎng)潛力仍然巨大。

另一方面,英偉達(dá)在PC市場(chǎng)上,亦處在壟斷地位。英偉達(dá)在2022年全球獨(dú)立GPU市場(chǎng)中的市占率為88%,AMD和Intel僅占8%和4%。

更重要的是,英偉達(dá)在GPU方面豐富的產(chǎn)品線,可以在PC市場(chǎng)上長(zhǎng)期發(fā)貨優(yōu)勢(shì)。英偉達(dá)提供了一系列針對(duì)不同用戶需求的GPU產(chǎn)品,包括面向游戲玩家和創(chuàng)作者的Ampere,以及面向數(shù)據(jù)中心的Hopper3。英偉達(dá)還構(gòu)建了包括驅(qū)動(dòng)程序、開發(fā)工具和應(yīng)用程序在內(nèi)的全面生態(tài)系統(tǒng)。

從目前來(lái)看如果英偉達(dá)的RTX40系列顯卡在PC上能夠支持新的AI業(yè)務(wù),那么未來(lái)仍將獨(dú)占這一百億級(jí)別的市場(chǎng),甚至通過(guò)AI技術(shù)的升級(jí),進(jìn)一步擴(kuò)大個(gè)人pc市場(chǎng)中GPU的裝機(jī)率,推動(dòng)全球市場(chǎng)規(guī)模更上一個(gè)臺(tái)階。

2023年數(shù)據(jù)中心業(yè)務(wù)的增長(zhǎng)速度驚人,與AI大模型這一新興技術(shù)的爆發(fā)密切相關(guān)。然而,AI大模型目前對(duì)全球科技市場(chǎng)來(lái)說(shuō)仍處在非常早期的階段,未來(lái)的增長(zhǎng)持續(xù)性到底如何,對(duì)云端服務(wù)器的需求如何都未可知。

而PC業(yè)務(wù),在過(guò)去30年中已經(jīng)走出了一條穩(wěn)定的增長(zhǎng)曲線。由此可想,雖然英偉達(dá)勢(shì)必會(huì)重點(diǎn)投資更有利可圖且增長(zhǎng)潛力更大的數(shù)據(jù)中心業(yè)務(wù),但一定也不會(huì)把早已站穩(wěn)腳跟的PC業(yè)務(wù)市場(chǎng)拱手讓人。

RTX 40系列的機(jī)遇和挑戰(zhàn)

AIPC概念在市場(chǎng)上被熱炒,很多廠商都在提出把AI落地到本地,從而降低云計(jì)算成本、提高安全性和響應(yīng)效率。這無(wú)疑給PC端的GPU創(chuàng)造了新的市場(chǎng)機(jī)遇。

英偉達(dá)在2024 CES上最新發(fā)布的GeForce RTX 40 SUPER系列顯卡中,GeForce RTX 4080 SUPER在AI視頻生成上比GeForce RTX 3080 Ti快1.5倍,圖片生成上快1.7倍。SUPER GPUs的Tensor Cores能夠?qū)崿F(xiàn)每秒高達(dá)836萬(wàn)億次AI運(yùn)算(TOPS),從而為游戲、創(chuàng)作和日常生產(chǎn)力帶來(lái)變革性的AI能力。

NVIDIA AI Workbench則允許開發(fā)者快速創(chuàng)建、測(cè)試和定制預(yù)訓(xùn)練的生成式AI模型和大型語(yǔ)言模型(LLM)。TensorRT-LLM是一個(gè)開源庫(kù),用于加速PC上大型語(yǔ)言模型的運(yùn)行。最新版本的TensorRT-LLM現(xiàn)已可用,它為PC增加了更多預(yù)優(yōu)化模型,與其他推理后端相比,運(yùn)行速度提高了多達(dá)5倍。

此外,英偉達(dá)還發(fā)布了生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù),使開發(fā)者能夠向游戲中添加智能、動(dòng)態(tài)的數(shù)字化角色。此外,NVIDIA還發(fā)布了“Chat with RTX”技術(shù)演示,它允許AI愛好者通過(guò)所謂的“檢索增強(qiáng)生成”(RAG)技術(shù),輕松地將PC上的大型語(yǔ)言模型(LLM)連接到自己的數(shù)據(jù)。

這些新品都針對(duì)生成式AI做了大量?jī)?yōu)化,為GPU在未來(lái)的AIPC中發(fā)力提供了機(jī)會(huì)。

有趣的是,最近有研究團(tuán)隊(duì)發(fā)現(xiàn)RTX4090在一定條件下甚至有可能替代服務(wù)器級(jí)芯片。

上海交通大學(xué)的研究團(tuán)隊(duì)就開發(fā)了一個(gè)名為PowerInfer的高性能CPU/GPU混合LLM推理引擎。這款引擎大幅降低了對(duì)GPU內(nèi)存的需求,并減少了CPU與GPU之間的數(shù)據(jù)傳輸,從而提高了整體效率?梢栽趩蝹(gè)NVIDIA RTX 4090 GPU上運(yùn)行大型語(yǔ)言模型(LLM),達(dá)到平均每秒產(chǎn)生13.20個(gè)token的速度,峰值速度更是高達(dá)29.08 tokens/s,這與頂尖的A100 GPU服務(wù)器性能相差無(wú)幾,僅低18%,適用于多種LLM應(yīng)用場(chǎng)景。

PC端GPU在AI加持下雖然機(jī)遇巨大。但在AIPC的大潮流中競(jìng)爭(zhēng)也比高端GPU更激烈。

如今,英偉達(dá)要面對(duì)的競(jìng)爭(zhēng)中已經(jīng)不只有AMD和Intel了。蘋果M系列芯片提出的統(tǒng)一內(nèi)存架構(gòu)(Unified Memory Architecture, UMA),給生成式AI的預(yù)訓(xùn)練過(guò)程提供了一種選擇。

UMA允許CPU和GPU共享相同的物理內(nèi)存,減少了數(shù)據(jù)在不同內(nèi)存之間的復(fù)制需求,提高效率。此外蘋果的硬件優(yōu)化使其設(shè)備在執(zhí)行AI相關(guān)任務(wù)時(shí)能耗更低。蘋果的硬件和軟件高度集成的特性,也為特定的AI應(yīng)用提供了更好的優(yōu)化空間。

目前,已經(jīng)有大量AI大模型開發(fā)者開始嘗試使用蘋果電腦訓(xùn)練大語(yǔ)言模型。最新款Mac Studio的頂配版本,已經(jīng)可以訓(xùn)練700億參數(shù)的LLaMA2模型。

不過(guò),雖然UMA具備諸多優(yōu)勢(shì),但它更多地集中在蘋果自己的生態(tài)系統(tǒng)內(nèi),與外部系統(tǒng)的兼容性可能有限。且相比專業(yè)的GPU,蘋果的硬件可能在處理極其復(fù)雜的AI模型時(shí)有性能瓶頸。

英偉達(dá)在AI領(lǐng)域深耕多年,擁有強(qiáng)大的技術(shù)積累和廣泛的應(yīng)用生態(tài),這些都是蘋果短時(shí)間內(nèi)難以匹敵的。盡管蘋果UMA可能在某些方面對(duì)英偉達(dá)構(gòu)成挑戰(zhàn),但英偉達(dá)的GPU在AI領(lǐng)域依然具有很強(qiáng)的競(jìng)爭(zhēng)力。

PC業(yè)務(wù)能救中國(guó)市場(chǎng)嗎?

黃仁勛在英偉達(dá)2024財(cái)年第三季度的財(cái)報(bào)電話中提到,英偉達(dá)20-25%的業(yè)務(wù)來(lái)自中國(guó),美國(guó)對(duì)中國(guó)的高端芯片制裁,將會(huì)對(duì)英偉達(dá)造成嚴(yán)重影響。

2023年8月,英國(guó)《金融時(shí)報(bào)》曾報(bào)道了一則中國(guó)云廠商搶購(gòu)英偉達(dá)高端GPU的新聞,稱百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴四家公司合計(jì)向英偉達(dá)訂購(gòu)了價(jià)值50億美元的AI芯片。而受美國(guó)制裁法案的影響,英偉達(dá)機(jī)會(huì)完全無(wú)法履行這些訂單。

為了保住中國(guó)業(yè)務(wù),英偉達(dá)再度開始積極設(shè)計(jì)3款”中國(guó)特供“芯片。

某國(guó)內(nèi)服務(wù)器制造商近期曾向虎嗅透露,芯片限制政策對(duì)國(guó)內(nèi)服務(wù)器生產(chǎn)沒有影響,因?yàn)椴还苡ミ_(dá)推出什么芯片,服務(wù)器要做的只是適配NV-Link。目前搭載新的“中國(guó)特供”芯片的服務(wù)器已經(jīng)接受了很多客戶的下單,不過(guò)受到美國(guó)政府加強(qiáng)管制的影響,原本計(jì)劃2024年1月到貨的“中國(guó)特供”,現(xiàn)在看肯定要延后了。

有消息稱,拜登政府已經(jīng)開始調(diào)查英偉達(dá)為中國(guó)開發(fā)的三款新型AI芯片的具體細(xì)節(jié)。美國(guó)商務(wù)部長(zhǎng)吉娜雷蒙多在接受外媒采訪時(shí)談道:“我們會(huì)檢查每一個(gè)新芯片的每一個(gè)規(guī)格,顯然是為了確保它不違反出口管制。”

雷蒙多說(shuō),英偉達(dá)“能夠、愿意、也應(yīng)該向中國(guó)出售AI芯片,因?yàn)榇蠖鄶?shù)AI芯片將用于商業(yè)應(yīng)用”,但“我們不能允許他們運(yùn)送最復(fù)雜、處理能力最高的AI芯片,這將使中國(guó)能夠訓(xùn)練他們的前沿模型”。她強(qiáng)調(diào)說(shuō)不能向中國(guó)企業(yè)出售其最先進(jìn)的半導(dǎo)體,并表示將不斷更新出口管制規(guī)則。

美國(guó)對(duì)中國(guó)的芯片封鎖,與其說(shuō)是在制裁中國(guó),倒不如說(shuō)是在制裁英偉達(dá)。

1月7日,美國(guó)《華爾街日?qǐng)?bào)》以“英偉達(dá)在中國(guó)的新困境,客戶不想要它的降級(jí)芯片”為題,報(bào)道了英偉達(dá)為應(yīng)對(duì)拜登政府出口限制,向中國(guó)出售降級(jí)特供版AI芯片,但中國(guó)客戶不感興趣的最新困境。

事實(shí)上,RTX40系列顯卡在中國(guó)的銷售也未必會(huì)一帆風(fēng)順,有消息稱,目前英偉達(dá)在中國(guó)可以銷售的最高端芯片為RTX 4090D,這款新芯片比RTX4090的性能低了5%左右。英偉達(dá)介紹該產(chǎn)品將從2024年1月起陸續(xù)在中國(guó)上市。

有知情人士向虎嗅透露,為了緩和與中國(guó)客戶的關(guān)系,英偉達(dá)在積極開發(fā)“中國(guó)特供”的同時(shí),也在與中國(guó)服務(wù)器廠商協(xié)商,希望能在中低端服務(wù)器,以及PC業(yè)務(wù)方面做出一些讓步,從而在不取消訂單的情況下,用其他產(chǎn)品替代已經(jīng)下單但不能發(fā)貨的高端芯片產(chǎn)品。

雖然對(duì)于中國(guó)的AI公司來(lái)說(shuō),沒有全面封鎖GPU芯片就等于斷了AI研發(fā)的電。但這對(duì)中國(guó)的芯片企業(yè)來(lái)說(shuō),或許是一個(gè)好消息。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: 英偉 在下 一盤 大棋

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港