當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > 英偉達(dá)也在下一盤AI PC的大棋

英偉達(dá)也在下一盤AI PC的大棋
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-01-16 09:16:47 瀏覽：8099次

導(dǎo)讀：出品｜虎嗅科技組作者｜齊健編輯｜王一鵬頭圖｜DALL-E 3 2023年，英偉達(dá)幾乎一整年都在關(guān)注高端顯卡、AI大模型、超級(jí)計(jì)算等數(shù)據(jù)中心業(yè)務(wù)，以至于市場(chǎng)都快要忘記英偉達(dá)在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件軍火商。事實(shí)上，在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同...

出品｜虎嗅科技組

作者｜齊健

編輯｜王一鵬

頭圖｜DALL-E 3

2023年，英偉達(dá)幾乎一整年都在關(guān)注高端顯卡、AI大模型、超級(jí)計(jì)算等數(shù)據(jù)中心業(yè)務(wù)，以至于市場(chǎng)都快要忘記英偉達(dá)在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件“軍火商”。

事實(shí)上，在數(shù)據(jù)中心業(yè)務(wù)中賺得盆滿缽滿的同時(shí)，英偉達(dá)并沒有忘本，黃仁勛早已開始盤算，如何用AI到“電競(jìng)椅和辦公桌”上去賺錢了。

在剛剛結(jié)束的2024 CES上英偉達(dá)發(fā)布了大量聚集PC端的AI應(yīng)用和GPU新品。包括GeForce RTX 40 SUPER系列顯卡，NVIDIA AI Workbench，開源庫(kù)TensorRT-LLM，以及生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù)。

一系列PC端的GPU產(chǎn)品和應(yīng)用，全部圍繞本屆CES上PC廠商們最關(guān)注的話題AIPC。然而，對(duì)于一心撲在AI上的英偉達(dá)來(lái)說(shuō)，對(duì)PC用戶的“關(guān)心”，還保留了多少呢？英偉達(dá)對(duì)業(yè)界熱炒的AIPC到底是什么態(tài)度？

PC業(yè)務(wù)的前景不如數(shù)據(jù)中心

事實(shí)上，在2023年AI大模型爆發(fā)以前，英偉達(dá)最大的市場(chǎng)一直是PC端的“游戲”板塊。

英偉達(dá)從2015年開始把主營(yíng)業(yè)務(wù)分為游戲（Gaming）、企業(yè)（Enterprise）、高性能計(jì)算和云（HPC & Cloud）、自動(dòng)駕駛（Automotive）幾個(gè)板塊。也是自2015年起，超算和云，也就是未來(lái)的數(shù)據(jù)中心業(yè)務(wù)，開始在英偉達(dá)的營(yíng)收中一步步走向高位。

2016年，英偉達(dá)對(duì)其業(yè)務(wù)板塊進(jìn)行了調(diào)整，去掉了Enterprise和HPC & Cloud兩個(gè)板塊，取而代之的是今天的專業(yè)可視化（Professional Visualization）和數(shù)據(jù)中心（Datacenter）。英偉達(dá)還首次單獨(dú)公布了這幾個(gè)業(yè)務(wù)板塊的營(yíng)收情況。游戲業(yè)務(wù)的目標(biāo)用戶就是個(gè)人電腦，專業(yè)可視化的用戶則多數(shù)是商業(yè)客戶使用的工作站。

2016年英偉達(dá)全年的總收入為50.10億美元。在2016年1月31日結(jié)束的財(cái)年中，英偉達(dá)的游戲業(yè)務(wù)收入為28.18億美元；專業(yè)可視化業(yè)務(wù)的收入為7.50億美元；數(shù)據(jù)中心業(yè)務(wù)的收入為3.39億美元；自動(dòng)駕駛業(yè)務(wù)收入為3.20億美元。

其中游戲業(yè)務(wù)和專業(yè)可視化分別占總收入的56.25%和14.97%，今天如日中天的數(shù)據(jù)中心，在當(dāng)時(shí)只占總收入的6.77%。

個(gè)人電腦市場(chǎng)雖然穩(wěn)定，但市場(chǎng)似乎已經(jīng)能夠看到天花板了，不僅增長(zhǎng)速度有限，且由于技術(shù)門檻不高，這一領(lǐng)域的市場(chǎng)競(jìng)爭(zhēng)也日益激烈。

2017、2018年，AI技術(shù)首次爆發(fā)。給英偉達(dá)帶來(lái)了一條新的增長(zhǎng)曲線。

2018財(cái)年，GPU加速計(jì)算對(duì)于深度學(xué)習(xí)的支持使得英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)快速增長(zhǎng)，當(dāng)年數(shù)據(jù)中心業(yè)務(wù)的收入為193.2億美元，專業(yè)可視化為93.4億美元。數(shù)據(jù)中心的營(yíng)收和增幅都遠(yuǎn)超專業(yè)可視化。

數(shù)據(jù)中心業(yè)務(wù)的飛速發(fā)展，可以說(shuō)是把英偉達(dá)從傳統(tǒng)游戲硬件供應(yīng)商，帶上了多元化技術(shù)公司的軌道。

市調(diào)機(jī)構(gòu)TBRC在2024年1月發(fā)布的最新報(bào)告中預(yù)測(cè)，2023年全球個(gè)人電腦市場(chǎng)規(guī)模約為2040.9億美元，預(yù)計(jì)到2024年將增長(zhǎng)到2123.8億美元，復(fù)合年增長(zhǎng)率(CAGR)為4.1%。個(gè)人電腦市場(chǎng)規(guī)模預(yù)計(jì)在未來(lái)幾年將保持增長(zhǎng)。到2028年，或?qū)⒃鲋?677.1億美元，復(fù)合年增長(zhǎng)率為6.0%。

數(shù)據(jù)中心的市場(chǎng)規(guī)模和增長(zhǎng)潛力則比個(gè)人電腦更大。2023年的全球數(shù)據(jù)中心市場(chǎng)規(guī)模約2526.8億美元，比個(gè)人電腦市場(chǎng)規(guī)模大了約20%。預(yù)計(jì)到2024年將增至2749.8億美元，復(fù)合年增長(zhǎng)率(CAGR)為8.8%。未來(lái)幾年數(shù)據(jù)中心市場(chǎng)規(guī)模的增長(zhǎng)也更為強(qiáng)勁。TBRC預(yù)計(jì)，到2028年，這一市場(chǎng)的規(guī)模將增至3884.1億美元，復(fù)合年增長(zhǎng)率(CAGR)為9.0%。

相比于個(gè)人電腦業(yè)務(wù)，數(shù)據(jù)中心無(wú)論是市場(chǎng)規(guī)模、市場(chǎng)競(jìng)爭(zhēng)格局，還是用戶需求、技術(shù)發(fā)展趨勢(shì)，不管當(dāng)下還是未來(lái)，都明顯更好做，也更賺錢。

數(shù)據(jù)中心有多賺錢？

在英偉達(dá)最新的2024財(cái)年第三季度財(cái)報(bào)中，快速上升的數(shù)據(jù)中心業(yè)務(wù)營(yíng)收1451.4億美元，占總營(yíng)收的80%，完全碾壓了英偉達(dá)在PC端的傳統(tǒng)核心業(yè)務(wù)“游戲”。對(duì)于英偉達(dá)來(lái)說(shuō)，數(shù)據(jù)中心業(yè)務(wù)不管是當(dāng)下還是未來(lái)，都是最能賺錢，賺錢最快，賺錢最簡(jiǎn)單的業(yè)務(wù)。

今天的技術(shù)趨勢(shì)強(qiáng)烈指向云計(jì)算、大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域，這些都是數(shù)據(jù)中心業(yè)務(wù)的關(guān)鍵驅(qū)動(dòng)力。

AI推動(dòng)著各家公司對(duì)高算力、超級(jí)算力的需求持續(xù)上漲。2023年年中，科技博客GPU Utils對(duì)GPU短缺問(wèn)題做了一次調(diào)查，博主Clay Pascal給出的調(diào)查結(jié)果稱，彼時(shí)谷歌云擁有大約2.5萬(wàn)塊H100，微軟云服務(wù)Azure可能有1萬(wàn)-4萬(wàn)塊H100，甲骨文的情況應(yīng)該類似。Azure的大部分容量都將流向OpenAI。

Clay Pascal預(yù)測(cè)對(duì)于H100的需求，OpenAI可能需要5萬(wàn)塊，Meta可能需要2.5萬(wàn)塊，大型云廠商可能每家都需要3萬(wàn)塊，加上其他一些初創(chuàng)企業(yè)，可能總共需要大約43.2萬(wàn)塊H100。以每塊約3.5萬(wàn)美元計(jì)算，所需GPU的價(jià)值約為150億美元。這還不包括中國(guó)公司。

Clay Pascal在博客中寫道：我被告知，對(duì)于需要100或1000塊（英偉達(dá)GPU）H100的公司來(lái)說(shuō)，Azure（微軟云服務(wù)）和GCP（谷歌云服務(wù)）實(shí)際上已經(jīng)沒有容量了，亞馬遜也接近沒有容量了。

研究機(jī)構(gòu)Omdia的調(diào)研結(jié)果則稱，英偉達(dá)在2023年第三季度售出了近50萬(wàn)個(gè)A100和H100 GPU，基于H100的服務(wù)器的交付周期已延長(zhǎng)至36到52周。雖然不知道目前英偉達(dá)的補(bǔ)貨情況，不過(guò)從OpenAI近期接連發(fā)生的斷網(wǎng)，停賬號(hào)，以及新功能升級(jí)來(lái)看，不管補(bǔ)貨能力如何，需求的巨大缺口仍在。

在巨大的需求面前，英偉達(dá)也開始了坐地起價(jià)。在芯片行業(yè)中，高端產(chǎn)品的利潤(rùn)率通常較高，不少高端產(chǎn)品的利潤(rùn)率可達(dá)50%以上。而英偉達(dá)的高端GPU利潤(rùn)率高得可怕，投資銀行Raymond James的消息稱H100 GPU的成本只有3320美元，但英偉達(dá)賣出的價(jià)格為2.5-3萬(wàn)美元，利潤(rùn)率高達(dá)1000%。

如今英偉達(dá)a100和H100服務(wù)器的價(jià)格，在國(guó)內(nèi)更是炒得離譜，2023年最后三個(gè)月，8卡H100服務(wù)器的價(jià)格上浮一度達(dá)到300萬(wàn)元人民幣。

英偉達(dá)有多需要AIPC？

數(shù)據(jù)中心這么好賺，那是否意味著英偉達(dá)會(huì)就此減弱對(duì)PC市場(chǎng)的關(guān)注呢？

短期來(lái)看恐怕還不會(huì)，畢竟在過(guò)去30年里，PC一直是英偉達(dá)的主戰(zhàn)常在這里，英偉達(dá)不僅有優(yōu)勢(shì)，有經(jīng)驗(yàn)，更重要的是有信心。

個(gè)人電腦市場(chǎng)，特別是游戲和專業(yè)圖形處理領(lǐng)域，在今天仍然是英偉達(dá)重要的收入來(lái)源。英偉達(dá)2024財(cái)年第三季度業(yè)績(jī)顯示，游戲業(yè)務(wù)營(yíng)收為285.6億美元，同比增長(zhǎng)超80%。隨著游戲行業(yè)的發(fā)展和虛擬現(xiàn)實(shí)技術(shù)的進(jìn)步，PC市場(chǎng)的增長(zhǎng)潛力仍然巨大。

另一方面，英偉達(dá)在PC市場(chǎng)上，亦處在壟斷地位。英偉達(dá)在2022年全球獨(dú)立GPU市場(chǎng)中的市占率為88%，AMD和Intel僅占8%和4%。

更重要的是，英偉達(dá)在GPU方面豐富的產(chǎn)品線，可以在PC市場(chǎng)上長(zhǎng)期發(fā)貨優(yōu)勢(shì)。英偉達(dá)提供了一系列針對(duì)不同用戶需求的GPU產(chǎn)品，包括面向游戲玩家和創(chuàng)作者的Ampere，以及面向數(shù)據(jù)中心的Hopper3。英偉達(dá)還構(gòu)建了包括驅(qū)動(dòng)程序、開發(fā)工具和應(yīng)用程序在內(nèi)的全面生態(tài)系統(tǒng)。

從目前來(lái)看如果英偉達(dá)的RTX40系列顯卡在PC上能夠支持新的AI業(yè)務(wù)，那么未來(lái)仍將獨(dú)占這一百億級(jí)別的市場(chǎng)，甚至通過(guò)AI技術(shù)的升級(jí)，進(jìn)一步擴(kuò)大個(gè)人pc市場(chǎng)中GPU的裝機(jī)率，推動(dòng)全球市場(chǎng)規(guī)模更上一個(gè)臺(tái)階。

2023年數(shù)據(jù)中心業(yè)務(wù)的增長(zhǎng)速度驚人，與AI大模型這一新興技術(shù)的爆發(fā)密切相關(guān)。然而，AI大模型目前對(duì)全球科技市場(chǎng)來(lái)說(shuō)仍處在非常早期的階段，未來(lái)的增長(zhǎng)持續(xù)性到底如何，對(duì)云端服務(wù)器的需求如何都未可知。

而PC業(yè)務(wù)，在過(guò)去30年中已經(jīng)走出了一條穩(wěn)定的增長(zhǎng)曲線。由此可想，雖然英偉達(dá)勢(shì)必會(huì)重點(diǎn)投資更有利可圖且增長(zhǎng)潛力更大的數(shù)據(jù)中心業(yè)務(wù)，但一定也不會(huì)把早已站穩(wěn)腳跟的PC業(yè)務(wù)市場(chǎng)拱手讓人。

RTX 40系列的機(jī)遇和挑戰(zhàn)

AIPC概念在市場(chǎng)上被熱炒，很多廠商都在提出把AI落地到本地，從而降低云計(jì)算成本、提高安全性和響應(yīng)效率。這無(wú)疑給PC端的GPU創(chuàng)造了新的市場(chǎng)機(jī)遇。

英偉達(dá)在2024 CES上最新發(fā)布的GeForce RTX 40 SUPER系列顯卡中，GeForce RTX 4080 SUPER在AI視頻生成上比GeForce RTX 3080 Ti快1.5倍，圖片生成上快1.7倍。SUPER GPUs的Tensor Cores能夠?qū)崿F(xiàn)每秒高達(dá)836萬(wàn)億次AI運(yùn)算（TOPS），從而為游戲、創(chuàng)作和日常生產(chǎn)力帶來(lái)變革性的AI能力。

NVIDIA AI Workbench則允許開發(fā)者快速創(chuàng)建、測(cè)試和定制預(yù)訓(xùn)練的生成式AI模型和大型語(yǔ)言模型（LLM）。TensorRT-LLM是一個(gè)開源庫(kù)，用于加速PC上大型語(yǔ)言模型的運(yùn)行。最新版本的TensorRT-LLM現(xiàn)已可用，它為PC增加了更多預(yù)優(yōu)化模型，與其他推理后端相比，運(yùn)行速度提高了多達(dá)5倍。

此外，英偉達(dá)還發(fā)布了生成式AI驅(qū)動(dòng)的語(yǔ)音和動(dòng)畫模型在內(nèi)的NVIDIA ACE微服務(wù)，使開發(fā)者能夠向游戲中添加智能、動(dòng)態(tài)的數(shù)字化角色。此外，NVIDIA還發(fā)布了“Chat with RTX”技術(shù)演示，它允許AI愛好者通過(guò)所謂的“檢索增強(qiáng)生成”（RAG）技術(shù)，輕松地將PC上的大型語(yǔ)言模型（LLM）連接到自己的數(shù)據(jù)。

這些新品都針對(duì)生成式AI做了大量?jī)?yōu)化，為GPU在未來(lái)的AIPC中發(fā)力提供了機(jī)會(huì)。

有趣的是，最近有研究團(tuán)隊(duì)發(fā)現(xiàn)RTX4090在一定條件下甚至有可能替代服務(wù)器級(jí)芯片。

上海交通大學(xué)的研究團(tuán)隊(duì)就開發(fā)了一個(gè)名為PowerInfer的高性能CPU/GPU混合LLM推理引擎。這款引擎大幅降低了對(duì)GPU內(nèi)存的需求，并減少了CPU與GPU之間的數(shù)據(jù)傳輸，從而提高了整體效率�？梢栽趩蝹€(gè)NVIDIA RTX 4090 GPU上運(yùn)行大型語(yǔ)言模型（LLM），達(dá)到平均每秒產(chǎn)生13.20個(gè)token的速度，峰值速度更是高達(dá)29.08 tokens/s，這與頂尖的A100 GPU服務(wù)器性能相差無(wú)幾，僅低18%，適用于多種LLM應(yīng)用場(chǎng)景。

PC端GPU在AI加持下雖然機(jī)遇巨大。但在AIPC的大潮流中競(jìng)爭(zhēng)也比高端GPU更激烈。

如今，英偉達(dá)要面對(duì)的競(jìng)爭(zhēng)中已經(jīng)不只有AMD和Intel了。蘋果M系列芯片提出的統(tǒng)一內(nèi)存架構(gòu)（Unified Memory Architecture, UMA），給生成式AI的預(yù)訓(xùn)練過(guò)程提供了一種選擇。

UMA允許CPU和GPU共享相同的物理內(nèi)存，減少了數(shù)據(jù)在不同內(nèi)存之間的復(fù)制需求，提高效率。此外蘋果的硬件優(yōu)化使其設(shè)備在執(zhí)行AI相關(guān)任務(wù)時(shí)能耗更低。蘋果的硬件和軟件高度集成的特性，也為特定的AI應(yīng)用提供了更好的優(yōu)化空間。

目前，已經(jīng)有大量AI大模型開發(fā)者開始嘗試使用蘋果電腦訓(xùn)練大語(yǔ)言模型。最新款Mac Studio的頂配版本，已經(jīng)可以訓(xùn)練700億參數(shù)的LLaMA2模型。

不過(guò)，雖然UMA具備諸多優(yōu)勢(shì)，但它更多地集中在蘋果自己的生態(tài)系統(tǒng)內(nèi)，與外部系統(tǒng)的兼容性可能有限。且相比專業(yè)的GPU，蘋果的硬件可能在處理極其復(fù)雜的AI模型時(shí)有性能瓶頸。

英偉達(dá)在AI領(lǐng)域深耕多年，擁有強(qiáng)大的技術(shù)積累和廣泛的應(yīng)用生態(tài)，這些都是蘋果短時(shí)間內(nèi)難以匹敵的。盡管蘋果UMA可能在某些方面對(duì)英偉達(dá)構(gòu)成挑戰(zhàn)，但英偉達(dá)的GPU在AI領(lǐng)域依然具有很強(qiáng)的競(jìng)爭(zhēng)力。

PC業(yè)務(wù)能救中國(guó)市場(chǎng)嗎？

黃仁勛在英偉達(dá)2024財(cái)年第三季度的財(cái)報(bào)電話中提到，英偉達(dá)20-25%的業(yè)務(wù)來(lái)自中國(guó)，美國(guó)對(duì)中國(guó)的高端芯片制裁，將會(huì)對(duì)英偉達(dá)造成嚴(yán)重影響。

2023年8月，英國(guó)《金融時(shí)報(bào)》曾報(bào)道了一則中國(guó)云廠商搶購(gòu)英偉達(dá)高端GPU的新聞，稱百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴四家公司合計(jì)向英偉達(dá)訂購(gòu)了價(jià)值50億美元的AI芯片。而受美國(guó)制裁法案的影響，英偉達(dá)機(jī)會(huì)完全無(wú)法履行這些訂單。

為了保住中國(guó)業(yè)務(wù)，英偉達(dá)再度開始積極設(shè)計(jì)3款”中國(guó)特供“芯片。

某國(guó)內(nèi)服務(wù)器制造商近期曾向虎嗅透露，芯片限制政策對(duì)國(guó)內(nèi)服務(wù)器生產(chǎn)沒有影響，因?yàn)椴还苡ミ_(dá)推出什么芯片，服務(wù)器要做的只是適配NV-Link。目前搭載新的“中國(guó)特供”芯片的服務(wù)器已經(jīng)接受了很多客戶的下單，不過(guò)受到美國(guó)政府加強(qiáng)管制的影響，原本計(jì)劃2024年1月到貨的“中國(guó)特供”，現(xiàn)在看肯定要延后了。

有消息稱，拜登政府已經(jīng)開始調(diào)查英偉達(dá)為中國(guó)開發(fā)的三款新型AI芯片的具體細(xì)節(jié)。美國(guó)商務(wù)部長(zhǎng)吉娜雷蒙多在接受外媒采訪時(shí)談道：“我們會(huì)檢查每一個(gè)新芯片的每一個(gè)規(guī)格，顯然是為了確保它不違反出口管制。”

雷蒙多說(shuō)，英偉達(dá)“能夠、愿意、也應(yīng)該向中國(guó)出售AI芯片，因?yàn)榇蠖鄶?shù)AI芯片將用于商業(yè)應(yīng)用”，但“我們不能允許他們運(yùn)送最復(fù)雜、處理能力最高的AI芯片，這將使中國(guó)能夠訓(xùn)練他們的前沿模型”。她強(qiáng)調(diào)說(shuō)不能向中國(guó)企業(yè)出售其最先進(jìn)的半導(dǎo)體，并表示將不斷更新出口管制規(guī)則。

美國(guó)對(duì)中國(guó)的芯片封鎖，與其說(shuō)是在制裁中國(guó)，倒不如說(shuō)是在制裁英偉達(dá)。

1月7日，美國(guó)《華爾街日?qǐng)?bào)》以“英偉達(dá)在中國(guó)的新困境，客戶不想要它的降級(jí)芯片”為題，報(bào)道了英偉達(dá)為應(yīng)對(duì)拜登政府出口限制，向中國(guó)出售降級(jí)特供版AI芯片，但中國(guó)客戶不感興趣的最新困境。

事實(shí)上，RTX40系列顯卡在中國(guó)的銷售也未必會(huì)一帆風(fēng)順，有消息稱，目前英偉達(dá)在中國(guó)可以銷售的最高端芯片為RTX 4090D，這款新芯片比RTX4090的性能低了5%左右。英偉達(dá)介紹該產(chǎn)品將從2024年1月起陸續(xù)在中國(guó)上市。

有知情人士向虎嗅透露，為了緩和與中國(guó)客戶的關(guān)系，英偉達(dá)在積極開發(fā)“中國(guó)特供”的同時(shí)，也在與中國(guó)服務(wù)器廠商協(xié)商，希望能在中低端服務(wù)器，以及PC業(yè)務(wù)方面做出一些讓步，從而在不取消訂單的情況下，用其他產(chǎn)品替代已經(jīng)下單但不能發(fā)貨的高端芯片產(chǎn)品。

雖然對(duì)于中國(guó)的AI公司來(lái)說(shuō)，沒有全面封鎖GPU芯片就等于斷了AI研發(fā)的電。但這對(duì)中國(guó)的芯片企業(yè)來(lái)說(shuō)，或許是一個(gè)好消息。