展會(huì)信息港展會(huì)大全

英偉達(dá)特供芯片賣(mài)不動(dòng)了?黃仁勛穿上東北花襖“示好”,中國(guó)大廠難掩AI野心
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-30 19:14:44   瀏覽:3105次  

導(dǎo)讀:本文來(lái)源:時(shí)代財(cái)經(jīng) 作者:謝斯臨 實(shí)習(xí)生盧倩瑩 圖片來(lái)源:Pixabay 算力芯片的火,從2023年一直燃燒到2024年。 開(kāi)年不久,英偉達(dá)CEO黃仁勛時(shí)隔四年到訪中國(guó)大陸,還穿上了東北大花襖與國(guó)內(nèi)員工共舞,氣氛無(wú)比熱絡(luò),似乎是在對(duì)自家芯片遇冷的傳言進(jìn)行某種回應(yīng)...

本文來(lái)源:時(shí)代財(cái)經(jīng) 作者:謝斯臨 實(shí)習(xí)生盧倩瑩

圖片來(lái)源:Pixabay

算力芯片的火,從2023年一直燃燒到2024年。

開(kāi)年不久,英偉達(dá)CEO黃仁勛時(shí)隔四年到訪中國(guó)大陸,還穿上了東北大花襖與國(guó)內(nèi)員工共舞,氣氛無(wú)比熱絡(luò),似乎是在對(duì)自家芯片遇冷的傳言進(jìn)行某種回應(yīng)。

2023年,英偉達(dá)的AI芯片成了科技界的硬通貨,一度一片難求,英偉達(dá)業(yè)績(jī)也水漲船高,其2024財(cái)年第三季度財(cái)報(bào)顯示,期內(nèi)英偉達(dá)錄得營(yíng)收181.2億美元,比去年同期增長(zhǎng)206%,遠(yuǎn)高于市場(chǎng)預(yù)期的162億美元,創(chuàng)紀(jì)錄新高。

但近期,情況似乎發(fā)生了變化。據(jù)參考消息網(wǎng),自去年11月以來(lái),中國(guó)互聯(lián)網(wǎng)大廠就開(kāi)始在測(cè)試英偉達(dá)“中國(guó)特供版”AI芯片樣品,結(jié)果并不理想由于算力不足,相關(guān)公司已暗示英偉達(dá),今年訂購(gòu)的英偉達(dá)芯片數(shù)量將遠(yuǎn)少于原計(jì)劃。

因此,黃仁勛在這個(gè)特殊時(shí)間節(jié)點(diǎn)突然到訪,引發(fā)了市場(chǎng)諸多猜測(cè)與遐想。有業(yè)內(nèi)人士認(rèn)為,在國(guó)內(nèi)廠商不愿購(gòu)買(mǎi)性能縮水的英偉達(dá)特供版芯片的情況下,黃仁勛來(lái)到中國(guó)大陸,很有可能是為了穩(wěn)住國(guó)內(nèi)團(tuán)隊(duì)和頭部客戶,并了解市場(chǎng)對(duì)英偉達(dá)產(chǎn)品的需求和反饋,以便進(jìn)行相應(yīng)的產(chǎn)品和策略調(diào)整。

對(duì)此,英偉達(dá)方面也回應(yīng)媒體稱,黃仁勛的到訪并未涉及與政府官員的會(huì)面,也沒(méi)有重大的商業(yè)發(fā)布,最主要的目的是與中國(guó)員工“歡度美好時(shí)光”。

“這反映出我國(guó)相關(guān)產(chǎn)業(yè)在國(guó)際競(jìng)爭(zhēng)中的地位逐漸上升。”深度科技研究院院長(zhǎng)張孝榮向時(shí)代財(cái)經(jīng)記者分析表示,在政策端的支持以及國(guó)內(nèi)企業(yè)的不斷努力下,國(guó)內(nèi)外芯片算力的差距已在不斷縮小,這給予了國(guó)內(nèi)頭部大模型廠商轉(zhuǎn)投國(guó)產(chǎn)芯片的底氣,也為英偉達(dá)敲響了警鐘。

H20“遇冷”真相

2023年10月,為了繞過(guò)限制并滿足中國(guó)大陸市場(chǎng)需求,英偉達(dá)著手推出三款基于其AI芯片H100的“降級(jí)版”芯片:H20、L20和L2,并計(jì)劃在今年二季度量產(chǎn)。

然而這一針對(duì)中國(guó)市場(chǎng)研發(fā)的特供芯片未獲市場(chǎng)認(rèn)可。性能上的不足,被普遍認(rèn)為是英偉達(dá)芯片遇冷的主要原因。

官方資料對(duì)比顯示,H20為三款芯片中性能最佳的一款,更適用于垂類(lèi)模型的訓(xùn)練、推理。H20的內(nèi)存高達(dá)96GB,整數(shù)精度(INT8)算力為296TOPS;L20則配有48 GB內(nèi)存,整數(shù)精度(INT8)算力為239TFLOP;L2配置為24GB內(nèi)存以及算力為193TFLOP。

然而即便是三款芯片中最強(qiáng)大的是H20芯片,其運(yùn)算能力與H100相比還是大幅縮水。

半導(dǎo)體研究機(jī)構(gòu)Semianalysis調(diào)研報(bào)告曾顯示,理論上H20整體算力比英偉達(dá)H100下降80%左右,但在大語(yǔ)言模型(LLM)推理方面的性能比H100快20%,同時(shí)配置的HBM3顯存和NVLink互聯(lián)模塊增加了不小成本。

此外,多位業(yè)內(nèi)人士向時(shí)代財(cái)經(jīng)記者分析表示,性能表現(xiàn)不及預(yù)期,并非H20在華遇冷的唯一原因。

華芯金通半導(dǎo)體產(chǎn)業(yè)研究院院長(zhǎng)吳全向時(shí)代財(cái)經(jīng)記者指出,從2023年大模型爆火以來(lái),國(guó)內(nèi)一眾云計(jì)算、大模型廠商就已經(jīng)開(kāi)始積極囤貨,大批量購(gòu)買(mǎi)A800、H800等英偉達(dá)芯片,目前已部署的服務(wù)器總量尚能支撐市場(chǎng)需求,故而對(duì)“減量不減價(jià)”的H20興致缺缺。

而前人工智能NLP企業(yè)首席科學(xué)家、千芯科技董事長(zhǎng)陳巍進(jìn)一步向時(shí)代財(cái)經(jīng)記者透露,國(guó)內(nèi)交易市場(chǎng)中還囤積有大量英偉達(dá)GPU芯片等待消化。這也給予國(guó)內(nèi)大模型廠商一定的選擇余地。

“估計(jì)還有20%的存貨沒(méi)有出清。”陳巍表示。

時(shí)代財(cái)經(jīng)記者通過(guò)詢問(wèn)小紅書(shū)、閑魚(yú)APP等線上渠道,以及線下走訪華強(qiáng)北芯片交易市場(chǎng)后發(fā)現(xiàn),相比半年前囤貨惜售的場(chǎng)景,現(xiàn)在經(jīng)銷(xiāo)商手中英偉達(dá)存貨普遍較多,側(cè)面印證了陳巍的說(shuō)法。

多位賣(mài)家向時(shí)代財(cái)經(jīng)記者透露,其目前擁有A100芯片現(xiàn)貨在50個(gè)以上,配置不同報(bào)價(jià)略有波動(dòng),單個(gè)售價(jià)集中在12萬(wàn)到18萬(wàn)元區(qū)間內(nèi),相較去年下半年價(jià)格維持穩(wěn)定。也有賣(mài)家要求50-100個(gè)起售,交貨周期為1個(gè)月,可在中國(guó)香港、日本、新加坡進(jìn)行交易。

此外,陳巍強(qiáng)調(diào),當(dāng)下市場(chǎng)的觀望態(tài)度也與英偉達(dá)自身的動(dòng)作息息相關(guān)。

除H20外,2023年底,英偉達(dá)中國(guó)又在官網(wǎng)發(fā)布了定制的GeForce RTX 4090 D。隨后,又于今年1月初,推出了全新消費(fèi)級(jí)顯卡GeForce RTX 40 SUPER系列,包括RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER三款GPU,均具備強(qiáng)勁的生成式AI性能。英偉達(dá)副總裁Justin Walker在發(fā)布會(huì)上強(qiáng)調(diào),英偉達(dá)發(fā)布的新顯卡符合出口要求,可以提供給中國(guó)大陸消費(fèi)者。

陳巍認(rèn)為,考慮到多數(shù)國(guó)內(nèi)大模型廠商的發(fā)展趨勢(shì)是針對(duì)垂直領(lǐng)域開(kāi)發(fā)數(shù)十億參數(shù)量級(jí)或百億參數(shù)量級(jí)的中小模型,而不是開(kāi)發(fā)類(lèi)似GPT-3.5 175B這樣的千億級(jí)大模型。因此對(duì)于云計(jì)算和IDC廠商來(lái)說(shuō),4090D等消費(fèi)級(jí)顯卡在云部署與推理計(jì)算上更具備性價(jià)比,H20的吸引力進(jìn)一步下降。

國(guó)產(chǎn)自研AI芯片加速

在爆出H20等“降級(jí)版”芯片在華遇冷的同時(shí),參考消息網(wǎng)的相關(guān)報(bào)道稱,“短期來(lái)看,英偉達(dá)降級(jí)版芯片與中國(guó)本土芯片在性能上的差距不斷縮小,增強(qiáng)了中國(guó)自產(chǎn)芯片的吸引力。據(jù)知情人士稱,阿里巴巴和騰訊正將一部分高性能AI芯片的訂單轉(zhuǎn)給本土企業(yè),并更多地依賴內(nèi)部自研芯片。中國(guó)另外兩大芯片買(mǎi)家字節(jié)跳動(dòng)和百度也是如此。”

時(shí)代財(cái)經(jīng)記者通過(guò)采訪以及公開(kāi)資料梳理發(fā)現(xiàn),目前國(guó)產(chǎn)AI芯片主要可以分為三類(lèi):其一是大型科技企業(yè)自研的AI芯片,二是海光信息這類(lèi)國(guó)資背景的科技公司,三是壁仞科技、天數(shù)智芯、摩爾線程、燧原科技、寒武紀(jì)等創(chuàng)業(yè)型芯片公司。

據(jù)晚點(diǎn)統(tǒng)計(jì),上述芯片峰值算力大多相當(dāng)于英偉達(dá)A100的41%到82%。

從實(shí)際落地情況來(lái)看,絕大部分廠商仍處在商業(yè)化應(yīng)用的早期階段,仍停留在具體場(chǎng)景下的應(yīng)用。

目前,國(guó)內(nèi)已有科技企業(yè)具備全棧AI軟硬產(chǎn)品,能夠真正大規(guī)模量產(chǎn)并投入業(yè)務(wù)使用。其研發(fā)的核心產(chǎn)品被普遍認(rèn)為是性能表現(xiàn)最接近英偉達(dá)的國(guó)產(chǎn)AI芯片?拼笥嶏w副總裁江濤曾在一次業(yè)績(jī)說(shuō)明會(huì)上透露,該芯片的能力已經(jīng)基本做到可對(duì)標(biāo)英偉達(dá)A100。

而據(jù)時(shí)代財(cái)經(jīng)不完全統(tǒng)計(jì),科大訊飛、百度、360、云從科技、智譜AI等多家科技企業(yè)已在使用該芯片。

事實(shí)上,AI芯片的算力比拼只是第一步,對(duì)于國(guó)產(chǎn)廠商而言,接下來(lái)的生態(tài)構(gòu)建又是新的挑戰(zhàn)。多位從業(yè)人士、分析師也一致認(rèn)為,從配套生態(tài)、供應(yīng)鏈等多個(gè)角度看,大模型廠商依舊難以徹底擺脫對(duì)英偉達(dá)GPU的依賴。

這不是一家國(guó)內(nèi)廠商的難題。一位AI芯片設(shè)計(jì)相關(guān)的從業(yè)者向時(shí)代財(cái)經(jīng)記者表示,英偉達(dá)于2006年發(fā)布的CUDA平臺(tái)早已成為應(yīng)用最為廣泛的AI開(kāi)發(fā)生態(tài)系統(tǒng),這導(dǎo)致開(kāi)發(fā)者難以脫離英偉達(dá)芯片,進(jìn)行生成式AI的研發(fā)以及訓(xùn)練。

“從這個(gè)維度看,幾乎沒(méi)有芯片公司可以撼動(dòng)英偉達(dá)的統(tǒng)治地位。”上述從業(yè)者說(shuō)。

還有上市AI企業(yè)高管向時(shí)代財(cái)經(jīng)記者透露,目前,國(guó)產(chǎn)芯片價(jià)格基本與英偉達(dá)產(chǎn)品一致,且產(chǎn)能出貨也難達(dá)預(yù)期。“只有成為生態(tài)合作伙伴,才能勉強(qiáng)保證供應(yīng)。”

“只要漸進(jìn)就是一個(gè)好的趨勢(shì)”

對(duì)國(guó)內(nèi)大模型廠商而言,增加國(guó)產(chǎn)AI芯片比重仍是必然之舉。

“保供已經(jīng)成為一項(xiàng)關(guān)鍵的問(wèn)題。一方面,美國(guó)很有可能會(huì)采取各種手段保證自身在人工智能領(lǐng)域的優(yōu)勢(shì);另一方面,全球局勢(shì)也可能會(huì)影響供應(yīng)鏈的穩(wěn)定;谶@樣的預(yù)期,市場(chǎng)需要盡早尋得新的方案,這將成為國(guó)產(chǎn)AI芯片發(fā)展的機(jī)會(huì)。”陳巍認(rèn)為。

為抓住這一機(jī)會(huì),一眾國(guó)產(chǎn)AI芯片廠商都在重點(diǎn)發(fā)力,拓展市常據(jù)寒武紀(jì)向時(shí)代財(cái)經(jīng)記者提供的資料,旗下思元芯片近期接連宣布與百川智能、智象未來(lái)等廠商旗下大模型完成全面適配。

“生態(tài)構(gòu)建是目標(biāo),芯片只是基礎(chǔ),更重要的是在芯片之上構(gòu)建函括架構(gòu)平臺(tái)、軟件工具、操作系統(tǒng)和應(yīng)用場(chǎng)景等一系列生態(tài)體系。英偉達(dá)起步早,國(guó)產(chǎn)廠商需要快速追趕。”吳全向時(shí)代財(cái)經(jīng)記者分析道。

國(guó)際數(shù)據(jù)公司(IDC)披露數(shù)據(jù)顯示,2023年上半年,中國(guó)加速芯片的市場(chǎng)規(guī)模超過(guò)50萬(wàn)張。在陳巍看來(lái),這是一個(gè)能夠讓那個(gè)國(guó)產(chǎn)市場(chǎng)份額拉升的機(jī)會(huì)。“只要漸進(jìn)就是一個(gè)好的趨勢(shì)。AI芯片要在實(shí)際應(yīng)用中才能夠發(fā)現(xiàn)問(wèn)題、加快迭代。我們一般認(rèn)為,市場(chǎng)份額占比超過(guò)15%之后,生態(tài)建設(shè)才能真正跑起來(lái)。”

吳全形象地將國(guó)產(chǎn)AI芯片的發(fā)展比喻為樹(shù)木的成長(zhǎng),“目前我們只是種下了一顆小小的樹(shù)苗,完成了最基本的培育工作。國(guó)內(nèi)企業(yè)仍需在技術(shù)創(chuàng)新、人才培養(yǎng)、產(chǎn)業(yè)鏈完善等方面付出更多努力。”

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港