頭圖 | 視覺中國
出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
本文為《進(jìn)擊的AI巨頭》系列第001篇文章,《進(jìn)擊的AI巨頭》聚焦頭部AI公司的最新動向,我們將持續(xù)追蹤這些正在影響AI未來走向的核心參與者。本文聚焦于英偉達(dá)發(fā)布的H20 GPU 芯片。
一枚性能大幅縮水AI芯片,可能會讓英偉達(dá)在中國掙上900億。
7月5日,咨詢機(jī)構(gòu)SemiAnalysis發(fā)布報告稱,英偉達(dá)在今年有望交付100萬枚H20 GPU。
考慮到這是一枚閹割過,且性價比較低的“對華特供版”芯片,基本可以認(rèn)定,這100萬枚芯片將在今年全部流入中國大陸市常以目前該型芯片1.2-1.3萬美元的渠道定價來看,H20芯片可以為英偉達(dá)帶來至少120億美元的收入,已經(jīng)超過了這家公司去年在華總營收。
不過,H20在中國市場的實(shí)際情況,可能并沒有如咨詢機(jī)構(gòu)預(yù)估的那般樂觀。
一位服務(wù)器經(jīng)銷商向虎嗅表示,目前一臺H20八卡服務(wù)器,定價大約在120萬元,而性能大幅領(lǐng)先的滿配H100 NVLink版本的八卡服務(wù)器價格為270萬元上下,而且是現(xiàn)貨。
盡管后者早早被列入禁止對華出售的名單中,但在非官方渠道中,這款芯片的貨源基本沒有斷過,甚至在今年二季度H200開售后,這款芯片的價格還下跌了約10%。
“無論怎么看,H20的性價比都還是太低。”這位服務(wù)器經(jīng)銷商提到,即便是同國內(nèi)的解決方案相比,H20都難言有多大的競爭優(yōu)勢。
“閹割版”,但還挺良心的?
與同系列芯片不同,H20是一枚“趕工”性質(zhì)非常明顯的產(chǎn)品。
在去年10月美國升級芯片禁令后,原本就被視為閹割版芯片的A800/H800,甚至是消費(fèi)級產(chǎn)品RTX4090都被納入禁令的管制范圍。
但僅在一個月后,就有臺灣地區(qū)媒體報道稱,英偉達(dá)向代工廠下了H20芯片的訂單。
在如此短的時間內(nèi),英偉達(dá)不可能重新設(shè)計一款芯片,最大的可能是基于既有型號進(jìn)行有針對性的調(diào)整。
比如新規(guī)中取消了將“互聯(lián)帶寬”作為限制芯片的識別參數(shù),英偉達(dá)就將H20的HBM3顯存容量拉高到96Gb,使顯存帶寬提高到4.0Tb/s;又比如新規(guī)新增了“性能密度”的限制,英偉達(dá)就向算力規(guī)格大砍一刀,使其理論性能僅為296TFLOP,相當(dāng)于H100芯片的15%。
至于那些新規(guī)沒有提到的,比如PCIe Gen5擴(kuò)展卡、八路HGX,英偉達(dá)全部保留了下來。值得一提的是,H20還有非常高的卡間互聯(lián)速度,其NV Link帶寬達(dá)到900Gb/s,很適合組建大規(guī)模集群。
但這些特征組合在一起,卻形成了一個很尷尬的事實(shí):在算力大幅削減的情況下,H20的BOM(綜合硬件成本)很可能跟H100齊平,甚至高于后者。
原因在于,存儲顆粒一直是高性能計算卡成本的“大頭”,比如H100芯片中,HBM3顆粒的采購就要占到60%左右,而在H20芯片上,英偉達(dá)又不得不為其配備更高規(guī)格的顯存容量,以彌補(bǔ)算力不足的缺陷。
基本可以斷定,H20在英偉達(dá)高性能計算卡中,屬于利潤率最低的存在。相較于1.2-1.3萬美元的售價,與它同成本的H100目前定價為2.5-3萬美元。
從這個角度來看,H20算是英偉達(dá)的一款良心產(chǎn)品了。
英偉達(dá)自然不甘心于讓一款單品拉低公司整體的毛利表現(xiàn),但自去年芯片禁令升級后,英偉達(dá)四季度在中國大陸的營收,從上一季度的40.3億降低至19.46億,其中國區(qū)數(shù)據(jù)中心營收占比也從22%滑落至8%,英偉達(dá)急需用一款產(chǎn)品去穩(wěn)住在中國的市場份額。
H20就是英偉達(dá)拿出的誠意之作,但還是那個問題,H20的算力實(shí)在羸弱,這個硬傷無法被忽視。
華為或與之一戰(zhàn)?
實(shí)際上,英偉達(dá)曾在今年2月進(jìn)行過一次官方調(diào)價,在調(diào)價之前H20芯片的價格為2.3萬美元,盡管英偉達(dá)表示降價的原因是“供貨充足”,但如此大幅的價格調(diào)整,主要原因大概率還是銷量沒有達(dá)到預(yù)期。
“國內(nèi)大廠基本不會考慮H20服務(wù)器,都是閉眼買H100,而那些體量相對小的廠商也認(rèn)為有點(diǎn)劃不來。”
有服務(wù)器經(jīng)銷商向筆者算了一筆賬,現(xiàn)在H100的服務(wù)器單機(jī)租賃費(fèi)用大概是8-9萬元/月,而算力僅有前者六分之一的H20服務(wù)器價格為120萬元上下,即便不考慮算力損耗的問題,廠商也需要購買6臺H20服務(wù)器,才能與H100服務(wù)器相齊平。
這樣一對比,H20雖然是英偉達(dá)利潤率最低的產(chǎn)品,但對于客戶來說,實(shí)在稱不上有性價比。
而對于英偉達(dá)來說,還有一個不可忽視的因素是國內(nèi)同類型競品,比如華為騰910B。
與H20相比,910B在單卡算力(FP16)上幾乎相當(dāng)于前者的一倍。相應(yīng)地,910B價格也要高于H20,服務(wù)器經(jīng)銷商向筆者表示,目前910B的服務(wù)器價格已經(jīng)超過170萬元。
拋開價格,從實(shí)際表現(xiàn)來看,二者的競爭互有勝負(fù)手。910B強(qiáng)在算力和能效比上,H20則勝在軟件生態(tài)與互聯(lián)上。最直接的例子就是,H20兼容所有的英偉達(dá)H系列卡,而且具備極高的訪存能力,在搭建算力集群時,能夠更好地避免算力損耗。
當(dāng)然,這個集群規(guī)模是有上限的,比如各地籌劃的“萬P計算集群”,如果用H20搭建,那么0.15P單卡運(yùn)算能力就意味著十萬顆級別的GPU,組網(wǎng)難度極大。
另外一個值得關(guān)注的問題是,英偉達(dá)與華為誰能更加穩(wěn)定地供應(yīng)產(chǎn)品?
此前,就有業(yè)內(nèi)人士向筆者提到過,對于那些急于購買搭建算力中心的廠商來說,H20可能是更現(xiàn)實(shí)的選擇。
一方面,英偉達(dá)的軟件生態(tài)更加成熟,廠商的適配工作量要小得多;另一方面,目前無論是政策還是資本方,都對于算力中心的芯片國產(chǎn)化率有一定要求,910B的需求量非常大,相應(yīng)地交付周期也比較長。
這一說法筆者也在服務(wù)器經(jīng)銷商處得到了驗(yàn)證,對方向筆者表示,“在英偉達(dá)調(diào)價前,行業(yè)內(nèi)客戶對于910B的咨詢要遠(yuǎn)大于H20,但現(xiàn)在也有客戶對H20展現(xiàn)出了興趣,因?yàn)橛谐渥愕默F(xiàn)貨。”
有趣的是,二者可能并不是完全意義上的競爭關(guān)系,因?yàn)橛袠I(yè)內(nèi)人士向筆者表示,在他所在的公司,910B和H20被歸為不同分級,在采購上并不沖突。