展會信息港展會大全

瘋搶AI芯片:機房拆舊貨,一片賣10萬
來源:互聯(lián)網   發(fā)布日期:2023-06-26 06:51:52   瀏覽:6628次  

導讀:01、像賣愛馬仕一樣賣芯片 今年以來,大模型和AI 2.0既是最火熱的創(chuàng)富夢,也越來越成為一個昂貴的權力的游戲。在技術、資本、人才等構建出的種種門檻中,還有一張重要的入場門票你有沒有門路能搞到足夠的英偉達高端顯卡。 王非是華東地區(qū)一家服務器定制企業(yè)...

01、像賣愛馬仕一樣賣芯片

今年以來,大模型和AI 2.0既是最火熱的創(chuàng)富夢,也越來越成為一個昂貴的“權力的游戲”。在技術、資本、人才等構建出的種種門檻中,還有一張重要的入場門票你有沒有“門路”能搞到足夠的英偉達高端顯卡。

王非是華東地區(qū)一家服務器定制企業(yè)的銷售部經理,他向「市界」描述了最近英偉達顯卡的緊俏程度:“需求太火爆,有些人從機房里把芯片禁運政策生效前購買的A100 80GB拆出來倒賣。”這些舊芯片不只沒有保修,相比于去年8月前后8萬多元的單價,價格還漲到了10萬多元。

即便已經舊貨拆賣、物盡其用,顯卡的供應還是嚴重不足。“需要拿現(xiàn)款去,對方才愿意賣給你。”而相對顯存較孝訓練效率低的A100 40GB即便有全新的,也乏人問津。“詢價的多,成交的少。”

具體而言,這批搶手的顯卡指的是英偉達旗下的“Tesla”系列產品。在訓練AI大模型時,比傳統(tǒng)CPU更高效的GPU(圖形處理器,又稱顯示芯片),尤其是高端GPU一芯難求。

2020年和2022年,英偉達先后推出了A100芯片、H100芯片,其中A100顯卡又提供80GB、40GB兩個顯存版本,H100則提供80GB顯存。顯存越大,所能運行的神經網絡也就越大。

2022年9月開始,美國禁止英偉達等向中國出口高端GPU芯片。為應對禁運政策,英偉達又在2022年和2023年分別推出了特供中國版的顯卡A800和H800。

不過如今,在政策允許范圍內的A800芯片,在市場上也出現(xiàn)了供貨周期拉長、價格上浮的現(xiàn)象。王非透露:“在大模型火爆之前,A800大概兩周即可到貨。但現(xiàn)在我跟客戶保守估計要在8周內,即便是最樂觀的情況,也需要4-6周。”

供職于北京一家顯卡分銷企業(yè)的郭麗婕對「市界」表示:現(xiàn)在公司的A800單卡報價為8.75萬元,已經超出了A800在2022年11月時8萬-8.5萬元的價格區(qū)間。而且,8.75萬元只是實時報價,顯卡還有繼續(xù)漲價的趨勢。“我告訴客戶確定要了再找我聊,現(xiàn)在的庫存也不多。”

另一家位于深圳的顯卡供應商,則給A800開出了8.95萬元的報價更高的溢價意味著等待時間較短,需要大約兩周的貨期。

作為算力基礎設施,競購英偉達高端顯卡芯片已經成了一種“搶跑游戲”。而決定AI創(chuàng)業(yè)公司成敗的要素之一,“就是你到底有沒有能力調動最起碼100張以上的英偉達顯卡。”一家AI創(chuàng)業(yè)公司負責人對「市界」講到。

他透露:“在去年8月之前,通過國內正規(guī)渠道,還能買到A100顯卡,也可以采購海外版A100。在此之后,國內A100被切斷了貨源,從海外采購海關也不會放行。”

不過那些允許被特供中國的A800和H800芯片對于緊缺算力的AI中小公司而言,同樣是遙不可及。

王非透露:“一般來說英偉達的貨先到國內總代,再被我們這類廠家分走,銷售給做AIGC項目的客戶。目前H800雖然已經發(fā)售,預計單卡售價會在20萬起,也沒有進入我們這一級市常現(xiàn)在能拿到H800的,應該只有阿里云、騰訊云這種有資格從英偉達原廠直接采購的大廠商。”

在市場緊俏的背景下,H800等高端芯片已經提前被大廠包攬。目前,國內僅有騰訊云官宣“用上”了H800。4月14日,騰訊云發(fā)布了基于H800的大規(guī)模算力集群,并將其定義為H800的“全國首發(fā)”。

據《晚點 LatePost》了解,字節(jié)今年向英偉達訂購了超過 10 億美元的 GPU,僅字節(jié)一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。大公司的合作方式主要是和英偉達原廠直接談采購,能否搶到卡,更多是看商業(yè)關系,比如以往是不是英偉達的大客戶。

而在龐大的需求面前,據傳英偉達甚至開始學起了愛馬仕,在購買搶手的 GPU 時,也需購買其它產品作為取得優(yōu)先供應權的“配貨”。

在這場大模型研發(fā)競速賽中,相比超級大廠,更多小玩家只能先把名字寫進等待名單。而無論哪一方歷經蕩滌、最終勝出,作為算力供應者的英偉達都能穩(wěn)拿訂單,笑到最后。

02、黃仁勛的運氣有多好?

在商界一直有一種說法:當淘金者蜂擁而至時,獲得財富就變成了小概率事件。最后掙到錢的,更可能是站在淘金者身邊“賣鏟子”的人。

一位科技賽道的投資人對「市界」回憶:在前幾年的AI行業(yè)資本寒冬中,“泡沫破滅時,投資人和企業(yè)突然意識到,(算法創(chuàng)業(yè))成本極高,都是在虧錢,反而讓上游賺錢了。”

而在AI這個近年來最大的科技風口面前,英偉達便是那個第一批站在上游、得以幸運“起飛”的公司。

在今年5月舉辦的英偉達業(yè)績電話會上,英偉達創(chuàng)始人、總裁兼CEO黃仁勛直言:今年1月以來出現(xiàn)的新產品需求“不可思議地陡峭”,公司訂單“多到難以置信”。

不僅市場對英偉達產品瘋狂競逐,資本也展現(xiàn)出了慷慨的態(tài)度。5月30日,英偉達成為全球首家市值突破萬億美元的芯片設計商。

▲(2015年至今英偉達股價走勢圖)

當有記者向黃仁勛提問:“(在新一輪AI浪潮中)英偉達獲得的豐厚回報是因為運氣,還是因為有先見之明?”黃仁勛并不諱言英偉達人氣暴漲的“運氣”成分:“我們只是相信總有一天會有新的東西發(fā)生,其余的需要一些偶然性。”

如今已經無人在意,短短一年之前,英偉達還陷在營收不及預期、股價滑坡的漩渦之中。如果沒有AIGC的“天降神力”,看上去這將是一個已發(fā)生過無數次的“商業(yè)先行者”遺憾折戟的故事。

過去數年間,英偉達的高端顯卡更多被用于PC游戲和虛擬貨幣“挖礦”之上。疫情之下,受益于消費電子需求暴增,英偉達股價也隨之連番上漲。2021年,英偉達股價最高升至300多美元,創(chuàng)歷史高點。

但進入到了后疫情時代,隨著游戲市場遇冷,疊加虛擬貨幣持續(xù)波動,2023財年的前三個季度中,英偉達營收連續(xù)下滑,凈利潤大幅縮水。與之相應的,公司股價在2022年8月,跌至了年內最低的每股108美元。與2021年高點相比,市值僅余三分之一。

不過,到了2022年底,隨著ChatGPT橫空出世,英偉達一舉扭轉頹勢,成為了被全球追捧的明星。截至6月23日美股收盤,英偉達股價已升至422.90美元。

在英偉達一飛沖天的同時,人們開始追溯,這是否是一個關于決策者“深謀遠慮”的故事。而黃仁勛本人對此的定義是:“這不是先見之明。先見之明是加速計算。”

因為在某種程度上,用GPU訓練AI模型的歷史正是由英偉達開啟的。

2010年,據媒體報道,英偉達首席科學家兼高級研究副總裁Bill Dally與其好友、全球AI領域權威學者吳恩達某天在咖啡店里共進早餐。彼時,吳恩達正在谷歌進行AI研究,但在推進課題過程中遇到了算力不足問題。

如果想要補上吳恩達團隊面臨的算力缺口,谷歌需要新購置約1.6萬塊CPU(中央處理單元)。以英特爾在2010年發(fā)布的服務器CPU產品至強X5680為例,后者當年的單價約為1666美元,1.6萬塊合計需要約2700萬美元。

這筆預算足夠讓吳恩達的研究胎死腹中。據數據分析機構“PitchBook”調研,2010年全球AI和機器學習領域獲得的風險投資還不足5億美元。

Bill Dally聽說了吳恩達的煩惱后,建議他用英偉達的GPU替代CPU來進行AI訓練。由于CPU采用串行計算方式,更擅長邏輯控制,但數據處理效率較低。而英偉達的GPU產品采用了其自研的并行計算架構“CUDA”,能夠將任務分解成若干部分同時解決。最終,吳恩達團隊果然僅用48塊GPU并聯(lián),就解決了問題。

在此之后,越來越多的研究團隊開始將英偉達芯片用于AI訓練使用。而黃仁勛也在看到AI市場的巨大機遇后,從2012年開始,將AI列為了重要的發(fā)展方向。

某種程度上,在10年前AI落地應用還是模糊一片的背景下,便在深度學習層面開始布局,確實代表了黃仁勛的“先見之明”。

就職于硅谷某AI芯片獨角獸公司的Lee對「市界」講到:對芯片企業(yè)而言,在2012年投入深度學習的計算是一個非常難得的選擇。據他回憶:“2012年是大數據時代的巔峰,最賺錢的市場是互聯(lián)網數據庫、文件系統(tǒng)等等,做深度學習可以說是‘冷板凳’。而且英偉達是圍繞著深度學習的主題進行全方位、點點滴滴的下注,包括完善語言設計、開發(fā)者工具等周邊軟件工具。”

03、國產GPU奮力追趕

對于英偉達的成功原因,黃仁勛曾這樣總結:“我們很早地,大約在10年前就發(fā)現(xiàn),(AI)這種制作軟件的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。”

從2016年開始,英偉達旗下的加速計算GPU產品線(代號“Tesla”)開始專門針對AI訓練任務進行設計。這一年推出的芯片型號為P100,同時配備有英偉達新研發(fā)的高速互聯(lián)技術“NVLink”。而NVLink能夠允許CPU、GPU芯片間進行高速交互,進一步提升了運算效率。

從底層到頂層搭建起的軟硬件產品生態(tài),也是英偉達在這輪AI風口,因其長期布局和最大的確定性,得以受到資本熱捧的原因。但從市嘗技術等角度考慮,英偉達當下構建的“算力帝國”也還遠遠談不上固若金湯。

根據2023財年財報顯示,中國是英偉達的第一大目標市場,英偉達在中國市場實現(xiàn)的營收占其全球市場營收的47%。而在政策限制下,英偉達難以向中國市場銷售A100、H100高端芯片,無疑將對其營收造成重擊。

黃仁勛個人,從不掩飾對于中國市場的期望。5月底他在接受《金融時報》采訪時,抱怨美國政府對于半導體技術的出口限制使得英偉達束手束腳,警告持續(xù)升級的中美芯片戰(zhàn)將令美國科技業(yè)面臨遭受“巨大損害”的風險。“如果失去了中國市場,我們并沒有應急計劃。因為世界上沒有其他中國,中國只有一個。”

但在英偉達高端顯卡出口受阻的態(tài)勢下,許多中國客戶不得不轉向其他選擇。而細細數來,市場中英偉達的挑戰(zhàn)者并不少。

王非告訴「市界」:“我一些做AIGC項目的客戶選擇了海光的國產顯卡DCU Z100L。據我所知,海光的產品目前已經用到了多個國產大模型里。”

另一位大模型應用層的創(chuàng)業(yè)者則透露,由于買不到A800,其所在的團隊緊急購置了一批英偉達的消費級顯卡GeForce RTX 4090,“未來會考慮其他選擇,或者更多配置云計算資源”。

在供應端,天數智芯、摩爾線程等國產GPU廠商已經開始積極推動產品落地于大模型訓練領域。

6月10日,天數智芯對外宣布,經過驗證,其研發(fā)的國內首款量產的通用GPU“天垓100”具備支持百億級參數大模型訓練的能力。據稱,在天垓100加速卡的算力集群支持下,北京智源研究院70億參數的“Aquila”語言基礎模型完成了參數優(yōu)化工作。6月上旬,摩爾線程則宣布其已經完成對智源研究院“悟道天鷹”大模型的推理兼容適配,整個適配過程僅花費不到6小時時間。

除了國產GPU玩家,“AI芯片第一股”寒武紀、阿里巴巴旗下芯片企業(yè)“平頭哥”的產品同樣可以用于運行AI相關任務。

6月19日,“國產CPU第一股”龍芯中科在投資者交流平臺公開表示,其已完成通用GPU相關IP設計,預計第一個集成自研通用GPU核心的SOC芯片(系統(tǒng)級芯片)計劃于2024年Q1流片,在此基礎上將研制兼顧顯卡和計算加速卡功能的通用GPU芯片,計劃于2024年下半年流片。

服務器廠商南京坤前計算機的一位客戶經理總結道,在AIGC等大模型應用領域中,國產產品已經可以部分滿足客戶需求。他講道:“不僅是現(xiàn)在,在未來的一段時間內英偉達GPU供不應求也是可預見的,但我認為不必過于追求英偉達。只要算力集群足夠大,國產卡也夠用,就算國產卡帶寬少一點,運算的時間多一點,起碼可以實現(xiàn)自主。”

此外,從6月上旬開始,市場便不斷傳出知名資管機構與大股東對英偉達的減持計劃。實際上,英偉達“算力帝國”的縫隙也已經開始顯現(xiàn)。

6月6日,背后站著老牌歐洲金融世家羅斯柴爾德家族、管理資產近900億美元的愛德蒙得洛希爾資產管理公司透露,已經將部分英偉達頭寸獲利了結。主要原因是:AI估值太高,越來越不確定。如果估值繼續(xù)上漲,機構會變得謹慎。知名投資估值專家Aswath Damodaran也表示,賣掉了英偉達的股票,因為“這輪上漲太驚人”。

事實上,黃仁勛自己便可能是硅谷最具危機感的企業(yè)家,他曾多次公開提到:“我一直認為我們距離倒閉只有30天的時間。”最近,他也在采訪中表達了擔心:認為在英偉達因政策而“缺席”的這段時間,中國的GPU初創(chuàng)企業(yè)會很快追趕上來。

(文中王非、郭麗婕為化名)

作者 | 董溫淑

編輯 | 李 原

運營 | 劉 珊

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港