展會(huì)信息港展會(huì)大全

風(fēng)光背后的苦楚:AI芯片廠商的真實(shí)生存狀態(tài)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-04 14:59:15   瀏覽:4395次  

導(dǎo)讀:以下文章來源于晶上世界,作者泛靈 近年來,人工智能(AI)迅速崛起,成為全球科技和產(chǎn)業(yè)界的焦點(diǎn)。隨著AI技術(shù)的不斷突破和應(yīng)用場(chǎng)景的不斷拓展,市場(chǎng)對(duì) AI PC、AI Phone、AI Car 這些板塊的關(guān)注度持續(xù)拉升,AI芯片作為支撐AI運(yùn)算的核心硬件,也迎來了前所未...

以下文章來源于晶上世界,作者泛靈

近年來,人工智能(AI)迅速崛起,成為全球科技和產(chǎn)業(yè)界的焦點(diǎn)。隨著AI技術(shù)的不斷突破和應(yīng)用場(chǎng)景的不斷拓展,市場(chǎng)對(duì)AI PC、AI Phone、AI Car這些板塊的關(guān)注度持續(xù)拉升,AI芯片作為支撐AI運(yùn)算的核心硬件,也迎來了前所未有的發(fā)展機(jī)遇。

據(jù)OpenAI測(cè)算,從2012年開始,全球AI訓(xùn)練所用的計(jì)算量呈現(xiàn)指數(shù)增長(zhǎng),平均每3.43個(gè)月便會(huì)翻一倍。AMD則預(yù)計(jì),2027年全球數(shù)據(jù)中心 AI 計(jì)算市場(chǎng)規(guī)模將超過1500億美元(約合人民幣1.095萬(wàn)億元),年復(fù)合增長(zhǎng)率超過50%。

自英偉達(dá)率先在AI大模型算力芯片市場(chǎng)占據(jù)主導(dǎo)地位,市值突破萬(wàn)億大關(guān)后,英特爾、AMD以及中國(guó)GPU芯片公司也紛紛發(fā)力,渴望在AI芯片市場(chǎng)中分得一杯羹。然而在無(wú)限風(fēng)光的背后,無(wú)論是行業(yè)領(lǐng)導(dǎo)者還是獨(dú)角獸新秀,都有本自家“難念的經(jīng)”。

01

自研AI芯片的困境

夢(mèng)想與現(xiàn)實(shí)仍有距離

目前AI芯片市場(chǎng)依舊是英偉達(dá)一騎絕塵,據(jù)最新估計(jì)其全球市場(chǎng)份額已達(dá)90%,創(chuàng)下新記錄。然而隨著全球的科技巨頭、云服務(wù)提供商和初創(chuàng)公司都在搶奪算力資源來開發(fā)自己的人工智能模型,英偉達(dá)的芯片供不應(yīng)求,價(jià)格也水漲船高。為了避免受制于人,節(jié)省費(fèi)用,各大巨頭紛紛宣布自研AI芯片。

近期AI圈的熱點(diǎn)之一便是OpenAI首席執(zhí)行官Altman計(jì)劃自研AI芯片,并正在與臺(tái)積電和中東投資者進(jìn)行談判。

亞馬遜作為最先涉足自研芯片的廠商,已擁有兩款A(yù)I專用芯片訓(xùn)練芯片Trainium和推理芯片Inferentia;谷歌則擁有第四代張量處理單元(TPU);Facebook母公司Meta在十年前就開始努力了,終于在去年5月19日首次官宣了其自研AI芯片MTIA的進(jìn)展;微軟也在 Ignite 2023 大會(huì)上,發(fā)布了用于數(shù)據(jù)中心的AI 芯片Azure Maia 100。

然而,微軟和Meta的研發(fā)進(jìn)度相對(duì)較慢,仍依賴英偉達(dá)的芯片。根據(jù)市場(chǎng)研究公司Omdia Research的最新報(bào)告,2023年,Meta和微軟兩家公司以15萬(wàn)塊H100 GPU的購(gòu)買量并列位居第一。微軟預(yù)計(jì)于去年十一月發(fā)布的AI芯片雅典娜也一再推遲,Meta近日則高調(diào)宣布將花費(fèi)近百億美元購(gòu)入35萬(wàn)個(gè)H100,這也表明其自身研發(fā)并不順利。

2023英偉達(dá)H100的最終出貨量預(yù)估,圖源:Omdia Research

國(guó)內(nèi)廠商寒冬難熬

在過去3-4年里,國(guó)內(nèi)AI芯片企業(yè)可以說是百花齊放,涌現(xiàn)出諸如海思、燧原、寒武紀(jì)、地平線等實(shí)力不菲的廠商,奮力追趕國(guó)外巨頭,希望打破AI芯片的壟斷格局。

然而激昂的呼聲散去,這些過去紅極一時(shí)的獨(dú)角獸們似乎愈來愈命運(yùn)未卜。

近日,壁仞科技的重要成員徐凌杰宣布離職,這是繼GPU產(chǎn)品線總經(jīng)理焦國(guó)方離職后,壁仞科技失去的第二位聯(lián)合創(chuàng)辦人。這一連串的高層變動(dòng),無(wú)疑給公司的未來發(fā)展蒙上了一層陰影。

與此同時(shí),曾備受市場(chǎng)矚目的AI芯片企業(yè)寒武紀(jì)也正處于艱難時(shí)期。這家公司已經(jīng)連續(xù)七年虧損,市值大幅縮水,創(chuàng)始投資股東也在減持股份。曾一度籠罩的中科院光環(huán)也幾乎消散,AI芯片市場(chǎng)的泡沫似乎正面臨破裂的風(fēng)險(xiǎn)。從2023年第二季度開始,寒武紀(jì)被曝出裁員消息,近期其子公司行歌科技也宣布將大規(guī)模裁員。

曾在中國(guó)火紅一時(shí)的AI芯片廠,宛如「冬日里的一把火」,未能抵御大環(huán)境緊縮與外在禁令圍剿而陷入寒冬與困境。資本市場(chǎng)對(duì)AI芯片的追捧,也轉(zhuǎn)為對(duì)其的靈魂拷問:能不能撐過今年冬天?

02

“遙遙領(lǐng)先”的頭部公司同樣不安

“我們不需要假裝公司一直處在危險(xiǎn)之中,我們確實(shí)一直處于危險(xiǎn)之中”,英偉達(dá)創(chuàng)始人黃仁勛在去年十一月的一場(chǎng)演講中表示。

壓力首先來自同行圍剿

產(chǎn)品方面,除了那些“不忠誠(chéng)的”客戶們,紛紛自研芯片,AMD和英特爾和兩個(gè)老對(duì)手,每次發(fā)布新芯片,也都會(huì)和英偉達(dá)作對(duì)比。例如AMD12月6日推出MI300x時(shí),宣稱表現(xiàn)優(yōu)于英偉達(dá)的AH100。英偉達(dá)隨后發(fā)布了自己的基準(zhǔn)測(cè)試作為回應(yīng),表明AH100在正確的設(shè)置下仍然更好。AMD再次對(duì)此做出回應(yīng),發(fā)布了新的基準(zhǔn)測(cè)試,再次顯示MI300X在正確的設(shè)置下表現(xiàn)出色。

生態(tài)建設(shè)方面,英偉達(dá)芯片帝國(guó)的護(hù)城河CUDA也正遭猛烈進(jìn)攻,MLIR、谷歌、OpenAI等正在轉(zhuǎn)向一個(gè)“以Python語(yǔ)言為基礎(chǔ)的編程層”,以使AI訓(xùn)練更加開放。

與白宮的“貓鼠游戲”

近年來,美國(guó)政府為了限制我國(guó)在人工智能領(lǐng)域的發(fā)展,頻頻出臺(tái)或修正出口管制規(guī)定,要求“高性能半導(dǎo)體”不能出口到中國(guó),英偉達(dá)的王牌芯片A100和H100首先被狙擊,為了保住中國(guó)市場(chǎng),英偉達(dá)不斷閹割性能以符合規(guī)定,先后推出了“一次降級(jí)芯片”A800和H800、“二次降級(jí)芯片”H20、L20、L2等多款產(chǎn)品,然而國(guó)內(nèi)云計(jì)算公司對(duì)英偉達(dá)的訂單依舊愈來愈少,轉(zhuǎn)而購(gòu)買華為等本土企業(yè)開發(fā)的芯片。

1月26日,美國(guó)商務(wù)部部長(zhǎng)雷蒙多更是直言,美國(guó)正在“盡全力阻止中國(guó)獲得算力”?梢娒绹(guó)政府將繼續(xù)收緊對(duì)華出口標(biāo)準(zhǔn),限制我國(guó)企業(yè)能獲得的算力,進(jìn)而降低訓(xùn)練AI的效率,保持其在人工智能領(lǐng)域的領(lǐng)先地位?梢,英偉達(dá)與白宮的這場(chǎng)“貓鼠游戲”還將繼續(xù)進(jìn)行。

伴隨市場(chǎng)丟失的珍貴數(shù)據(jù)

正如上文所提到到,互聯(lián)網(wǎng)巨頭或人工智能公司自研AI芯片正在成為一種趨勢(shì),盡管困難重重,但他們具備一項(xiàng)英偉達(dá)所必需的重要資源,那就是數(shù)據(jù)。

在AI算法開發(fā)過程中會(huì)遇到的各種問題和數(shù)據(jù),這些信息反饋給英偉達(dá)時(shí),英偉達(dá)才能在后續(xù)迭代中,針對(duì)性地改進(jìn)自己的產(chǎn)品,提升使用體驗(yàn)。而我國(guó)在人工智能領(lǐng)域走在世界前列,英偉達(dá)伴隨中國(guó)市場(chǎng)丟失的,將是無(wú)法用數(shù)字統(tǒng)計(jì)的價(jià)值。

03

AI芯片還有哪些發(fā)展動(dòng)力

盡管發(fā)展勢(shì)頭有所削弱,但得益于供應(yīng)鏈及生態(tài)優(yōu)勢(shì),英偉達(dá)在AI算力芯片領(lǐng)域的主導(dǎo)地位短期內(nèi)不會(huì)發(fā)生改變。但無(wú)論是芯片企業(yè),還是下游客戶,都不想看到“英偉達(dá)”一家獨(dú)占鰲頭。

AI芯片的藍(lán)海中,競(jìng)爭(zhēng)正日趨激烈。面對(duì)這樣的市場(chǎng)環(huán)境,AI芯片產(chǎn)業(yè)的發(fā)展動(dòng)力何在?如何發(fā)掘新的競(jìng)爭(zhēng)優(yōu)勢(shì)呢?

存算一體,算力數(shù)量級(jí)提升

以數(shù)據(jù)為主的AI計(jì)算之下,馮諾伊曼架構(gòu)的“存儲(chǔ)墻”和“功耗墻”挑戰(zhàn)凸顯。隨算力增加,處理器核心數(shù)增多,每核心可用帶寬越來越少,限制了整體速度。搬運(yùn)數(shù)據(jù),成為相當(dāng)大的瓶頸。如果不進(jìn)行存儲(chǔ)優(yōu)化,芯片提供的計(jì)算力會(huì)大大降低。

而當(dāng)下的計(jì)算處理器如CPU,GPU或AI專用芯片等,均采用馮諾依曼架構(gòu)設(shè)計(jì),80%的功耗發(fā)生在數(shù)據(jù)傳輸上,99%的時(shí)間消耗在存儲(chǔ)器書寫過程中,而真正用于計(jì)算的能耗和時(shí)間其實(shí)占比很低。

因此,只有低功耗基礎(chǔ)上的大算力才是可持續(xù)發(fā)展。

存算一體化是將計(jì)算機(jī)中的運(yùn)算從中央處理器轉(zhuǎn)入內(nèi)存中進(jìn)行,直接在存儲(chǔ)單元內(nèi)部進(jìn)行運(yùn)算,緩解數(shù)據(jù)搬運(yùn),可大幅降低數(shù)據(jù)交換時(shí)間以及計(jì)算過程中的數(shù)據(jù)存取能耗。

存算一體是現(xiàn)階段實(shí)現(xiàn)高帶寬、低功耗、計(jì)算需求的一條有效途徑,如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn)。誰(shuí)擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),誰(shuí)就擁有了打開高能效計(jì)算的金鑰匙。

2019年后,新增的AI芯片廠商,多數(shù)在布局存算一體:據(jù)睿洞察不完全統(tǒng)計(jì),在2019-2021年新增的AI芯片廠商有20家,在這之中,有10家選擇存算一體路線。整體來看,目前國(guó)內(nèi)外在存算一體方面都處于起步階段,存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,所以這可能是發(fā)展國(guó)產(chǎn)芯片的另一大重要方向。

數(shù)據(jù)來源:睿洞察

系統(tǒng)級(jí)創(chuàng)新

AMD的CEO蘇姿豐曾指出,按照當(dāng)前計(jì)算效率每?jī)赡晏嵘?.2倍的速度,到2035年,若要達(dá)到十萬(wàn)億億級(jí)的算力,所需功率將高達(dá)500MW,這幾乎相當(dāng)于半個(gè)核電站的輸出功率。面對(duì)如此不切實(shí)際的能源消耗,系統(tǒng)級(jí)創(chuàng)新顯得尤為重要。它不再局限于單一的芯片或電路設(shè)計(jì),而是需要從上至下,協(xié)同考慮軟件、系統(tǒng)架構(gòu)、封裝技術(shù)等多個(gè)層面,實(shí)現(xiàn)整體性能的優(yōu)化。

同樣,歐洲三大半導(dǎo)體研究機(jī)構(gòu)IMEC、CEA Leti和Fraunhofer的在一次聯(lián)合演講中,也強(qiáng)調(diào)了系統(tǒng)級(jí)創(chuàng)新在未來半導(dǎo)體發(fā)展中的核心地位。隨著半導(dǎo)體工藝逼近物理極限,新的應(yīng)用需求已經(jīng)無(wú)法通過單純的工藝提升來滿足。特別是下一代智能汽車和AI應(yīng)用,它們對(duì)芯片的需求更加復(fù)雜和多樣化,需要從系統(tǒng)層面進(jìn)行整體考慮和創(chuàng)新。

芯片設(shè)計(jì)范式變革,圖片來源:孫凝暉院士集成芯片與芯粒大會(huì)報(bào)告

系統(tǒng)級(jí)創(chuàng)新或系統(tǒng)工藝協(xié)同優(yōu)化,是一種全新的設(shè)計(jì)理念。它從產(chǎn)品需求出發(fā),反向推導(dǎo)到系統(tǒng)架構(gòu)、芯片設(shè)計(jì)和半導(dǎo)體工藝等各個(gè)環(huán)節(jié)。通過各個(gè)環(huán)節(jié)的協(xié)同優(yōu)化,最終實(shí)現(xiàn)產(chǎn)品性能的大幅提升。這種由外向內(nèi)的設(shè)計(jì)思路,打破了傳統(tǒng)半導(dǎo)體設(shè)計(jì)的局限,為行業(yè)帶來了新的發(fā)展機(jī)遇。

蘇姿豐給出了一個(gè)經(jīng)典案例在對(duì)模型算法層面使用創(chuàng)新數(shù)制(例如8位浮點(diǎn)數(shù)FP8)的同時(shí),在電路層對(duì)算法層面進(jìn)行優(yōu)化支持,最終實(shí)現(xiàn)計(jì)算層面數(shù)量級(jí)的效率提升:相比傳統(tǒng)的32位浮點(diǎn)數(shù)(FP32),進(jìn)行系統(tǒng)級(jí)創(chuàng)新的FP8則可以將計(jì)算效率提升30倍之多。而如果僅僅是優(yōu)化FP32計(jì)算單元的效率,無(wú)論如何也難以實(shí)現(xiàn)數(shù)量級(jí)的效率提升。這一成果充分證明了系統(tǒng)級(jí)創(chuàng)新在提升計(jì)算效率方面的巨大潛力。

特定域計(jì)算支持工作負(fù)載優(yōu)化,從而提高性能和效率。圖源:ISSCC2023大會(huì)

千帆競(jìng)渡,創(chuàng)新領(lǐng)航

在技術(shù)飛速發(fā)展的時(shí)代,創(chuàng)新是打破技術(shù)壁壘、提升競(jìng)爭(zhēng)力的關(guān)鍵。我國(guó)AI芯片廠商面臨著國(guó)際技術(shù)封鎖和市場(chǎng)競(jìng)爭(zhēng)的雙重壓力,只有通過不斷創(chuàng)新,才能在激烈的競(jìng)爭(zhēng)中立于不敗之地。

未來,異構(gòu)計(jì)算叢集、特定加速單元、先進(jìn)封裝技術(shù)、高速片間UCIe互聯(lián)、存算一體等內(nèi)存技術(shù),這些技術(shù)的融合和創(chuàng)新,將為半導(dǎo)體行業(yè)帶來新的發(fā)展動(dòng)力和方向。我國(guó)芯片廠商需要緊跟技術(shù)前沿,并敢于推進(jìn)技術(shù)產(chǎn)業(yè)化,畢竟,長(zhǎng)坡厚雪的AI算力芯片賽道,如果缺乏核心競(jìng)爭(zhēng)力而僅靠融資輸血來維持公司研發(fā)投入,很難持久。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港