當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 風(fēng)光背后的苦楚：AI芯片廠商的真實(shí)生存狀態(tài)

風(fēng)光背后的苦楚：AI芯片廠商的真實(shí)生存狀態(tài)
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-04 14:59:15 瀏覽：4395次

導(dǎo)讀：以下文章來源于晶上世界，作者泛靈近年來，人工智能（AI）迅速崛起，成為全球科技和產(chǎn)業(yè)界的焦點(diǎn)。隨著AI技術(shù)的不斷突破和應(yīng)用場(chǎng)景的不斷拓展，市場(chǎng)對(duì) AI PC、AI Phone、AI Car 這些板塊的關(guān)注度持續(xù)拉升，AI芯片作為支撐AI運(yùn)算的核心硬件，也迎來了前所未...

以下文章來源于晶上世界，作者泛靈

近年來，人工智能（AI）迅速崛起，成為全球科技和產(chǎn)業(yè)界的焦點(diǎn)。隨著AI技術(shù)的不斷突破和應(yīng)用場(chǎng)景的不斷拓展，市場(chǎng)對(duì)AI PC、AI Phone、AI Car這些板塊的關(guān)注度持續(xù)拉升，AI芯片作為支撐AI運(yùn)算的核心硬件，也迎來了前所未有的發(fā)展機(jī)遇。

據(jù)OpenAI測(cè)算，從2012年開始，全球AI訓(xùn)練所用的計(jì)算量呈現(xiàn)指數(shù)增長(zhǎng)，平均每3.43個(gè)月便會(huì)翻一倍。AMD則預(yù)計(jì)，2027年全球數(shù)據(jù)中心 AI 計(jì)算市場(chǎng)規(guī)模將超過1500億美元（約合人民幣1.095萬(wàn)億元），年復(fù)合增長(zhǎng)率超過50%。

自英偉達(dá)率先在AI大模型算力芯片市場(chǎng)占據(jù)主導(dǎo)地位，市值突破萬(wàn)億大關(guān)后，英特爾、AMD以及中國(guó)GPU芯片公司也紛紛發(fā)力，渴望在AI芯片市場(chǎng)中分得一杯羹。然而在無(wú)限風(fēng)光的背后，無(wú)論是行業(yè)領(lǐng)導(dǎo)者還是獨(dú)角獸新秀，都有本自家“難念的經(jīng)”。

自研AI芯片的困境

夢(mèng)想與現(xiàn)實(shí)仍有距離

目前AI芯片市場(chǎng)依舊是英偉達(dá)一騎絕塵，據(jù)最新估計(jì)其全球市場(chǎng)份額已達(dá)90%，創(chuàng)下新記錄。然而隨著全球的科技巨頭、云服務(wù)提供商和初創(chuàng)公司都在搶奪算力資源來開發(fā)自己的人工智能模型，英偉達(dá)的芯片供不應(yīng)求，價(jià)格也水漲船高。為了避免受制于人，節(jié)省費(fèi)用，各大巨頭紛紛宣布自研AI芯片。

近期AI圈的熱點(diǎn)之一便是OpenAI首席執(zhí)行官Altman計(jì)劃自研AI芯片，并正在與臺(tái)積電和中東投資者進(jìn)行談判。

亞馬遜作為最先涉足自研芯片的廠商，已擁有兩款A(yù)I專用芯片訓(xùn)練芯片Trainium和推理芯片Inferentia；谷歌則擁有第四代張量處理單元（TPU）；Facebook母公司Meta在十年前就開始努力了，終于在去年5月19日首次官宣了其自研AI芯片MTIA的進(jìn)展；微軟也在 Ignite 2023 大會(huì)上，發(fā)布了用于數(shù)據(jù)中心的AI 芯片Azure Maia 100。

然而，微軟和Meta的研發(fā)進(jìn)度相對(duì)較慢，仍依賴英偉達(dá)的芯片。根據(jù)市場(chǎng)研究公司Omdia Research的最新報(bào)告，2023年，Meta和微軟兩家公司以15萬(wàn)塊H100 GPU的購(gòu)買量并列位居第一。微軟預(yù)計(jì)于去年十一月發(fā)布的AI芯片雅典娜也一再推遲，Meta近日則高調(diào)宣布將花費(fèi)近百億美元購(gòu)入35萬(wàn)個(gè)H100，這也表明其自身研發(fā)并不順利。

2023英偉達(dá)H100的最終出貨量預(yù)估，圖源：Omdia Research

國(guó)內(nèi)廠商寒冬難熬

在過去3-4年里，國(guó)內(nèi)AI芯片企業(yè)可以說是百花齊放，涌現(xiàn)出諸如海思、燧原、寒武紀(jì)、地平線等實(shí)力不菲的廠商，奮力追趕國(guó)外巨頭，希望打破AI芯片的壟斷格局。

然而激昂的呼聲散去，這些過去紅極一時(shí)的獨(dú)角獸們似乎愈來愈命運(yùn)未卜。

近日，壁仞科技的重要成員徐凌杰宣布離職，這是繼GPU產(chǎn)品線總經(jīng)理焦國(guó)方離職后，壁仞科技失去的第二位聯(lián)合創(chuàng)辦人。這一連串的高層變動(dòng)，無(wú)疑給公司的未來發(fā)展蒙上了一層陰影。

與此同時(shí)，曾備受市場(chǎng)矚目的AI芯片企業(yè)寒武紀(jì)也正處于艱難時(shí)期。這家公司已經(jīng)連續(xù)七年虧損，市值大幅縮水，創(chuàng)始投資股東也在減持股份。曾一度籠罩的中科院光環(huán)也幾乎消散，AI芯片市場(chǎng)的泡沫似乎正面臨破裂的風(fēng)險(xiǎn)。從2023年第二季度開始，寒武紀(jì)被曝出裁員消息，近期其子公司行歌科技也宣布將大規(guī)模裁員。

曾在中國(guó)火紅一時(shí)的AI芯片廠，宛如「冬日里的一把火」，未能抵御大環(huán)境緊縮與外在禁令圍剿而陷入寒冬與困境。資本市場(chǎng)對(duì)AI芯片的追捧，也轉(zhuǎn)為對(duì)其的靈魂拷問：能不能撐過今年冬天？

“遙遙領(lǐng)先”的頭部公司同樣不安

“我們不需要假裝公司一直處在危險(xiǎn)之中，我們確實(shí)一直處于危險(xiǎn)之中”，英偉達(dá)創(chuàng)始人黃仁勛在去年十一月的一場(chǎng)演講中表示。

壓力首先來自同行圍剿

產(chǎn)品方面，除了那些“不忠誠(chéng)的”客戶們，紛紛自研芯片，AMD和英特爾和兩個(gè)老對(duì)手，每次發(fā)布新芯片，也都會(huì)和英偉達(dá)作對(duì)比。例如AMD12月6日推出MI300x時(shí)，宣稱表現(xiàn)優(yōu)于英偉達(dá)的AH100。英偉達(dá)隨后發(fā)布了自己的基準(zhǔn)測(cè)試作為回應(yīng)，表明AH100在正確的設(shè)置下仍然更好。AMD再次對(duì)此做出回應(yīng)，發(fā)布了新的基準(zhǔn)測(cè)試，再次顯示MI300X在正確的設(shè)置下表現(xiàn)出色。

生態(tài)建設(shè)方面，英偉達(dá)芯片帝國(guó)的護(hù)城河CUDA也正遭猛烈進(jìn)攻，MLIR、谷歌、OpenAI等正在轉(zhuǎn)向一個(gè)“以Python語(yǔ)言為基礎(chǔ)的編程層”，以使AI訓(xùn)練更加開放。

與白宮的“貓鼠游戲”

近年來，美國(guó)政府為了限制我國(guó)在人工智能領(lǐng)域的發(fā)展，頻頻出臺(tái)或修正出口管制規(guī)定，要求“高性能半導(dǎo)體”不能出口到中國(guó)，英偉達(dá)的王牌芯片A100和H100首先被狙擊，為了保住中國(guó)市場(chǎng)，英偉達(dá)不斷閹割性能以符合規(guī)定，先后推出了“一次降級(jí)芯片”A800和H800、“二次降級(jí)芯片”H20、L20、L2等多款產(chǎn)品，然而國(guó)內(nèi)云計(jì)算公司對(duì)英偉達(dá)的訂單依舊愈來愈少，轉(zhuǎn)而購(gòu)買華為等本土企業(yè)開發(fā)的芯片。

1月26日，美國(guó)商務(wù)部部長(zhǎng)雷蒙多更是直言，美國(guó)正在“盡全力阻止中國(guó)獲得算力”�？梢娒绹�(guó)政府將繼續(xù)收緊對(duì)華出口標(biāo)準(zhǔn)，限制我國(guó)企業(yè)能獲得的算力，進(jìn)而降低訓(xùn)練AI的效率，保持其在人工智能領(lǐng)域的領(lǐng)先地位�？梢�，英偉達(dá)與白宮的這場(chǎng)“貓鼠游戲”還將繼續(xù)進(jìn)行。

伴隨市場(chǎng)丟失的珍貴數(shù)據(jù)

正如上文所提到到，互聯(lián)網(wǎng)巨頭或人工智能公司自研AI芯片正在成為一種趨勢(shì)，盡管困難重重，但他們具備一項(xiàng)英偉達(dá)所必需的重要資源，那就是數(shù)據(jù)。

在AI算法開發(fā)過程中會(huì)遇到的各種問題和數(shù)據(jù)，這些信息反饋給英偉達(dá)時(shí)，英偉達(dá)才能在后續(xù)迭代中，針對(duì)性地改進(jìn)自己的產(chǎn)品，提升使用體驗(yàn)。而我國(guó)在人工智能領(lǐng)域走在世界前列，英偉達(dá)伴隨中國(guó)市場(chǎng)丟失的，將是無(wú)法用數(shù)字統(tǒng)計(jì)的價(jià)值。

AI芯片還有哪些發(fā)展動(dòng)力

盡管發(fā)展勢(shì)頭有所削弱，但得益于供應(yīng)鏈及生態(tài)優(yōu)勢(shì)，英偉達(dá)在AI算力芯片領(lǐng)域的主導(dǎo)地位短期內(nèi)不會(huì)發(fā)生改變。但無(wú)論是芯片企業(yè)，還是下游客戶，都不想看到“英偉達(dá)”一家獨(dú)占鰲頭。

AI芯片的藍(lán)海中，競(jìng)爭(zhēng)正日趨激烈。面對(duì)這樣的市場(chǎng)環(huán)境，AI芯片產(chǎn)業(yè)的發(fā)展動(dòng)力何在？如何發(fā)掘新的競(jìng)爭(zhēng)優(yōu)勢(shì)呢？

存算一體，算力數(shù)量級(jí)提升

以數(shù)據(jù)為主的AI計(jì)算之下，馮諾伊曼架構(gòu)的“存儲(chǔ)墻”和“功耗墻”挑戰(zhàn)凸顯。隨算力增加，處理器核心數(shù)增多，每核心可用帶寬越來越少，限制了整體速度。搬運(yùn)數(shù)據(jù)，成為相當(dāng)大的瓶頸。如果不進(jìn)行存儲(chǔ)優(yōu)化，芯片提供的計(jì)算力會(huì)大大降低。

而當(dāng)下的計(jì)算處理器如CPU，GPU或AI專用芯片等，均采用馮諾依曼架構(gòu)設(shè)計(jì)，80%的功耗發(fā)生在數(shù)據(jù)傳輸上，99%的時(shí)間消耗在存儲(chǔ)器書寫過程中，而真正用于計(jì)算的能耗和時(shí)間其實(shí)占比很低。

因此，只有低功耗基礎(chǔ)上的大算力才是可持續(xù)發(fā)展。

存算一體化是將計(jì)算機(jī)中的運(yùn)算從中央處理器轉(zhuǎn)入內(nèi)存中進(jìn)行，直接在存儲(chǔ)單元內(nèi)部進(jìn)行運(yùn)算，緩解數(shù)據(jù)搬運(yùn)，可大幅降低數(shù)據(jù)交換時(shí)間以及計(jì)算過程中的數(shù)據(jù)存取能耗。

存算一體是現(xiàn)階段實(shí)現(xiàn)高帶寬、低功耗、計(jì)算需求的一條有效途徑，如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn)。誰(shuí)擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu)，誰(shuí)就擁有了打開高能效計(jì)算的金鑰匙。

2019年后，新增的AI芯片廠商，多數(shù)在布局存算一體：據(jù)睿洞察不完全統(tǒng)計(jì)，在2019-2021年新增的AI芯片廠商有20家，在這之中，有10家選擇存算一體路線。整體來看，目前國(guó)內(nèi)外在存算一體方面都處于起步階段，存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期，所以這可能是發(fā)展國(guó)產(chǎn)芯片的另一大重要方向。

數(shù)據(jù)來源：睿洞察

系統(tǒng)級(jí)創(chuàng)新

AMD的CEO蘇姿豐曾指出，按照當(dāng)前計(jì)算效率每?jī)赡晏嵘?.2倍的速度，到2035年，若要達(dá)到十萬(wàn)億億級(jí)的算力，所需功率將高達(dá)500MW，這幾乎相當(dāng)于半個(gè)核電站的輸出功率。面對(duì)如此不切實(shí)際的能源消耗，系統(tǒng)級(jí)創(chuàng)新顯得尤為重要。它不再局限于單一的芯片或電路設(shè)計(jì)，而是需要從上至下，協(xié)同考慮軟件、系統(tǒng)架構(gòu)、封裝技術(shù)等多個(gè)層面，實(shí)現(xiàn)整體性能的優(yōu)化。

同樣，歐洲三大半導(dǎo)體研究機(jī)構(gòu)IMEC、CEA Leti和Fraunhofer的在一次聯(lián)合演講中，也強(qiáng)調(diào)了系統(tǒng)級(jí)創(chuàng)新在未來半導(dǎo)體發(fā)展中的核心地位。隨著半導(dǎo)體工藝逼近物理極限，新的應(yīng)用需求已經(jīng)無(wú)法通過單純的工藝提升來滿足。特別是下一代智能汽車和AI應(yīng)用，它們對(duì)芯片的需求更加復(fù)雜和多樣化，需要從系統(tǒng)層面進(jìn)行整體考慮和創(chuàng)新。

芯片設(shè)計(jì)范式變革，圖片來源：孫凝暉院士集成芯片與芯粒大會(huì)報(bào)告

系統(tǒng)級(jí)創(chuàng)新或系統(tǒng)工藝協(xié)同優(yōu)化，是一種全新的設(shè)計(jì)理念。它從產(chǎn)品需求出發(fā)，反向推導(dǎo)到系統(tǒng)架構(gòu)、芯片設(shè)計(jì)和半導(dǎo)體工藝等各個(gè)環(huán)節(jié)。通過各個(gè)環(huán)節(jié)的協(xié)同優(yōu)化，最終實(shí)現(xiàn)產(chǎn)品性能的大幅提升。這種“由外向內(nèi)”的設(shè)計(jì)思路，打破了傳統(tǒng)半導(dǎo)體設(shè)計(jì)的局限，為行業(yè)帶來了新的發(fā)展機(jī)遇。

蘇姿豐給出了一個(gè)經(jīng)典案例。在對(duì)模型算法層面使用創(chuàng)新數(shù)制（例如8位浮點(diǎn)數(shù)FP8）的同時(shí)，在電路層對(duì)算法層面進(jìn)行優(yōu)化支持，最終實(shí)現(xiàn)計(jì)算層面數(shù)量級(jí)的效率提升：相比傳統(tǒng)的32位浮點(diǎn)數(shù)（FP32），進(jìn)行系統(tǒng)級(jí)創(chuàng)新的FP8則可以將計(jì)算效率提升30倍之多。而如果僅僅是優(yōu)化FP32計(jì)算單元的效率，無(wú)論如何也難以實(shí)現(xiàn)數(shù)量級(jí)的效率提升。這一成果充分證明了系統(tǒng)級(jí)創(chuàng)新在提升計(jì)算效率方面的巨大潛力。

特定域計(jì)算支持工作負(fù)載優(yōu)化，從而提高性能和效率。圖源：ISSCC2023大會(huì)

千帆競(jìng)渡，創(chuàng)新領(lǐng)航

在技術(shù)飛速發(fā)展的時(shí)代，創(chuàng)新是打破技術(shù)壁壘、提升競(jìng)爭(zhēng)力的關(guān)鍵。我國(guó)AI芯片廠商面臨著國(guó)際技術(shù)封鎖和市場(chǎng)競(jìng)爭(zhēng)的雙重壓力，只有通過不斷創(chuàng)新，才能在激烈的競(jìng)爭(zhēng)中立于不敗之地。

未來，異構(gòu)計(jì)算叢集、特定加速單元、先進(jìn)封裝技術(shù)、高速片間UCIe互聯(lián)、存算一體等內(nèi)存技術(shù)，這些技術(shù)的融合和創(chuàng)新，將為半導(dǎo)體行業(yè)帶來新的發(fā)展動(dòng)力和方向。我國(guó)芯片廠商需要緊跟技術(shù)前沿，并敢于推進(jìn)技術(shù)產(chǎn)業(yè)化，畢竟，長(zhǎng)坡厚雪的AI算力芯片賽道，如果缺乏核心競(jìng)爭(zhēng)力而僅靠融資輸血來維持公司研發(fā)投入，很難持久。