當(dāng)前位置：人工智能實驗室> 科技新聞 > 顛覆GPU、打倒英偉達！深扒12家AI芯片獨角獸

顛覆GPU、打倒英偉達！深扒12家AI芯片獨角獸
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-01-14 18:40:00 瀏覽：8441次

導(dǎo)讀：2024開年，去年大漲的科技股一片慘跌，但引領(lǐng)AI浪潮的總龍頭英偉達依然勢頭不減。沒有哪家芯片公司不眼紅英偉達的地位，隨著AI產(chǎn)業(yè)的蛋糕越做越大，硬件賽道也肉眼可見得擁擠起來。大量初創(chuàng)公司正試圖流向英偉達GPU的預(yù)算里分一杯羹。媒體匯總了目前處于競...

2024開年，去年大漲的科技股一片慘跌，但引領(lǐng)AI浪潮的總龍頭英偉達依然勢頭不減。

沒有哪家芯片公司不眼紅英偉達的地位，隨著AI產(chǎn)業(yè)的蛋糕越做越大，硬件賽道也肉眼可見得擁擠起來。大量初創(chuàng)公司正試圖流向英偉達GPU的預(yù)算里分一杯羹。

媒體匯總了目前處于競爭最前線的12家公司。這些初創(chuàng)企業(yè)平均歷史只有五年，融資額度最高的已有7.2億美元，它們都是英偉達的有力挑戰(zhàn)者。

Cerebras

成立時間：2015

應(yīng)用領(lǐng)域：訓(xùn)練

Cerebras以制造巨型芯片聞名。由Gary Lauterbach和Andrew Feldman聯(lián)合創(chuàng)立。兩人還曾經(jīng)聯(lián)合創(chuàng)辦專注于超高密度計算機服務(wù)器業(yè)務(wù)的公司Seammicro，在2012年被AMD以高達3.57億美元的價格收購。

Cerebras的主要產(chǎn)品是可用于AI訓(xùn)練的超級計算機芯片和系統(tǒng)，專為超級計算任務(wù)而構(gòu)建，此類芯片的大小約為普通GPU的56倍。

Cerebras的客戶集中于國防、學(xué)術(shù)實驗室等機構(gòu)。旗艦產(chǎn)品CS-2超算系統(tǒng)已經(jīng)部署在美國能源部阿貢國家實驗室、匹茲堡超算中心、愛丁堡大學(xué)超算中心等地。

不過，雖然已經(jīng)獲得高達7億美元的融資，但受制于英偉達GPU和CUDA生態(tài)的主導(dǎo)地位，Cerebras在爭取商業(yè)客戶方面面臨著艱巨的挑戰(zhàn)。

1月份，公司宣布將與美國頂尖醫(yī)療機構(gòu)梅奧診所合作，梅奧診所將使用Cerebras的計算芯片和軟件，以數(shù)十年的匿名醫(yī)療記錄和數(shù)據(jù)為基礎(chǔ)，開發(fā)專有AI模型。

據(jù)報道，一些模型將能夠讀寫文本，比如為新病人總結(jié)病歷中最重要的部分。其他模型可以分析復(fù)雜的醫(yī)學(xué)圖片或分析基因組數(shù)據(jù)。

Cerebras首席執(zhí)行官Andrew Feldman稱，這是一項為期數(shù)年、價值“數(shù)百萬美元”的協(xié)議。

d-Matrix

成立時間: 2019

應(yīng)用領(lǐng)域：推理

創(chuàng)辦于2019年的d-Matrix正在開發(fā)一種專用芯片和軟件，用于運行機器學(xué)習(xí)模型，公司的芯片可以處理和內(nèi)存結(jié)合在一起，而處理和內(nèi)存通常是芯片上獨立和不同的組件。

d-Matrix的芯片產(chǎn)生的熱量更少，因此需要的冷卻也更少，因此比主流的GPU和CPU芯片更具成本效益。公司CEO表示，許多公司都希望利用大模型設(shè)計AI應(yīng)用，成本非常重要。

d-Matrix選擇專注于推理，即運行AI模型，而非訓(xùn)練。公司認為，隨著時間的推移，模型會越來越大，運行成本也會越來越高。公司已有客戶在測試其芯片和軟件，并計劃在24年上半年將投入商用。

Etched

成立時間：2023

應(yīng)用領(lǐng)域：推理

Etched由兩位哈佛輟學(xué)生Gavin Uberti和Chris Zhu于去年6月創(chuàng)立，公司計劃生產(chǎn)一款名為Sohu的AI推理加速芯片，推理性能為H100的10倍。公司成立不久后估值即達到3400萬美元。

據(jù)報道，在制作工藝上，Sohu采用將變壓器架構(gòu)直接刻芯片核心的革命性方法。因此性能可以達到前所未有的高度，與傳統(tǒng)GPU相比，Sohu在模擬中運行大模型的速度要快140倍。Sohu還支持通過樹搜索更好地編碼，能夠并行比較數(shù)百個響應(yīng)，同時還能進行多重推測解碼（Multicast speculative decoding），可以實時生成新的內(nèi)容。

Etched的博客稱，這種架構(gòu)將允許以無與倫比的效率運行萬億參數(shù)模型。該系統(tǒng)只有一個內(nèi)核，可容納完全開源的軟件堆棧，可擴展至100T參數(shù)模型。

Extropic

成立時間：2022

應(yīng)用領(lǐng)域：推理&訓(xùn)練

Extropic是這幾家初創(chuàng)公司里最神秘的那個。公司創(chuàng)始人出身谷歌專注前沿技術(shù)探索的“登月工廠”部門“X”。據(jù)介紹，Extropic專注于量子計算，同時計劃開發(fā)一款專門用于運行大模型的芯片，但目前仍未有任何關(guān)于具體產(chǎn)品的細節(jié)曝出。

去年年底，公司剛剛完成1410萬美元的種子輪融資。

根據(jù)公司的新聞稿，隨著生成式人工智能的興起，世界對可擴展、高成本效益和高效計算的需求急劇增加，Extropic希望在未來，讓計算機把熵作為一種資產(chǎn)加以利用，通過編程自我學(xué)習(xí)，并以前所未有的效率運行：

Extropic的計算范式建立在熱力學(xué)原理之上，旨在將生成式人工智能與世界的基本物理學(xué)無縫融合。我們的目標(biāo)是將生成式人工智能最終嵌入物理過程，突破物理定律在空間、時間和能量方面規(guī)定的效率極限。

Groq

成立時間：2016

應(yīng)用領(lǐng)域：推理

Graphcore成立于2016年，總部位于英國布里斯托爾。公司主要產(chǎn)品的智能處理單元（LPU），且聚焦于大模型推理。

公司產(chǎn)品最大的特點就是極快的生成速度，可以確保流暢的終端體驗。在消費類AIGC應(yīng)用中，用戶對速度要求很高，而Groq LPU搭配開源模型Meta Llama 2 70B可以實現(xiàn)每秒生成300個單詞，在7分鐘內(nèi)就能生成與莎士比亞的《哈姆雷特》相同數(shù)量的單詞，這比普通人的打字速度快75倍。

Groq聯(lián)合創(chuàng)始人兼首席執(zhí)行官Jonathan Ross認為，對于在產(chǎn)品中使用人工智能的公司來說，推理成本正在成為一個問題，因為隨著使用這些產(chǎn)品的客戶數(shù)量增加，運行模型的成本也在迅速增加。與英偉達GPU相比，Groq LPU集群將為大模型推理提供更高的吞吐量、更低的延遲和更低的成本。

此外，受制于HBM3和CoWoS封裝的產(chǎn)能，英偉達GPU目前的產(chǎn)能無法完全滿足客戶需求，而Groq LPU的獨特之處在于，它不依賴于三星或海力士的HBM，也不依賴于臺積電的CoWoS封裝技術(shù)，因此不會面臨類似英偉達那樣的產(chǎn)能瓶頸。

Lightmatter

成立時間：2017

應(yīng)用領(lǐng)域：訓(xùn)練&推理

Lightmatter利用激光器發(fā)出的光在芯片和服務(wù)器群之間傳輸數(shù)據(jù)，公司由麻省理工學(xué)院的學(xué)生利用該校的專利技術(shù)創(chuàng)立。

據(jù)公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官Nicholas Harris介紹，與英偉達、AMD和英特爾等通過線纜傳輸數(shù)據(jù)的芯片廠商相比，Lightmatter的產(chǎn)品可以讓數(shù)據(jù)中心的能耗成本降低約80%。

MatX

成立時間：2022

應(yīng)用領(lǐng)域：未公布

MatX由前谷歌員工創(chuàng)辦，首席執(zhí)行官Reiner Pope為谷歌Pathways大模型的開發(fā)者之一，首席技術(shù)官Mike Gunter則是谷歌TPU的研發(fā)人員之一。

MatX正在開發(fā)用于文本應(yīng)用的LLM專用芯片。公司表示，與英偉達GPU硬件相比，其自研芯片的運行速度更快，成本更低，可支持包括圖像生成在內(nèi)的多種人工智能應(yīng)用。

MatX稱，公司已經(jīng)得到幾家風(fēng)險投資公司的支持，但未披露具體的資金，還稱已得到“著名大模型開發(fā)商的大力支持”，但也未披露具體公司。

Modular

成立時間：2022

應(yīng)用領(lǐng)域：：推理；今年開始涉足訓(xùn)練

Modular專注于打造用于訓(xùn)練和運行大模型的開發(fā)平臺和編碼語言，用戶可在該平臺上使用各類AI工具，包括谷歌開源軟件TensorFlow和Meta的開源軟件PyTorch。

公司認為，AI開發(fā)如今面臨受到過于復(fù)雜和分散的技術(shù)基礎(chǔ)設(shè)施的阻礙，Modulal的使命是消除大規(guī)模構(gòu)建和維護AI系統(tǒng)的復(fù)雜性。

構(gòu)建和運行人工智能應(yīng)用程序需要大量的計算能力，為控制成本，一家公司可能會使用不同類型的AI芯片，但這些芯片的軟件往往互不兼容。尤其是，英偉達用于編寫機器學(xué)習(xí)應(yīng)用程序的Cuda軟件只能在自家芯片上運行，這基本上將開發(fā)者鎖定在其GPU上。Cuda的用戶粘性極強，有報道稱，一家計算機視覺初創(chuàng)公司花了兩年時間才得以改用非英偉達芯片。

Modular希望通過開發(fā)一種Cuda替代方案來改變這種狀況，解決不同芯片的軟件兼容性問題，讓使用非英偉達芯片變得更容易。

Rain AI

成立時間：2017

應(yīng)用領(lǐng)域：推理&微調(diào)

傳統(tǒng)GPU的訓(xùn)練和推理過程需要消耗產(chǎn)生高昂成本，這部分成本部分源于這些芯片在從內(nèi)存和處理部件傳輸數(shù)據(jù)時產(chǎn)生的熱量，因此，GPU需要持續(xù)冷卻，從而增加了數(shù)據(jù)中心的電力成本。

而Rain AI的NPU芯片可以模擬人類的生物大腦，將內(nèi)存和處理功能結(jié)合在一起，不僅在計算速度和能效方面表現(xiàn)出色，還可以根據(jù)周圍環(huán)境實時定制或微調(diào)人工智能模型。不過公司目前還沒有生產(chǎn)出成品。

據(jù)媒體報道，一份2019年簽訂的意向書顯示，OpenAI計劃斥資5100萬美元購買Rain AI NPU芯片，這些芯片將被用于GPT模型的訓(xùn)練和部署。

Sima.ai

成立時間：2018

應(yīng)用領(lǐng)域：推理

Sima.ai專注于為邊緣計算設(shè)備開發(fā)硬件和軟件，應(yīng)用于飛機、無人機、汽車和醫(yī)療設(shè)備等場景，而非數(shù)據(jù)中心。

公司創(chuàng)始人Krishna Rangasayee曾在芯片制造商賽靈思（Xilinx）工作近二十年。此前，在接受媒體采訪時，他表示，許多行業(yè)由于種種原因無法使用基于云的AI服務(wù)，Sima.ai將專注于服務(wù)那些去中心化的邊緣計算設(shè)備。

例如，自動駕駛汽車需要即時做出決策，只有內(nèi)置的AI才能滿足其對延遲的苛刻要求。而在醫(yī)療保健等行業(yè)，公司可能不希望將敏感數(shù)據(jù)發(fā)送到云端，而希望將其保存在設(shè)備中。

2023年6月，Sima.ai表示已開始量產(chǎn)其第一代邊緣人工智能芯片。公司表示，正在與制造業(yè)、汽車和航空等領(lǐng)域的50多家客戶合作。

Tenstorrent

成立時間：2016

應(yīng)用領(lǐng)域：訓(xùn)練&推理

Tenstorrent由三位前AMD員工創(chuàng)辦，總部位于加拿大多倫多。

Tenstorrent以異構(gòu)和Chiplet設(shè)計的形式來開發(fā)RISC-V和AI芯片。目前已經(jīng)開發(fā)出基于12nm工藝的Grayskull和Wormhole兩款芯片，F(xiàn)P8算力高達328TFlops。公司的目標(biāo)是把價格壓到類似性能GPU的1/5到1/10。

2021年，Tenstorrent還推出了DevCloud，可以讓AI開發(fā)人員無需購買硬件即可運行大模型。

不過，最近幾年，也許是感受到了英偉達等硬件廠商的壓力，Tenstorrent將重心轉(zhuǎn)移到了技術(shù)許可和服務(wù)領(lǐng)域。

Tiny Corp

成立時間：2022

應(yīng)用領(lǐng)域：訓(xùn)練&推理

Tiny Corp由自動駕駛初創(chuàng)公司Comma AI的創(chuàng)始人和前首席執(zhí)行官George Hotz創(chuàng)辦，其產(chǎn)品將以名為tinygrad的開源深度學(xué)習(xí)工具打造，據(jù)悉可幫助開發(fā)人員加快訓(xùn)練和運行大語言模型。

Hotz認為，tinygrad可以成為Pytorch（源自Meta的深度學(xué)習(xí)產(chǎn)品）的“有力競爭者”。但目前他還沒有透露關(guān)于產(chǎn)品的具體細節(jié)。