展會信息港展會大全

華為麒麟9000S啟示:中國人工智能和半導(dǎo)體技術(shù)崛起,美國制裁已失敗
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-14 13:52:56   瀏覽:13080次  

導(dǎo)讀:華為發(fā)布Mate 60 Pro已經(jīng)過去了一段日子,美國的技術(shù)觀察者和政策分析者,仍處于突然得知中國在重重限制下突破7nm工藝的震驚中。 知名技術(shù)播客semianalysis寫了一篇長文,詳細(xì)分析了華為在芯片領(lǐng)域的突破,它的良率、產(chǎn)能與擴產(chǎn),它對蘋果、高通與聯(lián)發(fā)科等全...

華為發(fā)布Mate 60 Pro已經(jīng)過去了一段日子,美國的技術(shù)觀察者和政策分析者,仍處于突然得知中國在重重限制下突破7nm工藝的震驚中。

知名技術(shù)播客semianalysis寫了一篇長文,詳細(xì)分析了華為在芯片領(lǐng)域的突破,它的良率、產(chǎn)能與擴產(chǎn),它對蘋果、高通與聯(lián)發(fā)科等全球巨頭的沖擊,以及它實現(xiàn)5nm制程的可能性。文章還分析了中國將如何借此提升國內(nèi)AI芯片制造能力,實現(xiàn)在大模型與人工智能領(lǐng)域的突破。

文章站在美國的立場,很悲觀地指出,按照美國商務(wù)部去年制定的標(biāo)準(zhǔn),已經(jīng)無法阻止中國突破壁壘。作者進而提出了一大串強化限制的措施,即使這將使成本因再復(fù)制一套半導(dǎo)體供應(yīng)鏈而高得離譜。這也值得中國的芯片從業(yè)者與政策制定者警惕一些美國制裁失敗論背后的真實用意。

原文選擇核心章節(jié)編譯如下,文字有刪改,供批判閱讀:

華為麒麟9000S

讓我們直接進入熱點話題。

華為由中芯國際生產(chǎn)的麒麟9000S,使用華為定制的Armv9內(nèi)核和GPU架構(gòu)。在中國,設(shè)計領(lǐng)先架構(gòu)是一件大事。

雖然美國過去已經(jīng)阻止了AMD和英特爾與中國的各種CPU交易,但它還沒有能阻止Arm。

部分原因是Arm在中國的合資企業(yè)不受其直接控制。另一個原因是Armv9指令集來自Arm劍橋。此外,他們還利用Arm許可的A510內(nèi)核(基于ARMv9 64位指令集架構(gòu))。它由Arm法國索菲亞研發(fā)中心和劍橋設(shè)計。

從技術(shù)上講,這款芯片令人驚嘆。在各種測試中,性能和功耗與1-2年前的高通芯片(S888和S8G1)相媲美。芯片的射頻方面也令人驚嘆,使用的集成調(diào)制解調(diào)器與高通當(dāng)前的最佳產(chǎn)品媲美。

鑒于華為在被禁止使用臺積電之前,就稍微領(lǐng)先于高通,這并不令人驚訝。最重要的一點是,射頻前端芯片也是國內(nèi)生產(chǎn)的,這是許多人原本認(rèn)為的中國所缺乏的能力。

最令人震驚的發(fā)現(xiàn)是,當(dāng)對相同IP進行直接比較時,建立在中芯國際N+2(7納米)工藝上的華為麒麟9000S上的Arm A510,與2022年高通在三星4LPX工藝上生產(chǎn)的S8G1相比,性能和功耗實際上是相當(dāng)?shù)模M管它們的工藝技術(shù)還存在差距。

這表明中芯國際N+2比大多數(shù)西方國家意識到的要好。這些芯片之所以如此接近,部分原因是三星的良率較低,中芯國際的良率較高。

簡而言之,麒麟9000S是一個比西方意識到的更好的設(shè)計芯片。它有穩(wěn)定的功耗和性能。即使出口管制不理想,這也是一個在2021年將位于前列的先進芯片,而且是在沒有EUV、沒有尖端美國知識產(chǎn)權(quán)的情況下完成的。

對聯(lián)發(fā)科、高通和蘋果的影響

量化它對蘋果的影響非常簡單。

由于2019年下半年,華為遭到了禁令,蘋果額外獲得了大約3500萬至4500萬部iPhone銷量。這輕松地為蘋果帶來了超過200億美元的年收入。如果華為能夠重拾舊路,這些都可能會蒸發(fā)。這只是智能手機。對平板電腦、智能手表和筆記本電腦的影響,對蘋果來說將更大。

對聯(lián)發(fā)科和高通的影響甚至更糟。

在華為被禁之后,市場上每年消失了1.9億的華為SoC單元。聯(lián)發(fā)科和高通是主要受益者。從2020年到現(xiàn)在,這一份額轉(zhuǎn)移到了小米、OPPO和Vivo等其他中國廠商。如果華為重拾雄風(fēng),我們預(yù)計聯(lián)發(fā)科和高通將最多損失76億美元的收入。

高通可能受到?jīng)_擊的估算

當(dāng)然,這發(fā)生在14億部智能手機市場,目前的運行率低于12億部。

華為重拾佳績的能力,主要取決于中芯國際的制造能力。我們認(rèn)為后者非常強大。

真正的7納米,不錯的良率

就密度而言,該工藝是真正的7納米工藝。雖然與臺積電2018年7納米的不同,但它應(yīng)被視為類似的工藝技術(shù)。中芯國際最多只落后臺積電幾年,落后英特爾和三星更少。

由于中芯國際正在復(fù)制其他地方已經(jīng)完成的工作,加上來自中國內(nèi)地以及許多從臺積電挖角的臺灣移民組成的優(yōu)秀工程師團隊,這個差距可能會進一步縮校

如前所述,它在性能和功耗方面與三星的4LPX相當(dāng)。它最大的大問題是良率與產(chǎn)能。

雖然一些評論員聲稱良率只有10%,但我們不這么認(rèn)為。事實上,我們認(rèn)為中芯國際工藝良率很高。這里沒有確定的數(shù)字,但有一些數(shù)據(jù)點表明了這一點。

為什么?我們聽說中國的消息來源輕描淡寫地說良率很好。據(jù)說,他們的D0(平均缺陷密度,表示每單位面積下的故障數(shù))當(dāng)前約為0.14。相比之下,臺積電的N5和N6節(jié)點約為其一半。當(dāng)然,臺積電是黃金標(biāo)準(zhǔn),三星與英特爾的“7納米”更接近,盡管仍領(lǐng)先于中芯國際目前的成就。

良率如此可觀,就是中芯國際N+2工藝健康發(fā)展的巨大信號。參數(shù)良率是更重要的未知指標(biāo)。但道聽途說是不夠的。

更有說服力的證據(jù)是FinFET(形狀與魚鰭相似的晶體管)上的通道、柵極和漏極,觸點以及較低的金屬層(這些術(shù)語都描述了芯片的結(jié)構(gòu)元素,它們與性能相關(guān))看起來相當(dāng)干凈。低良率的工藝可能不會那么統(tǒng)一。參見TechInsights公開簡報中的這些圖像。

最后一個原因,與芯片的Binning相關(guān)。在半導(dǎo)體制造中,這是指在制造和測試后對集成電路(如CPU或GPU)根據(jù)其性能和質(zhì)量進行排序和分類的過程。

雖然芯片可能存在被稱為災(zāi)難性良率(由于各種物理缺陷導(dǎo)致完全無法工作的芯片數(shù)量占比)的有缺陷晶體管,但在許多情況下,工作的晶體管仍無法通過各種性能和功耗測試。這被稱為參數(shù)良率(在測試期間,能夠達(dá)到設(shè)計目標(biāo)的性能參數(shù)的芯片數(shù)量占比,如指定的時鐘頻率、電壓、功耗等下,在不同環(huán)境下它是可變的)。如果一個工藝技術(shù)的參數(shù)良率較低,管理芯片良率的公司可以通過降低封裝工藝的嚴(yán)格程度。更多芯片可以通過各種測試,但它也會導(dǎo)致更高的可變性(即消費者買到的產(chǎn)品可能差異很大)。

這已經(jīng)在過去良率較差的手機芯片上實現(xiàn)過。

例如,三星4LPX上的高通S8G1。就S8G1而言,具有相同芯片的不同設(shè)備在相同環(huán)境條件下完全過熱時,性能差異可高達(dá)10%以上。雖然我們還沒有看到就麒麟9000S在許多設(shè)備在相同環(huán)境下的嚴(yán)格測試,但在各種中國論壇上有足夠的證據(jù)表明,設(shè)備之間的差異相當(dāng)?shù)汀?/p>

這都不是確定無疑的證據(jù)。但我們認(rèn)為,中芯國際具有不錯的良率。有些評論員聲稱的10%良率,低估其重要性。這是真正的大批量生產(chǎn)工藝。就像蘋果是臺積電工藝節(jié)點的小白鼠,幫助它們提高產(chǎn)能一樣,華為也將以同樣的方式幫助中芯國際。

敬請留意,華為發(fā)布了第一款臺積電N5生產(chǎn)的芯片,因此,他們完全有能力發(fā)揮這個角色。

在兩年內(nèi),中芯國際可能能夠生產(chǎn)用于人工智能和網(wǎng)絡(luò)應(yīng)用的大型單片芯片。這與博通和英偉達(dá)向新工藝技術(shù)過渡的時間尺度相似。

中芯國際的設(shè)備和工具

這是因為他們能夠有效地使用所有臺積電和英特爾擁有的用于其“7納米”工藝的相同工具。雖然在理論上存在工具限制,但它們實際上毫無意義。

盡管中芯國際的N+1工藝已經(jīng)違反了制裁,但美國繼續(xù)向使用美國技術(shù)的半導(dǎo)體制造設(shè)備公司頒發(fā)許可證。中芯國際、長鑫存儲和許多其他中國公司,繼續(xù)進口他們需要的任何工具,追求超過制裁的工藝技術(shù)。美國實際上沒有任何禁令,最終用途檢查也沒有成功。

設(shè)備公司,如應(yīng)用材料、Lam Research、東京電子、KLA、Screen、ASM International、Kokusai等,基本上都在向中國銷售他們提供的所有設(shè)備與工具。

這是因為用于7納米甚至5納米的大多數(shù)沉積、蝕刻、計量、清洗、涂布、顯影、離子注入、外延等工具,也可以合理用于28納米。這些工具以“28納米”的名義,出售給中芯國際。

雖然中芯國際正在擴大28納米和其他低端節(jié)點,但這比他們聲稱的要少得多。因為這些工具正在轉(zhuǎn)向到前沿產(chǎn)品。

出口管制失敗了。

光刻設(shè)備

光刻技術(shù)的世界與其他工具有點不同。確實,對特定的DUV工具,有一些限制。問題是,它們對防止7納米毫無意義。

中國可以并能夠使用目前允許的光刻工具提高7納米產(chǎn)能。NXT: 1980i(DUV光刻機的一款型號)和改進的Di、Ei和Fi工具(另外三款重要光刻機平臺)可以在當(dāng)前限制下進口和維修。

原始的1980i,是臺積電用于將其7納米(N7)提升到每月超過10萬片晶圓的工具,良率非常高。1980i系列也被英特爾用于其“7納米”。

任何熟悉這個領(lǐng)域的人都很清楚這個漏洞。這是一個無效政策的完美例子,其宣稱的目標(biāo)是阻止進一步發(fā)展,同時給中國留下一個明顯的漏洞。ASML繼續(xù)受益,并計劃大幅增加DUV,主要由這些“老”工具主導(dǎo)。

中芯國際的產(chǎn)能不受限制

盡管中芯國際7納米工藝中有60多層光刻,但只有大約40層是關(guān)鍵層。但為了討論的完整性,我們假設(shè)需要最近的1980工具。實際上,來自尼康等供應(yīng)商的較老的ArFi工具,以及ArF/KrF/I-Line(以上均指不同波長的光源,對應(yīng)的是不同的光刻機型號)也可以用于許多層。

ASML聲稱最新1980Fi每小時可以做330層光刻。但我們認(rèn)為,這有點過于樂觀,而且是根據(jù)較低劑量計算的。讓我們保守一點,中芯國際使用ASML聲稱的2倍劑量,而且他們擁有一批Di,而不是Fi。這意味著每個工具每小時可以做約165層。

我們聽說,中芯國際從ASML獲得了超過30臺先進的ArFi工具。他們還訂購了更多的光刻工具,包括最新1980Fi。這些工具支持他們所有工藝節(jié)點,可以用于7納米和5納米。

我們還聽說,他們的第一個7納米Fab將在2024年第二季度末前,擁有15臺ArFi工具。在那之后,還需要幾個季度進行量產(chǎn)調(diào)試。有傳言稱,他們的下一個Fab將更大。來自中國的更多傳言稱,第一個Fab每月將有5萬片7納米晶圓。當(dāng)我們第一次聽說它時,這個數(shù)字似乎太大了。

雖然我們無法驗證這些來自中國的說法,但中芯國際似乎可以很容易地在其7納米廠房中,達(dá)到每月3萬片實際產(chǎn)量,而不需要從其他后端晶圓廠獲取工具。

中芯國際產(chǎn)能的估算

這與他們可以將需要1980i的層數(shù)降低到50層,并使用接近ASML所稱劑量的樂觀估計吻合。

即使良率只有50%,每月3萬片,也可以支持每年超過1000萬片英偉達(dá)H100 GPU芯片。當(dāng)前對類似CoWoS或高帶寬存儲器(HBM)的先進封裝設(shè)備也沒有限制。

5納米是可能的

ASML正在加緊提升到每年可交付超過400臺ArFi工具,并聲稱到2025年,DUV工具產(chǎn)能將達(dá)到600臺。超過一半的產(chǎn)能用于滿足他們認(rèn)為來自中國晶圓廠的需求。雖然這些工具將廣泛分發(fā)給許多公司,但中芯國際是ASML在中國最大的個人客戶。

ASML公開表示,每年額外增加15萬片過剩/低效產(chǎn)能,到2030年過剩/低效晶圓每月將超過150萬片。ASML稱這是由于半導(dǎo)體供應(yīng)鏈的區(qū)域化。但這只是掩蓋了中國實現(xiàn)半導(dǎo)體自給自足,并利用DUV達(dá)到5納米的目標(biāo)。

要非常明確,這已經(jīng)明確地納入了ASML的產(chǎn)能計劃和預(yù)測,即從半導(dǎo)體制造的角度,中國將實現(xiàn)半導(dǎo)體自主。這與他們最后一次投資者日的說法一致。供應(yīng)鏈的其他部分當(dāng)然仍然高度交織,包括設(shè)備、消耗品和設(shè)計IP。

使用ArFi多重曝光技術(shù),可以以高良率實現(xiàn)超過每平方毫米1300萬晶體管的“5納米”工藝。1980i系列的疊加精度,足以在可接受的良率下制造5納米。

鑒于政府補貼水平,這種中芯國際N+3“5納米”工藝的生產(chǎn),也具有經(jīng)濟效益。雖然缺乏EUV,會使我們估計的光刻總成本增加55%至60%。但請記住,光刻當(dāng)前在5納米節(jié)點,只占總工藝成本的約30%。

這意味著總工藝成本只會比使用EUV的5納米高約20%。

良率可能會受到打擊,因此由于每個晶圓的缺陷芯片更多,實際數(shù)字會更高,但對中國來說,這不會是一個無法逾越的障礙。

如果當(dāng)前的限制保持不變,我們預(yù)計,華為和中芯國際將在2025年或2026年擁有真正的5納米芯片。大規(guī)模人工智能芯片也會在不久后問世。當(dāng)前的出口管制,沒有限制中國的制造能力或產(chǎn)能。

中國人工智能能力

制造能力并非遙不可及,但即使沒有這些國內(nèi)制造能力,中國的人工智能能力也將非常強大。

到2024年底,中國總共將擁有超過100萬塊等效英偉達(dá)A100或更好的芯片。請記住,GPT-4是在約2.4萬塊A100上訓(xùn)練的,而即使到明年底,OpenAI擁有的先進GPU也將不到100萬塊。

當(dāng)前對中國的人工智能的限制,充其量也就那么回事。英偉達(dá)很快就制造了與A100和H100具有同等性能的新版本GPU,命名為A800和H800。這些GPU沒有削減總算力或內(nèi)存帶寬。雖然NVLink速度被削減至400GB/s,但對于大多數(shù)并行策略來說,這都不是限制。例如8倍張量并行、完全分片數(shù)據(jù)并行和流水線并行(以上均為并行計算時采用的策略)。這些降級,也無法進行最終用途檢查。如果硬件沒有熔斷,它們可能會像英偉達(dá)以前的加密挖礦限制一樣反轉(zhuǎn)。

此外,對于部署了數(shù)萬塊H100 GPU的最高端系統(tǒng),每個GPU到服務(wù)器外部網(wǎng)絡(luò)上其他GPU的以太網(wǎng)/Infiniband IO只使用50GB/s。限制的門檻是總芯片間IO為600GB/s。在當(dāng)前有缺陷的制裁下,比H100更好的芯片可以在國外制造,然后合法進口。例如,理論上的3納米芯片,其FLOPS是H100的10倍,內(nèi)存帶寬是5倍,以太網(wǎng)/超高速以太網(wǎng)/Infiniband帶寬是500GB/s,可以在當(dāng)前的限制下進口。晶圓級芯片/封裝也可以在當(dāng)前限制下進口。

中國很快就會擁有來自西方公司的尖端芯片,并有能力很快訓(xùn)練出比GPT-4更好的等效模型。

國產(chǎn)人工智能芯片能力

有許多成熟的玩家和人工智能硬件創(chuàng)業(yè)公司,即將能夠提供與英偉達(dá)A100媲美的芯片。

它們包括華為、壁仞、騰訊、阿里巴巴、百度、沐曦等。

我們今天不詳細(xì)介紹它們的能力,但它們可以在2年內(nèi),輕松地在中芯國際7納米工藝上,提供A100級芯片,產(chǎn)量很大。軟件無疑是一個挑戰(zhàn),但中國的軟件開發(fā)者總數(shù)比美國、加拿大和歐洲加起來還要多。這也不應(yīng)該是一個無法逾越的障礙。

這些芯片大多使用了美國企業(yè)的EDA知識產(chǎn)權(quán),如Cadence、Synopsys和Mentor Graphics(Siemens)。華為通過大規(guī)模投資正在快速推進國產(chǎn)EDA。一些玩家像沐曦,通過制造兼容CUDA的芯片,來模仿英偉達(dá)。其他像壁仞,就有許多來自英偉達(dá)上海的設(shè)計師,他們的架構(gòu)與英偉達(dá)的很相似,而且是很好的架構(gòu)。

隨著中國國內(nèi)半導(dǎo)體制造能力的發(fā)展,微架構(gòu)和系統(tǒng)設(shè)計將不斷演進,比H100更好的芯片就在眼前。中國有能力組建和聯(lián)網(wǎng)非常大的超級計算機。此外,中國還擁有領(lǐng)先的光學(xué)制造能力,如中際旭創(chuàng)。先進封裝也在迅速發(fā)展。

先進封裝和光學(xué)的結(jié)合,將使中國能夠在國內(nèi)生產(chǎn)的半導(dǎo)體上保持競爭力,即使被限制在5納米或7納米工藝。

僅明年一年,中國就會有多家公司能訓(xùn)練出優(yōu)于GPT-4的模型。這甚至都不需要質(zhì)疑。

射頻和傳感器

順便說一句,除了一些次要的無效制裁外,幾乎沒有任何針對無線電/傳感器能力的舉措。從歷史上看,通信和傳感器技術(shù)在國防安全中最重要。雖然隨著無人機使用的快速增加,這可能正在改變,但最先進的無人機在硬件上看起來非常像手機硬件。

中國通過各種先進的化合物半導(dǎo)體,繼續(xù)改進這項能力。中國本土的碳化硅和氮化鎵工業(yè)所進口的設(shè)備,也被用于類似的無線電應(yīng)用中。此外,還有許多公司如意法半導(dǎo)體,其技術(shù)是SpaceX Starlink的核心,正在積極合作并進行合資/知識產(chǎn)權(quán)轉(zhuǎn)讓。

這種合資/知識產(chǎn)權(quán)轉(zhuǎn)讓,將在幾乎不需要改造就可以將獲得的技術(shù)應(yīng)用于射頻應(yīng)用的借口下,大大加速中國的能力。

文章鏈接:

https://www.semianalysis.com/p/china-ai-and-semiconductors-rise

贊助本站

人工智能實驗室
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港