展會信息港展會大全

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨
來源:互聯(lián)網   發(fā)布日期:2023-09-21 09:45:56   瀏覽:9325次  

導讀:芯東西9月18日報道,9月14日-15日,2023全球AI芯片峰會(GACS 2023)在深圳市南山區(qū)圓滿舉行。開幕首日現(xiàn)場人氣十分火爆,不僅全場座無虛席,連會場大門都里三層外三層擠滿了熱情聆聽的觀眾,許多觀眾甚至站著聽完了全程。峰會全程啟動云直播,全網觀看人數...

芯東西9月18日報道,9月14日-15日,2023全球AI芯片峰會(GACS 2023)在深圳市南山區(qū)圓滿舉行。開幕首日現(xiàn)場人氣十分火爆,不僅全場座無虛席,連會場大門都里三層外三層擠滿了熱情聆聽的觀眾,許多觀眾甚至站著聽完了全程。峰會全程啟動云直播,全網觀看人數高達153萬人次。

這場高規(guī)格產業(yè)會議由智一科技旗下芯東西聯(lián)合智猩猩發(fā)起主辦,在南山區(qū)科技創(chuàng)新局的指導下以“AI大時代 逐鹿芯世界”為主題,設置七大板塊,主會場包括開幕式和AI芯片架構創(chuàng)新、AI大算力芯片和高能效AI芯片三大專場,并公布2023中國AI芯片企業(yè)「先鋒企業(yè) TOP30」和「新銳企業(yè) TOP10」評選結果;分會場包括首次增設的集成電路政策交流會、AI芯片分析師論壇、智算中心算力與網絡高峰論壇。

本屆峰會針對行業(yè)變化,圍繞AI芯片的學術研究、GPGPU、ASIC、Chiplet、存算一體、智算中心等方向設置議程,邀請46+位嘉賓暢談生成式AI與大模型算力需求、投融資機遇、架構創(chuàng)新、商用落地等AI芯片焦點議題。

在首日舉行的主會場上,清華大學教授、中國半導體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍進行主題報告《再談人工智能芯片的發(fā)展》,來自英偉達、燧原科技、高通、億鑄科技、北極雄芯、AMD、奎芯科技、后摩智能、安謀科技、鯤云科技、珠海芯動力、芯至科技、每刻深思等12家國內外頂尖AI芯片企業(yè)及新銳企業(yè)的創(chuàng)始人、技術決策者及高管分別發(fā)表主題演講,分享對AI芯片產業(yè)趨勢的前沿研判與最新實踐。

深圳市南區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)代表深圳市南山區(qū)科創(chuàng)局,對峰會的召開表示熱烈祝賀,并為本屆峰會致辭。他表示,2023全球AI芯片峰會(GACS 2023)定位于集成電路與高科技產業(yè)政策的宣傳平臺、全球AI芯片產業(yè)的集聚與交流的平臺,嘉賓陣容強大,內容豐富,并專設深圳集成電路政策交流會,對推動深圳AI芯片產業(yè)高質量發(fā)展具有重要的意義。

▲深圳市南區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常作為主辦方發(fā)表致辭,宣布智一科技深圳總部正式落戶南山區(qū)西麗湖國際科教城,智東西公開課品牌正式升級為「智猩猩」,深圳總部將承擔西麗湖國際科教城的智猩猩AI產業(yè)服務平臺的建設,未來希望與大灣區(qū)的企業(yè)有更多的合作。智猩猩由智東西公開課全新升級而來,定位于新科技服務平臺,聚焦人工智能與新興科技,面向企業(yè)側和用戶側提供價值服務。

▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常

通過峰會首日的AI芯片峰會嘉賓分享和觀點碰撞,我們探討了生成式AI與大模型帶來的算力壓力與機遇,看到了產學界如何通過越來越廣泛的創(chuàng)新思路來繞過摩爾定律瀕臨極限的瓶頸,見證了存算一體、可重構計算、“算力統(tǒng)一場”等各路創(chuàng)新流派百家爭鳴。通過這場干貨滿滿的AI芯片產業(yè)盛宴,我們總結了以下五大趨勢:

1、生成式AI和大模型正在主導AI應用,得算力者得天下,要求產業(yè)從芯片設計、通信、集群、軟件等多方面進行優(yōu)化AI芯片研發(fā)和落地,以實現(xiàn)更高性能、更低時延、更低成本。

2、現(xiàn)實算力資源和理想的算力資源存在鴻溝。一方面AI芯片產業(yè)繼續(xù)追求大算力,另一方面則通過架構創(chuàng)新及軟件定義新方式突破算力瓶頸。

3、隨著芯片制程工藝觸碰天花板,架構創(chuàng)新有望迎來“黃金十年”。比如感存算一體架構有望通過破除“存儲墻”,降低海量數據搬運負擔;可重構計算架構通過提高芯片利用率,用設計換制程;Chiplet則通過拆分組合實現(xiàn)異構集成,提高芯片性能,這些領域都已涌現(xiàn)出創(chuàng)業(yè)先行者。

4、Transformer正通過統(tǒng)一的大模型構建一個“大樹型”的統(tǒng)一濃縮生態(tài),解決過去多個“小樹苗”AI生態(tài)的碎片化痛點。因此AI芯片企業(yè)可以通過硬件、軟件、系統(tǒng)、方案多產業(yè)聯(lián)動促進AI芯片商業(yè)化落地。

5、從資本市場來看,一級市場的監(jiān)管政策客觀上會促進AI芯片產業(yè)資源重新配置,IPO收縮或具有短期性;二級市場出現(xiàn)的“炒作”現(xiàn)象客觀上為一級市場吸引了投資。

一、魏少軍:大模型時代再談AI芯片發(fā)展,大算力不是最終挑戰(zhàn)

本屆峰會的開場主題報告嘉賓,是AI芯片學術研究的代表人物清華大學教授、中國半導體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍。他引用2017年圖靈獎得主John L. Hennessy和David A. Patterson的金句“現(xiàn)在是計算機架構的新黃金年代”,談到步入泛在計算時代,計算無處不在,對智能計算的要求越來越緊迫。

經演變,人工智能現(xiàn)在分成了兩大類別:類腦計算和深度學習。類腦計算,即模仿人腦的計算方式。沿著類似思路,漸有起色的是存算一體,比起傳統(tǒng)存算分離架構,可將能效提升10倍,但這種架構目前只能模仿到人腦機制的皮毛。另一個方向是深度學習,2018年獲得圖靈獎的“深度學習三巨頭”通過神經網絡不斷運算來達到計算目標,構成了深度神經網絡。這促使今天的人工智能包含三要素:算法、數據、算力。算力的挑戰(zhàn)決定了我們需要找到新的計算架構。

▲清華大學教授、中國半導體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍

在參加GTIC 2019全球AI芯片創(chuàng)新峰會時,魏少軍教授曾分享過一張圖,將AI芯片(AI Chip)分為三個階段:0.5階段是利用已有芯片來實現(xiàn),1.0階段開發(fā)面向應用的領域專用芯片,1.5階段更強調通用性、靈活性,2.0階段的最終結論是能不能真正實現(xiàn)智能。如今再看這張圖,他認為中間應該加個階段AI Chip 1.7。

在他看來,大算力可能是當前面臨的最大挑戰(zhàn),但不是最終挑戰(zhàn)。1.7階段強調的是對通用性的理解,今天AI芯片的通用性已經被異化成大算力,計算能力成為追求目標,但它只是演進過程的中間階段。找到AI Chip 2.0階段的完全智能化,那才是我們的終極目標。

通向這一目標,需要賦予芯片自學習和接受教育的能力,以不斷提升性能和效率。他提出要尋找到一個具備軟件和硬件雙可編程的體系,即軟件定義芯片,英偉達、英特爾及一些美國頂尖科研團隊都在研究這一技術。

“中國人在這方面做的是最快的,也是最好的,我們實現(xiàn)了芯片架構和功能的納秒級重啟。”魏教授說,基于可重構計算架構的軟件定義芯片,計算效率永遠是最高的,功耗和成本都大幅下降,實現(xiàn)了應用與芯片的最優(yōu)整合。目前,其團隊已在在線編程、訓練方面實現(xiàn)了相當一部分這樣的功能。

二、ChatGPT催生算力新機遇,云邊端AI芯片熱戰(zhàn)大模型

ChatGPT掀起生成式AI熱潮后,大算力芯片迎來前所未有的發(fā)展機遇,新的挑戰(zhàn)也接踵而來。

高通AI產品技術中國區(qū)負責人萬衛(wèi)星分享了高通對生成式AI未來發(fā)展趨勢的觀察:隨著云端處理生成式AI的成本不斷提升,未來云經濟將難以支撐生成式AI的規(guī);l(fā)展。此外,基礎模型正在向多模態(tài)擴展,模型能力越來越強大,而垂直領域模型的參數量也正在變得越來越校未來,豐富的生成式AI模型將在終端側運行,讓大眾享受到生成式AI帶給生活、工作、娛樂上的變革。

▲高通AI產品技術中國區(qū)負責人萬衛(wèi)星

NVIDIA解決方案與架構技術總監(jiān)張瑞華認為:“生成式AI和大模型是人工智能目前最重要的領域,也是對算力資源需求最高的人工智能應用。由于模型的訓練和推理的計算范式都發(fā)生了變革,所以現(xiàn)實算力資源和模型發(fā)展所需要的理想算力資源之間還有很大的差距。隨著用戶空間的巨量增長,還需考慮成本、實時性等問題。這是生成式AI和大模型時代所面臨的計算挑戰(zhàn)。”

接下來以大模型GPT-3 175B為例,她分享了存儲空間、計算、網絡通信和系統(tǒng)設計方面模型訓練的需求和計算特點,繼而提出在GPU設計、AI服務器設計和AI集群設計方面需要關注的技術熱點,并分享了NVIDIA的參考架構。軟件生態(tài)更是AI計算中心的靈魂,NVIDIA NeMo框架為生成式AI和大模型訓練提供全生命周期的支持,TensorRT-LLM為新計算范式下的推理提供支持。張瑞華總結到:在生成式AI和大模型的時代,NVIDIA新的技術生態(tài)端到端地賦能用戶的AI旅程。

▲NVIDIA解決方案與架構技術總監(jiān)張瑞華

芯片巨頭AMD在MI Instinct GPU方面擁有大量的技術積累以及基于CDNA3的架構創(chuàng)新。AMD人工智能事業(yè)部高級總監(jiān)王宏強談道,AMD在單個GPU能做到上千T的浮點算力規(guī)模,通過多節(jié)點橫向擴展,更是能達到每秒百億億次浮點計算能力(EFLOPS),并提供額外的超大內存容量及帶寬,可實現(xiàn)700億參數級大模型在單個GPU上的部署,并達到更高的TCO(總擁有成本)。

王宏強也特別強調了易用AI軟件以及強大的開放軟件生態(tài)的重要性,它是釋放這些創(chuàng)新硬件性能的關鍵。AMD通過統(tǒng)一AI軟件實現(xiàn)跨平臺AI部署,以開放和模塊化的方式構建軟件解決方案,從而擁抱更高層次的抽象,并與最重要的生態(tài)系統(tǒng)(PyTorch, ONNX, Triton HuggingFace等)合作對接推動開箱即用的用戶體驗。

▲AMD人工智能事業(yè)部高級總監(jiān)王宏強

云端AI芯片獨角獸企業(yè)燧原科技也在積極備戰(zhàn)大模型算力需求。其創(chuàng)始人兼COO張亞林談道,參數量高達數千億的大模型,依賴分布式計算、更大的內存容量和帶寬、更高算力、更實惠的成本或性價比,對AI芯片生態(tài)提出更高要求。

他打了一個形象的比喻:Transformer正通過統(tǒng)一的大模型,濃縮出一個“大樹型”的AIGC平臺生態(tài),算力是“樹根”,大模型是“樹干”,行業(yè)模型庫是“樹枝”,應用是“樹葉”。相比原來碎片化的CV、NLP中小模型,大模型的“大樹型”生態(tài)的算力需求更加明確和聚焦。對此,他倡導聯(lián)合生態(tài)伙伴,通過統(tǒng)一的大模型技術生態(tài)棧解決算力瓶頸問題。

▲燧原科技創(chuàng)始人兼COO張亞林

奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽談道,大模型推理的關鍵瓶頸在于內存帶寬,目前主流的AI大算力芯片均采用HBM作為內存首選,采用HBM離不開先進封裝,在散熱、工藝、產能等方面均受到一定限制。據他分享,采用基于UCle接口的AI大算力芯片架構可突破HBM的互聯(lián)的局限。

作為存算一體AI大算力芯片企業(yè)的代表,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬分享道,AI應用進入2.0時代, 一大突出問題是大模型帶來巨量數據搬運,大算力芯片的競爭核心會逐漸轉向破除“存儲墻”,存算一體超異構成為“換道超車”的可行路徑。

▲億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬

端側和邊緣側的芯片企業(yè)同樣看到大模型的機遇與需求。面向日益增長的算力需求,在邊緣和中心側,鯤云科技用可重構數據流技術路徑來解決大模型算力需求攀升的問題,通過芯片底層架構革新,將芯片利用率大幅提升,這種方法能滿足架構內海量數據的計算需求,提供高性能、高性價比、低延時的實時處理。

高通萬衛(wèi)星談道,與云端相比,終端側跑大模型擁有諸多優(yōu)勢,包括成本、能耗、可靠性、時延和性能、隱私和安全,以及個性化等。而終端側AI與云端AI相互配合的混合AI架構,是讓生成式AI實現(xiàn)全球規(guī);瘮U展的關鍵。“目前我們能夠支持參數超過10億的模型在終端上運行,未來幾個月內超過100億參數的模型將有望在終端側運行。”他分享說,高通不斷提升端側AI能力,從而提高終端支持大模型的參數閾值,讓更多云端生成式AI用例向邊緣側和端側遷移,這將真正釋放生成式AI的潛力。

安謀科技產品總監(jiān)楊磊也同意這一觀點,認為大模型AI的未來將在云側和端側同時發(fā)展。“由于Tranformer計算結構趨于穩(wěn)定,微架構廠商迎來大模型時代的創(chuàng)新契機。”安謀科技推出了本土自研AI處理器“周易”X2 NPU,不僅在算力、精度、靈活性等方面進行了大幅提升,還針對車載、邊緣計算等應用場景進行了專門優(yōu)化。

▲安謀科技產品總監(jiān)楊磊

端側場景更多是中小算力場景,最在乎能效比和低成本。對此,清華電子系科技成果轉化企業(yè)每刻深思的CEO鄒天琦相信“模擬計算”大有可為,基于新型存儲技術的模擬計算能夠更有效率地發(fā)揮優(yōu)勢,降低Transformer大模型在端側完成推理的能耗。

芯至科技聯(lián)合創(chuàng)始人、首席芯片架構師兼副總裁尹文認為,AI大模型落地到推理側的新機會與RISC-V架構創(chuàng)新不謀而合,RISC-V不僅可以做標量通用計算,也可以做線程級并行的AI計算。Scaler小標量+SIMT大算力的指令集/微架構融合將是未來RISC-V發(fā)力的重點,能以相對低的成本,為AI推理側應用提供高效支持。

他提到WoW (Wafer on Wafer)混合鍵合在新型芯片工程技術領域有重大價值。WoW可將AI Die和Memory Die垂直堆疊,低于HBM一個量級的成本提供數倍于HBM的帶寬;對于大模型推理來說,4~6GB的Memory Die完全滿足Transformer一層網絡權重的存儲和層內高帶寬需求。

三、AI芯片繁榮與資本同頻共振,新型計算技術的局限性尚存

進入生成式AI時代,資深投資人們如何看待AI芯片產業(yè)的發(fā)展走向?智一科技聯(lián)合創(chuàng)始人、總編輯張國仁,與普華資本管理合伙人蔣純、和利資本合伙人王馥宇、華興資本集團華興證券董事總經理阮孝莉進行了一場以“AI芯片的繁榮與資本的同頻共振”為主題的圓桌對話。

▲圓桌對話環(huán)節(jié),從左到右依次是智一科技聯(lián)合創(chuàng)始人、總編輯張國仁,普華資本管理合伙人蔣純,和利資本合伙人王馥宇,華興資本集團華興證券董事總經理阮孝莉

大模型參數規(guī)模激增,對算力提出巨大需求,三位投資人都談到提高芯片效率與架構創(chuàng)新的問題。阮孝莉談到資本投入已經跟不上算力需求,需要能夠提高“硅效率”的架構創(chuàng)新。蔣純和王馥宇均提及新型計算技術。王馥宇認為,可重構計算、存算一體、類腦神經擬態(tài)計算、光子計算、量子計算等新型計算技術的終點都會是很好的,都在結合各自應用場景的需求,一步一步解決當前工程性問題,朝前迭代與進步。

蔣純認為,美國的“小院高墻”既是中國AI芯片企業(yè)得以崛起的機會,也是中國AI芯片企業(yè)發(fā)展中最大的威脅。中國AI芯片企業(yè)還是要爭取走出“國芯國造”的路子,擺脫始終存在的仰人鼻息的風險。同時,“換道超車”也是必須考慮的路徑。以存內計算為代表的“本征計算”、3D封裝和堆疊技術都是非常重要的換道超車手段。

▲普華資本管理合伙人蔣純

阮孝莉談道,以Fabless為例,其短期會形成帶有地方產業(yè)特色的形態(tài),但遵循半導體產業(yè)特性來看,終局大概率是2-3家設計公司來服務國內市場。她認為國內在先進制程產線的突破對AI芯片有直接帶動作用,創(chuàng)新架構依賴于全產業(yè)鏈的成熟,有一個過程,先進制程階段性進展可以為大家獲得一些緩沖時間。

▲華興資本集團華興證券董事總經理阮孝莉

從資本市場來看,一定程度上AI芯片產業(yè)、還有創(chuàng)新創(chuàng)業(yè)在一級市場和二級市場已經形成比較好的同頻共振效應。蔣純和阮孝莉的觀點一致,表面來看,一級市場的AI芯片創(chuàng)新創(chuàng)業(yè)氛圍與二級市場的炒作脫節(jié)。蔣純談道,雖然二級市場不乏寒武紀這樣的優(yōu)秀代表,但其就像冰山浮出海面的尖角,大量創(chuàng)新生態(tài)的企業(yè)都在二級市場水下,但是二級市場的炒作代表了全國上下的期望,可以起到“千金買馬骨”的作用。阮孝莉補充說,二級市場泡沫并不完全是壞事,蓬勃才能吸引更多資本來關注并投資。而從新的大模型背景下未來AI賽道的增長空間來看,估值繁榮也是一定程度上具有合理性

據王馥宇分享,和利資本不會花太多精力去關注二級市場,在做創(chuàng)投時,更多關注客戶需求、市場空間、產品力、團隊組織力和執(zhí)行力、業(yè)績和利潤的成長情況等,因為滿足了客戶需求,才能真正創(chuàng)造價值。因此,和利資本做投資預判的參考點十分樸素人的需求是什么,能不能通過技術和產品來滿足人的需求,能不能提供更高的社會生產力。

▲和利資本合伙人王馥宇

四、創(chuàng)新架構橫刀立馬,換道破解性能與功耗難題

面臨傳統(tǒng)馮諾依曼體系帶來的內存墻、功耗墻、通信墻等挑戰(zhàn),依靠工藝技術進步來實現(xiàn)芯片性能、能效、成本等方面的改善變得愈發(fā)困難,架構創(chuàng)新已是AI芯片面臨的一個不可回避的課題。圍繞架構創(chuàng)新,國產AI芯片正從早期的百花齊放,向更深更多維的層面發(fā)展。

在峰會首日,主題演講分享的AI芯片架構創(chuàng)新思路主要集中在兩類,一是通過縮短計算單元與存儲單元、傳感器的距離,來減少芯片內不必要的數據傳輸所產生的時延和能耗;二是引入數據流驅動的可重構計算,將硬件資源更多集中在計算上,兼具靈活性與高能效。芯至科技則提出了一種將RISC-V開源指令架構、自研一致性總線、WoW 3DIC組合的架構創(chuàng)新思路。

1、感存算一體:為數據搬運減負,大幅降低功耗

在大模型時代,技術“剪刀差”越來越大:算力摩爾定律終結,但數據量越來越大,算法越來越復雜,一大核心的痛點就是“存儲墻”。由于存儲和計算分離架構,大模型開發(fā)的95%甚至更多時間花在數據搬運上,將導致能耗劇增和實際計算效率巨降。

億鑄科技熊大鵬認為,存算一體技術能夠從根本上解決“存儲墻”問題。面向數據中心、云計算、自動駕駛等場景,2023年8月,億鑄科技成功點亮存算一體AI大算力核心技術驗證芯片,可基于成熟工藝制程,實現(xiàn)單卡突破P級算力的極強性能與極高能效比。

后摩智能則首先瞄準汽車場景,于2023年5月推出的存算一體智駕芯片后摩鴻途H30,預計在2024年推出第二代產品后摩鴻途H50芯片。后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮稱,根據后摩實驗室及MLPerf公開測試結果,在ResNet50性能功耗對比上,采取12nm制程的H30相比某國際芯片巨頭的7nm同類芯片性能提升超2倍,功耗減少超50%。

陳亮談道,H30背后是后摩智能自研的IPU架構,該架構設計遵循“中庸之道”。如果將集中式計算架構比作居住面積和擴展性有限的“中式庭院”,那么分布式計算架構類似于“高層公寓”,容納性好但溝通性不足。后摩智能的IPU架構選擇在兩者之間尋求平衡點:在計算方面,通過多核、多硬件線程實現(xiàn)計算效率與算力靈活擴展;在存儲方面,通過多級數據緩存實現(xiàn)高效數據搬運與復用;在數據傳輸方面,通過雙環(huán)拓撲專用總線實現(xiàn)靈活數據傳輸與共享。

▲后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮

與存算一體的思路類似,從清華電子系智能感知集成電路與系統(tǒng)實驗室孵化出的每刻深思,將計算部分與傳感器相連,直接用模擬數據做運算,省去ADC模數轉換過程,能夠大幅節(jié)省功耗。

每刻深思的智能感知芯片,基于創(chuàng)新的近傳感模擬計算架構,可落地智能駕駛、VR/AR等多類應用場景中。以汽車的哨兵模式應用場景為例,這是一種通過硬件幫助車主在遠離車輛時監(jiān)控車輛安全的汽車模式,每刻深思的車載“感存算一體”協(xié)處理芯片能促進哨兵模式每晚耗電從5-8度下降到0.05度;待機功耗從原來的10W下降到14mW,從而大大提升用車體驗。

▲每刻深思CEO鄒天琦

2、數據流驅動可重構計算:顯著提升芯片利用率

可重構計算架構根據不同的應用或算法來配置硬件資源,讓數據在計算單元之間流轉,減少了傳統(tǒng)的譯碼操作和對內存的訪問,能夠大幅提升效率和節(jié)省功耗。除了在這一技術路線上研發(fā)十余年之久的魏少軍教授團隊外,一些AI芯片企業(yè)也已經開始探索這一技術路線的落地商用價值。

AMD基于XDNA AI引擎的架構創(chuàng)新,是數據流處理并行計算陣列的架構,用于提供高速的、低延時、低功耗的實時推理;赬DNA AI引擎的架構構建的Chiplet,與CPU、FPGA等構建片上異構計算平臺,可擴展至數據中心、端側(Ryzen AI)、邊緣/嵌入式等不同平臺來滿足多樣化的AI推理需求。

可重構數據流架構能并行進行數據訪問和數據計算。鯤云科技聯(lián)合創(chuàng)始人兼首席技術官蔡權雄提到一個公式:芯片的實測性能=芯片理論峰值算力x芯片利用率。而鯤云科技的可重構數據流架構,便是從芯片利用率找到突破點,最大化利用片上計算資源,提升芯片實測性能。相比于芯片利用率不足35%的指令集架構,基于鯤云可重構數據流架構的CAISA芯片最高可實現(xiàn)95.4%的芯片利用率。

▲鯤云科技聯(lián)合創(chuàng)始人兼首席技術官蔡權雄

蔡權雄說:“鯤云不追求先進制程,而是從架構側創(chuàng)新為行業(yè)提供極致性價比AI算力。”通過自研芯片架構CAISA 3.0和自研編譯器RainBuilder,據公開測試數據顯示,一顆28nm工藝的CAISA芯片相較于一顆16nm的GPU芯片,可實現(xiàn)最高4.12倍實測算力的提升。該芯片已實現(xiàn)量產和規(guī)模化落地,為10余個行業(yè)提供算力、算法、平臺一體化的AI視頻分析解決方案,成功落地1500多個智能化項目,覆蓋智慧安監(jiān)、智慧能源、工業(yè)制造等多個領域。

珠海芯動力專攻兼具通用性、高性能的RPP(可重構并行處理器)架構路徑。芯動力創(chuàng)始人&CEO李原透露說,RPP架構是將PE陣列以流水線的方式排列,實測面積效率比可達到同類產品的7~10倍,能效比也超過3倍,也就是說,在相同算力下只需占用更小的芯片面積。

此外,RPP架構還具備全方位兼容CUDA的特性,這意味著開發(fā)者可以直接使用CUDA編程語言編寫程序,無需進行復雜的代碼轉換。目前,芯動力首款基于可重構架構的GPGPU芯片RPP-R8已經流片成功,實現(xiàn)小規(guī)模量產。

▲珠海芯動力創(chuàng)始人&CEO李原

3、重構計算體系結構:軟硬件全棧系統(tǒng)架構創(chuàng)新

進入AI新時代,芯至科技尹文認為,算力創(chuàng)新不再僅僅是單個處理器微架構和芯片工藝的創(chuàng)新,而需要軟硬件全棧的系統(tǒng)架構全面創(chuàng)新,未來的創(chuàng)新機會來自以下方面:開放的通用指令架構,高效的融合加速器,異構互聯(lián)總線和芯片工程,開源算子庫、工具鏈和軟件

基于此,芯至科技圍繞RISC-V開源指令架構、自研一致性總線、WoW 3DIC的架構創(chuàng)新,可以帶來10倍性價比的大模型AI推理芯片。展望更長期的未來,尹文相信基于RISC-V開源指令同構和微架構異構,開源軟件工具鏈及自主一致性總線和芯片工程創(chuàng)新,未來有機會推進到算力統(tǒng)一場。算力統(tǒng)一場將更利于形成更大的自主可控軟件新生態(tài),并符合計算架構的原始特征,助力我國在計算體系方面換道超車。

▲芯至科技聯(lián)合創(chuàng)始人、首席芯片架構師兼副總裁尹文

五、為AI芯片錘煉精兵銳器,Chiplet助攻大算力芯片破局

隨著摩爾定律越發(fā)難以維系,如何在面臨逼近物理極限的情況下保持算力持續(xù)增長?基于先進封裝的Chiplet(芯粒)技術已成為后摩爾時代兼顧經濟效益和提升芯片性能的一大有效路徑。

Chiplet的優(yōu)勢在于可以實現(xiàn)異構集成。這種技術方案通過先進封裝技術將采用不同工藝制程、不同功能的各種Chiplet模塊組合到一起,能夠大幅提高大型芯片的良率,并能降低設計和制造環(huán)節(jié)的成本,同時減輕對先進制程產能的依賴。AMD MI300、特斯拉D1、蘋果M1 Ultra等經典AI芯片產品均采用了先進的Chiplet架構。

珠海GPGPU創(chuàng)企芯動力也十分認同Chiplet技術在產業(yè)發(fā)展中的價值,計劃將Chiplet和I/O Die連接形成邊緣端適合的芯片,以及使用類似技術將多顆核心進行連接,提供更高計算能力。”

今年2月,北極雄芯發(fā)布了國內首款基于異構Chiplet集成的智能處理芯片“啟明930”。該芯片由11塊Chiplets通過高速接口拼接而成,采用12nm工藝、2.5D封裝、全國產基板材料,可獨立用于AI加速卡,亦可通過D2D擴展多種功能型Side Die進行集成。

其創(chuàng)始人、清華大學交叉信息研究院助理教授馬愷聲經常被問一個問題,能不能用兩個2N工藝的Wafer通過3D集成,做出N工藝的性能? 答案是可以,用2塊14nm芯片拼出一塊7nm芯片是可能的。

▲清華大學交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲

他列數了4種可能的解決方案:1)用一層晶圓做供電網絡解決IR drop(電源電壓降)問題;2)多層邏輯;3)內存和邏輯混合;4)將內存、邏輯、互聯(lián)與存儲、供電耦合到一起。

上;ヂ(lián)IP產品及Chiplet產品供應商奎芯科技專注于高速接口IP,同時致力于用Chiplet破解內存墻與I/O墻。其副總裁王曉陽分享說,考慮到HBM的使用存在尺寸數量、對熱敏感、擺放方向和適配不靈活、工藝等限制,奎芯科技試圖將HBM HOST和SoC解耦,打造M2link互聯(lián)方案,將HBM和主SoC的距離拉到2.5厘米。采用這種方案,同等大小SoC可利用面積增大44%,內存容量帶寬增長33%,最大芯片尺寸擴大2倍。

▲奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽

結語:產學研投前沿交鋒,全球AI芯片峰會沸騰深圳南山

從2018年舉辦第一屆開始,全球AI芯片峰會至今已連續(xù)舉辦五屆,成為國內極少數專注在AI芯片領域且具有較大影響力的行業(yè)峰會。每一屆,你都能聽到頂級AI芯片產學研用及投融資領域專家們的思想交鋒,多元的精彩觀點在這里碰撞,迸發(fā)出更多技術或產品創(chuàng)新的靈感火花。

這也是全球AI芯片峰會連續(xù)第二年落地深圳南山。據深圳市南區(qū)科技創(chuàng)新局黨組書記、局曹環(huán)分享,今年5月,深圳市發(fā)布推動新型人工智能高質量發(fā)展方案,提出要聚焦通用大模型、智能算力芯片等領域,實施人工智能科技重大專項扶持計劃,推動AI產業(yè)高質量發(fā)展。

當前,南山區(qū)正大力推動集成電路產業(yè)高質量發(fā)展,已發(fā)布集成電路產業(yè)專項政策,在人才、研發(fā)、融資等方面大力支持芯片企業(yè)發(fā)展,先后落地了國家集成電路設計深圳產業(yè)化基地、粵港澳大灣區(qū)集成電路設計創(chuàng)新公共平臺等創(chuàng)新載體,集聚了英特爾、江波龍、中微半導等一批行業(yè)龍頭企業(yè),芯片領域上游設計能力突出,下游應用場景廣泛,成為了半導體精英企業(yè)聚集高地。

“接下來,南山區(qū)將認真做好服務,為更多業(yè)內企業(yè)、優(yōu)秀人才提供更全面的政策指引和服務。”曹環(huán)談道,“我們也誠摯邀請廣大企業(yè)家、投資人和創(chuàng)業(yè)者朋友們,選擇南山、投資南山、扎根南山,在南山這片創(chuàng)新與創(chuàng)業(yè)的熱土,展現(xiàn)創(chuàng)新實力、開拓創(chuàng)新事業(yè)、實現(xiàn)創(chuàng)新夢想。”

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港