展會信息港展會大全

中國工程院院士鄭緯民:以高質(zhì)量算力基礎(chǔ)設(shè)施建設(shè) 推動AI產(chǎn)業(yè)生態(tài)健康發(fā)展
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-22 18:48:56   瀏覽:22330次  

導(dǎo)讀:隨著ChatGPT的火爆,人工智能的應(yīng)用已成為大趨勢。算力作為人工智能的三大基礎(chǔ)要素,正變得前所未有的重要。無論是AI模型的訓(xùn)練、推理還是部署,抑或商業(yè)模式的創(chuàng)新,都需要算力作為支撐。而隨著生成式AI應(yīng)用的不斷發(fā)展,如何靈活、高效整合分散的先進計算能...

隨著ChatGPT的火爆,人工智能的應(yīng)用已成為大趨勢。算力作為人工智能的三大基礎(chǔ)要素,正變得前所未有的重要。無論是AI模型的訓(xùn)練、推理還是部署,抑或商業(yè)模式的創(chuàng)新,都需要算力作為支撐。而隨著生成式AI應(yīng)用的不斷發(fā)展,如何靈活、高效整合分散的先進計算能力、充分發(fā)揮計算效果,為人工智能的進一步發(fā)展提供關(guān)鍵的基礎(chǔ),成為算力需求增長之外最大的挑戰(zhàn)。

中國工程院院士、清華大學(xué)計算機科學(xué)與技術(shù)系教授鄭緯民是我國超算領(lǐng)域?qū)<,由其帶領(lǐng)的清華大學(xué)研究團隊獲得過國際高性能計算應(yīng)用領(lǐng)域最高獎項“戈登貝爾”獎。目前,他帶領(lǐng)團隊在人工智能領(lǐng)域的研究包括在AI與算力基礎(chǔ)設(shè)施的設(shè)計、評測和優(yōu)化方面,提出了一種AI算力基礎(chǔ)設(shè)施的架構(gòu)和平衡設(shè)計原則,并推出大規(guī)模人工智能算力基準測試程序AIPerf(已于2020年11月15日發(fā)布)。清華大學(xué)團隊還提出百萬億參數(shù)超大規(guī)模訓(xùn)練模型的加速方法,將數(shù)據(jù)并行、模型并行、專家并行三種訓(xùn)練模型開源到FastMOE系統(tǒng)當中,得到了業(yè)界許多認可與應(yīng)用。

鄭緯民院士指出,人工智能正在推動新一輪產(chǎn)業(yè)變革,通專結(jié)合的多樣化算力已成為數(shù)字經(jīng)濟發(fā)展的“基石”。 我國算力規(guī)模排名全球第二且增速排名第一,當前我國HPC、AI、數(shù)據(jù)中心三大算力系統(tǒng)發(fā)展已取得一定成效,但將領(lǐng)先算力高效轉(zhuǎn)化為解決科學(xué)與工程難題的能力依然面臨挑戰(zhàn)。他認為,未來更重要的是應(yīng)用,即基于大模型研發(fā)行業(yè)細分領(lǐng)域的垂直模型,加強AI算力芯片設(shè)計、軟硬件生態(tài)建設(shè)與產(chǎn)業(yè)化應(yīng)用,通過完善開放的產(chǎn)業(yè)生態(tài),推動各行各業(yè)數(shù)字化轉(zhuǎn)型,從而真正促進數(shù)字經(jīng)濟和大模型產(chǎn)業(yè)的健康發(fā)展。

“AI大模型的核心硬件是芯片,盡管目前國內(nèi)自研芯片起步較晚,但仍可以通過生態(tài)建設(shè)實現(xiàn)彎道超車。” 在接受《經(jīng)濟觀察報》采訪時鄭緯民院士表示,“算力、網(wǎng)絡(luò)具備很強的公共基礎(chǔ)設(shè)施特性,只有加快建立一個開放性的產(chǎn)業(yè)生態(tài),把選擇權(quán)交給用戶,才能驅(qū)動行業(yè)百花齊放,從而真正促進大模型產(chǎn)業(yè)的健康發(fā)展。”

雖然我國算力產(chǎn)業(yè)發(fā)展迅速,規(guī)?偭看蠓S升,但在發(fā)展背后,除了面臨能耗高企、通用算力資源過多、智算資源不足等問題外,還存在諸多挑戰(zhàn)。

一是,算力分布分散,存在高效連接難題。二是,算力異構(gòu)化程度高,存在著統(tǒng)一管理調(diào)度難題。三是,算力歸屬于不同運營方,算力交易過程中存在信任問題。為滿足現(xiàn)代數(shù)據(jù)中心對算力的靈活、高效、充分使用的需求,算力統(tǒng)一調(diào)度是大趨勢。

面對產(chǎn)業(yè)發(fā)展面臨的問題,北京市加快算力基礎(chǔ)設(shè)施建設(shè),目前已形成1.2萬P的算力供給規(guī)模。例如,由提供規(guī);冗M智算算力、AI云及AI轉(zhuǎn)型服務(wù)的高科技企業(yè)北京電子數(shù)智科技有限責(zé)任公司(以下簡稱“北電數(shù)智”)承建的北京數(shù)字經(jīng)濟算力中心,已經(jīng)在酒仙橋核心地帶開工建設(shè),預(yù)計2024年完成基礎(chǔ)設(shè)施建設(shè),達產(chǎn)后實現(xiàn)多元異構(gòu)的1000P智能算力供給。作為北京電子控股有限責(zé)任公司下屬企業(yè),北電數(shù)智希望通過打造以人為本、綠色低碳的新型算力基礎(chǔ)設(shè)施,整合分散的、多元異構(gòu)的先進算力,支持各行各業(yè)對智能算力的需求。

為應(yīng)對人工智能創(chuàng)新浪潮下,對高質(zhì)量算力的迫切需求,傳統(tǒng)數(shù)據(jù)中心需要實現(xiàn)面向未來的整體智算升級與政策合規(guī)。北電數(shù)智通過對傳統(tǒng)數(shù)據(jù)中心進行軟硬件升級和智算算力改造,同時通過算力調(diào)度,整合分散的先進計算能力,助力傳統(tǒng)數(shù)據(jù)中心打開新的增長點。

與此同時,北電數(shù)智也致力于構(gòu)建一個充滿創(chuàng)造力的人工智能產(chǎn)業(yè)生態(tài),攜手國內(nèi)外芯片、服務(wù)器、大模型、人工智能、應(yīng)用創(chuàng)新、產(chǎn)業(yè)投資等多個領(lǐng)域的合作伙伴,以實踐不斷推動產(chǎn)業(yè)鏈迭代升級,實現(xiàn)產(chǎn)業(yè)的進步和繁榮。

如鄭緯民院士所言:“智算中心的建設(shè)和布局是一個重要趨勢,但也伴隨著挑戰(zhàn)。機遇在于可以推動高性能計算和智能計算領(lǐng)域的發(fā)展,但挑戰(zhàn)包括資源分配、合作與競爭等方面,需要綜合考慮。通過算力基礎(chǔ)設(shè)施建設(shè),推動AI產(chǎn)業(yè)繁榮和生態(tài)健康發(fā)展。”

訪談:

沈建緣:您認為目前我國人工智能技術(shù)領(lǐng)域的研發(fā)和國產(chǎn)AI芯片大模型基礎(chǔ)設(shè)施處于怎樣的階段?

鄭緯民:從AI技術(shù)三駕馬車:算法、數(shù)據(jù)、算力來看,中國在大數(shù)據(jù)領(lǐng)域處于優(yōu)勢地位,但在算法和智能算力領(lǐng)域,中國落后于美國。智能算力的不足嚴重制約了我國在AI領(lǐng)域的創(chuàng)新能力。目前我國算力規(guī)模排名全球第二且增速排名第一,但將領(lǐng)先算力高效轉(zhuǎn)化為解決科學(xué)與工程難題的能力依然面臨挑戰(zhàn)。國產(chǎn)算力芯片的發(fā)展需要重點關(guān)注生態(tài)系統(tǒng)的建設(shè)。性能并非唯一的關(guān)鍵因素,我們需要更好地發(fā)展生態(tài)系統(tǒng),包括軟件支持等,以提高用戶友好性和競爭力。國內(nèi)有許多芯片公司,但生態(tài)系統(tǒng)的健康程度同樣重要。

沈建緣:基于大模型研發(fā)的針對各行業(yè)細分領(lǐng)域的垂直模型要在應(yīng)用層面實現(xiàn)商業(yè)價值,面臨哪些挑戰(zhàn)?

鄭緯民:當大模型從C端走向B端,它就像從玩具走向工具,而工具的精確性至關(guān)重要。未來更重要的是應(yīng)用,即基于大模型研發(fā)針對行業(yè)細分領(lǐng)域的垂直模型,并在工業(yè)、農(nóng)業(yè)、智慧城市建設(shè)等領(lǐng)域利用AI大模型進行充分賦能。但在大模型時代,應(yīng)該重點關(guān)注應(yīng)用領(lǐng)域的垂直模型和具體定制,滿足市場需求。不要盲目跟風(fēng),應(yīng)根據(jù)自身領(lǐng)域的需求和優(yōu)勢來選擇發(fā)展方向,以更好地滿足市場需求。大模型不是唯一的出路,應(yīng)著眼于應(yīng)用領(lǐng)域的需求和競爭潛力。

沈建緣:基于大模型訓(xùn)練需要的大規(guī)模算力因“卡脖子”帶來的限制,中國在哪些方面有機會實現(xiàn)突破?

鄭緯民:第一,加快“卡脖子”相關(guān)核心技術(shù)攻關(guān)。芯片的自主可控,涉及芯片的設(shè)計、生產(chǎn)和封裝測試等很多環(huán)節(jié),要從核心原材料、生產(chǎn)設(shè)備、制造工藝等各方面突破,迎難而上,想辦法解決關(guān)鍵技術(shù)問題。

第二,構(gòu)建自主可控的算力生態(tài)。以RISCV/ARM作為抓手,積極發(fā)展非X86架構(gòu)來構(gòu)建多樣性算力格局。加強軟件的開發(fā),包括基礎(chǔ)軟件和應(yīng)用軟件。軟件開發(fā)好,將自主研發(fā)的芯片用起來,才能構(gòu)建自主可控的算力生態(tài)。

第三,密切跟蹤國際前沿革新技術(shù),提前布局后摩爾時代新型算力技術(shù)研究和儲備,例如存算一體、量子計算、非硅基芯片等。

第四,制定更為積極的全球人才戰(zhàn)略,大幅擴充人才蓄水池。半導(dǎo)體人才的缺失甚至流失也是制約我國芯片實現(xiàn)自主可控的重要因素。我們要進一步加大對相關(guān)領(lǐng)域人才的培養(yǎng)、引進力度,張榜聚智,不拘一格用人才。

沈建緣:隨著各地算力基礎(chǔ)設(shè)施逐漸發(fā)展完善,算力聯(lián)網(wǎng)形成統(tǒng)一調(diào)度是大勢所趨,基于“算力網(wǎng)絡(luò)”的概念,有哪些政策推動和實踐?

鄭緯民:數(shù)字時代的信息有四個步驟:獲娶傳輸、處理、顯示。目前,我們在信息的傳輸、顯示上已經(jīng)做得不錯了,信息的獲娶處理能力還需努力,F(xiàn)在發(fā)展算力網(wǎng)絡(luò),是為了把這兩步做好。算力網(wǎng)絡(luò)將改變算力的供給、應(yīng)用和服務(wù)方式,大大提升算網(wǎng)服務(wù)的靈活性和高效性,對支撐國家戰(zhàn)略、推動行業(yè)數(shù)字化轉(zhuǎn)型都有重大意義。

隨著各地算力基礎(chǔ)設(shè)施發(fā)展完善,算力聯(lián)網(wǎng)形成統(tǒng)一調(diào)度是大勢所趨。算力聯(lián)網(wǎng)有3個關(guān)鍵詞:算力、互聯(lián)和互通。算力互聯(lián)需要關(guān)注并網(wǎng)(帶寬高,延遲低)、帶寬和延遲。算力互通需要解決硬件和軟件異構(gòu)帶來的困難,需要一個統(tǒng)一編程框架和編譯的軟件。

沈建緣:從您的專業(yè)視角來看,算力產(chǎn)業(yè)下一步發(fā)展的重點在哪里?在綜合算力發(fā)展的過程中,就算力、存力和運力三方面而言,我國有哪些優(yōu)勢以及需要提升的方面?

鄭緯民:下一步,要用好先進計算,高效整合分散的先進計算能力、充分發(fā)揮計算效果是關(guān)鍵。第一,核心技術(shù)需攻關(guān):從核心技術(shù)的角度來看,我國算力的硬件技術(shù)自主可控性仍是薄弱環(huán)節(jié)。目前,國內(nèi)云系統(tǒng)受制于高性能通用CPU的國產(chǎn)化進展,仍然主要采用國外廠商如Intel或AMD的X86服務(wù)器。算力中心采用的網(wǎng)卡和網(wǎng)絡(luò)交換機,也多是基于國外芯片,國產(chǎn)網(wǎng)卡和交換機芯片與國外一線云網(wǎng)絡(luò)廠商相比,技術(shù)完整度和生態(tài)上還有差距。

第二,“供應(yīng)商鎖定”難題需解決:算力的互操作性不足,以及由此導(dǎo)致的“供應(yīng)商鎖定”問題,是全球性問題。與國外相比,我國的“供應(yīng)商鎖定”問題不容忽視,成為影響構(gòu)建算力統(tǒng)一生態(tài)、阻礙算力業(yè)務(wù)持續(xù)發(fā)展創(chuàng)新的瓶頸。算力互操作性的不足,會讓人們在不同算力供應(yīng)商之間實現(xiàn)應(yīng)用程序的遷移時,需要付出巨大的努力和投入。

第三,傳統(tǒng)公有云應(yīng)用效率待提升:從行業(yè)應(yīng)用的角度來看,公有云上的行業(yè)應(yīng)用類型單一是突出問題。盡管我國算力市場處于爆發(fā)式增長階段,2022年達4550億元規(guī)模,較2021年增長40.91%,但當前公有云上的行業(yè)應(yīng)用主要還是游戲、短視頻、即時通信這三項。我國公有云的利用率只有30%左右,私有云的利用率只有5%左右。也就是說,100臺機器,只用了30臺,甚至是5臺,利潤怎么可能高?如果不積極拓展應(yīng)用,這也將影響我國算力產(chǎn)業(yè)持續(xù)健康發(fā)展。

沈建緣:面對AI計算需求的大規(guī)模爆發(fā),新型數(shù)據(jù)中心又將如何進行迭代升級?傳統(tǒng)數(shù)據(jù)中心需要在哪些領(lǐng)域發(fā)力轉(zhuǎn)型?

鄭緯民:未來,新型數(shù)據(jù)中心將是提供多樣性計算綜合能力的算力集群,以滿足千行百業(yè)智能化的需求。智算中心的建設(shè)和布局是一個重要趨勢,但也伴隨著挑戰(zhàn)。機遇在于可以推動高性能計算和智能計算領(lǐng)域的發(fā)展,但挑戰(zhàn)包括資源分配、合作與競爭等方面,需要綜合考慮。未來數(shù)據(jù)中心的發(fā)展還要考慮不同地區(qū)能源結(jié)構(gòu)的差異、同一地區(qū)不同行業(yè)的業(yè)務(wù)差異,提供更綠色的算力,并滿足實時應(yīng)用的需求。算力的統(tǒng)一調(diào)度是算力發(fā)展的必由之路,其關(guān)鍵在于將分散的算力資源聚合,形成集群效應(yīng),并建設(shè)多元異構(gòu)的算力調(diào)度體系,更高效地發(fā)揮計算效果。

對于傳統(tǒng)數(shù)據(jù)中心,可以通過智算改造與升級的解決方案,增加多元異構(gòu)的智能算力供給,成為滿足AI計算需求大爆發(fā)的重要組成部分,還可以通過軟硬件升級和能耗方案的優(yōu)化,以滿足人工智能產(chǎn)業(yè)對數(shù)據(jù)中的綠色環(huán)保、低能耗的需求。同時,通過智能算力供給服務(wù)的加持,傳統(tǒng)數(shù)據(jù)中心也能進一步實現(xiàn)可持續(xù)增長。

沈建緣/文

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港