展會(huì)信息港展會(huì)大全

IBM模仿人腦打造全新高效節(jié)能AI芯片:能耗降低4/5 效率提高24倍
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-25 13:55:57   瀏覽:4565次  

導(dǎo)讀:劃重點(diǎn) 1 IBM研究人員模仿人腦結(jié)構(gòu)打造出北極點(diǎn)芯片,提高計(jì)算能力的同時(shí)也能節(jié)約能源。 2 北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元,顛覆了傳統(tǒng)上存儲(chǔ)與計(jì)算單元分離的馮諾伊曼瓶頸。 3 北極點(diǎn)芯片采用12納米節(jié)點(diǎn)工藝制造,在800平方毫米的面積內(nèi)包...

劃重點(diǎn)

1

IBM研究人員模仿人腦結(jié)構(gòu)打造出北極點(diǎn)芯片,提高計(jì)算能力的同時(shí)也能節(jié)約能源。

2

北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元,顛覆了傳統(tǒng)上存儲(chǔ)與計(jì)算單元分離的“馮諾伊曼瓶頸”。

3

北極點(diǎn)芯片采用12納米節(jié)點(diǎn)工藝制造,在800平方毫米的面積內(nèi)包含220億個(gè)晶體管,擁有256個(gè)內(nèi)核。

4

研究人員估計(jì),如果北極點(diǎn)芯片設(shè)計(jì)采用最先進(jìn)的制造工藝,其效率將比目前的設(shè)計(jì)提高24倍。

科技新聞?dòng)?美國(guó)加利福尼亞州圣何塞的IBM研究人員開發(fā)了一種以大腦為靈感的計(jì)算機(jī)芯片,這款北極點(diǎn)處理器芯片消除了頻繁訪問(wèn)外部存儲(chǔ)器的需要,在圖像識(shí)別任務(wù)中比現(xiàn)有架構(gòu)更快,能源消耗更少。

巴黎薩克雷大學(xué)的納米電子學(xué)研究員達(dá)米安奎里奧斯(Damien Querlioz)說(shuō):“它的能源效率大幅降低,這令人感到非常興奮。”他說(shuō),這項(xiàng)研究表明,計(jì)算和內(nèi)存可以大規(guī)模集成,“我覺(jué)得這篇論文將動(dòng)搖計(jì)算機(jī)體系結(jié)構(gòu)中的普遍思維”。

北極點(diǎn)芯片采用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由簡(jiǎn)單計(jì)算單元組成的多層陣列通過(guò)編程來(lái)識(shí)別數(shù)據(jù)中的模式。底層用于接收數(shù)據(jù),例如圖像中的像素。每一個(gè)連續(xù)的層檢測(cè)就會(huì)采取越來(lái)越復(fù)雜的模式,并將信息傳遞給下一層。頂層用于輸出結(jié)果,比如可以表示圖像中含有貓、汽車或其他物體的可能性。

被“馮諾伊曼瓶頸”拖慢了速度

自半導(dǎo)體工業(yè)誕生以來(lái),計(jì)算機(jī)芯片基本上遵循相同的基本結(jié)構(gòu),其中處理單元和存儲(chǔ)待處理信息的存儲(chǔ)器始終處于分離狀態(tài)。雖然這種結(jié)構(gòu)允許更簡(jiǎn)單的設(shè)計(jì),能夠在幾十年內(nèi)很好地?cái)U(kuò)展,但它也造成了所謂的“馮諾伊曼瓶頸”,即在內(nèi)存、處理器和芯片內(nèi)的任何設(shè)備之間不斷地來(lái)回傳輸數(shù)據(jù)時(shí),需要耗費(fèi)更多時(shí)間和能源。

“馮諾伊曼瓶頸”以數(shù)學(xué)家約翰馮諾伊曼(John von Neumann)的名字命名,后者是世界上第一個(gè)提出基于處理單元和獨(dú)立存儲(chǔ)單元計(jì)算機(jī)標(biāo)準(zhǔn)架構(gòu)的人。 這種芯片架構(gòu)可以有效地處理計(jì)算,但每次計(jì)算時(shí)都需要使用被稱為RAM的外部存儲(chǔ)器。因此,不管處理器運(yùn)行多快、性能多好,每次執(zhí)行運(yùn)算時(shí)都需要把數(shù)據(jù)從存儲(chǔ)器搬到處理器中,數(shù)據(jù)處理完再搬回到存儲(chǔ)器。

“馮諾伊曼瓶頸”已經(jīng)成為影響計(jì)算機(jī)應(yīng)用(包括人工智能)發(fā)展的最重要因素之一,并導(dǎo)致能源效率低下。論文合著者、IBM計(jì)算機(jī)工程師達(dá)門德拉莫達(dá)(Dharmendra Modha)表示,他曾做過(guò)估計(jì),在這種架構(gòu)上模擬人類大腦可能需要12個(gè)核反應(yīng)堆的能源輸出。

那么,北極點(diǎn)芯片是如何實(shí)現(xiàn)比現(xiàn)有芯片更高的計(jì)算效率的?其最獨(dú)特之處在于,該處理器的所有內(nèi)存都在芯片上。如果沒(méi)有“馮諾伊曼瓶頸”,該芯片進(jìn)行人工智能推理的速度可以比市場(chǎng)上已有其他芯片快得多。

北極點(diǎn)芯片采用12納米節(jié)點(diǎn)工藝制造,在800平方毫米的面積內(nèi)包含220億個(gè)晶體管。它擁有256個(gè)計(jì)算單元(或稱內(nèi)核),每個(gè)計(jì)算單元都有自己的內(nèi)存。每個(gè)周期可以以8位精度執(zhí)行2048次運(yùn)算,并有可能分別以4位和2位精度將運(yùn)算數(shù)量增加一倍和四倍。莫達(dá)說(shuō):“你在每個(gè)內(nèi)核中都緩解了馮諾伊曼瓶頸。”

莫達(dá)解釋稱,這些內(nèi)核通過(guò)消除片外內(nèi)存,將計(jì)算與片上內(nèi)存集成起來(lái)。這些計(jì)算單元以一種網(wǎng)絡(luò)連接在一起,這種網(wǎng)絡(luò)的靈感來(lái)自于人類大腦皮層之間的白質(zhì)連接。這種設(shè)計(jì)使北極點(diǎn)芯片在圖像識(shí)別的標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中以相當(dāng)大的優(yōu)勢(shì)擊敗了現(xiàn)有的人工智能芯片。

他補(bǔ)充說(shuō):“從架構(gòu)上講,北極點(diǎn)芯片模糊了計(jì)算和內(nèi)存單元之間的界限。在單個(gè)內(nèi)核層面上,北極點(diǎn)芯片表現(xiàn)為內(nèi)存近似計(jì)算,而從芯片外部來(lái)看,在輸入輸出層面上,它表現(xiàn)得就像活動(dòng)存儲(chǔ)器。這使得該芯片易于集成到系統(tǒng)中,并顯著減少了主機(jī)上的負(fù)載。”

在不使用最先進(jìn)制程工藝的情況下,北極點(diǎn)芯片能耗是使用最先進(jìn)技術(shù)人工智能芯片的1/5。論文作者估計(jì),如果北極點(diǎn)芯片設(shè)計(jì)采用最先進(jìn)的制造工藝,其效率將比目前的設(shè)計(jì)提高24倍。

北極點(diǎn)芯片的潛在應(yīng)用

雖然對(duì)北極點(diǎn)芯片的研究仍在進(jìn)行中,但它的結(jié)構(gòu)適合新興的人工智能用例,以及其他更成熟的用例。

在測(cè)試中,北極點(diǎn)芯片團(tuán)隊(duì)主要專注于與計(jì)算機(jī)視覺(jué)相關(guān)的用途,部分原因是該項(xiàng)目資金來(lái)自美國(guó)國(guó)防部。目前考慮的一些主要應(yīng)用是檢測(cè)、圖像分割和視頻分類。但它也在其他領(lǐng)域進(jìn)行了測(cè)試,例如自然語(yǔ)言處理(在僅限編碼器的BERT模型上)和語(yǔ)音識(shí)別(在DeepSpeech2模型上)。該團(tuán)隊(duì)目前正在探索將僅限解碼器的大語(yǔ)言模型映射到北極點(diǎn)橫向擴(kuò)展系統(tǒng)中。

當(dāng)你想到這些人工智能任務(wù)時(shí),腦海中會(huì)浮現(xiàn)出各種各樣的用例,從自動(dòng)駕駛汽車到機(jī)器人、數(shù)字助理或空間計(jì)算。許多需要實(shí)時(shí)處理大量數(shù)據(jù)的邊緣應(yīng)用都非常適合北極點(diǎn)。

例如,它可能是一種將自動(dòng)駕駛汽車從需要固定地圖和路線才能在小范圍內(nèi)運(yùn)行的機(jī)器,轉(zhuǎn)變?yōu)槟軌蛩伎己蛻?yīng)對(duì)罕見(jiàn)邊緣情況的設(shè)備。即使對(duì)熟練的人類駕駛員來(lái)說(shuō),這些邊緣情況也使得在現(xiàn)實(shí)世界中導(dǎo)航變得非常具有挑戰(zhàn)性。這些邊緣案例正是未來(lái)北極點(diǎn)芯片應(yīng)用的最佳選擇。

這款芯片還可以幫助衛(wèi)星監(jiān)控農(nóng)業(yè)和管理野生動(dòng)物種群,監(jiān)控車輛和貨運(yùn)以確保道路更安全和不那么擁堵,安全地操作機(jī)器人,并為更安全的企業(yè)檢測(cè)網(wǎng)絡(luò)威脅。

然而,這只是北極點(diǎn)芯片廣泛應(yīng)用的起點(diǎn)。目前CPU的制程技術(shù)水平是3納米,IBM本身已經(jīng)在2納米節(jié)點(diǎn)上進(jìn)行了多年的研究。這意味著,除了基本的架構(gòu)創(chuàng)新外,還有幾代芯片處理技術(shù)可以在北極點(diǎn)上實(shí)現(xiàn),以不斷提高其效率和性能。

但對(duì)莫達(dá)來(lái)說(shuō),這只是他過(guò)去19年職業(yè)生涯中一個(gè)重要的里程碑。他始終在研究以大腦為靈感的數(shù)字芯片,他知道大腦是我們所知道的最節(jié)能的處理器,并在尋找數(shù)字復(fù)制的方法。他相信,把最好的傳統(tǒng)處理設(shè)備與大腦的處理結(jié)構(gòu)結(jié)合起來(lái)是有好處的。在大腦中,記憶和處理分散在整個(gè)大腦中。

現(xiàn)在,莫達(dá)的計(jì)劃是展示北極點(diǎn)芯片的能力,同時(shí)探索如何將設(shè)計(jì)轉(zhuǎn)化為更小的芯片生產(chǎn)工藝,并進(jìn)一步探索新架構(gòu)的可能性。這項(xiàng)工作源于一個(gè)簡(jiǎn)單的想法,即我們?nèi)绾巫層?jì)算機(jī)像大腦一樣工作?經(jīng)過(guò)多年的基礎(chǔ)研究,他們似乎終于找到了答案。

走在正確的道路上

但是,對(duì)于大語(yǔ)言模型來(lái)說(shuō),即使是北極點(diǎn)芯片的224兆內(nèi)存也是不夠的。比如,聊天機(jī)器人ChatGPT所使用的大語(yǔ)言模型,即使在它們最精簡(jiǎn)的版本中,也要占用幾千兆的數(shù)據(jù)。而且該芯片只能運(yùn)行預(yù)先編程的神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)需要在單獨(dú)的機(jī)器上提前訓(xùn)練。但論文作者表示,北極點(diǎn)芯片架構(gòu)可能在速度關(guān)鍵型應(yīng)用中很有用,比如自動(dòng)駕駛汽車。

北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近內(nèi)核中的計(jì)算元件。在其他方面,研究人員一直在使用新材料和制造工藝開發(fā)更激進(jìn)的創(chuàng)新。這使得存儲(chǔ)單元本身也能夠執(zhí)行計(jì)算,原則上可以進(jìn)一步提高速度和效率。

上個(gè)月出現(xiàn)的另一種芯片使用憶阻器進(jìn)行內(nèi)存計(jì)算,憶阻器是一種能夠在電阻和導(dǎo)體之間切換的電路元件。憶阻器研究論文的合著者之一、清華大學(xué)教授高斌表示:“IBM和我們的方法都有望緩解延遲,降低與數(shù)據(jù)傳輸相關(guān)的能源成本。”

另一種方法是由幾個(gè)團(tuán)隊(duì)合作開發(fā)的,其中一個(gè)團(tuán)隊(duì)來(lái)自瑞士蘇黎世的IBM實(shí)驗(yàn)室,可以通過(guò)改變電路元件的晶體結(jié)構(gòu)來(lái)存儲(chǔ)信息。不過(guò),這些新方法能否在經(jīng)濟(jì)上得到推廣還有待觀察。(文/金鹿)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港