展會(huì)信息港展會(huì)大全

IBM開發(fā)新芯片為AI提速:消除片外內(nèi)存,靈感來自大腦
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-21 09:32:34   瀏覽:8642次  

導(dǎo)讀:在傳統(tǒng)馮諾伊曼架構(gòu)下,計(jì)算和存儲(chǔ)分離。而北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元中的計(jì)算元件。北極點(diǎn)芯片由256個(gè)計(jì)算單元組成,每個(gè)計(jì)算單元都有內(nèi)存,通過消除片外內(nèi)存,將計(jì)算與片上內(nèi)存交織在一起。這些計(jì)算單元以一種網(wǎng)絡(luò)連接在一起,設(shè)計(jì)靈...

在傳統(tǒng)馮諾伊曼架構(gòu)下,計(jì)算和存儲(chǔ)分離。而北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元中的計(jì)算元件。北極點(diǎn)芯片由256個(gè)計(jì)算單元組成,每個(gè)計(jì)算單元都有內(nèi)存,通過消除片外內(nèi)存,將計(jì)算與片上內(nèi)存交織在一起。這些計(jì)算單元以一種網(wǎng)絡(luò)連接在一起,設(shè)計(jì)靈感來自于人類大腦。

北極點(diǎn)處理器芯片消除了頻繁訪問外部存儲(chǔ)器的需要,在圖像識(shí)別任務(wù)中比現(xiàn)有架構(gòu)更快,能源消耗更少。

IBM研發(fā)的北極點(diǎn)(NorthPole)處理器芯片可避開訪問外部存儲(chǔ)器,提高計(jì)算能力,節(jié)約能源。

美國(guó)加利福尼亞州圣何塞的IBM研究人員開發(fā)了一種以大腦為靈感的計(jì)算機(jī)芯片,這款北極點(diǎn)處理器芯片消除了頻繁訪問外部存儲(chǔ)器的需要,在圖像識(shí)別任務(wù)中比現(xiàn)有架構(gòu)更快,能源消耗更少。這表明計(jì)算和內(nèi)存可以大規(guī)模集成。相關(guān)研究10月19日發(fā)表在《科學(xué)》雜志。

北極點(diǎn)芯片采用神經(jīng)推理結(jié)構(gòu),由簡(jiǎn)單計(jì)算單元組成的多層陣列通過編程來識(shí)別數(shù)據(jù)中的模式。底層接收數(shù)據(jù),例如圖像中的像素;每一個(gè)連續(xù)的層檢測(cè)日益復(fù)雜的模式,并將信息傳遞給下一層;頂層輸出結(jié)果,例如可以表示圖像含有貓、汽車或其他物體的可能性。

在傳統(tǒng)馮諾伊曼架構(gòu)下,計(jì)算和存儲(chǔ)分離。傳統(tǒng)計(jì)算機(jī)芯片可以有效處理計(jì)算,但每次計(jì)算時(shí)仍然需要使用被稱為RAM的外部存儲(chǔ)器。因此不管處理器運(yùn)行多快、性能多好,每次執(zhí)行運(yùn)算時(shí)都需要把數(shù)據(jù)從存儲(chǔ)器搬到處理器中,數(shù)據(jù)處理完再搬回到存儲(chǔ)器。在以數(shù)據(jù)為主的AI計(jì)算之下,馮諾伊曼架構(gòu)的“存儲(chǔ)墻”和“功耗墻”挑戰(zhàn)凸顯。論文合著者、IBM計(jì)算機(jī)工程師達(dá)門德拉莫達(dá)(Dharmendra Modha)表示,他曾估計(jì)在這種架構(gòu)上模擬人類大腦可能需要12個(gè)核反應(yīng)堆的能源輸出。

而北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元中的計(jì)算元件。北極點(diǎn)芯片由256個(gè)計(jì)算單元組成,每個(gè)計(jì)算單元都有內(nèi)存,通過消除片外內(nèi)存,將計(jì)算與片上內(nèi)存交織在一起。這些計(jì)算單元以一種網(wǎng)絡(luò)連接在一起,這種網(wǎng)絡(luò)的靈感來自于人類大腦皮層之間的白質(zhì)連接。

在不使用最先進(jìn)工藝的情況下,北極點(diǎn)芯片能耗是使用最先進(jìn)技術(shù)的人工智能芯片的1/5。論文作者估計(jì),如果北極點(diǎn)芯片設(shè)計(jì)采用最先進(jìn)的制造工藝,其效率將是目前設(shè)計(jì)的25倍。論文提到,“在ResNet50基準(zhǔn)圖像分類網(wǎng)絡(luò)上,相對(duì)于使用類似12納米技術(shù)工藝的GPU, 北極點(diǎn)實(shí)現(xiàn)了每瓦FPS(每秒傳輸幀數(shù))的能量度量高25倍,每個(gè)晶體管FPS的空間度量高5倍,延遲時(shí)間度量低22倍。”

不過,據(jù)《自然》雜志報(bào)道,即使是北極點(diǎn)芯片224兆內(nèi)存對(duì)于大型語言模型來說也是不夠的,比如聊天機(jī)器人ChatGPT這樣的語言模型,即使在最精簡(jiǎn)的版本中也要占用幾千兆的數(shù)據(jù)。而且該芯片只能運(yùn)行預(yù)先編程的神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)需要在單獨(dú)的機(jī)器上提前訓(xùn)練。但論文作者表示,北極點(diǎn)芯片架構(gòu)可能在速度關(guān)鍵型應(yīng)用中有用,比如自動(dòng)駕駛汽車。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港