展會(huì)信息港展會(huì)大全

IBM推出5.5GHz八核處理器Telum II,還有300TOPS的Spyre AI加速器
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-28 08:26:42   瀏覽:2613次  

導(dǎo)讀:8月27日消息,在近日召開的Hot Chips 2024大會(huì)上,IBM宣布推出針對(duì)AI時(shí)代的下一代企業(yè)計(jì)算產(chǎn)品,包括全新Telum II處理器和Spyre AI加速器,預(yù)計(jì)這兩款芯片都將于2025年上市。 Telum II處理器 早在2021年,IBM就推出了第一代的Telum處理器,當(dāng)時(shí)就采用了全新...

8月27日消息,在近日召開的Hot Chips 2024大會(huì)上,IBM宣布推出針對(duì)AI時(shí)代的下一代企業(yè)計(jì)算產(chǎn)品,包括全新Telum II處理器和Spyre AI加速器,預(yù)計(jì)這兩款芯片都將于2025年上市。

Telum II處理器

早在2021年,IBM就推出了第一代的Telum處理器,當(dāng)時(shí)就采用了全新的核心構(gòu)架,并針對(duì)AI加速進(jìn)行優(yōu)化。具體來(lái)說(shuō),該芯片采用三星7nm制程技術(shù)制造,核心面積為530mm,內(nèi)部有225億個(gè)晶體管,8核心16線程的配置,主頻超過(guò)5GHz。由于Telum處理器是IBM z16大型機(jī)計(jì)劃成功的關(guān)鍵,所以隨著客戶需求的變化,IBM需要持續(xù)升級(jí)該系列芯片,因此推出了性能更強(qiáng)、更適合AI任務(wù)的Telum II處理器。

據(jù)介紹,Telum II處理器采用了更先進(jìn)的三星5nm HPP制程技術(shù)制造,核心面積為600mm,擁有430億個(gè)晶體管,雖然還是8核心16線程的配置,但是對(duì)于核心分支預(yù)測(cè)進(jìn)行了優(yōu)化改進(jìn),比如將寄存器數(shù)控從128提高到了160個(gè),改進(jìn)了存儲(chǔ)回寫和地址轉(zhuǎn)換,疊加制程工藝的提升,使得核心面積減少了20%,功耗降低了15%。

同樣,得益于三星5nm制程以及CPU核心優(yōu)化,Telum II處理器的CPU核心主頻也提升到了5.5GHz,整體性能提升了20%。

Telum II處理器還采用了一個(gè)新的電壓控制環(huán)路,可以幫助CPU內(nèi)核可以穩(wěn)定的運(yùn)行在5.5GHz,并且功耗可以降低18%。

另外,Telum II處理器內(nèi)部還配備了10個(gè)36MB的L2緩存,整體緩存容量達(dá)到了360MB,較第一代的Telum處理器增加了40%。此外,每個(gè)drawer還擁有360MB的虛擬L3緩存和2.88GB的虛擬L4緩存。

Telum II處理器內(nèi)部還集成了全新I/O加速單元DPU,并接在L2Cache上,而不是放在PCIe總線后面,提高了50%的I/O密度來(lái)優(yōu)化數(shù)據(jù)處理。IBM表示,該處理器這一進(jìn)步提高了 IBM Z 的整體效率和可擴(kuò)展性,使其非常適合處理當(dāng)今企業(yè)的大規(guī)模 AI 工作負(fù)載和數(shù)據(jù)密集型應(yīng)用程序。

該DPU擁有四組八個(gè)微控制器,并運(yùn)行IBM自己的定制協(xié)議。還有PCIe Gen5 x16接口。一個(gè)完整的系統(tǒng)可以支持多達(dá)192個(gè)PCIe卡,12個(gè)I/O擴(kuò)展和16個(gè)PCIe插槽等。

為了應(yīng)對(duì)AI加速計(jì)算需求,Telum II處理器內(nèi)部還集成了AI加速器,支持CISC指令集,支持Int8、FP16數(shù)據(jù)類型的計(jì)算加速,單芯片算力達(dá)24TOPS,可以運(yùn)行大語(yǔ)言模型,可實(shí)現(xiàn)低延遲、高吞吐量的交易內(nèi) AI 推理,例如增強(qiáng)金融交易期間的欺詐檢測(cè),并使每個(gè)芯片的AI計(jì)算能力比上一代提高了四倍。每個(gè)drawer集群(8個(gè)AI內(nèi)核)可以將算力提升到192TOPS。

Spyre AI加速器

Spyre AI加速器是基于三星5nm LPE制程技術(shù)制造,核心面積為330mm,擁有260億個(gè)晶體管,是一款專門面向企業(yè)級(jí)的AI加速器,可以為復(fù)雜的AI模型和生成式AI應(yīng)用提供可擴(kuò)展的AI加速功能。

具體來(lái)說(shuō),Spyre AI加速器擁有32個(gè)計(jì)算核心,與Telum II整合的AI內(nèi)核擁有類似的構(gòu)架,支持 int4、int8、fp8 和 fp16 數(shù)據(jù)類型,整體算力超過(guò)300TOPS,適用于低延遲和高吞吐量 AI 應(yīng)用。每個(gè)計(jì)算核心還擁有2MB暫存,擁有超過(guò)55%的有效TOPS利用率。內(nèi)存方面,支持LPDDR5。

Spyre AI加速器的核心結(jié)構(gòu):

8個(gè)Spyre AI加速器可以通過(guò) 75 瓦 PCIe 適配器連接成為一個(gè)集群,整個(gè)集群可以支持1TB的內(nèi)存,帶來(lái)高達(dá)1.6TB/s的帶寬。

IBM表示,Telum II處理器 和 Spyre AI加速器可以協(xié)同工作,形成一個(gè)可擴(kuò)展的架構(gòu),以支持 AI 建模的集成方法,即將多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí) AI 模型與編碼器 LLM 相結(jié)合。通過(guò)利用每個(gè)模型架構(gòu)的優(yōu)勢(shì),與單個(gè)模型相比,集成 AI 方案可以提供更準(zhǔn)確和穩(wěn)健的結(jié)果。

“我們強(qiáng)大的多代路線圖使我們能夠在技術(shù)趨勢(shì)方面保持領(lǐng)先地位,包括不斷增長(zhǎng)的 AI 需求,”IBM Z 和 LinuxONE 產(chǎn)品管理副總裁 Tina Tarquinio 說(shuō)。“Telum II 處理器和 Spyre 加速器旨在提供高性能、安全且更節(jié)能的企業(yè)計(jì)算解決方案。經(jīng)過(guò)多年的開發(fā),這些創(chuàng)新將引入我們的下一代 IBM Z 平臺(tái),以便客戶可以大規(guī)模利用 LLM 和生成式 AI。”

據(jù)介紹,Telum II 處理器將成為為 IBM 下一代 IBM Z 和 IBM LinuxONE 平臺(tái)提供支持的中央處理器。它預(yù)計(jì)將于 2025 年提供給 IBM Z 和 LinuxONE 客戶。IBM Spyre Accelerator 目前處于技術(shù)預(yù)覽階段,預(yù)計(jì)也將于 2025 年推出。

編輯:芯智訊-浪客劍

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: IBM 推出 5.5GHz 八核 處理器 Telum 還有

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港