展會(huì)信息港展會(huì)大全

黃仁勛自曝英偉達(dá)最強(qiáng)Rubin架構(gòu)!數(shù)百萬(wàn)GPU集群將至,人形機(jī)器人是未來(lái)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-03 08:42:22   瀏覽:5141次  

導(dǎo)讀:芯東西6月3日?qǐng)?bào)道,昨夜,英偉達(dá)披露未來(lái)三代數(shù)據(jù)中心半導(dǎo)體技術(shù)路線圖,新GPU架構(gòu)每年一更: 2025年推出Blackwell Ultra GPU(8S HBM3e 12H);2026年推出Rubin GPU(8S HBM4);2027年推出Rubin Ultra GPU(12S HBM4),新一代基于Arm的Vera CPU,以及NVLi...

芯東西6月3日?qǐng)?bào)道,昨夜,英偉達(dá)披露未來(lái)三代數(shù)據(jù)中心半導(dǎo)體技術(shù)路線圖,新GPU架構(gòu)每年一更:

2025年推出Blackwell Ultra GPU(8S HBM3e 12H);2026年推出Rubin GPU(8S HBM4);2027年推出Rubin Ultra GPU(12S HBM4),新一代基于Arm的Vera CPU,以及NVLink 6 Switch(3600GB/s)。

Rubin和Vera的命名均源自美國(guó)天文學(xué)家Vera Rubin。她對(duì)宇宙暗物質(zhì)研究做出重大貢獻(xiàn)。

“我在這里向你們展示的所有這些芯片都在完全開(kāi)發(fā)中,百分之百。”英偉達(dá)創(chuàng)始人兼CEO黃仁勛說(shuō),英偉達(dá)的更新節(jié)奏以年為單位,所有架構(gòu)都是兼容的,“以一年為周期,我們把所有東西推向技術(shù)極限”。

作為本周臺(tái)北國(guó)際電腦展COMPUTEX 2024開(kāi)幕前的重磅演講嘉賓,黃仁勛甩出未來(lái)三代GPU架構(gòu)這一重磅披露,顯得誠(chéng)意十足。

身為芯片圈“頂流”,黃仁勛這次到臺(tái)灣省再度引起轟動(dòng)。他前幾天相當(dāng)繁忙,又是跟臺(tái)積電創(chuàng)始人張忠謀、聯(lián)發(fā)科董事長(zhǎng)蔡明介、廣達(dá)董事長(zhǎng)林百里等大佬聚餐,又是拉著92歲高齡的張忠謀去體驗(yàn)逛夜市,所到之處都受到巨星級(jí)歡迎,從具體行程到宴請(qǐng)菜品都被臺(tái)媒扒個(gè)底朝天。

連續(xù)數(shù)日霸屏臺(tái)灣科技頭條,只是“皮衣老黃”黃仁勛來(lái)臺(tái)的開(kāi)胃菜。

周日晚上19點(diǎn)09分,正餐來(lái)了

最近英偉達(dá)市值穩(wěn)定在2.7萬(wàn)億美元,黃仁勛儼然人逢喜事精神爽,穿著標(biāo)志性的黑色皮衣一路小跑登臺(tái),滿面笑容地向臺(tái)灣大學(xué)綜合體育館內(nèi)的6500名參會(huì)者用中文問(wèn)候:“大家好!”

臺(tái)下也是大佬云集,有美超微CEO梁見(jiàn)后、華碩董事長(zhǎng)施崇棠、鴻海董事長(zhǎng)劉揚(yáng)偉、聯(lián)發(fā)科總經(jīng)理陳冠州等。

黃仁勛在演講中忍不住提起到臺(tái)灣夜市,說(shuō)自己很喜歡逛夜市,因?yàn)楹芟矚g看人,自己臉上有道疤就是小時(shí)候去夜市時(shí)被不慎割傷的,所以對(duì)夜市印象很深。他還特別夸贊了一位賣了43年水果的老板娘。

在介紹基于英偉達(dá)Earth-2數(shù)字孿生地球和英偉達(dá)CorrDiff生成式AI模型生成的12倍高解析度天氣預(yù)測(cè)模型時(shí),他更是全程中文,流利不卡頓。

老黃中文進(jìn)步這么大?隨后黃仁勛自揭謎底:都是AI生成的!

他還在現(xiàn)場(chǎng)展示了Blackwell芯片主板,稱這是“世界上最復(fù)雜、性能最高的計(jì)算機(jī)”。

黃仁勛說(shuō),自己這場(chǎng)演講主要談三件事:一是其工作的意義;二是什么是生成式AI以及它對(duì)各行業(yè)的影響;三是英偉達(dá)的藍(lán)圖和下一步。

他堅(jiān)信下一波AI浪潮是物理AI,看好人形機(jī)器人,還站在大屏幕顯示的9款人形機(jī)器人之間張開(kāi)雙臂展示。

一、8年AI算力漲1000倍,能耗降到1/350

黃仁勛說(shuō),英偉達(dá)立足于計(jì)算機(jī)圖形學(xué)、仿真和AI的交叉領(lǐng)域,這是英偉達(dá)的靈魂。加速計(jì)算和AI技術(shù)將會(huì)重塑計(jì)算機(jī)行業(yè)。

他強(qiáng)調(diào)加速計(jì)算能夠?qū)崿F(xiàn)可持續(xù)增長(zhǎng),稱CPU的性能擴(kuò)展已經(jīng)大大放緩,頂不住持續(xù)暴增的計(jì)算需求、數(shù)據(jù)處理需求、數(shù)據(jù)中心電量、計(jì)算機(jī)成本了,而更好的辦法就是加速計(jì)算。

一如既往,黃仁勛現(xiàn)場(chǎng)算賬,說(shuō)明“買得越多,省得越多”。

英偉達(dá)通過(guò)GPU+CPU組合,實(shí)現(xiàn)了高達(dá)100倍的加速,同時(shí)功耗僅增加到3倍,成本僅增加到1.5倍。

“100倍的速度意味著97%、98%的節(jié)剩所以當(dāng)我們從100倍的速度到200倍的速度再到1000倍的速度,節(jié)盛計(jì)算的邊際成本繼續(xù)下降。”黃仁勛說(shuō)。

英偉達(dá)的軟件組合也在不斷壯大。

黃仁勛再度強(qiáng)調(diào)CUDA的前瞻性和主導(dǎo)地位。通過(guò)CUDA+GPU的組合拳,英偉達(dá)實(shí)現(xiàn)安裝量一路上漲、開(kāi)發(fā)者和應(yīng)用越來(lái)越多、研發(fā)規(guī)模擴(kuò)大、性能越來(lái)越好的良性循環(huán)。

英偉達(dá)在1000美元的PC上添加了一張500美元的GPU,性能大幅提升;一個(gè)10億美元的數(shù)據(jù)中心加上5億美元的GPU,就能變成一個(gè)AI工廠。

黃仁勛說(shuō),很多公司花費(fèi)了數(shù)億美元在云端處理數(shù)據(jù),通過(guò)加速計(jì)算,可以節(jié)省數(shù)億美元。

8年內(nèi)英偉達(dá)AI算力增加了1000倍,能以更低成本去訓(xùn)練大模型。比如訓(xùn)練1.8萬(wàn)億參數(shù)、8萬(wàn)億token的GPT-4,所需能耗從8年前Pascal架構(gòu)的1000GWh減少到Blackwell的3GWh。

也就是說(shuō)將能耗足足降至8年前的1/350。

黃仁勛還分享說(shuō),Blackwell將生成token的能耗降至8年前的1/45000。

以前用Pascal產(chǎn)生1 token的能耗相當(dāng)于2個(gè)200W燈泡運(yùn)行2天,讓GPT-4生成一個(gè)單詞大約需要3個(gè)token,F(xiàn)在1 token只用0.4J能耗。

有Blackwell還不夠,必須制造更大的機(jī)器,英偉達(dá)構(gòu)建它的方式是風(fēng)冷DGX和液冷MGX。黃仁勛活像現(xiàn)場(chǎng)帶貨,對(duì)這些大機(jī)器挨個(gè)安利。

其中DGX的AI算力提升到上一代的45倍,達(dá)到1440PFLOPS,而能耗僅為上一代的10倍。

黃仁勛還拿了張GeForce顯卡跟機(jī)柜對(duì)比大校

新一代DGX能搭載72個(gè)GPU,背后由NVLink 5000根電纜組成的主干支持,能為一個(gè)機(jī)架節(jié)省20kW電能。

二、英偉達(dá)計(jì)劃每年推出Spectrum-X新品,數(shù)據(jù)中心將進(jìn)入數(shù)百萬(wàn)GPU時(shí)代

“數(shù)百萬(wàn)GPU數(shù)據(jù)中心的時(shí)代即將到來(lái)!”黃仁勛宣布每年推出新的Spectrum-X產(chǎn)品。

NVIDIA Spectrum-X是全球首款專為AI打造的以太網(wǎng)網(wǎng)絡(luò)平臺(tái),可將網(wǎng)絡(luò)性能較傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)平臺(tái)提升1.6倍,能加快AI工作負(fù)載的處理、分析和執(zhí)行速度。

Spectrum-X800為數(shù)萬(wàn)個(gè)GPU而設(shè)計(jì),X800 Ultra為數(shù)十萬(wàn)個(gè)GPU而設(shè)計(jì),X1600則可擴(kuò)展至數(shù)百萬(wàn)個(gè)GPU。

CoreWeave、Lambda等AI云服務(wù)提供商率先采用Spectrum-X。

英偉達(dá)計(jì)劃每年推出Spectrum-X新品,提供更高的帶寬、更多的端口、更加強(qiáng)大的軟件功能集與可編程能力,不斷提高AI以太網(wǎng)網(wǎng)絡(luò)性能。

三、AI工廠將掀起新產(chǎn)業(yè)革命,AMD和英特爾均支持MGX架構(gòu)

黃仁勛極力描繪生成式AI時(shí)代的巨大市場(chǎng)機(jī)會(huì):“有史以來(lái)第一次,IT行業(yè),這是3萬(wàn)億美元,3萬(wàn)億美元的IT產(chǎn)業(yè)即將創(chuàng)造出能夠直接服務(wù)于100萬(wàn)億美元產(chǎn)業(yè)的東西。”

他展示了英偉達(dá)如何從Blackwell芯片等一系列先進(jìn)技術(shù)和產(chǎn)品的組合,壘起層層疊疊的機(jī)架、集群,最終形成由32000張GPU組成的AI工廠。

永擎電子、華碩、技嘉、鴻佰科技、英業(yè)達(dá)、和碩、QCT、超微、緯創(chuàng)、緯穎等企業(yè)正在打造基于英偉達(dá)技術(shù)的云、專用系統(tǒng)和邊緣AI系統(tǒng)。

NVIDIA MGX模塊化參考設(shè)計(jì)平臺(tái)為計(jì)算機(jī)制造商提供了一個(gè)參考架構(gòu),以便其能夠以快速且低成本的方式構(gòu)建超過(guò)100種的系統(tǒng)設(shè)計(jì)配置。

MGX加入了對(duì)Blackwell產(chǎn)品的支持,包括專為大語(yǔ)言模型推理、檢索增強(qiáng)生成和數(shù)據(jù)處理而打造的全新GB200 NVL2平臺(tái)。

已有超過(guò)25家合作伙伴的90多套已發(fā)布或正在開(kāi)發(fā)中的系統(tǒng)使用了MGX參考架構(gòu),較去年來(lái)自6家合作伙伴的14套系統(tǒng)有顯著增加。

通過(guò)采用MGX,開(kāi)發(fā)成本大幅降低,較之前最多降低了3/4;開(kāi)發(fā)時(shí)間縮短到僅6個(gè)月,較之前減少了2/3。

AMD和英特爾都支持MGX架構(gòu),并首次計(jì)劃打造基于他們自己CPU主機(jī)處理器的模塊設(shè)計(jì),包括下一代AMD Turin平臺(tái)和基于P核心的第六代英特爾至強(qiáng)處理器(原Granite Rapids)。

四、從幾天縮至幾分鐘,NIM服務(wù)改變生成式AI模型部署方式

NVIDIA NIM推理微服務(wù)能將企業(yè)部署生成式AI應(yīng)用的時(shí)間從幾天壓縮到幾分鐘。

該服務(wù)提供了一種簡(jiǎn)單、標(biāo)準(zhǔn)化的方式,通過(guò)經(jīng)優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。

現(xiàn)在,全球2800萬(wàn)開(kāi)發(fā)者可下載NIM,從而輕松構(gòu)建Copilot、聊天機(jī)器人等生成式AI應(yīng)用。

與未使用NIM相比,在NIM中運(yùn)行Meta Llama 3-8B可產(chǎn)生高達(dá)3倍的生成式AI token。這有助于企業(yè)在相同計(jì)算基礎(chǔ)設(shè)施上大幅提高效率。

企業(yè)可使用NIM來(lái)運(yùn)行用于生成文本、圖像和視頻、語(yǔ)音以及交互式數(shù)字人的應(yīng)用。

200家技術(shù)合作伙伴正在將NIM集成到他們的平臺(tái)中以加快生成式AI部署。

開(kāi)發(fā)者可從Hugging Face上輕松訪問(wèn)和運(yùn)行Meta Llama 3模型的NIM服務(wù)。

“今天我們?cè)贖ugging Face上發(fā)布了全面優(yōu)化的Llama 3,”黃仁勛說(shuō),“你可以在任何云中運(yùn)行它。下載該容器,并將其存入數(shù)據(jù)中心,然后就可以托管,并提供給客戶使用。”

黃仁勛相信未來(lái)每家公司都會(huì)有NIM agent,分別負(fù)責(zé)弄清任務(wù)、拆解子任務(wù)、執(zhí)行,通過(guò)分工協(xié)作完成任務(wù)。

五、未來(lái)數(shù)字人會(huì)像人一樣交互,PC將是重要AI平臺(tái)

未來(lái)數(shù)字人會(huì)是什么樣?

黃仁勛展示了一段視頻,計(jì)算機(jī)可以像人一樣互動(dòng),比如用手機(jī)攝像頭掃過(guò)四周的環(huán)境,數(shù)字人就會(huì)做出判斷:“你似乎正在進(jìn)行某種錄制或制作布景中?”

數(shù)字人將徹底改變客服、廣告、游戲行業(yè)。例如,你用手機(jī)掃描廚房后,數(shù)字人可以成為AI室內(nèi)設(shè)計(jì)師,生成幾種設(shè)計(jì)選項(xiàng)并采購(gòu)家具;數(shù)字人還可以成為AI客服代理、數(shù)字醫(yī)療工作者,或者成為AI品牌大使,引領(lǐng)營(yíng)銷廣告新潮流。

黃仁勛說(shuō),PC將成為非常重要的AI平臺(tái),并發(fā)布4款新款RTX AI PC。

英偉達(dá)在全球有1億臺(tái)GeForce RTX AI PC的用戶基礎(chǔ),將通過(guò)200多款RTX AI筆記本電腦和500多款采用AI技術(shù)的應(yīng)用和游戲來(lái)改變消費(fèi)者的體驗(yàn)。

RTX套件和為NVIDIA ACE數(shù)字人平臺(tái)新推出的基于PC的NIM推理微服務(wù),將進(jìn)一步提高AI的可訪問(wèn)性。

英偉達(dá)還發(fā)布了搭載RTX的AI助手技術(shù)演示G-Assist項(xiàng)目,展示了針對(duì)PC游戲和應(yīng)用的上下文感知輔助功能,相當(dāng)于為玩家添加了一個(gè)能隨時(shí)咨詢攻略的游戲AI助手外掛。

微軟和英偉達(dá)正在一起幫助開(kāi)發(fā)者將新的生成式AI功能加入到Windows原生和Web應(yīng)用程序中,使開(kāi)發(fā)者能通過(guò)API工具來(lái)輕松訪問(wèn)由RTX加速的SLM(小型語(yǔ)言模型)。

黃仁勛相信,未來(lái)PC將成為一個(gè)AI,會(huì)一直在后臺(tái)協(xié)助你,還將運(yùn)行由AI增強(qiáng)的應(yīng)用程序,并且能承載帶有數(shù)字人類的應(yīng)用程序。

六、下一波AI浪潮是物理AI,人形機(jī)器人將被機(jī)器人工廠量產(chǎn)

接下來(lái)要做什么呢?

在黃仁勛看來(lái),下一波AI浪潮是物理AI,即理解物理定律的AI。

物理AI是指能理解指令,并在現(xiàn)實(shí)世界中自主執(zhí)行復(fù)雜任務(wù)的模型。

今天大多數(shù)AI并不理解物理定律,不以物質(zhì)世界為基矗而生成圖像、視頻、3D圖形和許多物理現(xiàn)象,需要基于物理并理解物理定律的AI。

為我們工作的AI,必須理解世界模型,才能理解如何解釋世界、如何感知世界。多模態(tài)大語(yǔ)言模型的突破,它使機(jī)器人能夠?qū)W習(xí)、感知和理解周圍的世界,并計(jì)劃它們將如何行動(dòng)。

從視頻中學(xué)習(xí)是一種途徑,另一種方法是合成、模擬數(shù)據(jù),還有利用計(jì)算機(jī)相互學(xué)習(xí)。如果AI數(shù)據(jù)是通過(guò)強(qiáng)化學(xué)習(xí)算法合成的,那么數(shù)據(jù)生成的速度將會(huì)持續(xù)變快,需要更大的GPU。

英偉達(dá)正在努力通過(guò)推進(jìn)英偉達(dá)機(jī)器人軟件棧來(lái)加速生成物理AI,包括用于模擬應(yīng)用的NVIDIA Omniverse平臺(tái)、Project GR00T人形機(jī)器人通用基礎(chǔ)模型和Jetson Thor機(jī)器人計(jì)算機(jī)。

“機(jī)器人時(shí)代已經(jīng)到來(lái)。”黃仁勛說(shuō),“AI的下一波浪潮已經(jīng)到來(lái)。由實(shí)體AI驅(qū)動(dòng)的機(jī)器人技術(shù)將徹底改變行業(yè)。這不是未來(lái)。這正在發(fā)生。”

他預(yù)言,總有一天,所有移動(dòng)的東西都將是自主的,世界各地研究人員和公司都在開(kāi)發(fā)由物理AI驅(qū)動(dòng)的機(jī)器人,“機(jī)器人將遍布所有工廠。工廠將實(shí)現(xiàn)對(duì)機(jī)器人的統(tǒng)籌,這些機(jī)器人將制造新的機(jī)器人產(chǎn)品。”

黃仁勛相信,下一個(gè)將由機(jī)器人工廠生產(chǎn)的大批量機(jī)器人產(chǎn)品很可能是人形機(jī)器人

。

他現(xiàn)場(chǎng)展示了全球最大電子制造商鴻海集團(tuán)(富士康如何利用NVIDIA Omniverse、Isaac和Metropolis創(chuàng)建其用于訓(xùn)練機(jī)器人的復(fù)雜工廠數(shù)字孿生,以更高精度優(yōu)化工作流并降低成本。

Omniverse是機(jī)器人可以學(xué)習(xí)如何成為機(jī)器人的一個(gè)虛擬世界模擬開(kāi)發(fā)平臺(tái),結(jié)合了實(shí)時(shí)、基于物理的渲染、物理模擬和生成AI技術(shù),能夠在虛擬環(huán)境中集成來(lái)自領(lǐng)先行業(yè)工具3D數(shù)據(jù)的平臺(tái),幫助鴻海團(tuán)隊(duì)優(yōu)化操作流程的設(shè)備布局,AI攝像頭通過(guò)NVIDIA Metropolis監(jiān)控工人安全。

然后,鴻?梢允褂霉S數(shù)字孿生作為虛擬培訓(xùn)環(huán)境來(lái)模擬、測(cè)試和驗(yàn)證其基于NVIDIA Isaac Perceptor加速庫(kù)構(gòu)建的自主移動(dòng)機(jī)器人(AMR),以及由NVIDIA Isaac Manipulator AI模型提供支持的AI機(jī)器人機(jī)械臂。

Isaac平臺(tái)采用模塊化設(shè)計(jì),擁有一整套NVIDIA加速庫(kù)、AI基礎(chǔ)模型和仿真技術(shù),今日起可供機(jī)器人制造商集成到其技術(shù)堆棧中,助力其提高工廠、倉(cāng)庫(kù)和配送中心的工作效率。

比亞迪電子、西門子、泰瑞達(dá)、Alphabet旗下公司Intrinsic等全球十多家領(lǐng)先的機(jī)器人企業(yè)正在采用NVIDIA Isaac機(jī)器人平臺(tái)。

100多家公司正在采用Isaac Sim來(lái)仿真、測(cè)試和驗(yàn)證機(jī)器人應(yīng)用。Agility、波士頓動(dòng)力公司、Figure AI、傅利葉智能、Sanctuary AI正在使用Isaac Lab。

黃仁勛說(shuō),英偉達(dá)將為每種類型的機(jī)器人系統(tǒng)創(chuàng)建平臺(tái),包括機(jī)器人工廠和倉(cāng)庫(kù)、用于操縱物體的機(jī)器人、移動(dòng)機(jī)器人,以及人形機(jī)器人。

構(gòu)建具有生成物理AI的機(jī)器人需要3臺(tái)計(jì)算機(jī):NVIDIA AI超級(jí)計(jì)算機(jī)來(lái)訓(xùn)練模型,NVIDIA Jetson-Orin和下一代Jetson-Thor機(jī)器人超級(jí)計(jì)算機(jī)來(lái)運(yùn)行這些模型,機(jī)器人還需用Omniverse來(lái)在模擬世界中學(xué)習(xí)和完善技能。

結(jié)語(yǔ):新一輪工業(yè)革命開(kāi)始,英偉達(dá)力推新型數(shù)據(jù)中心

“新一輪工業(yè)革命已經(jīng)開(kāi)始。眾多企業(yè)和地區(qū)正在與英偉達(dá)合作推動(dòng)價(jià)值萬(wàn)億美元的傳統(tǒng)數(shù)據(jù)中心向加速計(jì)算轉(zhuǎn)型,并建造一種新型數(shù)據(jù)中心「AI工廠」來(lái)生產(chǎn)新的商品AI。”黃仁勛說(shuō)。

他回顧道:“過(guò)去12年,我們意識(shí)到計(jì)算的未來(lái)將發(fā)生根本性的變化,直到今天,這真的和我之前說(shuō)的完全一樣,2012年前的GeForce和今天的英偉達(dá),公司已經(jīng)發(fā)生了巨大的變化。”

英偉達(dá)的路線圖將每年更新,其基本理念是“打造數(shù)據(jù)中心規(guī)模,以每年的節(jié)奏分步驟實(shí)現(xiàn)、并向客戶交付產(chǎn)品,在各領(lǐng)域?qū)崿F(xiàn)技術(shù)突破”。

黃仁勛承諾不會(huì)止步于此,希望英偉達(dá)繼續(xù)提高性能、降低訓(xùn)練和推理成本、擴(kuò)展AI功能,讓每家公司都能接受。

本周,全球科技產(chǎn)業(yè)的目光將持續(xù)聚焦在中國(guó)臺(tái)北。AMD董事長(zhǎng)兼CEO蘇姿豐、英特爾CEO基辛格、高通總裁兼CEO安蒙、恩智浦CTO Lars Reger、聯(lián)發(fā)科CEO蔡力行等芯片巨頭的高層都將在COMPUTEX發(fā)表演講,對(duì)這場(chǎng)科技盛會(huì)及其臺(tái)系合作伙伴表現(xiàn)出絕對(duì)的重視。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港