關(guān)于「算力豹」(微信公眾號(hào)搜索:dethinktank)
?▌Blackwell新架構(gòu)在萬(wàn)億參數(shù)級(jí)的大模型的成本和能耗較前代改善25倍?

30年來(lái),人們一直追求實(shí)現(xiàn)加速運(yùn)算和AI等變革性突破, 生成式AI是當(dāng)前決定性技術(shù)。生成式 AI 的下一步是多模態(tài)和視頻,也就意味著更大規(guī)模的訓(xùn)練。相對(duì)的是,算力市場(chǎng)也在升溫,硬件和軟件方面的競(jìng)爭(zhēng)都在加劇。

而英偉達(dá)帶來(lái)的產(chǎn)品總是再次將AI芯片的標(biāo)桿推向了難以想象的高度。全球的科技公司都還在爭(zhēng)搶Hooper(H100)芯片,但新一代產(chǎn)品已來(lái)。

今天凌晨四點(diǎn),加州圣何塞,在堪比科技界伍茲塔克(Woodstock)音樂(lè)節(jié)的GTC大會(huì)上,英偉達(dá)推出新一代AI圖形處理器芯片(GPU)架構(gòu)Blackwell,并重磅發(fā)布采用該架構(gòu)的GPU——B200GB200產(chǎn)品系列。GB200集成了1個(gè)Grace CPU和2個(gè)B200 GPU,號(hào)稱是全世界最強(qiáng)大的Grace超級(jí)芯片。

Blackwell新架構(gòu)代表了迄今為止功能最強(qiáng)大的AI芯片架構(gòu)!擁有2080億個(gè)晶體管的GPU,定制臺(tái)積電4nm工藝制造,通過(guò)NVLink連接實(shí)現(xiàn)高速通信;運(yùn)行實(shí)時(shí)生成式AI,在萬(wàn)億參數(shù)級(jí)的大型語(yǔ)言模型(LLM)的成本和能耗較前代改善25倍。

圖:黃仁勛右手舉著Blackwell,左手舉著Hopper GH100 GPU;圖源:GTC大會(huì)

這是塊非常非常大的GPU!”黃仁勛談道,他對(duì)著尺寸比較大顆的Hopper GH100 GPU打趣地說(shuō)“沒關(guān)系,你很棒,很棒的成長(zhǎng)”。

正如此前外媒DigiTimes爆料,Blackwell架構(gòu)GB200之所以這么“大”,是因?yàn)檫@是英偉達(dá)首個(gè)采用MCM(多芯片封裝)設(shè)計(jì)的GPU,在同一個(gè)芯片上集成了兩個(gè)GPU。

據(jù)了解,GB200驅(qū)動(dòng)系統(tǒng)可通過(guò)新Quantum-X800網(wǎng)絡(luò)獲得800Gb/s超高速網(wǎng)絡(luò)。此外,英偉達(dá)還推出GB200 NVL72液冷機(jī)架級(jí)系統(tǒng),集成36個(gè)Grace Blackwell超級(jí)芯片,與傳統(tǒng)H100 GPU相比,在大模型推理上可提升30倍性能。,時(shí)長(zhǎng)00:20

圖:Blackwell架構(gòu)

新一代SuperPOD超算 撐起百萬(wàn)億參數(shù)模型想象力

隨著AI對(duì)全領(lǐng)域的滲透和算力加緊加急部署,不斷變化的項(xiàng)目需求使得互聯(lián)網(wǎng)公司正在謀求一種更加安全、便捷、大規(guī)模、可擴(kuò)展、數(shù)據(jù)可隔離的集群式解決方案。

在本屆GTC大會(huì)上全新升級(jí)的 DGX SuperPoD,也為企業(yè)對(duì)u萬(wàn)億模型的探索提供了一份極其重要的保障。

英偉達(dá)基于GB200系統(tǒng),發(fā)布新一代DGX SuperPOD超級(jí)計(jì)算機(jī)平臺(tái),采用液冷設(shè)計(jì),提供11.5 exaflops AI運(yùn)算能力。

DGX SuperPOD是專門為AI量身定制的大規(guī)模、安全、可擴(kuò)展的超級(jí)計(jì)算機(jī)。可擴(kuò)展至數(shù)萬(wàn)個(gè)GB200超級(jí)芯片,并透過(guò)NVLink連接576個(gè)Blackwell GPU,獲取龐大共享內(nèi)存。該平臺(tái)具備智能管理和持續(xù)運(yùn)行能力,將極大推進(jìn)大規(guī)模生成式AI的部署。

圖:SuperPOD;圖源:GTC大會(huì)

除SuperPOD外,英偉達(dá)也推出DGX GB200系統(tǒng),提供144 petaflops AI性能、1.4TB GPU內(nèi)存,且比上代快15倍。B200支持DGX SuperPOD配置,為企業(yè)部署AI提供彈性。

入局具身智能 發(fā)布多模態(tài)AI項(xiàng)目GR00T

當(dāng)AI大模型有了身體,會(huì)是什么樣?從Figure 01身上已隱約可見人類與AI共存的未來(lái)

在今天的GTC大會(huì)中,英偉達(dá)還公布了人形機(jī)器人項(xiàng)目GR00T。黃仁勛展示了多個(gè)由GR00T驅(qū)動(dòng)的人形機(jī)器人如何任務(wù),包括來(lái)自Agility Robotics、Apptronik、傅利葉智能(Fourier Intelligence) 和宇樹科技(Unitree Robotics)的機(jī)器人產(chǎn)品。亮點(diǎn)有:

▌使用其數(shù)位孿生技術(shù),讓機(jī)器人可以在虛擬世界不會(huì)摔斷腿就可以學(xué)會(huì)走路、揮手

▌?dòng)ミ_(dá)將會(huì)提供Robotic Foundation Model,加速機(jī)器人時(shí)代來(lái)臨

GR00T于英偉達(dá)的Isaac機(jī)器人平臺(tái)工具,基于新的通用基礎(chǔ)模型,GR00T 驅(qū)動(dòng)的人形機(jī)器人能夠接受文本、語(yǔ)音、視頻甚至現(xiàn)場(chǎng)演示的輸入,并對(duì)其進(jìn)行處理以采取特定的操作,包括理解自然語(yǔ)言、模擬人類行為、在現(xiàn)實(shí)世界中導(dǎo)航和交互。英偉達(dá)還開發(fā)了一種新型“機(jī)器人大腦”計(jì)算芯片 Jetson Thor,能夠執(zhí)行復(fù)雜的任務(wù)并使用 Transforme 引擎處理多個(gè)傳感器。

人形機(jī)器人賽道近期達(dá)到了一個(gè)新的火熱程度,正如黃仁勛所說(shuō)“機(jī)器人的ChatGPT時(shí)刻可能即將到來(lái)”。

結(jié)語(yǔ)

當(dāng)黃仁勛又很淡定的在自家廚房里開完了GTC發(fā)布會(huì),我們知道這場(chǎng)“AI核彈”轟炸的影響將一直持續(xù)下去。

“通用計(jì)算已經(jīng)失去動(dòng)力,現(xiàn)在我們需要更大的模型,我們需要更大的GPU,更需要將GPU堆疊在一起?!秉S仁勛說(shuō)道?!斑@不是為了降低成本,而是為了擴(kuò)大規(guī)模?!盙B200預(yù)計(jì)將在今年晚些時(shí)候發(fā)貨。

隨著AI對(duì)全領(lǐng)域的滲透,英偉達(dá)超級(jí)芯片Blackwell、超算SuperPOD、人形機(jī)器人項(xiàng)目GR00T等產(chǎn)品的發(fā)布,使得造萬(wàn)億模型獲獎(jiǎng)成為可能,甚至打開了通往十萬(wàn)億,乃至更大想象力算力AI模型探索的潘多拉魔盒。?

參考鏈接:https://www.nvidia.cn/gtc-global/keynote/

*關(guān)于「算力豹」,微信公眾號(hào)搜索:dethinktank

分享到

yunlang

相關(guān)推薦