文字編輯|宋雨涵

1

整場發(fā)布會重點信息一覽

新發(fā)布涉及十大重點

整場演講信息量爆棚,覆蓋加速計算、深度推理模型、AI智能體、物理AI、機器人技術(shù)、自動駕駛等在內(nèi)的AI下一個風口,新發(fā)布涉及十大重點:

1、Vera Rubin與Rubin Ultra芯片:兩代旗艦芯片HBM內(nèi)存實現(xiàn)升級,GPU“樂高拼裝”技術(shù)日益成熟。提前揭曉Vera Rubin NVL144機架及Rubin Ultra NVL576機架性能,F(xiàn)P4推理性能峰值達15EFLOPS,基于Rubin的AI工廠性能相較Hopper提升900倍。

2、Blackwell Ultra芯片:全球首款288GB HBM3e GPU亮相,發(fā)布GB300 NVL72機架及HGX B300 NVL16機架系統(tǒng)方案,實現(xiàn)機架如單一大型GPU般高效運行。

3、數(shù)據(jù)中心AI超算方案:推出Blackwell Ultra DGX SuperPOD,搭載全新DGX GB300與DGX B300系統(tǒng),助力企業(yè)輕松構(gòu)建AI超級計算機。同時發(fā)布AI托管服務(wù)NVIDIA Instant AI Factory及AI數(shù)據(jù)中心運營編排軟件NVIDIA Mission Control。

4、AI推理與智能體軟件:AI推理軟件Dynamo在運行DeepSeek-R1模型時,GPU生成token數(shù)量提升超30倍。全新Llama Nemotron推理模型系列中,Super 49B版本吞吐量達Llama 3.3 70B及DeepSeek R1 Llama 70B的5倍。宣布向全球企業(yè)提供構(gòu)建AI智能體的核心模塊,存儲巨頭攜手構(gòu)建企業(yè)級AI數(shù)據(jù)平臺。

5、個人AI超算產(chǎn)品:推出全球最小AI超算DGX Spark及高性能桌面級AI超算DGX Station,滿足開發(fā)者本地微調(diào)或推理深度思考模型需求。

6、Blackwell芯片進展:已全面投入生產(chǎn),銷量較上一代Hopper增長3倍。

7、工作站與服務(wù)器GPU更新:推出RTX Pro Blackwell數(shù)據(jù)中心GPU、桌面級GPU及筆記本電腦GPU新品。

8、光電一體化封裝網(wǎng)絡(luò)交換機:推出“世界領(lǐng)先”的網(wǎng)絡(luò)解決方案,支持AI工廠擴展至數(shù)百萬塊GPU規(guī)模。

9、物理AI與機器人技術(shù):開源Isaac GR00T N1人形機器人基礎(chǔ)模型,與迪士尼研究院、谷歌DeepMind合作開發(fā)開源物理引擎Newton。

10、電信AI與自動駕駛領(lǐng)域:與通用汽車攜手打造GM AI,為工廠和汽車提供全方位全棧自動駕駛安全系統(tǒng)NVIDIA Halos。

Blackwell GPU創(chuàng)下DeepSeek-R1推理性能的世界紀錄

值得一提的是,英偉達宣布Blackwell GPU創(chuàng)下滿血版DeepSeek-R1推理性能的世界紀錄。
單個配備8塊Blackwell GPU的NVIDIA DGX系統(tǒng),可實現(xiàn)每位用戶每秒超過250個token,或每秒超過30000個token的最大吞吐量。通過硬件和軟件的結(jié)合,英偉達自今年1月以來將DeepSeek-R1 671B模型的吞吐量提高了約36倍,相當于每個token的成本改善了約32倍。

2

芯片演進路線提前曝光

下一代Vera Rubin超級芯片明年登場!

英偉達Blackwell芯片自推出以來,在AI行業(yè)取得了顯著成就。據(jù)數(shù)據(jù)顯示,2024年全球前四云服務(wù)提供商共計采購了130萬片Hopper架構(gòu)芯片,而到了2025年,他們更是購買了360萬片Blackwell芯片。

英偉達最新財報顯示,Blackwell架構(gòu)AI芯片的銷售勢頭極為強勁,在正式出貨的首個季度就實現(xiàn)了超百億美元的收入,遠超公司的預期。

展望未來,黃仁勛預計到2028年,數(shù)據(jù)中心建設(shè)支出將達到1萬億美元。

近年來,數(shù)據(jù)中心一直是英偉達營收和利潤的主要來源。在之前的財報溝通會上,黃仁勛和公司CFO均表示,全球?qū)I基礎(chǔ)設(shè)施的需求將持續(xù)增長,因為客戶希望部署更大、更復雜的集群,這不僅需要英偉達的GPU,還需要其NVLink交換機、InfiniBand以及Spectrum-X系列網(wǎng)絡(luò)套件。

GTC大會上,英偉達推出了新一代芯片Blackwell Ultra(GB300),包括NVIDIA GB300 NVL72機架級解決方案和NVIDIA HGX B300 NVL16系統(tǒng)。GB300 NVL72的AI性能是前一代GB200 NVL72的1.5倍,這使得基于GB300構(gòu)建的AI工廠的收入機會相比基于Hopper構(gòu)建的系統(tǒng)增加了50倍。

同時,黃仁勛還展示了未來三年芯片架構(gòu)的技術(shù)路線圖。

下一代芯片將被命名為Vera Rubin,預計將在2026年下半年接替Blackwell Ultra。而到了2027年下半年,英偉達將推出Rubin Ultra版本。黃仁勛表示,Rubin的性能將達到Hopper的900倍,相比之下,Blackwell相較Hopper已經(jīng)實現(xiàn)了68倍的提升。

此外,英偉達還計劃推出Rubin的Ultra版本,以滿足更高性能的需求。不僅如此,黃仁勛還提前透露了Rubin之后的下一代芯片架構(gòu)名稱——Feynman,以著名物理學家理查德·費曼的名字命名,延續(xù)了英偉達以科學家命名GPU架構(gòu)的傳統(tǒng)。

四代芯片路線一覽:

“構(gòu)建AI工廠需要數(shù)年前瞻規(guī)劃,我們必須讓客戶看到未來三年的技術(shù)藍圖。”黃仁勛強調(diào)

三、新旗艦Blackwell Ultra:

全球首個288GB HBM3e GPU

作為本次大會的核心產(chǎn)品,Blackwell Ultra GPU以288GB HBM3e內(nèi)存和1.8TB/s NVLink帶寬成為焦點。

其FP4精度算力達15PFLOPS,推理速度較前代Hopper架構(gòu)提升40倍,支持72顆GPU構(gòu)建單機架級解決方案。

搭載該芯片的GB300 NVL72機架在運行DeepSeek-R1 671B模型時,單用戶響應速度達253Token/s,峰值吞吐量突破30,000Token/s,較前代H100系統(tǒng)提升36倍。

黃仁勛現(xiàn)場演示了復雜推理任務(wù):7人婚宴座位安排問題在10秒內(nèi)完成,而傳統(tǒng)系統(tǒng)需1分半鐘。

技術(shù)突破:

四、機器人仍是壓軸節(jié)目

具身智能浪潮已經(jīng)到來

在芯片發(fā)布之后,黃仁勛又帶來了全新的AI推理服務(wù)軟件Dynamo,旨在開啟AI工廠的革命性變革。演講的壓軸環(huán)節(jié),機器人再次登場,但這次不同以往,上臺的是英偉達與谷歌、迪士尼聯(lián)合開發(fā)的機器人Blue(星球大戰(zhàn)主題機器人)。演示環(huán)節(jié)中,Blue展現(xiàn)出極高的靈活性,能夠準確聽從指令,且形態(tài)呆萌可愛。

作為算力領(lǐng)域的佼佼者,英偉達將新的增長希望寄托于機器人技術(shù)。黃仁勛表示,機器人技術(shù)的下一波浪潮已經(jīng)到來,它由物理AI驅(qū)動,使機器人能夠理解并適應物理世界。可以說,機器人時代已經(jīng)悄然降臨。

在此次大會上,英偉達隆重推出了全球首款開源人形機器人通用基礎(chǔ)模型——GR00T N1。這款模型不僅是世界首款開源的,還具備可定制性,為人形機器人的發(fā)展提供了全新基礎(chǔ)。

據(jù)介紹,GR00T N1采用了雙系統(tǒng)架構(gòu),這一設(shè)計靈感來源于人類的認知原理。其中,“系統(tǒng)1”負責快速思考,類似于人類的直覺和反射反應;“系統(tǒng)2”則負責慢速思考,用于做出深思熟慮的決策。

此外,黃仁勛還宣布了與谷歌DeepMind和迪士尼研究所的合作,共同開發(fā)開源物理引擎Newton。這一引擎將使機器人能夠更精確地處理復雜任務(wù),提升其智能化水平。預計Newton物理引擎將于2025年晚些時候正式推出。

黃仁勛對機器人市場的前景充滿信心,他認為這一市場具有巨大的爆發(fā)潛力,并有望成為最大的產(chǎn)業(yè)之一。期待如黃仁勛所言,在AI時代,每個人都能成為贏家。

分享到

lixiangjing

算力豹主編

相關(guān)推薦