(圖片引自SemiAnalysis報道)

據(jù)SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構(gòu)建,通過全互連拓撲架構(gòu)實現(xiàn)芯片間高效協(xié)同,可提供高達300 PFLOPs的密集BF16算力,接近達到英偉達GB200 NVL72系統(tǒng)的兩倍。此外,CM384在內(nèi)存容量和帶寬方面同樣占據(jù)優(yōu)勢,總內(nèi)存容量超出英偉達方案3.6倍,內(nèi)存帶寬也達到2.1倍,為大規(guī)模AI訓(xùn)練和推理提供了更高效的硬件支持。

(圖片引自SemiAnalysis報道)

報道分析稱,盡管單顆昇騰芯片性能約為英偉達Blackwell架構(gòu)GPU的三分之一,但華為通過規(guī)模化系統(tǒng)設(shè)計,成功實現(xiàn)整體算力躍升,并在超大規(guī)模模型訓(xùn)練、實時推理等場景中展現(xiàn)更強競爭力。SemiAnalysis也指出,華為的工程優(yōu)勢不僅體現(xiàn)在芯片層面,更在于系統(tǒng)級的創(chuàng)新,包括網(wǎng)絡(luò)架構(gòu)、光學(xué)互聯(lián)和軟件優(yōu)化,使得CM384能夠充分發(fā)揮集群算力,滿足超大規(guī)模AI計算需求。

此次華為云CloudMatrix 384的發(fā)布,標(biāo)志著中國在AI計算系統(tǒng)領(lǐng)域已具備與國際巨頭正面競爭的實力。SemiAnalysis在報道中特別指出,華為的規(guī)模化解決方案“領(lǐng)先于英偉達和AMD目前市場上的產(chǎn)品一代”,并認(rèn)為中國在AI基礎(chǔ)設(shè)施上的突破將對全球AI產(chǎn)業(yè)格局產(chǎn)生深遠影響。

分享到

崔歡歡

相關(guān)推薦