概覽:
在AMD,能效一直是我們路線圖和產(chǎn)品戰(zhàn)略中的核心設計指導原則。十多年來,我們制定了公開、有時限的目標,以大幅提升產(chǎn)品的能效,并始終如一地實現(xiàn)并超越這些目標。今天,我很自豪地宣布,我們再次做到了,并正在制定下一個五年節(jié)能設計的愿景。
在今天的Advancing AI上,我們宣布AMD已經(jīng)超越了在2021年制定的30×25目標,即從2020年到2025年將AI訓練和高性能計算(HPC)節(jié)點的能效提高30倍。這是一個雄心勃勃的目標,我們很自豪能夠超額完成它,但我們不會止步于此。
隨著人工智能規(guī)模的不斷擴大,以及我們邁向真正端到端的全AI系統(tǒng)設計,我們比以往任何時候都更需要繼續(xù)保持在節(jié)能設計領域的領先地位。正因為此,我們今天也將目光投向一個大膽的新目標:以2024年為基準,到2030年,將用于AI訓練和推理的機架級能效提升20倍。
在十年領先地位的基礎上再接再厲
這標志著我們在數(shù)十年間致力于提高整個計算平臺能效的第三個重要里程碑。2020年,我們超額實現(xiàn)了25×20的目標,在短短六年內(nèi)將AMD移動處理器的能效提高了25倍。在此勢頭之上,便是針對加速節(jié)點中AI和HPC工作負載的30×25目標。如今,到2030年實現(xiàn)機架級20倍能效提升的目標反映了下一個前沿領域,不僅著眼于芯片,還關注更智能和更高效的系統(tǒng),從芯片到整機架集成,以滿足數(shù)據(jù)中心級別的電力需求。
超越 30×25
我們的30×25目標源自于一個明確的基準,即與2020年基準年相比,將加速計算節(jié)點的能效提升30倍。這一目標意味著,與過去五年(2015-2020年)的行業(yè)趨勢相比,能效提升2.5倍以上。截至 2025 年中,我們已超越這一目標,在四塊AMD Instinct GPU和一顆第五代AMD EPYC CPU的當前配置下,相較基準系統(tǒng)實現(xiàn)38倍的能效提升。與五年前的系統(tǒng)相比,這相當于在相同性能下能耗降低97%。
我們通過深度架構創(chuàng)新、積極優(yōu)化每瓦性能以及對CPU和GPU產(chǎn)品線進行不懈的工程設計實現(xiàn)了這一目標。
AI時代的新目標
隨著工作負載規(guī)模和需求的持續(xù)增長,節(jié)點級效率提升將無法跟上步伐。最顯著的效率影響可以在系統(tǒng)級實現(xiàn),而這正是我們2030年目標的重點。
我們相信,從2024年到2030年,我們可以將AI訓練和推理的機架級能效提升20倍。AMD 估計,這將比2018年至2025年的行業(yè)提升趨勢高出近3倍。根據(jù)我們最新的設計和路線圖預測,這反映了整個機架的每瓦性能提升,包括 CPU、GPU、內(nèi)存、網(wǎng)絡、存儲和軟硬件協(xié)同設計。這種從節(jié)點到機架的轉變得益于我們快速發(fā)展的端到端AI戰(zhàn)略,也是以更可持續(xù)的方式擴展數(shù)據(jù)中心AI的關鍵。
實踐中的意義
機架級效率提升20倍,幾乎是之前行業(yè)效率提升率的3倍,意義重大。以2025年典型AI模型的訓練為基準,這些提升可以實現(xiàn):
?將機架數(shù)量從超過275個整合到少于1個已充分利用的機架
?運營用電量減少95%以上
?模型訓練產(chǎn)生的碳排放量從約3000公噸二氧化碳減少到100公噸二氧化碳
這些預測基于AMD芯片和系統(tǒng)設計路線圖以及能效專家Jonathan Koomey博士驗證的測量方法。
Koomey 博士表示:“通過將2030年目標建立在系統(tǒng)級指標和透明方法的基礎上,AMD正在提高行業(yè)標準。機架級效率的目標提升將使生態(tài)系統(tǒng)中的其他各方,從模型開發(fā)者到云服務提供商,更能夠可持續(xù)、更具成本效益地擴展AI計算。”
放眼硬件之外
我們的20倍目標體現(xiàn)了我們直接掌控的領域——硬件和系統(tǒng)級設計。但我們知道,隨著軟件開發(fā)人員不斷探索更智能的算法,并以目前的速度繼續(xù)使用低精度方法進行創(chuàng)新,AI模型的效率將有可能實現(xiàn)更大提升,在目標期內(nèi)最高可達5倍。將這些因素納入考量,到2030年,典型AI模型訓練的整體能效將提升100倍。
雖然 AMD 并未宣稱在我們自己的目標中已實現(xiàn)如此高的倍增,但我們很自豪能夠提供實現(xiàn)這一目標的硬件基礎,并支持致力于實現(xiàn)這些提升的開放生態(tài)系統(tǒng)和開發(fā)者社區(qū)以實現(xiàn)這些收益。無論是通過開放標準、AMD ROCm的開放軟件方案,還是與合作伙伴的密切合作,AMD 始終致力于幫助世界各地的創(chuàng)新者更高效地擴展AI規(guī)模。
下一步行動
我們以30×25為上一個篇章畫上句號,并以全新的機架級目標開啟下一章,我們將繼續(xù)致力于透明、責任義務和可衡量的進展。這種方式使AMD脫穎而出,而且對于我們?nèi)绾卧贏I需求和部署不斷擴展的背景下推動行業(yè)效率提升也必不可少。
我們很高興能夠不斷挑戰(zhàn)極限,不僅僅是性能的極限,還有以效率為主導的無限可能。隨著目標的推進,我們將繼續(xù)分享進展情況以及這些成果對整個生態(tài)系統(tǒng)產(chǎn)生的影響。
【本文作者Samuel Naffziger, AMD高級副總裁兼企業(yè)院士】