騰訊云上目前提供的實例主要分為兩大系列:6代實例(S6、C6、M6),基于第三代英特爾至強處理器;以及8代實例(S8、M8),搭載第五代英特爾至強處理器。與原來使用的第三代至強相比,現(xiàn)在搭載第五代至強的實例性能提升尤為顯著。
首先,物理核心數(shù)量從36個提升到了56個,內(nèi)存帶寬從DDR4升級為DDR5,速率提升75%,并且PCIe帶寬也實現(xiàn)了翻倍。更值得一提的是,L3緩存從60MB增至320MB,提升了5倍,單核的IPC至少提升了25%。
英特爾資深技術專家表示,這些改進使得在實際應用中,騰訊云的實例可以處理更復雜的任務,特別是在AI和大規(guī)模數(shù)據(jù)處理場景中表現(xiàn)優(yōu)異。
騰訊云將基于英特爾至強6構建下一代CVM實例
下一階段,英特爾計劃推出更性能強大的至強6性能核處理器。首先,至強6性能核處理器的核心數(shù)量將增加到128個。內(nèi)存通道也將從8個擴展到12個,并且,它的內(nèi)存速率將達到8800MT/s,提升1.57倍。
至強6還支持最新的MRDIMM,MRDIMM的優(yōu)勢在于通過多路復用技術優(yōu)化內(nèi)存數(shù)據(jù)傳輸,提升內(nèi)存系統(tǒng)的帶寬利用率和頻率性能,同時支持更高的容量和效率,適用于高性能計算和服務器環(huán)境。
至強6還引入了新的AI功能,支持FP16數(shù)據(jù)類型,可以為AI推理和訓練提供更高精度的選擇。此外,它還支持CXL 2.0,支持各種CXL設備,為未來的內(nèi)存擴展和池化奠定了中套基礎。
英特爾專家表示,英特爾也將用至強6助力騰訊打造下一代CVM實例。這些硬件提升將為云計算和AI提供更強大的支持,特別是在需要大規(guī)模數(shù)據(jù)處理和并發(fā)計算的場景中,至強6的性能將顯著超越其前代。
英特爾的架構優(yōu)勢:獨特的網(wǎng)絡與內(nèi)存設計
相比競爭對手,英特爾至強處理器在架構設計上具備兩大顯著優(yōu)勢。
首先,第五代英特爾至強由兩個Tile構成,每個Tile最多32個物理核心,處理器最多64核。兩個Tile通過Mesh網(wǎng)絡連接,以確保核心之間的低延遲通信。
也就是說,英特爾的Mesh架構通過網(wǎng)狀網(wǎng)絡連接所有的CPU核心,使得多核心的通信延遲顯著降低,這意味著它在多核并發(fā)任務中表現(xiàn)更為突出。
而AMD采用的是多個Die的小核心設計,通過中央的I/O Die連接多個Die,這種總線式架構導致Die之間的通信隔離性較強,跨Die時的延遲較高。
根據(jù)Java負載基準測試發(fā)現(xiàn),在虛擬機核數(shù)較少時區(qū)別不大,但當虛擬機超過24核時,英特爾至強處理器的多核性能明顯領先于對手,最高差出42%,展現(xiàn)了更強的擴展性。
其次,內(nèi)存帶寬是影響處理器性能的關鍵因素之一,特別是在需要頻繁內(nèi)存讀寫的應用中,如AI訓練、游戲和科學計算。
第五代英特爾至強的加持,讓騰訊云S8 CVM單核內(nèi)存帶寬達到了3.2GB/s,基于AMD的SA4高33%,比基于AMD的SA5高出77%。
當內(nèi)存帶寬不會輕易成為系統(tǒng)瓶頸,處理器可以更高效地執(zhí)行復雜任務,在處理大規(guī)模并發(fā)任務時會更從容。
應用場景:游戲、科學計算與數(shù)據(jù)處理
英特爾至強處理器的技術優(yōu)勢在多個行業(yè)的應用中得到了驗證,尤其在游戲、科學計算和數(shù)據(jù)處理等領域表現(xiàn)尤為出色。
為游戲行業(yè)用戶提供更高性能和更低延遲
MMORPG、FPS、以及很多對戰(zhàn)游戲?qū)Ψ掌鞯囊蠛芨?,特別是在并發(fā)計算和實時數(shù)據(jù)同步方面。游戲中的玩家行為涉及大量的時空矢量計算,這些計算需要在極短時間內(nèi)完成,同時還要同步大量數(shù)據(jù),以確保玩家實時看到其他玩家的動作。
首先,第五代英特爾至強通過更高的IPC性能和AVX-512指令集加速這些矢量計算,同時內(nèi)置的AI加速引擎能夠提升游戲中的AI表現(xiàn)。第五代英特爾至強在單核性能上比前代提升25%,能夠支持更多的玩家并發(fā)運行。
此外,搭載第五代英特爾至強的騰訊云S8云主機有更大的L3緩存、更高的內(nèi)存帶寬和網(wǎng)絡吞吐能力,這有助于減少延遲,確保更快的數(shù)據(jù)同步和更流暢的游戲體驗。
同時,采用第五代英特爾至強的騰訊云S8云主機在高密度部署時性能衰減更可控,適合游戲服務器的大規(guī)模部署。
最后,英特爾在游戲領域還提供了優(yōu)化的編譯器、渲染工具包和AI工具,幫助提升游戲開發(fā)和運行的性能。
英特爾與Riot Games合作的游戲《Valorant》就是一個典型案例。通過軟硬件優(yōu)化,英特爾幫助《Valorant》實現(xiàn)了128Tickrate的刷新率,帶來了更低延遲和更流暢的游戲體驗。《Valorant》在國服上線時,英特爾通過硬件升級和優(yōu)化,提升了用戶承載量。
科學計算領域,加速仿真與研發(fā)
在科學計算領域,英特爾至強處理器同樣有出色表現(xiàn)。通過與騰訊云和合作伙伴的聯(lián)合解決方案,基于英特爾至強處理器的云架構能夠顯著提升并發(fā)計算的能力。
比如,騰訊云與速石科技合作,基于搭載英特爾至強實例的騰訊云服務器,建立了混合云存算分離架構。該架構使任務并發(fā)量提高了100%,仿真周期縮短了30%。
與晶泰科技合作的藥物研發(fā)案例中,英特爾不僅提供了硬件支持,還利用了OneAPI軟件生態(tài)庫。這個生態(tài)庫包含了科學計算所需的編譯器、數(shù)學庫、通信庫和并行庫,幫助優(yōu)化計算性能。
通過這套軟件優(yōu)化,總體性能提升了2.32倍,其中,切換到英特爾編譯器,性能提升了41%。通過使用英特爾數(shù)學庫,性能提升了28%。利用英特爾IPP中的AVX-512指令集,性能提升了38%。
提升數(shù)據(jù)庫性能
在數(shù)據(jù)處理領域,特別是數(shù)據(jù)庫的應用中,英特爾至強憑借大容量的L3緩存和向量計算能力,顯著提升了數(shù)據(jù)庫的性能。例如,在MySQL數(shù)據(jù)庫的測試中,第五代英特爾至強比第三代英特爾至強在同等規(guī)格下,性能提升了40%。
小結(jié)
英特爾通過不斷創(chuàng)新,繼續(xù)在競爭激烈的通用計算市場中保持領先。通過與騰訊云等領先的云服務提供商的合作,英特爾至強處理器不僅在當前應用中展現(xiàn)了卓越的性能,還為未來的云計算和AI工作負載提供了堅實的基礎。