Clearwater Forest的至強6+,其架構(gòu)更為復(fù)雜,在一個非常小空間堆疊了29個芯片,實現(xiàn)了相當高的算力和密度。翻倍的核心數(shù)和性能、576MB的更大三級緩存、1.9倍的內(nèi)存帶寬,17%的IPC提升,相較于Sierra Forest,它有難以抗拒的吸引力。

核心規(guī)格固然重要,但對于英特爾來說,Intel 18A工藝上的進展更為重要,18A大致相當于1.8nm到2nm的水平,這是英特爾證明制造技術(shù)水平重回領(lǐng)先地位的里程碑,也關(guān)系到未來代工業(yè)務(wù)能否正常開展,這可能是英特爾近年來最重要的至強處理器。

288核至強6+全新能效核處理器,讓服務(wù)器一臺頂8

由于單一內(nèi)核架構(gòu)很難同時在性能和能耗上都優(yōu)化,于是從至強6開始,英特爾在在性能核處理器的基礎(chǔ)上,引入了能效核產(chǎn)品線。性能核主打性能,超線程以及AVX-512等一個都不少,而能效核主打核心多,能效高,代價是砍掉了超線程等特性。

2024年6月,英特爾發(fā)布第一款能效核至強處理器,它就是代號為Sierra Forest的至強6。目前,它在國內(nèi)外主流云廠商、電信運營商進行了大規(guī)模的部署,它帶來了3.8倍的能效比提升,在運營商環(huán)境中,能將單臺服務(wù)器的吞吐量增加5倍。

全新發(fā)布的Clearwater Forest,將核心數(shù)從144提升到了288個,帶來2倍的性能提升。雖然此前Sierra Forest也有288核的版本,但在并沒有在官方的SKU列表里放出來,應(yīng)該是只給部分云廠商提供,而這次應(yīng)該會大面積售賣288核版本。

這次內(nèi)核數(shù)暴增的同時,內(nèi)存通道數(shù)從8個升級為12個,內(nèi)存頻率從DDR5-6400MT/s升級到了DDR5-8000MT/s,算下來內(nèi)存帶寬提升了1.9倍,幾乎與核心增長同頻,用戶不用擔心內(nèi)存墻的問題。

此外,有消息顯示,Clearwater Forest這次不支持MRDIMM,無法將內(nèi)存頻率進行進一步提升。不過,它的LLC三級緩存的容量提升到了576MB,可以增強數(shù)據(jù)密集型場景的性能表現(xiàn)。

核心數(shù)的增長意味著可以用較少的服務(wù)器,提供相同的算力?,F(xiàn)在使用20臺機架180臺Clearwater Forest服務(wù)器就可以替代70個機架1400臺第二代英特爾至強服務(wù)器,兩者提供相同的算力,完成了8:1的服務(wù)器整合比例,降低71%的數(shù)據(jù)中心占用空間。

處理器架構(gòu)非常復(fù)雜,但帶來1.9倍的性能提升

Clearwater Forest的內(nèi)核架構(gòu)(代號Darkmont)看起來比以往都更復(fù)雜,整個設(shè)計是在一個非常小的尺寸里面堆疊了29個芯片,包括12個計算單元,3個有源硅基板,2個I/O單元和12個EMIB單元,最后實現(xiàn)了相當高的算力和密度。

從圖中可以看到,它需要12個計算單元,計算單元采用的是最新的Intel 18A工藝,12個計算模塊通過3D混合鍵合技術(shù),焊接在三個有源硅基板上。有源硅基板也采用了相對先進的Intel 3工藝,其中還放置了很多三級緩存。

三個有源硅基板和分布在左右的兩個I/O單元,通過EMIB形成2.5D的互聯(lián)。其中,這里使用的I/O單元和至強6的性能核處理器的I/O單元是一致的,因此可以實現(xiàn)平臺兼容性的無縫升級。

看得出來,Clearwater Forest采用了一個極度復(fù)雜的Chiplet架構(gòu),代表了Intel在高密度封裝上的最新水平。但也帶來了制造復(fù)雜性和良率風險,任何一個環(huán)節(jié)的缺陷都可能導(dǎo)致整個處理器報廢。

在這樣一番復(fù)雜的設(shè)計操作下來,它在指令解碼、分配、微操作隊列、緩存窗口以及指令派發(fā)等方面都帶來了30%-50%不等的提高。最終在相同功耗下,每核IPC性能相較于此前的Sierra Forest提升了17%。

相較于此前Sierra Forest的Crestmont,現(xiàn)在Clearwater Forest的Darkmont核心,也就是至強6+處理器,不僅可以帶來1.9倍以上的性能提升,同時,在整體負載范圍之內(nèi)帶來高達23%的能效提升,帶來服務(wù)器和機架功率降低。

至強6+與Intel 18A工藝的成敗深度綁定

Clearwater Forest產(chǎn)品的推出不只是一個更強的處理器,這是英特爾在向業(yè)界證明了其在先進制程上的成熟度和穩(wěn)定性。如此一來,Clearwater Forest(至強6+)處理器的成敗,與Intel 18A工藝的成敗深度綁定。

Intel 18A是業(yè)界首個將全環(huán)繞柵極(RibbonFET)與背面供電(PowerVia)兩項技術(shù)同時落地的制程節(jié)點。這兩項技術(shù)一個管“如何更好地開關(guān)晶體管”,一個負責“如何更高效地供電”,最終提高了核心密度和能效。

首先,RibbonFET改變了傳統(tǒng)晶體管的二維布局方式,把溝道堆疊成了三維結(jié)構(gòu),并讓柵極從四周360°包裹溝道。這種設(shè)計讓晶體管實現(xiàn)了更好的電流控制,同時降低了漏電與功耗。簡單說,RibbonFET讓晶體管既能跑得快,能耗還更低。

傳統(tǒng)芯片用于電源與信號的金屬層都擠在正面,容易出現(xiàn)電力和信號相互搶資源的問題。PowerVia把電源金屬層從晶體管正面移到背面,讓電源和信號分開走。這樣既能減少信號干擾和布線擁堵,又能提高單元利用率。

同時,通過納米級TSV(通孔)讓電流從背面更短路徑直達晶體管,進一步降低能量損耗。根據(jù)測算,結(jié)合RibbonFET和PowerVia,可以將單元利用率提高10%,可以在相同功耗下性能提高4%。

制程進步只是第一步,F(xiàn)overos Direct 3D則讓Clearwater Forest在封裝層面實現(xiàn)了結(jié)構(gòu)性突破。

Clearwater Forest采用了Foveros Direct 3D技術(shù),將計算單元與下方的有源硅基板(Base Chiplet) 通過銅對銅混合鍵合垂直連接,有源硅基板再通過EMIB 2.5D與 I/O芯片互聯(lián),形成一種類似3.5D的封裝架構(gòu)。

Foveros Direct 3D封裝支持9微米間距的高密度互聯(lián),中間的有源基板還能集成邏輯和緩存,從而實現(xiàn)更快的跨芯片通信、更大的三級緩存。而且,整體互聯(lián)功耗僅0.05 pJ/bit,約為傳統(tǒng)2.5D封裝的十分之一,極大提升了能效與帶寬密度。

因此利用Intel 18A和Foveros Direct 3D技術(shù),可以將Clearwater Forest的能效比達到前所未有的新高度。

結(jié)束語

能感受出來,英特爾在Clearwater Forest在還是非常用力的。它將英特爾最尖端的制程、先進的封裝和復(fù)雜的架構(gòu)設(shè)計融于一體,它不僅是一款芯片產(chǎn)品,更是對英特爾未來命運有深遠影響的事件。

盡管英特爾在Clearwater Forest上描繪的技術(shù)藍圖令人振奮,但本次發(fā)布會因缺乏一些具體的信息,比如,SKU型號、真實基準測試以及與AMD產(chǎn)品的直接對比,也讓部分市場觀察者感到了一點困惑。

Clearwater Forest計劃在2026年上半年交付,如果能如期交付,而且有出色的性能和能效表現(xiàn),不僅將幫助英特爾在數(shù)據(jù)中心市場投入重磅炸彈,對于英特爾的芯片代工業(yè)務(wù)也是極大的利好消息,所以說,這可能是英特爾近年來最重要的處理器了。

分享到

zhupb

相關(guān)推薦