圖:IBM z196大型機(jī)芯片

z196引擎的超標(biāo)量通道可以在每個時鐘周期內(nèi)解碼3個z/Architecture CISC指令并執(zhí)行多達(dá)5個操作。每個核心有6個執(zhí)行單元:2個整數(shù)單元,1個浮點(diǎn)單元,2個加載/保存單元和1個小數(shù)單元。IBM表示,這個浮點(diǎn)單元要比z10芯片中的更好,但是并沒有透露它在每個時鐘周期內(nèi)可以做多少flops。z/Architecture CISC中的一些優(yōu)先級別高的指令被分割成塊,這不僅使得通道的使用更高效,還讓z196更像RISCy。

與POWER7芯片一樣,z196在芯片中采用嵌入式的DRAM(eDRAM)作為L3緩存。這種 eDRAM比經(jīng)常用作緩存的靜態(tài)DRAM(SRAM)速度更慢,但是你可以將信息其指定到特定的區(qū)域。對很多工作負(fù)載來說,芯片可用調(diào)用內(nèi)存的大小比高速度內(nèi)存更重要。基于這點(diǎn)考慮,z196處理器設(shè)計了24 MB的eDRAM L3緩存,每個緩存劃分為2個存儲體,并由2個片上L3緩存控制器進(jìn)行管理。

每個z196芯片可以作為一個GX I/O總線控制器–這種方法同樣被用于POWER系列芯片中,用于連接主機(jī)通道適配器和其他外圍設(shè)備,每個插槽分配得到一個與受RAID保護(hù)的DDR3 主內(nèi)存相連接的內(nèi)存控制器。此外,z196芯片還有2個加密和壓縮處理器,IBM大型機(jī)將采用了這種第三代電路設(shè)計。

z196芯片采用兩個核心共享其中一個協(xié)同處理器方式,且每個核心有16KB的緩存空間。最終達(dá)到每個 z196芯片有一個可連接SMP Hub/共享緩存芯片接口。如下圖所示,有2個芯片被集成到一個z196多芯片模塊(MCM)上,提供了交叉耦合允許MCM上所有6個插槽通過40GB /s相連接。Z196提供的交叉耦合訪問方式,在MCM上提供了六個插槽以40GB/s的速度連接到各芯片上。

圖:zEnterprise 196 SMP Hub/共享緩存

在IBM大型機(jī)中,z196處理引擎相當(dāng)于中央處理器(CP),而CP的互連芯片稱為共享緩存 (SC)。每個SC有6個CP接口相互連接,其中有3個架構(gòu)接口連接到全加載的z196系統(tǒng)中其他3個MCM。

從上面的架構(gòu)圖來看,SMP Hub的一個優(yōu)點(diǎn)就是可以加載到帶有L4緩存的組件上,這是大多數(shù)服務(wù)器所沒有的功能–幾年前IBM曾向至強(qiáng)處理器的EXA芯片組上增加了一些L4緩存。L4緩存之所以重要,其原因在于大型機(jī)引擎的主頻要遠(yuǎn)高于主內(nèi)存速度,但是如果只通過增加一個緩存層來滿足Z196的引擎需求是非常昂貴的。不管怎樣,這種SMP Hub/共享緩存芯片和CP一樣也是采用45nm制程工藝,有15億個晶體管,面積為478.8平方毫米,封裝中有8919個觸點(diǎn)。

每個MCM上部署6個CP和2個SC,MCM是一個邊長96毫米的正方形,功耗1880瓦。每個處理器板有一個MCM,這使得一個完全連接的系統(tǒng)可以達(dá)到96個CP,十幾個控制器可以訪問多達(dá)3TB RAID內(nèi)存,32個I/O Hub接口最高可實(shí)現(xiàn)288 GB/s的I/O帶寬。頂架式zEnterprise 196 M80設(shè)備中的80個CP可用于運(yùn)行工作負(fù)載,其他可以使用Parallel Sysplex集群來耦合系統(tǒng)、管理I/O和熱備份等等。

分享到

zhabin

相關(guān)推薦