目前“天河一號”配備了14336顆至強X5670處理器(32nm工藝,六核12線程,2.93GHz主頻),而GPU方面則采用了7168塊基于Nvidia “Fermi”架構的Tesla M2050計算卡(主頻1.15GHz,雙精度浮點性能515Gflops、單精度浮點性能1.03Tflops)。而2048顆國產飛騰處理器的使用則使“天河一號”如虎添翼(八核64線程,主頻1GHz),后面我們會詳細闡述。

▲“天河一號”的CPU計算節(jié)點,四路節(jié)點上每個至強X5670處理器(32nm工藝,六核12線程,2.93GHz主頻)擁有六根內存,以4Gb*6*4來計算,單CPU計算節(jié)點的內存容量可以達到96Gb,如果采用8Gb DDR3內存則單節(jié)點內存容量可以達到192Gb之巨。

▲“天河一號”采用了國產處理器“飛騰”,65nm工藝,八核64線程,晶體管數(shù)目達到3.5億個。芯片主頻800Mhz-1Ghz,擁有3個HT直連總線接口,4個獨立的DDR3內存通道,帶寬達到32GBps,8個PCIE 2.0通道,從規(guī)格上看要么是采用了微處理器內核設計,要么就是超低緩存設計(晶體管數(shù)量決定了兩者只能取其一)

相比去年“天河一號”僅有5120個CPU(其中E5540(2.53GHz)處理器4096個,E5450(3.0GHz)處理器1024個)和5120個AMD HD4870組成的GPU計算模塊(詳見這里),現(xiàn)在的“天河一號”在性能上的飛躍也就不足為奇了。

“天河一號”有秘密武器 “星云”爆冷有三大原因

那么曙光“星云”超級計算系統(tǒng)作為曙光6000的一部分,今年5月底在Top500榜單上榮獲第二名的好成績,也同樣采用了至強5600系列處理器和“Fermi”架構的Tesla計算卡,為什么會“悲情”的被爆冷呢???原因有三個方面:

首先是規(guī)模上,“星云”擁有了120640個處理核心(CPU和GPU數(shù)量之和,詳見這里);而現(xiàn)在的“天河一號”CPU部分擁有202752個核心(CPU核心數(shù)102400個,GPU核心數(shù)100352個),規(guī)模上較“星云”高出59.5%。內存規(guī)模也達到了262TB,后臺存儲容量為2PB。

其次是處理器選型上,“星云”采用的是較低主頻的X5650(主頻2.66GHz),而“天河一號”則采用了X5670(主頻2.93GHz),值得注意的是X5670的功耗與X5650相同,均為95W(詳見這里);而GPU方面“星云”采用的是C2050(T3600刀片機箱每個插了10塊C2050計算卡),而“天河一號”采用的是M2050計算卡(一個字母之差區(qū)別在何處?點擊這里和這里分別查看兩款計算卡的區(qū)別,其實就在于GPU附帶的3G存儲器的存儲頻率??1.5Ghz與1.55Ghz的區(qū)別)。

▲“天河一號”的GPU計算節(jié)點,Nvidia “Fermi”核心Tesla M2050系列計算卡,擁有448個流處理器核心(CUDA核心),主頻1.15GHz,專用ECC存儲器是DDR5規(guī)格的3Gb緩存,緩存頻率高達1.55GHz,這使得GPU內數(shù)據(jù)存儲速率達到了148Gb/s。由于散熱和功耗等因素,一個GPU計算節(jié)點中只放置了兩塊M2050計算卡。

第三點也是最核心的區(qū)別??“天河一號”采用了雙向160Gbps私有高速通訊網絡,遠遠超過了“星云”所采用的QDR Infiniband 40Gb的通訊速率,可以說這種通訊速率上的秘密武器才使得“天河一號”得以集成如此多的處理器和GPU計算卡。而國產“飛騰”處理器的加入,不但有助于計算性能的提升,也為國產處理器進入大規(guī)模實際應用做了示范。

▲“飛騰”處理器近照披露

▲傳說中的高速互聯(lián)交換芯片“NRC”和接口芯片“NIC”。其中NRC芯片片內延遲只有單端口雙向帶寬高達160Gbps??是Infiniband QDR傳輸速率的2倍,而NRC單芯片上擁有16個這樣的交換端口,其峰值速率達到2.56Tbps。通信芯片由于穩(wěn)定性和制程局限,往往不采用最新的制程工藝,該NRC芯片采用了90nm工藝制造,晶體管數(shù)目大約為4.6億??細心的讀者可以發(fā)現(xiàn)其比“飛騰”處理器晶體管要多(再度認為飛騰的微內核專用性更強)

分享到

liukai

相關推薦