英特爾(中國)有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇

令人驚嘆的是,盡管英特爾至強E5處理器問世才3個月,但本次TOP500中已有多達45套基于E5處理器的系統(tǒng)入榜,其中包括3套擁有每秒千萬億次浮點計算能力的系統(tǒng)。

此外,英特爾還在國際超級計算大會上宣布未來所有基于英特爾集成眾核架構(gòu)(英特爾MIC 架構(gòu))的產(chǎn)品將采用全新品牌——英特爾至強融核(Intel Xeon Phi)。英特爾(中國)有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇透露,第一代英特爾至強融核產(chǎn)品家族(代號為“Knights Corner”的協(xié)處理器)將于 2012 年年底推出,屆時它將成為英特爾至強處理器E5-2600/4600產(chǎn)品家族的重要補充,并為高度并行的工作負(fù)載帶來全新性能。

至強E5為高性能計算而生

英特爾至強E5在本屆TOP500中的表現(xiàn),除了45套系統(tǒng)入圍外,更是奪得了第四名的佳績。

位于德國萊布尼茨超級計算中心(LRZ)的“SuperMUC”,達到每秒2900萬億次浮點計算的的計算能力,是當(dāng)前歐洲計算能力最強的高性能計算機,也是目前基于英特爾至強處理器E5產(chǎn)品家族的最大的高性能計算機,在本屆榜單上排名第四。

回首全球高性能計算機的發(fā)展之路,1997年當(dāng)時最快的計算機叫“ASCI RED”,其運行速度僅為1TFLOP,當(dāng)時一個放20臺2路服務(wù)器的機柜,其典型的計算能力是0.5GFLOP。到2012年6月,最快的IBM的“紅杉”達到了16PFLOP。目前,一個20千瓦標(biāo)準(zhǔn)機柜能提供高達5TFLOP的計算能力。而到2018年,業(yè)內(nèi)最快的計算機將達到百億億次級別,屆時一個20千瓦標(biāo)準(zhǔn)機柜就能提供0.5到1PFLOP的計算能力。“在1997年我們需要用16萬個標(biāo)準(zhǔn)機柜才能達到80TFLOP的計算能力,現(xiàn)在用至強處理器的服務(wù)器僅需16個機柜就能實現(xiàn)了。”張振宇說,“處理器以及相關(guān)技術(shù)的發(fā)展,使得人類的計算能力日新月異。”

作為高性能計算的上游和領(lǐng)導(dǎo)廠商,英特爾一直在致力于提供更快更高能效的高性能計算機。2012年3月,英特爾推出了至強E5-2600處理器,采用Sandy-Bridge架構(gòu)的英特爾至強E5更是為高性能計算增添了新的動力。

首先,至強E5具有8個核心,相比上一代的至強5600多出兩個內(nèi)核,具備20MB L3緩存,平均每核心2.5MB,這比上一代的每核心2MB要多25%,核心和緩存的增強對計算能力的提升明顯。因而至強E5在性能上比上一代的至強5600有80%的性能提升。

英特爾至強融核標(biāo)識

其次,至強E5在帶寬方面采用了環(huán)形鏈路總線,提升了帶寬降低了延遲。在QPI總線上,至強E5具備兩條最高8GT/s的QPI,相比至強5600家族每條鏈接帶寬增加了25%;在內(nèi)存支持上,至強E5具有四個內(nèi)存通道,內(nèi)存規(guī)格支持也提升到了DDR3-1600,而至強5600最高支持DDR3-1333。從這些規(guī)格來看,E5在數(shù)據(jù)帶寬上要明顯領(lǐng)先于至強5600,更加適合HPC苛求高帶寬的應(yīng)用。

第三,至強E5還引入了專門針對HPC應(yīng)用的AVX高級向量擴展指令集,來加強浮點運算性能。AVX指令集將現(xiàn)存的浮點向量指令從128位擴展到256位,這種改進可以讓每核每時鐘浮點運算峰值翻倍。英特爾認(rèn)為,AVX技術(shù)是加大計算密度的起點。

此外,英特爾還發(fā)布了至強E5-4600,這是針對緊湊型4路服務(wù)器的新平臺。至強E5-4600能在單個系統(tǒng)中最多可提供32個內(nèi)核和48個DIMM,適用于諸如科學(xué)研究和金融服務(wù)等各種廣泛的技術(shù)計算應(yīng)用,適合做大規(guī)模集群的“胖”節(jié)點使用。

眾核進入倒計時

英特爾在高性能計算的另一利器——集成眾核架構(gòu)(MIC)處理器亦將進入倒計時。在國際超級計算大會上, 英特爾公司宣布未來所有集成眾核架構(gòu)產(chǎn)品將采用全新品牌——英特爾至強融核。同時第一代英特爾至強融核產(chǎn)品家族(代號為“ Knights Corner”的協(xié)處理器)將于 2012 年年底推出,屆時它將成為英特爾至強處理器 E5-2600/4600 產(chǎn)品家族的重要補充,并為高度并行的工作負(fù)載帶來全新性能。英特爾(中國)有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇透露,至強融核第一代產(chǎn)品將主要用于高性能計算( HPC)市場,而未來的英特爾至強融核產(chǎn)品還將滿足企業(yè)數(shù)據(jù)中心和工作站的需求。

為了加深用戶對至強融核系統(tǒng)的了解和認(rèn)知,英特爾還搭建了首個基于至強融核協(xié)處理器的集群并投入了使用,該系統(tǒng)目前在本屆TOP500榜單上位列第150位,它具備了每秒118萬億次浮點計算的性能。

張振宇介紹,至強融核處理器具備出色的易用性,能夠充分利用在英特爾架構(gòu)上使用的常見編程模式、技術(shù)和開發(fā)者工具。由于它能夠更充分地利用并行 CPU 代碼,軟件公司和 IT 部門將無需重新為其開發(fā)人員提供與加速器有關(guān)的專用編程模型的培訓(xùn)。除了兼容 x86 編程模式外,英特爾至強融核協(xié)處理器還能夠適用于專為高性能計算優(yōu)化且高度并行的獨立計算節(jié)點。它可以獨立于主機操作系統(tǒng)來運行自己的基于Linux的操作系統(tǒng)。這一特性將可以為實施無法采用其它 GPU 技術(shù)的集群解決方案帶來更大的靈活性。

全球高性能計算對比

具體規(guī)格和技術(shù)細(xì)節(jié)方面,首個英特爾至強融核協(xié)處理器將采用22 納米3-D三柵極晶體管制程技術(shù),可在 PCI-e插卡形態(tài)下集成超過 50 顆內(nèi)核和支持最低 8GB容量的GDDR5 內(nèi)存。此外,它還具備支持512b SIMD 指令的特點,可在單個指令控制下同時處理多個數(shù)據(jù)元素,從而能顯著提升性能。

從去年開始,英特爾還在全球范圍內(nèi)精心挑選了100家企業(yè)和科研單位,開始對“ Knights Corner”進行測試和試用,其中中國的企業(yè)有6家,涵蓋了石油、互聯(lián)網(wǎng)等領(lǐng)域。英特爾工程師正幫助他們將應(yīng)用移植到MIC上,因而張振宇認(rèn)為,到今年年底有可能出現(xiàn)真正的集成眾核系統(tǒng)。

英特爾高性能計算三駕馬車

此外,英特爾至強融核協(xié)處理器還獲得了廣泛的行業(yè)支持,包括 Bull、Cray、戴爾、惠普、IBM、浪潮和NEC在內(nèi)的44家制造商已承諾將推出采用該款協(xié)處理器的系統(tǒng)。

向百億億次進軍

英特爾在高性能計算領(lǐng)域的目標(biāo),就是到2018年向全球提供每秒浮點計算能力達百億億次的超級計算機,為此英特爾正朝著這個目標(biāo)不斷努力。

張振宇表示,目前在推動千萬億次向百億億次級的過程當(dāng)中,至強扮演著非常重要的角色,它本身是非常強大的平臺,最重要是能夠適應(yīng)各種各樣的工作負(fù)載。但到百億億次的發(fā)展階段僅僅靠至強是不夠的。需要用眾核架構(gòu)來提供高度定型應(yīng)用的效率,提高計算效率。

各種架構(gòu)近年來在TOP500中的變化

張振宇透露,首個搭配采用英特爾至強E5處理器和至強融核協(xié)處理器的千萬億級(可實現(xiàn)每秒千萬億次浮點計算能力)的高性能計算機將于 2013 年年初推出,并將命名為“Stampede”。英特爾預(yù)計在英特爾至強融核協(xié)處理器的可編程性和卓越性能的支持下,明年還將會有大量千萬億級的系統(tǒng)涌現(xiàn)。

英特爾在高性能計算領(lǐng)域的優(yōu)勢

為了實現(xiàn)到2018年達到百億億級計算目標(biāo)的承諾,英特爾還在多個領(lǐng)域進行了大量投資,旨在滿足未來對于龐大性能的需求。英特爾最近收購了Qlogic的Infiniband業(yè)務(wù)和Cray的互連技術(shù),以進一步在此基礎(chǔ)上創(chuàng)新,消除在未來提供可擴展的百億億次級計算平臺所面臨的障礙。

分享到

xuzhenxin

相關(guān)推薦