英特爾(中國)有限公司服務器平臺產(chǎn)品經(jīng)理張振宇介紹至強融核

英特爾新推出的至強融核協(xié)處理器分為兩大產(chǎn)品家族,分別是5110系列和3100系列。5110系列主要針對內(nèi)存帶寬和容量密集型工作負載, 3100系列則能計算密集型工作負載的需要。張振宇透露,目前英特爾至強融核協(xié)處理器5110P已經(jīng)開始出貨,并將于2013年1月28日以2649美元的建議銷售價格正式面市。3100產(chǎn)品家族會在2013 年上半年面市,其建議銷售價格將在2000 美元以下。

至強攜手融核:HPC獨領風騷

英特爾至強融核作為一款協(xié)處理器,和至強處理器有著明顯的區(qū)隔和不同定位。至強作為主流的服務器處理器平臺,主要為企業(yè)應用、關鍵業(yè)務和技術計算提供強大的處理能力;至強融核則以并行計算能力見長。兩者相輔相成,未來在高性能計算領域?qū)ⅹ氼I風騷。

位于美國德州高級計算中心(TACC)的Stampede超級計算機

根據(jù)最新發(fā)布的TOP500,新上榜系統(tǒng)中有91%是基于英特爾處理器構(gòu)建,并且還新增了7套基于英特爾至強融核協(xié)處理器的上榜系統(tǒng),其中包括:TACC首次部署的 Stampede系統(tǒng)(每秒2.66千萬億次浮點計算,在榜上排名第7)、美國國家航空航天局(NASA)氣候模擬中心的Discover系統(tǒng)(每秒417萬億次浮點計算,排名第52)、英特爾公司的Endeavour系統(tǒng)(每秒379萬億次浮點計算,排名第57)、俄羅斯科學院聯(lián)合超級計算中心的MVS-10P超級計算機(每秒375萬億次浮點計算,排名第58)、美國國家航空航天局(NASA)Ames研究中心的Maia系統(tǒng)(每秒212萬億次浮點計算,排名第117)、南烏拉爾國立大學的SUSU系統(tǒng)(每秒146萬億次浮點計算,排名第170)以及田納西大學國家計算科學研究所的Beacon系統(tǒng)(每秒110萬億次浮點計算,排名第253),Beacon系統(tǒng)也是本屆全球高性能計算機500強(TOP500)排行榜上能效最高的系統(tǒng),其能效水平為每瓦12.44 GFlops。

英特爾至強融核協(xié)處理器

通過新入榜的系統(tǒng)不難發(fā)現(xiàn),英特爾至強融核剛問世就表現(xiàn)不俗,已經(jīng)贏得相當一部分高性能計算用戶的青睞,未來這種趨勢將愈發(fā)明顯。因為和用GPU進行加速相比,至強融核在編譯和移植等方面完全兼容至強處理器平臺,用戶甚至不需要對原有應用進行修改或者只要進行極少量的工作就可以將應用遷移到“至強+至強融核”的環(huán)境中,而獲得的將是性能大幅的提升。

張振宇表示,至強通過與至強融核協(xié)處理器搭配,可應付眾多“高度并行化”的處理工作,從而幫助高性能計算解決包括基因研究、油氣勘探和氣候建模在內(nèi)的廣泛的科學和技術領域中的問題。

英特爾至強融核協(xié)處理器內(nèi)部構(gòu)造

至強融核的前世今生:8年磨一劍

羅馬不是一天建成的,英特爾至強融核也是經(jīng)過了8年的孕育,終于瓜熟蒂落。

早在2004年,英特爾就開始了眾核技術的策略規(guī)劃;2005年,英特爾又制定了眾核研發(fā)議程及圖形芯片Larrabee的發(fā)展計劃;2006年,由超過80個項目組成的萬億級計算研究計劃開始執(zhí)行;2007年,英特爾實驗室開始研究眾核的負載、模擬器和軟件;2008年,英特爾建立了通用并行計算研究中心;2009年,英特爾在超算大會上展示了用Larrabee實現(xiàn)的每秒萬億次單精度浮點計算能力;2010年,英特爾開始加快眾核技術的研究;2011年,英特爾開始讓用戶試用眾核芯片;2012年上半年,英特爾首個基于至強融核協(xié)處理器的集群投入使用,并在當期TOP500榜單上位列第150位,其具備了每秒118萬億次浮點計算的性能。

至強融核8年發(fā)展之路

2012年6月,英特爾宣布未來所有基于英特爾集成眾核架構(gòu)(英特爾MIC架構(gòu))的產(chǎn)品將采用全新品牌——英特爾至強融核,中文名稱為至強Phi。第一代英特爾至強融核產(chǎn)品家族(代號為“KnightsCorner”的協(xié)處理器)將在2012年年底推出,其第一代產(chǎn)品將主要用于高性能計算市場,而未來的英特爾至強融核產(chǎn)品還將滿足企業(yè)數(shù)據(jù)中心和工作站的需求。

現(xiàn)在,伴隨著5110P的出貨,英特爾正在按照集成眾核的產(chǎn)品線路圖有序地推陳出新。張振宇認為,隨著新品的陸續(xù)到位,至強融核將受到越來越多用戶的認可。英特爾在至強融核的研發(fā)過程中充分考慮到了與至強的兼容性和可移植性。至強融核能夠充分利用為英特爾架構(gòu)提供的人們熟知的編程語言、并行模式、技術和開發(fā)人員工具,這有助于確保軟件公司和企業(yè)的IT部門加大對并行代碼的利用,且無需為與加速器相關的專有的、針對硬件的特定編程模式重新培訓其開發(fā)人員。

英特爾還在至強融核發(fā)布的當天推出了英特爾Parallel Studio XE和英特爾Cluster Studio XE在內(nèi)的軟件工具,用來幫助科學家和工程師們優(yōu)化其代碼,以便充分利用英特爾至強融核協(xié)處理器。這些工具能夠通過英特爾至強融核協(xié)處理器和英特爾至強處理器E5產(chǎn)品家族共用的編程語言和模型對代碼進行優(yōu)化,從而使應用不但能從英特爾至強融核協(xié)處理器的數(shù)十個內(nèi)核中獲益,亦可從英特爾至強處理器E5更為高效的多線程資源利用上獲得幫助。

英特爾至強融核3100系列

雙劍合璧:并行計算稱王

新發(fā)布的至強融核3100系列和5110系列都英特爾最先進的22納米3-D三柵極晶體管制程工藝。

對于那些希望運行計算密集型工作負載(如生命科學應用和金融模擬)的用戶,英特爾至強融核協(xié)處理器3100系列將能夠為他們提供出色的價值。3100系列將能夠提供超過1000 Gigaflops(即每秒1萬億次浮點計算)的雙精度浮點計算性能,并支持容量最高達6GB、帶寬最高達240GB/秒的內(nèi)存,以及內(nèi)存錯誤校正碼(ECC)等一系列可靠性特性。該產(chǎn)品家族工作時的熱設計功耗(TDP)范圍在 300瓦以內(nèi)。

英特爾至強融核5110系列

至強融核5110系列則能以更低的功耗提供額外的性能。它能夠?qū)崿F(xiàn)1,011 Gigaflops(即每秒1.01萬億次浮點計算)的雙精度浮點計算性能。它可支持容量和帶寬分別高達8GB和320GB/秒的GDDR5內(nèi)存。熱設計功耗(TDP)為225瓦、可進行被動散熱的至強融核5110P具備適用于密集計算環(huán)境的能效表現(xiàn),可用于處理諸如數(shù)字內(nèi)容創(chuàng)建和能源研究等內(nèi)存密集型工作負載。這款產(chǎn)品已經(jīng)交付給了一些早期用戶,并出現(xiàn)在了最新發(fā)布的第40屆TOP500排行榜中。

英特爾至強融核產(chǎn)品家族

為了讓諸如德克薩斯高級計算中心(TACC)等客戶早日使用全新的英特爾至強融核協(xié)處理器技術,英特爾還提供了兩款定制化的產(chǎn)品:英特爾至強融核協(xié)處理器SE10X和英特爾至強融核SE10P。兩者均可在熱設計功耗為300瓦的情況下提供1073 GFlops的雙精度浮點計算性能,其余規(guī)格則與英特爾至強融核協(xié)處理器5110P相似。

目前,有超過50家制造商正在基于英特爾至強融核協(xié)處理器設計解決方案,這些制造商包括宏基、Appro、Asus、Bull、Colfax、Cray、戴爾、Eurotech、富士通、日立、惠普、IBM、浪潮、NEC、Quanta、SGI、Supermicro和Tyan。

分享到

xuzhenxin

相關推薦