點擊查看大會直播專題

31日,HPC China 2012大會進入最后一天的日程。上午的主會場上,國家超級計算濟南中心常務(wù)副主任、高級工程師陳德訓(xùn)發(fā)表了主題為“神威藍光系統(tǒng)及應(yīng)用”的演講。

【圖】國家超級計算濟南中心常務(wù)副主任、高級工程師陳德訓(xùn)

國家超級計算濟南中心是科技部2010年底批準的全國四個千萬億次超級計算中心之一,由山東省科學院計算中心負責建設(shè)、管理和運營。機房建設(shè)從2011年3月開始,2011年8月完成機房基礎(chǔ)加固、供電改造、機房裝修、冷卻工程、機房設(shè)備安裝調(diào)試以及神威藍光系統(tǒng)的安裝與全系統(tǒng)加點。2011年9月完成系統(tǒng)聯(lián)調(diào),2011年10月中旬,完成Linpack測試,10月27日,在HPC China 2011大會上發(fā)布。

陳德訓(xùn)介紹道,家超級計算濟南中心設(shè)立了應(yīng)用咨詢委員會,邀請各個領(lǐng)域的專家做一些應(yīng)用咨詢。家超級計算濟南中心的研發(fā)部門,主要是完成超算中心的科研活動,為個應(yīng)用領(lǐng)域?qū)<姨峁I(yè)知識。包括四個領(lǐng)域的研發(fā):高端應(yīng)用研究,為了支持用戶應(yīng)用軟件的移植和優(yōu)化,我們在國產(chǎn)處理器和x86處理器上都進行了移植;信息安全應(yīng)用,主要結(jié)合國產(chǎn)處理器,開發(fā)信息相關(guān)課題;CAD應(yīng)用負責商業(yè)軟件的支持;大規(guī)模數(shù)據(jù)處理等四個領(lǐng)域。陳德訓(xùn)表示,目前團隊主要有37個人,今年還要招聘15個人。

【圖】中心組織架構(gòu)

神威藍光介紹

神威藍光系統(tǒng)安裝了8704個自主設(shè)計生產(chǎn)的申威1600CPU,主頻為0.975-1.1GHz,峰值為1.07PFlops,效率74.37%,,性能功耗比為0.74Flops/W??捎么鎯?.15PB,包括在線存儲和近線存儲。系統(tǒng)支持的最大并行規(guī)模為單道課題13萬MPI進程。

【圖】神威藍光系統(tǒng)分布圖,主機系統(tǒng)共11個機倉,9個計算機倉,2個網(wǎng)絡(luò)機倉。系統(tǒng)網(wǎng)絡(luò)采用胖樹結(jié)構(gòu)。鏈路單項持續(xù)帶寬

陳德訓(xùn)談道,由于國產(chǎn)處理器對于一些商用軟件不支持,增加了100TB的商用機群。下圖是基于x86處理器的商用輔助集群的配置:

【圖】商用機群配置

【圖】神威藍光系統(tǒng)架構(gòu)

用戶通過國家網(wǎng)絡(luò)或internet登陸節(jié)點上進行軟件開發(fā)調(diào)試,把源代碼或常用的數(shù)據(jù)放在在線存儲上,對于不常用的數(shù)據(jù)可以放在近線存儲上。

編譯器:國產(chǎn)資源和商用輔助資源的串行編譯器和并行編譯器是不一樣的。

主要部署軟件:商用軟件和科學計算軟件跟其他超算中心差不多,如下圖所示:

神威藍光萬核應(yīng)用

 陳德訓(xùn)表示,如果有可擴展性不錯的課題,在理論上有突破萬核的可能,而且有實際應(yīng)用需求,國家超算濟南中心非常歡迎這樣的課題去濟南中心開發(fā)、調(diào)試與優(yōu)化。神威藍光的申威處理器的可擴展性、能耗等方面非常適合萬核應(yīng)用的程序開發(fā)和調(diào)試,有專門的技術(shù)隊伍支持。

【圖】神威藍光萬核應(yīng)用成果

陳德訓(xùn)還重點介紹了MASNUM并行海浪應(yīng)用模式,MASNUM采用了MPI進程級的編程,從8192個核一直測試到13萬個核,從右邊圖可以看出,從8192個核到13萬核,有9倍多的加速,加速比還是很不錯的。

當然這也不是一帆風順的,在測試到6萬核的時候,初始化用了2個多小時,最后分析出來,變量分布的時候用了很多MPI的調(diào)用,后來就安排Cluster把數(shù)據(jù)合并之后一次性廣播,并且用二叉樹方式實現(xiàn),另外在邊界通信方面,核多了以后會出現(xiàn)問題,調(diào)整網(wǎng)絡(luò),讓臨近通信盡量集中在4096區(qū)域范圍內(nèi)。最后,經(jīng)過這些改進,13萬核測試的時候基本都在15分鐘左右。

【圖】MASNUM并行海浪應(yīng)用模式

【圖】萬核課題優(yōu)化體會

分享到

tangrong

相關(guān)推薦