某些系統(tǒng),包括紅杉在內(nèi),在重新進行的基準測試里提升了一點點。雖然泰坦被擠出了第一的位置,降至第二,但它仍保有最具效率的系統(tǒng)之一的桂冠,能耗為8.21兆瓦, 能效為2.143 MFlops/W,剛好勝過紅杉的7.84兆瓦,2,031.6 MFlops/W。
但天河2號,使用了三百萬個處理器,前代MIC卡,從互連到內(nèi)部軟件工作方式的獨有的中國制造才是今天的重頭戲。而且它贏得毫無懸念,因為——直言不諱地說——它完勝任何其他對手。
為了更詳細地說明上圖,看看下面這張兩種架構(gòu)的并排對比圖,要特別注意觀察電源和散熱的數(shù)量。這兩者以它們的體積和我們當(dāng)前的預(yù)期來說,都是相對高效率的系統(tǒng)——不僅如此,它還顯示了中國人在超大規(guī)模方面向前邁進了一大步,而且正在尋找達到滿功率包絡(luò)的方法。
這次打破傳統(tǒng)格局的真正意義是什么?其意義就是圍繞著加速器和協(xié)處理器這一主題。它給將摩爾定律的穩(wěn)定曲線推至25兆瓦一下帶來了新的思路…當(dāng)然,它也撼動了全球超級計算機技術(shù)市場的向西集中的世界觀。
關(guān)于最后一點,正如Dongarra提到的,“該系統(tǒng)的大部分功能都是在中國開發(fā)的,而且他們只在主要計算部分使用了英特爾的產(chǎn)品。也就是說,互連、操作系統(tǒng)、前端處理器和軟件工具基本上都是中國原生的。”
該系統(tǒng)給英特爾做了不小的廣告,英特爾在TOP 500中仍擁有80.4%的處理器份額,有人認為這預(yù)示著外來組件和系統(tǒng)的新時代的來臨。雖然天河2號不是以龍芯為核心的,但中國早晚會使用自主研發(fā)的處理器、加速器和協(xié)處理器,這僅僅是時間的問題。
美國的下一個超算,洛斯阿拉莫斯國家實驗室的Trinity系統(tǒng)什么時候完成還不清楚。但中國已經(jīng)以天河2號稱霸全球的消息向世界發(fā)出一個聲音,中國已經(jīng)正式進入超級計算的領(lǐng)域。今年六月的這次排名顯示了中國現(xiàn)已成為全球第二大高性能計算使用國,超過了日本,英國,法國和德國——所有這些超算列強。
之后呢?最有可能的就是一些配合內(nèi)存創(chuàng)新的互連概念,解決效率問題。到時我們所看到的就是一個全球性的超級計算競爭,一些有膽識的新角色也會加入比拼。六月這次沒趕上的話,我們將十一月拭目以待。
Top 500創(chuàng)始人Hans Meuer認為,該系統(tǒng)的出現(xiàn)與11年前的“地球模擬器”超級計算機出現(xiàn)時一樣具有顛覆性。當(dāng)時的“地球模擬器”性能超出對手5倍之多,創(chuàng)造了一個新的時代。
Horst Simon告訴我們,如果總功耗為25兆瓦(包括冷卻),我們都想讓系統(tǒng)在這樣的功率包絡(luò)下運行,但仍然需要開發(fā)更節(jié)能的技術(shù)。“我們正在接近一條摩爾定律曲線,要改進的領(lǐng)域是在互連和內(nèi)存上。”
Simon指出,“不像過去,我們能預(yù)見未來三四年的情況,現(xiàn)在,我沒看到有什么非比尋常的東西出現(xiàn)。我們已經(jīng)從標(biāo)準架構(gòu)到多核心的轉(zhuǎn)變中收獲了所有好處——魔術(shù)子彈已經(jīng)被射出了。”
這顆魔術(shù)子彈,當(dāng)然,就是強大的加速器。
分析人士認為,在未來幾年,前十大超算中,加速器會成為主宰。但是,如果你看一下名單就會發(fā)現(xiàn),使用加速器的系統(tǒng)的數(shù)量已經(jīng)減少了。然而,如果你看一下500個系統(tǒng)的總功率之和,它們占了總體性能的33%。
Dongarra強調(diào),它占了名單中的33%,但上一次排名時是22%,再上一次只有11%。
Horst Simon解釋說,截至目前,加速器并沒有被用于商業(yè)系統(tǒng)廣泛使用。大公司在超算上使用的工具會帶動更多公司使用加速。
到今年年底之前,天河2號超算會在其臨時駐地中國長沙的國防科技大學(xué)全面投入運作。然后它將在廣州的國家超級計算機中心永久駐留,用以進行生物醫(yī)學(xué)研究、氣候?qū)W、制造等領(lǐng)域的常規(guī)超級計算應(yīng)用。
即便Trinity在2015年問世,當(dāng)問到天河2號會稱霸多久時,Dongarra微微一笑道,“很長……也許非常久。”