GPU技術大會作為一場引領最新GPU相關科學研究、行業(yè)應用與創(chuàng)新技術的大會選在中國舉辦的原因是顯而易見的,中國已成為全世界高性能計算的中心,在全球前500最快的超級計算機排名中,僅前五名中就占據(jù)兩席,分別為來自國防科技大學的天河1A號和曙光公司所研發(fā)的星云(Nebulae),而且中國的研究學者及業(yè)界精英都已經(jīng)意識到GPU在包括石油和天然氣、分子模擬、核聚變研究、流體動力學等在內的各種研究領域和行業(yè)應用中無可比擬的強大計算能力。
異構計算模式的崛起
全球高性能計算 (HPC) 市場早已進入千萬億次級時代,在這個十年結束之前, 有望大踏步邁進百億億次級時代,這種趨勢是全球性的。IDC預計,由于百億億次級計算將極大地推動科學進步,增加各國的工業(yè)和經(jīng)濟競爭力,改善人們的生活品質,因此美國、歐盟、日本、中國、俄羅斯將在該領域展開激烈競爭,以便享受這種技術帶來的巨大實惠。
但是很多高性能計算專家也指出,只有在現(xiàn)有技術和手段的基礎上進行革命性的開拓,我們才能從容應對一系列巨大的挑戰(zhàn),從而在這個有限的時間框架內實現(xiàn)合理的百億億次級性能。這些挑戰(zhàn)包括但不限于以下內容:
系統(tǒng)成本 (每秒浮點運算次數(shù)/美元)。二十年前,全球領先的高性能計算機構花兩千五百萬至三千萬美元,用于購置當時最強大的超級計算機。如今購買千萬億次級超級計算機的費用通常在一億美元以上,人們歡迎任何可增加每秒浮點運算次數(shù)/美元比值的技術。
應用性能 (時間/解決方案)。隨著高性能計算用戶日益為自己的應用尋求更新、更大的超級計算機系統(tǒng),這種長期挑戰(zhàn)也會隨之增大。由于時鐘頻率難以繼續(xù)增加,未來的性能提升潛力幾乎都來自于日益增加的并行性,這進而導致了對百億億次級計算的巨大并行性需求。1 GHz 主頻的機器每個時鐘周期將需要執(zhí)行十億次獨立運算。隨著時間的推移,人們有望用這種級別的系統(tǒng)解決一些重大科學難題。此外,一些缺乏必要的單次運行并發(fā)性的其他問題就可以利用百億億次級計算系統(tǒng)來進行整體運算。比如,在解析每次運行操作時,汽車設計工程師們已經(jīng)顯著增加了參數(shù)運行的數(shù)量,這會發(fā)生于設計周期的分配階段。
空間和計算密度需求 (每秒浮點運算次數(shù)/平方英尺)。一項全球性的 IDC 研究表明,絕大多數(shù)高性能計算機構都極大地受限于數(shù)據(jù)中心的占地面積。其中三分之二的機構正在計劃擴建或修建新的高性能計算數(shù)據(jù)中心。其中一半的機構已規(guī)劃,或已開始將高性能計算資源分布到多個地點。
計算和數(shù)據(jù)移動的能源成本 (每秒浮點運算次數(shù)/瓦,字節(jié)/瓦)。最后但同樣很重要的是,功耗已成為一個顯著的設計約束,并在總擁有成本中占有巨大的份額。隨著電壓的增長速度顯著下降,當我們按照摩爾定律增加晶體管總數(shù)時,能耗不再是一個一成不變的制約因素,這使得如今的處理器受限于能耗,當每一代新的 IC 芯片面世時,情況也日益如此。
這個時代的計算性能主要取決于能源效率,因此系統(tǒng)設計方面的主要挑戰(zhàn)就是在不過度降低性能的前提下讓處理器和數(shù)據(jù)移動變得更加節(jié)能。高性能計算系統(tǒng)領域的巨大進步對能源效率提出了更高的要求。如今,規(guī)模最大的高性能計算數(shù)據(jù)中心所消耗的電能和一個小城市消耗的電能相當,多個千萬億次級和百億億次級數(shù)據(jù)中心所消耗的電能注定還要更多。盡管能源價格相對于2008年的高位水平已回落了不少,但是相比于歷史水平它仍然顯著增加了很多。這場“完美風暴”所暴露出來的另一個問題是,人們日益關注碳排放和全球氣候變化,而高性能計算數(shù)據(jù)中心對能耗和冷卻的要求卻與日俱增。最終,一些規(guī)模最大的高性能計算中心會擔心當?shù)氐碾娏疚磥砜赡懿粫M足其需求。其中有一家打算修建一個能耗為250 兆瓦的數(shù)據(jù)中心,不過它恐怕無法使用電網(wǎng),而必須要自行修建一個小型核反應堆。