高性能計算歷史上重點用于解決解釋物理系統(tǒng)的微分方程,如地球的大氣層或者氫彈的裂變觸發(fā)器。這些系統(tǒng)把自己分為許多網(wǎng)格,這樣,物理系統(tǒng)在這種程度上就能夠映射到處理器或者處理器內(nèi)核的物理位置上,從而最大限度地減少移動數(shù)據(jù)中的延遲。

但是,重要的科學和工程問題(更不用說國家安全問題了)數(shù)量的增加是不同的。這些問題數(shù)據(jù)通用類型的信息學,并且包括計算在一個自然災害期間運輸網(wǎng)絡可能發(fā)送什么事情,以及尋找預測恐怖主義襲擊或者核擴散失敗的方式。這些操作通常需要通過詳審大量的信息數(shù)據(jù)庫。

根據(jù)Sandia國家實驗室的模擬,對于信息學來說,更多的內(nèi)核并不意味著更好的性能。Sandia的計算、計算機、信息和數(shù)學主任James Peery說,超過8個內(nèi)核之后,性能沒有改善。在使用16個內(nèi)核的時候,計算機看起來與2個內(nèi)核的計算機一樣。在過去的一年里,Sandia團隊與芯片廠商、計算機設計者和高性能計算機用戶廣泛地討論了這個結果。除非計算機設計師找到一個解決方案,否則,Peery和其他人都預計超級計算機程序員將關閉多余的內(nèi)核或者使用多余的內(nèi)核處理解決主要問題之外的輔助的事情。

這個難題的核心是所謂的內(nèi)存墻:處理器能夠操作數(shù)據(jù)的速度與處理器能夠得到它需要的數(shù)據(jù)的速度之間的日益加大的差距。Sandia的高級技術人員 Richard C. Murphy解釋說,雖然每個處理器上的內(nèi)核數(shù)量在增長,但是,芯片連接到計算機其它部分的連線數(shù)量沒有增加。因此,讓所有的內(nèi)核都獲得充足的數(shù)據(jù)是一個問題。在信息學應用中,問題更糟糕,因為處理器正在處理的數(shù)據(jù)和下一套數(shù)據(jù)所在的地方?jīng)]有相互之間的物理聯(lián)系。數(shù)據(jù)不是在隔壁的內(nèi)核的緩存中,而是有可能在20米之外的一個機架的DRAM內(nèi)存芯片中,并且需要離開那個芯片通過一個或者更多的路由器和光纖找到通向處理器的道路。

為了使事情重回正軌,美國能源部今年組建了高級架構和算法研究所。這個研究所在Sandia并且在田納西州的橡樹嶺國家實驗室,其工作是找出未來五年之十年將需要什么高性能計算機架構,并且?guī)椭笇н@個行業(yè)向那個方向發(fā)展。

Peery說,解決這個瓶頸的關鍵是把內(nèi)存和處理器更緊密地(也許是更聰明地)結合在一起。因此,Sandia正在探索處理器上面的堆疊內(nèi)存芯片的影響以便改善內(nèi)存帶寬。

分享到

zhabin

相關推薦