在上述領域,華中科技大學計算機科學與技術學院院長金海教授率領的集群與網(wǎng)格計算湖北省重點實驗室是國內(nèi)學界的佼佼者。作為“中國教育科研網(wǎng)格ChinaGrid”計劃的專家組組長,金海也非常關注CPU領域的進展。在AMD全球首發(fā)代號為巴塞羅那的四核處理器之際,本報記者獨家采訪了金海,從高性能計算與網(wǎng)格計算等角度分析AMD四核處理器的價值。



華中科技大學計算機科學與技術學院院長 金海


      體系架構和功耗優(yōu)勢


      記者:代號巴塞羅那的AMD四核處理器即將發(fā)布。從目前發(fā)布的資料來看,AMD在四核處理器上延用了直連架構、集成內(nèi)存控制器、超傳輸總線等架構。從高性能計算的角度,如何看待這種繼承性的架構?


      金海:從目前得到的資料來看,同樣的架構從單核、雙核延伸到四核,說明它是一個有彈性的架構。以直連架構為例,它既保持了與之前傳統(tǒng)前端總線架構的兼容性,消除瓶頸,內(nèi)存帶寬又可達傳統(tǒng)FSB+北橋架構的2倍以上,響應時延卻僅為傳統(tǒng)架構的一半。超傳輸互聯(lián)技術可以提供更高的帶寬和更低的延遲。另外,I/O數(shù)據(jù)使用單獨的總線,加大了CPU的吞吐量,同時,內(nèi)存帶寬會隨著CPU的增加而增加。這樣都對于高密度計算有明顯幫助。


      此外,由于架構上的特點,使得巴塞羅那和其他皓龍?zhí)幚砥饕粯?,在大?guī)模使用內(nèi)存時也具有一定功耗優(yōu)勢。


      記者:這種架構特性能給網(wǎng)格計算帶來什么好處?


      金海:我們對處理器的一些新特性比較有興趣。在網(wǎng)格計算研究中,經(jīng)常會需要考慮異構環(huán)境中的問題。例如如在去年完成的ChinaGrid一期項目中,各個學校就有包括基于RISC指令集、EPIC指令集,x86指令集在內(nèi)的不同設備參與,而且各個指令集下的CPU架構和特性還各不相同,網(wǎng)絡結構也不一樣,這就要求我們必須考慮如何盡量提高系統(tǒng)帶寬和I/O,并降低延遲,巴塞羅那在體系架構上的繼承性滿足這一要求。


      而且,在網(wǎng)格計算中也要盡量降低功耗方面的開銷,而巴塞羅那在功耗方面采用了更精細的內(nèi)部控制。例如獨立動態(tài)核心技術,實現(xiàn)了每個內(nèi)核可以使用獨立的頻率工作,CoolCore技術實現(xiàn)了粗放模式和精微模式的電路控制,這兩項技術都對于CPU省電有較大好處。此外,還有AMD在業(yè)界率先使用的雙重動態(tài)電源管理(DDPM)技術,能對CPU和內(nèi)存控制器分別獨立供電,使得在功耗降低的同時獲得更高的內(nèi)存帶寬。


      內(nèi)存帶寬優(yōu)勢


      記者:集成內(nèi)存控制器一直是AMD處理器的特點,在四核里也是如此。這種集成內(nèi)存控制器的方式,對于高性能計算有什么樣的好處?


      金海:集成內(nèi)存控制器是AMD在內(nèi)存方面很有創(chuàng)意的一個設計,顯然使CPU到內(nèi)存的路徑更短,延遲降低,同時每一個CPU具有專有內(nèi)存帶寬。在高性能計算領域,從CPU核心到內(nèi)存之間的數(shù)據(jù)交換往往受制于帶寬限制,之間的延遲越來越高,限制了系統(tǒng)整體性能的提升??這一現(xiàn)象導致了“內(nèi)存墻”(Memory wall)一詞的誕生。隨著近年來處理器性能的大幅提升,“內(nèi)存墻”在高性能計算和網(wǎng)格計算領域的瓶頸作用也越來越明顯,所以我們需要有能較好緩解這一現(xiàn)象的產(chǎn)品出現(xiàn)。


      巴塞羅那在內(nèi)存帶寬上采用了一系列優(yōu)化技術,使得在不做其他改動的前提下,內(nèi)存性能比雙核皓龍?zhí)嵘?0%。其中,巴塞羅那采用的核心預取、內(nèi)存預取、內(nèi)存頁面優(yōu)化、寫爆發(fā)和大內(nèi)存緩沖技術能帶來40%的性能提升。此外,DDPM技術能讓每個核心的內(nèi)存控制器獲得額外10%左右的提升。


      記者:帶寬直接影響到高性能計算時的數(shù)據(jù)吞吐量,現(xiàn)有的資料顯示,在四核中使用了寬浮點加速器。這個寬浮點加速器對于高性能計算又有什么影響呢?


      金海:從目前看到的資料里可以得出結論,在巴塞羅那處理器中,SSE的執(zhí)行帶寬、指令拾取帶寬、數(shù)據(jù)緩存負載帶寬、L2/NB帶寬等都是現(xiàn)有處理器的兩倍。因此,可以知道系統(tǒng)的數(shù)據(jù)通路寬了兩倍,這意味著在ChinaGrid項目中存在的大量科學計算帶來的浮點運算就可以更快完成。


      硬件級的虛擬化優(yōu)勢


      記者:虛擬機技術是近些年來IT業(yè)界非常熱的一個領域,無論是硬件廠商還是軟件廠商都積極參與。據(jù)了解,你目前正擔負著國家973計劃中的“計算系統(tǒng)虛擬化基礎理論與方法研究”研究項目,那么AMD四核處理器在虛擬機技術上有什么樣的吸引力?


      金海:很顯然,大家之所以希望虛擬化幫助提升IT基礎設施的效率,那么打破“每臺服務器一種應用”的模式,根據(jù)工作負載或維護安排遷移虛擬機就是它最有吸引力的地方,它將一臺計算機分成多個獨立的虛擬機,能夠同時支持多種不同的操作系統(tǒng)和應用。


      如果在一個硬件系統(tǒng)上運行多個虛擬機,那么如何保證從最底層的CPU到最上層的應用之間,物理機與虛擬機之間高速高效的數(shù)據(jù)交換,以及虛擬機之間的高隔離度就成了重要課題。我們通過研究VMware和Xen這樣在Windows和Linux操作系統(tǒng)上的典型虛擬機產(chǎn)品,可以知道相較傳統(tǒng)的進程遷移,虛擬機遷移具有很大優(yōu)勢,但同時帶來不少挑戰(zhàn)。例如在內(nèi)存遷移、網(wǎng)絡連接保持、用戶數(shù)據(jù)遷移和虛擬機本身的效率等問題上還有提升空間。而這就需要有從底層硬件、固件到軟件的同步提升,巴塞羅那就從CPU底層提供了良好的硬件支持。


      例如DEV(Device Exclusion Vector)技術可以在內(nèi)存中創(chuàng)建保護域,通過拒絕未經(jīng)授權的內(nèi)存訪問請求,使得設備在未經(jīng)授權的情況下,不得訪問內(nèi)存頁面,實現(xiàn)了在硬件中嵌入安全性,從而提高虛擬機效率。


      此外,為了提升虛擬機與物理機之間的數(shù)據(jù)傳送及翻譯轉(zhuǎn)換,巴塞羅那中使用了帶標簽的 TLB(Translation Look-aside Buffer,地址轉(zhuǎn)換后備緩沖器,它是 CPU 中的一個表,用于存儲最近使用的從虛擬到物理內(nèi)存翻譯記錄),使得在多個虛擬機同時運行時,在內(nèi)存地址中切換時可以使系統(tǒng)管理程序知道TLB與虛擬機之間的一一對應關系,從而提高虛擬機性能。


      用戶歡迎多元結構


      記者:在全球TOP500排名中,出現(xiàn)了越來越多的基于AMD處理器的系統(tǒng),而且有消息說IBM、Cray和Sun三大廠商都將采用巴塞羅那作為千萬億次HPC的搭建平臺,您如何看待這一趨勢?


      金海:總結起來,AMD的新一代處理器的重要貢獻來自于三個方面,即獨特的系統(tǒng)架構,優(yōu)勢的內(nèi)存性能與控制,以及在虛擬化領域里的一系列新設計。在這三方面,AMD都提供了較好的方案,例如有彈性的直連架構實現(xiàn)了線性的性能提升,所需要解決的問題越大,越復雜,直連架構的優(yōu)勢也就越大。


      作為高性能計算領域里的研究人員,我們當然希望能夠有更多新的技術、新的設計和新的突破點出來,滿足更多領域?qū)τ诟咝阅苡嬎愕男枨蟆>唧w到即將開始的ChinaGrid網(wǎng)格二期工程,我們也希望看到在6個核心計算節(jié)點和40個高校計算節(jié)點中,有更多來自不同廠商的產(chǎn)品,讓更多性價比良好的系統(tǒng)能被各個領域的研究者說采用。


       人物鏈接:


      金海,工學博士,華中科技大學教授、博士生導師,華中科技大學計算機學院院長,華中科技大學“集群與網(wǎng)格計算湖北省重點實驗室”和“服務計算技術與系統(tǒng)教育部重點實驗室”主任。國務院特殊津貼專家、中國計算機學會常務理事、中國計算機學會對外聯(lián)絡部副主任。教育部重大專項“中國教育科研網(wǎng)格ChinaGrid”計劃的專家組組長。主要研究領域為計算機體系結構、并行與分布式處理、集群計算和網(wǎng)格計算、對等計算、網(wǎng)絡存儲與并行I/O、網(wǎng)絡安全、可信計算等。

分享到

多易

相關推薦