立足實(shí)際,戰(zhàn)略合作


      網(wǎng)格計(jì)算是伴隨著互聯(lián)網(wǎng)而迅速發(fā)展起來(lái)的,專門針對(duì)復(fù)雜科學(xué)計(jì)算的新型計(jì)算模式。通俗的說(shuō),這種計(jì)算模式就是通過(guò)網(wǎng)絡(luò)連接地理上分布的各類高性能計(jì)算機(jī)、數(shù)據(jù)庫(kù)和存儲(chǔ)設(shè)備等閑散資源,對(duì)其進(jìn)行統(tǒng)一調(diào)配,讓其為同一目標(biāo)而工作。要實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)閑散資源的統(tǒng)一調(diào)配,必須實(shí)現(xiàn)分布式資源、網(wǎng)格軟件平臺(tái)和網(wǎng)格應(yīng)用這三個(gè)層面的部署。


      分布式資源是整個(gè)網(wǎng)格計(jì)算的基本載體,由分布在網(wǎng)絡(luò)上的各類資源組成,包括各種硬件設(shè)備和軟件資源。它們可以是異構(gòu)的,也可以運(yùn)行在不同的操作系統(tǒng)下,網(wǎng)絡(luò)是對(duì)他們進(jìn)行統(tǒng)一調(diào)配、互通的橋梁。網(wǎng)絡(luò)軟件平臺(tái)處于分布式資源和網(wǎng)格應(yīng)用之間。一方面,該平臺(tái)起到綜合集成網(wǎng)格中各種資源的作用,提供用戶對(duì)資源的透明使用;另一方面,網(wǎng)格軟件平臺(tái)還提供了一些支持各種類型應(yīng)用的常用工具,讓基于網(wǎng)格的應(yīng)用開發(fā)變得更加容易。網(wǎng)格應(yīng)用也就是在網(wǎng)格軟件平臺(tái)上所能提供的各種功能和服務(wù)。目前,網(wǎng)格應(yīng)用領(lǐng)域主要有四類:分布式超級(jí)計(jì)算、分布式儀器系統(tǒng)、數(shù)據(jù)密集型計(jì)算和遠(yuǎn)程沉浸。此外,網(wǎng)格的信息集成也是一個(gè)重要的應(yīng)用領(lǐng)域。


      一個(gè)成功的網(wǎng)格系統(tǒng)可整合用戶系統(tǒng)內(nèi)的各類軟、硬件資源,為用戶提供優(yōu)異的計(jì)算平臺(tái),提高用戶的資源利用率。同時(shí),用戶還可通過(guò)網(wǎng)格系統(tǒng)實(shí)現(xiàn)與網(wǎng)絡(luò)中其他用戶的資源互配。這樣的系統(tǒng)平臺(tái),對(duì)科研項(xiàng)目繁復(fù),信息化資源配置零散的高校教育系統(tǒng)來(lái)說(shuō)尤其有益。


      重慶大學(xué)為解決自身科研項(xiàng)目對(duì)高性能計(jì)算的需求,和奠定其在中國(guó)教育網(wǎng)格系統(tǒng)西南節(jié)點(diǎn)的樞紐地位,聯(lián)合國(guó)內(nèi)服務(wù)器廠商中的領(lǐng)軍企業(yè)曙光公司,結(jié)成戰(zhàn)略合作關(guān)系,共建高性能計(jì)算聯(lián)合實(shí)驗(yàn)室。曙光公司采用曙光4000A高性能計(jì)算機(jī)機(jī)群系統(tǒng),同時(shí)配有高性能的存儲(chǔ)系統(tǒng)和軟件操作系統(tǒng),為重慶大學(xué)成功搭建了性能優(yōu)異的網(wǎng)格系統(tǒng)。


      高端產(chǎn)品,優(yōu)勢(shì)網(wǎng)格


      曙光公司為重慶大學(xué)構(gòu)建的網(wǎng)格計(jì)算平臺(tái)整體峰值計(jì)算能力達(dá)到每秒5500億次,其中包括機(jī)群服務(wù)器、SMP計(jì)算機(jī)、外存儲(chǔ)系統(tǒng)、視頻服務(wù)器,和外存儲(chǔ)系統(tǒng)等硬件設(shè)備。為了避免單點(diǎn)故障,I/O節(jié)點(diǎn)采用雙機(jī)高可用架構(gòu),同時(shí)系統(tǒng)還配備了豐富的網(wǎng)格系統(tǒng)軟件和各種應(yīng)用軟件。


      作為擁有眾多理工學(xué)科的綜合性大學(xué),重慶大學(xué)不可避免的要利用網(wǎng)格系統(tǒng)做大量的圖象處理、流體力學(xué)計(jì)算、生物信息運(yùn)算等大規(guī)??茖W(xué)計(jì)算。這也對(duì)網(wǎng)格系統(tǒng)的計(jì)算能力提出了極高的要求。曙光公司在整個(gè)網(wǎng)格系統(tǒng)中的28個(gè)計(jì)算節(jié)點(diǎn),和2個(gè)兼任管理節(jié)點(diǎn)和登錄節(jié)點(diǎn)功能的存儲(chǔ)節(jié)點(diǎn)中,配備了具有極高穩(wěn)定性和超強(qiáng)處理能力的2U曙光天闊機(jī)架式服務(wù)器A620r-E。各節(jié)點(diǎn)擁有兩個(gè)AMD64 Opteron處理器,其先進(jìn)的架構(gòu)體系和Hyper-Transport技術(shù)具有訪問(wèn)內(nèi)存帶寬高、延遲低、能力強(qiáng)的優(yōu)勢(shì),在多處理器系統(tǒng)上體現(xiàn)了近乎線性的性能加速比。網(wǎng)格平臺(tái)中的高性能節(jié)點(diǎn)機(jī)奠定了整個(gè)系統(tǒng)高可用性的基礎(chǔ)。


      從應(yīng)用程序的角度出發(fā),為不使管理操作系統(tǒng)與應(yīng)用程序爭(zhēng)奪帶寬資源,整個(gè)網(wǎng)格系統(tǒng)需要有基于共享內(nèi)存體系的平臺(tái),和基于消息傳遞模式的平臺(tái),以提供對(duì)這兩種主流程序的支持。曙光公司在網(wǎng)格系統(tǒng)中,節(jié)點(diǎn)間采用雙網(wǎng)共存的網(wǎng)絡(luò)架構(gòu)系統(tǒng)進(jìn)行連接,計(jì)算網(wǎng)絡(luò)和管理網(wǎng)絡(luò)分別由全線速千兆和百兆以太網(wǎng)擔(dān)當(dāng),計(jì)算網(wǎng)和管理網(wǎng)分開的方式大大提高了系統(tǒng)的效率。


      伴隨網(wǎng)格系統(tǒng)的成功運(yùn)行,大規(guī)模計(jì)算中所積累的各種各樣的資料和數(shù)據(jù)也會(huì)越來(lái)越多,整個(gè)網(wǎng)格系統(tǒng)需要有一個(gè)海量的存儲(chǔ)空間與其適配。曙光公司在重慶大學(xué)的網(wǎng)格系統(tǒng)的搭建中特別配備了獨(dú)立的外存儲(chǔ)設(shè)備,整個(gè)存儲(chǔ)系統(tǒng)采用SAN結(jié)構(gòu),1套曙光DS-2120F光纖盤陣作為外存,配備4塊300G熱插拔硬盤,總存儲(chǔ)容量達(dá)到1.2TB。同時(shí),系統(tǒng)中的可選SCSI RAID配置支持在線恢復(fù)RAID陣列,個(gè)別硬盤出現(xiàn)故障時(shí)也可確保數(shù)據(jù)安全。


      對(duì)重慶大學(xué)的師生而言,科學(xué)研究是最重要的工作,平時(shí)沒(méi)有過(guò)多的精力來(lái)進(jìn)行硬件和軟件設(shè)備的管理。因此眾多設(shè)備的管理必須非常簡(jiǎn)單統(tǒng)一,需要保證系統(tǒng)管理的有序性,高效性,避免管理上的混亂。曙光公司在網(wǎng)格平臺(tái)中配置了曙光4000A監(jiān)控/SKVM子系統(tǒng),其是曙光自主研發(fā)的、先進(jìn)的管理監(jiān)控系統(tǒng),具備布線更加簡(jiǎn)單、管理更加方便、使用更加穩(wěn)定的特點(diǎn)。其可配合機(jī)群系統(tǒng)及相應(yīng)軟件提供系統(tǒng)內(nèi)部溫度,直流電源電壓等工作狀態(tài)信息顯示。并自動(dòng)記錄主機(jī)因故障停止工作的時(shí)間和日志信息,幫助分析故障原因。其方便的切換功能使得系統(tǒng)管理員在管理整個(gè)機(jī)群的時(shí)候非常方便。


      重慶大學(xué)作為非贏利機(jī)構(gòu)的教育組織,信息化系統(tǒng)的性價(jià)比是需要著重考慮的因素?;诖耍锕夤究紤]到使重慶大學(xué)的信息化建設(shè)投資達(dá)到收益最大化,系統(tǒng)產(chǎn)品均采用標(biāo)準(zhǔn)配置,并可實(shí)現(xiàn)平滑升級(jí)。比如,作為節(jié)點(diǎn)的曙光天闊A620r-E所配備的雙核Opteron處理器就可平滑升級(jí)至四核,為用戶提供更強(qiáng)大的運(yùn)算能力。由于每個(gè)節(jié)點(diǎn)都配置了自適應(yīng)的多塊千兆網(wǎng)卡,在今后的升級(jí)中可以僅僅增加交換機(jī)就可以構(gòu)造雙千兆的網(wǎng)絡(luò),增加傳輸帶寬,形成動(dòng)態(tài)分配系統(tǒng)。并且,由統(tǒng)一標(biāo)準(zhǔn)的中間件構(gòu)成的網(wǎng)格平臺(tái),可完全與各類軟、硬終端產(chǎn)品實(shí)現(xiàn)互聯(lián)互通,保證了資源的充分共享。


      結(jié)束語(yǔ)


      教育網(wǎng)格系統(tǒng)應(yīng)用的研究、開發(fā)和部署方興未艾,重慶大學(xué)的加入必將起到積極的作用。其通過(guò)曙光公司精心打造的網(wǎng)格系統(tǒng),整合校園內(nèi)高性能計(jì)算資源,消除了信息孤島,充分調(diào)動(dòng)了各處信息化資源的運(yùn)算活力,體現(xiàn)了中國(guó)一流大學(xué)所應(yīng)具有的信息化實(shí)力。

分享到

多易

相關(guān)推薦