• 按使用量付費——客戶可以按照應用程序的運行時間或者按使用存儲和數據傳輸服務的時間支付費用。
• 近乎無限的基礎架構——幾乎可以實時享用基礎架構;反過來,沒有工作負載時,基礎架構可以縮回到近乎零資源。
• 根據工作負載配置資源——可以根據工作負載,隨時分配操作系統或服務器的類型,大幅改進了資源配置方面的靈活性。
實施HPC云面臨的障礙
盡管云計算有諸多優(yōu)勢,但是在考慮云計算是否適合HPC環(huán)境時還有很多障礙需要克服。
• 安全性和知識產權——云環(huán)境中的數據對商業(yè)企業(yè)來說常常是核心的知識產權。絕不能忽視這種可能性:商業(yè)競爭對手可能使用相同的共享計算資
• 軟件許可——大多數商業(yè)企業(yè)使用獨立軟件開發(fā)商(ISV)提供的第三方軟件來運行或管理HPC作業(yè)。這些應用軟件在購買時都附有法律協議,明確了該應用程序可以在何處運行,通常都規(guī)定該應用程序只能在客戶的場地運行。
• 數據轉移——除非企業(yè)完全采用云計算,棄用自己的數據中心,否則用于模擬的模和結果就必須在云計算提供商與客戶數據中心之間進行傳輸。然而這項工作很復雜,因為就傳輸大容量文件而言,互聯網帶寬很有限;而且對大多數基礎架構即服務(IaaS)提供商來說,進出云環(huán)境傳輸的所有數據都是按字節(jié)數計費的“收費服務”。
• 定價模式——按使用量付費的模式常常對客戶有很大的吸引力,但如果長期使用公共云,其費用通常比在兩年內自己擁有和維護硬件的成本貴兩三倍。公司應認真確定在多長時間內使用公共云比使用本地服務器更有優(yōu)勢。
面向HPC的云計算
HPC數據中心必須綜合考慮采用云計算的商業(yè)理由及其面臨的障礙,才能確定這種模式是否適合本企業(yè)以及哪種模式最適合自己。
實現HPC云需要幾款工具,包括虛擬機管理程序平臺、工作負載管理器和基礎架構管理工具包。管理工具包應該提供策略定義及執(zhí)行、配置管理、資源預留及報告等功能。虛擬機管理程序平臺應該為云計算資源的虛擬部分提供良好的基礎。最后,工作負載管理器應該提供作業(yè)管理功能。
對多數大型HPC環(huán)境來說,用戶需要考慮采用私有云還是混合云解決方案。在混合云環(huán)境中,可以在峰值需求期間使用外部公共云,這又叫“云爆發(fā)”(cloud bursting);比較小的HPC環(huán)境可能應該考慮公共云,使用的所有資源都在云端。不管使用哪一種模式的云,特別重要的是確保基礎架構包含可以同時充分利用物理資源和虛擬資源的管理層,因為HPC應用程序仍主要放置在物理機器上。在理想情況下,該管理層應該能夠把虛擬機管理程序環(huán)境和物理環(huán)境合并為一個動態(tài)共享的基礎架構,既支持多種操作系統,又支持異構環(huán)境。
混合云方案對HPC環(huán)境來說可能非常有優(yōu)勢,因為它可以提供完成作業(yè)所需要的額外計算能力。在下列情況尤其應該考慮采用云爆發(fā)方案:
• 預計作業(yè)在本地運行的等待時間過長時;
• 如果作業(yè)在本地運行所需的累計運行時間過長時;
• 當作業(yè)對進出云環(huán)境的數據傳輸要求不高時。
一旦確定了企業(yè)實施云計算的最佳方案,就可以采用多種方法來評估IaaS提供商,看看哪一家提供商最適合本企業(yè)的應用和工作負載要求。評估時要考慮的因素包括性能、可靠性、創(chuàng)建實例的速度、價格等,此外,還應該考慮每一家IaaS提供商的洽談和定價流程以及政策,還要對照服務級別協議(SLA)評估可靠性??紤]上述每一個因素對于企業(yè)選擇最適合其用途的提供商大有幫助。
作者介紹
Chris Porter 現任Platform公司HPC云產品經理,他在HPC和云計算領域有著豐富的經驗,他曾經撰寫過眾多有關HPC和云計算的白皮書。