圖 1) 六節(jié)點(diǎn) NetApp FAS6240 集群的 SPC-1 IOPS。
在本文中,我首先介紹 SPC-1 基準(zhǔn)測(cè)試,并將討論延遲的重要性。然后更為詳細(xì)地深入探究 NetApp 和其他供應(yīng)商近期競(jìng)爭(zhēng)的結(jié)果,再比較一下基于磁盤(pán)與基于閃存的存儲(chǔ)。
SPC-1 基準(zhǔn)測(cè)試
存儲(chǔ)性能理事會(huì) (SPC) 是存儲(chǔ)供應(yīng)商、集成商和學(xué)術(shù)機(jī)構(gòu)聯(lián)盟,旨在規(guī)定、標(biāo)準(zhǔn)化和促進(jìn)存儲(chǔ)基準(zhǔn)測(cè)試。存儲(chǔ)性能理事會(huì)的 SPC-1 基準(zhǔn)測(cè)試是行業(yè)標(biāo)準(zhǔn)的、經(jīng)過(guò)審核且基于塊的嚴(yán)格基準(zhǔn)測(cè)試,用于衡量磁盤(pán)子系統(tǒng)對(duì)工作負(fù)載(由包括寫(xiě)入、覆蓋、讀取后寫(xiě)入、寫(xiě)入后讀取、熱點(diǎn)以及隨機(jī)和順序操作在內(nèi)的 I/O 混合而成)的處理性能??傮w而言,因大約 60% 的工作負(fù)載是寫(xiě)入操作,而使得這種基準(zhǔn)測(cè)試對(duì)于存儲(chǔ)系統(tǒng)極具挑戰(zhàn)性。I/O 大小不一,有大有小。
SPC-1 可能是模擬存儲(chǔ)系統(tǒng)對(duì)數(shù)據(jù)庫(kù)工作負(fù)載處理方式的最佳基準(zhǔn)測(cè)試。SPC 開(kāi)發(fā)該基準(zhǔn)測(cè)試時(shí),研究了各種應(yīng)用訪(fǎng)問(wèn)存儲(chǔ)的方式,然后根據(jù)這些衡量數(shù)據(jù)模擬了工作負(fù)載。混合操作代表一類(lèi)廣泛的應(yīng)用,大約占所有商業(yè)應(yīng)用的一半。
SPC-1 訪(fǎng)問(wèn)模式會(huì)引發(fā)熱點(diǎn),這在總工作負(fù)載中占據(jù)相當(dāng)大的比例。如果進(jìn)行測(cè)試的存儲(chǔ)的自動(dòng)存儲(chǔ)分層 (AST) 系統(tǒng)達(dá)到足夠的粒度和智能水平,則可能會(huì)將此類(lèi)熱點(diǎn)部分緩存(如果緩存足夠大)或存儲(chǔ)到 SSD 中。
盡管沒(méi)有任何基準(zhǔn)測(cè)試是完美無(wú)缺的,但要衡量隨機(jī)塊 I/O 性能和比較供應(yīng)商之間的結(jié)果,SPC-1 或許是最佳標(biāo)準(zhǔn)化基準(zhǔn)測(cè)試。如果某個(gè)存儲(chǔ)系統(tǒng)在 SPC-1 基準(zhǔn)測(cè)試中表現(xiàn)良好,則該系統(tǒng)在面對(duì)不斷動(dòng)態(tài)變化且難以處理的延遲敏感型工作負(fù)載(一般是數(shù)據(jù)庫(kù)應(yīng)用程序,尤其是 OLTP,還包括電子郵件和虛擬化)時(shí),通常也能提供極高的性能。如果您有興趣了解這項(xiàng)基準(zhǔn)測(cè)試,則可閱讀該測(cè)試的完整規(guī)范。
SPC-1 不是吞吐量類(lèi)型的基準(zhǔn)測(cè)試。要了解 Gb/秒測(cè)試的最佳結(jié)果,請(qǐng)查看其他資料。
解釋基準(zhǔn)測(cè)試結(jié)果
基準(zhǔn)測(cè)試的秘訣在于對(duì)結(jié)果的解釋。單單一個(gè) IOPS 數(shù)字也許并不能完全說(shuō)明問(wèn)題。查看 SPC-1 報(bào)告時(shí),您需要關(guān)注以下幾點(diǎn):
可持續(xù)性。所有 SPC-1 基準(zhǔn)測(cè)試都要包含可持續(xù)性測(cè)試,并且該測(cè)試必須至少運(yùn)行八個(gè)小時(shí)。理想的 IOPS 應(yīng)始終保持較高的水平且具有持久性。間隔期間性能不能下降,持續(xù)性測(cè)試時(shí)間越長(zhǎng)越好。
每個(gè)驅(qū)動(dòng)器的 IOPS。該指標(biāo)衡量存儲(chǔ)系統(tǒng)驅(qū)動(dòng)底層硬件的效率如何,每個(gè)驅(qū)動(dòng)器的 IOPS 為 500 的效率是每個(gè)驅(qū)動(dòng)器的 IOPS 為 250 的兩倍。能夠更高效地使用驅(qū)動(dòng)器意味著達(dá)到指定性能水平所需的驅(qū)動(dòng)器較少,這樣可縮減成本與物理占用空間。
響應(yīng)時(shí)間(延遲)。SPC-1 中的響應(yīng)時(shí)間從應(yīng)用角度來(lái)衡量完成平均 I/O 事務(wù)所需的時(shí)間長(zhǎng)度。響應(yīng)時(shí)間越短(響應(yīng)速度越快)越好。IOPS 較高而響應(yīng)時(shí)間較長(zhǎng)的情況可能出現(xiàn)(但并不可取)。對(duì)于數(shù)據(jù)庫(kù)事務(wù),我們認(rèn)為 10 毫秒的響應(yīng)時(shí)間是處理讀取操作時(shí)保持高性能的上限(如果超過(guò) 20 毫秒,Microsoft 等供應(yīng)商會(huì)認(rèn)為數(shù)據(jù)庫(kù)"已中斷"),而寫(xiě)入操作需要更快的響應(yīng),重做日志寫(xiě)入操作需要近乎即時(shí)的響應(yīng)。
這些就是 NetApp 致力于實(shí)現(xiàn)低延遲結(jié)果的部分原因。有關(guān) IOPS 和延遲的更多信息,請(qǐng)查看我最近的博文。
每次操作成本。該指標(biāo)衡量每次操作必須花費(fèi)多少美元。從根本上講,計(jì)算方法是使用系統(tǒng)總價(jià)除以得出的 SPC-1 IOPS。但請(qǐng)注意,有些供應(yīng)商報(bào)告的是折扣價(jià),而另一些供應(yīng)商報(bào)告的是標(biāo)價(jià),這樣可能會(huì)使結(jié)果出現(xiàn)偏差。
RAID 保護(hù)。將哪種類(lèi)型的 RAID 保護(hù)用于測(cè)試?大多數(shù) SPC-1 結(jié)果使用鏡像(RAID 10 或 RAID 1+O)來(lái)消除奇偶校驗(yàn)開(kāi)銷(xiāo)。這實(shí)際上意味著,與采用單奇偶校驗(yàn)或雙奇偶校驗(yàn) RAID 的相近可用容量比較,使用磁盤(pán)將支出更多成本。
需要的所有硬件。硬件配置的復(fù)雜程度如何?使用的是哪些類(lèi)型的磁盤(pán)?這是您實(shí)際上可能會(huì)部署的系統(tǒng),還是專(zhuān)門(mén)為了取得較好的基準(zhǔn)測(cè)試結(jié)果而使用的系統(tǒng)?
NetApp SPC-1 結(jié)果
NetApp SPC-1 結(jié)果如上圖 1 中所示。我們使用的是一個(gè)由 6 個(gè) FAS6240 節(jié)點(diǎn)(3 個(gè)高可用性對(duì))構(gòu)成的集群,每個(gè)節(jié)點(diǎn)帶有一個(gè) 512 GB 的閃存模塊(FAS6240 標(biāo)配),總共使用了 432 個(gè)磁盤(pán)驅(qū)動(dòng)器(450 GB 的 15K SAS 驅(qū)動(dòng)器,每個(gè)控制器 72 個(gè)驅(qū)動(dòng)器)。
閃存是 NetApp 虛擬存儲(chǔ)層 (VST) 的一部分,讀取熱數(shù)據(jù)將自動(dòng)提升到閃存執(zhí)行。一個(gè) FAS6240 控制器最多可支持 3 TB 的閃存,因此,相比于典型數(shù)據(jù)中心配置的部署而言,將每個(gè)集群節(jié)點(diǎn)限制到一個(gè) 512 GB 的卡(系統(tǒng)標(biāo)配)是規(guī)模更小的部署。
同樣,由于一個(gè) FAS6240 控制器最多可支持 1440 個(gè)驅(qū)動(dòng)器,因此每個(gè)控制器僅使用 72 個(gè)驅(qū)動(dòng)器也是很低的配置。使用的磁盤(pán)是 450 GB15K SAS 驅(qū)動(dòng)器。需要注意的是,我們?cè)谒袦y(cè)試中都啟用了 RAID-DP® 技術(shù) — NetApp 雙奇偶校驗(yàn) RAID 6 實(shí)現(xiàn)形式。這與標(biāo)準(zhǔn)的客戶(hù)做法保持一致(RAID-DP 是 NetApp 默認(rèn)項(xiàng))。表 1 總結(jié)了相對(duì)于上述衡量指標(biāo)的基準(zhǔn)測(cè)試結(jié)果。
表 1) NetApp 通過(guò) SPC-1 主要衡量指標(biāo)體現(xiàn)出的性能。
此外,經(jīng)過(guò)可持續(xù)性測(cè)試或可重復(fù)性測(cè)試,我們未發(fā)現(xiàn)性能隨時(shí)間有所下降。在下一部分您會(huì)發(fā)現(xiàn),NetApp 得到了令人非常滿(mǎn)意的結(jié)果,尤其是能以較短的響應(yīng)時(shí)間(延遲)提供較高的 IOPS。
與其他領(lǐng)先 SPC-1 結(jié)果的比較
我們根據(jù)大約 3 毫秒的響應(yīng)時(shí)間閾值,對(duì)基于磁盤(pán)的領(lǐng)先 SPC-1 結(jié)果進(jìn)行了分析。分析表明,在以低延遲提供指定 IOPS 的情況下,NetApp SPC-1 結(jié)果屬于基于磁盤(pán)的企業(yè)系統(tǒng)的最佳結(jié)果。NetApp 通過(guò)主要基于 HDD 的配置,能夠達(dá)到接近閃存水平的性能。
3 毫秒的響應(yīng)時(shí)間目標(biāo)符合要求苛刻的低延遲數(shù)據(jù)庫(kù)應(yīng)用程序(例如金融企業(yè)使用的應(yīng)用程序)的需求。對(duì)于絕大多數(shù)數(shù)據(jù)庫(kù)工作負(fù)載而言,非常低的 I/O 延遲可大大提高數(shù)據(jù)庫(kù)的運(yùn)行性能。
您可閱讀我最近發(fā)表的關(guān)于這些結(jié)果的博文,查看更為詳細(xì)的分析(外加評(píng)論)。
我們比較了以下幾個(gè)存儲(chǔ)系統(tǒng)(單擊下面的超鏈接可轉(zhuǎn)到每個(gè)存儲(chǔ)系統(tǒng)的完整 SPC-1 基準(zhǔn)測(cè)試報(bào)告):
• NetApp FAS6240 集群
• 帶有 V7000 的 IBM SVC
• 帶有 DS8700 的 IBM SVC
• Hitachi Data Systems VSP
• HP 3Par V800
• Huawei Symantec S8100
表 2) NetApp 集群與其他領(lǐng)先 SPC-1 結(jié)果的比較。
*這些數(shù)字的計(jì)算方法是,找到每個(gè)結(jié)果響應(yīng)時(shí)間最接近 3 毫秒的數(shù)據(jù)點(diǎn),然后報(bào)告該點(diǎn)的 IOPS。(表中顯示了每個(gè)數(shù)據(jù)點(diǎn)的準(zhǔn)確響應(yīng)時(shí)間。)
SPC-1 IOPS 和每個(gè)磁盤(pán)的 IOPS 以及每次操作成本
表 2 從各個(gè)方面比較了六個(gè)系統(tǒng)的 SPC-1 結(jié)果。無(wú)可否認(rèn),有些系統(tǒng)達(dá)到的原始 SPC-1 IOPS(第一行)高于 NetApp FAS6240 集群。但是,NetApp 每個(gè)磁盤(pán)的 IOPS 達(dá)到其他供應(yīng)商結(jié)果的兩倍以上,而且能提供最低的每次操作成本(以標(biāo)價(jià)計(jì))。我已將表中的定價(jià)規(guī)范化,使其反映所有配置的標(biāo)價(jià)(有些供應(yīng)商在提交的 SPC 中報(bào)告的是折扣價(jià),造成若不規(guī)范便無(wú)法加以比較的情況)。
低延遲 IOPS
比較一下所有系統(tǒng)在 3 毫秒延遲情況下的最高性能(在表中以粗體顯示),您會(huì)發(fā)現(xiàn)只有一個(gè)系統(tǒng)(即帶有 V7000 的 IBM SVC)的性能超過(guò) NetApp 系統(tǒng),但僅僅高出 4%。該系統(tǒng)的價(jià)格約為 NetApp 集群的 3.5 倍(以標(biāo)價(jià)計(jì)),而且該系統(tǒng)帶有 8 個(gè) SVC 虛擬化引擎、16 個(gè) V7000 系統(tǒng)(每個(gè)系統(tǒng)包含 2 個(gè) SVC 控制器和 2 個(gè) RAID 控制器)以及 1,920 個(gè) 15K RPM 146 GB 磁盤(pán)驅(qū)動(dòng)器(或許不是您目前大量購(gòu)買(mǎi)的驅(qū)動(dòng)器。),其復(fù)雜性遠(yuǎn)遠(yuǎn)高于 NetApp 集群。較之由 6 個(gè)控制器(帶有 432 個(gè)磁盤(pán))構(gòu)成的 NetApp 集群,該系統(tǒng)要配置、管理和支持更多的組件。
系統(tǒng)復(fù)雜性
總體而言,與表中所示其他存儲(chǔ)系統(tǒng)相比,NetApp FAS6240 集群能以更少的硬件和少得多的磁盤(pán)獲得良好的結(jié)果,并且是在測(cè)試中唯一一個(gè)采用雙奇偶校驗(yàn) RAID 而非鏡像的存儲(chǔ)陣列。這意味著更簡(jiǎn)單的管理、更低的管理和能源成本,以及更切合實(shí)際的總體配置。
閃存是否能提供合適的解決方案?
完全基于 DRAM 和閃存的系統(tǒng)能提供極高的 IOPS 和非常短的響應(yīng)時(shí)間,盡管這些系統(tǒng)的 SPC-1 結(jié)果已存在,但是到目前為止,這些系統(tǒng)在實(shí)現(xiàn)高 IOPS 的同時(shí),并不能提供企業(yè)通常需要的容量或功能。如果您對(duì)容量的要求不高,但需要極高的 IOPS,則當(dāng)然有必要評(píng)估完全基于閃存或完全基于 DRAM 的解決方案,但是需要斟酌取舍。
NetApp 也提供完全基于閃存的方案,但是在未來(lái)一段時(shí)間內(nèi),一旦您的容量要求超過(guò)數(shù)十 TB,出于經(jīng)濟(jì)性的考慮,基于磁盤(pán)或磁盤(pán)加閃存的混合存儲(chǔ)系統(tǒng)仍是更好的選擇。表 3 列出了通過(guò)粗略計(jì)算得出的成本差異,顯示了每 TB 原始容量的大體成本。
表 3) 容量成本:DRAM 和閃存陣列較之 NetApp 集群。
結(jié)論
憑借這一 SPC-1 結(jié)果,NetApp 證明了 Data ONTAP 8 集群模式能夠以卓越的性能處理 SAN 和 NAS 工作負(fù)載。集群模式可實(shí)現(xiàn):
• 低延遲(響應(yīng)時(shí)間)與高性能
• 可動(dòng)態(tài)擴(kuò)展的 FC、iSCSI、NFS 和 CIFS 統(tǒng)一集群
• 極高的性?xún)r(jià)比
• 無(wú)中斷運(yùn)行,例如跨集群節(jié)點(diǎn)(包括 CIFS)的數(shù)據(jù)移動(dòng),而跨 CIFS 的數(shù)據(jù)移動(dòng)通常幾乎無(wú)法實(shí)現(xiàn)
• Data ONTAP 功能組合包括寫(xiě)入優(yōu)化、應(yīng)用感知、Snapshot™ 副本、重復(fù)數(shù)據(jù)刪除、數(shù)據(jù)壓縮、復(fù)制、精簡(jiǎn)配置、虛擬存儲(chǔ)分層等
• 能夠?qū)⒂糜?7-模式的硬件用于集群模式,包括 V 系列平臺(tái) — 可對(duì)其他供應(yīng)商的存儲(chǔ)陣列實(shí)施虛擬化
作者:系統(tǒng)工程師 Dimitris Krekoukias
Dimitris 從事 IT 行業(yè)已超過(guò) 17 年,在存儲(chǔ)、大規(guī)模備份和恢復(fù)、虛擬化、大規(guī)模并行系統(tǒng)以及高性能計(jì)算領(lǐng)域擁有豐富的經(jīng)驗(yàn)。自從三年前加入 NetApp 以來(lái),他一直擔(dān)任性能和競(jìng)爭(zhēng)主題專(zhuān)家。他定期在 http://www.recoverymonkey.org/ 上發(fā)表有關(guān)性能和其他主題的博客。