如果思科公司所說(shuō)的增長(zhǎng)速度將保持平穩(wěn),那么到2022年,僅每月產(chǎn)生的移動(dòng)信息量就將超過(guò)2007年全年全球的數(shù)據(jù)存儲(chǔ)總量。當(dāng)然,其中會(huì)包括像“跳舞的小孩”這樣的視頻,但與之相對(duì)應(yīng)地,存儲(chǔ)庫(kù)里也會(huì)保存銀行數(shù)據(jù),加密健康記錄和銷(xiāo)售網(wǎng)點(diǎn)數(shù)據(jù)庫(kù)等非常重要的信息。如果調(diào)出一個(gè)“跳舞的小孩”視頻要花15秒,沒(méi)多少人會(huì)介意。但對(duì)于文件讀取請(qǐng)求而言,15秒的反應(yīng)時(shí)間對(duì)客戶(hù)來(lái)說(shuō)會(huì)像是一個(gè)世紀(jì)那么漫長(zhǎng),長(zhǎng)此以往,公司會(huì)被 “慢”死掉。有些信息就是要能即用即取,而其他數(shù)據(jù)則可以放在相對(duì)更慢更便宜的存儲(chǔ)區(qū)。你可以把它想成溫度,保存最快最重要的數(shù)據(jù)為“熱”,保存最慢最不重要的數(shù)據(jù)為“冷”。
“如果你是一條航線(xiàn),有人想預(yù)定一趟航班,那么讓對(duì)方快速查到航班時(shí)刻表并完成預(yù)定操作會(huì)讓客戶(hù)心情愉悅。”希捷公司高級(jí)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理Teresa Worth說(shuō)。 “航班預(yù)定一旦成功,航空公司也收到了機(jī)票費(fèi),那接下來(lái)航線(xiàn)數(shù)據(jù)就可以從 ”熱“轉(zhuǎn)為”溫“了。如果客戶(hù)想換航班,查詢(xún)座位號(hào)或其他信息,客戶(hù)肯定還是希望速度夠快,但這時(shí)就不再是那么”熱“了,因?yàn)楹娇展竞驮摽蛻?hù)的交易已經(jīng)完成。航班飛過(guò)后,數(shù)據(jù)就可以變”冷“或近線(xiàn)存儲(chǔ)了。當(dāng)然數(shù)據(jù)仍需保持在可以被查詢(xún)的狀態(tài),因?yàn)榭蛻?hù)也許想在年末查詢(xún)當(dāng)年的飛行里程,并確定他們的這次飛行拿到了積分,但這時(shí)候讓他們稍微等等也沒(méi)有什么大問(wèn)題了”
就像做飯一樣,溫度就是一切?;蛟S還是跟做飯一樣,熱的材料最受關(guān)注,但做飯用到最多的還是那些冷的,放在冰箱冷藏和冷凍室里的材料。熱存儲(chǔ)一般都存在容量較低的驅(qū)動(dòng)器中,而冷存儲(chǔ)驅(qū)動(dòng)器通常存儲(chǔ)的數(shù)據(jù)則要多出好幾倍。這就形成了某種動(dòng)態(tài)的平衡,你必須在設(shè)計(jì)分層存儲(chǔ)時(shí)考慮到這個(gè)因素。T一個(gè)公司分層存儲(chǔ)時(shí)采用了何種方法對(duì)公司的經(jīng)營(yíng)收益會(huì)產(chǎn)生重要影響,甚至關(guān)乎著公司的存亡。
分層模型更新
存儲(chǔ)分層這個(gè)想法已經(jīng)出現(xiàn)幾十年了,但因?yàn)榇鎯?chǔ)技術(shù)的不斷發(fā)展,這個(gè)想法的細(xì)節(jié)也在因此不停的更改。更改集中在中間層和存儲(chǔ)架構(gòu)上。
這里說(shuō)的中間層是指選用的存儲(chǔ)媒介。磁盤(pán)存儲(chǔ),也就是硬盤(pán)驅(qū)動(dòng)器以前既被用于交易型存儲(chǔ)(熱)也被用于近線(xiàn)存儲(chǔ)(溫),而磁帶則主要被用來(lái)歸檔(冷)這三種存儲(chǔ)的具體含義如下:
交易型存儲(chǔ)。指用于高速和大量商務(wù)交易的數(shù)據(jù)。交易型數(shù)據(jù)常常和產(chǎn)生利潤(rùn)的業(yè)務(wù)直接掛鉤,對(duì)公司生計(jì)有著決定性的作用。
近線(xiàn)存儲(chǔ)。以上述航班的例子為例,近線(xiàn)數(shù)據(jù)就是指那些從即時(shí)讀取降級(jí)成快速讀取的信息。它就像是放在檔案柜的卷宗,而不再是擺在桌子上的棘手文件。你仍然能快速方便的找到它,但得稍微多花點(diǎn)時(shí)間。雖然時(shí)間成本增加了,但換回來(lái)的是存儲(chǔ)媒介成本的大幅下降。
歸檔存儲(chǔ)。不久,你的檔案柜存滿(mǎn)了。這時(shí),企業(yè)常常會(huì)找出最老的文件,把它們裝箱然后放到像地下室或倉(cāng)庫(kù)這樣的冷存儲(chǔ)室里。這就是歸檔。如果方法得當(dāng),所有的數(shù)據(jù)將仍然被有序存放,但很明顯,想找到具體某個(gè)箱子查找到其內(nèi)容會(huì)花更長(zhǎng)的時(shí)間。隨著每GB磁盤(pán)存儲(chǔ)價(jià)格的下降,磁盤(pán)在不斷入侵并占領(lǐng)磁帶的市場(chǎng),結(jié)果就是近線(xiàn)和歸檔存儲(chǔ)之間的界限越來(lái)越模糊了,但磁帶在企業(yè)歸檔市場(chǎng)中,尤其是在備份/故障恢復(fù)應(yīng)用方面仍然處于統(tǒng)治地位。這說(shuō)明,在基于磁盤(pán)的系統(tǒng)當(dāng)中,磁帶庫(kù)也能被虛擬化和使用。
隨著固態(tài)磁盤(pán)驅(qū)動(dòng)器的普及,很多人正在注意到金字塔尖還有一個(gè)新的存儲(chǔ)層:Tier 0。
“Tier 0是專(zhuān)屬于SSD的,它涉及到的工作任務(wù)最重,占空比、耐久力和性能穩(wěn)定性最大” 希捷公司高級(jí)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理Teresa Worth 說(shuō)。 “ Tier 0上的信息都是和交易及IOPS相關(guān)的。更快地完成交易能讓公司掙更多錢(qián),或者提升顧客的滿(mǎn)意度,進(jìn)而增加公司的競(jìng)爭(zhēng)力?!?/p>
如果想完整的解釋存儲(chǔ)架構(gòu),可能需要有一篇專(zhuān)門(mén)的文章。小企業(yè)用直連方式和網(wǎng)絡(luò)連接(DAS和NAS) 這兩種存儲(chǔ)可能就能很好的運(yùn)作起來(lái),這兩種存儲(chǔ)一般會(huì)分別選擇eSATA 或 USB 3.0再加以太網(wǎng),我們知道這些就夠了。但是這些連接的性能和可擴(kuò)展性都受到了某種程度的限制,因此不適用于較大的存儲(chǔ)。而事實(shí)上,在上世紀(jì)90年代及本世紀(jì)最初幾年里,存儲(chǔ)區(qū)域網(wǎng)(SANs)的光纖通道技術(shù)已經(jīng)標(biāo)準(zhǔn)化了。光纖通道的成功在很大程度上是源于對(duì)協(xié)議的寬容性。IP, iSCSI, ATM和其它協(xié)議都能在該網(wǎng)絡(luò)中運(yùn)行,效率也都一樣。
現(xiàn)在,作為一種網(wǎng)絡(luò)技術(shù),光纖通道能產(chǎn)生的最大傳輸速度是8 Gb/s 或16 Gb/s,但驅(qū)動(dòng)器接口的最大速度則僅為4 Gb/s。對(duì)于企業(yè)來(lái)說(shuō),這樣的帶寬夠用了,但以太網(wǎng)的潛在帶寬是10 Gb/s,而且以太網(wǎng)有價(jià)格優(yōu)勢(shì)和更廣泛的使用范圍,因此光纖通道將很快面臨壓力。過(guò)去高速以太網(wǎng)的致命弱點(diǎn)是它的高價(jià)位以及由此對(duì)系統(tǒng)資源產(chǎn)生的影響,但網(wǎng)絡(luò)適配器中出現(xiàn)了TCP卸載引擎,它與更強(qiáng)有力的CPU結(jié)合后,高成本的問(wèn)題已經(jīng)基本得到了解決。這項(xiàng)技術(shù)加速了光纖通道在架構(gòu)和存儲(chǔ)驅(qū)動(dòng)器兩個(gè)層面的衰落,為以太網(wǎng)的iSCSI掃清了障礙,最近,因此受益的又變成了串行并列SCSI(SAS)。和光纖通道一樣,驅(qū)動(dòng)連接器和存儲(chǔ)網(wǎng)絡(luò)互聯(lián)都在用SAS,SAS因此變成了現(xiàn)在最高性能分層存儲(chǔ)的最佳解決方案。我們很快將跟進(jìn)一篇專(zhuān)門(mén)講述SAS的文章。
分層存儲(chǔ)服務(wù)器選擇
大多數(shù)分層存儲(chǔ)都會(huì)用到某種類(lèi)型的存儲(chǔ)服務(wù)器。表現(xiàn)形式一般是:將單機(jī)服務(wù)器系統(tǒng)連在被稱(chēng)為JBODs(“就是一摞盤(pán)”)的外接存儲(chǔ)箱上。這時(shí),一個(gè)JBOD跟一個(gè)連在類(lèi)似SAS接口上的裝有基架的磁盤(pán)柜差不太多。The JBOD attaches這個(gè)JBOD反過(guò)來(lái)又跟服務(wù)器相連,服務(wù)器里會(huì)包含一個(gè)存儲(chǔ)控制器,該控制器能進(jìn)行RAID操作并將磁盤(pán)陣列連接到一個(gè)更大的SAN結(jié)構(gòu)中。下圖展示的Xyratex RS-1600-FC2就是一個(gè)JBOD磁盤(pán)柜。
還有另外一種方法:有些企業(yè)喜歡把控制器/服務(wù)器和驅(qū)動(dòng)器裝在同一個(gè)磁盤(pán)柜里。一種常見(jiàn)的設(shè)計(jì)是使用12個(gè)熱插拔的3.5“驅(qū)動(dòng)器,配合一個(gè)服務(wù)器平臺(tái)和3 Gb/s 的SAS結(jié)構(gòu),然后把它們裝在一個(gè)3U的磁盤(pán)擴(kuò)展柜。存儲(chǔ)器制造商們生產(chǎn)的磁盤(pán)柜有7U的,甚至還有能裝載超過(guò)60個(gè)3.5”驅(qū)動(dòng)器的8U磁盤(pán)柜,見(jiàn)下圖所示的雙面STX XS62-2810。
很明顯,存儲(chǔ)服務(wù)器的性能如何以及能否找到正確的目標(biāo)層取決于使用了哪種存儲(chǔ)處理方法和驅(qū)動(dòng)技術(shù)。裝有6 Gb/s SSDs 的最先進(jìn)的Xeon 5600平臺(tái)將被應(yīng)用于Tier 0,而基于SATA的JBOD如果和三年前研發(fā)的單CPU相連之后,則更適用于Tier 2?,F(xiàn)在的分層技術(shù)中有一些模糊的地方,其中大部分都是和Tier 1有關(guān)的。Tier 0需要可觀的預(yù)算作支持,才能挖掘其性能的最大潛力,而Tier 2常常被用來(lái)平衡可靠性,容量和價(jià)格。前些年談到這個(gè)話(huà)題的時(shí)候,我們的選擇似乎還只局限于兩種:也就是只需要在最快的SCSI 3.5“硬盤(pán)驅(qū)動(dòng)器和最大的PATA或 SATA 3.5”硬盤(pán)驅(qū)動(dòng)器之間作權(quán)衡。而現(xiàn)在,需要考慮的因素增加了很多。
這篇文章中表達(dá)的想法是和頭三級(jí)驅(qū)動(dòng)器存儲(chǔ)相關(guān)的,也就是從交易存儲(chǔ)到近線(xiàn)存儲(chǔ)。這里的討論中我們可以忽略磁帶,而把目光聚焦在兩種主要存儲(chǔ)類(lèi)型,它們的形狀系數(shù)及其它一些需要考慮的問(wèn)題上,這些因素在為分層存儲(chǔ)方案選擇驅(qū)動(dòng)器時(shí)都需要考慮到。應(yīng)用程序過(guò)去一直是被磁帶和光盤(pán)統(tǒng)治的,不過(guò),我們應(yīng)該注意到,把磁盤(pán)也納入考慮范疇將越來(lái)越有其必要性。一篇由企業(yè)存儲(chǔ)集團(tuán)撰寫(xiě)蘋(píng)果公司發(fā)起的題為“分層存儲(chǔ)藍(lán)圖”的論文說(shuō)道:在磁盤(pán),磁帶和虛擬磁帶解決方案之中,“故障恢復(fù)的失敗率平均為40%?!?究其原因,在部分程度上問(wèn)題就出在企業(yè)所存的數(shù)據(jù)的量上,以及存儲(chǔ)大量數(shù)據(jù)時(shí)非磁帶不選。在Tier 3選擇相對(duì)更慢但更可靠的、又能保護(hù)RAID的硬盤(pán)存儲(chǔ)能顯著降低深層存儲(chǔ)器中數(shù)據(jù)毀壞的風(fēng)險(xiǎn)。
SSD 驅(qū)動(dòng)器選擇:SSD
梯形存儲(chǔ)的頂層是SSD,它的形狀系數(shù)一般都是2.5”。現(xiàn)在,SSD將NAND 閃存作為其存儲(chǔ)媒介而不是硬盤(pán)驅(qū)動(dòng)器轉(zhuǎn)盤(pán)來(lái)使用,對(duì)此你肯定已經(jīng)不再陌生了。不過(guò),NAND 存儲(chǔ)器有兩種:?jiǎn)螌邮酱鎯?chǔ)(SLC) 和多層式存儲(chǔ)。單層和多層代表的是每個(gè)存儲(chǔ)單元里可放置的信息單元(bit)數(shù)。多層式存儲(chǔ)(MLC)的優(yōu)點(diǎn)是每個(gè)單元能存儲(chǔ)更多數(shù)據(jù),因此單個(gè)NAND芯片的總?cè)萘扛撸@是以犧牲速度和使用壽命(系統(tǒng)失效前閃存單元可執(zhí)行的寫(xiě)循環(huán)次數(shù))為代價(jià)的。
通常來(lái)講,SLC的每個(gè)存儲(chǔ)單元里可進(jìn)行約10萬(wàn)次讀寫(xiě)。2-bit MLC每個(gè)單元能接受的讀寫(xiě)次數(shù)只有大約一萬(wàn)次,而到了3-bit MLC就僅剩一千次了。不過(guò)請(qǐng)記住,SSD中能進(jìn)行數(shù)據(jù)寫(xiě)入的邏輯單元塊有上百萬(wàn)個(gè),而且,寫(xiě)入算法一直在發(fā)展,因此寫(xiě)入次數(shù)也在不斷增加。隨著容量,速度,讀寫(xiě)次數(shù)的增加,基于MLC的SSD正在受到企業(yè)界越來(lái)越多的青睞,而且有望成為未來(lái)Tier 0市場(chǎng)的主力軍。不過(guò),SLC技術(shù)仍然是Tier 0應(yīng)用程序中的首選。
在企業(yè)存儲(chǔ)市場(chǎng)中,SSD是如何被使用的呢?通過(guò)希捷公司的Pulsar系列產(chǎn)品,我們可以對(duì)此有個(gè)更清晰的認(rèn)識(shí)。目前有三種Pulsar 產(chǎn)品:Pulsar, Pulsar.2和 Pulsar XT.2。早先的Pulsar 驅(qū)動(dòng)器使用的SLC NAND容量分別有50, 100和200 GB,它們使用的都是3 Gb/s的SATA接口。 Pulsar.2使用MLC,容量從100到800GB不等。接口既可以選擇6 Gb/s SAS 也可以用6 Gb/s SATA,并且希捷還提供了加密功能。對(duì)那些對(duì)數(shù)據(jù)安全要求較高,尤其是法律上對(duì)此有強(qiáng)制性要求的企業(yè)而言,加密功能是非常關(guān)鍵的。加密功能將確保所有寫(xiě)入磁盤(pán)的文件都得到AES的保護(hù),沒(méi)有特定權(quán)限的人都不能進(jìn)入。Pulsar XT.2使用了容量為100, 200和400 GB 的SLC存儲(chǔ)器,接口則只能選用SAS 6 Gb/s,型號(hào)有加密和不加密兩種。
Tier 0目前使用的仍然是SLC SSD,因?yàn)榻灰仔痛鎯?chǔ)系統(tǒng)每秒產(chǎn)生的數(shù)據(jù)請(qǐng)求可能會(huì)多達(dá)幾百,甚至幾千個(gè),因此寫(xiě)入次數(shù)在這一級(jí)至關(guān)重要。這也是為什么盡管SSD性能表現(xiàn)非常高,一些企業(yè)公司在遇到重要應(yīng)用程序時(shí),仍然依賴(lài)硬盤(pán)的原因,因?yàn)橛脖P(pán)是業(yè)界公認(rèn)的MTBF 評(píng)級(jí)標(biāo)準(zhǔn)較高的產(chǎn)品。一般說(shuō)來(lái),同樣花一美元,SSD可實(shí)現(xiàn)的IOPS是企業(yè)硬盤(pán)驅(qū)動(dòng)器的20倍。 HDD大約是它的10倍。用哪個(gè)技術(shù)更好呢?答案不是固定的。不同的公司應(yīng)該根據(jù)自身的需求和特點(diǎn),對(duì)各項(xiàng)技術(shù)的優(yōu)缺點(diǎn)進(jìn)行權(quán)衡之后作出選擇。