圖一:Gartner關(guān)于2012年基于閃存的存儲(chǔ)陣列營(yíng)收統(tǒng)計(jì),從圖中可以看出基于閃存的存儲(chǔ)陣列的總市場(chǎng)營(yíng)收約為3.7億美金。全閃存陣列仍然處于一個(gè)發(fā)展初期,整個(gè)市場(chǎng)規(guī)模不大。

 EMC認(rèn)為閃存不僅僅需要解決性能問題,專注在硬件和物理的性能將會(huì)讓閃存置于小眾市場(chǎng),EMC作為全球最大存儲(chǔ)廠商致力于如何用閃存技術(shù)加上軟件主導(dǎo)的架構(gòu),讓用戶能夠使用得起,更加簡(jiǎn)單、敏捷、快速的為下一代虛擬數(shù)據(jù)中心服務(wù)。EMC XtremIO技術(shù)總監(jiān)任宇翔更是直言:XtremIO的大部分知識(shí)產(chǎn)權(quán)專利都集中在軟件領(lǐng)域,XtremIO基于4K數(shù)據(jù)塊內(nèi)容的數(shù)據(jù)安置、雙階元數(shù)據(jù)引擎、XtremIO數(shù)據(jù)保護(hù)(XDP)、共享內(nèi)存中的元數(shù)據(jù)的四大特性使得能夠徹底擺脫傳統(tǒng)陣列的思維方式和架構(gòu)。

在正式推出XtremIO之后,EMC也發(fā)動(dòng)了針對(duì)當(dāng)前全閃存領(lǐng)域熱門廠商ViolinMemory、Purestorage、Solidfire等的攻勢(shì),大膽拋出了產(chǎn)品功能對(duì)比圖并對(duì)競(jìng)爭(zhēng)對(duì)手提出諸多技術(shù)問題,這也引起了整個(gè)全閃存陣列市場(chǎng)的快速響應(yīng)。EMC這種敢于曬干貨的風(fēng)格遠(yuǎn)比動(dòng)不動(dòng)就號(hào)稱要砸10億美金的廠商來的有效。

XtremIO全閃存陣列概況

EMC XtremIO為一款具備橫向擴(kuò)展能力的全閃存陣列,每個(gè)陣列單元稱之為X-Brick。每個(gè)X-Brick單元配置了25個(gè)容量為400Gb的eMLC SSD,因此一個(gè)X-Brick的原始容量為10TB。EMC宣稱由于采用了全新的架構(gòu),每個(gè)X-Brick的可用容量可達(dá)7.5TB,這還是不包含去重優(yōu)化的結(jié)果。

 

圖二:EMC XtremIO全閃存陣列X-Brick模塊外觀圖。每個(gè)X-Brick高度為5U,分別由Storage Controller、DAE、UPS電源組成,每個(gè)控制器為1U雙插槽服務(wù)器,每個(gè)X-Brick配置了4個(gè)8Gb光纖通道端口、4個(gè)10GbiSCSI端口、4個(gè)40Gb Infiniband端口以及2個(gè)1Gb的管理端口。

圖三:XtremIO每個(gè)X-Brick架構(gòu)示意圖,包括兩個(gè)存儲(chǔ)控制器以及24個(gè)eMLC SSD組成。

 

圖四:EMC XtremIO具備橫向擴(kuò)展能力,可擴(kuò)展為四集群化(每個(gè)X-Brick具有兩個(gè)節(jié)點(diǎn),四集群化X-Brick意味著有八個(gè)節(jié)點(diǎn)。),IOPS可達(dá)到百萬(wàn)級(jí),X-Brick之間采用Infiniband交換機(jī)互聯(lián)。

EMC XtremIO 技術(shù)總監(jiān)任宇翔表示,XtremIO已經(jīng)在實(shí)驗(yàn)室環(huán)境中實(shí)現(xiàn)了八個(gè)X-Brick(16個(gè)節(jié)點(diǎn))甚至更大的陣列擴(kuò)展,EMC也會(huì)很快提供8個(gè)X-Brick配置的陣列。“從理論上看,16個(gè)X-Brick和32個(gè)X-Brick并沒有區(qū)別,但是涉及到很多測(cè)試和實(shí)際應(yīng)用場(chǎng)景,即客戶當(dāng)前是否需要這么大的容量和性能。”任宇翔補(bǔ)充道。

根據(jù)EMC介紹,X-Brick具有非破壞性XIOS軟件及硬件升級(jí)、擁有高可靠性的熱插拔升級(jí),且不存在著單點(diǎn)故障。集群化的XtremIO陣列中各個(gè)X-Brick可以擁有不同存儲(chǔ)容量;集成了VMware VAAI、vmware多通道I/O支持,數(shù)據(jù)分卷能夠夸整個(gè)系統(tǒng);所有元數(shù)據(jù)存儲(chǔ)、配置、管理均在內(nèi)存中進(jìn)行,無(wú)需涉及到SSD;擁有豐富的數(shù)據(jù)保護(hù)功能,且已經(jīng)與EMC其他產(chǎn)品開始集成。

EMC XtremIO一經(jīng)推出,其每個(gè)X-Brick都需要配置UPS電源就讓人感到奇怪,并且如果單獨(dú)購(gòu)買一個(gè)X-Brick則需要配置兩個(gè)UPS。對(duì)此,EMC XtremIO解釋道:“目前每個(gè)X-Brick都需要一個(gè)UPS來解決電源問題。為什么一個(gè)X-Brick需要兩個(gè)UPS,是因?yàn)樵趩蝹€(gè)X-Brick情況下,電源也需要配置兩個(gè)UPS備份,防止單個(gè)X-Brick情況下UPS失效。如果用戶購(gòu)買兩個(gè)X-Brick以上,則每個(gè)X-Brick配置一個(gè)UPS即可。至于為什么X-Brick需要UPS,那是因?yàn)閄remIO將所有的元數(shù)據(jù)都存儲(chǔ)在內(nèi)存之中,而且元數(shù)據(jù)的操作都在內(nèi)存中進(jìn)行。因此,一旦有任何硬件和軟件問題,內(nèi)存信息將會(huì)全部丟失,比如數(shù)據(jù)中心掉電的情況,UPS可以保證有足夠的電量將內(nèi)存中的數(shù)據(jù)改變寫入到SSD中。我們也不喜歡UPS這個(gè)解決方案,因?yàn)殡姵胤浅1恐?、占用空間。我們今后會(huì)采用其他辦法,在下一代硬件平臺(tái)上將會(huì)有新技術(shù)來取代UPS。”

“基于內(nèi)容的數(shù)據(jù)安置”打破傳統(tǒng)模式

“基于內(nèi)容的數(shù)據(jù)安置”是指EMC XtremIO全閃存陣列將數(shù)據(jù)分為4KB的散列塊,這些4KB的散列塊完全打散,不按照邏輯地址進(jìn)行排列存儲(chǔ),而是根據(jù)物理位置進(jìn)行安置。EMC XtremIO技術(shù)總監(jiān)任宇翔強(qiáng)調(diào)基于4K數(shù)據(jù)塊內(nèi)容安置是整個(gè)全閃存陣列其他所有軟件功能的基礎(chǔ)。

圖五:EMC XtremIO的基于內(nèi)容的數(shù)據(jù)安置,完全打破了過去基于傳統(tǒng)磁盤的數(shù)據(jù)存儲(chǔ)模式。

其實(shí)XremIO這種基于數(shù)據(jù)打散的陣列技術(shù)以前也有先例,之前類似的3PAR、XIV等陣列都是基于這種策略。不過傳統(tǒng)磁盤陣列的數(shù)據(jù)存儲(chǔ)都是基于邏輯地址,時(shí)間久了之后不可避免的就會(huì)產(chǎn)生磁盤碎片化,從而對(duì)性能產(chǎn)生影響。EMC XtremIO全閃存陣列的策略則是個(gè)將數(shù)據(jù)徹底的打亂,完全碎片化,基于4KB的數(shù)據(jù)塊通過指紋來識(shí)別、存儲(chǔ)、管理等。EMC認(rèn)為這種技術(shù)帶來的直接好處就是線內(nèi)去重化變得非常容易。

圖六:EMC XtremIO基于4KB數(shù)據(jù)塊的數(shù)據(jù)安置,采用了雙階元數(shù)據(jù)引擎,通過兩步的元數(shù)據(jù)映射使得全閃存陣列的線內(nèi)重復(fù)數(shù)據(jù)刪除能夠輕松實(shí)現(xiàn)。

圖七:數(shù)據(jù)通過核心引擎重刪之后,通過40Gb的高速Infiniband內(nèi)部交換網(wǎng)絡(luò)均勻分布到各個(gè)X-Brick之中。

EMC XtremIO技術(shù)總監(jiān)任宇翔表示:“傳統(tǒng)磁盤陣列是按照邏輯地址的次序來存儲(chǔ)在磁盤上,順序操作性能是最佳的,如果傳統(tǒng)磁盤陣列去做線內(nèi)的重復(fù)數(shù)據(jù)閃存操作將會(huì)打破某些操作次序,造成磁盤碎片化,從而使得陣列的性能受損,這是傳統(tǒng)磁盤陣列很難去做線內(nèi)去重的原因。EMC XtremIO則完全不管邏輯地址這種模式,通過基于4K數(shù)據(jù)塊內(nèi)容的數(shù)據(jù)指紋技術(shù),按照指紋來決定4K數(shù)據(jù)放在什么地方,這種徹底碎片化的方式使得線內(nèi)去重實(shí)現(xiàn)非常容易。如果相同的4K數(shù)據(jù)塊則只用寫入一個(gè)地址即可,當(dāng)去重化成為一個(gè)內(nèi)在功能而不是疊加功能之時(shí),去重化比例越高、寫操作性能就會(huì)越好,因?yàn)橹恍枰谶h(yuǎn)數(shù)據(jù)設(shè)置好指針就可以。”

據(jù)悉,EMC XtremIO基于4K數(shù)據(jù)塊的指紋技術(shù)是采用的哈希算法。EMC表示通過利用好哈希算法將會(huì)保證數(shù)據(jù)一定完全均衡分布在所有結(jié)構(gòu)的節(jié)點(diǎn)中。

“XtremIO采用的雙階元數(shù)據(jù)引擎,第一步元數(shù)據(jù)映射是邏輯地址到指紋映射;第二部是指紋映射到內(nèi)部的物理地址。一旦做完兩步的雙階元數(shù)據(jù)之后,就增加了系統(tǒng)內(nèi)部的靈活性,XtremIO可以根據(jù)指紋來映射到內(nèi)部具體哪個(gè)物理地址。傳統(tǒng)的RAID有很大的寫放大,即后端的寫擦做和前端寫操作的比例,RAID5和RAID6都會(huì)寫操作都會(huì)放大很多,對(duì)傳統(tǒng)陣列而言將會(huì)是性能損耗,對(duì)全閃存陣列而言將會(huì)是閃存壽命的損耗,XtremIO這種方式則將傳統(tǒng)的RAID的寫放大給大幅降低了。”任宇翔補(bǔ)充道。

圖八:XtremIO的數(shù)據(jù)保護(hù)機(jī)制XDP,通過雙階數(shù)據(jù)引擎避免了RAID5、RAID6的寫放大外,達(dá)到了RAID6的保護(hù)效果。

圖九:EMC XtremIO XDP原理。

EMC XtremIO技術(shù)總監(jiān)任宇翔表示:“XDP首先是雙備份,和RAID6一樣讓XtreamIO陣列同事有兩塊閃存盤,如果出錯(cuò)可以糾錯(cuò),不會(huì)造成數(shù)據(jù)丟失。同事,還避免了傳統(tǒng)RAID的寫放大發(fā)生。”

共享內(nèi)存元數(shù)據(jù)—XtremIO高速運(yùn)行的秘密

就如前文所述,EMC XtremIO將元數(shù)據(jù)的存儲(chǔ)、管理與操作全部轉(zhuǎn)移到內(nèi)存層進(jìn)行操作。通過這種將元數(shù)據(jù)存儲(chǔ)在內(nèi)存之中的方式,共享式元數(shù)據(jù)將不再寫入到SSD之中;從而降低了閃存的各種寫操作,延長(zhǎng)使用壽命。共享內(nèi)存元數(shù)據(jù)的方式也使得很多軟件功能在內(nèi)存層即可完成。

EMC XtremIO 技術(shù)總監(jiān)任宇翔表示:“共享內(nèi)存元數(shù)據(jù)使得很多功能通過操作元數(shù)據(jù)即可完成。比如拷貝功能,虛擬機(jī)模板拷貝到成百上千個(gè)虛擬機(jī)中,傳統(tǒng)磁盤方式只能依靠讀寫所有的數(shù)據(jù)塊,非常耗時(shí)間、耗IO的操作。而XtreamIO的拷貝操作完全在內(nèi)存中,以元數(shù)據(jù)操作的方式去解決,速度就會(huì)非常之快。”

 

圖十:EMC XtremIO SnapShot快照通過元數(shù)據(jù)可以讓處理速度更快。

通過在內(nèi)存層面的元數(shù)據(jù)操作,像虛擬機(jī)克隆、拷貝;數(shù)據(jù)庫(kù)克隆;快照處理等功能都將大幅提升處理速度。當(dāng)然,這種處理方式也充滿爭(zhēng)議。Greenbyte前CEO Steve O’Donnell就表示:“EMC將垃圾碎片回收機(jī)制從SSD中徹底取消,這樣將無(wú)法對(duì)被鎖定的NAND進(jìn)行控制,無(wú)法在系統(tǒng)控制器層面加以適當(dāng)管理。”同時(shí),Steve O’Donnell也指出采用X86服務(wù)器充當(dāng)控制器可能存在隱患,他表示:“雖然將元數(shù)據(jù)放入內(nèi)存之中能夠讓陣列擁有極高的運(yùn)行速度,但是控制器的主板是出了名的不可靠。”這也許能夠解釋為什么X-Brick需要配置UPS電源的原因。

XtremIO:這一年在整合

EMC收購(gòu)XtremIO之后,并沒有著急正式推出新產(chǎn)品,而是在各方面進(jìn)行了整合與集成。根據(jù)任宇翔介紹,XtremIO利用了EMC提供最好的硬件平臺(tái)和全球供應(yīng)鏈,從而保證了XtremIO陣列的數(shù)量和質(zhì)量。此外,XtremIO在產(chǎn)品與技術(shù)層面也進(jìn)行了深度的整合,包括與VMware、VCE集成系統(tǒng)、VPlex、PowerPath、EMC遠(yuǎn)程安全支持等。

EMC XtremIO 技術(shù)總監(jiān)任宇翔表示:“目前XtremIO已經(jīng)有超過100多個(gè)用戶,分布在北美、歐洲以及中東等地區(qū),大部分公司都是財(cái)富五百?gòu)?qiáng)的公司,包括全球知名的保險(xiǎn)公司、汽車制造商、軟件商、制藥公司等。”

隨著閃存特別是全閃存在數(shù)據(jù)中心逐漸開始流行,基于整個(gè)數(shù)據(jù)中心的分層策略無(wú)疑將會(huì)成為用戶考慮的要素。任宇翔表示:“目前XtremIO第一代產(chǎn)品還不是EMC分層存儲(chǔ)的一部分,未來XtreamIO將會(huì)成為EMC分層存儲(chǔ)戰(zhàn)略的一部分。XtremIO是全閃存陣列,某個(gè)角度是為解決一系列特殊問題而設(shè)計(jì)的,在這些問題有個(gè)共同點(diǎn)就是客戶分不清哪些數(shù)據(jù)是熱的,哪些數(shù)據(jù)是冷的。分層存儲(chǔ)一個(gè)很重要的前提就是客戶需要了解數(shù)據(jù)的冷熱,如果90%的數(shù)據(jù)是熱的那就是徹底的完全隨機(jī)讀寫環(huán)境和場(chǎng)景,在這種情況下傳統(tǒng)分層存儲(chǔ)很難解決性能問題。很多客戶告訴我們,他們的應(yīng)用場(chǎng)景分不清楚冷熱數(shù)據(jù),但是會(huì)覺得這些應(yīng)用場(chǎng)景往往是對(duì)IO要求最高的應(yīng)用,今后的趨勢(shì)是這種應(yīng)用場(chǎng)景的比例會(huì)越來越多。短則三五年,長(zhǎng)則十到半年,所有數(shù)據(jù)中心的存儲(chǔ)都會(huì)變成閃存,即全閃存數(shù)據(jù)中心。”

同時(shí),任宇翔還駁斥了閃存內(nèi)部需要進(jìn)行分層的做法。他表示:“選擇SLC和MLC之間進(jìn)行分層是因?yàn)樵诩軜?gòu)上存在問題,一些寫操作不能放到MLC上,如果把這些寫操作放到MLC上,將會(huì)很快使MLC消耗殆盡。如果架構(gòu)上領(lǐng)先,則可以全部采用MLC,因?yàn)镸LC價(jià)格低、密度大,沒理由不用。”

圖十一:EMC已經(jīng)推出了集成XtremIO全閃存陣列版本的VCE產(chǎn)品。

總結(jié):EMC XtremIO一經(jīng)推出,即獲得了大量關(guān)注與爭(zhēng)議,雖然第一代產(chǎn)品并不完美,但是XtreamIO在軟件和架構(gòu)層面上的創(chuàng)新,使得XremIO在全閃存陣列領(lǐng)域樹立了新的標(biāo)桿。毫無(wú)疑問,隨著EMC正式加入到全閃存陣列市場(chǎng)的戰(zhàn)團(tuán),未來全閃存陣列市場(chǎng)的競(jìng)爭(zhēng)無(wú)疑會(huì)愈演愈烈

分享到

shaolong

相關(guān)推薦