西瓜哥 發(fā)表于:14年09月19日 00:00 [原創(chuàng)] DOIT.com.cn
存儲(chǔ)在線專欄文章:這兩天忙參加HCC,沒有關(guān)注其他新聞。今天有點(diǎn)時(shí)間,去老地方轉(zhuǎn)了轉(zhuǎn),發(fā)現(xiàn)在Pure Storage領(lǐng)頭的全閃存陣列初創(chuàng)公司的猛烈炮火下,大廠已經(jīng)亂了陣腳,形勢(shì)一片混亂。
首先是前段時(shí)間思科宣布,由于質(zhì)量問題,全閃存陣列Whiptail(收購(gòu)后改名Invicta)暫停出貨。
這兩天,EMC說(shuō)XtremIO的軟件從V2.4升級(jí)到3.0,需要破壞性升級(jí),網(wǎng)上咋開了鍋。
今天,NetApp急忙發(fā)布了一個(gè)半成品FlashRay,只有單控,不支持Scale out,為啥這么猴急?
大廠們,別亂了陣腳啊,Hold!
啥,Hold不住,趕快求助Hold住姐啊。
閃存相關(guān)架構(gòu)太新,對(duì)存儲(chǔ)的架構(gòu)設(shè)計(jì)師是一個(gè)巨大的挑戰(zhàn)?偸堑酱罅渴褂玫臅r(shí)候,發(fā)現(xiàn)原來(lái)的底層設(shè)計(jì)考慮不全面,需要破壞性的升級(jí)。
在分享XtremIO的升級(jí)問題之前,我們先來(lái)看兩個(gè)定義。
NDU:Non-Disruptive Upgrades (非破壞性升級(jí))
DU:Disruptive Upgrades(破壞性升級(jí))
DU一般指影響到業(yè)務(wù)運(yùn)行的升級(jí),最少需要停機(jī),嚴(yán)重的需要數(shù)據(jù)刪除,然后再?gòu)膫浞莼謴?fù)。
因此,針對(duì)關(guān)鍵業(yè)務(wù),NDU是一個(gè)重要特性。也是高端存儲(chǔ)區(qū)別與其他存儲(chǔ)非常關(guān)鍵的特性。
EMC在去年GA XtremIO產(chǎn)品的時(shí)候,承諾系統(tǒng)的可靠性很高。NDU是其承諾的一項(xiàng)(見下圖第3點(diǎn)):
"XtremIO eliminates the need for planned downtime by providing non-disruptive software and firmware upgrades to ensure 7×24 continuous operations."
但是,XtremIO最新發(fā)布的軟件版本XIOS 3.0,居然要求用戶采用DU升級(jí)。因此,用戶憤怒了,競(jìng)爭(zhēng)對(duì)手也幸災(zāi)樂禍。
EMC內(nèi)部人士Virtual Geek在其博客中解釋了為什么需要DU升級(jí)的原因,下面有很多用戶或者競(jìng)爭(zhēng)對(duì)手的反饋,建議存儲(chǔ)的架構(gòu)師好好看看,絕對(duì)漲姿勢(shì)。文章很長(zhǎng),文后有鏈接,西瓜哥簡(jiǎn)單說(shuō)一下概要。
Virtual Geek說(shuō), XtremIO 2.4->3.0的DU升級(jí)其實(shí)不奇怪,業(yè)界經(jīng)常發(fā)生。一般來(lái)說(shuō),存儲(chǔ)軟件的數(shù)據(jù)布局結(jié)構(gòu)層或者元數(shù)據(jù)映射層有一個(gè)發(fā)生改變,就很難保證NDU升級(jí)了。
而XIOS 3.0在這兩個(gè)層面都發(fā)生了變化,在數(shù)據(jù)布局結(jié)構(gòu)層,原來(lái)的重刪塊是4K大小,現(xiàn)在調(diào)整為8K。而在元數(shù)據(jù)映射層,由于引入在線壓縮的功能,因此這層也發(fā)生變化。
重刪的塊從4K調(diào)整到8K,據(jù)說(shuō)是為了減少元數(shù)據(jù)的數(shù)量。大家知道,XtremIO是采用內(nèi)存計(jì)算的方式,元數(shù)據(jù)都在內(nèi)存里,隨著Flash容量越來(lái)越多,元數(shù)據(jù)膨脹太快了。
西瓜哥認(rèn)為,XtremIO才發(fā)布半年,就需要這么傷筋動(dòng)骨的改動(dòng),這些教訓(xùn),希望各位存儲(chǔ)架構(gòu)師要吸取,預(yù)見性要做足一點(diǎn)。
Virtual Geek舉了一些DU升級(jí)的例子:
EMC的CLARiiON和VNX都有過ND升級(jí)的情況,比如Rockies update。
NetApp從ONTAP 7-mode升級(jí)到c-mode。
VMWare從VMFS-3升到VMFS-5。
很多初創(chuàng)公司,宣傳NDU前,其實(shí)已經(jīng)多次DU過了。
一個(gè)中心思想,軟件為了提高性能,增加新功能,動(dòng)了上面的說(shuō)的數(shù)據(jù)布局層和元數(shù)據(jù)映射層,DU就是必須的了。當(dāng)然,可以采用版本向下兼容,但這樣做難度很大。
Virtual Geek也讓大家放心,這種DU升級(jí)不會(huì)很頻繁。從XtremIO這兩年的路標(biāo)來(lái)看,要增加動(dòng)態(tài)scale-out功能(現(xiàn)在做不到動(dòng)態(tài)負(fù)載均衡),遠(yuǎn)程復(fù)制功能,甚至升級(jí)到haswell硬件平臺(tái)和以后的新平臺(tái)都可以保證NDU,不需要DU。
當(dāng)然,用戶可以選擇不升級(jí),但西瓜哥認(rèn)為這個(gè)不現(xiàn)實(shí)。不升級(jí)沒有新功能,而且以后廠商也很難維護(hù)老版本。
如果是VMware環(huán)境,可以考慮用vMotion功能來(lái)規(guī)避業(yè)務(wù)宕機(jī)。
從后面很多反饋來(lái)看,大約有以下觀點(diǎn):
XtremIO的用戶或潛在用戶:很生氣,后果很嚴(yán)重。銷售騙了我們,告訴我們可以NDU的,嗚嗚,其實(shí)已經(jīng)是你們第二次DU了,你賠,你賠......
Pure Storage:我們的架構(gòu)沒有這個(gè)問題,我們GA以來(lái),都可以NDU的
NetApp:我們也沒有這個(gè)問題啊,我們從ONTAP 7.x升級(jí)到8.x都可以NDU的啊。那個(gè)從7-mode升級(jí)到c-mode,那是兩個(gè)平臺(tái)切換好不好,不是版本升級(jí)
......
哎,XtremIO,這個(gè)屁股不好擦啊。
說(shuō)完EMC,我們?cè)賮?lái)看NetApp的FlashRay。
FlashRay的定位以前和大家分享過:
這個(gè)產(chǎn)品已經(jīng)跳票,推遲發(fā)布了。但今天NetApp還是沒有Hold住,發(fā)布了一個(gè)半成品,來(lái)應(yīng)對(duì)Pure Storage等Startup公司的競(jìng)爭(zhēng)。
為啥西瓜哥說(shuō)這是一個(gè)半成品,因?yàn)楝F(xiàn)在只能支持單控,也沒有提供scale-out功能,關(guān)鍵業(yè)務(wù)誰(shuí)敢用。
不過,F(xiàn)lashRay有幾個(gè)特點(diǎn),也應(yīng)該是亮點(diǎn)吧:
支持變長(zhǎng)重刪和壓縮,而且號(hào)稱粒度是byte級(jí)別壓縮
采用cMLC,這是除HP 3PAR外,第二個(gè)大廠采用cMLC
新的OS號(hào)稱從頭設(shè)計(jì),名字叫Mars(火星) OS,又是一個(gè)來(lái)自星星的你。據(jù)說(shuō)底層數(shù)據(jù)保護(hù)還是采用閃存優(yōu)化的RAID-DP。但沒有說(shuō)是否還采用WAFL,這個(gè)NetApp成名的武器。WAFL的原理其實(shí)大家都清楚,最大的特點(diǎn)就是Write Anywhere,也就是磁盤轉(zhuǎn)到哪里就寫到哪里:
但和其他的日記文件系統(tǒng)一樣,當(dāng)容量比較滿的時(shí)候,需要尋找新空間,做類似閃存FTL層類似的垃圾收集工作,性能會(huì)有影響。WAFL經(jīng)過NetApp十幾年的優(yōu)化,在機(jī)械盤時(shí)代無(wú)人能及,成就了NetApp的NAS性能。但在全閃存時(shí)代,WAFL這些針對(duì)機(jī)械硬盤的優(yōu)化,幾乎毫無(wú)價(jià)值,因?yàn)镕lash不在乎你寫是隨機(jī)的還是連續(xù)的(這也許FAS不把閃存作為主存而是只做Cache的原因吧?)。
也許這是Mars OS老跳票的原因吧,確實(shí)需要從頭設(shè)計(jì)。
但目前的FlashRay發(fā)布太倉(cāng)促了吧?會(huì)不會(huì)造成類似EMC的DU問題?
看來(lái),Pure Storage等來(lái)勢(shì)洶洶,大廠們有的Hold不住了。在國(guó)內(nèi)的市場(chǎng)上,西瓜哥也看到有些場(chǎng)合,本來(lái)是傳統(tǒng)高端存儲(chǔ)的地盤,但為了搞差異化,大廠的銷售紛紛用自己的全閃存陣列去替換自家的高端存儲(chǔ),是否相煎太急?
看來(lái),相對(duì)傳統(tǒng)的高端存儲(chǔ)市場(chǎng),全閃存陣列的可靠性還是有不少距離啊。新架構(gòu)必然要經(jīng)歷這個(gè)過程,大家都理解,只是希望宣傳的時(shí)候不要太激進(jìn)。作為用戶,也應(yīng)該冷靜看待新產(chǎn)品的宣傳。記得以前做金融入圍的時(shí)候,大行有一個(gè)入圍原則,這個(gè)架構(gòu)必須是市場(chǎng)使用過3-5年后的架構(gòu),當(dāng)時(shí)就覺得太保守了吧,不給新廠商和新產(chǎn)品機(jī)會(huì),F(xiàn)在西瓜哥似乎比較理解這些原則了。
好,今天隨筆就分享到這里,西瓜哥水平有限,觀點(diǎn)也許比較尖銳,僅代表個(gè)人觀點(diǎn),各位大廠粉絲,歡迎技術(shù)攻擊,人身攻擊的不要。
希望大家積極反饋你的意見和建議,微信掃描如下二維碼,關(guān)注微信公眾號(hào)“高端存儲(chǔ)知識(shí)”,與作者微信互動(dòng)。通過掌上DOIT移動(dòng)客戶端,您可以訂閱西瓜哥專欄,第一時(shí)間獲得知名專家和業(yè)界領(lǐng)袖的深度剖析與趨勢(shì)分析。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.