鵬云網(wǎng)絡(luò)創(chuàng)始人陳靚博士

原AWS核心架構(gòu)師、S3、Glacier存儲項目團(tuán)隊負(fù)責(zé)人,華裔科學(xué)家陳靚先生表示:傳統(tǒng)企業(yè)應(yīng)用上云,在存儲方面需要解決:

1)可用性與可靠性,這是用戶最為關(guān)心的問題,當(dāng)節(jié)點(diǎn)或磁盤故障時,業(yè)務(wù)不停,數(shù)據(jù)不丟是必須的。但限于crush機(jī)制,Ceph系統(tǒng)在節(jié)點(diǎn)當(dāng)機(jī)時會造成IO中斷,前端業(yè)務(wù)會受到一定影響。

2)性能。Ceph基于對象存儲,IO延遲長,而傳統(tǒng)業(yè)務(wù)系統(tǒng)對IO延遲比較敏感。

3)應(yīng)提供豐富的企業(yè)級存儲服務(wù)功能,例如,快照/克隆技術(shù)提供快速數(shù)據(jù)恢復(fù)、以及多用途數(shù)據(jù)副本等能力;在線遷移能夠根據(jù)實際需求為業(yè)務(wù)系統(tǒng)調(diào)整存儲資源配置;QoS功能在多業(yè)務(wù)系統(tǒng)復(fù)雜環(huán)境下充分保證關(guān)鍵業(yè)務(wù)系統(tǒng)的存儲性能供給。

以上這些問題,用戶都可以在產(chǎn)品測試過程中進(jìn)行實際的驗證和考察,眼見為實。

ZettaStor和原生塊存儲

作為原AWS核心架構(gòu)師、S3、Glacier存儲項目團(tuán)隊負(fù)責(zé)人,陳靚先生非常了解對象存儲應(yīng)對塊數(shù)據(jù)需求的不足。

機(jī)緣巧合,2012年,陳靚應(yīng)南京市政府的感召歸國創(chuàng)業(yè),創(chuàng)辦了南京鵬云網(wǎng)絡(luò)科技有限公司,并推出了從最底層開始研發(fā)的ZettaStor DBS軟件定義分布式存儲系統(tǒng),提出了原生塊存儲的概念。

它是以裸設(shè)備方式直接管理底層硬盤,并整合成為塊存儲資源供上層應(yīng)用來訪問使用,由于并不存在對象存儲的中間轉(zhuǎn)換過程,因此能夠?qū)崿F(xiàn)低延遲的高I/O訪問效率。

考慮到傳統(tǒng)企業(yè)級應(yīng)用對于功能的需求,ZettaStor DBS還提供了自動精簡配置、快照/克隆、分級存儲、數(shù)據(jù)復(fù)制和遷移、SSD緩存加速、QoS管理、訪問控制、多路徑冗余等完整的功能。ZettaStor DBS所具有的機(jī)房多級容災(zāi)、故障域隔離、雙活容災(zāi)解決方案可以很好滿足企業(yè)級用戶業(yè)務(wù)的需求。

ZettaStor DBS以標(biāo)準(zhǔn)的iSCSI/SCSI協(xié)議和私有的LBD協(xié)議對外提供存儲服務(wù),并可以通過對接Cinder API、標(biāo)準(zhǔn)REST接口,可以為OpenStack等云計算管理平臺的統(tǒng)一管理提供技術(shù)支持!

ZettaStor DBS產(chǎn)品架構(gòu)圖

測試中的 “貓膩”

談到原生塊存儲,陳靚表示:其實概念并不重要。在擔(dān)任AWS核心架構(gòu)師期間,其內(nèi)部很少談?wù)摳拍睿嗍菍W⒃谝鉀Q哪些技術(shù)問題。用戶應(yīng)該更加專注需要解決的問題,而不應(yīng)該盲從于概念、標(biāo)準(zhǔn)或者趨勢。其實,關(guān)注問題不同,著眼點(diǎn)也不同。

對于原生塊存儲、非原生塊存儲,測試和驗證將是一個非常重要的方法。但是在測試過程中,也應(yīng)該結(jié)合實際,謹(jǐn)防被一些“貓膩”手段所蒙蔽。

以可靠性測試為例,重點(diǎn)要考察的是:當(dāng)集群中磁盤或節(jié)點(diǎn)發(fā)生故障時,數(shù)據(jù)會不會丟失?業(yè)務(wù)會不會中斷?中斷的時長是多少?

很多SDS的容錯域都是提前配置好的。以3副本9個節(jié)點(diǎn)為例,通常會配置3個容錯域A\B\C、每個容錯域各3個節(jié)點(diǎn),每個容錯域保存獨(dú)立的副本數(shù)據(jù)。例如當(dāng)以一個容錯域A的3臺機(jī)器都故障時,還有兩2個副本存在,數(shù)據(jù)不會丟失,業(yè)務(wù)照常運(yùn)行,這就是通常所說的能容忍1/3節(jié)點(diǎn)宕機(jī)。這樣的要求大多數(shù)廠家都能做到,但如果同時B域或者C域也有機(jī)器down機(jī)呢?

這就是測試中,用戶需要仔細(xì)考察和驗證的。

再以性能測試為例,SSD緩存對性能測試有很大的影響,特別在小數(shù)據(jù)量時,看不出來系統(tǒng)的差異,但在實際中,當(dāng)數(shù)據(jù)量、負(fù)載加大,SSD存在被穿透的可能,這時數(shù)據(jù)就需要落盤(寫到硬盤),這個時候良莠不齊,高低立判。這就是為什么很多以ceph為基礎(chǔ)二次開發(fā)的系統(tǒng)把SSD緩存做為標(biāo)配的原因,因為一旦沒有SSD加速性能會變得很差。

當(dāng)系統(tǒng)發(fā)生磁盤/節(jié)點(diǎn)故障,恢復(fù)數(shù)據(jù)是否會影響系統(tǒng)性能表現(xiàn)。以Ceph為例,其元數(shù)據(jù)管理和尋址采用的是Crush算法,在節(jié)點(diǎn)動蕩時,元數(shù)據(jù)(其實是ceph內(nèi)部保存的資源列表)發(fā)生變化,會導(dǎo)致大量的沒有必要的數(shù)據(jù)遷移,不僅導(dǎo)致網(wǎng)絡(luò)帶寬擁擠,嚴(yán)重時會導(dǎo)致業(yè)務(wù)系統(tǒng)訪問受影響。

小結(jié)

傳統(tǒng)企業(yè)沒有辦法和互聯(lián)網(wǎng)企業(yè)相比,無論IT管理模式,技術(shù)水平,還是發(fā)展階段,二者完全不同。所謂橘生淮南則為橘,生于淮北則為枳,無論對于互聯(lián)網(wǎng)企業(yè)、云計算服務(wù)商,還是對于傳統(tǒng)企業(yè)用戶,服務(wù)的對象,面臨場景不同,其選擇也就不同,切不可為商業(yè)化的宣傳所誤導(dǎo)!

分享到

songjy

相關(guān)推薦