方案特點(diǎn)
1.零業(yè)務(wù)中斷:數(shù)據(jù)并行讀寫冗余盤陣,Raid組故障、盤陣故障探測(cè)、切換完全由藍(lán)鯨集群文件系統(tǒng)BWFS的盤陣冗余模塊依靠BWmirror技術(shù)來(lái)控制和實(shí)現(xiàn),保證客戶端應(yīng)用程序數(shù)據(jù)讀寫在盤陣整體故障的情況下仍能持續(xù)進(jìn)行,從而保障用戶業(yè)務(wù)不因盤陣整體故障出現(xiàn)任何中斷,最大可能保證業(yè)務(wù)連續(xù)性。
2.零數(shù)據(jù)丟失:有別于文件復(fù)制方案存儲(chǔ)存在數(shù)據(jù)同步周期,BWFS的盤陣冗余功能能夠保證寫入冗余盤陣的數(shù)據(jù)實(shí)時(shí)同步,在一個(gè)盤陣出現(xiàn)整體故障后,其冗余盤陣中仍然保存有完整的數(shù)據(jù)鏡像,所以數(shù)據(jù)沒有任何丟失,最大可能保證數(shù)據(jù)安全性。
3.對(duì)應(yīng)用程序完全透明:盤陣冗余功能在BWFS內(nèi)部實(shí)現(xiàn),所以可以做到對(duì)外接口仍然使用標(biāo)準(zhǔn)的文件系統(tǒng)接口,應(yīng)用程序仍然像訪問(wèn)普通的NFS、CIFS一樣來(lái)訪問(wèn)配置成盤陣冗余的BWFS,不需要做任何修改,最大可能保證應(yīng)用兼容性。
4.兼容第三方存儲(chǔ)設(shè)備:BWFS盤陣冗余功能可以支持所有標(biāo)準(zhǔn)的FC SAN和IP SAN設(shè)備,功能的實(shí)現(xiàn)不依賴于具體的盤陣品牌和型號(hào),最大可能節(jié)約方案成本。
應(yīng)對(duì)盤陣整體故障現(xiàn)有方案的不足
目前應(yīng)對(duì)盤陣整體故障的問(wèn)題,主要采用的方案是主備系統(tǒng)進(jìn)行文件復(fù)制,即采用備用的光纖盤陣搭建一套備份文件系統(tǒng),通過(guò)備份服務(wù)器將文件定期從主文件系統(tǒng)復(fù)制到備份文件系統(tǒng)中。當(dāng)主盤陣出現(xiàn)故障主文件系統(tǒng)不能訪問(wèn)時(shí),客戶端掛載起備份文件系統(tǒng),應(yīng)用程序切換到備份文件系統(tǒng)繼續(xù)工作。這種基于文件復(fù)制的方案,解決了盤陣整體故障后數(shù)據(jù)徹底丟失不能訪問(wèn)的問(wèn)題,但從應(yīng)用容災(zāi)的角度看主要存在以下幾方面的嚴(yán)重問(wèn)題:
1)業(yè)務(wù)中斷:文件復(fù)制方案中,盤陣故障導(dǎo)致的讀寫出錯(cuò),以及后續(xù)的文件系統(tǒng)切換工作對(duì)應(yīng)用不透明。在主盤陣出現(xiàn)故障不能訪問(wèn)后,主文件系統(tǒng)會(huì)對(duì)正在進(jìn)行讀寫的前端應(yīng)用程序返回IO Error,從而導(dǎo)致這些程序報(bào)錯(cuò)退出,文件讀寫和相關(guān)業(yè)務(wù)必然中斷,造成整體事故。
2)數(shù)據(jù)丟失:文件復(fù)制方案,因?yàn)橛袕?fù)制周期的存在,所以出現(xiàn)主盤陣故障后,從上次復(fù)制完后新編輯、添加、修改文件都未被復(fù)制到備份盤陣中,導(dǎo)致切換到備份盤陣后數(shù)據(jù)丟失。由于丟失的都是新近修改的文件,所以這很大程度上意味著會(huì)丟失最緊要的工作成果。
3)業(yè)務(wù)恢復(fù)時(shí)間長(zhǎng):主要是由于文件復(fù)制方案的業(yè)務(wù)恢復(fù)過(guò)程復(fù)雜和數(shù)據(jù)不一致這兩方面的因素導(dǎo)致。對(duì)于文件復(fù)制方案,業(yè)務(wù)恢復(fù)過(guò)程是:第一步:確認(rèn)盤陣整體故障;第二步:修改客戶機(jī)上應(yīng)用程序的數(shù)據(jù)磁盤設(shè)置,從主文件系統(tǒng)盤符切換到備份文件系統(tǒng)盤符,然后重新運(yùn)行程序。這個(gè)步驟中,很可能需要重啟客戶機(jī)。對(duì)于大型文件存儲(chǔ)網(wǎng)絡(luò),有幾十甚至上百臺(tái)客戶端,這種修改過(guò)程非常耗時(shí)。第三步:確認(rèn)因?yàn)榍袚Q盤陣/文件系統(tǒng)丟失的數(shù)據(jù)造成的影響。最近一個(gè)復(fù)制周期內(nèi)的所有工作都會(huì)丟失,至少需要花費(fèi)同樣的工作量才能恢復(fù)到業(yè)務(wù)中斷時(shí)刻的狀態(tài)。而且由于文件復(fù)制方案不能嚴(yán)格保證主備系統(tǒng)的數(shù)據(jù)一致性,所以可能會(huì)出現(xiàn)一些文件徹底損壞這種更嚴(yán)重的狀況。通常,對(duì)于一個(gè)大型文件共享存儲(chǔ)網(wǎng)絡(luò),文件復(fù)制方案在盤陣故障發(fā)生后,最好的情況也需要數(shù)小時(shí)才能恢復(fù)到故障發(fā)生時(shí)的狀態(tài)。
總之,傳統(tǒng)的文件復(fù)制方案難以滿足廣電等行業(yè)高標(biāo)準(zhǔn)盤陣容災(zāi)的要求,是一個(gè)“有甚于無(wú)”的方案。中科藍(lán)鯨文件級(jí)盤陣實(shí)時(shí)容災(zāi)存儲(chǔ)方案的出現(xiàn),徹底解決了這一問(wèn)題。
文件級(jí)盤陣實(shí)時(shí)容災(zāi)方案與其他方案對(duì)比的優(yōu)勢(shì)
1.與傳統(tǒng)基于文件復(fù)制的方案相比:
a)對(duì)應(yīng)用完全透明,客戶端只有單一盤符,故障發(fā)生后不需要顯示在客戶端切換盤符;
b)盤陣無(wú)縫切換,不需人工干預(yù),業(yè)務(wù)沒有中斷;
c)盤陣間數(shù)據(jù)實(shí)時(shí)同步,沒有文件復(fù)制窗口,沒有任何數(shù)據(jù)丟失;
2.與基于應(yīng)用復(fù)制的方案相比:
a)基于應(yīng)用的復(fù)制需要應(yīng)用自己實(shí)現(xiàn),難度大,成本高;
b)基于應(yīng)用的復(fù)制方案沒有辦法修改文件系統(tǒng),難以處理諸如緩存一致性的問(wèn)題;
3.與基于盤陣的復(fù)制方案相比:
a)盤陣復(fù)制是在設(shè)備底層服務(wù),需要配置高端盤陣,并且盤陣型號(hào)必須一致,成本非常高;
b)在文件系統(tǒng)下層,所以在切換之前備用盤陣都不能使用,也無(wú)法確認(rèn)文件是否一致;
中科藍(lán)鯨將在今年的BIRTV展上現(xiàn)場(chǎng)展示本文所述的文件級(jí)盤陣實(shí)時(shí)容災(zāi)存儲(chǔ)方案。
也歡迎各位屆時(shí)光臨國(guó)際展覽中心6號(hào)館6038指導(dǎo)與交流。