我們知道傳統(tǒng)意義上的自動(dòng)接管,需要具備HA雙機(jī)軟件,偵測故障發(fā)生并執(zhí)行切換,通常是在有共享存儲的情況下切換服務(wù)器。這時(shí)存在一個(gè)問題,如果共享的磁盤陣列壞了怎么辦?盡管有許多雙控制器存儲號稱沒有單點(diǎn)故障了,但他們一般最多宣傳99.999%的可用性,也就是依然有宕機(jī)的可能。就像某國外廠商說的,背板故障也不是沒遇到過…
 
火星艙CDP的手動(dòng)接管,是在生產(chǎn)存儲出現(xiàn)設(shè)備故障和數(shù)據(jù)錯(cuò)誤時(shí),將CDP磁盤組掛載到生產(chǎn)服務(wù)器或者備用服務(wù)器,恢復(fù)數(shù)據(jù)庫和/或者應(yīng)用的正常運(yùn)行。那么,有沒有將CDP連續(xù)數(shù)據(jù)保護(hù)與傳統(tǒng)服務(wù)器雙機(jī)結(jié)合使用的方法呢?答案是肯定的。
 
但有些災(zāi)難和故障發(fā)生時(shí),不僅是數(shù)據(jù)錯(cuò)誤或者存儲系統(tǒng)的故障,這時(shí)用戶除了確保數(shù)據(jù)可用之外,還要考慮如何恢復(fù)業(yè)務(wù)。

HA考慮因素:備機(jī)與共享存儲

這里用戶應(yīng)該根據(jù)自己的實(shí)際情況來部署,首先考慮的因素是備機(jī):是選擇物理服務(wù)器、專用的虛擬化容災(zāi)服務(wù)器(外部),還是火星艙內(nèi)置的虛擬機(jī)。

選擇物理服務(wù)器、專用的虛擬化容災(zāi)服務(wù)器其性能和可用性都是最好的,但成本投入也比較大;虛擬化可以做多對一的業(yè)務(wù)接管,設(shè)備的利用效率提高,可能需要購買虛擬化軟件許可;而采用火星艙,不用投入單獨(dú)的設(shè)備,火星艙內(nèi)置虛擬機(jī)會分享火星艙本身的硬件資源,但是性能上會受一定的限制。最重要的是用戶根據(jù)自己的情況來選擇適合自己的場景。
 
另一個(gè)考慮因素,如果做服務(wù)器雙機(jī)HA自動(dòng)接管,是否有共享存儲也是一個(gè)需要考慮的問題。

如果是“雙機(jī)單柜”,在增加了火星艙CDP之后就是“雙機(jī)雙柜”了,當(dāng)故障切換發(fā)生時(shí)備機(jī)第一時(shí)間接替對生產(chǎn)存儲——共享磁盤陣列的訪問,同樣連接兩臺主機(jī)的CDP磁盤組也要切換過去,同時(shí)備用服務(wù)器上安裝的鏡像代理程序要無縫接管寫入拆分的任務(wù),繼續(xù)保持火星艙與生產(chǎn)存儲之間的數(shù)據(jù)同步。

當(dāng)生產(chǎn)服務(wù)器的故障修復(fù)后,火星艙CDP保護(hù)任務(wù),還能隨著兩套存儲的“回切”而一并切回至生產(chǎn)主機(jī)。
 
要是沒有共享存儲呢?如果應(yīng)用數(shù)據(jù)位于生產(chǎn)服務(wù)器內(nèi)置硬盤(通常也做了RAID),服務(wù)器宕機(jī)后上面的數(shù)據(jù)也無法訪問了,此時(shí)服務(wù)器切換的HA軟件會將備用服務(wù)器連接的“共享盤”指向CDP磁盤組,這樣就相當(dāng)于火星艙CDP完成了數(shù)據(jù)同步復(fù)制的工作。

在成本有限、業(yè)務(wù)壓力相對不高的情況下,如果采用火星艙虛擬機(jī)作為備機(jī),CDP+HA方案加上生產(chǎn)服務(wù)器一共只需要兩臺設(shè)備。這時(shí)虛擬機(jī)到CDP磁盤組的連接可在設(shè)備內(nèi)部直接高效實(shí)現(xiàn)。

最后,談?wù)剶?shù)據(jù)塊級同步CDP,在雙機(jī)HA + 數(shù)據(jù)容災(zāi)方案中的優(yōu)勢。

首先,火星艙CDP可以保護(hù)任何塊存儲設(shè)備,也就是操作系統(tǒng)中可以看到的任何磁盤。包括外部連接的FC SAN、iSCSI還是DAS存儲,也可以是服務(wù)器機(jī)箱內(nèi)的單個(gè)硬盤或者RAID卡配置的陣列。對于后者這一點(diǎn),磁盤陣列廠商的同步鏡像/復(fù)制是無法解決的。

其次,對于許多文件級CDP和基于日志的異步復(fù)制方案,通常是定時(shí)傳送變化數(shù)據(jù),或者先臨時(shí)保存在本地暫存區(qū)。這時(shí)一旦生產(chǎn)存儲不可訪問,CDP備用設(shè)備上的數(shù)據(jù)與生產(chǎn)數(shù)據(jù)之間會有一個(gè)差異量。也就是說在切換時(shí)很可能會丟數(shù)據(jù)!

而火星艙則不存在上述的問題,這就是我們在前兩篇文章中曾經(jīng)介紹過的“RPO=0”和“塊級同步保護(hù)”。

分享到

renxinbo

相關(guān)推薦