糾刪碼:確保RAID失效后的存儲耐用性
IT168 發(fā)表于:11年08月19日 09:15 [轉(zhuǎn)載] IT168
然后這些糾刪碼碼塊分布在存儲系統(tǒng)中的各個驅(qū)動器上,這樣即使一個或多個硬盤發(fā)生故障,存儲系統(tǒng)也能夠重新恢復損壞數(shù)據(jù)。
更為重要的是,我們不僅需要注意數(shù)據(jù)的有效性,還要注意底層的存儲效率,F(xiàn)在有一些適用于存儲系統(tǒng)的糾刪碼碼技術(shù)產(chǎn)品,也有一些較新的衍生版,如噴泉碼、颶風碼或在線糾刪碼。
每一種在應對多組件故障、不可恢復的讀取錯誤和損壞的數(shù)據(jù)保護方面都具有獨特的優(yōu)點,大多數(shù)軟件在系統(tǒng)元件故障時,還提供數(shù)據(jù)自動修復功能。這些系統(tǒng)還能夠提供非常高等級的存儲數(shù)據(jù)可用性,這就意味著其可大大降低每年的數(shù)據(jù)丟失率。
在目前的云存儲環(huán)境中有一個共同的數(shù)據(jù)保護機制,即保持文件的多個副本(注:例如目前流行的“三副本云服務”)。云能夠提供高等級的存儲可用性,但這也將花費三倍的潛在資源和運營成本(硬盤、電能、散熱、占地面積和成本支出)。
如果是300MB,就無需考慮這個問題了。當100PB有效空間需要300PB未使用空間來確保可用性的時候,它可能會變成一個限制因素。投入成本事實上要比RAID-6高(用200%的存儲經(jīng)費做三個備份 VS 用150%的經(jīng)費使用RAID-6)
有了糾刪碼技術(shù),就可以實現(xiàn)相對低成本下的高等級存儲可用性了。在安裝啟動模式中,保護數(shù)據(jù)在16磁盤4次故障的情況下可用需要經(jīng)費的60%。也就是說,每PB的有效空間需要1.6PB的未使用空間。
和其他方法相比,它可以有效地節(jié)省運行成本。使用了糾刪碼的存儲系統(tǒng)因此有機會以更經(jīng)濟的方式將數(shù)據(jù)存儲到高密度磁盤驅(qū)動器上,并保證數(shù)據(jù)的可靠性和持久性 。
Amplidata成立2008年,由當時一個存儲領域退休人員組成的團隊開始這項技術(shù)的研發(fā),后來基于該項技術(shù)建立了AmpliStor—— 一個旨在解決散亂數(shù)據(jù)存儲問題的優(yōu)化目標存儲系統(tǒng)。該技術(shù)的核心是以最低的成本提供最高的存儲可靠性和可讀取水平。AmpliStor可以擴展到P字節(jié),和傳統(tǒng)方法相比,保護數(shù)據(jù)所需的存儲容量要低50-70%。