更麻煩的是,這些數據中有很多都是多余的。以你自己的設備為例。 你可以將一個文件的多個不同版本都保存起來,每一個文件都有少許不同,不同版本的文件儲存在不同的地方。當你將這個數量與你所在組織中的電腦數量相乘,你就會發(fā)現備份它們占用了大量的存儲空間和網絡帶寬。


      通過消除多余數據并確保數據歸檔盡可能地精簡,你就可以將更多的數據保持更長的時間在線,而且成本也大大降低。雖然壓縮技術有助于將數據量減少一半左右,但是它還不足以有效管理數據的爆炸增長問題。 只有重復數據刪除技術可以做到這一點,它可以優(yōu)化成本效率和存儲環(huán)境的性能。正確使用重復數據刪除可以提高數據存儲的成本效率、性能和可縮放性。


      如果你正在考慮使用重復數據刪除技術,你也許就能將更多數據在網絡上保持更長的時間,同時也不用增加存儲的占地面積。為了讓大多數人明白實行重復數據刪除戰(zhàn)略決策的意義,需要解決下面這些問題:


      它在現有備份環(huán)境中將如何工作?


      有些重復數據刪除技術要求你完全改變你備份的方式。其他一些重復數據刪除技術也會調整備份軟件中的步驟和進程。 消除重復數據和改善備份質量的最簡單、破壞性最小的方法是與虛擬磁帶庫(VTL)整合。 模仿你現有環(huán)境的VTL系統是并入你現有基礎結構的最簡單的方法。另外,帶有重復數據刪除功能的VTL系統還非常便于進行磁盤備份/恢復,而且集中于重復數據最大的來源:備份。


      重復數據刪除什么時候可以發(fā)生? 這將如何影響備份性能?


      你應該考慮什么時候進行與備份進程有關的重復數據刪除。有些解決方案是在數據進行備份的同時進行重復數據刪除。 然而,今后這種方法會使備份性能降低60%,對備份系統構成嚴重影響。那些在備份工作完成之后再進行重復數據刪除的解決方案可以解決這個問題,不會對備份性能構成任何影響。


      一款重復數據刪除解決方案應該不僅限于數據中心。它應該可以等效應用于分部辦公室,并能夠進行跨站全局式重復數據刪除以降低成本、理順管理任務以及將統一和災難恢復所需的帶寬減少到最低。


      因此,一個理想的重復數據刪除策略應該包括復制和多級重復數據刪除,只要最小的帶寬就可以判定那些遠程數據是否存在在中央存儲上。只有唯一保存在各處辦公室的數據才應該被復制到中央存儲和災難恢復存儲上。


      我們的重復數據刪除解決方案在規(guī)模上是否與我們的組織相匹配?


      由于重復數據刪除一般被用于長期數據存儲,因此從容量和性能上來說,其可縮放性就成了一個重要因素。一款重復數據刪除解決方案應該具備一個經濟結構,不管是從最初的執(zhí)行還是系統長期增長上來說,它的大小都應該是合適的。 例如,如下圖所示,這個群集的解決方案可以隨需求進行調整,滿足容量增長的需求,同時也不會降低重復數據刪除的效率和系統的性能。



重復數據刪除的“流程”



   
      考慮5年以上的增長預期情況。你希望保持有多少數據在線以便進行快速存取? 解決方案的性能和容量是否都可以進行調整以滿足你的長期需求?


      我們可以預計什么類型的重復數據刪除比率?


      你也許已經聽說過50:1或者更高的重復數據刪除比率。 沒有哪個比率是對的或者錯的。它取決于實際情況的需求。


      重復數據刪除比率實際上取決于若干變量,但是從根本上來說是取決于數據的固有特征和保護數據所用的政策。這是目前影響重復數據刪除比率的最重要的因素。 數據存儲空間越大,重復數據刪除所需的時間就越長,重復數據刪除比率就越大。


      我們的數據存儲安全性如何?


      由于完成了重復數據刪除操作的存儲包括了更廣泛的原始數據,因此這個解決方案應該能夠保護那些數據。理想的重復數據刪除解決方案應該包括數據鏡像以免局部存儲出錯。 這款解決方案還應具備failover功能以免出現節(jié)點故障。即便一個群集中發(fā)生多個節(jié)點故障,貴公司也應該能夠繼續(xù)恢復數據并確保數據的全天24小時可用和業(yè)務的正常運行。


      結論


      由于商業(yè)應用需求和監(jiān)管法規(guī)要求,存儲數據量越來越大,重復數據刪除技術已經成為一項重要的技術。 通過了解重復數據刪除技術,你就可以逐步采用這種技術并顯著降低存儲需求和數據保護的成本,讓你的公司盡快進入所謂的“備份天堂”。

分享到

多易

相關推薦