數(shù)據遷移是數(shù)據系統(tǒng)整合中保證系統(tǒng)平滑升級和更新的關鍵部分。在信息化建設過程中,隨著技術的發(fā)展,原有的信息系統(tǒng)不斷被功能更強大的新系統(tǒng)所取代。從兩層結構到三層結構,從Client/Server 到Browser/Server。在新舊系統(tǒng)的切換過程中,必然要面臨一個數(shù)據遷移的問題。

    6.1 數(shù)據遷移的概念

    原有的舊系統(tǒng)從啟用到被新系統(tǒng)取代,在其使用期間往往積累了大量珍貴的歷史數(shù)據,其中許多歷史數(shù)據都是新系統(tǒng)順利啟用所必須的。另外,這些歷史數(shù)據也是進行決策分析的重要依據。數(shù)據遷移,就是將這些歷史數(shù)據進行清洗、轉換,并裝載到新系統(tǒng)中的過程。數(shù)據遷移主要適用于一套舊系統(tǒng)切換到另一套新系統(tǒng),或多套舊系統(tǒng)切換到同一套新系統(tǒng)時,需要將舊系統(tǒng)中的歷史數(shù)據轉換到新系統(tǒng)中的情況。銀行、電信、稅務、工商、保險以及銷售等領域發(fā)生系統(tǒng)切換時,一般都需要進行數(shù)據遷移。對于多對一的情況,例如由于信息化建設的先后,造成有多個不同的系統(tǒng)同時運行,但相互間不能做到有效信息共享,所以就需要一套新系統(tǒng)包容幾套舊系統(tǒng)的問題。

    數(shù)據遷移對系統(tǒng)切換乃至新系統(tǒng)的運行有著十分重要的意義。數(shù)據遷移的質量不光是新系統(tǒng)成功上線的重要前提,同時也是新系統(tǒng)今后穩(wěn)定運行的有力保障。如果數(shù)據遷移失敗,新系統(tǒng)將不能正常啟用;如果數(shù)據遷移的質量較差,沒能屏蔽全部的垃圾數(shù)據,對新系統(tǒng)將會造成很大的隱患,新系統(tǒng)一旦訪問這些垃圾數(shù)據,可能會由這些垃圾數(shù)據產生新的錯誤數(shù)據,嚴重時還會導致系統(tǒng)異常。

    相反,成功的數(shù)據遷移可以有效地保障新系統(tǒng)的順利運行,能夠繼承珍貴的歷史數(shù)據。因為無論對于一個公司還是一個部門,歷史數(shù)據無疑都是十分珍貴的一種資源。例如公司的客戶信息、銀行的存款記錄、稅務部門的納稅資料等。

    6.2 數(shù)據遷移的特點

    系統(tǒng)切換時的數(shù)據遷移不同于從生產系統(tǒng)OLTP (On-line Transaction Processing),到數(shù)據倉庫DW(Data Warehouse)的數(shù)據抽取。后者主要將生產系統(tǒng)在上次抽取后所發(fā)生的數(shù)據變化同步到數(shù)據倉庫,這種同步在每個抽取周期都進行,一般以天為單位。而數(shù)據遷移是將需要的歷史數(shù)據一次或幾次轉換到新的生產系統(tǒng),其最主要的特點是需要在短時間內完成大批量數(shù)據的抽取、清洗和裝載。

    數(shù)據遷移的內容是整個數(shù)據遷移的基礎,需要從信息系統(tǒng)規(guī)劃的角度統(tǒng)一考慮。劃分內容時,可以從橫向的時間和縱向的模塊兩個角度去考慮。

    橫向劃分

    以產生數(shù)據的時間為劃分依據,需要考慮比較久遠的歷史數(shù)據如何遷移的問題。由于信息技術的發(fā)展,以及存儲工程師對計算機依賴性的增強,新系統(tǒng)每天往往需要比舊系統(tǒng)存儲更多的信息,同時為了解決數(shù)據量高增長帶來的性能瓶頸,新系統(tǒng)一般只保留一定時期的數(shù)據,比如1 年,而把超過保存周期的數(shù)據,即1 年以前的數(shù)據轉移到數(shù)據倉庫中,以便用于決策分析。對于這種新系統(tǒng)的數(shù)據遷移,主要遷移1 年以內的數(shù)據,1 年以前的歷史數(shù)據需要另外考慮。

    縱向劃分

    以處理數(shù)據的功能模塊為劃分依據,需要考慮在新系統(tǒng)中沒有被包含的功能模塊,其所涉及數(shù)據的處理問題。這類數(shù)據由于無法建立映射關系,一般不需要遷移到新系統(tǒng)中。但對于模塊間偶合度比較緊密的舊系統(tǒng),在縱向劃分時需要注意數(shù)據的完整性。

分享到

多易

相關推薦