張亦 馮麗
摘要:數據遷移的順利完成是信息系統改造升級中相當重要的一環。本文以一個實際應用中的信息系統為例,從分析設計階段到實施階段,詳細闡述了數據從一個既有成熟的系統向新建設的系統中遷移的實現過程和注意要點。
關鍵字:信息系統 數據遷移
中圖分類號:TP311 文獻標識碼:A 文章編號:1672-3791(2012)10(b)-0014-01
在項目開發過程中經常會遇到老系統的歷史數據向新系統遷移的問題,很多歷史數據對新系統來說相當重要,有些甚至是新系統啟用時所必須的,可以說一次成功的歷史數據遷移是新系統成功上線運行的基礎。數據遷移的質量不光決定了新系統的上線成功與否,也對新系統上線后的穩定運行有著巨大的影響。
1 系統概述
根據用戶需求,為了貫徹政府文件要求,開展對持有獨生子女父母光榮證的企業退休職工發放一次性獎勵的工作,開發了計劃生育一次性待遇發放系統。它以企業退休職工為服務人群,實現了計劃生育一次性待遇發放相關的一系列流程控制和數據管理,包括了單位管理、單位發放管理、個人申請管理、個人公示管理、個人發放管理、綜合查詢等功能。
2 數據遷移設計
本系統雖然是個功能相對獨立的系統,但企業退休職工數據作為所有業務的起點卻非系統自身產生的數據,而是源自社會保障管理信息系統,因此社保系統必須向本系統提供系統運行所需的數據。只有這些數據的遷移成功后,一次性待遇發放的具體業務操作才能正常開展起來。然而社保系統由于歷史原因,其數據并非統一存放,而是分散在各統籌區不同的社保系統中,客觀上就存在著較大的差異。為了保證各統籌區的數據都能在本系統中運行,數據遷移的設計必須以實現統一數據格式,統一數據標準為原則。
2.1數據字典設計
首先,根據用戶的具體需求,確定能保障新系統運行的基礎數據,而這些數據就是數據遷移所需要的數據內容。通過與用戶的交流和分析,最終確定了各統籌區需向本系統提供的數據主要為單位基本信息和退休人員基本信息等,具體如下。
退休人員基本信息:個人ID、姓名、身份證號、性別、退休時間、單位ID、常住地、戶口地、生存狀態、死亡時間、聯系電話。
單位基本信息:單位ID、單位名稱、主管部門、注冊地址、經營地址、聯系人、聯系電話。
轄區基本信息:轄區ID、轄區名稱。
其次,根據需要遷移的信息,設計統一的數據字典,制定遷移的目標。各統籌區的數據最終將轉換成統一格式的接口表,便于將來新系統對數據的使用。
2.2數據抽取轉換設計
數據字典設計完成后,就可以進入各統籌區系統中,進一步研究如何因地制宜提取數據的方法。需要分析的內容包括原系統數據字典整理、原系統數據質量分析、新系統數據字典整理、新舊系統數據差異分析、建立新舊系統數據之間的映射關系等。
首先,要通過分析和整理原有系統的數據,從中找出與本次數據遷移所需要的數據和遷移范圍。必須在系統中明確找到個人ID、姓名、身份證號等信息的數據來源。然而另外一些不需要遷移的數據也很重要。例如,本次遷移人員的要求是養老金需沒有享受過獨生子女5%上浮的企業退休人員,因此相關待遇計算信息也是需要明確的非遷移信息。如果分析過程中發現數據存在質量問題,需及時與用戶和其相關技術人員進行溝通。
其次,根據整理好的原系統和新系統的數據字典,分析系統間的差異,建立新老系統數據字典的映射關系,將非標準的數據轉化為在一定程度上的標準化的數據,使映射后的數據能夠適應新系統的要求。大部分的遷移字段都可以通過直接映射的方法進行遷移(如個人ID、單位ID、姓名、身份證號等),還有一部分編碼數據(如性別、單位的主管部門、各轄區編碼等)由于各統籌區的差異性,不能直接使用,這就需要采用中間編碼映射的方式,將不統一的編碼映射成統一標準的編碼。為了數據抽取方便,可以設計必要的視圖;如果涉及到較為復雜的中間計算過程,也可以通過使用創建中間表的方法,將中間過程數據暫存到中間表中輔助建立映射關系。而通過各種方法通過映射關系轉換后的數據放在與數據字典同名的表中備查。
最后,為了保證數據遷移的正確性,及時發現遷移中可能遇到的問題,需對遷移條件以及遷移字段的正確性進行校驗。如果數據中含有不規范的數據,將對新系統的運行造成很多問題和麻煩。校驗通常包括檢查二義性、重復數據、不完整、違反業務或邏輯規則等問題的數據進行相應的檢查操作,如人員是否滿足條件、單位和退休人員是否一致、標準化后的編碼的正確性等。
3 數據遷移的實施
根據上述的設計思路,可以開發出一套數據遷移實施腳本和數據遷移結果校驗腳本。在遷移腳本執行完成后,可通過校驗腳本檢查數據,也可以通過篩選特殊測試用例進行抽查測試,及時對錯誤數據進行修正,或者調整抽取腳本,重新抽取。
數據抽取完成后,需要將數據傳遞到新系統中。由于各統籌區社保系統各自獨立,而且新系統與各統籌區系統也沒有實際的連接,因此本次數據遷移采用了通過中介文件的方式來實現。考慮到相關系統都使用ORACLE數據庫管理數據,故可通過使用ORACLE的工具生成和導入DUMP文件的方法來實施數據傳遞,將數據遷入到新系統中去。導入后,可在系統中對遷移的數據進行進一步的測試,確保遷移的數據可在系統中正常使用。
4 結語
通過上述步驟的實施,計劃生育一次性待遇發放系統的數據遷移已經基本完成了。本次實施過程中,主要難點是不同統籌區業務數據怎樣進行統一,因此必須對各統籌區的相關業務數據都有了解,也需要同相關用戶和技術人員反復溝通。遷移完成后要進行多次測試以檢驗遷移數據的完整性和正確性。目前本系統已經正式上線使用,本次數據遷移為企業退休職工一次性待遇發放的順利開展提供了數據保障。
參考文獻
[1] 池太崴.數據倉庫結構設計與實施-建造信息系統的金字塔[M].2版.電子工業出版社,2009.
[2] 袁磊,劉宏生,王淮龍.醫院信息系統數據遷移的實現[J].中國醫療前沿(下半月),2009,4(11):123-124.
[3] 趙欽,周丹.政府辦公自動化信息系統數據遷移解決方案[J].廣西科學院學報,2008,24(4):354-355,359.