張迎平,眭建新,周沿東
(1.國網湖南省電力有限公司,長沙 410004;2.國網湖南信通公司,長沙 410004)
隨著社會科技的不斷進步與發展以及人民生活信息化水平的不斷提高,個人和企業對于信息系統的依賴性越來越強[1-3]。信息系統是企業業務得以正常運轉的基礎,是關系到企業生存和發展的一種寶貴無形資產。而數據遷移是指在系統軟件開發過程中,將其中具有實際價值的業務數據,依據功能需求或系統開發的要求,在不同的存儲介質、存儲形式或者計算機系統之間轉移的過程[3-6]。雖然原有系統被新系統所取代,但是原系統積累的大量珍貴歷史數據和用戶信息等,都是新系統順利啟動所必須依賴的,這些歷史數據也為企業后期進行數據分析和決策提供重要的參考依據。因此,對數據遷移的相關問題進行最優化求解具有重要的研究意義[7-9]。
在電力信息系統的建設過程中,由于電網企業用戶業務規模和數量的不斷擴大,系統軟件的不斷升級和硬件系統的不斷更新換代(如硬件層次結構的增加、數據庫版本的升級、運行環境的轉換、多子系統的綜合以及信息查詢模式的多樣化等),電網公司不可避免地需要面臨信息系統相關數據的遷移問題。在遷移的過程中,如何保證用戶業務的連續性,實現系統數據快速、平滑的遷移,把由于遷移帶來的損失降至最低水平,是衡量遷移設計方案優越性一個重要標準。特別是,系統遷移得及時、準確將直接影響到新系統能否及時上線,也是影響新系統能否穩定運行的重要前提和根本保障。
目前,各個企業采用的數據遷移方案多種多樣,如:文獻[10]研究了基于勘探開發綜合數據庫PCEDM(petrol china engineer data model)的數據遷移方案,實現了將原始數據遷移到Oracle數據庫PCEDM的技術方法,并在中石油勘探開發數據的實施取得了較好的應用效果;文獻[11]對數據遷移過程中的數據庫結構分析、數據遷移流程設計和數據遷移等實現步驟進行分析和研究,實現了政府辦公室自動化新舊系統的正確、快速數據遷移;文獻[12]對系統升級過程中數據遷移可采取不同方案進行適用情況和優點缺點比較,實現了新舊系統的順利切換。然而,這些方案均局限于某個單一的應用領域,不具有普適性。
實際信息系統遷移中的諸多要素多種多樣,要素之間的關聯也較為復雜,如果對這些關聯進行分析并實行調度優化,就可以找到一個系統性的方法來將遷移中所涉及到的要素間關聯統一在一個模型框架下,進而實現信息遷移系統的最優化求解。在此,通過對國網湖南省電網公司信息系統遷移過程的相關要素進行抽象和分析,提取出影響系統遷移的多維特征描述向量,而后運用改進粒子群算法對系統遷移過程中的遷移時間開銷問題進行優化設計,給出電力信息系統數據遷移時間開銷最優化的解決方案,具有很好的普適性。
國網湖南電力信息系統遷移項目,涉及面廣,信息系統多,總共涉及ERP、財務管控、交易、用電信息采集、營銷、IMS等17套核心應用系統;人資管控、財務核算、統計管理、基建管理、應急管理、安全監督管理和協同辦公等53套重要信息系統;投資計劃、信息安全檔案管理、同業對標、統一漏洞補丁等42套一般系統。該項目具有以下的突出特點:
1)信息設備多。系統總共涉及各類信息設備約1162臺搬遷,分別包括網絡交換機、路由器、防火墻、負載均衡、機架PC服務器、刀片PC服務器、小型機、光纖交換機、FCOIP、磁盤陣列、磁帶庫等。
2)信息系統集成關系復雜。在運信息系統間涉及到的集成關系成千上萬條,且使用的技術路線也不盡相同,比如通過ESB,數據交換平臺,統一數據交 換 平 臺 ,DBLink,Oracle Golden Gate,DSG,SAP RFC,SAP JCO,LDAP,JMS,等完成數據交換。
因此,該信息系統遷移中涉及各類要素不僅數量大,而且類型多,既包括硬件設備與系統,也包括軟件系統與工具;既涉及硬件設備采購、運輸、安裝與調試,也設計軟件系統的采購、開發、測試和部署;既需要滿足時限要求,又需要兼顧經濟成本,還需要估計可能的風險。為了在一個統一的模型框架下來研究和優化信息系統的遷移方案,需要對上述諸要素進行適當的抽象與描述,以滿足普適性的模型的需求。
基于以上分析,文中提出了一種時間最優信息系統遷移模型TOISM(time optimal information system migration),即:
①機房集合 R={r1,r2,…,rm},式中 rj為第 j個機房,j=1,2,…,m;
②信息系統集合 S={s1,s2,…,sn},式中 si為第i個信息系統,i=1,2,…,n;
③遷移系統序列集合 MS={ms1,ms2,…,msn},其中 msi={msi1,msi2,…,msik}為系統 si中各設備的遷移順序序列;
④可搬遷機房集合 MSR={msi1,msi2,…,msik},其中 msij={msij1,msij2,…,msijk}為系統 si中各設備可遷移的機房;
⑤搬遷時間矩陣 T,tij∈T,式中 tij為第i個系統si搬遷至機房j所需要的時間;
⑦遷移目標 min f(Wt),即找出時間最短的遷移方案。
TOISM能夠反映信息系統遷移過程中遷移方案的時間優化目標,求解模型的最優解,即確立最短遷移時間方案是一個典型的組合優化問題,為NP難問題,隨著問題規模的增大,傳統算法無法有效地進行求解。為此,針對TOISM文中提出了一種基于改進粒子群算法,用于TOISM的求解。
受到鳥類群體運動模型的啟發,Kennedy J.與Eherhart R.在1995年提出了粒子群算法PSO[13-15](particle swarm optimization)。PSO 是一種基于群體的智能優化算法,群體中每一個個體(粒子)均為解空間中的一個潛在可行解,群體在解空間中進行全局尋優。每個粒子的位置為可行解,粒子通過速度來改變自身的位置,在求解過程中,每個粒子都保存自身經歷過的最佳位置即個體最優解,群體也保存所有個體經歷過的最佳位置即群體最優解。通過迭代過程,群體中所有粒子在解空間中進行全局搜索。從本質上而言,PSO是一種進化算法:

式中:vj,vj+1分別為粒子在第j次、第j+1次迭代時的速度;xj,xj+1分別為粒子在第j次、第j+1次迭代時的位置;c1,c2為學習因子, 通常為固定常數;r1,r2為隨機數;pb,gb分別為粒子個體最優位置、群體最優位置;ω為慣性權重,按式(3)線性遞減,即

式中:ωmax,ωmin分別為慣性權重的最大值、最小值;t為當前迭代代數;tmax為最大迭代次數。
粒子群算法具有全局尋優、收斂速度快等優點,因此得到了廣泛的應用,但是標準粒子群算法的速度和位置更新非常適合于連續空間中的實數解空間,對于組合優化問題,則無法適用。雖然有基于離散空間的PSO改進算法,但多為通過將位置和速度轉換二進制的方式來求解,而二進制PSO算法也不能直接應用于TOISM的優化。針對二進制PSO算法的特點,文中提出了一種改進PSO算法TOISM-PSO,用于TOISM的優化。
TOISM-PSO算法的基本流程與PSO算法一致,在具體環節的處理上則根據TOISM模型的特點進行改進。TOISM-PSO算法的基本思想是對PSO的位置和速度更新公式進行改進,以符合TOISM模型的特點。其基本處理流程如下:
步驟1生成初始群體
考慮到TOISM模型的數據為特定的機房與系統編號的組合,隨機生成初始群體時通過限定器對個體進行限定,使生成的個體直接為有效解。限定器使用輪盤賭方式,隨機生成初始化序列,并通過更新禁忌表進行限定。初始個體的結構如圖1所示。

圖1 ISMM-PSO個體結構Fig.1 Individual structure of ISMM-PSO
每個個體包含遷移序列與遷移機房信息。由圖可見,系統遷移順序為 so1→so2→so3→so4→…→son;對應的遷移機房分別為 ro1,ro2,ro3,ro4,…,ron。
步驟2評估個體適應度
此步驟TOISM-PSO與PSO一樣,通過對個體進行適應度計算,評估群體中個體的適應度。適應度計算依據遷移時間開銷進行計算。
步驟3更新個體最優和群體最優
此步驟TOISM-PSO與PSO相同,計算出個體的適應度后,與個體的歷史最優及群體的歷史最優進行比較,如果優于個體歷史最優,則用當前個體替換個體歷史最優,否則不更新;如果優于群體歷史最優,則用當前個體替換群體歷史最優,否則不更新。
步驟4更新個體位置與速度
TOISM-PSO的位置更新和速度更新采用與PSO類似的方式。速度更新采用式的方式,其中,當前位置與個體最優及群體最優的減法操作與PSO不同。針對TOISM模型的特點,減法操作分為2個部分,遷移序列之差與遷移機房之差,相應的結果作為影響當前速度的擾動因子。位置的更新采用式的方式,但生成的新位置需要使用限定器重新限定到有效解。
步驟5重新評估個體新位置的適應度
對個體的新位置進行適應度計算,并與原位置進行比較,如果新位置優于原位置,則替換原位置,否則不變。
步驟6輸出最優解
判斷是否滿足結束條件。如果不滿足,則轉至步驟3進入下一輪迭代;如果滿足結束條件,則輸出群體最優解作為求解結果。
在信息系統多并發遷移模型中,涉及了諸如時間開銷、成本開銷、風險等多個決定優化目標的參數,這些參數往往因不同的遷移項目、不同的遷移要素以及不同的環境因素而存在變化。因此,需要研究此類優化參數的系統性的估計方法,從而使得整個優化建立在合理的基礎之上。
信息系統多并發遷移項目中包含的遷移要素多,要素間的關聯復雜,因此即使在完成了建模之后,也往往歸結為一個大規模的優化問題。同時由于優化參數多,優化目標函數為非線性函數,因此存在著嚴重的局部最優問題,導致一般的優化方法難以獲得性能較好的全局最優/次優解。因此需要針對這類問題研究其優化方法。
TOISM-PSO算法的參數設置見表1。其中的c1,c2分別對應粒子向個體最優、群體最優學習的力度。

表1 TOISM-PSO算法參數設置Tab.1 Parameter setting of TOISM-PSO algorithm
為了驗證所提出的TOISM-PSO算法的有效性,進行了對比仿真試驗。通過與基本遺傳算法的對比,可以發現TOISM-PSO在收斂速度以及尋優結果方面都明顯優于遺傳算法,對比結果如圖2所示。
將TOISM-PSO算法應用到國家電網湖南省電力公司的信息系統遷移實際工作中,通過對各系統遷移的工作時間開銷進行估計,統計出各信息系統遷移需要的時間開銷,通過TOISM-PSO算法對信息系統遷移方案進行優化。其優化結果如圖3所示。

圖2 算法的迭代尋優對比Fig.2 Iterative optimization comparison of different algorithms

圖3 信息系統遷移方案甘特圖Fig.3 Gantt chart of information system migration scheme
與傳統的信息遷移系統相比,基于改進粒子群算法的電力信息系統遷移方案可以將信息系統遷移對日常業務的影響將至最低水平,能夠實現整個系統遷移時間的最優化,可明顯縮短信息系統更新與升級期間的系統停機時間,保持系統對外基本業務服務的連續性,減少系統更新與升級對客戶體驗造成的影響,最大限度地減少了企業的損失,具有很好的普適性和借鑒價值。