宋忠洋
摘? ?要:核電企業由于崗位編制人員數量限制,內部IT資源無法完成與日俱增的信息系統運維工作任務,為保證信息系統穩定運行,只能通過服務外包管理模式或者混合管理模式借助外部IT資源開展運維工作。綜合考慮業務、人員、技術、安全、財務等多方面因素,多數公司傾向采用混合管理模式,內外部資源共同組成運維團隊。本文講解了某核電企業通過混合管理模式運維信息系統所遇到的管理上問題,并介紹如何借助信息系統提升運維管理水平,保證運維人員的工作效率。
關鍵詞:核電? 信息系統? 運維管理
信息系統建設期盡管項目組編寫測試腳本對系統進行充分測試,但是后續上線運行使用過程中難免還會有遇到新的缺陷。公司內部IT人員負責需求調研、業務梳理、藍圖編制、系統配置等,外部人員負責代碼實現和測試驗證,從而及時解決系統缺陷,完成需求變更,支撐公司各項業務工作正常開展。
1? 運維管理現狀
2009年為了提高維護響應效率,規范維護流程,提供單點接入服務平臺,并參考同行的良好實踐,某核電企業依據ITIL(Information Technology Infrastructure Library,信息技術基礎架構庫)理念建立了面向公司用戶的IT服務體系,設置了IT服務臺。服務臺按照ITIL理念為公司用戶提供IT服務,實現了用戶報修→服務臺建單→二線工程師處理→為用戶解決→服務臺與用戶確認并關閉事件單的閉環處理流程。根據職責分工,公司運維小組承擔二線工程師崗位,主要的工作內容包括如下。
(1)事件單處理。
用戶在信息系統使用過程中如果遇到問題或存在疑惑,聯系服務臺,服務臺人員登記請求人、信息系統、問題詳情等信息形成事件單轉派給運維組,運維組工程師分析問題產生的原因并進行處理,并把通過結果反饋給請求人。
(2)缺陷修復。
運維組負責分析缺陷產生的原因,尋找解決方案進行修復,然后部署到生產系統,以保證業務正常執行。
(3)需求變更。
運維組需要根據業務部門提交的需求變更申請,編寫配置文檔或開發文檔,調整系統功能,已適應新的管理要求。
(4)業務數據修改。
業務數據修改包括前端修改和數據庫層面修改,運維組主要負責數據層面的修改。根據業務部門提交的數據修改申請,構造SQL(Structured Query Language,結構化查詢語言)語句,提交數據庫管理員執行。
(5)知識積累。
信息系統運維過程中,很多問題重復出現,運維組需要對常見問題進行總結、提煉,形成文檔,保證運維知識能共享,可傳遞。
整個運維組工作任務中,事件單管理使用基于BMC Remedy產品搭建了ITSM運維管理系統,但是由于未對BMC Remedy產品進行深入開發,無法支持需求、缺陷全生命周期管理。因此除了事件單外,其他均無信息系統支持。隨著運維組負責運維的信息系統數量越來越多,運維管理矛盾日益突出,包括:
(1)信息系統需求變更申請、數據修改申請線下紙質審批,效率低下;
(2)信息系統需求變更和功能缺陷通過Excel維護管理,無法快速掌握任務進展情況;
(3)運維經驗總結存在個人辦公電腦中,不利于知識分享和傳遞;
(4)無法掌握每位運維人員工作量及各系統需求和缺陷未完成情況。
2? 運維管理平臺建設過程
為了規范化需求變更、數據修改審批流程,準確掌握系統缺陷、需求變更進展,共享運維經驗,科學管理運維人員,運維組啟動運維管理平臺建設工作。為了不影響計劃中運維工作,運維平臺建設以“快速、實用、經濟、好用”為宗旨,采用使用成熟軟件為主、自開發為輔的模式。根據不同的階段面臨的管理需求不同,一體化運維管理平臺建設分“三步走”。
2.1 系統建設
(1)工作流開發。
根據公司管理程序要求,信息需求變更和信息系統業務數據修改均需經過批準后才予以實施,兩項任務均涉及到工作流。由于公司基于SAP BPM引擎開發大量審批流,基礎框架高效、穩定,同時流程中的工作任務均集成到統一工作門戶中,實現集中處理,所以信息系統需求變更流程和信息系統數據修改流程均通過自開發的方式,基于SAP BPM引擎實現。
(2)需求、缺陷管理。
信息系統需求管理、缺陷管理均有一套方法論支持,自主開發不僅需要先消化方法論內容,而且工作量非常大。經過市場調研,最終選擇禪道國產開源項目管理軟件用于需求和缺陷的管理。
(3)知識管理。
知識管理系統需求比較簡單,主要是知識創建和使用,其中知識創建過程一定要簡單,使用過程一定要方便。經過調研,市場上存在一些產品,但是操作過于繁瑣,界面復雜不滿足需求。經過評估最終采用Java語言自主開發。考慮到工作量,本系統不使用復雜的框架,但是依舊遵循DAO(Data Access Object,數據訪問對象)設計模式,數據庫操作使用Mybatis框架,UI(User Interface,用戶界面)界面EasyUI組件。
2.2 系統集成
第一步走完后,運維中的工作任務均實現信息化覆蓋,有效提升運維管理水平,實現運維知識共享化。但是由于整個運維工作使用了多套信息系統,系統間沒有集成,來回切換影響工作效率,故第二步打通系統間數據壁壘,實現數據交互與共享。通過對運維管理流程進行梳理與討論,一體化運維管理平臺系統間數據流。
(1)ITMS中事件單經過分析后確認為系統缺陷,通過接口需把相關信息傳遞到禪道系統中,按照缺陷的管理方法進行管理;
(2)缺陷解決后,通過接口更新對應的事件單狀態;
(3)需求變更經過批準后,通過接口把相關信息傳遞到禪道系統中,按照需求的管理方論進行管理;
(4)數據修改經過批準后,通過接口把相關信息傳遞到ITSM系統中,按照事件的管理方法進行管理。
(5)對于常見的數據修改,形成解決方案,后續相同的數據修改申請流程直接引用已經存在的知識點,而無需每次都寫修改方案。
為了降低耦合度,提高系統的可擴展性,各系統間采用SOA(Service-Oriented Architecture,面向服務的架構)架構,首先制定服務的接口規范,然后按照規范開發SOA服務。系統間數據壁壘打通后,減少了需求、缺陷創建重復工作,有效提高了運維工作效率。
2.3 指標分析
從2011年試驗性引入2名Java開發人員開始,隨著上線的信息系統增加,運維工作量越來越大,陸續引入多種語言開發顧問,內外部資源組成的運維團隊超過20人。如何保證運維人員認真處理分配的工作任務,如何保證運維任務分配的科學合理,是運維組負責人需要思考的問題。雖然相關緯度數據均存在系統中,但是統計分析耗費大量時間,因此,一體化運維平臺搭建第三步,開發指標分析系統。
指標分析系統上線后,運維組負責人可實時掌握每個運維人員工作量,用數據督促大家積極努力工作。同時通過分析各信息系統需求和缺陷未解決數量,及時調整投入的運維資源,快速解決遺留問題,有效提高的用戶的滿意度。
3? 結語
一體化運維管理平臺從構想到落地經過3個階段,歷經5個春秋,充分驗證了隨著精細化管理水平的不斷提升,業務部門對信息系統的需求也在不斷的改變。運維團隊唯有通過科學合理的管理制度,簡單易用的信息系統方能快速響應新的需求變更,提高運維管理水平,保證運維人員的工作效率,保障了信息系統安全、穩定、高效運行。
參考文獻
[1] 曹姝媛.山東核電調試生產信息管理系統運維管理研究[Z].電力信息化文庫,2016-07-19.
[2] 符長青,符曉勤,符曉蘭.信息系統運維服務管理[M].北京:清華大學出版社,2015.
[3] 項目管理協會.項目管理知識體系指南[M].北京:電子工業出版社,2013.