姜曉濤 張梅


摘要:隨著國家電網公司信息化建設步伐的加快, IT設備數量大幅度增加,日常運檢任務也日益繁重,給運維管理工作造成極大壓力。本文通過梳理電力信息網日常運維工作內容,并結合最新的自動化運維技術針對部分運維業務通過規范業務流程、建設自動化運維工具,為廣大一線運維操作人員提供更加實用高效的運維手段,提升公司運檢自動化水平。
關鍵詞:電力信息網 自動化運維 信息運檢
中圖分類號:TP39 文獻標識碼:A 文章編號:1007-9416(2016)07-0254-01
隨著國家電網公司信息化建設步伐的加快,公司IT管理已逐步邁入了云計算與大數據的時代,其管理對象已全覆蓋包含網絡、主機、存儲在內的設備,溫度、濕度、電源在內的機房環境,數據庫、中間件、業務應用系統等在內的軟件環境和業務環境,在實現設備集中、業務集中、數據集中的基礎上,各單位在公司調運檢體系的基礎之上,也在積極探索高效的手段進行日常運維管理[1]。隨著IT設備數量大幅度增加,日常運檢任務日益繁重,運維人員數量有限,給運維管理工作造成極大壓力;特別是隨著設備數量的激增,目前已有運維人員已無法保質保量完成日常工作。傳統運維帶來大量繁瑣、重復的工作,造成管理員大量低效勞動,運維成本居高不下[3]。
為緩解運維壓力,提升運維效率,可通過建設自動化運維工具實現對服務器、網絡設備配置的日常管理,實現對操作系統、中間件、數據庫的管理,對業務系統的管理,對管理對象進行性能分析,形成閉環的IT運維全生命周期管理。
1 運檢自動化建設目標
目前國網安徽省電力公司作為SG-I6000項目[2]三家牽頭試點單位之一,緊扣“運檢自動化”的命題,以項目建設和應用為切入點,積極參與并推動了系統的運檢自動化功能設計、試用和實踐工作。本文基于SG-I6000系統平臺,開發自主開發運維自動化工具模塊,支持日常運維工作,并在地市電力公司進行運行實踐。結合電力信息網運維工作重點,運檢自動化從日常巡檢自動化、軟件及補丁管理自動化兩個方面逐步開展自動化運維活動。
其中巡檢自動化以設備自動化巡檢及配置管理為主要目標。(1)設備日常巡檢自動化:檢查設備及應用系統的運行狀態,建立運行日常巡檢標準基線庫,自動化巡檢采集信息與基線進行符合度檢查,實現對用戶操作規范的約束和對信息資源進行實時檢查,實現服務器、數據庫、中間件、網絡、業務應用和客戶端等目前人工巡檢的自動化,減少手工操作。(2)配置信息的日常管理,包含抓取、備份、比對、回滾及變更。針對多個節點,當發布失敗后,可以通過配置項的歷史快照,將各個節點的配置項快速回滾到發布前。設備配置的配置控制確保只部署授權的軟件和配置,最小化服務中斷風險。
軟件及補丁管理自動化實現軟件及補丁的自動開通、自動安裝(客戶端、服務器)、自動部署、自動配置、自動擴容/縮容、自動發布等領域的自動化實現手段。通過基于策略的補丁、修復、更新和升級部署,實現對軟件和補丁的自動化管理。
2 運檢自動化工具建設實現
2.1 運檢自動化工具技術路線
運檢自動化建設主要為運檢自動化工具建設,工具采用開放的C/S結構,根據業務需求添加擴展功能模塊,實現不同區域的個性化運檢需要。運檢自動化工具的用戶及權限管理由I6000統一管理,工具客戶端根據I6000的權限設定生成操作界面,實現操作權限控制。工具技術架構見圖1。
其中IT基礎設施包括主機、網絡設備、安全設備、數據庫、應用系統、中間件等。配置采集從I6000系統中采集主機、網絡、應用、安全等的配置,建立統一資源信息庫,為運檢自動化工具提供IT基礎設施實時故障、告警、設備配置等信息。
工具服務端為客戶端提供功能和數據支撐。通過在服務端建立用戶和角色,搭建所需權限模型;通過對設備進行分組,從而確定操作的數據邊界;通過功能擴展管理,可按區域需求對運檢自動化工具進行個性化定制;通過日常工作臺,形成每個操作人員每日工作展板,利用快速便捷掌握工作進度。工具客戶端采用胖客戶端模式,運檢工作由客戶端完成,主要完成巡檢自動化、軟件管理、補丁管理等業務需求。將日常運檢工作封裝為任務的方式,以策略的模式在客戶端運行,處理從I6000獲取的數據,之后將結果反饋I6000,同時將任務信息反饋,以便于后期進行運維綜合分析。
工具可視化層面采用國網標準圖元,設計用戶操作界面,構造一個友好的操作界面。
2.2 運檢自動化工具實現展示
運檢自動化工具通過業務分類定制巡檢頁面,以棒狀圖、曲線圖、氣泡圖等圖形,實現了采集指標的自動告警,如數據庫發生鎖等待、隊列等待等情況,運行監控人員可以第一時間通知數據庫管理員;主機電源或風扇異常,運行監控人員可以第一時間通知主機管理員。圖2為數據庫自動化巡檢圖。
3 結語
通過運檢自動化工具的研制與應用,信息調度可以全面準確的掌握網絡、主機、數據庫的運行情況及趨勢,并迅速、準確地定位故障;結合軟件自動化安裝及配置,提高了信息運行人員的系統部署及管理能力,較好的提升了信息網運檢的自動化程度,極大提升了運行質量和工作效率。
參考文獻
[1]黃聰.電力信息系統運維管理自動化解決方案的構建[J].科技傳播,2015年19期.
[2]黑龍江省電力公司開展SG-I6000頂層設計工作[J].電力信息化,2013年6期.
[3]壽增.調度自動化運維監管系統的設計與應用[J].電力信息與通信技術,2014年12期.