宋靜 李可 李冬

摘要:隨著電力行業信息化建設的高速發展,各種信息系統及設備讓運維人員難以從容應對,自動化運維迫在眉睫。而標準化是自動化運維的基礎,本文提出了針對信息系統標準化工藝檢查的工具,設計并實現了信息設備資源管理、指標管理、數據采集、檢查基線、標準化檢查、異動告警等功能,從而降低信息系統建設與運維的復雜度,助力實現自動化運維。
關鍵詞:標準化;自動化運維;檢查工具
中圖分類號:TP31 文獻標識碼:A 文章編號:1007-9416(2019)07-0142-02
0 引言
隨著電力行業信息化建設的持續深化,云計算、大數據、泛在電力物聯網等新技術的應用所帶來的在設計開發、部署及運行模式、用戶應用方式等方面的變革,對系統運行維護提出新的要求。對主機、數據庫、中間件進行規范標準的安裝、配置等操作,開展標準化運維工作,能夠極大的提升系統投運質量,增強系統規范性,降低信息系統建設與運維的復雜度。
本文設計研發了一套貼合電力行業現狀的信息系統標準化工藝檢查工具,實現主機、數據庫、中間件等管理資源的靜態數據自動化采集、任務計劃、基線對比、標準管理等功能。可以大大提升運維人員工作效率和質量,提高數據準確性,最終實現運維過程的標準化管理。
1 系統概述
信息系統標準化工藝檢查工具是基于國家電網《信息系統安裝部署標準化生產工藝指導手冊》,并結合運維人員日常工作經驗總結設計開發的一套配置核查工具。梳理了主機、數據庫、中間件的數百項基礎配置指標與采集方式,并建立了多個運維標準化工藝基線數據的模型,通過各類指標采集結果與標準基線的對比分析,生成橫縱向分析報告,從而快速提升運維標準化水平。
2 系統架構設計
2.1 總體架構
本工具采用MVC三層架構模式,基礎框架是SSH(Struts、Spring、Hibernate)的集成框架,基于國家電網統一應用開發(SG-UAP)平臺研發,研發語言是JAVA,數據庫采用MySQL數據庫,ES大數據存儲集群、Redis緩存集群。
2.2 詳細架構
如圖1所示,系統的運維對象主要是主機、中間件、數據庫,具體的版本有:Linux、Windows、Tomcat、Weblogic、Oracle、Mysql六大類型資源。
本地數據存儲由三部分組成,分別是結構化存儲Mysql數據庫,非結構化存儲ES數據庫、緩存數據庫Redis。其中ES即ElasticSearch,是一個能夠提供高并發、易擴展、高可用的分布式搜索引擎,能夠為系統提供一個易于查詢和共享的接口[1],在此工具中主要用于存儲采集規則,極大的提高了查詢效率與存儲上限。Redis是一種高性能的KV存儲系統,比傳統的關系數據庫提高了吞吐量和相應的性能[2],在此工具中主要用于存儲。
由檢查工具客戶端通過RPC發起數據采集請求,采集服務端響應并解析客戶端的請求。RPC(Remote Procedure Call)指的是遠程調用,通過遠程調用,將采集服務與客戶端剝離[3]。遠程連接上被采集對象同時執行相應的采集指令,執行完成后將采集結果返回至檢查工具客戶端,同時根據標準化檢查的設定基線,將采集值與標準值進行對比,生成相應的分析報告。
規則引擎是將運維標準工藝基線中的配置項生成可配置、可量化的規則,從而能夠動態靈活的與指標采集值進行的比較,生成各類分析對比報告。并能夠進行橫縱向對比,當此次采集值與上次采集值不一致時生成異動告警。
3 系統功能設計
系統主要功能為資源管理、指標管理、基線管理、標準化檢查、異動分析五大模塊。
3.1 資源管理
資源管理作為此工具的基礎模塊,統一管理資源的基本信息。基礎資源維護是為系統使用人員提供了資源基礎數據維護的功能,在資源維護功能模塊下可以維護主機、數據庫、中間件、應用系統的基礎數據,并可維護其間的關聯關系,能夠清晰的展示應用系統下的所有基礎資源信息。
其中采集配置信息是資源管理中重要的一類信息,在本工具中均通過各類對象的采集協議進行遠程的采集。通過協議的采集方式,無需在被采集的服務器上安裝代理或者探針,極大的方便了數據采集的工作開展。
3.2 指標管理
指標管理主要維護工具中可采集的指標,并且按照各資源類型進行分類,囊括了主機、數據庫、中間件的標準工藝要求的各項指標數據采集方式。每個指標有多個采集指令從而適應不同的版本,盡可能的做到涵蓋標準化工藝基線建設需要的指標。
3.3 基線管理
基線管理主要是維護各類指標的標準值,基線值,基線依據國網標準工藝和安全加固手冊中的標準配置來制定。可以針對不同的指標設置相應的標準值,為采集數據的分析提供標準值。基線主要涉及到以下幾類,基礎軟硬件環境規范,操作系統安裝配置規范,軟件安裝配置規范,安全基線配置規范,每類基線中都有詳細的配置規范要求。
3.4 標準化檢查
標準化檢查是將資源管理下的各類資源,配置相應的要求基線,通過采集回的數據與基線中要求的標準值進行比對判斷合格與不合格,并計算合格率。通過生成檢查報告,并對違反基線要求的檢查項進行高亮顯示。通過這樣批量高效的、準確可靠的檢查方式,簡化數據統計流程,提高工作效率,能夠全面的核查資源標準工藝建設情況,從而建立一套完整、真實的數據資源臺帳,支撐標準工藝建設。
3.5 異動分析
異動分析主要關注指標值的變動情況。通過對同一采集對象所采集的數據與前次采集數據進行比對分析,找出與前次配置不符、標準化檢查結果變動的配置項。針對數據有變動的采集對象,通過列表的形式展現為異動告警信息,供管理人員查看分析。通過針對異動的數據做運維檢查,避清楚的掌握服務器的各項指標值的變化情況,免運維工作隱患的發生。
4 結語
本文基于國家電網統一開發平臺和自動化運維理念,將日常的標準化工藝建設工作落實為一套高效、便捷的管理工具。為客戶提供了資源管理、指標管理、基線管理、標準化檢查、移動分析等功能模塊,實現了各類資源的標準化工藝建設,從而鞏固提升信息系統工作成果,確保信息基礎平臺按照標準進行建設,著力提升電網信息基礎平臺隱患排查能力和穩定運行水平。
參考文獻
[1] 楊麗萍,張希翔,孟椿智,等.基于Elasticsearch的大數據搜索引擎在電力企業的應用研究[J].數字技術與應用,2017(12):63+65.
[2] 張婷,孫鳳文.淺述Redis在高速緩存系統中的應用[J].科學與信息化,2019(8):43-43.
[3] 楊帆,孔維萍,蔣曉肖,等.基于Thrift的RPC中間件在航天信息系統中的設計與實現[J].計算機測量與控制,2017(12):279-282+306.