臧洪睿,楊婷婷,辛 穎,宋 健
國網吉林省電力有限公司信息通信公司,吉林 長春 130000
近年來,服務器資源組成云計算平臺已成為電網公司信息系統基礎平臺發展的新熱點,也是建設國際領先的能源互聯網企業信息化的基礎和保障。在電網公司信息系統的運維過程中,云資源的管理一直是件非常棘手的事情。以往的運維模式已越來越不適應現代化社會發展需求,電網公司信息化發展和運維工作人員的技術水平之間的矛盾也逐漸凸顯。過去信息通信運維狀態下,跨部門及組織需要長時間溝通,總體處事效率較低,自動化運維水平不高等問題較為突出[1]。如何簡單且有效地管理公司云資源,形成基于云計算環境的信息系統配置智能發現及自動管理體系成為電網公司目前亟待解決的難題。
近年來,電網公司信息設備、系統均在不斷升級,對系統服務質量也有了更高標準的要求。在這種情況下,運維工作若采取以往的人工手段,則會導致電網公司信息化建設和系統運維工作之間的矛盾越發突出。具體而言,系統運維還存在以下不足。(1)系統巡檢工作質量不高。網絡及信息系統架構比較復雜,機房、設備及信息系統的巡檢需要耗費許多人力資源,工作成本非常高。(2)設備自動化運維輔助方式不多?,F階段,業務系統從建設到維護仍然選擇以往的人工運維手段,缺乏自動化的現代化部署配置及資源的智能化調配工具。(3)運維人員工作難度較大。由于維護系統涉及的知識內容廣泛,不僅要懂得以往的運行方法,還要了解新系統的運行維護技術,這無疑給運維人員增添了較大的工作量,使得其工作強度大幅增加,并且帶來了較大的挑戰,這要求系統管理員不但要加強業務知識的學習,認真做好系統運維工作,而且應充分利用業余時間了解及學習系統架構的各項說明,以更好地掌握工作技術要領。
由此可見,電力系統的建設和運維兩者間的矛盾加劇,這需要相關部門結合系統的具體需求及問題來強化信息系統自動化運維體系的建設,盡可能確保系統實現自動巡查、規范部署,以及配置、監控、資源調度的自動化,不斷提高運維管控水平[2]。
電網公司系統運維自動化需要分階段完成,以解決自身實際問題。隨著信息通信融合的發展,信息通信運維建設的監控系統越來越多,在監控運維工作的時候應盡可能減少系統之間縱向接口數據的傳輸頻次,規避數據存儲差異,選擇規范的數據格式,使得模塊化的數據分析及展現設計有所增加,給予種類繁多、內容充沛的途徑,從而確保運維系統能夠較好地對工作開展情況進行監督管理。此外,要求做到對監控業務系統實施靈活性的資源協調使用及故障自動維修,以確保業務監督管理的規范化及流程的可靠性;要求硬件資源、軟件資源與信息系統越來越集約化,在降低運行維護成本的同時,進一步增強運維能力[3]。要達到這些要求,就必須選擇自動化的形式進行運行維護,提升電網企業運維管理水平。
此階段主要是結合運行資源管理對象清單,不斷對資源對象目錄進行補充及更新,使資源對象的編碼所代表的意思、所用的格式等相關資料均比較清晰,同時對資源對象進行科學、規范管理。總結歸納編制數據的采集標準,它大致涉及運行采集、告警及應用性能采集三個方面,還需要確保數據定義、精準性等相關語義信息保持一致,為電力系統運行維護自動化工具之間實施數據交換提供便利條件[4]?,F階段,系統業務流程已由起初的信息系統管理途徑逐漸朝著以信息技術為主的服務管理方式轉變。
此階段是以CMDB配置管理和分層建模為主要方式來實施的。配置管理數據庫(CMDB)是將IT基礎架構中的全部屬性均當作1個配置項,可以更改及定義各個配置項的屬性,各個配置項的屬性數據與修改、消息等管理信息資料均具備相應的業務關聯性,需要認真分析并加以處理,同時需要在存儲標準庫中闡釋。CMDB能夠有效闡釋管理屬性,憑借業務邏輯的關聯性可以給予明確的分層模型,最終為電網公司的長期發展給予可靠的決策指導[5]。此外,CMDB和自動化維護服務對象給予的程序均可以進行有機融合,最終為運行維護的持續、穩定運行帶來可靠保障,讓CMDB起到有效作用。CMDB主要憑借有關邏輯業務程序來確保數據的可靠性,以確保運行維護各個環節的協調合作,最終確保運維工作的智能化開展。在項目實施時,CMDB通常被看作建立運行維護程序的重要前提,運維項目是否在公司中得到普遍推廣,和項目初期構建的CMDB配置管理具有十分密切的關系。在后續推廣時,還需對CMDB已形成的標準及運行維護的具體情況給予變更申請,憑借充足的配置項對當前運維服務的業務流程進行逐步優化及健全,建立自動化分析處理機制應用情景,完善業務邏輯,節約運維時間及人力成本,提升系統運維準確性及服務效率。通過微應用的途徑使運維工作流程化,盡可能地消除或者減少系統運維的不確定性,節約處理的時間,確保運行維護項目可以及時交付。此外,可以應用可靠的資源來增強運行維護的有效性,確保資源的智能化配置。與此同時,結合面向服務及延伸的體系,不斷改變工作人員的工作方式,確保項目業務的安全、可靠運行,同時在較短時間內滿足持續變化的業務需求。
通常,電力信息系統運維工作會涉及系統實時出現的流量存在較大的變化、應用需求更新速度比較快、組網及應用環境越來越煩瑣、開發形式越來越多等困難,以及系統安全穩定、運維效率、系統成本、系統體驗等相關問題。在系統運行維護服務時,若已經具備一定數量的運行維護服務器,那么運維工作人員就應該及時改變思路,不能再一味注重設備運維服務,而是要逐漸加強業務系統的運行維護。
公司的自動化維護技術架構涉及自動規劃、自動監控、工作狀態及業務邏輯四個部分,可以較好地反映信息系統及業務系統的協調聯動機制,重視體現業務邏輯的內在性、業務流程的標準化及自動化分析處理,以構成完整的業務支撐系統。自動化運維系統有利于對網絡設備、操作系統、中間件及數據庫實施自動化基線檢查,在開展此項工作時,主要結合現有檢查模板進行,也能夠自定義。公司的自動化維護技術支持基線配置數據采集,既可以采用人工方式進行一鍵式采集,也可以自動化采集。數據采集能夠借助遠程協議來實施,不用在目標系統上設置代理。自動化運維服務系統能夠對挖掘的數據進行科學剖析,在較短時間內幫助用戶找出不符合規范要求的配置項,同時可以借助“機房—業務系統—設備—配置項”的模式,逐層展示異常配置項內容和受到相關影響的區域,即業務系統、機房或設備。自動化運維管理系統具有賬號的統一管理、身份認證等功能,可將業務和運行維護工作進行有機融合,實現自動化分析處理及資源的靈活調度。自動化運維管理系統可以通過賬號申請、賬號自動搜索、賬號自動修改密碼、賬號智能化檢查、賬號風險管理等功能,還可以對公司全部的設備賬號實施精細化的管理,使公司設備賬號時刻處于安全狀態。同時,自動運維管理系統還可在冗雜的業務工作中靈活調配運行資源,并在使用資源出現異常情況時智能化分析其造成的影響,借助系統將處理方式上報至業務處理部門。
隨著計算機信息技術的迅猛發展,電力系統信息化建設已經成為電網公司發展的重要方向,給電網公司與社會大眾帶來了極大便利。但電力信息化在帶來極大有利條件的同時,也面臨一些安全隱患,無論是黑客的惡意破壞還是工作人員在運維中的不規范操作,均可能會給電網公司帶來無法預估的損失。因此,電網公司越來越重視信息系統的建設與維護。文章根據電網公司實際環境,探討了自動化運維安全管理系統的技術結構,實現了對電網公司信息系統的自動化運維管理,最大限度地降低了電網公司在信息化建設與系統運維過程中的安全風險。