何子慶 王博 習文風 徐鵬 廖真 婁芮凡


摘要:信息化運維是軍工科研院所重要的基礎性服務工作之一,它不僅支撐起了軍工科研院所干部職工和相關人員進行信息資源共建共享,更為科研生產全局提供了有力的信息化條件保障。目前,某軍工科研院所信息化運維主要基于各類技術工具和管理平臺開展服務,自動化程度低、人工依賴度高,安全監管不足,既不能滿足用戶服務的高效性和便捷性,也無法對有限的信息化資源進行合理有效利用;同時,虛擬化、大數據、人工智能等新興技術日益發展并成熟應用,該軍工科研院所信息化運維技術也有待于更新換代,以縮小和先進技術的差距。隨著深入推進信息化建設,這些問題日益凸顯并逐漸被重視,成為亟待解決的重要項目。
關鍵詞:數字化;自動化;安全運維;信息系統
0現狀與需求分析
該軍工科研院所內網信息系統已經成為重要的基礎設施,是提高工作效率及開展日常必不可少的平臺及工具,信息系統的安全性、穩定性和可持續性的要求也越來越高。隨著第三輪軍工保密資格認證標準的發布,涉密信息系統和基礎設施的不斷擴張,信息化部門在運行維護過程中的安全保密要求越來越高,而基于現有手段和工具的數字化程度較低、安全監管難度越來越大。
上述問題的存在,從短期看,給信息化日常管理工作的開展帶來了諸多的不利。因此,搭建一套能夠滿足未來業務需求、提升信息管理工作質量及快速實現 “智能安全運維”的系統,從而建立完整統一的融合架構運維監控管理極為重要。通過業務的視角,基于人工智能動態算法,建模實現業務的監控,同時為提高運維效率,節約人力成本,建立自動化巡檢功能,在信息安全運維流程平臺建設初期,實現問題、事件、服務臺三大功能,基于ITSM信息安全運維體系的最佳實踐,滿足當前實際運維現狀,解決疑難問題
1系統設計
1.1設計標準
本運維系統的設計方案在ITIL和ITSS標準的指導下進行,同時結合實際情況進行方案設計。
建設的總目標是充分吸收軍工行業先進單位運維積累的豐富管理經驗,合理利用現有資源,適度引進外部專家的智慧力量,全方位多角度構建“一體化、自動化、智能化、標準化、規范化”的運維管理體系,有力保障信息系統的安全穩定運行。
1.2總體結構
數字化安全運維系統的總體架構建設為:
1)業務適配層, 提供各種豐富的采集處理引擎和協議適配器;
2)融合基礎架構運行監控管理(IOM),實現對網絡、主機、存儲、數據庫、中間件、應用系統、虛擬化等融合基礎架構資源的統一監控管理;
3)自動化運維管理(AOM),能夠基于客戶日常運維場景提供自動化的部署手段;
4)資源配置管理(CMDB),提供對所有資源的自動發現和自動服務關系映射、審計;
5)業務服務管理(BSM),從業務入手,統一管理網絡、服務器、存儲、應用、虛擬化資源,通過內置業務健康評價模型,動態展示業務整體運行情況;
6)IT服務管理(ITSM),提供了對運維服務過程的設計、過程記錄、監督與考核等事務的管理能力;
7)統一運維門戶(U-Portal),提供了統一的、可定制的運維門戶界面。
1.3系統功能
系統功能包含:
1)數字化運維監控管理,提供基礎架構設備軟硬件監控功能,實現多廠商設備管理;
2)信息安全運維流程,提供基于ITSM的流程管理平臺,對重復事件合并處理,主事件關閉后,所有重復事件自動關閉;
3)信息安全業務服務,對業務系統的用戶使用體驗進行管理和展示;
4)智能巡檢平臺,提供自動化巡檢,對業界主流網絡設備廠商的主要型號設備提供自動化巡檢服務;
5)業務駕駛艙與運維大數據展示,對平臺大數據概覽提供駕駛艙頁面,便于快速了解整體運行情況。
2關鍵技術
2.1統一數據接口
數字化安全運維平臺能打通各種現有數據平臺的數據接口,實現統一數據接口;對監控系統產生的數據進行存儲與管理,故將涉及到數據庫、分布式計算等技術。數字化安全運維平臺將統一各類孤島平臺的接口,包括管理平臺、流程平臺、存儲設備、網絡設備、安全設備、服務器、全員用戶終端、現場運維組等系統,實現運維統一軟件管理、統一流程管理、統一軟硬件管理、統一用戶服務和統一現場運維,達到運維一體化和標準化。
2.2數據可視化技術
為了讓運維人員更加直觀的看到運維數據,需要用到數據可視化技術.可視化技術是利用計算機圖形學及圖像處理技術,將數據轉換為圖形或圖像形式顯示到屏幕上,并進行交互處理的理論、方法和技術。
通過實現數據可視化,直觀地展示網絡數據地運行情況。此外,為了使監控系統能對故障發生預判,需要用到數據挖掘的相關方法,比如關聯規則、決策樹等。
2.3機器學習技術
如果想真正的實現安全運維,必然離不開機器學習的方法。機器學習就是讓計算機從大量的數據中學習到相關的規律和邏輯,然后利用學習來的規律預測以后的未知事物。
機器學習技術的應用場景分為三個階段:數據采集階段、數據處理階段和性能分析階段。往往在使用機器學習的相關算法前,需要相關領域的知識專家對數據進行一定的標注,當然標注不能完全靠人,也需要通過機器來自動進行關鍵詞標注。
2.4大數據技術
大數據是指所涉及的資料量在一定時間范圍內,規模巨大到無法通過目前主流軟件工具進行捕捉、管理和處理的數據集合。
通過安全運維平臺收集到的監控數據和報警數據,在大數據技術的基礎上實現挖掘數據與事件之間的關系、日志關聯分析和科學預警,最終為決策提供量化依據。
3安全運維應用實踐
目前,OA系統使用高峰時期,用戶登錄延時過高,影響科研工作的及時開展。部署安全運維系統后,可直觀的顯示OA系統業務使用情況,分析造成延時過高的原因并給出相應對策。當OA系統訪問量激增時,OA系統繁忙度會明顯增高。
通過安全運維系統的監測結果發現,做了負載均衡的兩臺服務器中,有一臺負載明顯高于另一臺,服務器負載均衡失效,導致服務器負載過高,無法同時處理高并發量的任務。因此,對兩臺服務器重新做過負載均衡后,OA系統登錄延遲得到了有效緩解。
4結論
本文結合信息系統現狀和需求,提出了配合運維工作的安全運維平臺建設方案,
并以監測解決OA系統使用延遲過高事件為實例,驗證了安全運維平臺對運維工作帶來的便利。結果表明:安全運維平臺可以提高運維效率和可靠性。下一步,可以在多種軟硬件環境和各類應用系統上充分測試后推廣應用。
參考文獻
[1] 郭佑君,曾錚,劉颋.ITSS在環境信息化運維服務中的應用[J]. 行業應用,2018(6): 60-62.
[2] 工業和信息化部軟件服務業司.中國信息技術服務標準(ITSS)白皮書(2010) [R/OL].[2018-05-16]..
[3] 楊嫻娟,丁三軍,陳紅梅,王文華.將ITIL融入軍工企業安全保密運維服務[J]. 第二十四屆全國信息保密學術會議(IS2014)論文集,2014(增刊): 33-38.
[4] 周宇潔.ITIL管理理論在IT運維服務中的應用[D]. 上海交通大學,2010.
個人簡介
何子慶,1993.01.23,男,甘肅天水人,碩士研究生,助理工程師,研究方向:計算機網絡,信息安全。