


[摘" " 要] 為探究國產化環境下智能運維技術的應用效果,文章以現階段我國智能運維技術為例,對智能運維系統進行分析。從智能運維系統的資源管理、系統監控、運維知識庫以及系統配置角度出發,逐步分析系統的功能結構,對云計算環境下的信息系統智能運維模式進行簡述,并通過實驗對智能運維系統進行分析。測試總結:國產化運維環境下的運維系統具有較高的運維效率,可成為推動國產化環境下信息系統自動化運維的動力。
[關鍵詞] 國產化;運維管理;自動化;信息系統
doi : 10 . 3969 / j . issn . 1673 - 0194. 2023. 03. 044
[中圖分類號] TP307" " [文獻標識碼]" A" " " [文章編號]" 1673 - 0194(2023)03- 0158- 05
0" " " 引" " 言
受信息化產業發展影響,信息系統的日常運維技術需要不斷提升,從而保障信息系統的穩定高效運行。在常態化信息系統運維環境中,對系統軟硬件進行科學規劃設計可解決信息系統的信息安全問題,促進系統運維進入智能化階段。我國信息系統智能化運維發展較晚,與發達國家相比其技術與管理方式皆存在欠缺。對此,本文將以國產化環境下的信息系統為例,對智能運維技術的應用進行研究。
1" " " 國產化現狀
在現階段我國信息系統的運維工作中,常規的系統運維存在系統配置較為煩瑣與運維成本過高等問題。其中,以人工運維方式為主的信息系統保障模式,既需要技術人員駐場以應對突發事件,同時又需要大量技術人員對系統進行常規維護,例如對系統的啟停服務、加載系統安全運行、參數配置和故障排查等。受系統與技術的發展影響,上述方法已經不能滿足信息系統運維工作新的要求,需要將其從人工運維轉向智能運維。目前,國內一些互聯網公司、軟件企業和科研機構均開始加強對自動化運維技術的研究,并已經取得一些成果。同時,在現階段的國內市場中也存在一些開源的系統監控軟件,例如Cloudinsight。已有智能運維技術可實現對信息系統的交換機、服務器以及路由器等設備的運行進行監控[1]。因現階段使用的智能運維技術僅可以實現對系統硬件與服務狀態的監控,當使用的開源監控系統全面部署到國內信息系統環境時將會產生無法兼容的問題,并且無法合理解決國產化環境下信息系統的運維問題。因此,需要設計一款基于國產化環境的高兼容性信息系統運維管理系統,以期提高當前我國信息化建設的配套技術水平。
2" " " 智能運維系統設計
2.1" "資源管理
智能運維系統中資源管理模塊主要承擔對信息系統資源數據的獲取與維護工作,該模塊工作原理是借助客戶端代理的方式獲取客戶端插件,并由此生成信息系統資源的初始數據,上述數據會分散存儲在系統下不同的文件中。資源管理模塊工作時會對原始數據進行一次數據的提取與整合操作,并由此自動構建信息系統下業務軟件與數據庫服務間的關聯關系,并最終生成一個完整的信息系統資源數據包存儲在智能運維數據庫中[2]。通過該模塊可支持智能運維系統實現用戶對信息系統資源數據的智能維護,且系統支持數據的Excel表格表現形式,以及該形式下的數據資源導入與導出。當系統用戶登錄智能運維管理系統后,便可借助表格或拓撲圖的方式查看資源信息和各資源間的關系,智能運維管理系統各模塊間的關系如圖1所示,各模塊的能力說明如表1所示。
2.2" "系統監控
基于上述資源管理模塊實現智能運維系統監控模塊的設計,監控模塊的工作原理如圖2所示。
信息系統的用戶可向監控模塊下的命令處理線程下達控制命令,此時處理線程會將控制指令進行轉換,使其成為客戶端代理可識別的格式并將命令調用至客戶端代理。信息系統下的客戶端代理借助SSH插件可實現結合調用指令進行具體操作的目的,并將命令的執行結果以字符的方式反饋至命令處理線程[3]。通過上述方式可實現結合不同控制指令命令處理線程,使其能夠借助調用不同字符串處理方式實現對字符串的解析,將解析過程中的關鍵信息進行采集并存儲至智能運維系統的數據庫中。因系統監控支持信息系統下用戶在軟件界面進行指令執行結果的查看功能,并且受到該功能設計模式的影響(基于消費者與生產者模式),雙方皆可借助消息隊列的方式進行通信。即命令處理線程可以獲得客戶端插件當前所執行的控制指令反饋信息,然后將實時反饋信息寫入線程的消息隊列,上述過程可視為消息的生產者;信息系統下用戶在進入監控模塊后便會建立日志監聽線程,即一種全雙工通信協議連接,此時日志的監聽線程便會實時讀取生產者消息隊列中的反饋信息,然后與瀏覽器進行信息的推送,此過程可視為消息的消費者[4]。整個監控模塊運行操作簡單,多數功能皆可通過用戶交互界面的方式實現直觀化操作。
2.3" "運維知識庫
智能運維系統的知識庫主要存儲信息系統常見故障以及解決方案的數據記錄,借助功能模塊可實現對記錄故障的一鍵排查。運維管理模塊可借助運維數據庫的方式進行故障查詢與知識的關聯,結合信息系統下數據庫與業務軟件之間的關聯關系,反推出所有與當前故障相關的數據庫服務,然后對數據庫服務進行一次停啟檢測。當上述操作全部完成后,需要進行一次業務軟件的重啟檢測,若存在尚未重啟的相關業務軟件,則需要立即進行一次同步重啟[5]。另外,在軟件故障的篩查過程中,信息系統的用戶可借助軟件界面的方式實現自行配置業務軟件的目的,上述故障排除流程如圖3所示。
因告警管理與操作審計模塊功能全部基于上述模塊而實現,且沒有較大的技術創新,所以不進行詳細論述。
3" " " 云計算環境下的信息系統智能運維模式
3.1" "運維組織架構
將上述智能運維系統應用到云計算環境下的信息系統中,首先需要了解其運維組織的架構,從系統的職能管理、技術支撐以及運維責任角度出發,對系統的運維組織結構進行合理構建。其中,職能管理部分主要承擔運維與運營管理兩方面內容。運維責任部分主要承擔發揮運維團隊的主體作用,首先承擔云平臺、軟硬件以及業務平臺等各項運維工作。而技術支撐部分則應當發揮第三方運維技術單位的主體作用,對信息系統的智能運維管理進行技術強化支持,從而促使智能運維系統在云計算環境下信息系統中的科學化應用[6]。
3.2" "運維崗位應用智能運維系統的效果
從云計算視角出發,當智能運維系統的資源管理模塊接入后,信息系統的服務管理便可得到穩定的控制,同時其虛擬化程度也將會得到明顯提升,進而會帶動云計算技術水平的進一步優化。并且,當智能運維系統全面落實之后,可進一步放大技術人員的信息系統運維管理水平,減少駐場技術人員的使用量,滿足當前我國云計算背景下對信息系統智能運維崗位人才的要求。另外,通過智能運維系統還可以提高信息系統遠程運維管理的能力,實現故障監控平臺數據的共享。
3.3" "智能運維系統對運維管理制度的影響
從我國信息系統運維管理的角度來看,云計算下信息系統的自動化運維模式的運維管理功能主要以云平臺作為技術支持,而信息系統自動化運維監控體系能夠得到科學的應用,主要得益于資源的封裝技術,通過量化服務的方式滿足現階段網絡用戶的現實需求,并為其提供更加快捷、優化且靈活的網絡服務[7]。同時,若要全面發揮智能運維系統在用戶、資源、服務和計費等層面的管理需求,則需要在運維管理過程中,為云平臺下信息系統的穩定運行提供科學的運維管理技術,保障云計算背景下信息系統智能運維工作的順利展開。
3.4" "智能運維系統在云環境下的運維范圍
為使云環境下智能運維系統能夠發揮出應有的價值,需要明確云環境下信息系統運維活動的具體范圍。對信息系統支持的業務平臺而言,其需要以虛擬機作為核心實現智能運維,從而將數據庫、第三方軟件以及運營平臺等功能融入其中。因對云平臺而言需要設定較為具體的運維范圍,并且范圍應當具有較高的特殊性,所以范圍的確定應當以云管理、虛擬化軟件以及監控平臺為主體,起到保障云平臺運維的理想效果,以期促進國產化云計算環境下信息系統運維的發展。
3.5" "智能運維系統在云環境下的安全性管理
在信息技術的支持下,我國信息系統智能運維管理將會更加規范,在企業級信息資產數據運維管理中,通常需要加強對智能運維系統應用的安全性管理,最大限度降低運維過程中信息泄露的概率,并隔絕病毒在云環境下信息系統的擴散。因此,智能運維系統的安全性管理應當以客戶端為對象,實現對數據安全的分級,進而全面提高云環境下信息系統智能運維管理的安全性。
4" " " 實驗驗證
4.1" "測試設計
為證實上述設計的可行性,將以編寫自動化測試用例的方式替換手工測試所需要進行的操作,同時借助自動化測試用例數據覆蓋率高的特性,避免出現人工輸入數據高度重復或覆蓋等情況,以期提高測試的執行效率和檢測效率。實驗基于國產化某信息系統平臺,服務器選用國產飛騰1500A型服務器,操作環境采用銀河麒麟4.0.1e,實驗數據庫為某國產數據庫。通過進行不同維度的用例測試,實現對所提系統的自動化檢測,即需要從GUI測試、接口測試以及單元測試等層面分別進行一次自動化系統的用例檢測,測試用例比例為1∶3∶6使用Selenium實現云平臺下所提智能運維系統的自動化測試。因資源管理模塊主要為數據的采集與整理模塊,系統監控模塊可視為被動運維管理模塊,因此實驗將針對運維知識庫和系統配置模塊進行設計。
4.2" "運維知識庫
信息系統下用戶登錄系統首頁通常會出現編輯維護功能以及業務辦理等模塊不顯示等故障。發現信息系統的故障后,用戶可登錄智能運維管理系統,由該系統進入知識庫界面,結合故障特征搜索對應的運維知識,然后點擊“處理”按鈕,此時智能運維管理軟件會按照如圖3所示的流程進行信息系統的故障排查,并將排查過程與執行過程展現給用戶。當對應故障排查完畢之后,用戶可通過再次登錄信息系統首頁的方式對編輯維護功能以及業務辦理模塊的功能性進行檢驗,以判斷運維知識庫的各項基礎功能是否得到一鍵排查。
4.3" "系統配置
智能運維系統的系統配置驗證場景為信息系統下的人員新增,其步驟如下:首先,在信息系統基礎數據庫中寫入結構化查詢腳本并執行,然后在其中插入人員的基礎數據;其次,進入系統下的組織機構管理軟件,將上述插入的人員基礎數據信息同步到信息系統的目錄服務當中;再次,進入系統的權限管理模塊,為上述插入新用戶進行角色與菜單權限的配置;最后,逐次進入其他功能業務軟件對記錄人員信息進行數據同步。在該配置實驗中,信息系統的用戶可應用智能運維管理軟件快速完成上述工作,并且能夠在用戶不熟悉智能運維系統各項操作步驟的情況下,實現結合故障問題的配置向導操作,幫助信息系統運維管理人員實現快速且精細化的運維管理。
5" " " 結" " 語
綜上所述,本文通過對國產化環境的分析,明確信息系統下資源管理、系統監控以及運維知識庫的運維設計,通過進一步分析智能運維系統在云計算背景下的應用,證明當前國產化背景下信息系統智能運維技術應用的需求與應用的必要性,通過設計實際應用過程實驗的方式,明確該智能運維系統應用在實際中的各項準備措施。實驗并未對所提方法的應用效果進行數據化分析,因此可在之后的研究中進行優化設計,證實系統設計的科學性。
主要參考文獻
[1]錢海,賈松江,楊飛,等.基于移動互聯的繼電保護設備智能運維技術研究[J].智慧電力,2019,47(11):60-66.
[2]呂培強,王加臣,楊啟明,等.物聯網+配網智能運維的創新技術研究[J].科技與創新,2017(2):161.
[3]廖建涵,唐忠,劉曉紅.應用大數據和人工智能技術構建醫院信息運維平臺的探討[J].信息與電腦:理論版,2020,32(24):124-126.
[4]張惠.信息系統運維階段信息安全風險評估工作研究[J].網絡安全技術與應用,2018(6):15-17.
[5]朱賀斌. 基于BIM及大數據技術的列控中心智能運維系統研究[D].北京:中國鐵道科學研究院,2021.
[6]張運德.異構服務器智能運維管理技術設計與實現[J].信息工程大學學報,2021,22(6):683-687.
[7][作者不詳].智和網管平臺國產化AIOps 監控+展示+運維+安管+日志+開發六合一[J].網絡安全和信息化,2020(1):108.
[作者簡介]孫偉(1971—" "),男,吉林長春人,高級工程師,主要研究方向:信息化管理、網絡安全。