

摘要:為適應數字化時代對企業網絡基礎設施運維的新要求,探討了基于多源異構數據的IT智能運維體系的構建與應用,深度梳理了當前企業IT基礎設施運維的現狀和需求,據此提出了一個整合數據采集、分析、監控、自動化操作和安全管理等功能的智能運維解決方案。結果表明:采用該智能運維體系能夠顯著提升網絡運維的效率和安全性、實現對網絡設備和服務狀態的全面監控,有效預防和響應網絡安全威脅,支撐企業的數字化轉型。
關鍵詞:多源異構數據智能運維體系IT企業監控系統
ResearchontheConstructionandApplicationofITIntelligentOperationandMaintenanceSystemBasedonMulti-SourceHeterogeneousData
LUKangyan
ZhanjiangBranch,CNOOCInformationTechnologyLtd.,Zhanjiang,GuangdongProvince,524057China
Abstract:Inordertomeetthenewrequirementsofenterprisenetworkinfrastructureoperationandmaintenanceinthedigitalage,thispaperdiscussestheconstructionandapplicationofITintelligentoperationandmaintenancesystembasedonmulti-sourceheterogeneousdata,deeplysortsoutthecurrentstatusandneedsofenterpriseITinfrastructureoperationandmaintenance,andproposesanintelligentoperationandmaintenancesolutionthatintegratesthefunctionsofdatacollection,analysis,monitoring,automationandsecuritymanagement.Theresultsshowthattheintelligentoperationandmaintenancesystemcansignificantlyimprovetheefficiencyandsecurityofnetworkoperationandmaintenance,achievethecomprehensivemonitoringofnetworkequipmentandservicestatus,effectivelypreventandrespondtonetworksecuritythreats,andsupportthedigitaltransformationofenterprises.
KeyWords:Multi-sourceheterogeneousdata;Intelligentoperationandmaintenancesystem;ITenterprises;Monitoringsystem
隨著數字化轉型加速,企業對計算機網絡基礎設施依賴增強。全球數據流量未來五年將增長五倍,網絡安全事件頻發,對網絡穩定和安全性需求提高。智能化網絡運維(ArtificialIntelligenceforITOperations,AIOps)技術依托云計算、大數據分析、人工智能(ArtificialIntelligence,AI)和機器學習(MachineLearning,ML)成為保障網絡運行效率和安全的關鍵,實現網絡基礎設施的自動化監控、管理和優化[1]。雖然,領先的IT企業和金融機構已部署智能化NetOps解決方案,應對網絡擴張,但許多企業在實施中遇到運維平臺缺失、子系統集成度低、運維數據孤島等問題,降低了運維效率,增加了網絡運行風險[2]。面對網絡安全形勢的挑戰,迫切需要通過技術創新和系統整合構建高效、安全和可靠的網絡智能運維解決方案,為企業數字化轉型成功帶來希望。
1智能運維的關鍵技術
如下表1所示,智能運維實施需關注綜合監測技術、數據分析與可視化技術、智能決策支持技術、自動化運維工具、運維流程優化技術和安全防護與響應技術。
2系統架構設計
2.1總體藍圖
基于云技術的計算機網絡智能運維系統,以數據為核心生產要素,構建了一個全面的架構體系。該系統采用“1+N”模式,目標涵蓋網絡運營管理、生產組織及設備維護的現代化轉型[3],以維修業務策劃、用戶需求分析和生產組織優化等設計策略實現了資源的高效配置和利用。
2.1.1智能云主線
整合企業內外的網絡資源,構建統一的云平臺,依托云計算技術這一核心,推動大數據和人工智能技術的應用。利用云計算和邊緣計算的先進技術,提供集中的計算和數據分析能力,支持大規模網絡設備監測、數據分析和智能化監控。依托大數據技術,優化網絡安全運維和信息化服務,使服務的專業性和定制化增強。
2.1.2業務板塊創新
針對計算機網絡的管理、運營和服務需求,實施全生命周期的管理策略,構建全方位服務體系[4]。創新形成了包括智能監控、自動化操作、安全防護、故障診斷、管理決策、工具集成、信息展示等多個關鍵業務領域,在新一代信息技術的支持下,深入探索計算機網絡智能運維技術的應用,加強技術和業務的融合發展。
2.1.3全面安全策略
構建了全面的網絡信息安全策略,考慮到網絡的多層安全需求,實現智能運維系統的安全保護,建立完善的技術標準和設備狀態評估體系,推動計算機網絡智能運維的全面進步,最大限度地發揮智能運維在網絡安全管理中的核心作用。
2.1.4綜合能力構建
在智能運維的戰略指引和總體目標下,目標鎖定于構建智能化和數字化驅動的核心運維能力,實現服務全覆蓋、流程優化和信息共享。
2.1.5智能運維設備配置
配置了服務器、路由器、交換機及其在線監控設備、智能分析系統、安全防護工具等多套智能運維工具和設備,為實現網絡的自動化和智能化運維提供硬件基礎。
2.2系統架構
在架構設計上,計算機網絡智能運維系統采用了層次化和分布式架構,包含基礎設施與接入層(涵蓋數據采集、網絡連接和基礎設施管理)、平臺層和應用展示層。該系統能夠與網絡監控系統、環境及安全監控系統、自動化響應系統、時間同步系統等進行數據接口交換,實現對網絡設備狀態的實時監測、智能故障診斷和預警及設備健康狀態管理,構建完善的知識庫以支持故障應急指揮。
在計算機網絡智能運維系統中,基礎設施與接入層主要負責數據采集,包括服務器和網絡設備的狀態、故障記錄、操作日志、安全警報、配置管理、用戶活動追蹤、運維進程監控、性能評估、環境監測等。該層的設計使數據能夠從各個感知點無縫匯聚并融合,克服了信息孤島的問題,滿足了復雜的數據處理和應用需求[5]。網絡構建方面,該層支持站點間及站點到數據中心級別的有效連接,為數據傳輸和通信提供骨干網絡,并實現不同網絡層次間的無縫集成。
平臺層負責處理從基礎設施與接入層獲取的信息,并執行存儲、分析和計算任務。該層需要建立標準化的設備管理和健康評價指標體系,并能根據數據性質和應用需求靈活選擇存儲解決方案,優化運維數據的集成利用。利用數據挖掘技術,該層可以累積豐富的運維知識庫,支持基于人工智能的數據分析,為智能化決策提供必要的支持,從而以高效和精準的方式提供操作和管理的智能輔助。
應用及展示層為運維人員、管理層和維護團隊提供交互界面。這一層分為決策、管理、業務和接口4個子層。在決策子層,主要關注網絡系統運維的長期戰略、績效和成本管理;管理子層側重于檢修、維護流程和成本控制策略的制定與執行;業務子層依靠大數據分析執行網絡設備的實時監控、異常檢測、趨勢分析和可靠性評估;接口子層則確保系統與其他監控、安全、自動化響應等應用的數據和資源整合,促進跨領域的信息交流和協作,進一步提升網絡智能運維的效率和效果。
3系統功能
基于計算機網絡智能運維系統的功能需求分析,該系統能夠實現下表2中展示的核心功能。
3.1自動化監控檢測
利用高級監控技術,如自動化巡檢腳本和網絡性能監控工具,實時監控關鍵網絡設備和服務的運行狀態。系統支持自定義監控規則,以實現對網絡流量、服務器負載、應用響應時間等關鍵性能指標的自動追蹤和檢測,及時發送告警信息,確保網絡環境的全面自動化監控。
3.2操作智能化
集成了基于AI的自動化運維工具,能夠支持遠程自動化執行配置更改、軟件部署、故障恢復等操作。借助先進的機器學習算法,系統可以自動識別和執行最優操作流程,實現高度精確的操作執行和快速問題解決。
3.3安全智能化
融合了最新的網絡安全管理技術和工具,包括入侵檢測系統(IDS)、入侵防御系統(IPS)和安全信息與事件管理(SIEM)系統。結合訪問控制和身份認證機制,確保只有授權用戶能夠訪問敏感網絡資源和數據。系統利用高級的安全算法和加密技術保護網絡環境,防止安全威脅和數據泄露。
3.4診斷智能化
引入了基于AI的故障診斷和預測管理系統,對網絡設備和服務的實時數據進行深度分析,以評估系統健康狀態、預測潛在故障并實施預防性維護策略,這一功能幫助系統管理員及時發現問題并采取措施,避免故障發生或減輕其影響。
3.5管理智能化
采用全面的信息化管理平臺實現對網絡設備、配置、工作計劃和工單的數字化管理。系統通過數據分析和機器學習技術評估運維任務的效能,提供仿真培訓和決策支持,優化資源分配。此外,系統還能對網絡能源消耗進行監控和優化,提高能效和減少運營成本。
4結語
綜上所述,基于多源異構數據構建并應用IT智能運維體系可解決當前網絡運維面臨的數據孤島、效率低下、網絡安全威脅等挑戰。本文依托云計算、大數據、AI、ML等前沿技術,對智能運維體系的設計理念與關鍵技術進行了深入探討,詳細闡述了系統架構與核心功能,最終得出以下結論:(1)實施智能運維體系顯著提升了網絡運維效率,自動化監控檢測、操作智能化等功能的介入減少了人為操作錯誤,使問題可被快速題解決;(2)該體系能有效提高網絡安全性,利用IDS、IPS和SIEM系統,結合訪問控制和身份認證機制,為網絡環境提供了全方位安全防護;(3)全面監控與智能診斷增強了網絡系統的穩定性,系統可基于數據分析評估系統健康狀態,預防潛在故障;(4)智能運維體系促進了企業數字化轉型,在集成化平臺構建、運維模式創新等功能的支持下,運維流程得以改善,幫助企業更好地適應數字經濟時代的新要求。
參考文獻
[1]張海彬,羅玉林,區云帆,等.基于中鐵貴州智慧社區管理的多源異構數據集成方法[J].建筑技術,2023,54(22):2808-2813.
[2]李超.數字新基建背景下能源工業云網多源異構數據接入與融合研究[J].電子元器件與信息技術,2023,7(11):106-109.
[3]閆佳和,李紅輝,馬英,等.多源異構數據融合關鍵技術與政務大數據治理體系[J].計算機科學,2024,51(2):1-14.
[4]庫新勃,張海龍,楊帥.基于XML格式融合多源異構數據建設智慧社區數據管理平臺[J].電力勘測設計,2023(8):1-5,17.
[5]石俊杰,趙子巖,何永遠,等.基于多源異構數據湖平臺的電力信息通信多源異構數據清洗方案[J].電力信息與通信技術,2023,21(7):59-66.