李寧 蔣寧寧
摘要:智能化運維系統對大數據以及云計算技術進行了有效的結合,使IT運維服務的運維效率得到了提升,新興的大數據智能運維系統能夠從整體上實現對網絡的實時監控以及對大數據的分析。本文以大數據技術為中心,在大數據的背景下,從設計和應用方面對智能運維系統進行了相關研究。
關鍵詞:云計算;大數據;智能運維系統;設計
中圖分類號:TP311. 文獻標識碼:A? ? ?文章編號:1007-9416(2020)10-0000-00
1大數據智能運維系統的技術原理
相比以往的運維系統來說,大數據和智能技術在運維系統中的應用,使其具備了大規模數據搜索、快速處理以及大量業務開展等能力,有著極為關鍵的作用,新興的大數據運維系統,能夠使運維系統由傳統的自動化實現向智能化發展轉變,對其的應用是為了在減少運維資金的同時,提升客戶所獲得的服務質量和服務體驗。由于其有效的應用了智能混合技術,因此,其能夠實現對各類工作的動態化管理、對內存的合理計算分配以及對全方位的調度等,也就是說其能夠通過對資源的最大化利用,以此來使預算能夠得到最大化的節省。
大數據運維系統中,通過對大數據技術的基礎應用,使各項運維工作得到了全面的基本指標,以此來實現對各服務器數據運行的實時動態監測,并且,其對運行日志的統一收集,能夠通過對各種非關系類型數據庫的借助,實現對各項數據的多樣化保存。以此為基礎,在Hadoop數據集群中,統一輸入各項所收集到的數據,能夠實現大數據技術對此類收集數據的全方位離線分析,并且能夠實現對相應曲線圖的生成,此外,通過其與預先設定指標數據的對比,在關聯監控報警系統后,能夠實現對目標數據中心性能,以及可用性的實時監測,并且,還需要對其發展趨勢進行分析。根據以往數據以及算法,能夠使預算模型獲得相應的應用基礎,此外,需要根據運行狀況和問題,對未來的服務器發展進行合理的預測,運維人員根據所獲得的數據信息,能夠更好的對系統以及硬件資源,進行提前遷移和調整[1]。
2信息系統運維在現階段面臨的問題
2.1監控防護缺乏主動性
根據總結以往對問題的監控有著以下流程:首先在問題發生時,需要做好問題位置的查找工作,并且需要告知運維人員,運維人員在接收到通知后,需要做好對問題的解決。換句話說,一旦系統發出了警報,就意味著發生了問題,需要做好事后的控制工作,以及對其的管理。以此來方式進行監控,對運維人員有著較高的素質要求。主要是由于問題無法得到預防,如果在問題發生時無法在第一時間得到解決,就會造成十分嚴重的影響。
2.2傳統運維方式與大數據環境無法適應
指數增長是數據在大環境下的特征之一,對以往運維方式的采用,會導致海量數據無法得到利用,導致運維工作無法得到有效的開展。并且,以往運維階段所采用的方式方法,管理人員以及業務人員,沒有對運維數據進行全方位的分析,以至于運維人員無法通過運維工作,對大量數據進行有效針對的運維[2]。
3大數據智能運維系統功能設計分析
3.1智能警告
大數據技術以及智能技術在運行系統中的應用,能夠使其具有智能警告的功能,也就是說,以監控對象為基礎,根據其歷史數據以及日后的發展趨勢,采用統計學的應用原理,通過大數據技術對其功能的分析,能夠根據最終的性能數據,實現對被監控對象平穩性的判斷。并且,還能夠根據業務形態以及時間范圍,實現對被監控對象差異性,以及具體表現的判斷。最終根據動態閾值,能夠在不同的時間點內,實現對業務的實時監測,通過對動態閾值的借助,能夠使性能監測機制得到強有力的建設,對以往的警告檢測進行了極大的突破,在動態性、實時監督等方面具有一定的優勢,通過此類轉變,能夠使無法較高的出現得到盡可能的減少,以此來使用戶對系統異常性能的感知,能夠更加準確。
3.2分析預測智能化
所謂的分析預測智能化,就是在服務器內部通過對SMATR信息、syslog信息等不同類型信息的基礎應用,同時需要做好監督工作,以及對各種示例的實習等,在場景特征中,通過對LR的借助或對GBDT模型的引入,能夠合理的對服務器內部頻繁使用部件可能出現故障的概率和時間進行預測,并且能夠通過對相應措施的采取,實現對故障出現的預防,從整體上使IT架構具備了更強的可用性。此外,針對產品和定制來說,通過智能技術對標準容量的預測以及對方式的開發,能夠實現對動態閾值、閾值趨勢以及瓶頸點的獲取、分析以及預測,需要以IT系統對容量的預測為基礎。此外,以定制開發方式對流量的智能預測,能夠為數據中心以及多冗余鏈路,提供一種全新的預測技術,以此來實現對網絡流量的針對性預測,能夠作為決策依據,為流量數據的調度工作提供支持[3]。
3.3根因定位智能化
從本質上來說,這一功能能夠實現對系統故障源的定位,專家知識庫是其基礎功能,用于復雜場景下對IT故障源的定位。同時,所獲取到的故障源,能夠作為基礎,實現對故障影響范圍的計算,以及對故障的自動化處理等。
3.4智能能耗管理
在進行智能化管理的過程中,需要做好對服務器數據運行能耗的全面采集,以集群和業務為基礎,做好對服務器歷史功耗數據以及對采集數據的對比分析,同時,需要根據業務機制,對云平臺進行業務的調度,通過對用powercapping、powersaving等技術的使用,使系統功耗能夠從整體上得到優化,實現對系統基礎運行的穩定保障,使其功耗能夠得到盡可能的減少。
4大數據智能運維系統
從整體上來說,采集器、數據存儲、大數據分析以及數據展示,是大數據智能運維系統
的四大主要模塊,其有著不同的邏輯。這四個模塊能夠展示不同階段所采集到的數據。采集器模塊能夠使分布式采集有效的實現對目標的達成,數據資源能夠作為基礎,實現對采集工作效率的提升,例如主機、虛擬機等數據能夠起到技術支撐作用。采集器模塊將所有節點在內部的同一位置進行了集中,只是采集任務的執行方式有所不同,如果某個采集節點在其中的運行出現了停止,控制中心就需要及時對其進行監測和確認,然后需要由其他采集器負責采集本模塊的數據節點,以此來負責數據的采集,能夠具有連續性以及完整性。
綜上所述:相比以往的運維系統來說,大數據和智能技術在運維系統中的應用,使其具備了大規模數據搜索、快速處理以及大量業務開展等能力,有著極為關鍵的作用,從整體架構的角度來說,信息系統在云系統以及分布式系統中得到了不斷的完善,受到此類情況的影響,運維系統需要通過主動服務,實現對運維效率的提升,并以此為基礎,使客戶能夠獲得更強的感知能力,是目前最為重要的問題。
參考文獻
[1] 曹建軍.基于大數據的云計算中心智能運維系統的研究[J].計算機產品與流通,2019(7):150.
[2] 林剛.基于大數據云計算的鐵路智能運維系統技術研究[J].鐵道通信信號,2019,55(5):37-41.
[3]羅硯.基于大數據的信息系統運維智能化研究[J].郵電設計技術,2018(3):79-82.
收稿日期:2020-08-24
作者簡介:李寧(1980—),女,山西晉中人,本科,工程師,研究方向:計算機技術應用和系統運維。
Design of big Data Intelligent Operation and Maintenance System Based on Cloud Computing
LI Ning,JIANG Ning-ning
(Unit 91001, Beijing? 100841)
Abstract: The intelligent operation and maintenance system effectively combines big data and cloud computing technology, which improves the operation and maintenance efficiency of it operation and maintenance services. The emerging big data intelligent operation and maintenance system can realize the real-time monitoring of the network and the analysis of big data as a whole. This paper takes big data technology as the center, and studies the intelligent operation and maintenance system from the aspects of design and application under the background of big data.
Keywords: cloud computing; big data; intelligent operation and maintenance system; design