畢進元
摘要:探究大數據自動化運維在企業中的應用價值和方法,從大數據自動化運維的應用架構和技術架構出發,闡述大數據自動化在企業發展中的具體應用及實踐,對推廣大數據自動化運維技術有重要意義。
關鍵詞:大數據自動化運維;企業;應用
在計算機技術的應用中,通過軟件等一系列非人為方式完成操作與控制即自動化運維。自動化運維技術的應用,在提高運維工作效率的同時,也減少了因人為失誤所造成的損失。當前數據中心規模不斷擴大,傳統的人工運維模式難以支撐數據中心海量大數據的應用。研究適用于數據中心的大數據自動化運維平臺,讓數據分析工作更加安全、智能和自動化非常有必要。
1 大數據自動化運維平臺設計原則
1.1 指導性
為避免人為因素導致的各種風險,數據中心自動化運維平臺的設計應當具有一定的指導性,利用計算機軟件技術在數據處理方面的優勢,通過科學的分析,對風險進行評估,為運維管理工作提供依據,從而提高自動化運維平臺的安全性,降低平臺運營風險。
1.2 實時性
自動化運維平臺的相關工作均以數據流的形式進行展現,因此,為保證自動化運維平臺的工作效率,數據的實時傳輸就是必要條件之一。數據傳輸的實時性,能夠使運維人員在第一時間掌握自動化運維平臺的工作狀態,并根據數據分析的結合,對可能存在的風險進行防范。
1.3 可靠性
數據中心自動化運維管理平臺建設的目的是實現以數據為參考的自動化運營和維護,因此,數據的可靠性就顯得至關重要。因此,在自動化運維中心的設計過程中,需要增加數據監控、對比、分析的功能,保證數據的真實、有效。
2 大數據自動化運維平臺建設目標
2.1統—數據存取
大數據平臺數據存取服務實現了異構、分布式數據存取,建設了統一的用戶管理和授權,滿足數據統一存取基礎的應用需求。但在訪問服務的負載均衡模式、數據存取安全控制及資源保護方面的需求也要求更精細化,需要在數據存取服務提供統一分配下多節點獨立服務的模式,更好地提高處理并發服務請求能力,同時也要加強數據跨庫訪問、異構數據庫關聯查詢的服務能力,以及存取訪問會話、流量等方面的管控能力。
2.2 資源隔離按需分配
隨著企業業務量接入的增加,對業務系統的用戶資源管理提出了更高的要求,一方面需要實現對用戶級的科學隔離,另一方面還需要充分利用技術環境如軟硬件資源池來加強對硬件級別資源的科學管理。因此通過對大數據自動化運維技術的應用可以實現多租戶管理,便于企業更好地落實管理制度。
2.3運行故障自動告警
運維工作是一項極為復雜的工作,對運維人員有著極高的要求,在運維管理工作中,自動化運維平臺需要對任務類型進行分類,并嚴格按照流程執行相關任務。但是,在實際應用中,自動化運維平臺出現故障的幾率較高,一旦出現故障,自動化運維平臺將向運維工作人員發出告警信息,并為工作人員解決故障提供指導。
3 大數據自動化運維平臺應用實踐
自動化運維技術的應用,降低了傳統人工運維模式下工作超時發生概率,將人們從重復性的工作中解放出來,大大提高了工作效率。不僅如此,基于計算軟件技術的自動化運維系統還可以實現自我狀態監控,對運維管理中的各種風險進行預估,并根據軟件中閾值設置的大小發布預警信息,從而降低自動化運維過程中存在的風險,減少因自動化運維風險導致的成本支出。為更好地支持企業數據中心大數據應用,開展大數據自動化運維技術研究和應用很有必要。
3.1 構建自動化運維管理平臺
自動化運維管理平臺是數據中心自動化運維平臺的核心,通過自動化運維管理平臺,能夠實現對數據中心自動化運維平臺所存在的風險提出預警,并對其中出現的故障進行快速恢復。在自動化運維管理平臺的構建中,需要借助服務端、數據庫、互聯網、計算機等技術,實現對數據中心海量數據的監控,通過科學的數據分析,對自動化運維風險進行評估,同時給出降低自動化運維風險的建議。
3.2 構建故障監控流程
故障監控流程,是指在自動化運維平臺出現故障之后,系統將自動對故障信息進行匯總,并啟動上報流程,將匯總后的故障信息發送至相關人員,并對這一故障將產生的風險進行預估,為運維人員后期故障的排查、處理提供依據,提高自動化運維平臺的故障處理效率。
3.3 完善事件跟蹤流程
自動化運維平臺的實現,是基于軟件對參數分析后的自我判斷,在軟件判斷行為做出之前,需要對數據庫中的信息進行比對,從而確保自動化操作的正確性。為實現的對自動化運維平臺工作情況的監督,自動化運維平臺的建設過程中,應當設計完善的事件跟蹤流,從而明確自動化運維平臺所發出的每一項指令,減少運維工作人員對系統的隨意操作,避免不必要的風險與故障出現。
3.4 增加關鍵流程管控
在自動化運維平臺的建設過程中,基于關鍵流程對整個平臺的影響,需要單獨進行管控。在觸發關鍵流程之后,運維人員需要對關鍵流程進行分析,詳細介紹該流程的含義、處理機制,以及對平臺的影響,從而為流程審批人員提供參考。除此之外,針對關鍵流程所產生的影響,運維人員應當進行特別監視,避免關鍵流程所引起的自動化運維平臺連鎖反應造成的影響。
結束語:
大數據時代的到來,促使政府、企業、高校工作的信息化程度不斷提高,以數據中心為代表的新技術為政府、企業、高校等各項工作的開展帶來了極大便利。加快數據中心自動化運維管理建設,降低數據中心管理過程中人為因素導致的故障,節約運維管理成本,提高管理效率,是數據中心運營管理的必然選擇。
參考文獻
[1]葉枝平, 蘇立偉, 楊秋勇,等. 基于大數據平臺的營銷監控自動化運維探索研究[J]. 電子世界, 2019, No.580(22):32-34.
[2]胡人卓, 費曉亮, 趙路寧, et al. 基于大數據的計算裝置自動化運維管理模式研究與應用[J]. 信息周刊, 2019, 000(032):1-2.