楊旸 呼和 李為沖 張垚
摘要:隨著業務的不斷拓展,新系統的不斷上線,系統運維團隊的壓力變得越來越大。為提高運維工作效率,降低工作強度并控制人力成本,本文提出了了一種輕量級運維管理系統設計和實現方案。通過該系統,運維人員將能直觀地了解各個系統、服務器的運行狀態,并能方便地對各業務熱度和服務器壓力進行統計和對比,還能將運維經驗有效地收集、共享和討論,方便了其他運維人員和各系統用戶的工作,也為多地協作提供了解決方案。
關鍵詞:運維管理;監控報警;日志采集;交流共享;統計分析
中圖分類號:TP311.52 文獻標識碼:A 文章編號:1007-9416(2018)05-0172-02
1 背景
對于非專業IT公司的信息部門,運維團隊往往只有有限的人力物力資源。隨著系統不斷增加,運維壓力也逐年增加,需要一個自動化的運維管理工具幫助運維人員解決日常的機械性重復工作,把寶貴的精力集中在判斷和處理運維風險上;也需要一個平臺收集和共享運維人員經驗,并提供用戶查找、提問同時方便運維人員發現和反饋問題。
因此,我們需要設計一個能統一管理各個系統及相應資源的運維管理系統,協助運維人員監測和分析運維風險,同時提供一個用戶和運維人員交流的平臺,以提高工作效率。
2 平臺應當具備的功能
為了實現設計目標,系統需要具備以下功能:
(1)統一監控和管理:包括服務器、業務系統、數據庫、應用服務、業務關鍵服務、業務關鍵進程、各類硬件資源和各類賬號密碼等;(2)提問、檢索和交流:提供一個用戶和運維人員互相交流的平臺,并能將解決方案和經驗技巧分類保存;(3)及時通知和報警:包括各個監控對象的異常情況、用戶提出的問題、長時間未被反饋的問題和長時間沒有結題的問題等;(4)統計和分析:包括系統日志、應用服務日志、數據庫日志、業務系統日志以及運維工作量的統計和分析。
3 系統設計
3.1 統一信息管理平臺
對運維系統涉及的各個目標進行統一管理。以業務系統為單位,由各運維人員注冊服務器、業務系統、數據庫和應用服務信息;并填報正常運行所需的關鍵服務和進程信息、硬件資源信息;同時提供具有一定權限的服務器、數據庫、業務系統的賬號及密碼。
3.2 狀態監控平臺
為了實現狀態檢查的自動化,從機械化重復勞動中釋放人力資源,使用了基于Webservice和C/S端程序的狀態監測方式,各系統運維人員在運維管理系統中設定的周期檢查以下內容:
對于服務器、數據庫和應用服務的連通情況,主監測服務器主動進行通信測試;
對于關鍵服務、進程、硬件資源(如硬盤容量、CPU負荷、內存使用情況等)等,由C/S端監控程序根據預先設定的掃描周期通過各服務器上的監控WebService獲取目標后自動檢查,如圖1所示。
3.3 信息采集平臺
目標信息主要有兩種,非結構化(文件形式)的日志信息和結構化數據的日志信息:
對于各個業務系統數據庫中本身已經結構化的業務系統日志,直接按照預設的周期取出并標準化存入運維管理系統;
對于系統、應用服務、數據庫等以文件方式儲存的日志,將根據各系統運維人員在運維管理系統重配置的絕對路徑,由C/S端監控程序根據預先設定的掃描周期通過各服務器上的監控WebService獲取路徑后,按照增量采集策略,從文件夾中提取并標準化,再發送到運維管理系統的數據庫相應表,同時通過WebService獲取并重設下一個掃描周期。由于日志數量可能為海量數據,運維管理系統將根據日志類型、業務類型,每個月自動創建數個新日志表,如圖2所示。
3.4 交流共享平臺
為方便用戶根據系統或問題類型找到運維專家,同時方便運維人員討論和解決問題,并為日后統計工作量和貢獻度提供依據,基于網絡論壇設計了運維經驗交流共享平臺,如圖3所示。
3.5 統計和分析平臺
通過數據進行可視化處理(折線圖、散點圖等)使用圖表對自動采集到的日志數據、交流平臺運維工作記錄和監控報警信息進行統計,并通過基于Excel的協方差公式(COVAR)和協方差矩陣對n組數據進行對比計算,找到數據中正相關的變量(兩個變量的變化趨勢一致則協方差是正值)進行相關性分析,自動生成周報和月報等資料。
4 應用效果
運維管理系統在應用中取得了良好效果。經過對比,狀態監控平臺有效地減少了運維風險的發現和報警時間,縮短30%以上:交流共享平臺極大地提高了運維人員的工作效率和用戶滿意度,工作效率提高40%,用戶滿意度達到95%以上:信息采集平臺顯著地減輕了運維人員的日常運維工作壓力;統計分析平臺為領導決策提供了信息支持。
5 前景展望
運維管理系統已在廣大用戶和運維人員中廣受好評,下一步計劃從大數據和機械學習角度出發,挖掘現有海量數據的應用價值,對業務系統的日志進行同步分析,緊跟每個用戶的操作并學習各個用戶的使用習慣,為進一步優化業務流程、改進系統設計提供精準的數據支持。
參考文獻
[1]梅長林,范金城.數據分析方法[M].高等教育出版社,2006.
[2]任育偉,呂學強,李卓,徐麗萍.搜索日志中熱點查詢的內容抽取[J].計算機應用與軟件,2015,32(12):16-21.