姚成玉
摘 要
隨著各行各業業務的拓展和多樣化,對信息系統功能的強大依賴性越來越高,因此各種大中小型企業的IT構架規模也不斷在發展,運維水平質量也各不相同,這其中有大集群的復雜運維環境,也有質量相對差的運維環境,在現代不同企業中,自動化生產線的規模、運行方式以及需求方式也各不相同,因此在技術控制方面,通用的方法實現難度較大,但是,運維工具的使用與發展思路是有共通之處的。
【關鍵詞】運維工具 大數據 自動化生產線
1 運維工具介紹
1.1 運維工具應用階段
運維工具一般分為三個使用階段:
1.1.1 手工階段
利用人為的將軟件部署和運維進行重復的操作,完全沒有使用運維工具,充分利用個人的經驗來進行操作。
1.1.2 腳本階段
這個階段主要是通過腳本的編寫,對軟件的部署和運維,這階段的操作很方便,個人經驗非常重要,同時也很難對系統傳承,運維成本非常高。
1.1.3 工具階段
這個階段主要是利用第三方工具進行軟件的部署和運維,而且高效、運行方便。在半自動化階段主要是對系統進行檢測控制,對數據進行自動化采集,而這個過程主要依賴于人工進行處理;全自動化階段主要是對系統進行全生命周期的自動化部署和運維,不需要人工參與進來,完全的對運維知識庫的拓展與修正。
1.2 運維工具研究現狀
國外對運維工具研究的比較早,對IT服務管理規范和標準比較深入,并且非常完善,對世界起到了標準規范的作用。很多大企業的IT部門主要以ITIL為最佳時間參考,以ISO20000作為標準和規范,大部分是以自己的IT服務管理為主。大多數是以服務、價值運維為中心的發展階段,這樣就使運維實現了高度集中狀態,自動化程度非常高。
目前國內較少部分企業實現了運維自動化,而且運行的也非常好,例如百度公司實現了作業和管理兩個大領域的自動化。搜狐公司提出的“Smart IDC”概念,就非常新穎、創新,該目標實現了數據中心運維的自動化。
2 運維工具的分類
運維工具主要包括:運維工具管理工具、運維監控告警工具和運維發布變更工具,下面分別介紹各種工具的用途和特點。
2.1 運維流程管理工具
運維流程管理工具主要是結合在實際工作過程中流程管理需要,主要通過申請單、操作票等管理方式進行運維實際操作,對運維人員、運維事件等進行管控。
主要包括:
(1)流程管理工具對業務操作不予執行,主要是進行系統跟蹤和確保閉環,體現事件匯總工作關系,控制審批風險。
(2)告警和突發管理工具,通過這種工具可以確保故障中提煉總結經驗教訓,為業務的可控性提供指導,通過人工手段管理風險并且豐富知識庫。
2.2 運維監控告警工具
運維監控告警工具是對系統運行監控指標進行多種采集,比如網絡設備、數據庫、安全設備、主機、應用系統軟件等,并以圖像、短信、郵件等多種方式告知運維人員進行告警,這部分是目前自動化程度最高、工具類型最多、應用最為廣泛的運維工具。這種工具主要是zabbix,是一個基于WEB界面的提供分布式監視系統的企業級開源工具。它主要用于監控網絡上的服務器以及其他網絡狀態,能與多種數據庫搭配一起使用。隨時提供報警,采集的速度特別快。
現在所面臨的技術難點是各項工具采集目標滿足不了個性化需求,對校本化、接口化等第三方監控數據不理想,同時還存在大數據的讀取出現重存輕讀或者重讀輕存等現象,這樣就對設計數據采集和轉移讀取機制提出更高的要求。
2.3 運維發布變更工具
運維發布變更工具主要是對資源發布、資源調控進行統一的管理,根據實際的需要進行大批量下發的工具,即有主動發現發布變更,又有被動獲取下載的功能。
以上介紹了運維工具的類型和相應的特點,目前存在的技術難點在于相關工具使用方便程度較差,人工學習周期較長,對自動化配置更新方面還不夠成熟。
3 運維工具的發展方向
運維工具在系統自動化方向越來越受人們關注,越來越得到重視,因此運維工具未來發展方向是研究和開發人員研究熱點。它的價值不僅僅是保障系統運行以及處置故障,而應該從以下幾個方面開發和研究運維工具的價值:
3.1 事前干預運維工具
實施運維工具干預,對系統的源代碼、運行數據進行管理和分析,系統所需要的資源與其他系統進行橫向對比,同時也和自身運維變化的數據進行縱向對比,通過這兩種對比,實現對系統運行自動控制,對資源配置能充分預防式管理。這其中主要包括兩方面:
3.1.1 自動系統預先檢測工具
通過監控運行指標數據和分析代碼智能化,檢測和排除項目在運行過程中可能出現的隱患,就目前的情況來看,代碼的性能和安全問題是最主要的側重點。
3.1.2 系統資源分配策略制定
系統資源合理分配依據為系統運行知識庫,資源占用情況同比數據,這樣可以最大程度的避免浪費資源和資源不夠。
3.2 事中知識庫智能運維工具
事中知識庫智能運維工具是指系統在運行過程中出現的故障并能進行及時的診斷和分析,而這些診斷和分析是通過知識庫進行的智能選擇。這種工具與平時所應用的程序區別在于:知識庫的智能運維可以將相應領域的求解過程表達出來,而不是利用程序段中隱藏的代碼來解決問題。
因此,自動化系統通過知識庫方式的智能運維,可以非常好的解決某一領域的所對應的問題,因為運維知識庫相對比較簡單,同時將知識和信息進行有效的融合,這樣尋找和利用所需要的時間大大減少,從而極大程度的提高系統的有效性。
3.3 事后大數據挖掘運維工具
事后大數據挖掘運維工具主要特點就是對運維工具所產生的數據進行專業化處理,比如告警信息、日志信息等有意義的數據,對它們進行加工,實現運維數據的再次利用,這樣分析出監控資源的運行情況,分析所得到的結果給運維人員一些合適合理的建議,從而使運維人員更好的監控系統,掌握所需要的專業知識。
4 結論
隨著科技不斷發展,各行各業業務不斷擴大,運維方式也不斷在創新,從手工運維、到腳本運維,再到工具化運維,運維方式不斷在進化和改進,適應現代自動化系統的要求。通過運維工具把復雜的自動化系統進行簡單化,將運維人員從繁重的運維體系中解脫出來,是運維工作未來不斷發展的方向,同時也相信,運維工具將來也會越來越先進。
參考文獻
[1]王永.大數據抵御APT攻擊的可行性研究[J].電子制作,2015(10).
[2]李春鳴,肖軍,潘丹.大數據影響下網絡承載問題研究[J].科技創新與應用,2015(26).
[3]馬敏燕.大數據時代網絡信息安全策略研究[J].網絡安全技術與應用,2016(07).