黃曉明
摘要:在信息技術飛速發展的時代背景下,IT運維已經成為IT服務中不可或缺的一部分。自從IT的應用和維護誕生以來,自動化已經成為其重要屬性之一,IT運維管理自動化取代了人工操作,是一種深入的探索和全局的分析。文章著眼于如何在當前條件下對IT運維管理自動化的性能和服務進行優化,實現投資回報最大化。
關鍵詞:IT運維;管理;自動化
隨著企業管理職能在體制逐步健全的過程中逐漸完善,企業內部對IT運維信息管理業務中,涉及的各項工作的細化程度也逐步提高。企業隨著內部的需求在發展,規模也在逐步的擴大,對于企業IT運維信息管理工作涉及的工作人員也越來越多,各個部門以及部門員工的分工也越來越明確,工作環境逐步變化、工作的邏輯性也逐步的增強,通過手工的方式已經無法跟隨企業在IT運維信息管理發展的腳步。
盡管IT運維管理的技術在不斷進步,但實際上很多IT運維人員并沒有真正解脫出來,原因在于目前的技術雖然能夠獲取IT設備、服務器、網絡流量,甚至數據庫的警告信息,但成千上萬條警告信息堆積在一起,無法判斷問題的根源在哪里。另外,目前許多企業的更新管理絕大多數工作都是手工操作的。即使一個簡單的系統變更或更新往往都需要運維人員逐一登錄每臺設備進行手工變更,當設備數量成百上千時,其工作量之大可想而知。而這樣的變更和檢查操作在IT運維中往往每天都在進行,占用了大量的運維資源。因此,實現運維管理工作的自動化對企業來說已迫在眉睫。
一、IT運維管理自動化概述
IT運維管理自動化是IT運維中的高工作量任務。IT運維管理可以減少人工操作,實現自動化操作,減少運維人員的負擔,提高運維效率。IT運維自動化是維護設備正常運行的方法,還可以使管理設備正常運行,及時發現和解決檢測終端設備存在的問題。IT運維自動化是保證整個管理過程實現標準化、自動化的基礎,促進企業實現信息化目標。IT運維信息管理業務是對企業內應用系統在運行過程的維護工作進行管理,IT運維信息管理是企業信息化形成規模以后逐步產生的一項業務管理工作,并隨著企業的發展而逐漸的形成規范的、層次分明的業務體系。
現在,許多企業已經開始采用IT運維的核心戰略,而IT部門在現代企業中扮演著很重要的角色。企業領導把信息技術作為推動因素,與國外的發展相比,我國的信息服務管理還處于發展階段。隨著數據中心運維市場的深入發展,數據中心軟硬件設備越來越復雜和多樣化,企業更愿意接受第三方運維服務,實現跨廠商的硬件維保和軟件運維服務,第三方運維服務商已經逐漸成長為和原廠服務商勢均力敵的力量。以專業的數據中心運維服務為核心業務的IT服務商包括銀信科技、天璣科技、新炬網絡、海量數據等。這類企業在下游行業客戶的布局當中各有側重,如天璣科技重點服務于電信運營商,而銀信科技則更多的面向金融行業客戶提供運維服務。IT部門可以有效地控制成本,降低運營成本和風險,增加企業整體的投資收益,使企業獲得更多的效益,提高企業的綜合競爭力。
二、企業IT運維存在的問題
(一)工作效率比較低
信息系統架構的創新不僅能帶來效率提升、成本降低等管理價值,還能加速企業的差異化應用,成為保持核心優勢的關鍵。IT系統的運行、維護和管理是企業商業系統的保障,是企業生存和快速發展的支撐。在IT的運用及維護過程中,只有當涉及業務時,緊急情況才能被發現和處理。這種被動的“滅火”不僅增加了IT人員的工作量,而且使IT維護本身的質量難以提高。企業IT部門和部門對IT應用程序和服務感到不滿。早期預警機制的維護體系是不完善的。在出現故障或焦慮后,IT的使用和維護在許多情況下處于被動滅火狀態,而且在許多情況下,還會有惡意的連鎖反應。
(二)缺乏高效的IT運維機制
在公司信息化水平日益完善的同時,也需要更多的應用系統、軟件和硬件平臺,以及設備的維護和管理。如何有效地監控和管理結構復雜的IT系統,是企業信息部門面臨的一大難題。作為IT管理部門,經常會遇到很多IT障礙和問題,經常上演“拆東墻補西墻”的尷尬場面。無論是哪個公司,只要員工和IT系統發展到一定程度,在IT系統管理上必然會面臨一系列的問題。在IT運維管理的過程中,很多企業沒有實現完全自動化管理,沒有明確地劃分每個操作和維護人員。因此,在發生故障的情況下,由于沒有管理者負責及時處理事故,導致事故不能被及時排除。
(三)缺乏高效的IT運維技術工具
隨著企業信息化水平的不斷提高,越來越多的服務器、存儲設備和網絡設備將使IT系統變得復雜,每天都要進行維護和管理,但各種故障是不可避免的。這樣就會妨礙正在進行的工作,不能讓公司正常運營。造成這一問題的原因在于企業缺乏監測工具和故障診斷工具,難以及時檢測和處理各種故障。另一方面,基于OA系統,與財務、CRM、業務系統等構成公司的核心操作系統。這些復雜的核心系統是企業整體業務順利運行的關鍵。但是作為支持核心系統運行的IT基礎設施和運維系統,很多公司并不具備。現有的IT管理工具側重于技術層面的故障檢測和早期預警。雖然對發現的事件有相應的管理流程報告,但還沒有找到合適的工具來提供全面、安全、穩定的運行支持。
(四)IT運維的績效考核機制尚不完善
主觀的績效考核難執行,客觀的績效考核難制定,模糊的績效考核難見效。目前在績效考核方面雖然采用填寫工作表的方式,對不同崗位的工作時間進行收集、評測和考核,在一定程度上體現了IT運維人員的工作量,但還是很難全面準確的反映IT運維人員真實的工作績效表現。例如,提交IT事件清單后,對事件的預判和優先級設置不統一,沒有規范性的指導文件。IT事件的處理只能依靠運維工程師的經驗判斷或習慣使用的主觀方法。有標識卻不規范,有處理卻不管理,有制度卻沒有很好的利用。因此,IT運維管理“輕標重維”的現狀容易造成員工技能水平參差不齊導致IT運維不穩定,直接影響維護體系的有效性。簡單地說,其還沒有擺脫傳統管理思維的束縛。
三、建立高效IT運維自動化管理的建議
(一)建立自動化運維管理平臺
構建IT操作和維護自動化管理的第一步,是構建一個IT操作和維護的自動化監控和管理平臺。服務器、數據庫、中間件、存儲、網絡、安全、備份計算機室、業務應用程序,通過客戶端等的監測工具,用戶運營規則的限制和IT資源的實時監控,實現自動監測,并通過障礙及管理平臺實現或者合并處理問題和中央集中式管理。
例如,它會在自定義周期內自動觸發,以便完成IT日常操作和維護檢查并生成檢查報告。包含自動化操作和維護,借助這種方式完成同步部署和升級系統補丁、數據備份、病毒檢測和刪除等工作。
(二)建立故障事件自動觸發流程,提高故障處理效率
所有IT設備應在出現問題時自動報警,無論是系統自動報警還是用戶報告故障,操作和維護屏幕上都應顯示紅色。然后,IT操作員只需根據相關數據逐步操作即可。因此,企業應提前建立自動操作指令流程管理,當設備或軟件異常或超出預警指標時,會發生相關事件,并向相關IT運維人員執行相關操作指令處理程序。IT操作和維護人員必須在指定的時間內完成流程中指定的鏈接和操作,以提高對IT操作和維護問題反應的效率。
(三)建立規范的事件跟蹤流程,強化運維執行力度
在IT操作和維護自動化管理的建立過程中,工作人員應該首先設置錯誤和事件處理跟蹤進程,并使用表格工具和其他工具記錄錯誤和處理,以建立操作和維護日志,并定期進行檢查。識別和發現問題的線索和根本原因。在實踐中,很多例子表明,按事件類型設置標準化處理和跟蹤指南可以減少IT操作和維護的任意性,并增強操作和維護的執行能力,從而顯著地減少失敗的概率。同時,用戶也應該能夠隨時從自助服務臺、服務臺等跟蹤錯誤請求的處理狀態。
(四)設立IT運維關鍵流程,引入優先處理原則
核心IT操作和維護流程的建立以及優先處理原則的引入,意味著CIO定義了IT操作和維護的每個核心流程,要求他們不僅定義流程是什么,而且指出其目的是什么,每個主要流程對企業的影響和重要性。同時,在配置自動化進程時,需要引入優先級原則。程序需要像往常一樣處理任務,并且特殊事件需要按優先級進行處理。即,將事件分解為日常事件和特別重大事件。IT操作和維護自動化管理的實現,意味著將IT操作和維護中的日常和大量重復操作自動化,從過去的手工操作切換到自動化操作。自動化是IT運維操作的升華,IT運維自動化不僅是一種維護過程,也是一種管理改進過程,是IT運維操作的最高層次,是未來發展趨勢。
四、結束語
隨著社會的持續發展,中小企業也開始成長起來。因此,IT操作和維護自動化需要進一步的開發,以滿足企業開發的需求。隨著企業信息化水平的不斷提升,IT操作和維護的自動化程度也在不斷提升。因此,IT操作和維護自動化應該有更好的軟件、更多的功能、更多的數據處理能力,并為更多的中小企業提供方便。要不斷提高IT營運及維護處理問題的效率及服務質量,我們需要建立一個IT營運及維護呼叫中心,該中心可將語音呼叫與業務數據連接起來,推動IT營運及維護自動化工作的發展。
參考文獻:
[1]李明富.東亞中國借助BSM實現IT運維管理自動化[J].金融電子化,2012(8):88-89.
[2]張曉明.IT運維自動化技術在電力系統內的應用[J].數字技術與應用,2012(11):105-105.
[3]陸春,黃杰,陳云.自動化配置技術在高校IT運維的應用[J].中國教育網絡,2013(12):79-80.
[4]張霞.基于ITSM的企業IT運維管理信息系統初步設計[J].制造業自動化,2016,38(8):120-123.
[5]王欽可.基于ITIL框架的IT運維管理系統設計與實現[D].湖北工業大學,2017.