王月 李明
[摘 要] 本文首先提出IT運維管理的發展趨勢,并對國內企業IT運維管理現狀進行分析。在現狀分析的基礎上,結合IT運維管理領域的發展趨勢,提出國內企業IT運維管理存在的問題。在充分借鑒IT運維管理最佳實踐以及結合國內企業IT運維現狀特點的基礎上,提出一套適合國內企業運維特點、滿足企業未來IT發展需求的IT運維管理模式,以及提升IT運維管理水平的建議。
[關鍵詞] ITIL;IT運維管理;國內企業
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 06. 014
[中圖分類號] F270.7;TP307 [文獻標識碼] A [文章編號] 1673 - 0194(2014)06- 0019- 03
近幾年,國內企業均將建成世界(國際)一流的大型公司作為其發展目標,這就需要與之匹配的信息系統平臺作支撐。自2000年以來,國內大型企業的信息化工作進入到一個快速的發展時期。按照整體規劃,國內大型企業已經實現了集中建設的目標,今后將繼續推進系統深化應用,并實現集中化運維管理,這給傳統模式的運維工作帶來了巨大的挑戰。因此,亟需構建一套先進規范、運行高效的運維管理體系來滿足提升管控能力的要求。
1 IT運維管理發展趨勢
1.1 向集中化管理轉變
集中化管理是當前IT運維管理的發展趨勢,對主機設備、網絡設備、存儲設備、備份設備、數據庫、中間件、應用軟件、桌面系統等進行“集中監控、集中維護、集中管理”成為企業IT運維管理的必然選擇。
1.2 注重與業務的融合
IT運維管理體系越來越注重與業務的融合,正逐步向業務靠攏,IT部門正在由從一個純技術中心逐步轉向服務導向的中心,目標更是直指業務中心。同時,以業務為中心,驅動IT系統的建設和運營管理,在提高IT效率的同時推動業務價值的形成。
1.3 以ITIL為最佳實踐,指導運維工作
目前,ITIL作為當今IT運行服務管理的主要方法論已經被歐洲、美洲、澳洲、亞洲的很多企業采用,全球已經有1萬多家知名的公司在參考里面的方法管理自己的IT系統。ITIL已被認為是世界IT服務管理領域的標準,同時也使得ITIL在IT服務管理中應用越來越廣泛。
1.4 向自動化管理發展
目前,越來越多的企業開始運用專業化、標準化和流程化的手段,來實現運維工作的自動化管理。通過自動化監控系統能及時發現故障隱患,將IT運維服務由“被動”變為“主動”,防患于未然。例如,全天候自動檢測與及時報警能夠實現IT運維的“全天候無人值守”,大大降低IT運維人員的工作負擔。與此同時,通過自動化診斷能夠最大限度地減少維修時間,提高服務質量。因此,對于越來越復雜的IT運維來說,自動化管理是提升IT運維管理的過程,也是未來一個重要的發展趨勢。
2 國內企業IT運維管理現狀
2.1 IT運維管理現狀
隨著信息化的逐漸深入,企業的應用系統日益復雜,特別是數據集中之后,業務對IT持續運行的需求日益強烈,同時保證系統7×24正常運行也變得尤為重要。IT服務管理理念引進中國后,國內信息化的建設在參照了國際的流行趨勢后,結合國內企業的現狀進行運維管理體系的建設,在一些企業取得了重大成就,并且國內企業充分結合ITIL最佳實踐和企業的IT運維管理的現狀,從整體上提升了IT系統的運維管理水平。
通過調研中石化、中海油、國家電網、中煙信息4家企業的IT運維管理現狀,從運維體系、流程、工具、團隊4個方面進行對比分析(見表1)。從表1案例來看,IT運維管理都借鑒ITIL國際標準建立了相關流程,并遵照實施,其共同之處體現在以下4個方面:
從運維體系來看,中石化、中海油、國家電網、中煙信息均采用三級運維體系架構。
從運維流程來看,服務交付域和服務控制域中涉及的事件、問題、變更、發布、配置5個流程已得到全面應用,這5個流程是快速響應和解決用戶提報問題的關鍵流程,直接決定運維服務水平高低。通常與流程相關的關鍵績效指標會在與客戶簽訂的服務級別協議(SLA)中體現出來,之后這些指標會在內部團隊和外部供應商之間進行分解,以保證服務的可靠性和可用性。
從運維工具來看,多采用與ITIL流程吻合度高、先進、應用廣泛的運維管理平臺,如SM7和Remedy。這些平臺的應用,使運維人員和運維流程得到固化;同時,也使知識庫的作用得到最大限度的發揮,運維服務能力得到不斷提升。
從運維團隊來看,出于信息安全的考慮,大多為內部支持隊伍,且少有將全部運維工作外包出去。這些內部支持隊伍均取得ISO 20000認證,或者運維相關資質如CCOE認證。
2.2 IT運維管理存在的問題
在現狀分析的基礎上,結合IT運維管理領域的發展趨勢,可以看出國內企業在以下幾個方面需要改進。
2.2.1 向集中化管理轉變各企業的運維水平參差不齊,缺乏工具支持
目前各企業的運維管理水平也存在較大差距,有些企業已經初步建立了運維管理流程和工具,但在實際執行效果上并不盡如人意;更多企業的運維管理工作還處在不盡規范的狀態,缺少相關的管理流程和工具,更多的是依靠運維人員的個人能力維系業務系統的運維管理。另外,有些企業的信息系統運維工作缺乏有效工具的支持,運維流程效率的體現很大程度上依賴于適當工具的使用,包括監控系統去獲取客觀的數據,IT服務管理平臺掌握對運維流程關鍵點的控制等。
2.2.2 系統建設與運維并舉,運維管理環境和運維團隊尚不穩定
目前從總體來看,國內企業的信息化還處在建設和運維并行的階段,而且這種特點還將持續較長一段時間。這種并行特點給統一和整合的IT運維管理體系的建設帶來了環境和團隊方面的挑戰。
2.2.3 量化考核和評價機制需進一步完善
目前,國內企業的IT部門量化考核和評價機制還不完善,缺乏服務質量評價指標體系。而為配合運維管理工作規范化的開展,應提前制定必要的管理制度、績效衡量和質量評價體系等,這些內容是實現運維管理工作目標的必要手段。
3 國內企業實施IT運維管理的對策建議
未來,運維管理模式的建設方向是一體化集中管控模式。為此,國內企業在設計運維管理模式時,必須考慮組織特點和未來的發展方向,尤其要考慮,隨著基礎設施、應用的大集中模式的實現,未來國內企業會搭建以IaaS、PaaS為主,逐步嘗試SaaS的私有云,集中化的運維管理模式必須能夠支撐未來企業云環境的管理。
3.1 IT運維管理模式建議
借鑒IT運維管理發展趨勢,結合國內企業的現狀特點,建議IT運維管理以統一的技術工具平臺為支撐,遵照統一規范的運維流程執行,明確出人員角色,涵蓋三級運維體系。IT運維管理體系的建設涵蓋組織模式、管理制度、管理流程、績效考核、知識管理、技術支撐等內容。
3.1.1 組織模式
為了實現一體化集中管控的運維管理,建議將運維管理機構、運維服務機構到后臺支持團隊3個層次進行統一,按照業務設立統一的運維團隊,為用戶提供統一的IT運維服務。
3.1.2 制度規范
管理制度體系分為“信息化運維管理辦法”、“各服務管理流程序文件”、各信息系統項目根據具體情況再制定實施細則和操作指南以及表單4個層次(如圖1所示)。
3.1.3 管理流程
建立統一的服務管理流程,包括分別面向用戶的服務支持流程,如事件、問題等流程。以及面向客戶服務交付流程,如容量管理、可用性管理等流程。
3.1.4 績效考核
績效考核從IT運維管理體系的目標出發,按照組織、流程和崗位角色分解,形成“IT運維組織KPI關鍵績效指標—流程KPI—角色崗位KPI”3層相互關聯的績效考核指標體系。
3.1.5 知識管理
整合知識資源,建立一套“統一、集中”的運維知識管理平臺,以便為總部及所屬企事業單位IT運維工作提供支持。
3.1.6 技術支撐
建立集中統一的運維管理平臺,包括服務流程平臺、監控平臺、知識管理平臺等。
3.2 提升IT運維管理水平的建議
3.2.1 各企業參照統一標準搭建運維管理體系
各企業運維管理體系采用急用先上的原則,將目前存在的問題最突出的內容、日常運維中最不可或缺的內容建設完成,按照系統搭建運維服務臺,建立統一的用戶服務體系及內部管理體系,具備必要的運維管理能力,改變目前無流程、無工具或流程執行不到位的現狀,初步搭建規范統一的運維管理體系。
3.2.2 配套運維管理工具,提升體系的執行效率和效果
通過運維工具可以實現對IT服務過程工作流程的精確管理,將人員和流程固化,實現運維人員、流程、技術的有機整合,實現常規及突發狀態的應急管理,實現運行故障的提前預警。同時,從管理、制度和技術等角度出發,將系統運維工作相關信息、資源進行整理、分類,建立統一的、不斷豐富、完善的運維知識庫,為運維人員學習培訓、信息共享提供方便,從而提升管理體系的執行效率和效果。
3.2.3 建立持續優化機制,確保體系高效運轉
運維管理體系建設是一個持續發展、不斷改進的過程。體系實施后,在規范日常工作的同時,注重加大自檢力度,成立檢查小組,定期檢查數據、記錄及職能角色等執行的合規性,產出表單的完整性,認真出具自檢報告。對體系執行過程中存在的問題提出改進措施,并跟蹤監督落實。同時,隨著人員素質和知識水平的提升以及運維管理模式的轉變,運維管理體系也需持續改善,改進和優化運維管理流程,以適應業務部門和管理不斷升級的需求。因此,要建立持續優化管理體系機制,加強管理投入,定期度量和持續優化管理體系,確保體系高效運轉下去。
主要參考文獻
[1]龐玉東,樊少明.基于ITIL的中國石油IT運維管理體系研究[J].信息技術與標準化,2012(8),50-53.
[2]李長征.國家部委IT運維管理體系案例[J].電子政務,2008(12):26-33.