王曉杭
摘 要 網絡運維管理系統以行業的事實標準ITIL/ITSM為指導,采用分層設計,實現對IT資源的集中管理,整合監測,完成對單位信息系統的可用性評估和可視化展示。最終目的為了達到IT與業務相結合,以業務為核心搭建和管理IT系統,形成一個客觀、嚴謹、可量化的系統管理系統,為各項業務平穩運行提供技術支持。
關鍵詞 ITIL(IT基礎架構庫);ITSM(IT服務管理);SNMP簡單網絡管理協議
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)211-0113-02
在日常IT運行維護過程中,我們也經常會遇到如下問題:
1)上報故障無法及時回饋與跟蹤。
2)網絡中設備服務種類繁多無法全面監管,設備運行狀態缺少合適的監管方法。
3)由于業務復雜,支持其正常運行的設備多而復雜,無法抓住其核心節點,處理故障顧此失彼,在非核心環節浪費太多精力。
4)盡管信息化維護人員工作盡心盡責,但是缺少一個最佳的管理方案,造成信息使用者使用滿意度低,因操作失誤引起的故障不斷。
針對上訴問題,信息化團隊急需一套成熟完善的并可持續改進的緊緊圍繞業務開展的運維系統。通過構建一套信息管理系統,強化信息維護的支撐力,實現維護工作精確管理,完成維護可量化,提供高滿意度的信息服務,降低IT基礎設施方面的維護精力和成本。
1 系統概述
基于ITIL網絡運維管理系統以行業的事實標準ITIL/ITSM為指導,采用分層設計,實現對IT資源的集中管理,整合監測,完成對單位信息系統的可用性評估和可視化展示。最終目的為了達到IT與業務相結合,以業務為核心搭建和管理IT系統,形成一個客觀、嚴謹、可量化的系統管理系統,為我臺各項業務平穩運行提供技術支持。
網絡運維管理系統通過4個層面的功能實現完整的IT運維管理。
1.1 配置管理層面
實現對IT組件及其配置的識別,并形成具有邏輯關系視圖的配置管理數據庫(CMDB)和配置基線。在配置管理層面形成了對上層流程的信息支持。
1.2 整合管理層面
依據配置管理數據庫(CMDB)的邏輯信息,對 IT系統進行整合監測,形成完整的IT系統事態管理(Event Mgmt)。IT系統的整合管理包括:網絡系統、服務器主機系統、數據庫及中間件系統、存儲系統。
1.3 業務服務管理層面
依據配置管理數據庫(CMDB)的邏輯信息,形成組織機構的業務應用與IT組件的支撐關系,同時依靠IT組件的整合管理數據,完成對業務應用的可用性狀態感知和容量管理。
1.4 流程管理層面
在具有了配置管理數據庫(CMDB)的基礎上,可為IT部門提供依據ISO \IEC 20000標準的IT運維管理體系,為用戶形成“服務支持中心”和“服務交付中心”。
2 本系統主要特點
2.1 管理理念先進,架構設計合理
ITIL(IT基礎架構庫)/ITSM(IT服務管理)是一套公開的、基于業界最佳實踐制定,用于規范IT服務管理的流程和方法論。
系統以行業的事實標準ITIL/ITSM為指導,采用分層設計,實現對IT資源的集中管理,整合監測,完成對單位信息系統的可用性評估和可視化展示。最終目的為了達到IT與業務相結合,以業務為核心搭建和管理IT系統,形成一個客觀、嚴謹、可量化的系統管理系統。
系統幾個關鍵模塊說明:
1)CMDB(configuration management DataBase配置管理數據庫):用來存儲IT系統中所要進行管理與監測的CI。
2)CI(Configuration Item配置項):所指IT系統中需要管理與監測的某單個資產,如“機構、人員、角色、交換機、服務器、數據庫、中間件、OA服務、文檔“等都屬于CI。
3)CI關系(Configuration Item Relationship配置項關系):所指“機構、人員、角色、交換機、服務器、數據庫、中間件、OA服務、文檔“之間的組成、連接、涉及、使用關系。
2.2 功能強大,使用方便,提升工作效率
系統包含功能模塊有:自動發現、IT資產與配置管理(CMDB)、整合監測,業務服務管理(BSM)、IT運維流程、報警、報表、視圖展示、系統設置等。操作主體分為四大部分,基本涵蓋了日常運維工作的方方面面。
2.3 B/S模式快速部署,自動發現,及時提醒
B/S模式快速部署,隨時隨地方便查看和使用管理系統。通過SNMP協議自動發現IT環境中設備,并將已發現的路由器、交換機、服務器、中間件、數據庫、應用系統的類型與廠商自動識別,添加到IT基礎監視器,對發現的IT組件進行整合監測,形成完整的IT系統事態管理,通過豐富的顯示模型,展示業務系統的可用度,完整性。
3 詳細技術內容
網絡運維管理平臺是一個綜合性管理平臺,包括配置管理層;整合監測層;流程管理層;業務服務管理層;實現對網絡中IT資源管理,集中監測,對業務可用度評估展示,故障流程處理設定和評估等功能。
3.1 自動發現
自動發現及配置向導。自動發現IT環境中已開啟SNMP協議設備,并將已發現的路由器、交換機、服務器、中間件、數據庫、應用系統的類型與廠商自動識別,識別后自動發現網絡拓撲圖,自動掃描每類設備的CI添加IT組件基礎監視器。不掃描設備,從拓撲發現開始,自動發現網絡拓撲圖。CI掃描及監視配置向導,自動發現路由器、交換機、服務器、中間件、數據庫、應用系統的子CI與CI監視器。
3.2 IT資產與配置管理(CMDB)
配置CI 即Configuration Item配置項,所指IT系統中需要管理與監測的某單個資產,如“機構、人員、角色、交換機、服務器、數據庫、中間件、OA服務、文檔等。設置之間的相關項CI關系。包含有組成關系,連接關系,使用關系,設計關系。
3.3 整合監測
根據IT資產與配置管理部分生成管理數據庫(CMDB)的邏輯信息實現對應用、主機、網絡設備、存儲、環境、日志管理的進行整合監測。
3.4 業務服務管理(BSM)
依靠IT組件的整合管理數據,在監測同時完成對業務應用的可用性狀態感知和容量管理。劃分業務層,包含4個業務服務層。
1)業務層,體現機構內部的業務部門,如“運維中心”,“技辦室”。
2)服務層,體現機構內部的業務服務。如“OA”,“技術區”。
3)IT基礎設施層,體現機構內部支撐業務服務的IT基礎設施,如“服務器、數據庫、網絡設備”。
4)運維支撐層,體現對于IT基礎設施中的服務器、數據庫、網絡設備提供技術。
3.5 IT運維流程管理
在具有了配置管理數據庫(CMDB)的基礎上,實現的IT運維管理體系,完成IT運維流程管理,包含:服務臺、事件管理、問題管理、變更管理、發布管理、任務管理、巡檢管理等。
1)服務臺:提供對終端用戶提交用戶業務請求與保修請求。
2)事件管理:提供對于終端用戶所提交的請求與自動監測發現的請求分類集合,并能對事件進行橫向與縱向轉交處理。
3)問題管理:提供對一個事件多次發生,相同事件大范圍發生類型的事件進行產生根源分析與解決方案制定,并提供知識庫對解決方案分類歸納。
4)變更管理:提供因事件所產生的變更請求遞交與變更風險分析、審核。
5)發布管理:提供因變更所需要進行實施的工程項提供發布過程。
6)任務管理:提供對IT環境中的任務制定。
7)巡檢管理:提供對IT環境中的業務服務巡檢,檢查業務服務狀態。
3.6 報警
系統通過多種類型報警,是故障信息及時送達到相關維護人員。包含有:1)郵件報警:配置郵件報警可自動將事件發送給指定郵箱地址。2)短信報警:配置短信報警可自動將事件發送給指定手機號碼。3)消息報警:配置消息、聲音報警可自動將事件的產生通過聲音提示。
4 應用情況
該系統軟件功能豐富實用;操作簡單、方便、快捷;運行安全、穩定、可靠。自2016年初投入至今,使用將近兩年,系統多次提早發現提醒信息系統故障,為國家廣播電視總局八三一臺各項業務平穩運行提供保障。
參考文獻
[1]尚云云.IT運維服務管理支撐系統的設計與實現[D].北京:北京交通大學,2009.
[2]周宇潔.ITIL管理理論在IT運維服務中的應用[D].上海:上海交通大學,2010.
[3]曾球榮.ITIL在中小型企業IT運維管理中的應用實踐研究[D].廣州:華南理工大學,2011.