張珂
(陜西師范大學 網絡信息中心,陜西 西安 710062)
基于ITIL的高校校園網運維管理模式的研究
張珂
(陜西師范大學 網絡信息中心,陜西 西安 710062)
本文探討了基于ITIL的校園網運維管理模式,有效地將各種監控系統結合起來,最大效能地發揮各個監控系統的作用,為校園網用戶提供優質的服務。
ITIL;服務臺;知識庫;運維管理
隨著高校信息化建設的不斷推進,電子郵件、OA(辦公自動化)、VPN(虛擬專用網絡)、視頻點播、人事系統、科研系統、教務系統等等各種各樣的應用系統應運而生。用戶在使用過程中遇到問題的時候,絕大多數首先想到的是電話求助,而眾多的應用系統在網絡中心內部由不同的工程師負責。工作流程混亂,出現問題不知道該找誰負責。還有一種情況,一個大型的校園網擁有幾十臺甚至上百臺服務器、上千臺交換機,這些設備任何一臺出了故障,網絡中心都無法第一時間知曉并作出快速響應。
針對以上問題,高校校園網需要尋求一個系統,能夠有效地管理好網絡中的各個結點以及所有服務器。在網絡發生故障時,能夠第一時間準確地將信息傳達給相關責任人;在設備即將發生故障時能夠提前作出預警,而不是被動地等待電話。
目前市場上已經有很多基于SNMP(簡單網絡管理協議)的網管軟件,能夠實時監控網絡中設備的運行情況,通過短信平臺便可以第一時間將網絡故障反饋給管理員。但是就如前面所提到的,短信能夠發出去,可是發給誰呢?短信如何準確地發送給相應的管理員呢?本文探討了基于SNMP網絡管理平臺結合ITIL運維管理理念的一種運維管理模式。
ITIL(IT Infrastructure Library,信息技術基礎架構庫)是CCTA(英國國家計算機和電信局,現在已經并入英國商務部OGC)于20世紀80年代末開發的一套IT服務管理標準庫。 ITIL最初是為提高英國政府部門IT服務質量而開發的,但它很快在英國的各個企業中得到了廣泛地應用和認可。目前已經成為業界通用的事實標準,是目前業界普遍采用的一系列IT服務管理的實際標準及最佳實踐指南,包含著如何管理IT基礎設施的流程描述;它以流程為向導、以客戶為中心,通過整合IT服務與企業服務,提高企業的IT服務提供和服務支持的能力和水平。ITIL可以引導組織高效和有效地使用技術,讓既有的信息化資源發揮更大的效能。
ITIL的核心模塊是“服務管理”,這個模塊一共包括了10個流程和一項職能,這些流程和職能又被歸結為兩大流程組,即“服務提供”流程組和“服務支持”流程組。其中服務支持流程組歸納了與IT管理相關的一項管理職能及5個運營級流程,即事故管理、問題管理、配置管理、變更管理和發布管理,如圖1所示。

服務臺有時也稱幫助臺,即通常人們所指呼叫中心或客戶服務中心,它不是一個服務管理過程,而是履行服務職能。服務臺經常與事件管理緊密結合,用來連接其他的服務管理流程,逐漸被稱為一線服務支持的代名詞。
事故管理負責記錄、歸類和安排專家處理事故并監督整個處理過程直至事故得到解決和終止。事故管理的目的是在盡可能最小地影響客戶和用戶業務的情況下使IT系統恢復到服務級別協議所定義的服務級別。
問題管理是指通過調查和分析IT基礎架構的薄弱環節、查明事故產生的潛在原因,并制定解決事故的方案和防止事故再次發生的措施,將由于問題和事故對業務產生的負面影響減小到最低的服務管理流程。與事故管理強調事故恢復的速度不同,問題管理強調的是找出事故產生的根源,從而制定恰當的解決方案或防止其再次發生的預防措施。
配置管理是識別和確認系統的配置項,記錄和報告配置項狀態和變更請求,檢驗配置項的正確性和完整性等活動構成的過程,其目的是提供IT基礎架構的邏輯模型,支持其他服務管理流程特別是變更管理和發布管理的運作。
變更管理是指為在最短的中斷時間內完成基礎架構或服務的任一方面的變更而對其進行控制的服務管理流程。變更管理的目標是確保在變更實施過程中使用標準的方法和步驟,盡快地實施變更,以將由變更所導致的業務中斷對業務的影響減小到最低。
發布管理是指對經過測試后導入實際應用的新增或修改后的配置項進行分發和宣傳的管理流程。發布管理以前又稱為軟件控制與分發,它由變更管理流程控制。
隨著高校各種應用的不斷增加,各種各樣的監控系統平臺逐漸搭建起來,如:機房監控、主機監控、應用監控等。面對各種各樣的監控系統,技術人員如何面對,如何分工呢?這些監控系統如果和ITIL結合起來,便形成了我們要討論的基于ITIL的運維管理系統,如圖2所示。

ITIL為事件的處理提供了一套標準化的流程,即:事故管理→問題管理→變更管理→發布管理,如圖3所示。

每一個問題的出現都會按照標準的流程來處理。如:服務臺接到了一個故障申訴電話,或者監控系統捕捉到一個故障事件,服務臺接到了故障申訴之后,首先要將其遞交給“事故管理”流程,故障處理完成后,問題是否解決了呢?如果解決了,事故管理會將解決方案反饋給服務臺,由服務臺來將其生成“知識”存放于“知識庫”,以便于下次遇到類似的問題時能夠快速地找到解決方案。如果問題未得到解決,便進入下一個流程,即“問題管理”,會將這個故障升級成為一個“問題”,下次開會時便會討論看該如何解決這個故障。如果討論出了解決辦法,便會進入下一個流程即“變更管理”,變更管理需要做出變更處理:解決這個問題是否需要變更,如果不需要則直接反饋給服務臺,生成“知識庫”,如果需要變更,如:“配置變更”、“設備升級”等,則會產生一個變更的記錄,便于日后查詢。在“變更管理”中產生的變更,是否需要發布。有些變更需要大家都能夠看到,如“配置變更”。如果需要發布,便進入下一個流程“發布變更”,將產生的變更發布出去,這樣系統里的每一個技術人員都能看到,從“變更發布”中可以準確地得知 “這臺設備于何時,做了哪些變更?”,這樣在遇到問題時有助于問題的分析解決。
ITIL流程的每一個環節都有各自的流程,我們重點研究“事故管理”這一環節。如圖4所示,為ITIL中“事故管理”流程。

高校網絡信息中心人員的構成主要有:主任、副主任、部門負責人、技術工程師、臨時工、學生網管等。結合高校的實際運營環境,可以將學生網管定義為一線人員、臨時工定義為二線人員、技術工程師定義為三線人員。這樣,通過電話,或者監控系統捕捉到的故障事件,由服務臺工作人員手動或監控系統自動地放入“請求池”,請求池中的事件所有的一線人員都能夠看到,根據各自的分工,各自處理各自的相關故障。如果問題無法得到解決,則將問題升級到“二線”,如果“二線”無法解決則升級到“三線”,如果仍然無法解決,或者超越權限,等待批示,則轉入“問題管理”環節。
1.面向用戶,服務相對集中
在高校中,各種應用系統五花八門。用戶的信息化水平良莠不齊,在使用中遇到的問題也是方方面面。而用戶不需要區分這些問題,可將這些問題一次反映給“服務臺”,“服務臺”為用戶提供集中式的服務。這樣就避免了找不到負責人的問題,大大提升了服務質量。
2.業務流程規范
對于每一個事件或者故障,“服務臺”會進行跟蹤記錄,將問題提交給“后臺處理”,直至問題得以解決。解決問題的整個流程,可復制、跟蹤、查詢。
3.服務效率較高
“知識庫”中保存著以往故障處理的經驗和數據。服務臺工作人員可以通過查詢“知識庫”對問題做出準確的判斷和處理,大大地提高了服務的效率。另外各個監控系統和ITIL服務臺結合起來,能夠對各監控系統產生的“事件”第一時間做出反應,而不是被動地等待投訴電話。
4.責任分工明確,工作量考核方便
由于數據庫中會記錄每次事件處理的整個流程與結果,在每次進行工作量考核的時候,便可以對每個工作人員進行量的考核,進一步刺激了員工的工作積極性。
[1]Service on the Front Line:The IT Help Desk in Higher Education.Online available in http://www.educause.edu/ers0708/1507.
[2]趙春,任友群.“IT服務臺”對國內高校IT部門的啟示[J].中國教育信息化,2009(1):62-64.
[3]孫永杰.提高IT運維能力實現業務服務管理[J].華南金融電腦,2010(3).
[4]周宇潔.IT運維管理的最佳實踐[J].洛陽理工學院學報(自然科學版),2009(2).
(編輯:楊馥紅)
TP393.07
A
1673-8454(2011)05-0024-03