曹璞,陳銳浩(深圳職業技術學院教育技術與信息中心,深圳 518055)
IT事件跟蹤管理提升網絡服務質量
曹璞,陳銳浩
(深圳職業技術學院教育技術與信息中心,深圳518055)
隨著國家對教育信息化戰略的推廣實施,建設智慧校園成為高校信息化發展主流發展方向,未來的高校信息網絡將是以物聯網為基礎的智慧化校園工作、學習和生活一體化環境,這個一體化環境以各種應用服務系統為載體,將教學、科研、管理和校園生活進行充分融合。作為智慧校園的基礎支撐設施校園網建設也從重硬件設施建設階段進入到整合應用加強IT運維服務管理為主要特征的運行維護階段。信息化工作的重心從初期基礎設施建設逐漸過渡到軟硬件建設的均衡發展,。運維服務質量的好壞成為衡量信息化工作是否成功的關鍵要素。
大部分校園網建設在網絡基礎設施、廣域網升級、云計算平臺、網絡安全部署等方面已投入入大量經費,但是在網絡運維管理方法、技術支持人員能力配備等方面顯得薄弱,在校園網IT運維服務過程中被動式服務和運維效率不高成為主要問題,主要表現在下邊幾個方面:
(1)對用戶請求事件處理過程管理中,缺乏有效地對事件處理監控跟蹤的機制,網絡運維工作隨意性大,不能提供可信的量化服務統計分析報告,運維質量難以監督、考核和評估。
(2)對關鍵業務和普通業務沒有建立事件處理的優先級和解決時限關聯,不能保障事件解決的實效性和IT資源的有效利用。
(3)對用戶請求的事件處理過程和結果歸類總結,缺乏解決方案知識庫積累。網絡運維知識和經驗僅局限在個人范圍內而不能有效共享,造成運維人員大量的重復性勞動。
針對上述問題,本文準備從完善IT事件跟蹤管理機制,逐步建立事件處理流程,合理處理事件的“輕重緩急”關系,結合IT運維中的問題管理,建立運維知識庫方面綜合提升運維效率來進行探討。
網絡運維事件管理是以校園網IT服務臺為中心,統一入口接受用戶服務事件請求,通過對事件問題流程化管理,采取SLA管理約束網絡服務質量,選定相應運維人員處理相應的用戶的請求并限定運維人員的處理時間期限;記錄完整的跟蹤用戶請求的解決過程。最終在事件管理的基礎上積累和總結運維解決方案提取形成IT運維知識庫,提升網絡服務的質量和效率,具體組成方式如圖1。
1.1事件記錄
通過IT服務中心,為用戶提供統一的技術服務支持接入入口,包括Web,Email和自助站點門戶等方式接受用戶服務事件請求。服務中心記錄用戶基本信息和事件詳細信息,如姓名工號、地點、聯系方式,事件發生時間、現象描述、影響范圍等。
根據IT運維的規律,多數事件請求具有重現性,重現的事件根據已有維護經驗采取措施就可以很快速地解決。服務中心自動將用戶服務請求定向為相對應類別的工單。根據運維技術人員的的職責范圍或工作類別,基于輪流或動態負載調度模式,自動合理地匹配工單,保證事件請求能被快速有效地接受處理。

圖1 網絡運維事件跟蹤管理
1.2事件調查
技術支持小組接收事件處理任務,更新事件狀態和歷史信息。并依據SLA協議和優先級矩陣管理事件時效,當一線支持人員沒能在約束時間內解決事件時,二線、三線專家小組介入對事件進行調查和分析。
根據SLA協議重新評價事件影響度和優先級,必要時進行調整;記錄過程中所有相關信息,包括解決方案、新增或修改的分類;將所有相關事件的更新、花費的時間以及處理結果反饋給服務中心關閉此類事件。經過服務中心反饋用戶的請求事件當前所處的狀態,盡快把解決措施提供給技術人員和用戶。
1.3事件恢復
在分析調查事件反饋的結果上,技術支持小組根據更新的事件信息,和建議的臨時措施或解決方案,解決事件并恢復服務同時更新事件歷史狀態信息。
1.4事件跟蹤監督
服務臺負責跟蹤和監督事件解決整個過程。為了解決對事件處理過程的全程跟蹤評估,通過預先定義設計好的的處理流程,管理和跟蹤所有事件。通過創建SLA指定條件并配置相應的響應時間和解決時間,提供多級升級策略,有效地追蹤SLA的違規情況,有助于保障每個事件在規定的或者最短的時間內得到解決,確保服務團隊的服務質量。
1.5事件關閉
事件關閉階段主要與用戶確認事件解決是否成功,用戶是否同意事件解決方案和方案的執行及確認最終結果;詳細記錄事件控制階段的所有相關信息,如用戶是否滿意及滿意度,處理事件所累計花費的時間成本,事件終止日期和時間。
問題管理主要目的是為了找出事件發生的根本原因,避免相關事件再次發生;與事件管理最主要的區別是事件管理是被動地解決事件,要求時效性,而問題管理是主動地消除事件的發生,減少事件產生的數量。
問題管理通過分析一個或幾個相關事件的發現事件根本原因,提前主動識別和修復問題,降低IT設施內部錯誤引起的事件產生對業務的不利影響。問題管理具有被動和主動兩方面。被動方面表現在發生事件后解決問題,主動問題管理則是在事件發生前識別并解決問題和已知錯誤。問題管理主要實現:
(1)記錄問題的癥狀并分析問題的影響。提供暫時的規避方法,保證服務可用性。識別未來發生的事件,使影響降低到最低限度。通過有效的錯誤控制,提高一次性解決率。
(2)允許運維技術員關閉一個問題時,同時自動關閉所有關聯的事件。在知識庫發布已解決問題的解決方案,用于將來參考。通過直觀的報表分析問題的趨勢,并找出永久性的解決方法。
(3)發布問題公告,避免用戶反復提交類似事件工單。記錄已知錯誤,用戶可以通過自助服務門戶檢索。
(4)為接收的請求記錄解決方案,記錄的解決方案可以做為知識庫。這樣接收到請求時,可以參考其記錄的解決方案來尋求解決它的方法,從而能夠減少解決問題和關閉問題的時間。
(5)知識庫是記錄和存儲常見問題的最佳解決方法。在用戶自助門戶公開知識庫,知識庫的積累可有助于推進網絡用戶的自我維護技能的提高。
提高事件管理時效性的措施根據事件管理的基本流程,可以從流程的每個銜接環節入手主動管理,在實施中應注意以下環節:
(1)減少進入事件管理流程的事件數量。服務臺應利用匹配知識庫等方法解決所受理的事件,提高事件一線解決率,減少進入事件管理流程的事件數量和非必要的流轉,從而提升事件管理效率。
(2)準確評定事件優先級別。按照事件受影響范圍以及后果嚴重性等因素來確定事件的緊急程度,然后根據緊急程度確定事件優先級別,針對不同優先級別事件建立具體的事件處理時效性指標,規范二、三線支持部門在指定時間內完成事件處理,及時向客戶反饋處理結果。對于服務已恢復、原因無法確定的事件應及時轉至問題管理處理。
(3)監管事件升級管理過程。服務臺可以創建事件審計角色,承擔跟蹤和監控事件處理過程的工作。及時判斷事件SLA違反狀況,根據已經定義好的事件升級程序進行升級。
(4)避免事件管理問題化。在事件管理過程中通常會出現的偏差是未能分清事件管理同問題管理的區別,在處理事件過程中去關注事件具體原因和解決方法,沒有將快速恢復因此中斷的服務放在事件管理首要目標。
(5)注重事件管理工具的建設。在事件處理過程中,應盡可能發揮工具的作用,將事件的跟蹤管理工作自動化,提高事件處理效率,借此提高各個事件處理的時效性。
IT事件跟蹤管理,問題管理及形成的知識庫系統,有助于形成網絡服務質量改進的良性循環。使用事件跟蹤管理生成的知識庫中解決方案可以提高服務臺第一時間解決事故的成功率。通過對建立事件處理的優先級和解決時限約束,用戶對事件處理完成時間和結果滿意度上升。
二、三線技術人員可以從大量重復的基礎性運維活動中脫身,有更多的時間集中分析深層次問題原因,提前發現問題和解決問題;形成知識庫,更好促進服務臺的第一時間解決事件成功率。
對用戶請求事件處理過程管理中跟蹤數據分析,可以提供可信的量化服務指標統計報告,實現對技術支持人員的運維服務質量進行監督、考核和評估。
通過IT運維事件跟蹤管理,對記錄用戶提交的請求事件處理過程的全階段監督,縮短服務請求解決等候總體時間,提高了網絡用戶滿意度。同時校園網運維服務做可持續循環改進。以IT服務臺作為提供網絡服務的切入點,部署運維自動化工具,實現網絡運維中的變更管理配置管理和發布管理,落實網絡運維服務管理流程化,保障校園網絡信息系統的穩定運行。
[1]唐琳,李偉.基于用戶體驗的“主動式”信息運維管理實踐.電力信息化,2013.11-3:89~93
[2]劉建鋒.部署運維管理平臺提高校園網運維水平 技術在線2011(30):94~96
[3]馬宇飛.面向IT服務的事故管理系統的研究與實現[D].北京林業大學2008
[4]文必龍,趙晶浩,張璇,趙滿.IT系統運維管理研究.計算機系統應用2013(03)1~5
Abstract:
According to the basic situation of College Computer Basis course in music college Internet plus background,studies the current situation of teaching at music college,proposes using the multimedia teaching software,MOOC,micro-lectures and flipped classroom on the Internet platform,uses a variety of mobile Internet platform as another solution.
Keywords:
Internet Plus;College of Music;Computer;Electronic Virtual Classroom;Micro-Lectures
IT Event Tracking Management to Improve the Quality of Network Services
CAO Pu,CHEN Rui-hao
(Educational Technology and Information Center,Shenzhen Polytechnic,Shenzhen 518055)
IT Event Tracking;Problem Management;Solution;Operation and Maintenance Knowledge Database
Research on Computer Basis Courses in Music College under Internet Plus
CHEN Tong,ZHU Zhi-hui,LIN Jie
(Department of Public Foundation,Zhejiang Conservatory of Music,Hangzhou 310024)
1007-1423(2016)18-0055-04
10.3969/j.issn.1007-1423.2016.18.013
曹璞(1973-),男,浙江縉云人,碩士,系統分析師,研究方向為計算機網絡、信息安全
2016-04-06
2016-06-15
IT運維事件中被動式服務和運維低效率現狀影響校園網信息化實施開展。通過對IT運維事件流程跟蹤機制的分析研究,以服務等級協議作為衡量事件解決時效性指標,結合運維問題分析管理和解決方案知識庫的建設,使網絡運維服務質量得以良性循環改進,從而提升校園網絡運維效率和用戶滿意度。
IT事件跟蹤;問題管理;解決方案;運維知識庫
陳銳浩(1977-),男,廣東潮州人,碩士,高級實驗師,研究方向為教育技術、信息安全、WebGL技術
IT operation and maintenance events in the passive service and low efficiency of the current situation impact the implementation of campus network information technology.The tracking of IT operation and maintenance of the event process mechanism analysis,the service level agreement as the measure to resolve the incident time indexes,combined with operation and maintenance management and analysis,solution knowledge base is set up,benign circulation improves the service quality of network operation and maintenance,so as to enhance the campus network operation efficiency and user satisfaction.