曹 璞,莫 民
(深圳職業技術學院 教育技術與信息中心,廣東 深圳 518055)
高校網絡運維服務等級協議設計*
曹 璞,莫 民
(深圳職業技術學院 教育技術與信息中心,廣東 深圳 518055)
文章分析了高校網絡運維中被動式服務和低效率等現狀,通過研究網絡服務等級協議優先級矩陣模型中事件的模式、級別、影響度、緊急度指標相關性,設計了基于用戶體驗的“主動式”網絡信息運維管理體系.完善網絡事件處理流程和時限,引入人員虛擬成本計算來衡量工作績效,形成可實施的網絡運維服務系統,以提高校園網絡用戶用網體驗和滿意度.
優先級矩陣;服務等級協議;網絡運維;違規檢測
隨著校園網的基礎設施和業務應用的不斷擴張和深入,校園網業務應用對網絡服務的質量存在極大的依賴性,網絡服務能否有效、正常、平穩的運行, 對于廣大校園網用戶非常重要,也對網絡服務的質量提出了更高的要求.大部分高職院校都面臨學校網絡規模擴大和技術人員數量不足的矛盾,網絡服務又是一項持續的工作,需要不斷創新服務模式來滿足用戶的需求,如何提供有效快捷的用戶響應支持服務是高校信息化管理部門亟待解決的問題.
與在網絡基礎設施建設、廣域網網絡改造、業務應用系統升級、安全防護設備部署等方面的經費投入巨大相比,高校在網絡運維管理方法、IT技術支持人員等方面的建設要落后或脫節于軟硬件建設.在校園網運維服務中,用戶投訴意見主要集中在IT被動式服務和運維效率不高等.
1)對于網絡事件的處理,網絡運維部門雖已制定了一定的網絡事件處理制度和處理流程,但仍未覆蓋所有的事件處理,制定的流程也缺乏執行力,當出現緊急故障處理過程又復雜的狀況時,運維人員經常會不按照流程進行處置.
2)在網絡運維服務中,由于對業務梳理不夠清晰,關鍵業務和普通業務之間無明確的優先級參照,造成許多非關鍵業務消耗運維技術人員過多時間現象,技術人員疲于被動解決網絡事件.
3)網絡運維服務完成后,運維技術人員對請求的事件處理過程缺乏跟蹤和歸類總結.網絡運維工作隨意性大,運維質量難以監督、考核和評估.IT 管理的整體效率難于提高.
解決上述存在的問題,需要從提高網絡運維效率的角度出發,采取基于用戶體驗的“主動式”網絡信息運維管理體系[1],完善事件處理流程,減少運維人員被動工作強度,提高網絡用戶的用網體驗和滿意度.通過對校園網絡服務等級協議、優先級矩陣模型中事件模式、級別、影響度和緊急度指標相關性的研究設計,實現用戶的請求能按照符合服務等級協議的時效要求完成處理.
網絡運維服務管理框架是以校園網 IT服務臺為中心,通過Web,Email等多種方式接收用戶服務事件請求,對事件問題流程化管理,采取服務級別協議約束網絡服務質量,選定相應運維人員處理相應的用戶請求,限定運維人員的處理時間期限,并記錄完整跟蹤用戶請求的解決過程,最終積累FAQ解決方案,形成IT維護知識庫,反饋給用戶自助服務站點,從而提升網絡服務的質量和效率.網絡信息服務管理框架的核心功能模塊包括:網絡服務等級優先級矩陣、SLA管理、事件管理3大模塊,如圖1中虛線橢圓框內所示.

圖1 網絡信息服務管理框架
2.1 網絡服務等級優先級矩陣
網絡服務優先級矩陣是整個網絡服務管理框架中所有事件處理調度的參照標準.請求事件等級優先矩陣包含事件緊急度、事件優先級和事件影響范圍3個元素.
事件緊急度:是表明解決某個一定影響的事故所采取動作的緊急程度,從低到高設計為:低緊急度、中緊急度、高緊急度、極度緊急.
事件優先級:用于定義某一個事件請求的重要程度,從低到高設計為:低優先級、一般優先級、中優先級和高優先級.可采用不同的顏色來標記優先級.
事件影響范圍:用于衡量某個突發事件或者問題對業務影響程度的標準,一般從受影響系統的數量或者受影響人數的多少來進行衡量;影響范圍設計為影響單用戶、影響辦公室、影響院系部、影響校外用戶、影響全校用戶.
由緊急度、影響范圍、優先級三元素可生成如圖2所示的優先級矩陣表.定義優先級矩陣表后,事件請求可以歸類涵蓋到優先級矩陣表,從而保證所有事件請求都能有對應的處理優先級別.

圖2 優先級矩陣三元組
2.2 服務等級協議SLA
校園網業務應用對網絡信息服務的質量存在極大的依賴性,網絡信息服務質量的下降將給業務帶來嚴重的損失.通過嚴格執行網絡服務級別協議來確保IT服務達到較高的標準,因此如何定義服務級別協議也顯得尤為重要.
網絡服務等級協議作為一種規范,可對特定請求人或者部門所產生的請求,約束其處理過程和時限,并定義違反規范時逐步升級的處理策略.
服務等級協議的有效執行需要定義每個級別事件的處理時限,在處理時限內完成申請事件的處理,則符合服務等級協議標準,若無法在處理時限內完成事件的處理,則違反了服務等級協議規則,需要對事件進行升級處理.
請求事件服務級別協議,這些服務級別協議從特定請求人、部門或工作站所產生的請求,從而對請求的處理過程時間進行規范.定義服務級別協議包括三個方面的內容:服務級別協議明細,服務級別協議規則,以及違反該協議時的逐步升級策略.
1) 服務級別協議規則
定義一個或多個匹配標準,當創建的請求符合標準時自動使用該服務級別協議,并依據該協議的條款計算請求的逾期時間.還需要為該協議指定解決問題所需花費的時間.
規則集(匹配條件的“與”或者“或”組成)匹配條件依據:請求人、部門、優先級、影響范圍、緊急度、請求類別、……
2)處理時限要求
要求操作員在規定的時間內處理完畢,不同服務等級協議的處理時限:低級別SLA (處理時限0天8小時0分)一般級別SLA (處理時限0天4小時0分)中級別SLA (處理時限0天1小時0分)高級別SLA (處理時限0天0小時30分)
3)違反規則后升級策略
操作員在規定時限內沒有完成請求的處理,自動升級到更高層次的操作員處理
2.3 請求事件處理優先矩陣
建立SLA規則按照請求人、部門或類別區分不同優先級的請求;涵蓋請求人和技術人員的服務優先級矩陣,明確所有的請求相應的處理時間期限,在出現 SLA違規自動逐步升級追蹤順應性,通過分析 SLA違規報表可以衡量服務效率.服務等級協議定義包含,影響范圍、緊急度、優先級、事件歸類、運維人員.
參照表1的一個事件請求處理樣例:
匹配條件:請求類別=系部網站開通申請
處理時限:一般級別SLA (處理時限)要求操作員在創建請求后0天4小時0分內處理完畢
升級策略:操作員在4小時內沒有完成請求處理,發送SLA違規警告,并將該事件升級到更高層次操作員處理,須在1小時內處理完畢.

表1 優先級矩陣-請求事件-人員支持覆蓋圖
2.4 優先矩陣中技術人員調度
表1中一個網絡服務運維技術團隊的人員由低到高層次組成,例如Tech0-Tech9(初級,中級,高級,專家)2:5:2:1比例配置,合理的分配不同層級技術人員人員的對應任務任務參見表1的規劃,最大可能的發揮技術人員資源配置優化,確保優先級矩陣中各種等級的事件都有對應的層次運維技術人員處理,提高人員配置效率.
初級 Tech0、Tech1
中級 Tech2、Tech3、Tech4、Tech5、Tech6
高級 Tech7 、Tech8
專家 Tech9
一個請求時間的解決人工成本費用=解決問題所用時間乘以操作員的每小時成本,即:

式中,n為整個請求分派的技術員次數;TTi為第i個技術員處理事件所花銷的時間,TCi為第i技術員的每小時成本.
通過對技術人員工作成本核算,可以達到量化網絡服務質量評價指標,作為不斷調度優化的參考依據.
2.5 試運行結果分析
在網絡服務協議管理模型設計中,我們設置了Tech0初級技術員的虛擬成本為30元/h、Tech4中級技術員的虛擬成本為60元/h、Tech7高級技術員的虛擬成本為120元/h、Tech9專家技術員的虛擬成本為180元/h.結合事件請求的匹配標準和升級策略的執行,統計2015年最后一季度的運維時間和成本分析.統計列分組為應處理事件時長、年月,分組依據為按技術員和影響度,匯總花費時間和成本總和,結果見表2.
以事件優先級矩陣和服務等級協議的處理時限約束條件,結合可定量統計數值作為服務質量評價指標之一.通過一段時間的運行,從表2可以看出不同層次的技術人員在處理事件的開銷時間、人員虛擬成本支出總和每月度橫向比較都有明顯的減少,運維團隊和個人的效率都得到了明顯提高.

表2 運維事件時間和人員成本統計
[1] 唐琳,李偉.基于用戶體驗的“主動式”信息運維管理實踐[J].電力信息化,2013,11(3):89-93.
[2] 李焱,冉晉雪.網絡運維勝任力評估算法的研究及系統實現[J].電信科學,2011,02:115-118.
[3] 馬宇飛.面向 IT服務的事故管理系統的研究與實現[D].北京林業大學,2008.
Campus Network Operation Service Level Agreement
CAO Pu, MO Min
(Educational Technology and Information Center, Shenzhen Polytechnic, Shenzhen, Guangdong 518055, China)
The paper analyzes the current passive service and low efficiency in information network service. After researching the relevance of the mode, level, influence, and emergency degree of events in the network service level agreement priority matrix model, an “active” user-experience-orientated network information management system is designed. The system uses the calculation of virtual staff cost to measure work performance. A set of network service system is implemented to improve the user experience and satisfaction of campus network.
priority matrix; service level agreement; network operation; violation detection
TP393.1
A
1672-0318(2016)05-0022-04
10.13899/j.cnki.szptxb.2016.05.005
2016-01-18
*項目來源:深圳職業技術學院科研資助項目:網絡用戶服務質量優化研究(編號2213K4020031)的研究成果之一
曹璞(1973-),男,浙江省縉云人,系統分析師,碩士,研究方向:計算機網絡、信息安全.