薛翔
摘 要 銀行信息化建設和有效運行與IT運維服務體系息息相關,而檢驗信息系統是否安全運行的主要標準是系統是否能完成定量、實時的交易數據、事件以及性能指標,所以,銀行作為一個信息流動量大且對安全性能要求高的交易平臺,更需要構建一個完善的IT運維管理監控指標體系。本文首先認為銀行業建立IT運維監控指標體系具有必要性,其次對IT運維監控指標體系進行了簡單的研究,最后提出了建立IT運維監控指標體系的方法,希望對銀行業的管理體系建設具有借鑒作用。
關鍵詞 銀行業;IT運維管理監控指標;體系研究
引言
在銀行信息管理系統運行周期中,80%的時間都是用來進行系統的運行與維護,這就決定了IT運維服務在銀行信息化建設和運行中的核心地位。因此,銀行需要投入更多的精力去建立一個系統化、規范化的面向業務服務的運維監控指標體系,同時提高了銀行的管理水平。
1 建立IT運維監控指標體系的必要性
1.1 業務發展的客觀需要
一個完整的IT運維監控指標體系具備深度監控、全面數據采集和智能分析的特點,它將是一個能夠給銀行繁雜的業務流程帶來便利且提高效率的服務系統。傳統的業務管理流程大多數由人完成,在復雜、煩瑣的IT細節上花費了太多的人力資源,而擁有了一套規范化的監控系統后將極大改變這種情況。從管理層面上看,可以讓更多的管理者從具體瑣事中解放出來,將更多精力用于決策上,這樣才能真正發揮管理者的職能作用。該體系通過儀表盤將服務水平管理、監控和診斷結果呈送給管理者,讓管理者一目了然;既提高了管理服務水平,又對管理者的業務管理活動提供了IT決策支持。不僅如此,該體系不僅能夠提供實時監控與幫助,還能通過內嵌系統的方式,把需要關注的監控指標通過技術人員內嵌入系統應用中,起到“未雨綢繆”的作用。可想而知,該體系的建立是銀行的業務發展需要。
1.2 完善監控體系的需要
建立一套切實可行的運維監控指標體系進行監控和分析工作是促進運維管理工作系統化和規范化的需要,它為運維提供了安全保障;另一方面,為了適應銀監會《商業銀行數據中心監管指導》關于加強采用監控管理工具實行監控重要信息系統的要求。其中的條例規定:“應集中監控重要信息系統和通信網絡運行狀態。采用監控管理工具,實時監控重要信息系統和通信網絡的運行狀況,通過監測、采集、分析和調優,提升生產系統運行的可靠性、穩定性和可用性。監控記錄應滿足故障定位、診斷及事后審計等要求[1]。”
2 對IT運維監控指標體系進行研究
2.1 IT運維監控指標體系的定位
該系統是以ITIL為理論基礎,把業務服務與IT管理相融合,以此為客戶提供更為優質服務的同時便于銀行的信息管理。再將ITIL與業務流程管理(BPM)相結合,以可視化的方式給管理者提供業務狀況,讓管理者的工作與IT服務相協調。
2.2 IT運維監控指標體系的設置流程
首先通過層次分析法將監控要素(包括網絡、主機、數據庫等)進行分類,然后根據專家經驗將各監控要素進行整合,經過兩兩要素的定量描述后建立起關系矩陣。最后進行層次排序,總共分為四個層次:應用系統層、系統資源層、網絡服務層以及基礎設施層。各個領域的相互協調能夠保證業務的連續性。
2.3 IT運維監控指標體系中資源層面的分類
該體系的資源層面大致可分為四大類,包括數據庫類、中間件類、操作系統類和儲蓄類。其中數據庫的指標是用于反應服務器等各個環節的運行狀態,以保證體系運作的連續性;中間件類是將不同的使用特性的中間件進行分類,細分為WAS、Weblogic以及MQ這三種;操作系統是為了客觀反應各種主流操作系統的運行狀態;儲蓄系統類是用于客觀反映存儲系統端口到端口的運行狀態,可分為光纖交換機端口、XP儲存系統等[2]。
2.4 完成監控指標工作的前提
該體系要想實現切實可行的指標監控,就要通過標準化的數據采集接收端口對數據進行收集整理、分類匯總和關聯分析,以實現事件管理、性能管理、告警管理以及風險管理。
3 構建IT運維監控指標體系的方法
該體系的構建是一個循序漸進的過程,為了監控指標體系的有效運行,需要在前期的準備工作中做好監控指標的采集及其處理。包括指標的梳理、指標的設置、指標權重的計算、指標的評估,最后是建立體系。
3.1 指標的梳理
體系開發團隊需要根據銀行的業務特點,針對現實的工作需要,通過調查和采集的方式收集指定的監控指標的基本信息,匯總形成特定的監控指標集。而且指標可以根據實際情況進行調整。這樣就可為監控系統提供對象的監控指標標準[3]。
3.2 指標的設置
指標的科學設置需要在指標的梳理上完成,設置的具體內容包括采集方式、采集頻率、指標數據類型、觸發告警條件與告警級別、指標數據輸出接口類型等。值得注意的是,關鍵指標要做出標記。
3.3 指標權重的計算
指標權重的計算可通過定性或者定量這兩種方法,即層次分析法或者專家經驗法。兩種方法配合使用可以互補長短,專家經驗法在指標太多時無法綜合判斷導致指標權重不準確,而層次分析法正好能彌補這個漏洞。
3.4 指標的評估
對指標進行評估是為了更好地推動運維管理質量的提升,而評估過程中要遵守SMART原則,即堅持監控指標的針對性、監控指標的可量化、監控指標可收集、監控指標之間的相關性以及監控指標的實時性[4]。
3.5 確定并建立指標體系
完成以上四個步驟后基本上就明確了需要實施監控的指標,了解了指標之間的層次和依賴關系等重要信息后,就可構建起一個規范化、系統化的監控指標體系。
4 結束語
建立IT運維監控指標體系是行業發展的必然結果,符合現代企業的管理模式。成熟的IT運維監控指標體系能夠極大地提升運維管理的水平,今后不管是在管理層面還是在技術層面,該體系都會有更大的進步,從而實現“運維經驗”與“實時數據”共同作用,既能監控指標也能預測風險,同時為優化應用系統提供更多科學有效的參考依據。
參考文獻
[1] 高紹新.銀行業IT運維管理監控指標體系的研究[J].金融電子化,2014,(12):58-60.
[2] 戴長臻.銀行IT運維操作審計系統的設計與實現[D].長春:吉林大學,2016.
[3] 李璐璐.IT資源監控管理系統的設計與實現[D].沈陽:東北大學,2016.
[4] 王欽可.基于ITIL框架的IT運維管理系統設計與實現[D].長沙:湖北工業大學,2017.