【摘要】針對銀行信息系統特點,在綜合分析相關法律法規、規章制度和現有研究基礎上,對銀行信息系統應急演練組織流程進行討論,包括準備階段、演練階段、總結階段等三個階段,提出應急演練綜合評價方法,并在大型商業銀行信息系統應急演練中進行實踐。
【關鍵詞】銀行信息系統 應急演練 綜合評價方法
一、概述
隨著我國金融市場不斷發展,信息系統建設已成為商業銀行核心競爭力之一,信息系統安全直接關乎商業銀行自身利益,甚至影響國家金融安全和社會穩定。要確保信息系統安全穩定運行、保障業務連續性,就必須不斷加強商業銀行信息系統應急管理,提高應急能力。作為應急管理的重要環節,應急演練能夠全方位檢驗商業銀行應急管理能力,驗證應急預案有效性、應急資源完備性及應急人員的適應性。
鑒于此,國家相關部門、各商業銀行高度重視信息系統應急演練工作,銀監會對銀行業信息系統應急演練提出明確要求,涵蓋演練范圍、組織保障、優化改進等多方面[1];各主要國有行業銀行、股份制商業銀行及各地方銀行,都定期開展分重點、分層次、分系統、分階段的信息系統應急演練工作,查找問題,提高處置能力;蘇忠運對大型國有商業銀行一級分行信息系統應急演練工作方法進行探討,提出應急演練策略、工作要求和工作評價方法[2];王鋼對金融信息系統應急演練中的信息管理、資源共享、預案更新等問題進行研究,提出分級響應策略等[3];任長清將銀行災難恢復應急演練分為預警、啟動、恢復、解除和回切等五個階段,提出災難恢復組織、指揮機構、實施原則、演練案例、演練方案和演練培訓等六個重要事項[4];任長清還提出三點估算法,對商業銀行災備組織人員的到位時間進行評估[5]。綜上所述,業內專家和學者在商業銀行信息系統應急演練方面,已開展大量的工作,但這些研究仍存在進一步改進的地方和問題,如應急演練組織有待進一步細化、應急演練結果評價量化等。
二、組織流程
商業銀行信息系統應急演練組織流程如圖1所示,主要包括準備、演練、總結等3個階段。在準備階段,根據演練總體要求及各商業銀行信息系統現狀,做好人員構成、演練范圍、流程規劃、演練環境、故障場景、技術保障等方面的準備工作,做到安全可控前提下,確保盡量逼近真實[2];在演練階段,首先由應急值班人員向應急人員發布系統預警,通知人員到處置現場進行集結,人員集結后由技術專家向其宣布故障場景,處置人員根據故障場景,按照日常應急預案進行應急處置,處置過程中,考評小組對處置流程、處置方法、處置結果等進行量化打分,并形成演練評估報告;在總結改進階段,要對演練過程、演練結果進行深入總結分析,形成總結報告,對參加演練的應急處置人員進行表彰或提出改進意見,根據演練效果對應急預案做進一步優化。
圖1 應急演練組織流程
(一)準備階段
作為應急演練的組織方,在籌備演練過程中,首先要根據相關法律法規、規章制度以及銀行內部相關規定、管理辦法,綜合參考信息系統應急預案,擬定應急演練工作方案初稿,同時召開應急演練討論會,聽取管理、業務、安全及技術等部門的意見,形成應急工作方案,報上級領導審批同意后形成正式的應急演練工作方案,下發相關干系人。應急演練工作方案要明確演練組織機構、時間地點、參與人員、應用系統、演練流程等要素,明確分工,明晰責任。
構建高效的、完備的組織結構(表1)是演練成功的關鍵因素,通過高層領導推動演練資源準備、實現演練權威性,通過技術專家確保演練演練有效性和可靠性,通過設立工作小組實現演練有序開展,達到演練目標。
表1 應急演練組織結構表
相對機房環境、網絡、操作系統等方面而言,由于銀行業務種類繁多,各信息系統之間應用邏輯復雜、關聯性強,應用級應急演練更具緊迫性。在眾多應用系統中,要選擇以下三類應用系統作為演練的“故障”系統:(1)關鍵業務系統(2)近期有重大變更的系統(3)近期出現生產問題的系統。
評估小組根據應用系統歷史問題、關鍵程序、關鍵路徑制定演練場景,演練場景是各應用系統的“故障”描述,詳細記錄應用系統故障時間、故障部位、故障狀態、故障表現等,這些應用場景所描述故障一旦真實發生,將極大影響生產安全,甚至對業務造成重大影響。同時為確保安全可控,演練場景和相應處置方式對生產不能造成實質性影響,可采取的策略包括:系統維護時間窗口、交易量相對較少時間段、利用備份環境。
技術準備方面,在參加演練人員多、涉及環節復雜情況下,可采用應急短信作為應急通訊方式,及時高效發送應急集結、應急處置通知。應急短信可采用企業專有短信號碼,通過批量短信發送工具發送,應急人員通過短信進行反饋,由信息系統進行智能統計,形成報表。演練環境方面,設立演練各組織結構場地標示,通過投影等方式及時將處置現場傳輸到指揮中心。
(二)演練階段
1.系統預警和人員集結。為全面檢驗應急資源的就緒狀態,盡量做到演練突然性,盡量接近真實狀態,應以系統故障來通知各應急人員盡快趕到故障現場進行應急處置。應急通訊暢通、及時響應能力是應急工作的重要組成部分,需作為演練考評指標之一,由評估小組詳細記錄各應急處置人員的響應時間(表2)。在演練開始后,通過“公告板”等方式實時通報演練進展,營造應急處置的嚴肅、緊張氛圍,逼真模擬故障現場。
2.應急處置。應急人員抵達演練現場后,由技術專家向其說明預設的故障場景,按相關要求進行及時處置。評估小組的技術專家要全程觀察應急處置過程,判斷應急處置是否符合應急預案要求,是否對生產系統產生影響,并采取及時有效措施避免生產事故。在應急處置后,評估小組按照事先擬定規則,對各應急處置模塊進行量化打分。
表2 應急演練各項指標記錄表(樣例)
3.演練評估。演練結束后,評估小組對演練進行綜合評估,應急演練綜合評價方法(Emergency Drill Comprehensive Evaluate Method,EDCEM)就是評估小組對應急演練中的各關鍵項進行綜合評價,通過EDCEM可以得到演練評價結果(Emergency Drill Indicator,EDI),其計算方法如式1所示。其中,xi(xi>0)為各指標項的指標值,響應時間、集結時間、處置情況等;ψi(0?燮ψi(xi)?燮1)為指標值量化關系函數,如對響應時間進行量化,1分鐘以內為100,超過1分鐘為50,超過2分鐘為0;(0?燮ω■?燮1,■ω■=1)為各指標項在評價結果中的權重,權重越大,其在評價結果中所起作用越大。
EDI=100×■ω■Ψ■(x■) (式1)
(三)總結階段
評估小組對應急演練進行綜合評估并報應急領導小組同意后,公布考評結果。由應急領導小組將對演練進行全面總結,對演練整體情況進行點評,對在關鍵方面(如集結時間、處置時間等)表現較好的人員、部門進行表揚,對存在不足之處提出意見。在演練結束后,工作小組要對演練總結形成問題跟蹤表,及時跟進各部門改進不足之處,保障生產安全。
三、實踐
某商業銀行(下稱“A行”)為大型國有商業銀行,A行軟件開發部門(下稱“該部門”)現有員工1300余人,每年承擔200多個應用項目研發,還承擔幾百個業務系統的運維保障工作,在信息系統應急方面具有重要作用,由于涉及人員多、系統多、機構多,該部門的應急演練主要驗證應急組織協同性和應急流程的有效性,確認應急聯絡暢通性和應急集結時效性,提升應對突發事件的應急響應與處置能力。
近期,該部門組織開展了重要生產系統應急演練,依據事先制定的《重要生產系統應急支持工作規程》并結合有重要變更、容易出現生產問題來選擇參加演練的應用系統,演練由該部門負責人現場全程主持,A行風險管理部門、科技主管部門相關負責人作為觀摩小組成員參加演練,相關技術骨干作為應急人員具體實施應急處置工作,技術保障部門相關運維骨干根據應用系統歷史問題并綜合近期運維重點制定預設應急場景,相關部門一線管理人員、技術骨干組成評估小組和工作小組,承擔演練綜合評價、組織協調工作,參加演練的領導和技術人員超過50人。演練中,各項應急處置工作均能按照應急方案正確開展,達到相關應急處置規定要求,演練取得圓滿成功。
據統計,演練中各系統應急處置人員通訊順暢,平均集結時間為18分鐘,達到應急處置關于時間的規定要求,部分應用系統由于人員配置不合理、距離較遠、交通擁堵等客觀原因,在接報后超過30分鐘抵達處置現場,同時還有個別人員未及時響應應急電話,鑒于此,演練工作小組形成信息通報,督促對相關系統應急處置人員做適當調整,以符合應急處置時間規定,進一步加強應急意識,避免此類事情再次發生。
四、總結
本文對銀行信息系統應急演練組織流程進行討論,提出應急演練綜合評價方法,并在大型商業銀行應急演練中進行實踐,驗證應急組織協同性和應急流程的有效性,提升應對突發事件的應急響應與處置能力。本文所提出方法在部門級(一級部)進行實踐,應用范圍有待進一步擴大,其通用性、規模性還有待加強,同時由于管理、業務和技術等方面的原因,涉及全行的模擬真實故障的應急演練較難開展,應急演練組織方法的進一步研究存在困難。
參考文獻
[1]中國銀行業監督管理委員會.銀行業重要信息系統突發事件 應急管理規范(試行).2008年04月23日.
[2]蘇忠運.分行信息系統應急演練工作方法探討[J]中國金融電腦,2005(05):32-33.
[3]王鋼.金融信息系統應急響應及演練[J]計算機安全,2009(08):75-78.
[4]任長清.銀行如何開展災難恢復應急演練[J]中國金融電腦,2007(1):19-21.
[5]任長清.商業銀行災備組織人員的到位時間評估[J]中國金融電腦,2009(2):39-40.
作者簡介:郭會(1985-),男,漢族,四川人,任職于中國農業銀行,研究方向:金融信息化。