隨著信息科技的不斷發展,以及各種商業銀行業務的迅速發展,運維領域遇到的問題也越來越嚴重,其中主要是傳統運維方式需要改變,另外就是需要完善主動運維規范體系。傳統的運維方式也就是我們平時說的“被動式”運維,這種方式只有在發現問題后起到作用,根本無法適應銀行業務的迅猛發展,嚴重影響開發部門和運維部門的溝通。而且因為商業銀行業務多種多樣,技術隊伍龐大,所以在技術類、組織類、管理類規范等方面不夠完善。因此,對于現在商業銀行應用的統一運維規范體系,不僅可以防范應用系統運行風險,提升應用系統的穩定性和可用性,而且通過有序的組織結構和精細的流程管理以及合理的技術規范,來保障主動運維工作的穩定推進,有力支撐銀行業務發展。
商業銀行應用系統的主動運維是一種現代管理理念,指對一切可能發生故障或者突發情況下提前進行處理的一種運維模式。相比于傳統的運維模式而言,它可以從技術和管理兩個方面實現商業銀行應用系統的運作,一方面可以通過完善的運維流程、合理的運維規劃去提升主動運維管理水平;另一方面,通過建設智能化、自動化的運維平臺來處理大量的運維工作,明顯提高工作的效率。而且傳統的運維支撐工具自動化程度不高,不能完全自動的過濾海量的告警信息,也不能監控到所有的運維對象。傳統的運維流程并不規范,導致運維工作出現混亂,再加上運維人員的主動意識比較弱,同時一些商業銀行也缺乏相應的激勵措施,所以運維人員的主動運維意識也不高,根本無法起到預防突發事件的作用。因此主動運維改變了傳統運維模式的經驗運維以及人海戰術等特點,還提升了商業銀行應用系統的智能化水平,極大的節約了運維成本,提高了運維工作效率。
對于主動運維規范體系中的技術類規范來講,首先需要注意的一點就是應用運維需求,第二點需要注意的就是應用監控的規范。應用運維不僅僅需要滿足業務功能,還必須得滿足一些與運維工作相關的需求,分別得滿足運維功能的五大特性,資源使用性、可維護性、可靠性、功能適應性和性能效率性。其中,可靠性中包括系統可用性、異常處理、容錯響應三大指標;可維護性則包括報錯信息、版本升級、數據備份與清理三大指標。因此,針對于具體應用的不同系統運行特性時,要設計詳細的運維需求說明,然后根據應用系統制定開發每個需求項,而且這些運維需求要經過項目經理、總工程師和業務經理的評審,只有通過之后才可以實施。對于應用監控規范,必須要全部統一接口和設計標準,才能夠集中監控管理平臺建設,規范被監控系統與平臺間的信息交流,同時可以將告警事件和性能數據接入集中監控管理平臺,然后將統一的數據采集、數據處理和數據表現通過監控管理平臺展現出來。
主動運維規范體系的基礎和保障就是組織類規范,而且完善、健全的組織結構能夠有效推動商業銀行主動運維工作的開展,因此改進和完善傳統組織架構體系是實現主動運維規范的先決條件,因此從全局出發要先對本部門相關的研發和運維工作實現統一的指導和督促,并且統籌運維管理工作和安全生產辦公室。其次,我們還可以在運維部門設置運維經理崗位,設立研發總工程師和運維總工程師,實現和項目團隊的零距離溝通,貫徹運維規范、組織運維實施,進而推動運維與開發的協作。而且還應該改變之前運維部門與開發部門相互獨立的情況,重新調整組織結構,從而加強了商業銀行的統籌管理、促進運維與開發的交流,達到主動運維的目的。
管理類規范首先需要做到評審規范,其次是支持規范,最后還需要對一些機制進行改革,從而實現主動運維規范。對于評審規范,主要包括運維需求評審規范和運行架構評審規范。也就是說,在項目需求研制階段,我們需要對運維經理收集匯總的運維保障需求進行評審規范,確保這些運維需求的適用性和合理性。當然也需要運維經理修改完善評審時給出的意見。而運行架構評審則是由科技部門組織,并且在項目團隊的配合之下進行架構設計及架構評審。應用架構、數據架構、基礎架構和運行架構這四個方面是評審的主要內容。對于支持規范則包括應用變更管理規范和測試技術支持規范,應用變更管理規范以變更評審為核心,統一原則、規范操作為原則,強化變更評審意識,控制變更風險,而且商業銀行運行事件多發生于應用系統投產和變更期間,因此做好投產階段的變更管理是防范風險的重要一環。在改進機制這一方面,主要包括問題解決優化機制、事件協同分析機制。在應用系統投產后,對于那些大量發生且加重的事件要進行徹底的調查和修復,從根源上減少這一類事情的發生,保障應用系統的安全穩定運行,而且對于改進這些問題的意見和一些措施,都需要由安全生產辦公室收集、記錄并且分析,有效的規避以往側重事件原因調查而忽略的總結整改現象。
隨著商業銀行的不斷發展,對主動運維規范的研究也越來越透徹,而且主動運維規范的優勢也越來越大,不僅可以預防突發事件,而且還可以提高運維工作的效率。商業銀行應用系統主動運維規范主要包括有技術類、組織類、管理類規范三類。希望未來的主動運維規范可以給商業銀行帶來更大的發展空間。