山東省城市商業銀行合作聯盟有限公司2008 年經中國銀監會批準成立,是目前全國唯一持有金融牌照的中小銀行金融科技服務公司。已接入聯盟的成員行41 家,系統線上運行支持的銀行資產近1.6 萬億元。
聯盟已經成為一家顯著區別于國內其他合作平臺,黏性極高、共享特征明顯、規模效益顯著、以中小銀行特別是城商行1+N 信息科技服務能力為核心專長的金融科技共享服務平臺。
聯盟業務近年來飛速發展,業務處理量每年增長30%,為了保障IT 安全穩定運行,聯盟經過近五期的交易性能監控實施,逐步在交易層面完成了核心、網銀、ESB、柜面、銀聯、網聯系統、二代支付、網銀互聯、互金平臺、短信平臺、統一支付等系統重要節點的交易性能監控,在保障業務連續性方面發揮了重要價值。

旁路監聽示意圖
聯盟應用系統數量不斷增加以及系統復雜程度不斷提高,以往依靠人工每日一次的系統監控運維方式已不再能滿足行內需求,尤其在眾多應用微服務化的今天,存在系統監控效果差、故障發現不及時、問題排查難度大、人工維護成本高等問題。因此,急需加強應用系統監控能力,提高聯盟應用系統運維水平,保障系統正常穩定運行。
1.通過網絡旁路方式,解析應用系統端到端的數據信息,實現以真實用戶體驗和端到端應用性能管理為核心,創新自上而下的IT 管理新模式;
2.建立面向服務質量的監控體系,對業務系統可用性和運行健康情況進行監控和預警,出現異常時,自動記錄各處理節點系統指標,為后期故障排查和定位提供依據;
3.全聯盟關鍵應用的應用邏輯梳理,提升應用運維水平;
4.智能的告警模擬和多維度復合告警能力,全面及時的掌控業務運行狀態;
5.結合構建聯盟全業務性能監控視圖與具體應用端到端視圖,實現故障的1 分鐘快速定位。
6.支持對聯盟私有云及微服務架構進行監控,有效解決應用上云及微服務化后的故障定位難題。
項目采用上海天旦專利產品BPC,充分利用可靠的旁路網絡數據資源,建立業務監控管理及告警平臺。以服務為中心,提供交易量、成功率、響應時間等業務監控關鍵指標,并區分交易類型、交易渠道等統計維度,展現服務組件的實時運行狀態。
采用旁路監聽方式的技術方案一方面不會對被管理應用產生任何影響,完全避免了傳統監控方式所帶來的性能風險;另一方面也具備快速部署的特點及指標實時統計能力,提高了系統上線速度以及業務監控指標實時監控能力。
目前聯盟已完成一類系統的端到端部署,并逐步進行重要二類系統的覆蓋,同時在探索無代碼的開發平臺與流芯實時的旁路數據源在運維與運營方向的應用價值。
1.自動故障定位,在呈現應用故障對聯盟應用系統影響的同時,定位問題發生的根源組件及原因;
2.5大關鍵指標、靈活自定義的維度統計,協助聯盟更深入的掌控業務全局;
3.無代理,旁路式監控,不影響被管理應用;
4.以真實網絡流量為依托,使服務路徑可視化,反映應用組件、交付設備之間形成的訪問關系;
5.建立服務路徑圖檔案庫,提供準確的應用環境信息,使得應用組件之間的訪問依賴關系可持續管理,降低變更風險。
充分利用可靠的網絡數據資源,幫助聯盟運維部門建立業務監控視圖。以服務為中心,提供交易量、成功率、響應時間、響應率、返回碼五大關鍵指標,并區分交易類型、交易渠道等多個統計維度,展現服務組件的運行狀態。在監視范圍上可以覆蓋端到端、雙中心的應用服務路徑,實現了應用可用性、性能、負載量的全面可視化。
實現服務路徑的可視化,為運維部門提供準確有效的應用組件、交付設備之間的訪問依賴關系信息,通過簡單快捷的合并、拆分、篩選操作,以及自動化的梳理功能,BPC 為運維提供了一種高效的應用梳理方法,大大減少梳理工作的時間和人力資源投入,提升運維管理的效率和價值。
旁路式的監控技術不會對被管理應用產生任何影響,完全避免了傳統監控方式所帶來的性能風險,因此也可以獲得實時統計能力,第一時間為運維部門提供業務監控數據。
點評
隨著金融業務系統復雜度的不斷提高,其日常運維工作成為IT 部門的難題。山東城市商業銀行合作聯盟采用旁路監聽方式的技術方案對日常業務系統進行監控,避免了傳統監控方式所帶來的性能風險,提升了運維部門的運維管理的效率和價值。