
刷卡、簽字、按月還款,這是一套信用卡的標準使用流程。對于絕大部分信用卡用戶而言,不知道也根本不需要知道,在這套步驟簡單的流程背后發生了什么。但是,在銀行看來,信用卡交易卻是復雜的系統性工程。
這種復雜,從根本上來說其實可以概括為四個字:穩定可靠。保證交易的穩定,保證系統的可靠,這說起來簡單,實際上卻不容易。銀行IT人員需要設置一道又一道的“保險”,以未雨綢繆地將所有可能危害到交易的風險擋在門外。因此,在世界范圍內,銀行業是在IT系統上投入最多的垂直行業之一。
由于追求穩定可靠,因此大部分銀行的業務系統都在盡可能地少做甚至不做大的變動,這不僅是因為中間復雜的流程多少會讓人望而卻步,同時也是為了最大限度地減少出錯的概率。然而,光大銀行偏偏就反其道而行,打造出了一套創新的信用卡前置系統方案。
此“雙活”非彼“雙活”
信用卡前置系統是信用卡核心系統的一部分,其主要用于檢查商戶和卡片信息,同時核對密碼并處理相應的業務計算,將交易信息送往信用卡中心,傳送信用卡核心系統返回信息,并送往商戶終端完成整個交易流程??梢哉f,前置系統是信用卡處理過程中“迎來送往”的關鍵一環。就是在這樣一個重要環節上,光大銀行完成了完全自主設計的“創舉”。
“沒有人做過與我們一樣的方案?!敝袊獯筱y行信用卡中心技術部總經理李鐵成談到他們的信用卡前置系統時表示,“從銀行的角度來看,一般大家更依賴于廠商現有的解決方案,用一個成熟的操作系統級別的數據庫方案來實施?!?/p>
李鐵成將光大銀行信用卡中心的這套方案稱之為“信用卡前置雙活體系架構”。在這個架構中,“雙活”成為了最為畫龍點睛的字眼。
實際上,“Active-Active(雙活)”在容災領域并不是一個新鮮概念。在一般人的理解中,雙活意味著數據能夠做到實時備份,同時能夠在發生災害時實時進行地切換。這類方案中,信用卡生產中心的前置系統是一個數據接收的重要節點,數據源在此產生。同時,數據源會被復制到災備系統進行備份。災備系統在日常并不參與業務,不過一旦發生災害,就需要其立即投入到生產過程中去。
聽起來這有些像是正規部隊與預備役的組成。不同的是,為了能夠隨時“投入戰斗”,預備役在戰斗能力、裝備等方面并不輸給正規軍,甚至于還要與正規軍享受同樣的待遇。這也是一般雙活解決方案所為人詬病的問題之一:成本過高。這也成為了很多企業部署容災方案的一個障礙:如何說服財務部門去購置一套大部分時間都在閑置著的災備系統?
李鐵成表示,傳統以備份為主的容災方案,兩個系統之間的距離不能超過30公里,這使得其只能在同一城市建設。同時,由于數據源在處理過程中只生成了一份,因此一旦生產系統出現問題,數據還來不及備份,整個業務就會直接停滯。
光大銀行信用卡中心以一種新的方式來從根本上思考這一問題。傳統的雙活解決方案大多是依賴數據庫或者操作系統進行數據同步、復制和備份,那么能不能脫離開這些限制?
“因為涉及到技術論證,因此我們前期調研了很長時間?!崩铊F成表示。
如今,在光大銀行信用卡中心上線的前置系統采用了一種完全嶄新的架構模式:分別部署在北京和上海的兩套系統可以同時接收請求、處理數據,數據庫各自完全獨立。這樣的方案,使得原本單一的數據源變成了雙份,提高了數據庫自身的穩定性。同時,在“信用卡前置雙活體系架構”這個方案中,不再存在災備中心的概念,兩套系統都是一線生產系統,這等于是將數據中心的處理能力擴大了一倍。
光大銀行“舍近求遠”的沒有選擇已有的操作系統或者是數據庫同步技術,而是單獨開發了應用來支撐這套方案。李鐵成認為,這不僅提高了系統的健壯度,同時也為業務拓展提供了靈活性。“兩個系統上存在的數據或者是數據庫理論上來說是沒有關系的,而完全是由應用把兩個數據庫串接起來。”他介紹說,“在傳統架構中數據只有一份,如果誤刪了數據,遠程的數據也會同步地被刪掉,因為系統無法判斷刪除操作是否正確。而在我們這種結構中就不會發生這種現象,應用級同步是依照策略進行,像刪除數據庫這樣的危險動作就不會同步到遠程服務器上。這是一種‘應用級雙活’?!?/p>
NonStop,永不停機
多年來,雙生產中心的容災建設方案一直只是停留在技術研討與階段實施上,像光大銀行信用卡中心這樣將其完全落地的方案并不多。相較很多銀行,光大銀行有著自己比較獨特的特點。
光大銀行信用卡中心業務起步于2003年,不過此前其一直處于服務外包階段。這使得其在IT建設上并沒有過去舊有系統的包袱和壓力。從2011年11月26日新系統上線至今,這套“信用卡前置雙活體系架構”已經穩定運行了兩年有余。
在新的架構中,光大銀行信用卡中心選擇了惠普的NonStop產品來打造其前置系統。來自中國惠普有限公司中國區副總裁兼企業集團關鍵業務服務器系統部總經理樊瀛的數據顯示,目前全球三分之二以上的信用卡交易都是由惠普服務器來完成,而全球的證券交易中心系統絕大多數都構筑在惠普的關鍵業務服務器上。
實際上,無論是傳統的雙活體系,還是“應用級雙活”,單點故障都是最為讓人頭疼的問題?!癗onStop從設計之初就是一個容錯系統,所有部件在并行工作的同時互為備份,任何一個故障部件都不會造成整個系統的停機。”中國惠普有限公司企業集團關鍵業務服務器系統部客戶技術顧問張亮表示。
這使得NonStop很輕易地就可以達到單機99.99%的可靠性。在這套系統實施之前,光大銀行信用卡中心的IT部門曾經做過很多破壞性的實驗,包括帶電插拔CPU、硬盤、網卡等關鍵組件。NonStop在這些考驗面前做到了完全不停機。除此之外,NonStop大規模并行處理的架構,使得其可以進行線性擴展,保證了用戶的投資。
“信用卡前置雙活體系架構”的采用,不僅提升了光大銀行信用卡中心的系統靈活性與關鍵業務保障能力,同時也簡化了流程。目前,光大銀行信用卡中心的災備演練流程比原來簡單了許多,而且根本不需要營業部門配合?!拔覀兊难菥毟鷤鹘y的不一樣,很多時候只是想測試一下北京前置系統的機器單臺能不能支撐全部的業務。我們會主動把上海前置系統全部的交易切換到北京來?!崩铊F成表示。
“將災備系統用起來”,這是光大銀行信用卡中心構建“信用卡前置雙活體系架構”的初衷之一。經過兩年多的運行,其以實際案例證明,這種架構是完全可行的。如今,李鐵成希望能夠將這種模式介紹出去,讓更多人了解其優勢所在?!笆紫茸约阂行判模浯芜€要說服更多人,讓他支持你的觀點,才能把這個事情做下去。”他表示。