高清闊 孫勇
摘 要:網絡金融持續發展,對金融業數據庫方面要求日益提升,迫切需要具備高可用性、可擴展性、高性能的數據庫系統。鑒于此,本文主要圍繞著在金融行業應用場景當中分布式的數據庫應用探索及實踐,望能夠為相關專家及學者對這一課題的深入研究提供有價值的參考或者依據。
關鍵詞:分布式;數據庫;金融;應用場景;
1、系統整體框架
1.1 框架
分布式的數據庫(CBASE),整個系統框架以四個系統功能模塊為主,即為集群管理、事務處理、數據存儲、SQL處理。集群管理,管理集群全部服務器、副本與數據分布;事務處理,相應各種更新操作、更新存儲系統內部增量數據;數據存儲,儲集群基準的數據;SQL處理,接受、解析用戶端SQL的請求,經語法、詞法分析、查詢優化各項操作,發送至數據存儲或者事務處理的節點來執行。
1.2 關鍵性的技術模塊
①寫性能方面的優化
CBASE的設計,可實現讀寫相互分離的一種系統框架,對讀或者寫負載有所不同,予以分別優化處理。針對未修改數據,通過普通的PC服務裝置,實現存儲操作,處理大量數據擴展管理方面的問題。更新的熱點數據被存儲至內存較大的事務處理節點,事務處理的節點內存達相應大小后,能手動或自動凍結數據,并將其存儲至固態的硬盤內部,以定期合并形式把數據分散地存儲至靜態的數據節點內部。通過這一設計,可維持系統的可擴展性,且對事務處理的請求有著高吞吐量。多數事務處理均無需跨越相應事務處理的節點,可借助事務處理增加節點這一手段將系統整體處理能力提升。針對少量分布形式的事務,僅經優化兩個階段,便可將降低事務的延遲提交。事務處理的節點,通過大容量的內存數據,規避掉傳統的數據庫內集中式鎖管理裝置,改用輕量級別多版本、行鎖并發的控制協議、混合存儲的介質存儲相應日志等各項科學技術,系統整體能力得以有效提升。
②高可用性能
CBASE當中實現分布式的選舉協議狀態轉換,屬于不確定性的有限自動裝置。階段角色會伴隨選舉實隨時變換。某個節點在剛剛啟動或者從故障當中恢復,角色處于備節點狀態,會設定時裝置。若此節點已接收主節點所發送更新的日志,定時裝置會重置,角色處于恒定不變狀態。反之,則定時器在超時之后,認為集群未存在有效主節點,此節點便會轉變成候選者,并準備競爭成全新主節點。候選者會向其余節點傳輸投票的請求,有三種情況,即為獲取到多數節點的投票節點屬于主節點;受到更新的日志信息,證明集群當中主節點已存現,候選者們可轉變其備節點;若選舉已超時,則需重新發起新一輪的選舉。節點逐漸成為了主節點過后,會向其備節點來發送相應更新日志,將其余節點定時器予以重組處理。
③分布式的事務
事務處理,屬于支撐著金融業應用一項關鍵的科學技術,可保證業務數據一致與完整。大型的銀行應用不但要滿足數據庫方面系統完整度要求,還應具備著網絡級并的事務方面處理能力。金融業務內部系統的事務處理實際應用特點是,通過CBASE來實現支撐著高通量的事務處理分布式的一種數據庫綜合系統,相比原有集中式的數據庫,CBASE并不需要用戶設計及維護分庫的分表規則,該系統能自動化結合主鍵,把數據合理劃分成不同事務的處理節點,業務邏輯及數據存儲的解耦合即可實現,開發及維護方面的難度系數得以有效降低,資源線得以擴展,且集群解決了I/O上限方面現實問題。CBASE分布式的事務引擎具體實現期間,通過兩階段的提交優化處理,事務可保證有著一致性方面特征。無故障期間,可輕松實現此協議。若有故障問題出現,比如網絡故障、信息丟失等等,通過超時動作便可避免進程無限性的阻塞,協議實現后,進程會阻塞每步驟,且均會加入相應超時動作。處于最壞情況之下,執行兩個階段的提交協議,期間可能會有多次的服務器或者通信故障問題出現,導致參與者無法較長時間的停留至不確定的狀態中,即為未解決事務。而同分布式的數據庫,便能夠恢復持久存儲的信息內容對象值,若參與者為不可用狀態,則可等待著數據庫的管理技術員加以干預或處理.
2、實踐應用
2.1 查詢歷史數據
伴隨著時間逐步推移及業務持續發展,各企業內部歷史數據的查詢系統均面臨著歷史數據信息量持續增長、系統框架當中傳統的數據庫已無法滿足于快速增加的數據量現實需求。金融業歷史數據有著較廣的涵蓋范圍,如交行歷史數據的查詢系統,內含主機、賬務、貸記卡等業務系統所有歷史數據,對數據庫自身擴展性方面有著極高的要求,以能夠充分滿足于業務量現實需求。除了歷史數據方面存儲,查詢歷史數據系統還應當向外部提供著聯機事務檢索與各種新增業務服務等,緩解其余在線業務歷史數據的管理壓力,以至于對數據庫快速響應著聯機檢索服務方面有著極高的要求與標準。歷史數據的查詢系統,要求該數據庫應當具備著較高的可擴展性、可靠性、高性能等,且該分布式的數據庫還應當充分滿足于各方面現實標準與要求。經大量測試與評估分析后,交行歷史數據庫的綜合系統內采用了CBASE,現階段系統整體的數據量可達上百個TB,每日均超1個TB,且有持續增長這一變化趨勢。大并發檢索條件下,檢索相應的時間可維持毫秒級別范圍。經多年穩定運行可充分表明自主研發分布式的數據庫在金融領域中應用切實可行。
2.2 貸記卡專項授權系統的并發處理
信用卡相關業務不斷縱深向的發展及客戶量持續增長,以至于交易量極具攀升,對于貸記卡的授權系統在線升級更新、持續高效、7*24h的穩定化交易服務方面更為迫切。伴隨網絡金融出現與廣泛應用,支付寶相關電商雙11的網購促銷均引起交易呈爆發式的增長,系統負擔逐漸加重,傳統的數據庫迎來了空前絕后的、史無前例的發展挑戰,原有系統資源已無法滿足現實需求,數據庫整個系統自身潛在各項性能發展瓶頸。那么,為確保貸記卡的授權系統穩定,將系統總體處理能力提升,基于原有系統框架,借助CBASE分流處理高并發的業務所形成系統壓力。以CBASE為基礎新一代的貸記卡專項授權系統基本特征如下:高并發的處理能力,可高峰每秒處理事務量達上萬;彈性的擴展能力,整個系統處理的能力能實現快速彈性的擴容處理;高可用性,能夠確保業務系統維持7*24h以內在線服務,分流高并發時主機的壓力。在銀行各個關鍵系統的試點期間,CBASE框架已逐步成型,各項功能得以逐步完善化,可靠性與各項性能均得以增強,已向著產品化的方向發展著,所取得經濟與社會方面的效益較為顯著。以某商業銀行為例,通過采用了以CBASE為基礎新一代的貸記卡專項授權系統后,構建起了數據庫在授權系統,通過采集海量信息,存儲主數據庫內,依據不同信息安全等級,對不同用戶進行分級別授權,以更好地保護用戶信息,增強以CBASE為基礎新一代的貸記卡專項授權系統整體安全系數。
3、結語
通過以上分析論述之后我們對于金融行業應用場景當中分布式的數據庫應用情況,均能夠有了更加深入地認識及了解。從總體上來分析,分布式的數據庫具備著強大的應用優勢,今后為能夠更好地將其應用至金融行業的應用場景當中,便還需相關技術員結合實際情況,加以分析與研究,持續優化與完善該分布式的數據庫,以便于其充分發揮效用科學應用至金融行業各種應用場景中,為金融行業發展注入力量。
參考文獻:
[1]張文升.分布式數據庫Greenplum研究與應用[J].金融科技時代,2017,19(06):444-446.