本刊記者|石菲
此前學界廣泛認為金融機構本質是中介,還有人認為金融的本質是對風險的控制與管理,然而隨著金融業受到的沖擊越來越大,已經有人開始對金融進行重新定義,金融就是大數據。
在過去十年間,國內銀行的資產規模隨著經濟的快速發展,已經達到并超出了國際同行業的水平。而未來發展仍將面臨很多復雜的挑戰:來自中國經濟增長模式的根本性轉變、新客戶群體的興起、激烈的行業競爭以及來自銀行自身價值創造的業績壓力。金融業需要借助對業務的分析與優化,推動自身的轉型與創新。
作為全球五百強企業,民生銀行業務快速增長帶來的激增數據對業務洞察能力不斷提出新的要求。傳統粗放式的客戶營銷策略已經不足以幫助銀行實現更快速業務的增長。民生銀行亟需充分整合客戶數據,通過精準的營銷設計降低客戶流失率,提高忠誠度;借助大數據技術對不同渠道來源的提供商、客戶的交易行為進行全面分析,實現鏈式反應;搭建有效的數據模型,為客戶提供全方位管家式的非金融服務。
要達到這樣的效果,需要對幾種數據進行分析。首先是傳統數據,并且數據量增加速度迅猛,每半年的增長率可能會達到30%以上;其次是基于互聯網的數據,包括來自移動終端的數據;第三是基于電子商務類型的數據,且隨著互聯網金融的發展,基于電子商務的數據越來越多;最后是以用戶為中心的、更加全面的數據。以前在銀行業內有客戶統一視圖,圍繞用戶的金融行為和金融狀況來進行展示。而現在銀行需要更多的用戶行為,包括生活中的行為數據、地理信息、外延的交易行為等。
銀行業務有很多非結構數據需要處理,例如業務部門希望能夠通過對客戶來電的語音分析來判斷客戶對銀行服務的滿意度。非結構化數據對計算能力提出了不同的要求,通過大數據平臺的搭建,上層建立對應的模型就可以實現這些需求。所以民生銀行希望先提供一個基礎的計算架構和計算平臺,供上層建立想要的應用。
因此,民生銀行和IBM與巨杉數據庫公司展開合作,通過I B M BigInsights大數據解決方案和企業級NoSQL數據庫SequoiaDB為民生銀行搭建低成本、高性能、高可靠且水平擴張的數據平臺,幫助民生銀行通過大數據分析應對金融業的大數據挑戰。
大數據平臺解決方案的實施,將幫助民生銀行積極應對金融業發展的新要求。完善交易流水查詢分析系統, 產業鏈金融管理系統,以及私人銀行產品貨架管理系統。在應對金融業巨大信息量帶來的4V挑戰中,BigInsights也體現了特殊的優勢:
首先,隨著業務的細化和企業規模的增加,民生銀行面對的計算量呈數量級增加大數據平臺能夠應對大規模的靜態原始數據分析,提供多節點的分布式計算,提升數據處理能力。同時,BigInsights大規模并行線性伸縮能力,能夠應對海量文本的處理。
其次,民生銀行自2012年部署Hadoop計算平臺以來,數據分析能力得以提升,但在處理多樣性數據時仍受開發周期限制。大數據平臺集成了具備強大擴展性的結構化和半結構化處理描述性語言JAQL,可以處理各種類型的數據分析,在不同的應用場景中,實現全面的數據分析。特別是內置的集群內文本語義分析功能,為多種來源的文本提供高性能的處理、標注及分析功能。
第三,在金融業,1秒的響應時間差別,往往意味著客戶的去留。大數據平臺自帶的Symphony能夠即時地應對應用程序要求的變化,實現更佳的應用程序性能、利用率以及對業務關鍵型工作負載要求的更快速響應。Symphony 的多承租架構使得企業可以使得傳統的業務和多個大數據應用各行其道,互不干擾。同時,BigInsights提供的BigSQL,使開發人員可以簡單快速的查詢Hadoop中的數據,提升查詢效率。

最后,金融市場的實時性和自動化對數據的準確性不斷提出新的要求。大數據平臺提供完善的信息整合、數據治理和元數據管理功能,通過信息整合可以將任何類型的數據集成到大數據平臺中,通過數據治理可以實現信息的生命周期管理(數據生命周期的保留策略、測試數據管理和數據增長管理)、隱私保護和安全性管理(自動尋找、分類和保護敏感信息,漏洞、配置和行為評估,隱私信息修訂,數據庫活動監控和 Hadoop活動監測)、數據質量控制(數據源分析,元數據世系分析,數據轉換、清洗和標準化)和主數據管理等。通過統一的元數據管理,企業不僅可以了解關系型數據還可以掌握半結構化數據以及非結構化數據所代表的含義,為大數據的進一步分析和洞察提供基礎支撐。
現在傳統銀行業在業務方面受到的壓力非常大,不僅受到其他行業的正面競爭,還有經濟持續下行對銀行風險的考驗也在增加,銀行面臨越來越多的業務壓力。這些壓力從業務部門傳導到科技部門后,需要科技部門提升分析和預測能力,提高洞察力,減小風險,提高競爭力。IBM新興市場大數據中心總監王曉梅表示,早在2012年民生銀行的領導在做年度工作總結時就提到了要探索商務智能分析以及大數據如何推動業務提升。2013年民生銀行科技部進行了組織機構調整,準備籌建數據實驗室,專門設立數據科學家崗位。民生銀行對數據科學家們并不按照傳統的業務崗位考核績效,希望他們能夠發揮想象力,去創造性地使用大數據,從而提升業務效益。
王曉梅說,要建立這樣一個平臺,傳統的方案成本非常高,需要千萬元級或者上億元。而用大數據解決方案,硬件投入成本只需要幾百萬元。雖然目前大數據平臺上線的應用還不多,但它能夠靈活解決很多以前解決不了的問題。現在業務部門有很多需求,將來可以通過數據科學家將這些需求轉化為技術語言,就可以很容易實現。
王曉梅表示:“民生銀行在大數據分析領域的遠見和實踐,對于企業應對海量數據的挑戰具有重要意義。相信通過IBM在大數據領域的領先技術及對金融業豐富的行業經驗,以及合作伙伴巨杉數據庫的支持,民生銀行未來將通過數據分析獲得的行業洞察實現企業的創新與轉型,鞏固其在金融業的領先地位。”