劉靜芳
中國建設銀行從2003年開始認識到數據治理的重要性,開始探索適合建行特色的數據治理體系。2011年以來,建設銀行依托新一代核心系統工程,建立了完善的數據管理和數據應用體系,夯實了覆蓋所有業務的規范統一、集成互聯的數據基礎,實現了企業級、全流程數據管控。
建設銀行建立了完善的企業級數據規范體系,并在新一代核心系統中全面落地執行。數據規范體系包括數據標準、業務術語、指標體系、業務數據模型等,截至2017年末,建設銀行累計制定數據規范80000余項并全面執行,從源頭上保證了數據一致性。
建設銀行建立了外部數據資源統一引入和共享機制,數據倉庫在集成行內125個系統數據的基礎上,引入業務場景需要的工商、法律、海關、中經網等外部數據,實現企業級數據集成整合、互聯互通和全面共享。
建設銀行建立了完整的數據管控機制,開發了企業級、可視化的數據資產管理工具,支持對全行數據實施全生命周期的管理。建立企業級元數據資產庫,提供元數據應用服務。建立企業級數據質量平臺,提供可定制的數據質量監測服務。
建立一體化協同機制
大數據能力建設是覆蓋和貫通數據價值鏈中采集、加工、管理、應用各個環節的全局性工作,所有機構都是直接的參與者。大數據工作取得成效的關鍵在于,遵循科學規律,結合具體實踐,以全行一盤棋的思路做好頂層設計,建立適應互聯網和大數據新競合業態下的工作組織體系,充分激發全行各級機構管理數據、應用數據的積極性和創造性,促進全行經營管理向數據智能型邁進。
為保證大數據戰略有效實施,建設銀行自上而下建立了完整的組織管理和工作機制,成立了總行領導掛帥的工作領導決策機構,強化了總行數據管理部作為大數據能力建設牽頭部門的職能定位,與新組建的大數據智慧中心一體化協同運作,加強大數據工作的體系化統籌管理、創新動能培育和內聚賦能能力。大數據智慧中心作為專門為全行提供大數據應用支持的專業化機構,為總分行各業務部門大數據應用提供全面的數據、分析方法、工具和專業人員支持,協助業務部門滿足管理決策、客戶營銷、風險管理、產品創新等數據分析,共同實現全行大數據戰略目標。同時,為在全行范圍推廣大數據理念,培養數據分析人才,建設銀行每年組織實施“綠樹工程”大數據種子人才培養計劃,選拔總、分行骨干人員到大數據中心學習工作一段時間,以集中授課、項目實踐雙管齊下的形式,培訓骨干人員掌握大數據分析工具、技術和方法,為全行培養了一大批數據分析人才。
總行各部門相繼設立大數據應用崗位,以多方合作開展大數據應用項目的形式,深挖全行數據資源,逐步實現數據引領和數據驅動業務發展的目標。各分行數據管理條線參照總行大數據組織管理架構,在各層級機構共同推進大數據分析成果落地應用。全面規劃工作平臺
構建大數據生態體系
銀行業要發揮數據價值,驅動業務發展與創新,需要在傳統數據處理平臺的基礎上再上一個臺階。建設銀行規劃并建設了大數據工作平臺,將其定位為:面向全行數據分析人員大數據生態體系的基石,是全行大數據分析工作的實驗室、工具箱和知識庫;具備多類型數據整合、海量數據處理、數據產品創造等能力,并提供各類共享數據分析挖掘應用資源。在平臺項目實施過程中,以基礎先行、應用導向為原則,推進大數據相關技術、工具的研究、引進或功能開發,逐步實現涵蓋數據采集與轉換、存儲與計算、展現與運用等能力為一體的大數據生態體系。
在數據采集與轉換能力建設方面,制定了統一的結構化、非結構化數據采集規范,在合法合規的前提下,實現對企業內部、互聯網網站、社交媒體、第三方機構等結構化與非結構化數據的采集,進一步豐富數據來源。
在數據存儲與計算能力建設方面,依托“MPP+Ha-doop”的融合架構,搭建符合大數據處理要求的結構化、非結構化數據存儲與計算平臺,形成對多種數據類型的海量數據存儲能力、海量數據快速計算能力、針對流數據等動態數據的計算處理能力以及運用機器學習等技術實現的數據分析和挖掘能力。
在數據展現與運用能力建設方面,在傳統的可視化分析基礎上,增加大數據處理所需的可視化分析工具,支持更有效的圖形、圖表等可視化分析與展示需求;同時打通大數據工作平臺與多渠道的信息交互通道,支持將數據分析成果對接到應用組件、短信平臺、微信公眾號等。
圍繞大數據生態體系,建設銀行不斷跟蹤大數據及相關領域的最新技術成果,深入研究大數據領域相關技術應用,積極引入各類先進的分析工具和技術,培育數據挖掘和分析技能,在繼續提升全行傳統結構化數據分析能力的同時,結合非結構化數據的特點,因地制宜、各盡所能,分類建設多種不同的分析能力。
在機器學習領域,引入Python、R、Spark、Zeppe-lin等數據分析語言及工具,運用典型的關聯分析、LDA聚類、隨機森林、協同過濾等機器學習算法處理客服語音文本、智能客服會話文本等非結構化數據,融合處理結構化、非結構化數據,構建熱點問題分析、來電原因分類分析、投訴升級預測分析、智能推薦等一系列挖掘分析模型,從而洞悉客戶心聲、預測客戶需求,為優化業務運營、提升業務效益服務。
在深度學習領域,基于開源的TensorFlow深度學習框架等工具,在圖像識別等領域進行探索與應用;在圖分析領域,引進了專門工具用于實現圖分析、路徑分析,并在此基礎上探索研究Neo4j、JanusGraph等開源圖數據庫工具,用于構建客戶關系圖譜、預測客戶資金流向等。
積極推進大數據應用
建設銀行大數據戰略實施三年以來,聚焦全行業務發展的熱點、難點問題,著力提升大數據分析挖掘能力,推動全行體系化大數據應用,從無到有,從弱到強。
建設銀行在普惠金融領域,結合企業及企業主行內外數據,運用大數據技術,建立全新的客戶評價體系,圍繞客戶履約能力、信用狀況、資產狀況等方面進行綜合評價,選擇誠信納稅優質小微企業給予信用貸款,采用全線上自助貸款流程,實現針對性貸后預警監測,依托大數據技術實現在信貸流程、風險控制等方面的全面創新。
建設銀行在住房金融領域,基于我行自身海量、高質的住房交易數據,整合外部優質數據資源,采用特征價格法編制住房租賃價格指數,以完整反映住房租賃市場格局和動態,為政府部門、企業機構和各類市場參與者提供系統性支持和服務。建設銀行因此成為國內首家由金融機構編制發布住房市場分析監測指標的機構。
此外,建設銀行借助大數據技術深入探索語音、圖像、文本等非結構化數據的應用。一是分析客戶來電投訴語音數據,預測客戶投訴升級可能性,及早做好客戶服務和矛盾化解工作;二是運用深度機器學習技術,對客戶行駛證圖像數據進行自動識別分析,獲取客戶的購車日期、車型檔次等信息,精準定位客戶車型續保時點,預測客戶換車需求,驅動車險、購車分期等信用卡產品精準化營銷;三是根據各個渠道采集到的客戶咨詢、建議等文本內容,運用自然語言分析工具,挖掘客戶業務需求和業務場景,關聯客戶交易行為,精準定位營銷目標客戶群體,結合對應的金融產品,制定營銷策略和營銷話術,開展手機銀行獲客、活客精準營銷。