王娟
【摘 要】現如今,大數據概念及產業業已在人們生活和工作工作中不斷產生越來越多的影響,銀行業作為信息密集型的服務產業,它所產生的交易數據、客戶活動信息等都是重要的大數據來源.如何有效將大數據和銀行業進行結合,并通過大數據技術驅動銀行業務實現更好發展,是當前銀行業急需解決的問題.本文闡述了大數據的起源、定義、特征,并在此基礎上,對銀行業大數據應用進行了進一步探討和分析。
【關鍵詞】大數據;銀行業;應用
一、大數據的起源及特點
“大數據”概念最早由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在編寫《大數據時代》中提出,指不用隨機分析法(抽樣調查)的捷徑,而是采用所有數據進行分析處理。大數據有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
二、大數據在銀行業的應用
(一)業務驅動
大數據在銀行業的應用主要是由其業務驅動的。應用大數據的業務驅動主要由精準營銷、風險控制、改善經營和服務創新四個方面組成。
1.精準營銷:互聯網時代的銀行在互聯網金融的沖擊下,迫切的需要掌握更多用戶信息,繼而構建用戶360度立體畫像,即可對細分的客戶進行精準營銷、實時營銷等個性化智慧營銷。
2.風險控制: 應用大數據技術,可以統一管理銀行內部多源異構數據與外部征信數據,可以更好的完善風控體系。內部可保障數據的完整性與安全性,外部可控制用戶風險。
3.改善經營:通過大數據分析方法改善經營決策,為管理層提供可靠的數據支撐,使經營決策更加高效、敏捷,精確性更高。
4.服務創新:通過對大數據的應用,改善與客戶之間的交互、增加用戶粘性,為個人與政府提供增值服務,不斷增強銀行業務核心競爭力。
除以上四點之外,銀行等金融機構應用大數據也有政府政策的原因。在十二五規劃中,大數據已不再是只是專有名詞,大數據已然上升為國家戰略。隨著國家對數據的重視、對國產化的支持以及對開源架構的呼聲越來越高,使得銀行等金融機構對大數據技術的選擇成了必然趨勢。
(二)數據類型
銀行多源異構的數據類型是首先需要被考慮的。只有將多源異構的數據處理好,為應用建設打好基礎,銀行建設的大數據項目才有意義。銀行的數據類型可分為結構化數據、半結構化數據與非結構化數據三大類型。
1.結構化數據:結構化的數據來源自銀行運營數據倉儲(ODS)和數據倉庫(EDW)。EDW為企業提供分析決策服務,ODS主要實現企業數據整合、共享和準實時運營監控等功能。
2.半結構化數據:半結構化數據的整合在數據整合中是最為復雜的。銀行可對接來源于銀聯數據和其他的金融機構所提供的不同類型數據庫或Excel等的數據。“打通”多源異構的數據是項目中遇到的最困難的部分,數據整合完畢可快速進行建模分析。
3.非結構化數據: 銀行對于非結構化的處理的方法還是比較原始的。非結構化數據涵蓋的范圍比較廣泛,有新聞,視頻,圖片以及社交網絡等數據,此類數據的數據量相當巨大,但以后對銀行的增值會難以估量。
三、數據流向架構圖
1.大數據基礎平臺:國外廠商的產品CDH、HDP等,國內廠商的產品TDH、ADH等,以上產品均可為企業用戶提供大數據基礎的存儲與計算服務。
2.數據處理加工平臺:主要對大數據基礎平臺提供數據,進行建模分析。一可遷移銀行已有的主題模型,比如銷售主題、財務主題、風控主題等一系列主題遷移至大數據平臺上。二可對接服務機構創新性模型,比如半結構化數據、非結構化數據等的模型進行遷移。
3.數據服務共享平臺:目前銀行應用的較少。總行應用共享平臺,可為支行與分行提供服務,比如支行與分行的客戶經理在上班之前可用手機接收總行的推送信息,推送信息包括預測客戶經理的顧客貸款、購買理財產品等的概率,提升服務質量,提高服務精度,增加成單量。
目前接觸的銀行中,做到第二層級數據處理加工的比較多。銀行會做好用戶畫像,做一些簡單的客戶分析。至于第三層級數據服務共享平臺,做的銀行較少,而且總行應用共享平臺,怎樣提供服務給支行,支行怎樣提供給分行,還需要理好思路進行探討。總體來講,數據流向的大致思路是通過數據源的接入獲取更加全面的數據,通過構建或遷移相關模型,為共享平臺提供服務。流程如下: 數據源接入——模型構建——服務共享
四、大數據應用
大數據應用中,可依照非實時到實時為時間軸,分為離線分析、實時分析、流處理與數據服務接口服務。
1.離線分析: 銀行系統中,總行在離線分析應用的較好。離線分析在銀行中的應用比較落后陳舊,且多數利用海量歷史數據進行離線分析,分析現有客戶,刻畫用戶畫像,對客戶細分。并且大部分分行還在跑批的階段。銀行如果過度依賴離線分析,會錯過客戶購買時機,在搶占市場時失去先機。
2.實時分析:相對于離線服務,實時服務的總體投入量更多。實時分析階段主要提升計算能力,分析結果提升至分鐘級,及時提供服務支持,客戶經理可以及時的跟蹤。
3.流處理:在流處理階段,銀行與客戶的交流會更直接。比如當客戶消費時,消費記錄便會記錄在銀行的消息隊列,通過大數據平臺run出用戶符合某項活動的活動規則,1s內反饋結果,活動與人會自定義匹配,在用戶操作刷卡動作時,實時減免相關用戶等級的費用,而且此活動會比提供優惠券更能吸引客戶。
4.數據服務接口:可以增強銀行模式轉型競爭力。銀行的體制決定銀行本身具有大體量數據等資源,通過數據整合、模型分析等流程加工數據,以數據服務商的角色為政府等部門提供數據、在線服務等,還可與之交換數據。