王昭彧 中國銀監會白銀市銀監分局經濟師
?
銀行業數據挖掘:一般數據結構的嘗試及挖掘應用策略
王昭彧中國銀監會白銀市銀監分局經濟師
摘要:金融大數據蘊藏巨大價值,但受通用數據結構缺失等歷史因素影響,差異化的銀行業海量數據目前仍難真正成為“數據資產”,持續創造“經濟價值”。為此,本文嘗試提出了銀行業一般數據結構,并就銀行業數據挖掘實踐的應用方向與基本策略提出了建議。
關鍵詞:銀行業;大數據;一般數據結構;數據挖掘
自2012年以來,大數據、大數據分析、互聯網金融等概念持續熱議,銀行業因為擁有海量的電子化數據,且多為結構化數據,為迎接互聯網金融的沖擊,或被動或主動地加入到數據挖掘的隊伍之中,尋覓著隱藏在“數據資產”中的“金礦”。但如果依照KDD進程(Knowledge Discoveryin Database,基于數據庫的知識發現)及數據挖掘(DataMining)理論和技術的要求,客觀評估銀行現有的數據結構與信息處理方式,雖然大數據分析為有效利用點多、面廣、非結構化的數據提供了可行之路,但基礎性問題的存在,諸如不同產品數據規范不一致、新舊數據標準不兼容、銀行業統一數據架構缺失等,明顯遲滯了數據價值的挖掘進程。為此,筆者嘗試介紹一種銀行通用數據結構,并梳理出銀行數據挖掘當前實踐亟待解決的若干問題,供同業者參考。
2.1以銀行為中心的6個考察維度
借鑒業內監管專家與基層骨干的觀點,基于銀行業通用數據的視角,以單家法人銀行為分析對象,在保證與其它銀行業機構橫向可比的原則下,可以確定以下5個考察維度:……p>