張勝 安徽涇縣銅源村鎮銀行股份有限公司
引言:互聯網的快速發展,社會進入大數據時代,農村金融機構面臨的風險和挑戰逐漸增加,信用風險主要體現在業務風險和資金風險等方面,對于信貸資金未能展開有效監管,同時,對于客戶風險的把關存在問題,沒有將授信統一,導致貸款發放不合理,對此,需要利用大數據,建立風險評估體系,及時掌握客戶信息,做好信用風險管理,保證金融機構的信貸資金安全。
大數據主要指在特定時間內產生的各類數據,這些數據難以使用傳統方法進行收集,而且大數據平臺具有實效性,能夠動態化發展。大數據的數量以TB、ZB等標準為主,并且不斷上漲,難以在規定的范圍之內進行儲存和計算,數據流轉階段,以快速、動態化狀態進行,包括結構化數據以及非結構化數據,大數據價值密度相對較低,但是商業價值相對較高。
當前,市場利率化形勢明顯,金融機構利差收入的優勢受到影響,特別是農村地區的金融機構,營業收入出現下滑狀態。隨著大數據時代的到來,為農村金融機構的發展提供全新機遇,利用大數據分析方法對于農村金融機構重要性主要體現在如下幾方面:
第一,為農村的金融機構帶來更廣闊的業務空間,互聯網的快速發展,電商平臺應運而生,金融機構網點也出現變化,產生各類結構化與非結構化數據,通過大數據技術,能夠對客戶信息深入挖掘,找出潛在客戶,為銀行產品創新提供全新途徑,拓寬農村金融機構業務空間。
第二,大數據的應用,能夠提高農村金融機構決策與判斷能力。信息時代,銀行業務的開展需要依托數據信息制定運營決策,應用大數據,通過海量數據信息當中尋找利于銀行經營的數據信息,對于業務風險合理評估,并對資源展開優化配置。
第三,大數據的應用能夠提高信用風險的管理能力,運用大數據技術展開精細化管理,為農村金融機構產品創新以及風險控制提供全新途徑,轉變傳統經營模式,和電商之間進行聯合,控制信用風險,提高風險管理工作水平[1]。
農村金融機構的大數據平臺包括如下信息源系統:一是核心系統,二是信貸系統,三是外圍系統,通過上述系統對于文本文件進行采集,并對元數據進行清洗,通過轉換變為標準化數據,并按照法人機構進行區分,拆分數據信息,利用固定模型將數據整合,最終形成數據視圖。這樣后臺可以按照賬戶、客戶以及機構各層次展開匯總,便于前臺對于數據的利用。數據挖掘過程包括數據信息采集、清洗、轉換、整合、處理等內容。
數據挖掘方法種類多樣化,將挖掘目標、數據模型等作為基礎,建立多個模型形式,其中包括聚類分析、偏差檢測以及關聯規則等模型,金融機構可借助上述模型獲取更高商業價值,提高金融機構核心競爭力。
決策樹主要是樹形結構,能夠對分類預測起決定性作用,分析過程,不同節點都代表樹形測試,各分支則代表測試輸出,使用決策樹算法具有分類精度高、生成模式相對簡單、噪聲數據優越等特點,所以取得廣泛應用。
本研究所用的數據源為某農村金融機構中個人貸款的客戶數據,選擇個人工商戶、小額信用貸以及企事業貸款,通過分析上述客戶類型貸款情況,客戶信息和貸款不良率信息如表1所示:

表1 客戶信息和貸款不良率信息
可知小額貸款的人數相對較多,超過99%,由此可以看出,該金融機構面向的客戶主要為農戶。

表2 客戶年齡層次信用貸款信息表

分析客戶年齡層次,處于(18,25]歲年齡段的客戶,貸款不良率為2.75%;處于(25,30]歲年齡段的客戶,貸款不良率為2.52%;處于(30,35]歲年齡段的客戶,貸款不良率為3.44%;處于(35,40]歲年齡段的客戶,貸款不良率為2.73%;處于(40,45]歲年齡段的客戶,貸款不良率為3.38%;處于(45,50]歲年齡段的客戶,貸款不良率為4.53%;處于(50,55]歲年齡段的客戶,貸款不良率為4.2%;處于(55,60]歲年齡段的客戶,貸款不良率為4.15%;超過60歲年齡段的客戶,貸款不良率為6%。發現不同年齡段之間貸款不良差距相對較小,超過60歲的客戶在貸款不良率方面相對較高。

表3 為客戶年收入信息表
對于客戶收入進行分析,理論上來講,客戶擁有高收入,代表其還款能力相對較強,在貸款不良率方面應該低于低收入的客戶。但是結果顯示,收入≥20萬的群體,貸款不良率3%;收入處于(10,20]萬客戶,貸款不良率1.36%;收入處于(5,10]萬客戶,貸款不良率1.29%;收入處于(2,5]萬客戶,貸款不良率0.88%;收入≤2萬的客戶,貸款不良率1.39%;高收入人群貸款不良率相對較高,和理論存在差異,因此,需要對其中原因展開深入探索。

表4 為客戶學歷和貸款不良率信息關系表
分析客戶學歷以及貸款不良率二者之間關系,無學歷客戶貸款不良率1.72%;小學學歷客戶貸款不良率1.60%;初中學歷客戶貸款不良率1.62%;高中學歷客戶貸款不良率10.76%;技校學歷客戶貸款不良率5.91%;中專學歷客戶貸款不良率1.69%;大專學歷客戶貸款不良率3.39%;本科學歷客戶貸款不良率0.98%;研究生學歷客戶貸款不良率0.00%;呈現出“中間高,兩頭低”這一問題,小學學歷人貸款人數相對較高,和農村地區實際情況相符[2]。
通過上述案例分析,可以看出大數據在農村金融機構的客戶信息和客戶篩選方面不但高效,而且準確度高,可對農村金融的信用風險分析過程起到指導性作用。
大部分農村地區已經設立了金融機構網點,面向農民提供信貸業務。利用大數據平臺,可對客戶職業、年齡相關信息進行挖掘,尋找客戶信息和信用風險存在的關聯,結合風險信息對于客戶進行管理,實現精準營銷。然而,農村的金融機構信用風險的管理還存在不同程度問題,主要表現在如下幾方面:
第一,數據標準尚未完全建立,還存在大量冗余數據,難以共享,雖然收集到大量數據,但是,由于數據形式沒有統一,導致數據質量參差不齊,數據處理以及標準化體系的建設還不深入,難以以獲得理想的分析結果[1]。
第二,數據種類不豐富,對比商業銀行互聯網金融,農村金融機構在數據采集方面略顯不足,對此,可與電商平臺或者政府機構展開合作,將數據結構加以豐富。
第三,專業人員素質有待提升,部分農村金融機構尚未設置數據分析相關部門,都是將數據分析過程外包給專業公司,由于金融機構缺乏專業數據分析人才,對于信用風險的分析相對不足,數據覆蓋面窄,難以將業務有效聯系。
第一,建立數據標準,將冗余數據刪除,統一數據格式,保證數據分析過程信息獲取質量,對于農村金融機構客戶基本信息展開深入分析,制定營銷策略,展現數據分析價值。
第二,豐富數據類型,可借鑒商業銀行的運作模式,利用“互聯網+金融”的形式,采集信用信息數據,或者和政府部門、電商平臺等展開合作,豐富數據結構,提高信用信息數據獲取的真實性。
第三,培養專業人才,農村金融機構可設立數據分析部門,培養大數據技術人才,聯系自身業務,對于信用風險數據展開全面挖掘和分析,通過人才培養,不斷拓寬數據信息覆蓋面積,對于信用風險原因展開全面分析,展現大數據在信用風險防范方面的應用價值。
結束語:總之,結合農村金融機構面臨的信用風險問題,依托大數據技術建立管理平臺,并利用決策樹模型,建立完善的信用風險體系,為相關人員制定決策提供依據。大數據管理平臺的應用,能夠減輕機構管理信用風險期間各項成本,并提供精準數據支持,保證銀行數據和客戶信息的對稱性,對于信用風險全面管理。