999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

智能化對公信貸客戶風險監測審計模型研究

2022-04-29 00:44:03于威戴龍龍張偉青陳小其
中國內部審計 2022年11期
關鍵詞:商業銀行人工智能

于威 戴龍龍 張偉青 陳小其

[摘要]近年來,對公信貸一直是銀行資產投放的重要領域,規模和客戶數量穩定增加。隨著內外部經濟、經營環境的日趨嚴峻,銀行內部人員、信貸流程及內部控制等管理日趨復雜,審計部門利用傳統抽樣方法、規則模型監測方法等已不能滿足風險前瞻預判和日常監督的要求。本文結合審計經驗,從商業銀行海量經營、管理等信息中選取風險因子,運用XGBoost等人工智能算法,輔助進行對公信貸客戶風險監測,以提升審計效能。

[關鍵詞]商業銀行? ?內部審計? ?信貸風險? ?人工智能

從各家銀行披露的年報看,信貸穩則業績穩、信貸優則業績優,信貸規模和信貸資產質量直接影響商

業的盈利能力,尤其是信貸資產質量直接影響銀行利潤,對公信貸資產是商業銀行內部審計重點關注對象。大數據、人工智能等技術的發展,為銀行審計解決人力資源不足、發現問題滯后、風險識別能力不足等問題提供新的手段。銀行內部審計人員充分應用科技能力不斷擴大審計覆蓋廣度和深度,從而全面監控客戶,前瞻預判潛在風險,從事后逐步向事中、事前延伸分析,提高審計效能。

一、研究概述

(一)以往研究情況

近幾年,商業銀行數字化轉型探索日益向深處、實處發展,智能風控、智慧營銷、精細管理等方面成果豐富、成效明顯,以風險識別領域為例,人工智能和大數據技術運用從嘗試走向主流,正成為一家銀行科技軟實力的重要表現。很多學者和專家在智能風控、智能審計領域有著很多獨特見解。秦榮生指出審計要想實現全覆蓋就必須利用大數據挖掘技術,實現由單一審計向批量審計轉變。張昊楠倡導在銀行信貸風險管控上應拓寬銀行數據緯度,增強信貸風險管控能力。黃薷丹則嘗試邏輯回歸、支持向量機、神經網絡等多種機器學習算法應用于商業銀行企業客戶信貸風險評價,提升風險評估的效率和準確率。榮欣和劉紅生倡導引入機器學習技術,通過大數據模型的迭代學習,準確識別業務運行中出現的風險。沈燕兵提出創新構建商業銀行審計分析模型體系的構想,以大數據挖掘、機器學習、人工智能技術為主,運用監督分類學習、自然語言文本挖掘、社交網絡圖挖掘、關聯規則挖掘等方法,深入挖掘各類不良貸款的形成原因。

審計部門作為商業銀行風險的最后一道防線,要發揮守底作用同樣需要推進信息化、數字化變革,信用風險作為銀行主要風險類型,也是審計重點關注對象。以審計視角看商業銀行對公信貸客戶風險,一般面臨著分支機構與總行信息不對稱、經營管理部門掌握信息與審計部門信息不對稱、銀行內部信息與外部信息不對稱等問題。這導致審計對信貸客戶風險難識別、耗時間、拿不準等表現突出,亟需進行研究思考并加以解決。

(二)研究重點和方向

本文將信貸客戶風險審計監測和識別難題進行過程升維和結果降維,通過對銀行內外部信息進行收集、整理、融合、分析,并構建特征工程,利用人工智能算法,以審計視角轉化為二元分類分析判斷問題,實現科學預測客戶風險下遷的概率,更好輔助內部審計部門開展信貸客戶風險日常監測、客戶風險畫像、審計抽樣等工作,并在此基礎上,通過客戶所處行業、上下游風險傳導關系等在信貸客戶準入的事前環節釋放價值。

二、智能化信貸客戶風險監測模型設計

(一)體系架構設計

信貸客戶風險一般從三個維度進行分析,分別為宏觀維度、客戶維度和銀行維度,本體系將涉及客戶從申請準入、審查審批、貸款發放、貸后管理等全流程的信息,以及系統操作信息、統計信息等進行梳理,形成特征近400個。具體如表1所示。

(二)建模流程

數據建模過程嚴格按照SEMMA流程體系要求,強化過程質量管控,突出模型參數優化和算法選擇迭代方式,同時根據數據質量特點對流程進行細化,做到更加有針對性。總體流程如圖1所示。

(三)算法選擇

對公客戶風險識別的實質是判斷客戶貸款是否已經不良,是數據挖掘中典型的二分類問題。本文通過客戶相鄰季度信用等級的下遷進行標簽化處理,從而可以進行有監督學習。在客戶風險識別領域,傳統有監督算法像Logistic、SVM等已有較多的應用先例,但模型擬合能力相對不足,易過擬合。決策樹算法因擬合能力強、運算速度快、具有可解釋性等特點,在當前分類算法場景中逐步得到應用。因此,本文嘗試選用XGBoost(Extreme Gradient Boosting)和LightGBM(Light Gradient Boosting Machine)兩種算法,由于LightGBM相比XGBoost更易過擬合,本文最終使用XGBoost算法建立智能化信貸客戶風險審計監測模型。

三、模型研發實踐路徑

(一)數據獲取與數據處理

1.數據獲取。根據對公貸款客戶數據判斷其是否存在信用等級下遷的可能性,即預測客戶貸款出現不良的可能性。本文以季度為最小時間單位對客戶信息進行切片,并按照單季度、雙季度、四季度進行跨時間風險預測。選取從2018年第四季度至2021年第四季度對公客戶樣本數據集,數據按照表1范圍進行收集、整理,其中客戶相鄰季度的信用等級由“關注及以上”下遷至“次級及以下”為正樣本,而未下遷客戶數據為負樣本。

2.數據預處理。一是缺失值。將所有選取的特征項進行缺失值統計,得到空值率。由于空值率較高的特征在模型擬合過程中起到的作用較小,因此可以直接刪除。對于空值率較低的特征項,通常采用均值插補、最大自然估計、多重插補等方法進行填補。本文使用XGBoost自帶缺失值處理方法,即在計算分割點時,不會遍歷統計丟失特征數據的樣本,通過這個技巧減少為稀疏離散特征尋找分割點的時間開銷,從而提升效率。二是噪音數據。特征項中通常存在噪音數據,如亂碼、中英文等數據,因不符合建模要求,因而無法參與模型訓練。本文通過賦值、離散化等方式對噪音數據進行處理,發現異常值,消除異常離群點影響,降低數據復雜度,加快模型迭代速度,提升特征表達能力,增加模型魯棒性。為降低變量的復雜性,減少變量噪音對模型的影響,提高自變量和因變量的相關度,本文還采用決策樹、卡方、等距等多種方法進行分箱處理,從而使模型更加穩定高效。

3.特征因子選取。特征數據預處理完畢后,通常先采用WOE和IV值初步篩選特征,IV值通常用來評估特征的分類能力,通常IV值大于0.02時具有較好的區分能力,其評價標準如表2所示。

以對“最近一次貸款利率”特征進行分析,該特征項IV值為2.23,大于0.30,具有明顯的區分風險表達能力。數據分析發現信用等級下遷客戶主要集中于貸款利率在6%—10%,低利率或超過利率出現不良的可能性相對較低,差別較為明顯。

經過特征初篩后,驗證特征自相關性,特征相關性較高則可視同為同一特征,不應重復參與模型訓練。通過計算剩余特征兩兩之間線性相關性,若相關性高于0.6,則剔除IV值較低的特征。

通過上述空缺或噪音數據分析、IV值分析、線性相關性分析等,從而形成最終入模特征變量。

(二)模型訓練

根據模型目標,定義包含n個對公客戶和m個特征因子屬性的數據集D={(Xi,yi)}(|D|=n,XiRm,yi{0,1}),其中Xi表示對公客戶的特征向量,yi代表該客戶是否已經不良(0為正常客戶,1為不良客戶)。一棵回歸樹可以對一個客戶進行預測得到分值f(Xi),將多棵回歸樹所得的結果進行相加即可得到最終預測結果,如式(1)所示:

(1)

其中,F={f(x)=q(x)}(q:Rm→T,RT)表示回歸樹空間,q代表單棵樹的結構,T代表該樹葉子節點的數量,代表每個葉子節點的權重,每一棵樹都是獨立存在的。對于一個對公客戶通過K棵樹,將其映射到對應的葉子節點后,相加所有映射葉子節點的分數即可得到該樣本的最終分數結果。模型的目標函數如式(2)所示:

(2)

由該公式得知,目前共分為兩部分,第一部分代表預測值與真實值的yi之間的訓練誤差,通過不斷優化訓練誤差使得預測分布接近于真實分布;第二部分則代表模型復雜度的懲罰項,該部分有利于葉子節點權重更加平滑,模型更為簡潔,防止過擬合,增強模型魯棒性。

運用迭代的方式對模型求解,每經過一輪迭代增加一個函數到模型中,如式(3)所示:

(3)

其中為第t次迭代時的預測分數,為加快目標函數迭代速度,對目標函數進行優化得到,如式(4)所示:

(4)

利用泰勒公式對目標函數進行二次展開,加快迭代速率,最終可得第t次迭代簡化目標函數,如式(5)所示:

(5)

采用樹形結構的方式對函數進行優化,根據葉子節點的權重和數量的L2范數定義復雜度懲罰項,其中F={f(x)=q(x)}(q:Rm→T,RT),如式(6)所示:

(6)

其中和為懲罰系數,用以控制正則化程度,最后定義每個葉子中包含的樣本集合為:Ij={i|q(Xi)=j},最終改寫為式(7):

(7)

最終得到目標函數,如式(8)所示:

(8)

由式(8)等于0得到葉子最優權重以及最優函數如下:

(9)

式(9)可以作為一個評價數結構好壞的標準,利用貪婪算法,從深度為0的樹開始進行迭代分裂,通過信息增益(Gain)的方式,選擇信息增益最大的特征及其最佳分裂點進行分割,直至信息增益<=0或者迭代到預先設定的閾值時停止分裂,得到最終的分類樹結構,信息增益計算如式(10)所示:

(10)

四、模型效果評估

1.模型評估指標。本次模型評估指標主要利用混淆矩陣和基于混淆矩陣形成結果和圖形指標。混淆矩陣(Confusion Matrix)是一種評判模型分類結果的指標,屬于模型評估的一部分,如表3所示:

(1) TP (True Positive) 指的是實際為正樣本,預測結果恰好為正樣本的個數。

(2) TN (True Negative) 指的是實際為負樣本,預測結果恰好為負樣本的個數。

(3) FP (False Positive) 指的是實際為負樣本,預測結果卻為正樣本的個數。

(4) FN (False Negative) 指的是實際為正樣本,預測結果卻為負樣本的個數。

(5) TPR (True Positive Rate) 指的是本身為正樣本的所有結果中,模型預測為正樣本的比率,如式(11)所示:

(11)

(6) FPR (False Positive Rate) 指的是本身為負樣本的所有結果中,被錯誤預測為正樣本的比率,如式(12)所示:

(12)

(7) ROC (Receiver Operating Characteristic Curve) 曲線,其中FPR是橫坐標,TPR是縱坐標,描述的是TPR-FPR的關系。

(8) AUC (Area Under the Curve)是指ROC曲線下面積,通常面積越趨近于1,分類效果越好。

2.模型效果分析。OOT(Out Of Time)是指跨時間窗預測,即用非訓練樣本時間范圍內的數據進行測試,一般使用訓練樣本之后的時間窗口數據進行測試,可更好驗證模型魯棒性。比如,時間窗口切片為單季度時,采用訓練樣本時間窗口為當前季度的前四個季度,OOT測試樣本時間窗口為當前季度。

使用訓練樣本完成模型訓練,并進行樣本測試,樣本集的ROC曲線如圖2、3、4所示。

按照閾值Y=0.5進行樣本分類,相關模型指標計算如表4所示。

從ROC曲線上看,模型整體收斂較好,曲線上凸明顯,已接近填充完整個空間。經計算,OOT樣本AUC值為0.917,KS=0.735。與訓練集樣本指標差值不大,模型整體擬合較好。召回率和精確率指標雖有一定的下降,但仍具備較好的分類能力。

模型訓練完畢后,將模型特征因子按照重要性進行排列,數據分析顯示,重要性較高的為賬戶余額、欠息信息、利率信息等特征,這些特征在進行樣本分類時起的作用更大。通過特征重要性,可對樣本預測的結果進行解釋,對后續審計中樣本核查具有一定的指導作用。

將模型預測結果與隨機樣本結果進行對比,單季度模型提升能力最強,整體提升在40—50倍左右,可提前一個季度完成客戶風險預測。四季度模型預測提升在20—30倍,可提前一年完成客戶風險預測。

五、結語

在當前新冠肺炎疫情嚴重沖擊下,內部審計急需借助技術手段迎接挑戰。運用大數據、人工智能等技術大大提升海量數據的處理能力,從而改變傳統審計作業形式,實現降低成本、提高效率、控制風險、增加價值四大目標,加速推動審計進入數字化轉型快車道。

基于此,本文借助銀行對公客戶信息數據,運用集成學習XGBoost算法構建智能化信貸客戶風險審計監測模型,該模型OOT樣本集AUC=0.917,KS=0.735,對客戶風險具有較好的識別能力,并且該模型根據公有數據測試集實際效果,風險分值0.5以上客戶下遷精確率、召回率可以達到40%左右,符合模型投產和實際應用目標。同時,模型特征重要性排序對客戶風險預測風險具有較好的表達能力,便于審計人員了解客戶風險量化結果和定性原因,可以在現場查證、模型共享時,與一二道防線了解或交流客戶風險原因。

在實踐應用中,該模型為審計將有限資源投放到重要風險領域指明了方向,輔助在傳統審計項目全面覆蓋,助力客戶持續監測、行業及地域風險監測等發揮重要作用。同時,隨著審計職能由事后向事中、事前轉型,該模型可以在客戶準入、關聯客戶風險傳導、擔保圈(鏈)風險傳導等方面形成風險的提前預判和提前揭示,有效降低風險,避免形成實際損失。

(作者單位:中信銀行股份有限公司,郵政編碼:100020,電子郵箱:wuyufenfei123@163.com)

主要參考文獻

[1]黃薷丹.基于大數據算法的商業銀行企業客戶信貸風險評價模型建立與實證研究[J].當代經濟, 2018(22):3

[2]秦榮生.大數據、云計算技術對審計的影響研究[J].審計研究, 2014(6):6

[3]榮欣,劉紅生.商業銀行的多維度大數據風險挖掘審計技術應用研究[J].中國內部審計, 2021(12):5

[4]張昊楠.大數據背景下銀行信貸風險管控與審計[J].財務管理研究, 2020(4):5

猜你喜歡
商業銀行人工智能
我校新增“人工智能”本科專業
商業銀行資金管理的探索與思考
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
關于加強控制商業銀行不良貸款探討
消費導刊(2017年20期)2018-01-03 06:27:21
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
國有商業銀行金融風險防范策略
我國商業銀行海外并購績效的實證研究
主站蜘蛛池模板: 久久久黄色片| 天堂成人在线| 国产成人在线小视频| 97精品国产高清久久久久蜜芽 | 亚洲欧美自拍中文| 狠狠干综合| 91亚洲精品国产自在现线| 真实国产乱子伦视频| 无码精品一区二区久久久| 国产99精品久久| 99热这里只有精品国产99| 久久女人网| 又猛又黄又爽无遮挡的视频网站| 婷婷色婷婷| 国内毛片视频| 四虎永久在线视频| 制服丝袜一区二区三区在线| 国产网站一区二区三区| 久久久久无码精品| 国内毛片视频| 久久99国产精品成人欧美| 成·人免费午夜无码视频在线观看| 国产精品精品视频| 久久精品人人做人人爽| 国产菊爆视频在线观看| 国产成年无码AⅤ片在线| 国产毛片片精品天天看视频| 一级全免费视频播放| 99热在线只有精品| 亚洲欧美综合另类图片小说区| 久久精品一卡日本电影| 欧美日韩国产成人高清视频| 区国产精品搜索视频| 国产av色站网站| 国产精品无码AV中文| 亚洲色图欧美一区| 国产综合欧美| 国产成人一区在线播放| 亚洲福利网址| 亚洲精品人成网线在线 | 国产精品综合色区在线观看| 国产真实自在自线免费精品| 国产成人91精品免费网址在线| 孕妇高潮太爽了在线观看免费| 亚洲AV无码乱码在线观看裸奔| 日本一区二区三区精品国产| 97视频精品全国免费观看| 成人国产精品2021| 99在线观看精品视频| 成人精品午夜福利在线播放| 国产精品私拍在线爆乳| 欧美特黄一免在线观看| 亚洲日韩AV无码一区二区三区人 | 老司国产精品视频91| 精品久久久久无码| 久久久久免费看成人影片| 99热亚洲精品6码| 色AV色 综合网站| 999国内精品视频免费| 国产亚洲精品自在线| 欧美午夜在线播放| 国产精品免费久久久久影院无码| 亚洲欧洲国产成人综合不卡| 一级成人a毛片免费播放| 超薄丝袜足j国产在线视频| 强乱中文字幕在线播放不卡| 亚洲有无码中文网| 国产精品免费p区| 一本一道波多野结衣一区二区| 国产无码制服丝袜| 亚洲国语自产一区第二页| 国禁国产you女视频网站| 国内精品久久人妻无码大片高| v天堂中文在线| aaa国产一级毛片| 中国国产A一级毛片| 少妇露出福利视频| 精品中文字幕一区在线| 97精品久久久大香线焦| 无码视频国产精品一区二区| 国产日韩精品欧美一区喷| 在线中文字幕日韩|