李雨蔓 衛恒軍
摘 要:隨著“互聯網+”的發展,人工智能不僅為傳統金融業帶來了機遇和挑戰,同時也為商業銀行的信用貸款業務創造出新的機會。傳統商業銀行信貸審批流程中的人工決策存在非理性因素,在不同風險場景下存在的貸款決策行為偏差無法消除,從而出現偏離客觀的決策。人工智能方法能夠有效避免信貸審批中的主觀性和盲目性從而提高決策效率。本文分析了人工智能算法在貸款審批中的應用,根據算法分類對算法及其應用進行了闡述,并對智能信貸審批作出了總結和展望。
關鍵詞:信貸貸款;人工智能;神經網絡;支持向量機;決策樹
本文索引:李雨蔓,衛恒軍.<變量 1>[J].中國商論,2021(18):-132.
中圖分類號:F275.5 文獻標識碼:A 文章編號:2096-0298(2021)09(b)--03
1 引言
金融科技方興未艾,隨著人工智能和互聯網金融的迅速發展,傳統金融業的生存基礎受到了沖擊,商業銀行也在不斷通過探索和運用人工智能等新技術進行創新。商業銀行的貸款審批也可以通過多種人工智能方法獲得性能更優、預測更準確的模型。
信用評級與預測對商業銀行貸款決策有著顯著的影響。個人信貸業務擴展的同時也為銀行帶來一定的風險。
2 人工智能在銀行中的應用
信貸服務是一種普遍的金融服務,也是商業銀行的主要利潤來源。傳統信貸服務依賴于人工,對于中小企業和個人用戶貸款的審批流程復雜且周期長,使得小微企業和中產以下群體融資難成為世界難題。人工智能技術增強了商業銀行的風控能力,對于龐大非銀行人群的海量特征數據進行定量風險分析,得到連續的風險定價從而提供相應的金融產品與服務。
國內杭州銀行的“云抵貸”已經率先使用智能化抵押房屋貸款,將審批時間縮短到最短3分鐘,放款時間24小時之內。百度金融、螞蟻花唄和京東白條等互聯網金融企業紛紛開展信貸業務,利用大數據和人工智能算法進行信用評分。以京東白條為例,其信用評估根據用戶消費歷史數據進行風險評估,不良率為0.48%,遠低于商業銀行平均水平。
Florian K?nigstorfe分析了人工智能在商業銀行中的應用,其中支持向量機、決策樹和神經網絡方法在信貸審批中的應用范圍較廣;Dorota Witkowska比較了在商業貸款審批中使用不同的人工智能算法進行決策的準確度。
國內學者對人工智能在銀行信貸中的應用也展開了大量的研究:吳沖等(2009)將模糊神經網絡、支持向量機等多種人工智能方法運用到信貸風險評估中;王春鋒等(1999)對神經網絡模型和Logistic判別分析等方法對商業銀行信用貸款風險評估進行分析。
人工智能在商業銀行貸款審批中的應用如表1所示。
不難看出,人工智能算法在商業銀行貸款中的應用主要集中在貸款預測和信用評分評級中,而應用較廣的算法是神經網絡、支持向量機和決策樹。
3 應用于銀行信貸的人工智能算法
目前流行的人工智能算法主要屬于機器學習分類,根據功能可以將其分成分類、回歸和聚類三種類型。人工智能在信貸審批中的應用主要通過大量數據訓練做出智能決策,其相關研究主要為分類和回歸兩類。
分類算法預測標簽,而回歸算法是預測數值。分類算法和回歸算法都屬于監督學習的范疇。監督學習訓練過程為獲取數據→特征提取→監督學習→評估;而預測過程則根據模型進行預測。分類算法的目標是從已有的數個可能的分類標簽中預測一個樣本所屬的分類,其樣本數據是離散的。決策樹、支持向量機、線性回歸等回歸算法的目標是預測一個連續的數(浮點型)。
3.1 分類
分類算法用于分類變量的建模及預測,通常適用于類別的預測。常見的分類算法有五種類型:
(1)邏輯回歸。邏輯回歸通過邏輯函數將預測映射到0~1的區間,從而判定屬于某一類別的概率。
(2)分類樹。分類樹通常特指決策樹中用作分類的CART算法,其特點是分支條件為二分類問題,即只能形成二叉樹。CART分類樹使用基尼系數處理離散特征,如果是連續特征則需要將特征進行離散化。
(3)支持向量機。支持向量機是一種通用的前饋網絡類型,其主要思想是建立一個超平面作為決策曲面,使得分開的兩類數據點距離分類面最遠( 圖1)。
支持向量機是從線性可分情況下的最優分類超平面,所謂最優超平面就是以最大間隔將兩類樣本正確分開的超平面。
(4)樸素貝葉斯。樸素貝葉斯分類以貝葉斯定理為基礎,其核心思想是將給定的訓練集假定為特征互相獨立求取聯合概率分布得到先驗概率,再根據模型得到后驗概率,從而計算出條件概率的方法。
(5)人工神經網絡。人工神經網絡是一類模式匹配的非參數方法, 常見于銀行信貸審批中的神經網絡有BP神經網絡、模糊神經網絡和徑向基神經網絡(圖2)。
BP神經的基本思想是將神經網絡學習輸入/輸出的映射問題轉變為非線性優化問題,使用最優化中的梯度下降算法,用迭代運算修正網絡權值,實現網絡輸出與期望輸出間的均方誤差最小化。
模糊神經網絡利用模糊集合,確定模糊隸屬度。常用的模糊推理方法包括M型推理方法和TS型推理方法。模糊神經網絡的一般系統結構包括五層,分別是輸入層、模糊化層、規則層、反模糊化層和輸出層。
徑向基神經網絡是一種基于徑向基函數(RBF)的前向神經網絡,其神經元模型為:
3.2 回歸
回歸算法主要用于連續型的數值變量的預測和建模。常見的回歸算法有三種類型。
(1)線性回歸。利用線性回歸方程的最小平方函數進行建模,其回歸模型如下:
其中θ和c為未知參數,根據訓練集(xi,yi)計算參數,使得h(xi)逼近yi,其誤差值的平方用損失函數表示:
此方法計算簡單,但對于非線性數據的擬合效果不好。
(2)決策樹。在決策樹算法中,數據的屬性通常采取樹狀結構構建決策模型以實現分類和回歸。決策樹的生長過程由特征選擇、決策樹的生成和剪枝三個部分組成。特征選擇的衡量標準通常是信息熵、增益率和基尼系數。
其中,信息熵表示為:
Ent(D)的值越小,則D的純度越高。
增益率表示為:
其中IV(a)為屬性a的固有值,屬性a的類目越多IV(a)越大。
基尼系數表示為:
基尼系數反映了屬性的不純度,基尼系數越小則數據集D的純度越高。
決策樹的生成通常是選取信息增益最大的自變量作為根節點,將其他特征值依次選取為內部節點,將數據集重復分割成不同的分支。決策樹的集成方法包括隨機森林或梯度提升樹。
(3)K最鄰近算法。K最鄰近算法的指導思想是“近朱者赤,近墨者黑”,訓練數據集在已知標簽類別的前提下,輸入新數據后尋找與新數據最相近的k個實例,將這k個實例中大多數的類別確定為新數據的類別。即由k個最鄰近的數據投票確定新數據的類別。
4 針對銀行信貸不同應用場景的算法研究
商業銀行的信貸審批環節中人工智能算法主要應用于解決分類和回歸兩類問題,具體的分類問題體現在財務欺詐、信用卡履約、信用評級等方面,回歸問題體現在信用評分、貸款預測、破產時間預測、企業貸款、違約時間預測等方面。在實際的信貸審批應用中將針對不同的應用場景采用不同的算法。
4.1 信用評分和信用評級
信用評分和信用評級是銀行信貸審批中最重要的一個環節,其最終目的是將貸款人分類為良好貸款人和不良貸款人。
Henley和Hand的研究表明,如果將信用評分的準確率提高1%,公司將節約大量的成本。目前信貸審批的相關技術大多集中于信用評分的研究,目前已經出現了各種各樣的分類技術,例如線性判別分析、邏輯回歸等回歸算法,以及K臨近和決策樹等分類算法。
(1)邏輯回歸。用于信用評級的邏輯回歸主要解決的是二進制的響應模型,如果客戶是不良貸款人則y=0,如果客戶是優質貸款人則y=1,假設x是M個解釋變量的列向量,則邏輯回歸模型采用以下形式:
其中α是截距參數和βT包含變量系數。
(2)判別分析。判別分析利用個人消費信貸的原始數據對個人財務信用和自然特征等各個方面進行分析并賦值,尋找出符合預測的最佳線性組合。
4.2 企業破產預測
人工智能增加了用于信用風險評估的數據類型和種類。在貸款違約分析方面,人工智能方法可以結合非傳統數據(例如水電費、電信數據和社交媒體數據)對貸款人的違約行為進行預測。
(1)神經網絡。企業破產預測分析時,首先選取對企業存亡起關鍵作用的一些財務參數,例如營運資本、保留收益、利稅前收益、市場價值權益等。而后在輸入層分別輸入企業的速動比率和資產利潤率,輸出層為判別值Z,根據訓練集的數據計算出判別值的分界值Zc,并以此為分界判定企業生存或破產。
周毓萍改進了BP神經網絡并建立了用于企業破產預測的神經網絡模型,能夠有效對企業破產進行預測。
(2)支持向量機。使用支持向量機預測企業破產時需要選擇相同數量的破產和非破產案例,將全部數據的80%用于構建訓練集,對其中的財務指標進行分析提純,選擇顯著的變量。通常選擇利潤率、舉債經營率、償債能力比率、資產管理比率等變量進行分析,然后選擇合適的核函數和懲罰參數建立模型。
5 結語
利用人工智能方法進行信貸審批等金融科技手段已成為時代賦予商業銀行開展信貸實踐的重要使命。人工智能方法增加了信用風險評估數據的種類和數據量,解決了非財務信息搜索整合困難的問題,避免人為主觀因素對貸款審批決策的影響。人工智能技術在商業銀行中的普及,可以實現大批量的信貸服務拓展,從而落實普惠金融。
從全球范圍來看,中國是人工智能領域的領先國家之一,中國傳統央行征信系統中,征信的真實覆蓋率只有35%。而經過2015年中國大數據征信的爆發,基于人工智能的授信模型不斷發展并形成規模。
要實現充分實現信貸智能審批,需要商業銀行與科技企業的深度合作。龐大的數據量和海量用戶群體將為商業銀行的信貸智能審批提供得天獨厚的優勢,強大的金融內需將加速智能信貸審批乃至智能金融的發展。
參考文獻
吳沖,郭英見,夏晗.基于模糊積分支持向量機集成的商業銀行信用風險評估模型研究[J].運籌與管理,2009,18(2):115-119.
王春峰,萬海暉,張維.基于神經網絡技術的商業銀行信用風險評估[J].系統工程理論與實踐,1999,19(9):24-32.
張成虎,李育林,吳鳴.基于判別分析的人信用評分模型研究與實證分析[J].大連理工大學學報(社會科學版),2009,30(1):6-10.
龐素琳,黎榮舟,徐建閩.BP算法在信用風險分析中的應用[J].控制理論與應用,2005,22(1):139–143.
毛義華,劉悅.基于RBF神經網絡的商業銀行客戶信用評級[J].統計與決策,2010(2):151-153.
Literature Review on the Application of Artificial Intelligence Algorithms in
Bank Credit Loan Business
University of Chinese Academy of Sciences? LI Yuman
China Construction Bank Beijing Branch? WEI Hengjun
Abstract: With the development of "Internet +", artificial intelligence not only brings opportunities and challenges to the traditional financial industry, but also creates new opportunities for the credit loan business of commercial banks. There are irrational factors in the manual decision-making in the credit approval process of traditional commercial banks, and the deviation of loan decision-making behavior in different risk scenarios cannot be eliminated, resulting in deviating from objective decision-making. Artificial intelligence methods can effectively avoid subjectivity and blindness in credit approval and improve decision-making efficiency. This article analyzes the application of artificial intelligence algorithms in loan approval, expounds the algorithms and their applications according to the classification of algorithms, and summarizes and prospects for intelligent credit approval.
Keywords: credit loan; artificial intelligence; neural network; support vector machine; decision tree