許園園 中央軍委機關事務管理總局財務結算中心
隨著住房成本不斷攀升占用了年輕人較多資金,越來越多的人會選擇使用貸款去購買一些大型的家用品。在業務辦理初期,做好信用審核,把好準入關尤為重要。基于大數據分析,企業可以得知其客戶的結構、喜好、購物習慣、風險偏好等一大批結果,甚至可以發現一些表面看起來無關聯,但是又存在的內在聯系,從而更了解自己的客戶。根據這些結果,企業制定更精準的營銷方案或者是控制風險,從而快速提升企業發展。本文研究的主題是充分利用銀行做掌握的大數據,建立一個數據評分模型,在降低信用卡逾期風險的同時,提高信用卡審批效率。
本文參照信用卡業務常見填寫選項:性別、年齡、參加工作時間、職級、信用卡額度、年收入、住房情況、婚姻狀況等八項因素,結合搜集的5200筆分期業務(其中131筆發生違約),對每項因素做出簡要分析。

表1 性別在總樣本和違約樣本中的分布
從表中可見,男性對信用卡分期業務接納度更高一些,比女性高出了7%,但是從發生分期違約人數看,男性的違約人數占比比女性高出10%,初步認為性別對信用卡是否產生違約有影響。

表2 工作時間在總樣本和違約樣本中的分布
從表中可見,工作年限1-5年的客戶對信用卡分期業務接納度更高一些,占比53.6%,但是從發生分期違約人數看,工作年限1-5年的客戶占比更高,高達62.6%,而工作10年以上的客戶占比對比處于下降趨勢,初步認為工作年限對信用卡分期業務是否產生違約有影響。

表3 額度在總樣本和違約樣本中的分布
從表中可見,信用卡額度各個統計段對分期業務接納程度差別不是很明顯,但是從發生分期違約人數看,信用額度2萬以上的人數占比明顯下降,初步判定信用卡額度對信用卡分期業務是否產生違約有影響。

表4 年齡在總樣本和違約樣本中的分布
從表中可見,45歲以下對信用卡分期業務接納度更高一些,尤其是34歲以下,達到了各年齡段的最高點25.15%。從發生分期違約人數看,34歲以下違約人數占比更高,而45歲以上違約人數占比開始下降,初步認為性別對信用卡分期業務是否產生違約有影響。

表5 婚姻狀況在總樣本和違約樣本中的分布
從表中可見,已婚客戶對信用卡分期業務接納度更高一些,占比74.17%,但是從發生分期違約人數看,已婚占比較少,只有58.78%,而未婚和婚姻狀況為其他的違約人數占比均高于業務接納人數占比,初步認為婚姻狀況對信用卡分期業務是否產生違約有影響。

表6 年收入在總樣本和違約樣本中的分布
從表中可見,個人年收入統計段的分期業務接納度和違約人數占比集中度大體一致。

表7 職級在總樣本和違約樣本中的分布

科級/部門經理 18.00% 19.08%縣處級/總經理 8.52% 9.16%局級/董事 7.02% 7.63%
從表中可見,個人職務統計段的分期業務接納度和違約人數占比集中度大體一致。

表8 住房情況在總樣本和違約樣本中的分布
從表中可見,個人住房情況統計段的分期業務接納度和違約人數占比集中度大體一致。
比較于傳統的多元回歸分析,Logistics回歸分析不需要數據滿足正態分布的假設,這是其由于普通多元回歸分析的最主要的特點,而且Logistics回歸在擬合度和預測精度上,往往優于普通多元回歸分析。
同理,本文引入Logistics回歸分析,將因變量定為是否違約,而自變量主要由造成違約的幾種因素組成。
1.性別。本文中用sex代表性別變量,取0代表男性,1代表女性。
2.工作年限。本文用workyear代表工作年限變量,取值為各個統計段的中位數。
3.信用卡額度。本文用limit代表信用卡額度變量(以萬元為單位),取值為各個統計段的中位數。
4.年齡。本文用age代表年齡變量,取值為各個統計段的中位數。
5.婚姻狀況。本文用marry代表婚姻變量,取0代表已婚,1代表未婚及其他。
6.年收入。本文用income代表年收入變量(以萬元為單位),取值為各個統計段的中位數。
7.職級。本文用class代表職級變量,取值0-4分別代表無固定職業、科員/職員級、科級/部門經理、縣處級/總經理、局級/董事。
8.住房情況。本文用house代表住房情況變量,取值0代表自有住房,1代表租房及貸款買房。
我們用default代表違約這個因變量,則可以通過Logit變換建立logistics回歸分析如下:

通過計量學數據軟件EViews將搜集的數據進行處理,結果如下表:

變量指標 系數 標準誤 顯著性Sex -0.381617 0.194568 0.0498 Workyear -0.067624 0.29361 0.0213 Limit -0.476347 0.061401 0.0000

Age -0.191911 0.34021 0.0000 Marry 1.180618 0.240143 0.0000 Income 0.180611 0.023917 0.0000 Class 1.053083 0.182052 0.0000 House 0.830914 0.338914 0.0142 C(β0)1.725246 1.046204
從表中可見,各項變量的顯著性Prob均小于0.05,因此可以認為各項變量對違約的影響都是顯著的。
1.性別。通過計算結果可見,性別對違約概率影響為負相關,即隨著性別變量取值增大,違約概率減少,也就是男性違約概率更大,女性對風險厭惡程度更高。
2.工作年限。通過計算結果可見,工作年限對違約概率影響為負相關,即隨著工作年限變量取值增大,違約概率減少。可見,隨著工作年限增加,人們資本積累更豐厚,風險意識更強,考慮更加周全,違約概率降低。
3.信用卡額度。通過計算結果可見,信用卡額度對違約概率影響為負相關,即信用卡額度越高的客戶,越不容易出現違約行為。其原因可能是,能信用卡額度是跟客戶用卡頻率、刷卡金額和工作收入相關的,額度越高的客戶工作收入越高,刷卡金額越高,用卡時間越長,已經養成了良好的信用習慣,并且珍惜已經擁有的額度,所以違約概率比較低。
4.年齡。同樣,年齡與違約概率影響為負相關,即年齡越大的客戶,違約概率越低。年齡大的客戶工作時間長,有一定的儲蓄,并且有一定的人脈,也更懂得信用在生活和工作中的重要性,所以他們在出現資金短缺的時候,更傾向選擇別的方式來解決融資問題,而不是去消耗自己的未來信用。
5.婚姻狀況。婚姻狀況與違約概率呈正相關,即已婚客戶更不容易出現違約行為。原因可能是已婚客戶家庭收入來源比較穩定,即使一方收入出現問題,另一方的收入仍能夠保證生活的正常進行。而未婚或者離異的客戶,因為自己還款能力完全取決于自己的收入和積蓄,所以一旦此類客戶經濟出現問題,備選的解決方案較少,更容易出現違約。
6.收入。結果顯示,收入與違約概率呈正向相關,即收入越高,違約概率越高。這個結果與平新喬等實證發現相一致5。原因可能是,隨著收入的增加,客戶對自己的還款能力出現預判偏差,從而消費超過自己還款能力的物品,導致違約。
7.職位。職位與違約概率呈現正相關,也就是說,職位越高的人,違約概率越大。表面上看,職位越高的人收入越高,償還能力越高,所以違約概率越低。但是數據結果顯示,職位越高的人,違約概率越大。通過表7,我們可以看出,職位高的違約概率相對高于總樣本的比例。筆者認為,職位高的人群中,更多的是公司董事或者總經理,他們收入相對較高,但是資金需求也相對高,他們在公司出現資金問題的時候,更多的是通過信用卡分期這種融資成本較低的方式,來解決問題,所以職位越高的人,違約概率越大。
8.住房情況。通過結果發現,貸款買房的客戶違約概率比較低。原因可能為,雖然貸款買房的客戶需要償還貸款,每月的經濟壓力較大,但是信用卡違約會對其房貸產生不良影響,導致后期房貸利率無形升高。所以此類客戶更愿意保持良好的信用記錄。
本文通過量化信用卡表上填寫項,利用大數據分析這些因素與違約概率之間的關系。通過Logistics回歸,我們發現八個自變量都與違約有顯著的關系。通過這個結論,有助于后期信用卡發卡審核階段,對此類客戶準入的風險把控。本文的創新點在于將這些填寫項量化,得出這些項目在違約概率中所占的比重,通過帶入數據計算,能夠得出此客戶的違約概率,從而更好地衡量客戶準入標準。
目前本方法可以針對每一個客戶計算出違約概率,商業銀行可以根據自己的風控水平,劃定違約概率線,超過此概率的客戶,則不予批準分期業務。例如,風控較嚴格的商業銀行可以將違約線定在1%,按此標準實行一段時期,如果實際違約率仍超標,可繼續下調違約概率的數值,加強風控。如果實際違約概率低于期望風控水平,則可以適當提升違約概率線,從而加大分期業務核準量,增加商業銀行收入。最優的違約概率需要商業銀行結合自身情況,不斷調整,最后達到屬于自己的最有選擇。