□文/孫 靜
(天津大學管理與經濟學部 天津)
在“高信用風險、高人工成本”的小微企業貸款業務中,如何降低不良貸款率是小微金融能否持續發展的關鍵之一。降低不良貸款率的核心在于如何從眾多小微企業中甄選出優質客戶。本文根據實際操作經驗,選取對于貸款發放影響最大的四個指標,首次將多元統計中的copula方法綜合評價小微企業貸款能力,定量給出申請者排名,為銀行相關決策者提供借鑒和幫助。
隨機向量的聯合分布函數是刻畫隨機向量概率性質的最好工具之一,分布函數是對變量變化規律的精確描述。在實際應用中,都要假定變量服從某一分布,正態分布是最常用的分布,其原因是現有的許多定理及結論都是與正態分布有關。尤其是大數定律及中心極限定理更是奠定了正態分布在概率統計中的重要地位。然而研究表明,在對諸如股票、匯率等金融變量進行分析時,假設這些變量服從正態分布并不合適。copula函數著眼于具有非線性特征的變量間的相互關系,對變量的相關性建立模型。copula函數最大的優點是把隨機變量的邊緣分布和它們之間的結構關系分開研究,使得研究過程更加清晰,方法更加靈活。
Copula理論是由Sklar在1959年提出,Sklar指出,可以將任意一個n維聯合累積分布函數分解成n個邊緣累積分布和一個copula函數。邊緣分布描述變量自身特征,copula函數描述變量之間相關性。任意邊緣分布和任意copula都可以組合成一個嶄新的多維聯合累積分布函數,大大擴展了多元分布類型。
常見的 copula有 Gauss Copula、Gumbel Copula、Clayton Copula 和 Frank copula。其中,Gauss Copula為:

其中,φ為一元標準正態分布,p∈(-1,1)。CGa事實上是邊際分布為標準正態分布。諸多研究表明,在數據的中間部分,模擬CGa與實際數據吻合較好,但在尾部差別相當明顯,當要度量尾部風險相依性時,橢圓族的高斯Copula是無能為力的。
Gumbel Copula的密度函數具有非對稱性,上尾高下尾低,其密度分布呈“J”字型。Gumbel Copula函數上尾的相關性較強,可用于描述在上尾處具有較強相關關系的現象。收益率呈左偏分布時,多用Clayton Copula去描述相關關系。Gumbel Copula函數的分布函數為:

Clayton Copula函數的分布函數為:

Clayton Copula的密度函數同樣具有非對稱性,上尾低,下尾高,其密度分布呈“L”字型。Clayton Copula函數下尾的相關性較強,可用于描述在下尾處具有較強相關關系的現象。收益率呈右偏分布時,多用Clayton Copula去描述相關關系。Frank Copula函數的分布函數為:

根據個人工作經驗,選擇婚姻狀況、已有額度、資產合計、從事行業II四個指標作為申請人貸款能力綜合評價指標體系。四個指標中已有額度和資產合計是數值型變量,而婚姻狀況和從事行業II是分類變量。22個申請樣本中已婚者最多有15人,離異6人,只有1人未婚。從事行業II總共13個因素水平,最多的行業有3個樣本。22個申請人中有一部分是以前沒有在民生銀行貸過款的新客戶。而資產合計有2個申請人的資產遠超于其他人,達到6,000多萬元和8,000多萬元。
評價的第一步需要將指標標準化,剔除不同指標量綱的影響,一般標準化到[0,1]區間或者[-1,1]區間。標準化方法很多,理論上只要值域是[0,1]區間的函數都可以作為標準化函數。但有時需要考慮標準化函數的實際含義,選擇比較簡單的函數。
婚姻狀況和從事行業II分類變量可以看成離散分布,標準化數值可取離散分布的經驗分布函數。已婚和離異對于授信額度沒有差別,但是未婚者授信額度較低。將未婚者標準化為0.3,已婚和離異者標準化為0.9。同樣對于從事行業II,個人經驗表明,建材>交通運輸設備>服務>儀器儀表>家具>醫藥、醫療設備>日用品>金屬,剩下的服裝、器材、食品、飲料和專用設備看成和基準行業服務一樣。授信能力越強的行業,賦予其值也大。
假設已有額度和資產合計服從伽瑪分布,其形狀參數和尺度參數可以采用極大似然估計。兩者的Kolmogorov-Smirnov檢驗結果如表所示,兩者相伴概率都大于0.05,接受原假設,認為已有額度和資產合計兩個指標服從伽瑪分布。取伽瑪分布參數為極大似然估計值,指標標準化值為累積分布函數值。
Copula 種類很多,如正態、t、阿基米德、混合等等,不同生成元函數的阿基米德Copula各不相同。到底哪一種Copula適合數據,這是一個普遍問題。由于Copula種類太多,我們不可能在所有類型中選取,而只能在很小一部分Copula中選取。要想比較優劣,必須制定統一準則,計算不同Copula準則得分,取最大或者最小得分者為最優Copula。這就是Copula擬合優度檢驗問題。目前已有Copula擬合優度檢驗方法包括基于概率積分變換的擬合優度檢驗、基于核密度估計的擬合優度檢驗、基于卡方擬合優度檢驗、基于生成元核密度的擬合優度檢驗等。R語言的Copula宏包提供了一種基于經驗Copula的擬合優度檢驗。
選擇五種常見的Copula,正態Copula、t Copula、gumbel Copula、frank Copula和clayton Copula,其中正態和t Copula 屬于橢球型 Copula,gumbel、frank和clayton屬于阿基米德Copula。橢球型Copula方差矩陣(dispersionmatrix)含有較多參數,對于Copula,方差矩陣也稱作相關矩陣(correlationmatrix),決定變量之間的相關結構。方差矩陣通常有以下幾種形式:1階自回歸(autoregressive of order 1)、可交換(exchangeable)、Toeplitz和一般形式。
采用R語言基于經驗Copula的擬合優度檢驗。由于t Copula和gumbel計算時間過長,改用基于乘子中心極限定理方法,其他Copula采用參數自助法。假設邊緣分布為連續分布,這是該檢驗方法的基本前提。連續分布出現兩個相同的值概率為零,如果樣本中存在兩個相同的值,就會影響最后相伴概率的計算。如果相伴概率都小于0.05,拒絕原假設,認為不服從該copula。在5種Copula中,只有t Copula對應的相伴概率大于0.05,認為t Copula最適合本文貸款數據。
計算22個樣本標準化數據對應t copula的概率分布函數值,作為綜合評價值,所得排名與他們授信額度基本吻合,授信額度大的申請人排名都比較靠前,只有21號樣本申請人授信額度400萬元,但是排名最靠后。查閱此人申請資料,發現此人屬于跟其他2個申請人一起聯合擔保,每人400萬元額度。其他2人實力很強,但是此人本身經濟實力較為一般。貸款額度最小的7號84萬元和22號申請人95萬元排名都非常靠后,說明基于copula的綜合評價確實能反映申請人的銀行貸款能力。
本文根據個人工作經驗,最終選擇婚姻狀況、已有額度、資產合計、從事行業II四個指標作為申請人貸款能力綜合評價指標體系。首次將多元分布copula方法引入綜合評價,得到各貸款申請人能力排名,為銀行發放貸款提供一定的支持和參考。
[1]Nelsen R.An Introduction to Copulas[M].Ber lin:Springer,1998.
[2]史道濟,姚慶祝.改進Copula對數據擬合的方法[J].系統工程理論與實踐,2004.24.4.
[3]Wang W,Wel ls M T.Model selection and semiparamet ric inference for bivariate failure-time data[J].Journal of The American Statistical Association,2000.9.