摘 要 根據(jù)已有的商業(yè)銀行個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系和數(shù)據(jù),應(yīng)用投影尋蹤分類(PPC)技術(shù)進(jìn)行建模,通過改變指標(biāo)歸一化方式前后權(quán)重是否互為相反數(shù)等性質(zhì),以確保PPC建模時(shí)求得真正的全局最優(yōu)解.實(shí)證研究表明:對(duì)于商業(yè)銀行個(gè)人信用分類問題,PPC模型的識(shí)別正確率高于判別分析模型;在評(píng)價(jià)指標(biāo)的四個(gè)方面中,借貸人與本行關(guān)系最重要,其次是其基本情況,而償債能力和穩(wěn)定性的影響很小;而且,刪除償債能力和穩(wěn)定性兩個(gè)均值差異不存在顯著性的指標(biāo)后建立的PPC模型,不僅不會(huì)降低識(shí)別正確率,還有利于銀行降低采集數(shù)據(jù)的成本和節(jié)約時(shí)間,簡(jiǎn)化流程,對(duì)提高PPC模型的實(shí)用性等具有重要理論意義和實(shí)踐價(jià)值.
關(guān)鍵詞 商業(yè)銀行;評(píng)價(jià)指標(biāo)體系;個(gè)人信用風(fēng)險(xiǎn);實(shí)證研究;投影尋蹤分類技術(shù)
中圖分類號(hào) F830.5 文獻(xiàn)標(biāo)識(shí)碼 A
1 引 言
巴塞爾協(xié)議為商業(yè)銀行進(jìn)行風(fēng)險(xiǎn)管理提供了有效的指南,我國(guó)銀監(jiān)會(huì)要求有條件的銀行盡可能實(shí)現(xiàn)內(nèi)部評(píng)級(jí)和進(jìn)行風(fēng)險(xiǎn)識(shí)別.國(guó)內(nèi)商業(yè)銀行信貸業(yè)務(wù)(尤其是個(gè)人信貸業(yè)務(wù))發(fā)展很快,與此同時(shí),銀行也必須承擔(dān)較大的風(fēng)險(xiǎn).因此,國(guó)內(nèi)商業(yè)銀行個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)與預(yù)警已成為學(xué)界和業(yè)界急需解決的理論和實(shí)踐問題[1-6].國(guó)內(nèi)對(duì)個(gè)人信用風(fēng)險(xiǎn)研究的歷史并不長(zhǎng),主要從兩個(gè)方面來開展:①建立評(píng)價(jià)指標(biāo)體系;②確定各評(píng)價(jià)指標(biāo)的權(quán)重,進(jìn)行綜合評(píng)價(jià)研究.這兩個(gè)方面既有聯(lián)系,又有區(qū)別.絕大部分文獻(xiàn)既討論建立評(píng)價(jià)指標(biāo)體系,又進(jìn)行綜合評(píng)價(jià)研究,如文獻(xiàn)[2, 4-5]. 個(gè)人信用綜合評(píng)價(jià)方法目前主要有兩大類,第一類的樣本結(jié)果是已知的(如通過有關(guān)銀行、專家學(xué)者等的分析判定,個(gè)人的信用狀況是已知的),要求根據(jù)這些已知結(jié)果的樣本建立評(píng)價(jià)模型,無論對(duì)已知的還是未知的新樣本,要求模型有盡可能高的識(shí)別正確率,這類方法主要有l(wèi)ogistic 模型、判別分析模型、Probit模型、決策樹模型和神經(jīng)網(wǎng)絡(luò)等建模方法[2-6, 8-12],第二類情況是所有樣本的信用(結(jié)果)事先是不知道的,針對(duì)這類樣本的建模方法主要有層次分析法(AHP)、基于各種傳統(tǒng)賦權(quán)方法(信息熵、均方差法、離差法等)的綜合評(píng)價(jià)法、支持向量機(jī)、模糊綜合評(píng)價(jià)法、因子分析法、主成分分析法、投影尋蹤分類方法等等[2, 13,14].此外,有些作者把幾種模型(或權(quán)重)進(jìn)行組合,以期獲得更高的識(shí)別正確率[7,8, 14].但就被廣泛采用的有關(guān)個(gè)人信用評(píng)價(jià)的公用數(shù)據(jù)—德國(guó)和澳大利亞個(gè)人信用數(shù)據(jù)(http://archive.ics.uci.edu/ml/machinelearningdatabases/statlog/)—國(guó)內(nèi)外的大量研究、建模結(jié)果表明:針對(duì)第一類問題,各種模型的識(shí)別正確率幾乎相等,差異很小,德國(guó)個(gè)人信用數(shù)據(jù)的識(shí)別正確率均在75%左右,澳大利亞個(gè)人信用數(shù)據(jù)的識(shí)別正確率在85%左右[6, 9,10, 12].另一方面,對(duì)于非上述個(gè)人信用公用數(shù)據(jù),作者們的研究結(jié)果往往是不同模型具有不同的識(shí)別正確率,有時(shí)還相差很大,如文獻(xiàn)[8]的結(jié)果是ANN的正確識(shí)別率最高,而文獻(xiàn)[10]的結(jié)果是ANN的識(shí)別正確率最低.針對(duì)第二類模型,因?yàn)闃颖镜慕Y(jié)果事先是不知道的,而且不同方法的原理差異很大,結(jié)果的差異性往往也較大,可比性較差.其實(shí),個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)主要涉及兩大方面,即涉及建立合理、有效的綜合評(píng)價(jià)指標(biāo)體系和采用合適的方法進(jìn)行綜合評(píng)價(jià)兩個(gè)方面,主要要達(dá)到個(gè)人信用的識(shí)別正確率盡可能高,或者在滿足識(shí)別正確率的情況下,評(píng)價(jià)指標(biāo)應(yīng)盡可能的少,或者建模方法盡可能簡(jiǎn)潔(單),模型的穩(wěn)健性要好.因此,就目前來看,對(duì)于個(gè)人信用評(píng)價(jià)問題,無論是有關(guān)如何選取合理、有效的評(píng)價(jià)模型還是建立評(píng)價(jià)指標(biāo)體系(選取有效、刪除冗余指標(biāo))等問題,都還有待于深入研究探討.另一方面,投影尋蹤分類(Projection Pursuit Clustering,簡(jiǎn)稱PPC)模型是一種適用于高維、非線性、非正態(tài)分布數(shù)據(jù)處理的新興統(tǒng)計(jì)建模方法[15-18],PPC模型不僅數(shù)學(xué)意義清晰,而且便于對(duì)樣本和評(píng)價(jià)指標(biāo)重要性進(jìn)行排序和分類研究.本文以文獻(xiàn)[2]的銀行實(shí)際調(diào)研數(shù)據(jù)為例,與判別分析法為對(duì)照,將PPC技術(shù)引入到個(gè)人信用評(píng)價(jià)研究中,以期獲得更可靠和有效的結(jié)果,并探索一種新的個(gè)人信用評(píng)價(jià)研究方法.
2 構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系
構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系的基本原則為全面性、重要性、科學(xué)性、公正性和可操作性,以及還必須具備各項(xiàng)指標(biāo)數(shù)據(jù)的可獲得性和具有本國(guó)特色等實(shí)用性和適用性.
不同學(xué)者建立的個(gè)人信用風(fēng)險(xiǎn)指標(biāo)體系往往不完全相同,但大致都包含基本情況類指標(biāo)、償債能力類指標(biāo)、穩(wěn)定性指標(biāo)、以及與本行的關(guān)系等四大類指標(biāo)[2-7,13-14].基本情況指標(biāo)大致包括年齡、性別、學(xué)歷、婚姻與健康狀況、配偶職業(yè)等;償債能力類指標(biāo)主要有經(jīng)濟(jì)來源、個(gè)人月收入、家庭月收入、家庭人均收入、月均還款占家庭收入比、單位經(jīng)濟(jì)狀況以及職稱等;穩(wěn)定性指標(biāo)主要有住房性質(zhì)、從事本行業(yè)時(shí)間、是否參加醫(yī)療保險(xiǎn)、是否參加養(yǎng)老保險(xiǎn)以及是否繳納公積金等;與本行關(guān)系指標(biāo)主要包括是否是本行員工、在本行貸款拖欠情況、賬戶情況、存款數(shù)額以及其他商業(yè)信用等.在進(jìn)行評(píng)價(jià)指標(biāo)篩選時(shí),既要保證包含信息的全面性,又要保證信息盡可能少重疊.評(píng)價(jià)指標(biāo)太多,既增加評(píng)價(jià)工作難度和不便于銀行日常管理,也不一定能提高識(shí)別正確率;但評(píng)價(jià)指標(biāo)太少,也會(huì)造成無法區(qū)分個(gè)人信用之間的差異,降低模型的識(shí)別正確率.建模時(shí),有些作者直接根據(jù)評(píng)價(jià)指標(biāo)體系的數(shù)據(jù)進(jìn)行,有些作者對(duì)不同層級(jí)的指標(biāo),采用不同的方法.由于本文的重點(diǎn)是比較投影尋蹤分類技術(shù)與判別分析法的識(shí)別正確率以及說明在滿足識(shí)別正確率的情況下怎么選取盡可能簡(jiǎn)潔的評(píng)價(jià)指標(biāo)等問題,筆者不再對(duì)究竟應(yīng)該選取哪些指標(biāo)進(jìn)行詳細(xì)分析和討論,而是直接選用文獻(xiàn)[2]采用的評(píng)價(jià)指標(biāo)體系和建模數(shù)據(jù).
文獻(xiàn)[2]將第三層的指標(biāo)數(shù)據(jù)采用專家法綜合成4個(gè)第二層的指標(biāo)數(shù)據(jù),建立了由4個(gè)綜合指標(biāo)組成的判別分析模型,共計(jì)樣本94個(gè)(其中測(cè)試樣本4個(gè),違約和非違約各2個(gè)),其中52個(gè)非違約樣本,建模樣本的Ⅰ類(將非違約樣本判斷為違約)錯(cuò)誤率為8%,Ⅱ類(將違約樣本判斷為非違約)錯(cuò)誤率為7.5%,而測(cè)試樣本的正確率為100%.為便于比較對(duì)比,本文采用文獻(xiàn)[2]的指標(biāo)體系和數(shù)據(jù)(詳見文獻(xiàn)[2]),應(yīng)用PPC技術(shù)進(jìn)行建模研究,不僅數(shù)學(xué)意義明確,而且識(shí)別錯(cuò)誤率也低于判別分析模型.