摘要:在現代商業銀行經營中,信用風險是影響其安全高效運營的主要原因。信用風險管理中最重要的就是信用風險測量。自從20世紀80年代末期以來,人工智能技術如神經網絡、專家系統也被應用于商業銀行信用風險測量中。但預測指標的研究則相對滯后,成為研究的一個難點。
關鍵詞:信用風險;指標體系;遺傳算法
中圖分類號:F830.5 文獻標識碼:A
一、引言
近年來,隨著金融的全球化趨勢及金融市場的波動性加劇,商業銀行的風險管理一直是國際國內金融界關注的焦點。商業銀行在營運過程中面臨的金融風險主要有信用風險、利率風險、匯率風險、流動性風險和操作風險等,其中信用風險占有特殊的地位。
信用風險又稱違約風險,是指借款人、證券發行人或交易對方因種種原因,不愿或無力履行合同條件而構成違約,致使銀行,投資者或交易對方遭受損失的可能性。
信用風險管理中最重要的就是信用風險測量。信用風險測量是一個重要而廣泛的研究課題,它對銀行的貸款決策和盈利性都有重要的影響。在西方發達國家,商業銀行的信用風險管理測量技術已比較成熟,許多定量技術、支持工具和軟件已付諸商業應用。繼傳統的比例分析、主觀分析之后,統計方法得到廣泛的應用,如判別分析和logit回歸等。自從20世紀80年代末期以來,人工智能技術如神經網絡、專家系統、分類樹也被應用于商業銀行信用風險測量中。
目前我國銀行機構主要是用計算貸款風險度的方法進行信用風險測量一在對企業進行信用等級評定的基礎上,考慮貸款方式、期限以及形式因素,進而確定貸款的風險度。其中作為核心的信用等級評定,是通過對企業的某些單一財務指標進行評價,而后加權平均確定的。該方法的最大缺陷在于指標和權重的確定帶有很強的主觀性,使得評級結果與企業的實際信用狀況有很大出入,因此,需要引入科學方法來確定有效指標,并建立準確的定量模型來解決信用風險測量問題。
二、指標體系的構建
按照新巴賽爾協議第379款的相關規定,“信用打分模型和其他技術程序可作為評級的主要基礎或部分基礎,在評估損失特征中發揮作用”。同時該款中還指出,“銀行能否滿足監管當局要求,取決于模型或程序是否有好的預測能力,以及使用模型或程序后監管資本要求不會被歪曲。模型輸入的變量必須形成一整套合理的預測指標。總體來說,對于不同的借款人或銀行貸款,模型必須準確,同時不會有已知的重要偏差。”由此可見,預測模型在評級過程中作用非常重要,是最后作人工判斷的前提。而對于預測模型來講,確定一整套合理的預測指標作為輸入變量則是構建模型的前提和重點。
以往的研究中,多數研究者都是在奧特曼的研究基礎上,直接使用了奧特曼使用的五個變量。這五個變量包括:WC/TA;RE/TA;EBIT/TA;E/TL;S/TA。也有研究者使用了其他變量。比如,Ra-ghupathl(1991)等人在研究中使用了13個變量;Salchengerger(1992)等人開始選擇了29個指標,然后利用逐步回歸選定了五個指標用于神經網絡;Tam和Kiang(1992)在研究中使用了19個指標;P1ramuthu(1994)等人使用了12個連續變量和三個名義變量(nominal variables);Ahex(1996)使用了兩套指標,第一套包含了28個指標,第二套指標是利用主成分分析(prlnclpal component analysis)獲得了9個指標;Bontz和Kennedy(1995)分別使用了Ohlson的9個指標和11個指標,以及奧特曼的五個指標來檢驗神經網絡;Rudoffer則從財務報表中選擇了五個財務指標。有趣的是在該領域研究中最多的使用了41個指標,最少的僅使用了3個指標。
(一)構建原則
銀行所關注的財務指標體系應精簡并且實用,因此在構建指標體系時應遵循以下一些原則:
1.科學性原則,指標的選擇和指標體系的建立必須建立在一定理論和科學分析基礎之上;
2.系統性原則,整個指標體系應該能夠系統、客觀地反映一個企業的償還能力,包括流動性、財務杠桿資本結構和盈利能力等方面;
3.重要性原則,所選的指標有較強的綜合性,能夠反映銀行的主要關注點,從而使指標體系較為精煉;
4.實用性原則,指標體系中的指標所需要的數據都能夠從年度財務報表中獲得,同時,銀行可以通過對這些指標的分析,發現企業在償債能力方面的問題,從而作出正確的貸款決定;
5、可比性原則,整個指標體系的構建應該使不同的企業具有可比性;
6、精練性原則,指標過多容易引起多重共線性問題;同時使得信息的搜集會很困難。正如Hamer(1983)所說,“指標的選擇應當以搜集信息成本最小化和模型實用性最大化為基礎。”
(二)構建原理
在信用風險測量之前,應該先確定測量主體、測量目的和測量課題等因素。因為根據簡單的行為邏輯一動機產生行為,測量主體和目的決定了測量行為(即決定了測量的內容和方法)。測量主體即測量行為主體,它回答了誰要求評價的問題;測量目的是測量行為的動機,它回答為什么要評價的問題;企業自然就成為測量客體。具體到信用風險測量問題,按照前文提到的信用風險測量的概念,銀行就是測量的主體;信用風險測量的目的就是測量貸款企業的還款能力。正是這樣的測量主體和目的決定了信用風險測量所采用的指標體系與其他測量、評價活動的有所不同。
影響貸款企業還款的因素包括三方面:非財務因素;信用支持;財務狀況。非財務因素主要指的是還款意愿等,這一問題要利用信息經濟學進行分析,建立激勵約束機制,從而使得貸款企業愿意或不得不還款。信用支持指的是擔保和抵押,它們只是一種備選方案,只有在企業無力償還的情況下才被使用,而且處理成本較高,最重要的是信用支持額度的確定還要依賴對企業財務狀況的分析,因此,信用支持只作為第二還款來源。由此可見,影響企業還款能力的關鍵要素就是企業的財務狀況,它自然也就成為第一還款來源。因此,信用風險測量也就變成對貸款企業財務狀況的評估與分析。
為了這個目的,銀行很注意企業的現有資源以及未來現金流量的可靠性、及時性和穩定性。與其他分析企業財務狀況的人或機構相比,銀行通常更為保守,對于財務報表分析的依賴性較重,他們的分析集中于評價借款人控制現金流量的能力和在多變的經濟和運營條件下保持穩定的財務基礎的能力。 財務報表分析技術和評價借款人的標準因貸款的期限、擔保和目的的不同而不同。對于短期信用,銀行主要關心企業當前的財務狀況,短期資產的流動性和周轉率。
評價長期信用要求更加細致和具有前瞻性的調查和分析。長期信用分析包括預測現金流量和評價企業長期盈利能力。企業長期盈利能力是確保企業在各種情況下有能力履行貸款合同及附屬條款中所規定的償還本金及利息的決定性來源。因此,盈利分析對于長期信用分析來說非常重要。
長期和短期信用分析都包括對企業資本結構的分析,因為資本結構包含了一定的風險,關系到債權人銀行的安全。權益資本與債權的比例是反映債權人銀行風險的一種指標。這個指標也反映了企業對于風險的態度。
(三)指標體系
從銀行的角度出發,以上文中的財務分析為理論基礎,構建了一套完整的指標體系,用于分析貸款企業的財務狀況。該指標體系包含五大方面(流動性;周轉率;資本結構;資產結構;盈利能力),42個具體的財務比率。這些指標都是日常財務分析活動中經常使用的財務比率,同時借鑒以往研究的成果,將以往研究中已證明對信用風險測量有幫助的指標進行了歸納,并將其補充到指標體系中。
三、指標篩選
在上一節中,構建了一套完整的指標體系,該體系中每一個指標,或是從財務分析角度出發,或是從實證研究的結果出發,都表明對于信用風險預測有幫助。但是每個指標對預測結果的貢獻程度不盡相同,有大有小,而且整個指標體系包含五大方面、42個具體指標,無論使用什么方法,判別分析還是神經網絡,都意味著大量的運算時間和成本。因此,必須在不影響模型預測準確率和效率的前提下,對指標體系進行二次篩選,從中選出對預測結果貢獻最大的那部分指標,從而降低運算時間和成本,提高預測效率。
如前文所提到的那樣,從20世紀90年代開始,神經網絡就開始應用在信用風險測量領域,取得了非常好的預測效果,并逐漸占據了主導地位,直到今天。但是,在以往的研究中并沒有一個系統的方法用于選擇神經網絡的預測變量,即輸入指標。”’神經網絡指標的選擇有兩種方式,一種是在可供選擇的所有指標中進行徹底的搜索,但這種方法即使在只有幾個指標的情況下也非常費時;另一種方法就是遺傳算法,遺傳算法出現以后,開始在很多領域應用,包括要解決的這個問題,它是一種新興的、很有希望的篩選指標的方法。
(一)實驗數據
筆者采用的數據來源于2004年滬深兩市1000多家上市公司的財務報表(資產負債表、利潤分配表、現金流量表)。以ST公司(連續虧損兩年的公司,國內研究通常將ST公司作為財務危機公司)作為信用風險程度高,即失敗的樣本;其余公司為信用風險程度相對較低的公司,即非失敗的樣本。考慮到2004年當年只有82家ST公司,占整個上市公司的比重較低,如果將全部數據都納入實驗數據樣本中,很難保證實驗結果的精度,為此,分兩部分構造數據樣本:一部分是全部的82家ST公司;另一部分是在其余公司中隨機選取201家公司,從而構造了一個包含283條數據的數據樣本。這樣構造樣本有兩個原因:一是數據樣本的規模可以滿足實驗的要求(以往研究中已經證明,而且數據缺乏是該領域研究的一大障礙),同時保證了樣本結構的合理性;二是隨機選取非ST公司,即采取非配對方式構造樣本。這樣作主要是為了克服配對方式存在的一些問題: (1)配對方式等于認同了失敗公司與非失敗公司的發生概率是相等的,樣本數量也相應的減少了。而且,如果一一配對,被選中的非失敗的企業具有偶然性,不一定能夠代表該類企業。(2)配對方式只能成對的對比研究得出結論,而不能根據單個公司的研究得出結論。(3)很多公司的經營是多元化的,很難界定它們確定屬于那個行業,因此對這些公司進行配對很難達到預期效果。(4)配對方式通常依據行業和資產規模進行,也有的是按照成立期限進行配對,但這種方式無法解釋為什么依據這個而不是依據那個進行配對。因此,目前很多研究在構造樣本時都采用非配對方式,即抽取少量失敗樣本,同時隨機抽取相對較多的非失敗樣本。
樣本中的數據分別屬于兩類,即失敗和非失敗,分別用1和0表示;另外,第二章構建的指標體系中包含42個指標。因此,樣本中的每條數據都包含42個連續值條件屬性及一個類標號屬性。表2列示了數據示例,其中ID為數據序號。
(二)實驗結果
在應用遺傳算法的時候,首先要對所要求解的問題進行編碼,生成“染色體”的字符串。
1.參數設定。串長為42,即指標體系中所包含的42個指標;種群為50;迭代次數500次。
2.編碼。采用二進制的編碼方式,也就是染色體上的基因位不是0(未被選中)就是l(被選中)。染色體長度為42,即所有的指標的個數。
3.評價函數。采用神經網絡作為遺傳算法的評價函數。即神經網絡根據遺傳算法所選出來的指標對樣本數據進行訓練,然后分類。同時用神經網絡的全局平均誤差平方作為適應度,誤差越小適應度越高,否則相反(介紹神經網絡的時候將會進一步闡述)。
4.選擇操作。遺傳算法的選擇操作有輪盤賭選擇機制、最佳保留機制、選擇機制、期望值模型選擇機制、隨機競爭選擇機制等多種選擇方案。采用帶有最佳個體保留機制的輪盤賭選擇機制。
5.交叉操作。交叉操作又稱為交配,是仿照生物學中雜交的方法,對上一代個體部分結構加以替換重新組合,從而產生新個體的過程。采用雙點隨機斷裂交叉方法。
6.變異操作。變異操作可以保證取值的多樣性,避免在收斂過程中陷入停滯狀態。染色體上的每個基因位以4-較小的概率Pm進行變異,稱Pm為變異率。
7.終止規則。當滿足下列兩個條件之一時,迭代過程停止:
(1)迭代次數大于設定的閥值;
(2)得到個體的適應度值滿足設定的條件。
8.神經網絡適應度函數。采用BP神經網絡。用遺傳算法的個體串所選擇的輸入作為網絡的輸入,即染色體上面數值為1的基因所對應的指標。相應的輸入層的個數就是染色體中數值為l的基因的個數,隱層的個數按照一般的規律為輸入層的2n-1個,輸出層為1個節點即輸出實際的數值。在設定ST公式的類標碼為1,非ST的為0。當神經網絡的輸出接近l時,就認為該輸入為ST,否則相反。最后返回該個體的誤差平方作為適應度。具體設置如下:
網絡結構輸入層節點數,n(字符串中1的個數);
隱藏層節點數,2n-1;
輸出層節點數,1;
訓練步長;0.05
最大訓練次數,2000;
最小誤差,le-5;
實驗結果:
遺傳算法共迭代了500次,其中第475代適應度最大,為1.9538596。
四、預測實驗
將上節中利用遺傳算法選中的指標作為BP神經網絡的輸入變量,對表2中的數據樣本進行學習和預測。數據樣本分拆為兩部分,一部分為學習樣本,包括120個非ST上市公司,50個ST公司;另一部分為測試樣本,包括81個非ST上市公司,32個ST公司。
BP神經網絡訓練、測試時的結構和參數相同,具體設置如下:
網絡結構輸入層節點數,15;
隱藏層節點數,29;
輸出層節點數,1;
訓練步長;0.05
最大訓練次數,2000;
最小誤差,le-5;
五、結論
信用風險測量方法從最早的專家系統和主觀分析開始,到了80年代以財務數據為基礎的統計方法占據了主導地位,其中判別分析模型應用最為廣泛。進入90年代以來,各種新方法不斷涌現,大多是針對統計方法的不足提出來的,具有更高的準確率和可應用性。在眾多較新的方法中,神經網絡有它獨特的優勢:非線性假設、映射能力和泛化能力等等,并已得到廣泛使用,而且應用的效果非常好,準確率較高。
但隨著模型的確定,如何選擇模型的輸入變量,即如何構建指標體系及篩選又成了所有研究者頭疼的問題,好多文獻中都是避而不談。每個模型都使用不同的指標,從一個指標到幾十個指標,多種多樣,但都缺乏理論基礎,也沒有形成較穩定的指標體系。
從銀行角度出發,以財務分析理論為基礎,以實用性為原則,且迎合新巴賽爾協議的要求,構建了一套包含五大方面、42個具體財務比率的指標體系。
為了提高預測效率,降低運行成本,引入了遺傳算法對指標體系進行篩選,并將結果應用到BP神經網絡中,實驗結果非常好。