孟繁星
[摘要]本文首先簡要說明什么是神經動力學,然后簡介神經動力學模型中的BSB模型和多層感知器(MLP)模型,再說明如何將神經動力學應用于信用評級問題,最后對這種應用做出評價。
[關鍵詞]神經動力學 神經網絡 BSB模型 MLP模型信用評級
[中圖分類號]F224 [文獻標識碼]A [文章編號]1009-5349(2016)22-0255-02
一、引言
神經網絡在最近20年中得到了迅速的發展,有關的論文及著作已有許多,而神經網絡與數學中動力學系統理論的交叉結合(稱之為神經動力學)雖也有所發展,但是在應用上卻不是很廣泛。
自然界中的現象,我們都可以用數學模型去描述,大體上分為兩類,一類是確定性的數學模型,另一類是隨機性的數學模型。而動力學模型是最普遍的確定型的數學模型。
在信用風險管理中,信用評級是其重要的組成部分。持續的評估可以幫助信用管理者監測客戶的賬戶。對于現金充足的大公司來說,對銀行的評估有助于幫助他們決定分別應在各家銀行存入多少錢。對于尋求貸款的企業,幾個銀行的評估有時可以指導他們選擇合適的銀行來借款。
許多大的公司、銀行、政府及政府機構現存的債務都有各自的信用評級。評級通常是由穆迪標準普爾和惠譽(IBCA)這樣的專業機構完成的。根據企業評級結果,銀行可以決定對該企業的貸款使用何種等級的貸款利率。例如,一個信用等級較低的企業貸款利率會比較高。企業可以利用銀行評級來決定他們在銀行的存款額度。
本文著重說明神經動力學模型能夠在信用風險管理中得到應用,試圖做到舉一反三,而不做實證分析,為推動神經動力學在信用分析中的應用提供一些參考意見。尤其是在信用評級分類中,神經動力學模型對數據的要求沒有傳統的評級方法的要求那么高,且應用較其他領域更直接一些,下面我就來介紹幾個比較典型的神經動力學模型。
二、神經動力學模型
(一)數學模型
一個神經網絡包括n個處理單元,對于第i個單元,有三個相關的實數:網絡的輸入信號,行為的狀態以及輸出。輸出是行為狀態變量的函數,輸入是所有狀態和一個實參數矩陣——權重矩陣()的函數。一般假定 ,此處看成是從第j個神經元到第i
個神經元的傳送線路的強度。
為了完成對神經網絡的數學描述,我們通過指定表達狀態隨時間改變的方式的一種規則,即一種動力學使神經網絡置于一個動力系統之中。
1.離散的單層反饋形神經網絡的動力學模型
N個神經元排列成一個單層,如果它構成全反饋的網絡,這其中的每個神經元的輸出都與其他神經元的輸入相連,又整個網絡的輸入與輸出的神經元數是相同的,都為N。如果假設第j個神經元在時刻t的輸出為,那么在時刻t的N個神經元的輸出向量可表示為,又假設第i個神經元時刻t的內部狀態為,即可得到時刻t的N個神經元的內部狀態為向量,若
其中f可以是最簡單的二值函數H,也可以S是形單調連續函數,那么得到離散的單層反饋神經網絡。下面介紹離散的Hopfield神經網絡。
假定在(1)中的f取二值符號函數,sgn形式,又第i個神經元在時刻t的內部狀態
其中是權重,是內部狀態值。如果,那么,即第i個神經元在t+1時刻興奮;如果 ,那么,即第i個神經元在t+1時刻抑制。
我們的目的是先求出權重,然后求出,最后根據 的大小和權重對輸出進行分類。
2.BSB模型
①BSB模型
設W是對稱矩陣,且其最大的特征值有正的實部。記是模型的初始狀態向量,表示啟動一個輸入。假設模型由N個神經元構成,狀態向量的維數也為N,矩陣W是N×N陣,于是BSB模型的算法可以由以下方程完全給出:
其中β是小正常數,稱之為反饋因子,是離散時間的狀態向量,W表示單層線性神經網絡。函數φ是一個分段線性函數依賴于,
其中是的第j個分量。
②模型的應用——分類
BSB模型的一項基本的應用就是分類,這是由于作為吸引子的超立方體的頂點和相應的定義完善的區域,于是BSB模型被用來作為一種無監護的分類算法,而每一個不動點代表一組相關的數據構成的分類,由正反饋產生的自我放大是分類方法的最重要的特征之一。
Anderson于1990年描述了利用BSB模型進行分類的方法,它可以從不同的放射射線中區分出輻射的信號。在這一應用中,權矩陣是通過誤差糾正的線性相關的學習過程得到的。為了詳細說明,假設有K個訓練的向量
隨機選擇向量,于是權矩陣可以根據偏差糾正算法得到
其中η是學習率參數。根據計算,輸入向量像其“老師”一樣表現,因為線性結合會重新構造輸入向量,而學習的目標是使得
由式(6)給出的糾偏算法在最小均方意義下接近于理想的條件(7)。學習的過程是為了促使線性結合器給出一組特征向量,相應的特征值等于1。為了模擬雷達分類,BSB模型應用上述方法給出了權矩陣。
3.感知器模型
感知器是由F.Rosenblatt于1957年提出的。設為輸入量,y為輸出量,輸入與輸出之間滿足:
其中為權系數,θ為閾值,函數為分段常數函數,
令,那么
于是問題化為已知兩個樣本集分別為,要求權系數和閾值使得
如果A,B兩類樣本是線性可分的,即可用一根直線將兩類樣本分隔開來,而且有一段距離(參見圖1),那么形如(8)式的解有無數個。我們采用單層感知器來求解這個問題。
又如圖2所示的二維平面中,A類樣本分布在原點的附近,B類樣本分布在A類樣本的外部區域中,兩類樣本不能用直線分隔開來。
對于圖2的問題,就是尋找一個區域,使其內部為A類樣本,其外部為B類樣本。可以在二維輸入空間中劃出三根直線,因為他們的權系數和閾值各不相同,因此3根直線的斜率與截距也不相同(如圖3所示)。將這三個單元所得到的直線作相應的邏輯運算。
其中z為輸出單元,這樣得到一個封閉區域即可正確劃分兩類樣本。
(二)模型在信用分類評級上的應用
從理論上講,以上兩類模型都能解決分類問題,前類神經動力學模型是有導師學習的神經網絡,是一種具有聯想記憶功能的反饋動力學系統,能較好地逼近f,而多層感知器最適合解決分類問題,因為分類問題可視為求解靜態的映射f,前向網絡通過簡單處理單元的復合可獲得較強的處理輸入輸出關系的能力,能更好地逼近f。
三、對神經動力學模型在信用評級中應用的評論
1.準確性較高
在測試數據為線性關系可分時,則線性判別分析方法的準確性和多層感知器相當。但是在測試數據為非線性關系的情況下,準確性比較高。比如,在信用分類中加入了行業分析、發展潛力等因素的情況下,多層感知器分類的準確性明顯地高于多元統計中的判別分析法。
2.適應性強
多層感知器有較強的適應訓練樣本變化的能力,當訓練樣本增加新的數據時,多層感知器能記憶原有的知識,根據新增的數據作適當的調整,使之表示的映射關系能更好地刻畫新樣本所含的信息。這一點不僅使多層感知器具有較強的適應樣本變化的能力,而且還使得它具有動態刻畫映射關系的能力,也克服了線性判別分析方法的靜態特點。
3.健壯性
多層感知器對樣本的分布、協方差等沒有要求,對樣本中存在的噪音數據、偏差數據不敏感。線性判別分析方法雖然對噪音數據不很敏感,但它對樣本分布和協方差均有很高的要求。
4.神經網絡的主要缺點
(1)對樣本的依賴性過強,這就要求在選擇樣本時既要全面又要典型。因為它很少有人的主觀判斷的介入,所以它對樣本的選擇提出了很高的要求。
(2)解釋功能差。神經網絡被稱為黑箱,即它僅能給出一個判斷結果,而不能告訴你為什么。為了解決這個缺點,就應該將多層感知器和其他解釋功能較好的方法結合起來,形成雜和系統,這樣既可以保持神經網絡的準確性高、適應性強、健壯性的特點,同時也增加了它的解釋功能。
5.輸入特征變量的確定
首先,要從所有的可能的指標中確定出關鍵指標,這同時也需要依賴于其他的統計方法。第二個問題是樣本分成多少個種類,即分成哪幾種信用等級比較合適。這些問題都是神經網絡方法無法獨自解決的,要依賴于其他方法。
【參考文獻】
[1]阮炯,顧凡及,蔡志杰.神經動力學模型方法和應用[M].北京:科學出版社,2002.
[2]英國皇家銀行學會布來恩.科伊爾(著),周道,許關偉(譯).信用風險管理[M].北京:中信出版社,2003.
[3]石曉軍,陳殿左.信用治理:文化、流程與工具[M].北京:機械工業出版社,2004.
[4]約翰.B.考埃特,愛德華.I.愛特曼,保羅.納拉亞南(著),石曉軍,張振霞(譯).演進著的信用風險管理:金融領域面臨的巨大挑戰[M].北京:機械工業出版社,2001.
責任編輯:楊柳