[摘 要] 本文給出了財務評價指標體系及其量化方法,利用支持向量機的分類能力建立財務風險預警的模型。對上市公司的財務數(shù)據(jù)進行訓練和評估,證明基于支持向量機的財務風險預警模型的可行性和實用性,實驗表明支持向量機在小樣本情況下具有良好的非線性建模能力和泛化能力。
[關(guān)鍵詞] 財務風險預警;支持向量機
[中圖分類號]F232;TP224.0[文獻標識碼]A[文章編號]1673-0194(2008)18-0007-03
1 引 言
企業(yè)財務風險預測是以企業(yè)相關(guān)信息為基礎(chǔ),通過設(shè)置并觀察一些敏感性財務預測指標的變化,對企業(yè)可能面臨的財務危機實施預測。作為企業(yè)來講,在長期的運營過程中累計的風險,會持續(xù)傳導并影響企業(yè)的財務信息,最終形成財務危機。通過收集這類財務信息,運用一定的方法分類、識別和評價,就可以對企業(yè)的財務風險進行預警,協(xié)助企業(yè)及早有效規(guī)避和分散財務風險。本文運用支持向量機(Support Vector Machine,SVM),通過選取適當?shù)念A警指標獲取已知警情公司的預警數(shù)據(jù)來判別未知警情的新預警樣本。實驗表明,支持向量機模型在預警精確度和遠期預警能力上要好于傳統(tǒng)預警方法。
2 支持向量機技術(shù)
上市公司財務危機預警屬于小樣本問題。由于統(tǒng)計模型和神經(jīng)網(wǎng)絡都是基于經(jīng)驗風險最小化準則,所以在小樣本條件下,容易過度擬合,導致模型的泛化能力下降。因此近年來,諸多實證研究表明,在小樣本和高維條件下,SVM 結(jié)構(gòu)簡單,不僅具有良好的判別分類能力,而且具有良好的泛化能力。
支持向量機(Support Vector Machines,SVM)是一種建立在統(tǒng)計學習理論基礎(chǔ)之上的機器學習方法,其最大的特點是根據(jù)文獻[1]和[2]結(jié)構(gòu)風險最小化原則,盡量提高學習機的泛化能力,即由有限的訓練集樣本得到小的誤差仍然能夠保證對獨立的測試集保持小的誤差。另外,由于支持向量算法是一個凸優(yōu)化問題,所以局部最優(yōu)解一定是全局最優(yōu)解,這是其他學習算法所不及的。將支持向量機應用到客戶信用分析中,可在先驗知識不足的情況下,仍然具有較好的分類能力。SVM建立在結(jié)構(gòu)風險最小化原則的統(tǒng)計學習理論基礎(chǔ)之上,其主要思想是:對于一個給定的具有有限數(shù)量訓練樣本的學習任務,通過在原空間或經(jīng)投影后的高維空間中構(gòu)造最佳超平面,將給定的屬于兩個類別的訓練樣本分開,構(gòu)造超平面的依據(jù)是兩類樣本對超平面的最小距離最大化,這意味著距超平面最近的異類向量之間的距離最大[3]。它的思想可用圖1說明,圖1描述的是兩類樣本線性可分的情形,圖中“○”和“+”分別代表兩類樣本。
最優(yōu)超平面決策函數(shù)為:
3 基于SVM 的財務風險預警模型
3. 1樣本選取
根據(jù)我國上市公司實際情況和有關(guān)政策規(guī)定,上市公司發(fā)生財務狀況異?;虬l(fā)生其他異常狀況,導致投資者對該公司前景難以判定,可能發(fā)生損害投資者利益的情形時,上市公司自動進入ST板塊。其中,財務狀況異常指的是最近兩年連續(xù)虧損,或最近一年的每股凈資產(chǎn)低于每股面值。從以上規(guī)定可以看出,被特別處理(ST)的企業(yè)已經(jīng)陷入了較大的財務危機。因此,將ST類作為財務危機型企業(yè)的標準是現(xiàn)有條件下的最佳選擇。
本文實證分析中的原始的公司財務數(shù)據(jù)及財務比率數(shù)據(jù)來源于WIND資訊。考慮到我國ST制度運作的實際情況,本文擬采用上市公司被ST前1~3年有關(guān)數(shù)據(jù)來預測當年是否會被ST,選取的樣本分為學習樣本和檢驗樣本。為了訓練模型,從2005年和2006年的ST公司和非ST公司中隨機抽取60個作為學習樣本,另外隨機抽取80個作為檢驗樣本,供模型進行測試。
3. 2指標體系的建立
由于企業(yè)財務預警研究的指標選取缺乏具體的經(jīng)濟理論作指導,公司被ST的本質(zhì)原因又不盡相同,很難用簡單的幾個財務比率對財務困境進行充分描述,所以嘗試從不同的側(cè)面選取指標,以反映企業(yè)財務狀況的各個方面。指標選取遵循以下基本原則:
(1)以往研究中普遍使用,并被證明是有效的;
(2)數(shù)據(jù)能從資產(chǎn)負債表、損益表以及現(xiàn)金流量表中獲得,計算相對簡便;
(3)選取相對指標,排除企業(yè)規(guī)模的影響;
(4)考慮現(xiàn)金流量指標的重要性。
按照以上選取原則,采用傳統(tǒng)財務指標和現(xiàn)金流量信息相結(jié)合的方法,從企業(yè)盈利能力、償債能力、營運能力、發(fā)展能力、現(xiàn)金流量能力5方面,選取了18個財務指標:
(1)盈利能力指標:每股收益(x1),資產(chǎn)收益率(x2),銷售凈利率(x3),權(quán)益凈利率(x4);
(2)償債能力指標:流動比率(x5),速動比率(x6),資產(chǎn)負債率(x7),權(quán)益負債比(x8);
(3)營運能力指標:總資產(chǎn)周轉(zhuǎn)率(x9),應收賬款周轉(zhuǎn)率(x10),存貨周轉(zhuǎn)率(x11);
(4)發(fā)展能力指標:銷售增長率(x12),權(quán)益增長率(x13),主營業(yè)務利潤增長率(x14);
(5)現(xiàn)金流量指標:現(xiàn)金凈利潤比率(x15),現(xiàn)金流動負債比率(x16),現(xiàn)金總負債比率(x17),每股凈資產(chǎn)(x18)。
將上市公司分為兩組,第1組包含ST公司,認為該類企業(yè)具有較大的財務風險。非ST公司作為第2組,認為該類企業(yè)財務狀況正常。若模型將ST組樣本判為非ST組,則稱為犯第1類錯誤;若將非ST組樣本判為ST組,則稱為犯第2類錯誤。
3. 3SVM模型構(gòu)造
根據(jù)上述的分析,構(gòu)造了樣本集(x,y),其中x的維數(shù)為8,y是樣本的類別屬性,對于財務狀況正常的公司y=1,對于財務風險大的公司y=-1。SVM 中不同的內(nèi)積核函數(shù)將形成不同的算法,目前研究最多的核函數(shù)主要有多項式函數(shù)、徑向基函數(shù)、Sigmoid 函數(shù)3種。手寫數(shù)字識別實驗表明,采用上述3種不同核函數(shù)的SVM能得到性能相近的結(jié)果,且支持向量的分布差別不大。對于具體問題,如何選擇核函數(shù)目前還沒有一般性的方法。本文構(gòu)造的SVM模型的內(nèi)積核函數(shù)采用最常用的多項式函數(shù)和徑向基函數(shù):
K(x,xi)=[(x·xi)+ c]q;
K(x,xi)= exp(-| x-xi| 2/σ2)。
綜合考慮最少錯分樣本數(shù)和最大分類間隔,在高維空間中構(gòu)造軟間隔。σ2,c 等參數(shù)采用交叉驗證方法(Cross Validation,CV)確定,進行實驗分析。
4 實驗結(jié)果
SVM 中不同的內(nèi)積核函數(shù)將形成不同的算法,本例分別選取多項式核函數(shù)和徑向基函數(shù)分別訓練SVM,并對實驗結(jié)果進行比較。設(shè)定懲罰因子c=1 000,開發(fā)工具使用MATLAB 6.0 。
4. 1多項式核函數(shù)
(1)取多項式核函數(shù)為:K(x,xi)= [(x·xi)+10]2時,實驗結(jié)果如表1所示。
(2)取多項式核函數(shù)為:K(x,xi)=[(x·xi)+10]1時,實驗結(jié)果如表2所示。
當多項式核函數(shù)中參數(shù)c 固定,q=1 時有較高的識別率。
4. 2徑向基核函數(shù)
(1)取徑向基核函數(shù)為:K(x,xi)= exp(-| x-xi|2/0.7)時,實驗結(jié)果如表3所示。
(2)取徑向基核函數(shù)為:K(x,xi)= exp(-| x-xi|2/0.1)時,實驗結(jié)果如表4所示。
當徑向基核函數(shù)中參數(shù)σ取不同值時有不同的識別率,σ2= 0.1 比σ2 = 0.7 有高的識別率。
而用相同的樣本集訓練BP人工神經(jīng)網(wǎng)絡(ANN),其實驗結(jié)果如表5所示。
相對于BP神經(jīng)網(wǎng)絡而言,SVM具有較高的識別效果。實驗表明,采用上述兩種核函數(shù),包括兩層神經(jīng)網(wǎng)絡Sigmoid核函數(shù)的SVM 能得到性能相似的結(jié)果,且支持向量的分布差別不大。對于具體問題,如何選擇核函數(shù)目前還沒有一般性的方法[4-6]。
5 結(jié)束語
SVM是一種有堅實理論基礎(chǔ)的新穎的小樣本學習方法,其最終決策函數(shù)只由少數(shù)的支持向量所確定。該方法具有較好的“魯棒”性,例如增加或者刪除非支持向量樣本時對模型沒有影響,在有些成功的應用中,SVM對核的選取不敏感。將SVM 應用到財務風險預警中,比傳統(tǒng)方法更簡單、有效,具有更好的泛化能力。SVM不僅可以用于兩分類問題,而且可以推廣到更為復雜的多分類的問題上。
主要參考文獻
[1] V N Vapnik. 統(tǒng)計學習理論的本質(zhì)[M]. 張學工譯. 北京:清華大學出版社,2000.
[2] N V Vapnik. Statistical Learning Theory [M]. NY: Wiley,1995.
[3] 張學工. 關(guān)于統(tǒng)計學習理論與支持向量機[J]. 自動化學報,2000,26(1):32-42.
[4] 劉閩,林成德. 基于支持向量機的商業(yè)銀行信用風險評估模型[J]. 廈門大學學報:自然科學版,2005,44(1):29-32.
[5] 孫華麗,謝劍英,薛耀鋒. 基于支持向量機的物流服務顧客滿意度評價模型[J]. 上海交通大學學報,2006(4).
[6] 張麗霞,施國慶. 基于支持向量機的工程項目風險預測研究[J]. 計算機工程與應用,2005(21).
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文