閆大波?任淑紅?王微微

基于SVM的高校財務困境預警模型是一種在小樣本數據條件下預警高校財務困境的重要方法。本文選取了教育部64所高校中的7個財務評價指標進行分析,將其劃分為三種類別,即輕警、重警與巨警,然后與誤差反向傳播( BP) 神經網絡模型進行比較。經過系統研究,結果顯示通過SVM預警模型可以更好地預警高校財務困境。因此,建立基于支持向量機的高校財務困境預警模型,強化高校財務困境預警管理,尤為必要。
高校財務管理由早期的無風險管理逐漸向現代化的風險管理轉變,特別在2008年爆發金融危機后,建立財務困境預警非常有必要。六十年代到九十年代中后期,在傳統的統計方法基礎上又形成一些財務困境預警模型。然而,受模型對樣本數量要求較高等因素限制,導致以上預警模型在面對小樣本數據時,無法克服自身缺陷,不能有效解決財務困境預警問題。
通過研究國內外相關文獻,對企業財務困境領域研究表現較為突出的,當屬基于SVM的研究財務困境預警模型,上市公司在這方面的實證研究比較充分,但是關于非盈利性組織的研究較少,例如高校。本文在SVM算法基礎上,通過建立高校財務困境預警模型,對各種實證進行分析,以證明該模型在高校財務困境預警中具有非常高的應用價值,值得進行大力推廣。
一、SVM的原理和算法
SVM在一定程度上與概率測度和大數定律并不涉及,傳統機器學習方法中存在的各種缺陷都能效解決,如維數災難等。它可以有效發揮出自身獨特優勢,如非線性識別、有效解決小樣本和高維模式等,如一般的回歸問題和分類問題等在此基礎上能夠得到充分簡化。
簡單的描述SVM機理。首先選擇最優分類超平面的一個,保證超平面和樣本集轉化之間得到最大化的距離,在此基礎上最優超平面的構造可以將其朝著一個類似二次規劃問題的方向進行轉化。
(一)線性可分SVM
若樣本,不僅是線性的且可分,分類超平面有且只有一個,即wTx+b =0,則可以正確分類訓練樣本且誤差為零,即
之后再將拉格郎日函數引進來,通過優化解決二次規劃問題,可以將最優的分類函數進一步得到。
(二)線性不可分SVM
若樣本不是線性且不可分,則需要將非負松弛變量和懲罰參數C>0引入到方程式中,懲罰錯誤的分類隨著C增大,以此便可以優化解決廣義分類超平面問題。
(三)非線性SVM
針對非線性問題而言,只需要在一個非線性映射的基礎上在某一特征空間內實現輸入向量的映射,之后再將最優分類的超平面構造起來。
通過上述分析,在非線性函數的幫助下雖然可以在高維特殊空間內實現對樣本數據的映射,且能夠將最優分類超平面在特征空間中構建起來,然而在最優化問題求解和決策函數的計算過程中只需要對核函數進行計算即可,以此類似特征空間維數災難性的問題就能夠得到有效解決。
二、樣本選取與變量設計
(一)樣本選取
選取72所教育部直屬高校作為空間樣本,其中已知樣本空間和需要進一步進行判別所屬類別的高校分別有64所和8所,88.90%的高校參與了本次的分析判別,11.10%的高校在分類變量所能夠控制的范圍以外。
現將樣本高校共64所根據警戒限分為三類。一類高校共有48所,財務狀況良好,警戒限為輕警,;二類學校共有12所,財務狀況一般,警戒限為中警;三類高校共有4所,財務狀況非常差,警戒限為巨警。2.2變量設計
共劃分為三種指標體系。即償債能力指標體系、運作績效指標體系和收益能力指標體系。考慮到財務風險的來源-負債,將償債能力指標體系作為總評價指標體系的最重要主體,再在運行績效指標體系和收益能力指標體系兩種輔助指標的補充下,初步設置原始變量。
三、建立模型
選取徑向基核函數作為SVM預測模型的內積核函數,再使用M
ATLAB工具箱將SVM預測模型建立起來并進行必要的測算。
(一)選擇核函數
建立SVM模型,對應核函數g與懲罰參數C的選擇是其中最為關鍵的。通過合理選擇,一定程度上會對模型本身推廣能力和精度造成直接影響。當下,幾種比較常用的核函數形式如下:
1.多項式核函數;
2. 徑向基核函數,在一定程度上與SVM相對應,主要是徑向基函數分類器的一種;
3. Sigmoid核函數[K(xi,x)],SVM能夠建立1個具備多層感知器的神經網絡模型,再在自動算法的基礎上確定網絡權值域隱層節點的數目。
參數(C,g)在很大程度上可以直接決定1個基于徑向基核函數的SVM性能,由于所選取的C與g不同,相應的所得到的SVM也會有顯著的差異。所謂的K層交叉檢驗是將各類初始數據隨機地劃分成K組,然后選取其中1個作為檢驗集。訓練集就是余下的K-1個。最后得到的模型共有K個,再對K個模型的最終檢驗集的平均參數當做是評價K-CV分類器性能的重要指標。基于K-CV能夠有效避免欠學習和過學習狀態,比較具有說服力,因此選擇參數K-CV。計算后得知,核函數最佳參數g=0.345355,懲罰最佳參數C=45. 4825。
(二)建立模型
將自變量X[0,1],分類變量y[-1,1] ,懲罰參數C =45. 4825,核函數參數g = 0.345355,統一做歸一化處理,由此得到SVM 模型。再使用SVM模型,預測和分析檢驗樣本,最后得到檢驗樣本SVM 模型。
結果顯示,其具備較高的預警模型精度。當訓練樣本數為60和檢驗樣本數為4個時,便需要預測檢驗樣本,其判別的準確率高達100.00%,錯誤率為0.00%;當訓練樣本和檢驗樣本的數目分別為58個和6個時,便需要預測檢驗樣本,同時準確率為71.43%,錯誤率為28.57%,檢驗樣本的預測分類與實際分類不相符的數目只有1個。簡而言之,該模型能夠取得較好的預測效果。
(三)比較應用效果
通過比較BP神經網絡模型和SVM模型的判別結果,可以得出以下結果。
利用兩種方法進行判別的結果是一致的,分類正確率都比較高。其中最高的當屬SVM模型(1),檢驗樣本判別正確率在分類1的情況下可以實現100.00%,SVM模型(2)比BP神經網絡模型高3.33%。BP神經網絡模型判別正確率與SVM模型相比,準確率下降的更快。由此得知,SVM模型預測精度非常高,具備很好的推廣價值。
四、結語
經過各項實證研究證明,基于支持向量機的高校財務困境預警模型在樣本數據比較小情況下能夠準確進行科學預測,原因如下:
1.它能擺脫掉傳統單元與多元判別模型方法本身的局限性,以線性函數為依據,突破判別模型的限制;
2.提高有限樣本的針對性,利用BP神經網絡模型和非線性函數對樣本數據進行擬和;
3.在非線性變換的幫助下,促使輸入向量朝著到高維特征空間方向轉化,進而對原空間中的非線性函數進行科學判別,以此保障模型具有良好的推廣能力;
4.在最小化樣本點誤差的基礎上,保證模型泛化誤差,提高模型泛化能力。
綜上所述,本文從線性可分SVM、線性不可分SVM以及非線性SVM的角度出發,介紹了SVM的原理和算法,完成了樣本研究和原始變量設置、篩選。并在此基礎上進行深入思考,并得出重要結論:SVM模型具有較為簡單的分類面、較強的泛化能力以及較高的擬合精確度。(作者單位:沈陽農業大學)