嚴良 李淑雯 蔣夢婷 熊英楠



【摘 要】 資源型企業與傳統的制造業相比,財務風險在發展過程中有較大差異。文章立足于資源型企業財務風險,采用主成分分析法(PCA)提取代表資源型企業財務特點的七個關鍵因素指標;打破傳統運用粒子群算法(PSO)對支持向量機(SVM)的優化,采用較粒子群算法更穩定,優化性能更好的差分進化算法(DE)對支持向量機(SVM)進行優化,形成DE-SVM財務預測模型。將上市的ST資源型企業和非ST資源型企業近三年財務數據放置于DE-SVM、PSO-SVM以及單一的SVM財務模型中進行對比后發現,DE-SVM預測結果比PSO-SVM以及SVM更精準,運行速度更快,效率更高。因此,DE-SVM財務預測模型有助于提高資源型企業對財務風險問題的識別。
【關鍵詞】 財務風險識別; 資源型企業; 差分進化算法; 支持向量機; 主成分分析
【中圖分類號】 F272? 【文獻標識碼】 A? 【文章編號】 1004-5937(2019)07-0058-08
資源型企業是中國經濟發展的基礎,其提供的大量煤炭、鋼材、石油等礦產類資源對于區域經濟及國民經濟發展起著不可替代的作用,是國家能源安全和基礎產業發展的動力系統。2017年中國500強企業排行榜前50名中石油、鋼鐵、煤炭、能源、銅、鋁等資源型企業就有10家,資源型企業的重要地位可見一斑。根據曹翠珍和趙國浩[ 1 ]、吳樹會[ 2 ]、謝雄標等[ 3 ]的研究可以發現財務問題是資源型企業發展需要解決的重要問題。但是目前關于資源型企業財務預警的研究甚少,對于一般工業類企業的研究較多,定性和定量相結合的模型方法是目前研究的主要現狀[ 4 ]。
目前采用的模型主要分兩種:一種是Altman et al.[ 5 ]、Ohlson[ 6 ]等提出的統計模型,另一種是人工智能模型。統計模型有一元判別分析模型、多元判別分析模型、多元邏輯回歸分析方法和多元概率比回歸方法。統計模型的模擬分類效果比較差,解釋性明顯但數據要求限制嚴格。人工智能模型目前有分類回歸樹、多分類集成、神經網絡和支持向量機分類模型。人工神經網絡的容錯性、自適應性、泛化能力較好,但建模過程復雜,迭代次數較多且結果的精準度依賴人工調試[ 7 ]。人工神經網絡常用于大樣本數據分析,而本文所選樣本較少,神經網絡不大適合,而采用支持向量機模型較合適。
本文通過PCA降維實驗證實了資源型企業與普通工業型企業的關鍵因素指標確有較大不同。總樣本指標均來自于國泰安數據庫中財務指標分類方法,選擇了反映企業盈利能力、發展能力、償債能力、現金流量、經營能力的21個財務指標作為備選變量來分析財務風險。通過PCA主成分因子分析方法進行主要指標降維后發現資源型企業與普通工業型企業降維后指標除管理費用率和流動資產周轉率之外都存在較大差別,從而證實了資源型企業財務風險的影響因素與工業型企業財務風險不同。因此本文立足于資源型企業進行研究,建立符合資源型企業的財務風險識別模型以求更好地研究資源型企業財務問題。
一、原理與方法
(一)支持向量機概述
支持向量機(Support Vector Machine,SVM)主要運用數學和統計學習理論,而VC維理論和結構風險最小原理是其形成基礎,在解決小樣本分類和回歸問題上具備普遍優越性[ 8 ]。線性不可分樣本通常不易被分開,支持向量機運用非線性映射到高維度空間,由此數據點變成線性問題且可分,形成一個超平面使正反兩種樣本被分開,同時滿足二者之間隔離邊沿最大化,最終產生的結果超平面具有較強的魯棒性和泛化能力[ 9 ]。
在樣本空間,需要定義線性方程ωTx+b=0來劃分超平面,其中ω=(ω1,ω2,…,ωd)是法向量,決定了超平面的方向;位移項為b,超平面與原點間距離由其決定。筆者將超平面記為(ω,b),由此可以得到超平面的間隔距離式(1),超平面(ω,b)能夠將訓練樣本(xi,yi)∈D正確分類為式(2)。
(二)差分進化算法
差分進化算法(Differential Evolution,DE)[ 11 ]是啟發式算法的一種,其基于群體差異進行隨機搜索,是由R.Storn和K.Price為求解Chebyshev多項式而提出的。DE與PSO相似,是啟發式優化算法的典型代表。其基本原理均包括變異、交叉和選擇3個階段,但該算法使用了差分策略,使得相對于遺傳算法等其他啟發式算法而言尋優能力更強,更具魯棒性[ 12 ]。差分進化算法首先提取方向信息和搜索步長,然后進行隨機差分和交叉,最終產生臨時種群;通過將兩個種群進行對比、選擇,進一步生成新生代種群,不斷循環上述流程,直至達到滿足條件停止[ 13 ]。
1.種群初始化
二、DE-SVM財務風險識別模型建立
SVM參數是影響SVM性能的主要因素。根據相關文獻,目前對SVM參數進行優化的算法有蟻群算法(ACO)、粒子群算法(PSO)、遺傳算法(GA)和梯度下降算法(GD)[ 14 ]。梯度下降算法對初始點的位置選取較高,其他三種算法雖弱化對初始點位置選取的依附性,但算法本身原理復雜。對于不同的問題運行方式不同,因此該類算法易陷入局部最優中,不易達到全局最優效果。根據Storn和Price于1995年的觀點,差分進化采取浮點矢量編碼進行啟發式并行隨機搜索,全局搜尋能力強、魯棒性強、優化速度高[ 15 ],提高了SVM參數的準確度。
核函數也是影響SVM性能的重要方面。徑向基核函數(RBF)是應用最廣泛的核函數,無論是低維或高維空間、無論小樣本或大樣本都適用且具備較為寬泛的收斂域,是較好的歸類核函數。影響SVM性能的主要為懲罰參數c和RBF參數g。核參數g實質上是RBF核函數的寬度,本質上就是變化映射函數,從而變化特征子空間復雜程度[ 16 ]。
DE-SVM的財務風險模型屬于黑盒類模型,只關心對象的輸入與輸出,不關心對象的具體結構?;贒E-SVM的財務風險模型中的懲罰參數c與核參數g由DE產生,DE的目標函數為SVM輸出值與實際值y的誤差平方和,具體建模步驟如下:
Step1:所有的被采集樣本需被分成訓練集、測試集兩部分。
Step2:DE需進行初始化操作,包括大小規模M、維數N、迭代總次數maxgen、縮放因子F、交叉概率cr。
Step3:選擇RBF作為SVM的核函數,將訓練集輸入SVM,然后將訓練后的輸出值與實際值相關的誤差平方和作為DE的目標函數。此時需判斷誤差的大小是否符合要求,若符合即獲得最優參數c和g,若不符合需進行循環操作。
Step4:將得到的最優參數c、g作為SVM參數,測試集作為輸入函數,根據DE-SVM模型計算出預測值。
Step5:將測試集的實際值與預測值對比分析,判斷預測精確程度。
三、實證研究
(一)研究樣本
從樣本篩選的真實性和可獲得性出發,本文數據來源于深圳證券交易所、上海證券交易所、國泰安數據庫、WIND數據庫以及上市公司年報的財務信息。資源型企業樣本集根據學者定義觀點進行篩選,以開發和加工自然資源為主營業務,主要包括以石油、煤炭、礦藏、電力等資源加工為主的企業[ 3 ]。本文初步調查了2015—2016年的所有ST公司,通過查閱公司年報中主營業務成分所占比重,篩選出了12家資源型企業。根據大量研究資料,本文將ST企業定義為發生財務風險的企業[ 17 ]。為了顯著地反映ST企業財務狀況,本文采用被ST企業該年度與前一年度的數據共同對企業數據進行反映。本研究將36家資源型企業分為訓練樣本組與檢驗樣本組兩個組類,采用知名學者Zavagren提出的正常組與違約者2:1的配比方案確定訓練組和檢驗組樣本數量,分類情況見表1。
本文36家資源型企業共分為兩組,訓練樣本有24個公司,其中ST資源型企業8個,非ST資源型企業16個;檢驗樣本共有12個,其中ST資源型企業4個,非ST資源型企業8個。
(二)主成分分析
1.資源型企業財務指標提取
本文通過廣泛研究資源型企業的財務風險特點、風險衡量方法,采用國泰安數據庫中財務指標的分類方法,選擇了反映企業盈利能力、發展能力、償債能力、現金流量、經營能力的21個財務指標[ 18 ]作為備選變量來具體分析,使得模型中變量的選擇范圍更加全面、有針對性,具體見表2。
(1)KMO和Bartlett球形檢驗
多重共線性會對模型的準確度產生影響,通常情況下采用KMO和Bartlett觀測變量是否適當進行主成分分析。因子分析以0—1作為衡量尺度,變量間相關性越強,KMO值越靠近1;反之KMO值越接近0時,變量間相關性越弱。通常情況下KMO在0.5以上表示適當進行主成分分析。Bartlett球形檢測的P值小于或等于0.01時適合進行主成分分析。本文采用36家資源型企業2015—2016年的6大類21個財務指標分析后得到KMO值為0.645>0.6,P值為0.000<0.01,代表本文選取的6大類21個財務指標適合進行主成分分析,具體結果見表3。
[Kaiser-Meyer-Olkin測量取樣的適當性 0.645 Bartlett的球形檢驗 大約卡方 1 668.442 df 210 顯著性 0.000 ][表3 KMO和Bartlett檢驗結果]
(2)最大方差旋轉法
最大方差旋轉法通過實驗降維使得因子的累積貢獻率達到80%以上,提取指標才能夠代表其他指標。本研究采用36家資源型企業2015—2016年的6大類21個財務指標數據進行分析后發現,提取的7個指標代表性達到了82.22%,可以有效代表其他21個指標,具體情況見表4。
2.資源型企業財務指標確定
確定影響因子指標個數并不能夠解決實際問題,必須確定具體的分析指標才能夠有效地進行下一步研究。筆者采用旋轉的最大方差法使得單個因子的方差負荷達到最大值來確定因素的具體含義。取消小系數法僅顯示值大于0.6的旋轉因子負載指標可以使結果更加明晰直觀。原始變量的代表性與旋轉因子的荷載值有很大關系,值越大表明因子關系越密切,具體情況見表5。最終確定了7個代表性變量,分別為資產報酬率(X16)、速動比率(X2)、每股凈資產增長率(X10)、管理費用率(X21)、流動資產周轉率(X13)、存貨周轉率(X11)、凈資產增長率(X9),具體情況見表6。
通過對資源型企業指標做KMO和Bartlett檢驗以及最大方差旋轉以后,得到了旋轉因子負載荷表,根據數據大小先后順序及權重比較可以得到表6的7個指標為判斷資源型企業財務風險分析的主要指標。經過對比后發現,提取的資源型企業財務風險指標與傳統的工業型企業財務風險指標有較大不同。
3.資源型企業與工業型企業財務指標對比
對資源型企業與普通工業型企業財務指標對比可發現,其提取的總樣本21個財務指標均來自于國泰安數據庫。通過PCA主成分分析方法進行指標降維后可以發現資源型企業降維指標與普通工業型企業降維指標中除管理費用率和流動資產周轉率之外的其他指標都存在較大差別,具體見表7,因此需立足于資源型企業進行專項研究。
(三)實驗仿真與結果分析
本文采用2:1的比例將樣本分為訓練集和測試集,其中24個樣本為訓練集,12個樣本為測試集,采用DE-SVM構造財務預警模型。特征集和核函數的參數同時通過DE-SVM模型進行優化,仿真實驗平臺為Macbook pro 2015、Intel Core i5、2.7GHz CPU、8GB RAM。采用DE-SVM模型進行參數尋優適應度與迭代次數后的結果如圖2。
實驗中ST資源型企業用類別1表示,非ST資源型企業用類別-1表示。實點表示預測集實際類別,虛點表示使用模型預測出的類別。為方便觀察,分別使用實線和虛線連接實點和虛點,重合點即為結果預測為正確的點。
實驗結果顯示,在小樣本情況下,SVM模型、PSO-SVM模型和DE-SVM模型對分類精確度有一定差別,但由于SVM具有數學模型特性,故而模擬實驗的不確定性小,該模擬實驗結果較為穩定。SVM模型、PSO-SVM模型和DE-SVM模型對訓練集和樣本集進行詳細仿真實驗后的訓練結果如表8。
對比表8仿真結果可以發現,SVM遍歷整個區間尋找出最優懲罰參數和核參數,增加了小樣本分類問題的準確性。但通過對比運行時間發現,DE和PSO相對于SVM參數尋優更具優越性,可大量減少運行時間。但DE和PSO易陷入局部最優。觀察PSO-SVM多次實驗的正確性只有87.3%可知,用PSO-SVM進行預測比DE-SVM更易陷入局部最優。通過三種算法對比可清晰看出,DE-SVM在預測的正確性以及運行時間上相對于其他兩種算法模型更具明顯優勢。
四、結論
第一,資源型企業與普通工業型企業財務指標選取均來自于國泰安數據庫中的21個財務指標,但進行PCA降維后得到的7個代表型指標中有5個指標不相同,這說明資源型企業與普通工業型企業在財務風險問題上有較大不同。其不同之處是由資源型企業的特點所決定,這是以后進行深入研究的主要方向。
第二,本文運用主成分分析后再運用DE-SVM模型對資源型企業是否存在財務風險進行預測后發現運行時間大幅減小,說明DE-SVM模型對已有數據進行分類時更精確,對小樣本分類具有更強的實際意義。
第三,由于資源型企業通過PCA進行指標降維后達到較好的預測效果,還需考慮PCA未進行指標降維前其他財務指標,考慮未進行指標降維前的其他指標是進行深入研究的主要方向。
第四,本文運用了相對PSO而言更為適當的DE與SVM進行結合,在小樣本數據分類中具有良好的效果。以后的研究中,可適當提升樣本數量并對已有算法進行改進,達到更好的分類效果,進一步提升算法模型的精準程度,這在大數據時代來臨之際實際意義更加明顯。
【參考文獻】
[1] 曹翠珍,趙國浩.資源型企業綠色創新、綠色動態能力與競爭優勢的實證檢驗[J].統計與決策,2017(6):177-181.
[2] 吳樹會.資源型企業財務風險研究[J].財會通訊,2016(2):93-96.
[3] 謝雄標,嚴良,程勝.我國資源型企業資源效率管理行為分析及政策建議[J].中國人口·資源與環境,2008(1):207-211.
[4] 過新偉,胡曉.公司治理、宏觀經濟環境與財務失敗預警研究:離散時間風險模型的應用[J].上海經濟研究,2012,24(5):85-97.
[5] ALTMAN E I,HALDEMAN R G,NARAYANAN P. ZETA analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking and Finance,1977(1):29-54.
[6] OHLSON J A. Financial ratios and the probabilistic prediction of bankruptcy[J].Journal of Accounting Research,1980,19(Spring):109-131.
[7] 胡達沙,王坤華.基于PSO和SVM的上市公司財務危機預警模型[J].管理學報,2007(5):588-592.
[8] 業巧林,閆賀.基于最小二乘的孿生有界支持向量機分類算法[J].華中科技大學學報(自然科學版),2018,46(3):30-35.
[9] 朱發根,劉拓,傅毓維.基于非線性SVM的上市公司財務危機預警模型研究[J].統計與信息論壇,2009,24(6):49-53.
[10] 周志華.機器學習[M].北京:清華大學出版社,2016.
[11] 陳濤,雍龍泉,鄧方安,等.基于差分進化算法的支持向量機參數選擇[J].計算機工程與應用,2011,47(5):24-26.
[12] 賈立敬,張建文,王傳林,等.基于DGA的差分進化支持向量機電力變壓器故障診斷[J].高壓電器,2015, 51(4):13-18.
[13] 隋學深,喬鵬,丁保利.基于支持向量機的貸款風險等級分類真實性審計研究[J].審計研究,2014(3):21-25.
[14] 蔡歡.基于遺傳算法和LS-SVM的財務危機預測[J].統計與決策,2017(2):33-36.
[15] 張夢男.基于支持向量機的上市公司信用評價研究[J].財會通訊,2017(14):43-48.
[16] 王君萍,王娜.我國能源上市公司財務風險評價:基于主成分分析法[J].會計之友,2016(11):60-66.
[17] 張金貴,陳凡,王斌.基于PSO優化SVM制造業公司財務風險預警研究[J].會計之友,2017(14):52-56.
[18] 聶麗潔,趙艷芳.基于現金流的財務危機預警指標體系構建研究[J].經濟問題,2011(3):108-112.