康亮河 趙正強 萬君 王劍恩 王博



摘? 要:針對Elman神經網絡在財務困境中預測精度低的問題,文章提出了結合金槍魚TSO算法與Elman神經網絡的財務困境預警模型。針對2021年A股上市公司的財務數據,首先采用Z分數及多重插補法對異常值及缺失值進行了處理,并利用PCA算法篩選出貢獻度為90%的重要屬性;其次,利用TSO算法對Elman神經網絡參數尋優,構建財務困境預測模型。實驗結果表明:TSO-Elman模型在對上市公司財務困境預測中具有較高的預測精度及穩定性,相比RBF、BP、SVM及Elman模型,其分類準確率分別提高了18.89%、14.13%、12.54%及4.61%。
關鍵詞:TSO算法;Elman神經網絡;PCA算法;財務困境
中圖分類號:TP391;TP183 文獻標識碼:A 文章編號:2096-4706(2023)09-0162-04
Abstract: Aiming at the problem of low prediction accuracy of Elman neural network in financial distress, this paper proposes a financial distress early warning model combining Tuna Swarm Optimization (TSO) algorithm and Elman neural network. In view of the financial data of A-share listed companies in 2021, the Z score and multiple imputation method are used to process the outliers and missing values firstly, and the PCA algorithm is used to screen out the important attributes with a contribution of 90%. Secondly, TSO algorithm is used to optimize Elman neural network parameters to construct a financial distress prediction model. The experimental results show that the TSO-Elman model has high prediction accuracy and stability in financial distress prediction of listed companies. Compared with RBF, BP, SVM and Elman models, its classification accuracy has improved 18.89%, 14.13%, 12.54% and 4.61% respectively.
Keywords: TSO algorithm; Elman neural network; PCA algorithm; financial distress
0? 引? 言
2020年一場突如其來的疫情,國內很多大、中型企業停工停產,陷入了財務困境,給公司股東與利益相關者帶來了巨大損失[1]。經研究發現,影響企業財務危機的影響因素錯綜復雜,但有跡可尋,通過建立一套高效實用的預警系統,對于中小企業健康、有序發展具有重要意義[2]。
關于財務困境的預警已有大量研究,國內學者郭小敏[3]在2018年指出,當上市企業的財務連續3年虧損,表示該企業已出現財務困境,所以是否被ST處理可用來判斷企業是否出現財務困境。Altman[4]提出了Z分數模型,運用多個財務指標,結合加權算術平均數,構建了評價公司財務狀況的體系。Martin[5]利用多元邏輯回歸模型多銀行的經營數據進行分析,發現該模型的預警能力明顯高于Z模型。Benes等[6]學者利用BP神經網絡來評定公司信用等級,發現BP神經網絡具有較好的可行性。石先兵[7]根據滬深A股制造業上市公司財務數據,構建了主成分分析法(PCA)與支持向量機(SVM)財務危機預警模型,具有良好的推廣作用和泛化作用。游旺[8]等學者利用改進后的Elman神經網絡來識別電纜故障,與BP相比,具有較高的分類準確率。胡丹[9]等學者利用TSO模型結合極限學習機(ELM)來預測光伏的功率,發現TSO(Tuna Swarm Optimization)算法擁有更優的尋優精度和收斂速度。
截至目前,已有大量關于財務困境的預警研究,但其方法大致可以分為基于指標分析與基于模型分析兩類,隨著市場的變化,單指標與多指標不能有效預警企業的未來財務狀況。在大數據時代,隨著信息技術快速發展,機器學習及神經網絡算法在處理大量復雜數據方面展現出較大的優勢,能夠取得較好的預測效果。以往在預測模型選擇時,基本選擇了Logistic回歸分析、SVM及BP神經網絡,忽略了本身存在的易陷入局部最優及預測精度低等問題。所以本文引入了動態遞歸類Elman神經網絡,并利用TSO算法優化Elman神經網絡,大幅度提高了Elman神經網絡的預測精度,本文提出的TSO-Elman模型可作為財務困境預警的一種可行方法。
1? 算法分析
1.1? PCA算法
主成分分析PCA算法是一種常用的非監督降維算法,其核心思想是,在損失較小的前提下,將數據集從高緯空間轉換到低緯空間,即將n維特征映射到k維,這k維全新的正交特征被稱為主成分,其計算步驟如下:
1)構建樣本矩陣X={x1, x2, x3,…, xn},其中n表示樣本的列數,即矩陣的維度;
2)構建協方矩陣:;
3)計算協方矩陣的特征值λ和特征向量ω;
6)提取k各主成分,實現將n維數據轉換到k維,實現主成分提取。
1.2? Elman神經網絡
Elman神經網絡在傳統神經網絡中增加了接收隱含層反饋信息的承接層,用來存前一時刻的輸出值[10],提高了對過去數據的敏感度,同時也增加了Elman神經網絡對數據的動態計算能力,Elman的結構如圖1所示,由于各層使用的激活函數不同,所有其輸出值的數學模型如式(2)所示:
其中x(k)和xc(k)表示隱含層和承接層在時間上的輸出向量。y(k)表示輸出向量,α1、α2、α3表示權重,b1、b2表示隱含層和輸出層的閾值。
1.3? TSO算法
海洋中的金槍魚,為了高效快速地捕獲到獵物,通過選擇螺旋覓食或拋物線覓食,成為海洋中的捕食能手,TSO算法是模擬金槍魚覓食行為的一種新型智能優化算法。
1.3.1? 螺旋覓食
金槍魚在捕食的過程中,金槍魚可以隨時調整自己的方向,從而形成緊密的螺旋結構來追逐周圍的獵物,同時,最優個體在追逐獵物的過程中可與魚群交互信息,實現信息的共享[11],其金槍魚螺旋覓食的位置更新如式(3)所示:
1.3.2? 拋物線覓食
金槍魚覓食的第二種策略是拋物線覓食,金槍魚除了螺旋覓食外,還以食物為參照點形成拋物線形的形式覓食,同時金槍魚也可以在自己周圍尋找食物進行覓食假設在概率50%的情況下兩種方式同時執行,其數據模型如式(6)所示:
1.4? MOTSO-Elman 模型
Elman神經網絡是一種動態反饋遞歸神經網絡,具有較強的非線性擬合能力及泛化能力,但由于采用梯度下降法,易陷入局部最優導致預測精度較低,所以本文利用TSO算法來優化Elman神經網絡的權值及閾值,建立TSO-Elman模型,其具體的處理流程如圖2所示。
Step1:導入構建的財務困境數據集;
Step2:初始化金槍魚算法的各參數,包括種群規模、迭代次數、變量最大值、變量最小值、種群初始位置等;
Step3:以預測錯誤率(1-正確率)作為適應度函數,根據每條金槍魚的位置計算適應度值;
Step4:更新參數α1、α2及p;
Step5:根據式(6)、式(7)更新個體位置;
Step6:迭代計算,返回步驟3重新計算適應度;
Step7:判斷TSO算法是否滿足終止條件,如果滿足則結束迭代,輸出最優個體位置和對應的適應度值,否則轉入Step3;
Step8:采用Step6輸出值作為Elman神經網絡的初始閾值及權值,構建Elman神經網絡,計算TSO-Elman的預測結果;
Step9:根據預測結果,計算該模型對應的準確率、第I類錯誤率及第II類錯誤率。
2? 實驗結果及對比討論
2.1? 數據準備
2.1.1? 實驗環境
本文采用Windows 10(64 bit)操作系統,500 GB固態
硬盤,同時以Matlab R2020b作為仿真軟件,實現TSO-Elman模型及各對比模型的測試。
2.1.2? 評價指標
本文采用分類準確率Accuracy、第I類錯誤率及第II類錯誤率三個指標來評估分類模型,其三個指標的數學表達分別如式(8~10)所示:
其中,TP表示財務正常的上市公司被正確分類的數量,TN表示出現財務困境的ST上市公司被正確分類的數量,FP表示ST上市公司被劃分為正常公司的數量,FN表示財務正常的上市公司被分為ST公司的數量。
2.1.3? 參數設計
在TSO算法中,金槍魚的種群數量NP=30,最大迭代次數tmax=50,金槍魚在初始階段跟隨最佳個體及前一個個體移動的權重系數=0.7。
在Elman算法中,隱含層使用tansig(x)=2/(1+exp(-2x))-1作為激活函數,輸出層使用purelin(x)=x作為激活函數,最大訓練次數epochs=100,誤差目標goal=0.000 1,學習率lr=0.1。
2.1.4? 實驗數據預處理
本文在Choice金融終端獲取了2020年全部A股財務數據,共4 524家上市公司的123項財務指標數據,若該上市公司2018與2019年的財務凈利潤均小于0,則2020年該上市公可能存在財務困境,被判定為ST公司,用類別“1”表示,否則,判定為非ST公司,用類別“0”表示。
2.1.4.1? z分數去異常值
本文通過Z分數(Z-score)計算每個財務數據偏離其對應平均數的距離,若距離大于3,則認為是異常值,直接刪除,其計算公式如式(11)所示:
其中,X表示原始財務數據, 表示每一個財務指標對應的平均數,s表示標準差。
2.1.4.2? 多重插補法處理缺失值
對于缺失較多的財務數據,直接刪除該財務指標,對于缺失的個別財務數據,通過多重插補法進行插補,該方法利用模擬成m個完全數據集作為缺失值的替代值,缺失數據將用馬爾科夫鏈蒙特卡洛MCMC(Markov Chain Monte Carlo Simulation)進行填補。
2.1.4.3? PCA降維
本文通過PCA方法將高緯度數據投影到較低維空間,從而降低數據集的復雜度,提高預測的準確率。通過PCA算法,按累計貢獻率92%從87個財務指標中篩出9個重要指標。
2.1.4.4? 構建樣本集
本文隨機選擇了314家(包括157家ST股及非157家非ST股)上市公司的9個財務指標作為最終的樣本集,以80%作為訓練集,剩余20%作為測試集。
2.2? 實驗結果及對比分析
2.2.1? 模型適應度分析
在TSO算法中,選擇金槍魚的規模為30,迭代次數也設置了30,以錯誤率作為適應度函數,分別提取了第1次、第10次、第20次及第30次每條金槍魚的適應度值,其結果如圖3所示,通過分析圖3發現,在每次迭代的過程中,隨著TSO算法螺旋覓食跟拋物線覓食策略不斷更新金槍魚的位置,使其錯誤率不斷減小,另外對比第1次、第10次、20次及30次誤差,發現隨著不斷循環迭代,其每次迭代的誤差也逐漸縮小,TSO模型逐漸篩選出最優個體作為Elman算法的初始閾值及權值。
2.2.2? 模型預測結果分析
本文隨機選擇了20%數據集作為測試集,共63家上市公司,其中30家公司財務正常,33家公司因連續兩年虧損變為ST股。使用TSO-Elman模型對63家公司財務狀況進行了預測,其中財務正常的公司有33家,ST股上市公司有29家。經統計發現,在預測的63家公司中,57家上市公司的財務狀況與實際的財務狀況一致,該模型的預測準確率為90.32%,其具體的預測結構如表1所示。
2.2.3? 模型對比分析
本文選擇了RBF、BP、SVM及Elman模型來對比分析TSO-Elman模型,對各模型分別進行10次預測,并對預測結果取其均值,最后分別計算出各模型的準確率、第I類及第II類錯誤率,結果如表2所示。
經計算,TSO-Elman模型的準確率為90.32%,第I類錯誤率為3.45%,第II類錯誤率為15.15%,比單純使用Elman算法的準確率提高了4.16%,第I類及第II類錯誤分別降低了6.23%及1.52%。相比RBF算法,準確率提高了18.89%,第I類及第II類錯誤分別降低了10.84%及20.56%,TSO-Elman模型其準確率明顯高于其他模型,第I類及II類錯誤率低于其他模型,由此可知,本文提出的模型能夠較準確地預警企業的財務狀況,使企業經營者能盡早甄別問題、解決問題。
3? 結? 論
本文以2020年A股上市公司的財務數據作為研究對象,利用Z分數及多重插補法對數據的異常值、缺失值進行了清洗,提高了數據的質量,針對高緯度數據集,通過PCA算法來降低數據集的復雜度,利用TSO-Elman模型以251家上市公司的財務數據為訓練集,對63家公司的財務狀況進行測,得到了較好的預測效果,同時利用RBF、BP、SVM等多個模型對TSO-Elman模型進行對比分析,進一步證明了該模型在財務困境預警中的可靠性和有效性,是企業應對或規避財務風險的一種有效方法。
參考文獻:
[1] 張愛云.新冠疫情視域下山東中小企業財務困境預警研究 [J].現代商業,2022(22):53-56.
[2] ELHOSENY M,METAWA N,SZTANO G,et al. Deep Learning-Based Model for Financial Distress Prediction [J].Annals of Operations Research,2022:21-23.
[3] 郭小敏.基于Logit模型的上市公司財務困境預測研究 [J].經貿實踐,2018(8):54-55.
[4] ALTMAN E I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy [J].Journal of Finance,1968,23(4):589-609.
[5] MARTIN D. Early Warnings of Bank Failure: A Logit Regression Approach [J].Journal of Banking & Finance,1977,1(3):249-276.
[6] BENES J,KUMHOF M,LAXTON D. Financial Crises in DSGE Models: A prototype Model [J].IMF Working Paper,2014,14(57):1-1.
[7] 石先兵.基于PCA-SVM的企業財務危機預警模型構建 [J].財會通訊,2020(10):131-134.
[8] 游旺,李文沛,胡泰山,等.基于改進Elman神經網絡的電纜早期故障分類識別方法 [J].電工技術,2022(5):154-158+161.
[9] 胡丹,楊書恒.基于改進金槍魚算法優化ELM模型的光伏功率預測 [J].武漢理工大學學報,2022,44(8):97-104.
[10] ZHU C S,KANG L H,FENG W F. Predicting Stock Closing Price with Stock Network Public Opinion Based on AdaBoost-AAFSA-Elman Model and CEEMDAN Algorithm [J].Journal of Shanghai Jiaotong University:Science,2021:1-13.
[11] CONCHON S,DECLERCK D,ZA?DI F. Parameterized Model Checking on the TSO Weak Memory Model [J].Journal of Automated Reasoning,2020,64(7):1307-1330.
作者簡介:康亮河(1987—),女,漢族,甘肅會寧人,助教,碩士,研究方向:人工智能算法研究;趙正強(1999—),男,漢族,甘肅慶陽人,本科在讀,研究方向:數據挖掘;萬君(2000—),女,漢族,甘肅酒泉人,本科在讀,研究方向:機器學習;王劍恩(2002—),男,漢族,甘肅平涼人,本科在讀,研究方向:機器學習;王博(2001—),男,漢族,甘肅天水人,本科在讀,研究方向:機器學習。