


摘要:識別面臨財務困境的公司對于維護投資者信心、防范金融風險至關重要。為此,提出了一種新的Attention-LSTM-MOWOA模型,該模型在LSTM模型中集成了注意力機制和多目標鯨魚優化算法(MOWOA)。與依賴單目標鯨魚算法的傳統模型相比,模型結合了非優勢集和擁擠距離計算,最終在鯨魚算法中形成了一個更復雜的多目標優化框架。這一改進使分類器能夠敏銳地識別輸入序列中的關鍵數據并確定其優先級,從而生成帕累托解決方案集。
關鍵詞:財務困境預測;注意力機制;長短期記憶神經網絡;多目標鯨魚優化算法
一、前言
當前因財務困境導致企業經營出現問題甚至破產的案例不斷增多。上市公司出現財務危機,不僅會給財務投資方、債權人和投資者帶來巨大的投資風險,而且會產生一系列連鎖反應,使得證券市場的規范化和上市公司的治理能力備受質疑。對上市公司開展財務風險預警研究,有助于及時規避投資風險,保護各利益相關方權益,對于重塑投資者信心具有積極作用。肖毅等[1]認為所謂的財務困境(或財務危機),是指企業受復雜多變的外部環境影響或內部經營不善而導致的財務狀況的惡化,無力償還到期債務和當前股利等情形。
20世紀90年代后,機器學習技術已成為財務困境預測領域的主導方法。然而,盡管出版的相關論文數量巨大,數據不平衡仍然是當前研究的焦點和挑戰[2]。數據分類不平衡是一種普遍存在的現象。不平衡數據是響應變量的分布在不同類別之間差異很大的數據集。樣本較少的響應變量稱為正樣本或少數樣本,而樣本較多的響應變量稱為負樣本或多數樣本。特別是在財務困境預測領域,與沒有面臨財務困境(NFD)的公司相比,經歷財務困境(FD)的公司比例要小得多。何雯雯[3]指出,當數據集中NFD與FD公司的比例超過4:1(即80%NFD和20%FD)時,模型的預測性能會下降。在真實的數據集中,面臨財務困境的公司比例往往不超過5%~10%,加劇了問題的嚴重性。不平衡問題的主要特點是當少數樣本數量極小時,分類器無法學習少數樣本的所有特征[3]。在少數群體至關重要的情況下,這個問題的重要性尤其明顯。研究人員普遍承認,將陷入財務困境的公司錯誤地歸類為健全的公司,可能比錯誤地將健康的公司視為陷入財務困境的公司造成更有害的后果[4]。例如,當金融機構使用預測模型評估貸款申請人時,正確識別面臨財務困境的公司至關重要。如果不這樣做,可能會導致向瀕臨破產的公司提供貸款。相反,將健康的公司錯誤地歸類為陷入困境的公司可能會剝奪它們重要的財務資源。雖然這可能會導致決策不理想,但通常比向陷入困境的公司提供貸款的危害要小,后者可能會造成重大財務損失并導致更廣泛的經濟不穩定。因此,提高機器學習模型對不平衡數據分類的分析和理解既有理論意義又有實用價值。
二、相關研究綜述
隨著計算機技術的進步和發展,神經網絡和支持向量機逐漸應用于財務困境預測[5-6]。從此,財務困境預測研究開辟了新的研究方向。朱曉謙等[7]在土耳其商業銀行數據上采用了一種新穎的加權功能邊際分類器集合,與傳統模型相比,成功提高了區分健康銀行和不健康銀行的預測準確性。王建飛等[8]提出了一種獨特的基于雙聚類和集成技術的破產預測模型,該模型通過識別特定的企業組和相關變量來改進對各種破產情況的預測。
除了卷積神經網絡(CNN)之外,循環神經網絡(RNN)也被進一步用于財務困境預測[9]。長短記憶網絡(LSTM)是最典型的循環神經網絡架構之一。Huang使用CNN和LSTM算法從中國企業年報中提取文本情緒,發現結合審計報告中的情緒可以顯著提高模型預測財務困境的能力。方匡南等探索了RNN和LSTM算法在企業破產預測中的使用。他們的結果表明這些方法超越了傳統技術。
最近引入的注意力機制作為一種確定上下文敏感表示的新穎方法,能夠利用有限的注意力資源從大量數據中快速提取關鍵信息,特別是在小樣本環境中。如今,Attention-LSTM廣泛應用于財務困境預測。雖然LSTM擅長學習冗長的序列數據樣本,但其學習能力在涉及更多特征變量和有限數據集容量的預測任務中受到一定限制。
因此,本文結合注意力機制,為輸入特征分配不同的注意力權重,構建Attention-LSTM模型。并評估其在不同失衡比例下的預測性能。
至于模型優化,受自然啟發的元啟發式算法已成為一種有前途的訓練途徑。這些算法受到自然現象和生物過程的啟發,顯示出有效導航神經網絡權重和偏差搜索空間的潛力。例如,飛蛾火焰優化(MFO)算法模擬自然界飛蛾的導航行為。然而,上述提到的元啟發法調整的超參數通常涉及群體大小和迭代次數。相反,鯨魚優化算法(WOA)提供了特定超參數設置的優勢。
因此,本研究借鑒以上研究思路,利用多目標鯨魚優化算法來優化Attention-LSTM的模型結構,更加關注少數樣本的分類情況,提高模型對少數樣本的分類能力。
三、理論模型
伴隨著大數據技術以及機器學習的演變,從1980年開始,基于群體智能的優化算法,如GA算法、PSO算法、SA算法、蟻群算法、差分進化算法等方法,由于其求解的高效性,以及求解復雜非線性問題的有效性,受到了學者的廣泛研究。然而,目前研究采用的一般都是單一目標優化方法,但企業財務困境預測往往面臨著數據極不平衡的處境,因此尤其需要關注對少數類樣本的分類情況。本文通過引入非支配集、層次劃分和擁擠度排序的方法,改進傳統的鯨魚優化算法,使之可以處理多目標優化的問題。然后通過構建可以有效針對少數類樣本的優化函數,提高模型對少數類的分類能力。
LSTM加入了門控機制,以此來控制信息的去留,具有適合處理和預測時間序列中時間跨度較大的事件的能力,近年來被大量研究者用來預測股價走勢。LSTM擁有三個門,分別是遺忘門(forget gate)、更新門(update gate)和輸出門(output gate)。遺忘門通過sigmoid來控制,它會根據上一時刻的輸出和當前輸入來產生一個介于0~1的值,以此來決定是否讓上一時刻學到的信息保留或者部分保留。公式如下:
(1)
其中,ft的取值范圍是0~1,取值越小遺忘越多,反之則越少。ht-1是t-1時刻的輸出,xt是t時刻本層的輸入,Wf是各變量的權重,bf是偏置項,σ是sigmoid函數。
更新門由sigmoid層和tanh層兩個部分來共同作用,以此來控制細胞保留下來的信息。公式如下:
(2)
(3)
(4)
其中,it介于0~1之間,tanh是雙曲正切激勵函數,Ct-1是t-1時刻的細胞狀態值。
輸出門首先通過sigmoid層輸出一個初始結果,然后用tanh將Ct值縮放到-1~1,再與sigmoid得到的輸出結果依次相乘,最終給出輸出結果。公式如下:
(5)
(6)
與傳統的RNN相比,LSTM有效地解決了時間序列數據中長期依賴關系的難題,因此特別適合處理具有復雜時間關系的樣本。在訓練模型的過程中,本研究發現增加參數的數量可以提高模型的表達能力,增強其存儲信息的能力。然而,這種增強帶來了新的挑戰:信息超載的風險。為了應對這一挑戰,Attention-LSTM 模型將注意力機制引入LSTM中。這種整合旨在更有選擇性地分配計算資源,在有限容量的限制下,重點關注數據中相關性較高的部分。在實際應用中,軟注意力可以通過從整個數據集學習來計算每個數據點的權重。因此,本文在整個研究中采用了軟注意力的概念。
鯨魚優化算法的迭代過程為:
(7)
每次迭代通過不同的隨機概率p和收斂因子A的大小來確定不同的搜尋最優解的策略,大幅提高了算法的局部尋優能力。
本研究通過引入非支配集和層次劃分,將每次迭代產生的非支配解劃分在非劣勢集里,其余解全部劃分在劣勢集里,進而通過擁擠度排序,來確定最符合研究目標的帕累托最優解。擁擠度排序的過程為:
(8)
其中,D(i)表示第i個個體的擁擠程度,fj(i+1)和fj(i-1)分別是第i+1個和第i-1個個體的目標函數值。
四、實驗結果
本文在幾個基準數據集上進行了實驗,并對結果進行了詳細分析。所報告的結果是10次實驗的平均值和標準偏差。本研究深入研究了每個指標的變化,以全面了解不同模型在不同不平衡比率下的性能。
本小節將介紹UCI數據集的實驗結果。UCI數據集包括一個我國臺灣省的公司的數據集和五個波蘭公司的數據集。我國臺灣省的公司的數據集包括6819個樣本和96個財務輸入屬性。其中,6599個樣本被歸類為NFD,其余220個樣本被歸類為FD。波蘭公司數據集包含5個不同年份的數據,有64個輸入財務屬性。
圖1展示了每個模型在不同不平衡比下的召回率??梢钥闯?,在30組實驗中,Attention-LSTM-MOWOA在28組實驗中獲得了最高的召回率,高達93.3%。隨著不平衡比的增加,本研究模型在召回率方面表現出更明顯的優勢,尤其是當不平衡比為1:15和1:20時。本研究中觀察到的明顯改善可歸因于多目標鯨魚優化算法的使用,它使模型能夠將更多的注意力分配給少數類別。因此,這種改進提高了不平衡數據的分類性能。此外,在27組對比實驗中,Attention-LSTM的表現也優于LSTM,占總數的90%,表明注意力機制顯著提高了召回率。
對于F1分數,隨著不平衡率的增加,各模型的性能都有所下降,雖然在不同的實驗條件下,Attention-LSTM-MOWOA和Attention-LSTM-WOA的F1分數很接近,但本研究的模型總體表現最好。此外,Attention-LSTM和LSTM 之間也存在同樣的規律性。由此可見,MOWOA和注意力機制可以很好地提高模型的F1得分率。
在24組對比實驗中,Attention-LSTM-MOWOA的精度最高,達到了80%。雖然每個模型的精確度都會隨著不平衡比例的增加而降低,但包含注意力機制的模型的精確度降低得更慢,表明它們對數據不平衡的抵抗力更強。
AUC值是評價分類模型性能的重要標準,尤其是在正負樣本不平衡的情況下。研究結果發現隨著不平衡率的增加,AUC率總體上保持穩定,并沒有受到很大影響,與研究者的認識是一致的。但是,本研究的模型的AUC值具有明顯的優勢,表明區分正樣本和負樣本的能力更強,性能更優越。
總之,本研究提出的模型在分類能力方面優于所比較的Attention-LSTM-WOA、Attention-LSTM和LSTM模型,尤其是在少數樣本方面,表明MOWOA與注意力機制的整合在增強模型分類能力方面非常有效。
五、結語
本研究提出了一種可以關注少數群體的模型,即Attention-LSTM-MOWOA。通過建立多目標鯨魚優化算法,并將其集成到Attention-LSTM 框架中,然后通過非優勢集和擁擠距離計算生成帕累托解決方案集。這一改進使分類器能夠識別輸入序列中的關鍵數據并對其進行優先排序。結果表明,本研究提出的模型具有跨地域的有效性,在對少數群體樣本進行分類時表現良好。在未來的研究中,將主要開發能夠有效處理混合頻率數據的模型,這些數據既包括宏觀層面的政策信息,也包括詳細的微觀層面的企業數據。此外,還將關注多源異構數據的整合。
參考文獻
[1]肖毅,熊凱倫,張希.基于TEI@I方法論的企業財務風險預警模型研究[J].管理評論,2020,32(07):226-235.
[2]王昱,楊珊珊.考慮多維效率的上市公司財務困境預警研究[J].中國管理科學,2021,29(02):32-41.
[3]何雯雯.基于不平衡數據的增量LSTM動態財務困境預測[D].成都:西南財經大學,2023.
[4]王凱欣.基于Lasso-Logistic模型的上市企業財務困境預測研究[D].大連:大連理工大學,2020.
[5]張杰童.上市公司財務困境的預測研究[D].上海:東華大學,2023.
[6]閆達文,李存,遲國泰.基于混頻數據的中國上市公司財務困境動態預測研究[J].中國管理科學,2024,32(01):1-12.
[7]孫灝,朱曉謙,李建平.考慮財務報告中文本風險信息的財務困境預測[J].系統管理學報,2022,31(06):1204-1215.
[8]王建飛.基于圖表示學習的新三板企業財務困境預測研究[D].合肥:合肥工業大學,2023.
[9]袁先智,周云鵬,嚴誠幸,等.財務欺詐風險特征篩選框架的建立和應用[J].中國管理科學,2022,30(03):43-54.
作者單位:首都經濟貿易大學
■ 責任編輯:張津平 尚丹