





摘 要:財(cái)務(wù)困境預(yù)警是通過(guò)監(jiān)測(cè)和分析企業(yè)的財(cái)務(wù)狀況,及時(shí)發(fā)現(xiàn)潛在的財(cái)務(wù)風(fēng)險(xiǎn),從而為決策者提供及時(shí)的警示,以便采取預(yù)防或緩解措施,避免或減輕可能的經(jīng)濟(jì)損失。本文構(gòu)建了一種基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)網(wǎng)絡(luò),將來(lái)自上市公司的資產(chǎn)負(fù)債表、利潤(rùn)表、現(xiàn)金流量表和股票交易等不同來(lái)源的411個(gè)指標(biāo)進(jìn)行深度融合與壓縮,用于財(cái)務(wù)困境預(yù)警。與5種經(jīng)典機(jī)器學(xué)習(xí)算法在準(zhǔn)確率、精準(zhǔn)率、召回率、特異度和f1得分等五個(gè)評(píng)估指標(biāo)的對(duì)比結(jié)果顯示出本文提出的財(cái)務(wù)困境預(yù)警模型有明顯的優(yōu)勢(shì)。
關(guān)鍵詞:財(cái)務(wù)困境;卷積神經(jīng)網(wǎng)絡(luò);多源異構(gòu)數(shù)據(jù)
一、引言
21世紀(jì)是市場(chǎng)經(jīng)濟(jì)飛速發(fā)展的一個(gè)時(shí)期,中國(guó)經(jīng)濟(jì)保持快速增長(zhǎng)的態(tài)勢(shì),各上市公司間的競(jìng)爭(zhēng)也越發(fā)激烈。上市公司的正常運(yùn)轉(zhuǎn),無(wú)論是對(duì)企業(yè)、投資者還是政府而言都極其重要。如何準(zhǔn)確地對(duì)上市公司財(cái)務(wù)困境進(jìn)行預(yù)警,在風(fēng)險(xiǎn)來(lái)臨之前進(jìn)行提示,從而便于上市公司采取有效措施,避免企業(yè)出現(xiàn)財(cái)務(wù)風(fēng)險(xiǎn),成為上市公司的經(jīng)營(yíng)者、投資者和管理者最為關(guān)心的課題之一。
自FitzPatrick(1932)首次研究財(cái)務(wù)困境預(yù)測(cè)模型以來(lái)[1],上市公司財(cái)務(wù)困境預(yù)警一直都是一個(gè)熱門的研究領(lǐng)域。下面從問(wèn)題界定、影響因素和模型三個(gè)方面對(duì)國(guó)內(nèi)外相關(guān)研究進(jìn)行綜述。
財(cái)務(wù)困境的界定。在國(guó)內(nèi)外相關(guān)研究中,與“財(cái)務(wù)困境”類似概念還有“財(cái)務(wù)危機(jī)”“財(cái)務(wù)失敗”“財(cái)務(wù)惡化”和“財(cái)務(wù)風(fēng)險(xiǎn)”,它們的基本內(nèi)容相似,只是表達(dá)程度與側(cè)重點(diǎn)有所區(qū)別。國(guó)外學(xué)者一般將企業(yè)破產(chǎn)作為企業(yè)陷入財(cái)務(wù)困境的標(biāo)志[1~2]。因?yàn)槲覈?guó)的上市公司到目前為止還沒(méi)有出現(xiàn)過(guò)破產(chǎn)的案例,國(guó)內(nèi)學(xué)者在研究財(cái)務(wù)困境問(wèn)題時(shí),大都將上市公司因財(cái)務(wù)狀況異常而被宣布為ST作為財(cái)務(wù)困境的標(biāo)志[3~4],也有學(xué)者將財(cái)務(wù)困境劃分為不同的發(fā)展階段來(lái)進(jìn)行研究[5]。
財(cái)務(wù)困境預(yù)警指標(biāo)的選擇。在研究企業(yè)財(cái)務(wù)困境問(wèn)題時(shí),大部分研究都基于財(cái)務(wù)報(bào)表來(lái)選擇預(yù)警指標(biāo)。如:Beaver選取現(xiàn)金流/總負(fù)債指標(biāo)作為預(yù)警指標(biāo)[6];Altman,Haldeman和Narayanan選取凈資產(chǎn)收益率、利潤(rùn)穩(wěn)定性、利息保障倍數(shù)、留存收益/總資產(chǎn)、流動(dòng)比率、普通股收益/總資本建立ZETA模型取得了良好的預(yù)測(cè)效果[7];OhlSon選取總資產(chǎn)/物價(jià)指數(shù)、負(fù)債比率、營(yíng)運(yùn)資金/總資產(chǎn)、流動(dòng)比率、總資產(chǎn)報(bào)酬率、營(yíng)業(yè)現(xiàn)金流量/總資產(chǎn)結(jié)合三個(gè)虛擬變量(負(fù)債、稅后凈利和凈收入變動(dòng))構(gòu)建Logistic模型[8];周首華基于Z模型,考慮現(xiàn)金流量指標(biāo),構(gòu)建了F模型[9];王自強(qiáng)選擇了反映企業(yè)盈利能力、償債能力、成長(zhǎng)能力、擴(kuò)張能力以及運(yùn)營(yíng)能力的11個(gè)指標(biāo)構(gòu)建了綜合評(píng)價(jià)指標(biāo)體系,取得了較為理想的預(yù)測(cè)效果[10];方匡南選取了償債能力、成長(zhǎng)能力、分紅能力、收益質(zhì)量、現(xiàn)金流量、盈利能力、營(yíng)運(yùn)能力、資本結(jié)構(gòu)等共8組90個(gè)指標(biāo)構(gòu)建了SGL-SVM模型來(lái)進(jìn)行預(yù)測(cè)研究[11];宋宇利用反映償債能力、企業(yè)規(guī)模、盈利能力、經(jīng)營(yíng)能力、非財(cái)務(wù)因素以及宏觀環(huán)境的38個(gè)指標(biāo)構(gòu)建了Cox回歸模型[12]。也有學(xué)者認(rèn)為非財(cái)務(wù)因素,如公司治理結(jié)構(gòu)、股權(quán)結(jié)構(gòu)、宏觀經(jīng)濟(jì)因素等,對(duì)企業(yè)財(cái)務(wù)狀況也存在顯著影響,因此在相關(guān)研究中納入了內(nèi)部經(jīng)營(yíng)管理、董事會(huì)結(jié)構(gòu)、股權(quán)集中度、經(jīng)濟(jì)增長(zhǎng)、信貸、利率、匯率、經(jīng)濟(jì)周期等因素分析企業(yè)財(cái)務(wù)困境問(wèn)題[13~15]。
財(cái)務(wù)困境預(yù)警模型。如前所述,關(guān)于財(cái)務(wù)困境模型的研究已取得了豐碩的成果。從最簡(jiǎn)單的單變量判別模型到多元判別模型[1]、多元回歸模型[2,16]、Logistic回歸[17~18],到貝葉斯決策模型、生存分析[19~20]等,再到機(jī)器學(xué)習(xí)與人工智能模型如神經(jīng)網(wǎng)絡(luò)[21~22]、支持向量機(jī)[23]、遺傳算法、專家系統(tǒng)等。
綜上所述,國(guó)內(nèi)外學(xué)者從20世紀(jì)30年代開始,在指標(biāo)選取、樣本選擇和模型構(gòu)建等方面,對(duì)企業(yè)財(cái)務(wù)困境問(wèn)題進(jìn)行了較為系統(tǒng)的研究,取得了大量的研究成果。同時(shí)也存在一些問(wèn)題,主要表現(xiàn)在:第一,變量選擇不夠全面、缺乏客觀依據(jù)。第二,對(duì)數(shù)據(jù)的時(shí)序特征重視不足。現(xiàn)有的大部分研究在構(gòu)建模型時(shí)只是使用了截面數(shù)據(jù),忽略了時(shí)間序列方面的特征。第三,數(shù)據(jù)來(lái)源較為單一。現(xiàn)有的財(cái)務(wù)困境研究大都基于企業(yè)財(cái)務(wù)報(bào)表這一單一數(shù)據(jù)來(lái)源進(jìn)行分析研究。第四,卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)等在金融數(shù)據(jù)分析中有成功應(yīng)用的方法[24],在財(cái)務(wù)困境分析中還不多見。
二、財(cái)務(wù)危機(jī)預(yù)警模型
本文開發(fā)的基于二維卷積神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)困境預(yù)警模型結(jié)構(gòu)如圖1所示。綜合利用上市公司的資產(chǎn)負(fù)債表、利潤(rùn)表、現(xiàn)金流量表、股票交易數(shù)據(jù)等多種來(lái)源數(shù)據(jù)。對(duì)每一來(lái)源的數(shù)據(jù)不做人工篩選,而是利用滑動(dòng)窗口和二維化技術(shù),形成多個(gè)通道的三維數(shù)組。利用卷積神經(jīng)網(wǎng)絡(luò)里的特點(diǎn),對(duì)輸入不同子網(wǎng)絡(luò)的三維數(shù)組進(jìn)行信息融合與特征提取,最終利用分類器網(wǎng)絡(luò)預(yù)測(cè)輸出預(yù)警狀態(tài)。
(一)數(shù)據(jù)預(yù)處理
在數(shù)據(jù)預(yù)處理階段主要是進(jìn)行滑動(dòng)窗口數(shù)據(jù)的標(biāo)準(zhǔn)化變換與二維化變換。股票交易數(shù)據(jù)和財(cái)務(wù)報(bào)表數(shù)據(jù)都具有時(shí)間序列的特性,即有一定的序列相關(guān)性。通常可以設(shè)置一個(gè)滑動(dòng)窗口寬度w,在t時(shí)刻選擇[Xt=xt-w+1,xt-w+2,...,xt]作為時(shí)刻的輸入特征。選取合適的滑動(dòng)時(shí)間窗口后,將數(shù)據(jù)在窗口內(nèi)進(jìn)行標(biāo)準(zhǔn)化處理,以消除不同變量量綱的影響。本文選擇最大最小標(biāo)準(zhǔn)化,計(jì)算公式如下:
這里[ε]是事先確定的常數(shù)(例如取1),是為了避免在滑動(dòng)窗口內(nèi),最大值與最小值相同,導(dǎo)致分母為零的情形。
進(jìn)行二維化變換的目的是形成三維數(shù)組,以充分利用二維卷積神經(jīng)網(wǎng)絡(luò)的信息融合與壓縮能力。假設(shè)t時(shí)刻數(shù)據(jù)來(lái)源1的指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后為[Xtk,k=1,2,...,N1]。此時(shí),初始化一個(gè)[n1×n1]零矩陣[Mt1],這里[n1-12<N1≤n21],按照一定的次序(比如隨機(jī)次序)將[Xtk]填入[Mt1],就完成了數(shù)據(jù)的二維化變換。若來(lái)源1的滑動(dòng)窗口寬度為[w1],則[Mt-w+11,...,Mt1]就是圖1中維度為的[w1×n1×n1]三維數(shù)組。
在t時(shí)刻,對(duì)每一來(lái)源的數(shù)據(jù),獨(dú)立進(jìn)行上述滑動(dòng)窗口內(nèi)的標(biāo)準(zhǔn)化和二維化變換,就完成了t時(shí)刻的數(shù)據(jù)預(yù)處理。
(二)卷積神經(jīng)網(wǎng)絡(luò)
二維卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種專門用于處理圖像數(shù)據(jù)的深度學(xué)習(xí)模型。一個(gè)典型的卷積神經(jīng)網(wǎng)絡(luò)通常由多個(gè)卷積層組成。單個(gè)卷積層依次通常由卷積函數(shù)、激活函數(shù)、池化函數(shù)依次構(gòu)成。卷積函數(shù)通過(guò)卷積核在圖像上的卷積運(yùn)算來(lái)提取圖像的局部特征。通過(guò)控制卷積核的大小和參數(shù),可以起到特征融合與壓縮的功能。激活函數(shù)通常在卷積函數(shù)之后,通過(guò)應(yīng)用非線性激活函數(shù)(如ReLU),可以提高模型的表達(dá)能力。池化函數(shù)主要用于減少特征圖的維度,從而減少計(jì)算量并提高模型的抽象表達(dá)能力,同時(shí)在一定程度上消除指標(biāo)間共線性的影響[25]。另外還可以在卷積函數(shù)之后使用BatchNorm正則化等函數(shù),歸一化輸入特征的分布,從而加快訓(xùn)練過(guò)程并提高模型穩(wěn)定性。
用于分類問(wèn)題的卷積神經(jīng)網(wǎng)絡(luò)最后一層是分類器網(wǎng)絡(luò),各個(gè)子網(wǎng)絡(luò)提取的特征會(huì)被展平拼接后傳遞到一個(gè)或多個(gè)全連接層,用于生成最終的預(yù)測(cè)結(jié)果。
三、財(cái)務(wù)危機(jī)預(yù)警模型實(shí)證研究
本文從不同來(lái)源獲取到實(shí)證數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,采用2種不同的卷積神經(jīng)網(wǎng)絡(luò)模型設(shè)置對(duì)上市公司財(cái)務(wù)危機(jī)進(jìn)行預(yù)測(cè),同時(shí)使用5種經(jīng)典機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比分析,采用預(yù)測(cè)的準(zhǔn)確率、精準(zhǔn)率、召回率、特異度和f1得分等評(píng)價(jià)指標(biāo)來(lái)對(duì)所有模型的預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比。
(一)研究樣本與數(shù)據(jù)的選取
1. 數(shù)據(jù)來(lái)源與選擇標(biāo)準(zhǔn)
本文數(shù)據(jù)來(lái)源于銳思金融數(shù)據(jù)庫(kù),以1990—2020年滬深A(yù)股的上市公司作為研究對(duì)象,將上市公司發(fā)生財(cái)務(wù)問(wèn)題被ST(Special Treatment),即被特別處理作為公司發(fā)生財(cái)務(wù)危機(jī)的標(biāo)志,由于上市公司一旦經(jīng)歷過(guò)首次被ST后,其再次發(fā)生財(cái)務(wù)危機(jī)或被*ST的概率會(huì)增大,因此本文只選用自公司上市以來(lái),首次被ST的上市公司作為財(cái)務(wù)危機(jī)樣本。
一家上市公司被判定為ST主要有以下這幾個(gè)方面:
(1)上市公司連續(xù)兩個(gè)會(huì)計(jì)年度的財(cái)務(wù)凈利潤(rùn)是負(fù)值;(2)上市公司在一個(gè)會(huì)計(jì)年度中每股凈資產(chǎn)要低于股票面值,這種情況下無(wú)需連續(xù)兩年;(3)注冊(cè)會(huì)計(jì)師對(duì)上市公司當(dāng)年一個(gè)會(huì)計(jì)年度的報(bào)告出具無(wú)法表示或否定意見的審計(jì)報(bào)告;(4)上市公司被中國(guó)證監(jiān)會(huì)或交易所判斷為財(cái)務(wù)異常。
2. 配對(duì)樣本的選擇
通過(guò)對(duì)銳思數(shù)據(jù)庫(kù)中上市公司數(shù)據(jù)進(jìn)行篩選,自1990年開始共有208個(gè)上市公司經(jīng)歷過(guò)首次被ST,借鑒同類文獻(xiàn)通常的做法,本文選用1:3的比例進(jìn)行正常上市公司的配對(duì)。
在選擇配對(duì)上市公司時(shí),本文遵循以下標(biāo)準(zhǔn):
(1)為了排除市場(chǎng)經(jīng)濟(jì)環(huán)境的影響,配對(duì)上市公司與發(fā)生財(cái)務(wù)危機(jī)的上市公司要屬于同一年份;(2)為了能獲得配對(duì)上市公司三年的數(shù)據(jù),配對(duì)上市公司需滿足已上市三年以上時(shí)間,且財(cái)務(wù)報(bào)表與股票數(shù)據(jù)沒(méi)有大量缺失值;(3)為了避免行業(yè)對(duì)上市公司的影響,配對(duì)上市公司與發(fā)生財(cái)務(wù)危機(jī)的上市公司所屬行業(yè)需相同;(4)為了增加樣本的可比性,配對(duì)上市公司與發(fā)生財(cái)務(wù)危機(jī)的上市公司資產(chǎn)規(guī)模需相同或相近;(5)當(dāng)以上兩個(gè)條件無(wú)法同時(shí)滿足時(shí),則配對(duì)上市公司從與發(fā)生財(cái)務(wù)危機(jī)的上市公司的其他相近行業(yè)中選擇資產(chǎn)規(guī)模相同或相近的上市公司。
3. 特征指標(biāo)的選取
資產(chǎn)負(fù)債表表示各會(huì)計(jì)期末公司的資產(chǎn)、負(fù)債和業(yè)主權(quán)益的狀況,遵守了會(huì)計(jì)平衡原則,即資產(chǎn)=負(fù)債+所有者權(quán)益,其指標(biāo)可以反映公司整體的經(jīng)營(yíng)狀況,是財(cái)務(wù)報(bào)表中的核心內(nèi)容。資產(chǎn)負(fù)債表可以分為資產(chǎn)、負(fù)債、所有者權(quán)益這三個(gè)方面。在資產(chǎn)負(fù)債表中本文共選取了155個(gè)指標(biāo)。
利潤(rùn)表表示各會(huì)計(jì)期末公司的收入、費(fèi)用和利潤(rùn)的狀況,其指標(biāo)可以反映公司經(jīng)營(yíng)資金流動(dòng)的狀況,稱之為資本市場(chǎng)表。從利潤(rùn)表中,可以看出資產(chǎn)負(fù)債表的資產(chǎn)和負(fù)債結(jié)構(gòu)的好壞。利潤(rùn)表指標(biāo)可以分為營(yíng)業(yè)總收入、營(yíng)業(yè)支出、營(yíng)業(yè)利潤(rùn)、利潤(rùn)總額、凈利潤(rùn)、其他綜合收益等幾個(gè)方面。在利潤(rùn)表中本文共選取了99個(gè)指標(biāo)。
現(xiàn)金流量表表示各會(huì)計(jì)期末公司的現(xiàn)金變動(dòng)情況,其指標(biāo)主要體現(xiàn)的是資產(chǎn)負(fù)債表中的各類別指標(biāo)對(duì)公司現(xiàn)金流動(dòng)的影響,通過(guò)分析可以知曉公司在短時(shí)間內(nèi)有無(wú)充足的資金去應(yīng)對(duì)支出,評(píng)價(jià)公司的短期生存能力,揭示內(nèi)在發(fā)展問(wèn)題。現(xiàn)金流量表指標(biāo)可以分為經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量、投資活動(dòng)產(chǎn)生的現(xiàn)金流量和籌資活動(dòng)產(chǎn)生的現(xiàn)金流量等幾個(gè)方面。在現(xiàn)金流量表中本文共選取了112個(gè)指標(biāo)。
在股票交易數(shù)據(jù)中本文共選取了收盤價(jià)、成交量、流通股周換手率、流通股平均日換手率、每股營(yíng)業(yè)利潤(rùn)和每股營(yíng)業(yè)收入等45個(gè)指標(biāo)。
4. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理主要包括缺失值異常值的處理、訓(xùn)練樣本不平衡的處理以及滑動(dòng)窗口數(shù)據(jù)變換。
(1)樣本缺失值異常值的處理。對(duì)于缺失值,一般可以用所在列的“平均值”“中位數(shù)”“眾數(shù)”進(jìn)行填補(bǔ),也可以對(duì)缺失數(shù)據(jù)進(jìn)行整行刪除。但由于本文是以深度學(xué)習(xí)算法進(jìn)行建模,是在大數(shù)據(jù)的基礎(chǔ)上進(jìn)行建模,如果樣本量過(guò)少,會(huì)造成模型精度的降低,所以對(duì)于缺失值,本文沒(méi)有進(jìn)行刪除,而是以樣本均值對(duì)缺失值進(jìn)行填補(bǔ)。
(2)訓(xùn)練樣本不平衡的處理。使用python中的imblearn模塊,利用其over_sampling子模塊中的SMOTE類完成算法,實(shí)現(xiàn)對(duì)不平衡樣本的處理。算法中,k_neighbors參數(shù)是選擇的近鄰個(gè)數(shù),默認(rèn)的個(gè)數(shù)為5個(gè),m_neighbors參數(shù)是從近鄰樣本中挑選的隨機(jī)樣本個(gè)數(shù),默認(rèn)的個(gè)數(shù)為10個(gè)。
(3)滑動(dòng)窗口寬度設(shè)置。由于股票交易數(shù)據(jù)、資產(chǎn)負(fù)債表、利潤(rùn)表、現(xiàn)金流量表的變量特征數(shù)分別為45、155、99、112,因此t時(shí)刻的數(shù)據(jù),按照不同來(lái)源轉(zhuǎn)化為[7×7,13×13,10×10,11×11] 的格式。通過(guò)對(duì)股票數(shù)據(jù)和財(cái)務(wù)報(bào)表不同滑動(dòng)時(shí)間窗口組合的嘗試,本文選取模型效果最優(yōu)的組合為:股票數(shù)據(jù)的滑動(dòng)時(shí)間窗口寬度為12,即三個(gè)月;財(cái)務(wù)報(bào)表的滑動(dòng)時(shí)間窗口寬度為8,即兩年。因此每一子網(wǎng)絡(luò)輸入的數(shù)據(jù)分別為[12×7×7,8×13×13,8×10×10,8×11×11]的三維數(shù)組。
5. 網(wǎng)絡(luò)結(jié)構(gòu)與訓(xùn)練參數(shù)設(shè)定
本文構(gòu)造的財(cái)務(wù)預(yù)警網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)見表1所示,子網(wǎng)絡(luò)1-3的輸入分別是三個(gè)財(cái)務(wù)表的滑動(dòng)窗口數(shù)據(jù),采用相同的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù);子網(wǎng)絡(luò)4的輸入是股票交易的滑動(dòng)窗口數(shù)據(jù),第一層的輸入通道數(shù)與其他子網(wǎng)絡(luò)不同。分類器網(wǎng)絡(luò)是三層的全連接網(wǎng)絡(luò)。
(二)評(píng)估指標(biāo)
本研究使用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、特異度(Specificity)和[f1]分?jǐn)?shù)來(lái)評(píng)估對(duì)比不同模型的性能表現(xiàn),計(jì)算公式如下:
這里,TP(True Positive)表示模型將正類別的樣本正確預(yù)測(cè)為正類別的樣本數(shù)量,F(xiàn)P(False Positive)表示模型將負(fù)類別的樣本錯(cuò)誤預(yù)測(cè)為正類別的樣本數(shù)量,TN(True Negative)表示模型將負(fù)類別的樣本正確預(yù)測(cè)為負(fù)類別的樣本數(shù)量,F(xiàn)N(False Negative)表示模型將正類別的樣本錯(cuò)誤預(yù)測(cè)為負(fù)類別的樣本數(shù)量。
(三)模型訓(xùn)練與結(jié)果分析
1. 模型訓(xùn)練參數(shù)設(shè)置
在實(shí)證中,為了對(duì)比股票交易數(shù)據(jù)在預(yù)警模型中的作用,本文采用兩種不同的輸入數(shù)據(jù)來(lái)源設(shè)置,用CNN1表示只使用財(cái)務(wù)報(bào)表數(shù)據(jù)的預(yù)警模型,CNN2表示同時(shí)輸入財(cái)務(wù)報(bào)表數(shù)據(jù)和股票交易數(shù)據(jù)的模型。在模型訓(xùn)練時(shí),模型優(yōu)化方式設(shè)置為Adam方法,學(xué)習(xí)率設(shè)置為0.0002,batch_size設(shè)為32,epochs設(shè)為200。
邏輯回歸模型使用L2懲罰,參數(shù)C設(shè)置為0.01;支持向量機(jī)模型參數(shù)C設(shè)置為0.8,gamma設(shè)置為0.001;決策樹模型max_depth設(shè)置為4,max_leaf_nodes設(shè)置為500;隨機(jī)森林模型n_estimators設(shè)置為100,max_depth設(shè)置為2;AdaBoost模型n_estimators設(shè)置為60,learning_rate設(shè)置為0.1。
2. 結(jié)果分析
考慮到我國(guó)上市公司中,正常公司的數(shù)量要遠(yuǎn)遠(yuǎn)大于被ST的公司數(shù)量,巨大的樣本差異會(huì)使分類樣本數(shù)據(jù)非平衡化。針對(duì)不平衡數(shù)據(jù),本文使用兩種不同的處理思路進(jìn)行了實(shí)證分析。
首先,使用各個(gè)模型自帶的權(quán)重平衡參數(shù)設(shè)置,不對(duì)數(shù)據(jù)做額外平衡處理。機(jī)器學(xué)習(xí)模型設(shè)置參數(shù)class_weight='balanced',CNN1和CNN2模型損失函數(shù)的weight參數(shù)。從表2的預(yù)測(cè)結(jié)果對(duì)比可以看出,使用股票交易指標(biāo)可以大幅度提高預(yù)警模型的準(zhǔn)確率、精確率、召回率、特異度和f1得分。在所有模型的比較中,除了精確率指標(biāo)外,CNN2都是表現(xiàn)最優(yōu)的模型(AdaBoost模型全部預(yù)測(cè)為沒(méi)有發(fā)生財(cái)務(wù)困境,直接淘汰)。
其次,使用處理不平衡數(shù)據(jù)集的常用方法SMOTE算法。使用python中的imblearn模塊,利用其over_sampling子模塊中的SMOTE類完成算法。在此算法中,k_neighbors參數(shù)是選擇的近鄰個(gè)數(shù),默認(rèn)的個(gè)數(shù)為5個(gè),m_neighbors參數(shù)是從近鄰樣本中挑選的隨機(jī)樣本個(gè)數(shù),默認(rèn)的個(gè)數(shù)為10個(gè)。從表3所示的對(duì)比結(jié)果可以看出,使用SMOTE算法平衡處理后的數(shù)據(jù),對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,均能大幅度提升模型的各個(gè)評(píng)估指標(biāo)表現(xiàn)。在所有模型中表現(xiàn)最好的是支持向量機(jī)。
綜合對(duì)比兩種不同場(chǎng)景下的測(cè)試結(jié)果,可以看出使用原始數(shù)據(jù)訓(xùn)練的CNN2模型具有最高的召回率和f1分?jǐn)?shù),同時(shí)準(zhǔn)確率、特異度與表3的最優(yōu)算法相差不大。考慮到SMOTE算法有可能引入額外噪聲信息,綜合來(lái)看,在進(jìn)行上市公司財(cái)務(wù)困境預(yù)警時(shí)應(yīng)當(dāng)優(yōu)先使用CNN2模型。
四、總結(jié)
針對(duì)上市公司財(cái)務(wù)困境預(yù)警,本文提出了一種數(shù)據(jù)預(yù)處理方法和二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。對(duì)不同來(lái)源的數(shù)據(jù)指標(biāo),通過(guò)滑動(dòng)窗口內(nèi)的標(biāo)準(zhǔn)化和二維化變換進(jìn)行預(yù)處理,之后輸入不同的二維卷積子網(wǎng)絡(luò)完成特征提取和壓縮融合,最終使用分類器網(wǎng)絡(luò)輸出預(yù)測(cè)結(jié)果。實(shí)證結(jié)果顯示出股票交易指標(biāo)對(duì)財(cái)務(wù)困境預(yù)警有明顯的輔助作用,同時(shí)本文提出的財(cái)務(wù)困境預(yù)警模型對(duì)比傳統(tǒng)機(jī)器學(xué)習(xí)算法具有明顯的優(yōu)勢(shì)。
參考文獻(xiàn):
[1] FITZPATRICK P J. A Comparison of the Ratios of Successful Industrial Enterprises with those of Failed Firms[J].Certified Public Accountant, 1932,2(2):589-731.
[2] ALTMAN E I. Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,23(4):589-609.
[3] 李萬(wàn)福,林東杰,林斌.內(nèi)部控制能有效規(guī)避財(cái)務(wù)困境嗎?[J].財(cái)經(jīng)研究,2012,38(1):124-134.
[4] 戚家勇,蔡永斌.房地產(chǎn)上市公司財(cái)務(wù)風(fēng)險(xiǎn)評(píng)價(jià)研究[J].財(cái)會(huì)通訊,2018(26):114-118.
[5] 呂長(zhǎng)江,趙巖.上市公司財(cái)務(wù)狀況分類研究[J].會(huì)計(jì)研究,2004(11):53-61+97.
[6] BEAVER W H.Financial Ratios as Predictors of Failure[J].Empirical Research in Accounting: Selected Studies,1967,1(1):71-111.
[7] ALTMAN E I,HALDEMAN R,NARAYANAN P.Zrta Analysis: a New Model to Identify Bankruptcy Risk of Corporations[J].Journal of Banking & Finance,1977.
[8] OHLSON J A.Financial Ratios and the Probabilistic Prediction of Bankruptcy[J].Journal of Accounting Research,1980,18(1):109-131.
[9] 周首華,王平,楊濟(jì)華.論財(cái)務(wù)危機(jī)的預(yù)警分析——F分?jǐn)?shù)模式[J].會(huì)計(jì)研究,1996(8):8-11.
[10] 王自強(qiáng),陳旭,范貽昌.基于可拓方法的ST公司財(cái)務(wù)危機(jī)預(yù)警模型研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006(8):44-51.
[11] 方匡南,楊陽(yáng).SGL-SVM方法研究及其在財(cái)務(wù)困境預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)研究,2018,35(8):104-115.
[12] 宋宇,李鴻禧,秦學(xué)志.基于Cox回歸的中小企業(yè)財(cái)務(wù)預(yù)警模型及實(shí)證[J].管理現(xiàn)代化,2019,39(1):108-110.
[13] 姜秀華,孫錚.治理弱化與財(cái)務(wù)危機(jī): 一個(gè)預(yù)測(cè)模型[J].南開管理評(píng)論,2001(5):19-25.
[14] 王克敏,羅艷梅.中國(guó)上市公司對(duì)外擔(dān)保與財(cái)務(wù)困境研究[J].吉林大學(xué)社會(huì)科學(xué)學(xué)報(bào),2006(5):106-113.
[15] 黃曉波,王慧.從公司治理視角看農(nóng)業(yè)上市公司財(cái)務(wù)風(fēng)險(xiǎn)[J].財(cái)會(huì)月刊,2017(2):47-54.
[16] 陳靜.上市公司財(cái)務(wù)惡化預(yù)測(cè)的實(shí)證分析[J].會(huì)計(jì)研究,1999(4):32-39.
[17] 鮮文鐸,向銳.基于混合Logit模型的財(cái)務(wù)困境預(yù)測(cè)研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2007(9):68-76.
[18] 梁琪,石寧,過(guò)新偉.基于隨機(jī)效應(yīng)logistic模型的中小企業(yè)財(cái)務(wù)失敗預(yù)警研究[J].管理工程學(xué)報(bào),2014,28(3):126-134.
[19] LANE W R,LOONEY S W,WANSLEY J W.An Application of the Cox Proportional Hazards Model to Bank Failure[J].Journal of Banking & Finance,1986,10(4):511-531.
[20] 陸志明,姜麗莉,何建敏.基于生存分析模型的企業(yè)財(cái)務(wù)困境預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2007(21):174-176.
[21] 楊淑娥,黃禮.基于BP神經(jīng)網(wǎng)絡(luò)的上市公司財(cái)務(wù)預(yù)警模型[J].系統(tǒng)工程理論與實(shí)踐,2005(1):12-18+26.
[22] 龐清樂(lè),劉新允.基于蟻群神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)危機(jī)預(yù)警方法[J].數(shù)理統(tǒng)計(jì)與管理,2011,30(3):554-561.
[23] 朱發(fā)根,傅毓維,劉拓.基于非線性SVM的上市公司財(cái)務(wù)危機(jī)預(yù)警模型研究[J].統(tǒng)計(jì)與信息論壇,2009,24(6):49-53.
[24] 麻斯亮,魏福義.人工智能技術(shù)在金融領(lǐng)域的應(yīng)用: 主要難點(diǎn)與對(duì)策建議[J].南方金融,2018(3):78-84.
[25] 袁銘陽(yáng),周長(zhǎng)勝,黃宏博,等.卷積神經(jīng)網(wǎng)絡(luò)池化方法綜述[J].Software Engineering and Applications,2020(9):360.
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金項(xiàng)目資助“基于人工智能與多源異構(gòu)數(shù)據(jù)的上市公司財(cái)務(wù)困境預(yù)警研究”(19BTJ030)
作者簡(jiǎn)介:張志剛(1975— ),男,河北保定人,湖北經(jīng)濟(jì)學(xué)院教授,博士,研究方向?yàn)闄C(jī)器學(xué)習(xí)、深度學(xué)習(xí)、應(yīng)用統(tǒng)計(jì);張耀峰(1979— ),男,河北承德人,湖北經(jīng)濟(jì)學(xué)院教授,博士,研究方向?yàn)榇髷?shù)據(jù)技術(shù)及應(yīng)用、社會(huì)計(jì)算。
湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào)·人文社科版2024年10期