譚本艷 袁神鵬



【摘 要】 債務違約會對企業的正常生產經營帶來嚴重的負面影響。文章以我國2012—2021年上市公司的財務數據和非財務數據共38個指標作為研究對象,首先查詢企業的債務訴訟和信用債違約情況以確定企業是否債務違約,采用XGboost機器學習算法構建企業債務違約風險預警模型,實證結果顯示,基于XGboost所構建的企業債務違約風險預警模型具有較好的預警效果。其次,將XGboost訓練模型與決策樹、隨機森林、LightGBM、GBDT、Adaboost等多種機器學習模型進行穩健性比較,結果表明,XGboost模型在AUC、準確率、精確率、召回率、F1值等各項性能指標上均優于對比模型。再次,分別引入SHAP映射圖和SHAP力圖對模型進行了全局性和局部性解釋,發現影響企業債務違約風險的因素不僅僅局限于企業的財務狀況,企業的股權結構、公司治理也是重要影響因素,對企業開展債務違約風險控制具有指導意義。最后,給企業提出了相關的建議。
【關鍵詞】 上市公司; 債務違約; XGboost; SHAP解釋方法; 機器學習
【中圖分類號】 F275? 【文獻標識碼】 A? 【文章編號】 1004-5937(2023)19-0074-08
一、引言
黨的二十大報告指出,要強化金融穩定保障體系,依法將各類金融活動全部納入監管,守住不發生系統性風險底線。企業債務是金融穩定保障體系的重要組成部分,需要納入金融監管。現代市場經濟體制下,企業須通過長期負債和短期負債等方式滿足其日常經營活動及戰略發展。債務違約受企業融資行為的影響,權衡理論認為企業存在最優資本結構,合理的負債水平和結構能發揮稅盾效應,促進企業持續健康發展,而過度的負債可能使企業陷入財務困境,因此當資本結構偏離最優水平時企業應主動調整。然而,近年來我國企業債務違約事件不斷發生,2014年“11超日債”違約成為我國首例債券違約事件,2021年恒大商票暴雷事件更是引起廣泛關注。債務違約不僅對企業生產經營產生嚴重影響,而且存在行業內的溢出效應,嚴重制約企業的創新投資[ 1 ],甚至將風險外溢到金融系統[ 2 ]。因此,研究企業的違約特征并對其進行預警分析具有重要的現實意義。
學術界對企業債務違約的影響因素展開了一系列研究。委托代理理論指出,由于存在道德風險和信息不對稱,不同利益主體的利益訴求影響企業的融資決策,進而影響企業的債務違約風險。(1)大多數研究視角主要集中在企業內部經營管理方面,如管理層行為[ 3 ]、財務信息披露質量[ 4 ]、內部控制[ 5 ]、企業戰略[ 6 ]等。(2)也有部分學者從企業外部環境方面展開研究,如公司債信用利差[ 7 ]、貿易政策不確定性[ 8 ]、貨幣政策不確定性[ 9 ]、金融周期[ 10 ]等。從主流研究方法看,現有研究絕大多數采用計量模型,主要遵循在提出研究假設的基礎上進行線性回歸驗證的研究范式。
由于計量模型嚴苛的適用條件和計量精度遠遠不如機器學習模型,且影響債務違約的因素較多又相互關聯,一些學者開始采用機器學習模型展開研究。(1)在企業破產風險預測方面,Li等[ 11 ]通過對比回歸樹(CART)、支持向量機、K近鄰等模型得出回歸樹模型的預測效果最好。(2)在財務困境預測方面,方匡南和楊陽[ 12 ]發現SGL-SVM模型的預測精度優于SVM模型和Logistic模型,閆達文等[ 13 ]運用邏輯回歸發現混頻數據較同頻更能提高模型準確度,呂喜梅等[ 14 ]認為非監督機器學習模型LDA能顯著提升預測效果。(3)在企業違約風險預測方面,林宇等[ 15 ]發現Twin-SVR模型的預測性能比傳統的SVR、BPNN以及Logistic更優,章彤和遲國泰[ 16 ]通過比較K近鄰、支持向量機等模型,發現基于最優信用特征組合角度建立的模型判別精度更高,王玉龍等[ 17 ]比較SVM、RF和邏輯回歸等多種機器學習模型發現RF模型預測效果最佳。這些學者的研究傾向于提高模型的準確度。
需要說明的是,盡管機器學習模型的預測精度優于計量模型,不同機器學習模型的預測效果也不同,但其算法的黑盒特征卻往往缺乏可解釋性。因此,有學者在關注提高模型準確度的基礎上,在機器學習模型中引入SHAP可解釋性的方法,進而尋找到影響模型的核心特征及其影響方式[ 18 ]。本文除了運用機器學習模型預測企業債務違約外,還側重于尋找關鍵違約特征,并利用SHAP可解釋性方法對核心違約特征做出合理解釋,為企業可能的債務違約提供預警。
本文的差異化貢獻在于:第一,運用機器學習對企業債務違約問題進行探討,引入機器學習可解釋性模型是用于解決實際情況中對準確性與可解釋性的共同需求。第二,相比此前企業債務違約風險預測中使用的邏輯回歸和各類統計檢驗方法,本研究基于機器學習模型的SHAP方法探究影響企業違約的核心指標,為后續的指標研究提供了新的可能。第三,大多數學者僅考慮財務指標,本文將公司治理等因素納入考慮范圍,分析并定量比較影響企業違約的重要特征,并且對重要特征的作用進行了詳細解讀,對防范企業違約風險具有一定意義。
二、研究設計
(一)樣本選擇與數據來源
將上市公司財務和非財務相關的38個指標作為輸入特征,上市公司債務違約二分類標簽作為輸出變量,選取2012—2021年我國A股上市公司的數據為初始研究樣本,最后得到15 872個公司年度觀察值。數據來源于Wind數據庫、國泰安(CSMAR)數據庫和同花順數據庫等。
(二)研究變量
1.債務違約變量(Vio)
借鑒陳婧等[ 19 ]的研究,結合Wind和CSMAR數據庫中2012—2021年A股上市公司披露的訴訟仲裁數據,做如下處理:(1)根據案件類型,篩選出“借款糾紛”“貸款糾紛”“借貸糾紛”“欠款糾紛”“金融借款糾紛”“票據糾紛”“債務糾紛”“債權債務糾紛”的樣本。(2)剔除本公司作為原告和被告但被駁回的樣本。(3)剔除本公司作為擔保方(非第一被告)而只需承擔連帶擔保責任的樣本。(4)剔除被告為本公司母公司、參股公司或其他大股東的樣本。結合企業信用債違約的相關數據,數據來源于同花順數據庫。由于數據遺漏問題,違約樣本有所刪減,最終得到公司年度債務違約樣本421條。
2.其他變量
參考現有債務違約文獻,選取的公司財務指標見表1。
除了表1中的財務指標外,還選取了企業規模(Size)、管理層持股比例(Ms)、債權人—股東代理成本(Agen1)、財務困境(ZScore)、審計意見類型(Opin)、獨立董事比例(Indp)、股權制衡度(Z)、股權集中度(Top1)、融資約束(SA)、金融資產持有比例(Fin)等涉及企業股權結構、公司治理的18個非財務指標,財務指標和非財務指標合計38個。
(三)模型說明
用XGboost作為基礎模型,并對其進行訓練和比較,以上市公司是否債務違約的二分類狀態(取值分別為0、1)作為輸出標簽。極端梯度提升(XGboost,eXtreme Gradient Boosting)是陳天奇于2016年提出的CART決策樹的提升算法,是一種基于Boosting思想的模型。XGboost訓練過程的核心在于不斷地添加樹,其中每添加一棵樹,本質是學習一個新函數,擬合上次預測的殘差。基于該模型,主要按照以下步驟進行:
第一,將全樣本按照8:2的比例劃分為訓練集和測試集,在訓練集中通過參數調整來優化預警效果,并將測試集數據代入訓練好的模型中,評估模型效果。由測試集的預測結果可計算模型的AUC、準確率、精確率、召回率和F1值。
第二,探究各個特征對債務違約的相對重要性。對于XGboost模型,決策樹深度(max_depth)和學習器數量(n_estimators)這兩個超參數對模型的運算影響重大,也是重點調整的對象。在訓練集上通過網格搜索得到最優參數。樣本不平衡會嚴重影響模型的效果,因此在模型訓練過程中提升違約樣本的權重(scale_pos_weight=37),使違約樣本和非違約樣本被賦予同樣的重要度。基于XGboost得到每個特征的重要性得分,可以計算模型中各特征對模型分類的相對重要性,并從中總結出對上市公司債務違約預測能力較強的特征。
第三,為了增強模型的可解釋性,引入特征重要性(Feature importance)、SHAP力圖(SHAP force plot)等可解釋工具,旨在構建一個包含全局和局部解釋方法的綜合解釋框架來對“黑盒模型”的內在影響機理進行解釋。
第四,對實證結論進行穩健性檢驗,更換機器學習算法如決策樹、隨機森林、LightGBM、GBDT與Adaboost,更換樣本不平衡處理方法以及特征重要性排序方法。
三、實證檢驗與結果分析
(一)模型效果評估
采用AUC、Accuracy、Precision、Recall和F1 Score等指標分別衡量模型的準確性(表2)。根據模型預測結果,AUC的值為0.958,較高的AUC為判斷企業債務違約風險提供了參考,可以幫助企業和其他利益相關方及早做出風險預警并采取對策;召回率Recall為86%,意味著違約的樣本中有86%的樣本被模型預測準確;精確度Precision為85.1%,意味著預測正確未違約的樣本占全部未違約樣本的85.1%,體現了模型在預測正確少數違約樣本的同時并沒有誤傷太多未違約樣本。可見采用的XGboost模型預測效果較好。
(二)模型的特征重要性
鑒于機器學習算法“黑箱”特質,利用Lundberg于2017年提出的SHAP(SHapley Additive exPlanations)可解釋工具對模型進行解釋。SHAP可解釋工具的作用是測度機器學習模型的輸入特征對模型輸出標簽的邊際貢獻,對模型影響最大的前10個特征的SHAP值摘要如圖1所示。
圖1中,指標在樣本點上的取值大小采用不同顏色來表示,以深色顯示的樣本點代表指標在該樣本上取值較高,淺色取值較低。以SHAP值取0為中間分界線,對于處在左側的樣本點,該特征對應樣本點的SHAP值為負,特征取定該樣本點對應值時對企業債務違約有負向貢獻,處在右側樣本點則有正向貢獻。因此,對輸出違約概率有正向貢獻的線性關聯指標,圖像總體上表現為左淺右深,負向貢獻的指標則表現為左深右淺。
從模型訓練集的SHAP值摘要圖可得,對模型貢獻最大的分別為:營業凈利率(X14)、總營業成本率(X17)、管理層持股比例(Ms)、債權人—股東代理成本(Agen1)、財務困境(ZScore)等。其中管理層持股比例(Ms)、總資產增長率(X12)等較為顯著地呈現偏負向關聯指標,取值越高企業債務違約概率越低,而總營業成本率(X17)、債權人—股東代理成本(Agen1)等較為顯著地呈現偏正向關聯指標,取值越高企業債務違約概率越高。
(三)模型的局部解釋
隨機選擇訓練集中1個未違約樣本和1個違約樣本,用SHAP力圖(SHAP force plot)對單個樣本進行局部解釋,如圖2所示,其中上面為未違約樣本,下面為違約樣本。(1)最上面的橫軸坐標表示所有樣本SHAP值的可能取值區間,基準值(base value)為所有樣本SHAP值的均值。(2)特征名稱后的數值為該樣本某特征的實際值。(3)灰黑區域表示該樣本某特征SHAP值的正負和大小,灰(黑)色對應SHAP值的正(負),寬(窄)對應SHAP值的大(小)。(4)灰黑區域相鄰處的數字-5.45和7.92分別表示該樣本被預測為違約的SHAP輸出值。
將上述未違約樣本和違約樣本的SHAP輸出值-5.45和7.92通過sigmoid函數轉換可以得到其最終輸出違約概率為0.43%和99.96%,和實際情況相符。此外,從圖2中違約樣本的SHAP力圖可以看出:(1)首先營業凈利率(X14)是對預警邊際貢獻最大的特征,其次是非標準無保留意見(Opin=1)、總營業成本率(X17)、債權人—股東代理成本(Agen1)和財務困境(ZScore)等,最終所有的特征共同影響該樣本的違約風險判別。(2)由于灰色特征表示對SHAP的影響為正,黑色特征表示影響為負,可見該樣本公司在營業凈利率(X14)、非標準無保留意見(Opin=1)、總營業成本率(X17)、債權人—股東代理成本(Agen1)以及財務困境(ZScore)等特征上的表現不佳,更容易導致該公司債務違約,相反該樣本公司的托賓Q值(Tq)表現優良,降低了該公司債務違約的風險。
四、核心指標違約影響能力分析
上面模型的特征重要性分析找出了對企業債務違約最具影響的特征,下面分析這些特征對債務違約的具體影響,以強化模型的可解釋性。
(一)財務指標分析
1.總營業成本率(X17)、營業凈利率(X14)
總營業成本率和營業凈利率都是反映企業盈利能力的指標,也是對模型貢獻最大的兩個財務指標。如圖3,總營業成本率以1為界限,總營業成本率大于1意味著企業的總收入無法覆蓋總成本,此時對應的SHAP大于0,這將提高企業債務違約概率。營業凈利率以0為界限,當營業凈利率小于0說明企業處于虧損狀態,對應的SHAP大于0,此時將提高企業債務違約概率。這意味著,企業控制成本、保持適當的利潤有利于降低企業債務違約概率。
2.總資產增長率(X12)
總資產增長率能夠反映企業所處的生命周期。如圖4,當總資產增長率大于0.1時,SHAP小于0,此時將降低企業債務違約概率,總資產增長率較高可能意味著企業處于成長期,成長期的企業投入產出處于良好的正循環,市場份額不斷擴大,資金周轉良好,債務違約的可能性較小。當總資產增長率小于-0.05時,SHAP大于0,將提高企業違約概率,總資產萎縮過快可能意味著企業處于衰退期,企業市場份額縮小,產品競爭力減弱,盈利能力下滑,如果不能扭轉危局最終將導致破產。這意味著,企業應該尋找并且把握投資機會,進行適當規模的投資和擴張有利于降低企業債務違約概率。
3.長期資本負債率(X6)
合理的負債可以加速企業發展,提高資產報酬率,但不合理的負債可能會加重企業的財務負擔。如圖5,當企業的長期資本負債率小于0.35、SHAP值小于0,此時將降低企業債務違約概率。當長期負債比率處于(0.35,0.63)時,雖然SHAP值大于0,提高了企業違約的概率,但是SHAP無明顯趨勢變化,此時企業需要關注自身債務狀況,控制財務風險。當負債比率大于0.63時,企業一定要警惕財務風險,必要時去杠桿、降風險。這意味著,企業需要在動態調整中保持最佳資本結構。
(二)非財務指標分析
1.管理層持股比例(Ms)
根據委托代理理論,高管持股可以使股東和代理人之間的利益趨于一致,有助于降低代理成本。如圖6,當管理層持股小于0.01、SHAP大于0,此時將提高企業違約的概率。如果管理層持股比例過低,管理層的“欲望”得不到滿足可能會尋找其他途徑彌補,甚至損害企業和股東的利益。當管理層持股比例大于0.16時,SHAP值小于0且絕對值增大,此時將顯著降低企業違約的概率。管理層持股比例高可能意味著大股東直接參與公司經營管理,此時大股東與企業利益趨于一致。這意味著,股東應該給予管理層適當的“權力”,或者直接參與公司經營管理,實現企業和自身利益最大化。
2.債權人—股東代理成本(Agen1)
如圖7,債權人—股東代理成本是通過企業的利息費用除以有息負債得出的,當企業的利息費用超過有息負債的10%、SHAP大于0,此時企業的資金成本過高,將提高企業違約的概率,債權人可能嚴格審核向企業的借款,或者要求更高的風險溢價,加劇企業和債權人的矛盾。這意味著,企業只有保持良好的發展和健康的財務狀況,才能降低從外界獲取資金的成本,減少債權人與企業的矛盾。
3.股權制衡度(Z)
股權結構方面,學術界已經探討股權結構對企業治理的影響,如提高股權集中度能抑制盈余操縱行為[ 20 ],將股權結構與企業生命周期相聯系,發現高股權集中度會提升處于成長期企業的治理效果[ 21 ]。如圖8,當股權制衡度小于0.3時,將降低企業違約的概率。當股權制衡度大于1.8時,SHAP大于0,將提高違約的概率。股權制衡度過高可能導致企業決策效率低下,錯失投資機會,尤其是處于衰退期的企業如果錯失轉型機會,甚至可能導致破產重組。這意味著,企業需要根據自身情況找到最佳股權結構,不能因為“內斗”影響企業經營發展。
五、穩健性檢驗
(一)更換機器學習方法
為了驗證上述XGboost模型得出的效果穩健性,引入了決策樹(Decision Tree)、隨機森林(Random Forest)、LightGBM(Light Gradient Boosting Machine)、GBDT(Gradient Boosting Decision Tree)和Adaboost(Adaptive Boosting)五種模型作為對比(見表3)。
從測試集效果對比而言,除了決策樹的AUC值低于0.9外,其余各類集成學習模型具有較高精度,且其AUC值基本在0.95以上,其他評估指標Recall、Precision、Accuracy、F1 Score等總體表現良好,這說明采取的機器學習方法具有較強的穩健性。
(二)更換樣本不平衡處理方法及特征重要性排序
1.更換樣本不平衡處理方法
數據中違約樣本僅僅占總量的2.65%,屬于典型的不平衡樣本,上文采用提高少數類樣本的權重方法來處理不平衡樣本。此處,采用Chawla于2002年提出的基于虛擬樣本合成的過采樣方法(Synthetic Minority Over-sampling Technique,SMOTE)處理不平衡樣本。如表4,過采樣后模型的整體效果得到較大提升,AUC提升了4.1%,所有指標準確率均超過90%,Recall提升了13.7%,達到99.7%,說明模型對違約樣本預測準確,同時Precision達到94.4%,說明模型較少將未違約的樣本預測錯誤,表明預測模型的穩健性。
2.特征重要性排序
為進一步說明XGboost模型條件下,哪些特征對預測結果的貢獻度更大,將過采樣后的樣本通過XGboost的特征重要性(feature importance)得到各個特征的重要性得分,和上文SHAP摘要圖比較,有6個特征重合,前10個特征重要性可達63.32%。限于篇幅,具體結果在此不再贅述。可見,XGboost模型的特征重要性排序具有穩健性。
六、結論與建議
(一)研究結論
基于38個財務和非財務指標,借助XGboost算法構建了企業債務違約預警模型,采用SHAP解釋方法在機器學習模型基礎上挖掘重要指標,并且對重要指標作用原理進行解讀。得出以下結論:(1)XGboost機器學習模型能夠較為準確地預測企業債務違約。(2)通過SHAP可解釋工具對模型進行分析,發現總營業成本率、營業凈利率、管理層持股、總資產增長率和債權人—股東代理成本等是影響企業債務違約的主要因素。
(二)政策建議
第一,總營業成本率、營業凈利率、總資產增長率等財務指標能夠反映企業的盈利能力和發展能力,從其對企業違約的預警來看,一般是由于經營不善、產品缺乏競爭力以及沒有更好的投資機會等原因導致企業盈利不足,發展受阻,企業的財務狀況持續惡化。因此,企業應該將資源和精力投入到主營業務,努力提高自身產品的競爭力和市場份額,同時積極調整企業戰略,尋找新的投資機會和利潤增長點,甚至可以構建企業自身的“護城河”。
第二,長期資本負債率、債權人—股東代理成本等指標能夠反映企業的償債能力和大體的財務狀況,從其對企業違約的作用方向來看,一般是由于企業的負債規模龐大、結構不合理,導致資金成本過高、流動性不足。因此,企業應當在追求最優資本結構的同時,警惕過于激進的融資策略,在確保不發生債務違約、不加劇財務風險的前提下,適度發揮財務杠桿的效用,保持企業財務平穩運行。
第三,管理層持股比例、股權制衡度等能反映企業股東和管理層、大股東和中小股東之間的代理成本,從他們對企業經營管理的影響來看,無股權激勵的管理層可能從企業的其他方面來彌補自身欲望,如要求更高的貨幣薪酬。而股權過于集中可能導致大股東掏空上市公司而無人制約的情況,股權過于分散則可能導致相互制衡,股東間利益糾紛不斷,影響決策效率。因此,適當給予管理層股權激勵能夠緩解股東和管理層的代理成本,適當的股權制衡也能夠抑制大股東“壕溝防御”。
【參考文獻】
[1] 張瑋倩,方軍雄.債務違約溢出效應對企業創新投資的影響研究[J].證券市場導報,2019(9):31-40.
[2] 張慶君,馬紅亮.上市公司債務違約對商業銀行的風險溢出效應研究[J].安徽師范大學學報(人文社會科學版),2021,49(1):117-126.
[3] 姜付秀,張敏,陸正飛,等.管理者過度自信、企業擴張與財務困境[J].經濟研究,2009,44(1):131-143.
[4] 吳建華,張穎,王新軍.信息披露扭曲下企業債券違約風險量化研究[J].數理統計與管理,2017,36(1):175-190.
[5] 李萌,王近.內部控制質量與企業債務違約風險[J].國際金融研究,2020(8):77-86.
[6] 劉海明,步曉寧.民營企業債務違約是內因驅動嗎:基于短貸長投和多元化經營視角的分析[J].金融研究,2022(3):79-95.
[7] DAVID A.Inflation uncertainty,asset valuations,and the credit spreads puzzle[J].The Review of Financial Studies,2008,21(6):2487-2534.
[8] 李梓旗,于雙麗,喬桂明.貿易政策不確定性、企業現金持有水平與債務違約風險:來自滬深A股上市公司的經驗證據[J].山西財經大學學報,2023,45(1):115-126.
[9] 王博,李力,郝大鵬.貨幣政策不確定性、違約風險與宏觀經濟波動[J].經濟研究,2019,54(3):119-134.
[10] 羅朝陽,李雪松.金融周期、全要素生產率與債券違約[J].經濟管理,2020,42(2):5-22.
[11] LI H,SUN J,WU J.Predicting business failure using classification and regression tree:an empirical comparison with popular classical statistical methods and top classification mining methods[J].Expert Systems with Applications,2010,37(8):5895-5904.
[12] 方匡南,楊陽.SGL-SVM方法研究及其在財務困境預測中的應用[J].統計研究,2018,35(8):104-115.
[13] 閆達文,李存,遲國泰.基于混頻數據的中國上市公司財務困境動態預測研究[J/OL].中國管理科學,2022-11-17.
[14] 呂喜梅,蔣翠清,丁勇,等.融合臨時報告軟信息的新三板企業財務困境預測研究[J/OL].中國管理科學,2022-11-17.
[15] 林宇,吳慶賀,李昊,等.基于Twin-SVR的公司違約風險預測研究[J].管理評論,2019,31(11):33-43.
[16] 章彤,遲國泰.基于最優信用特征組合的違約判別模型:以中國A股上市公司為例[J].系統工程理論與實踐,2020,40(10):2546-2562.
[17] 王玉龍,周榴,張滌霏.企業債務違約風險預測:基于機器學習的視角[J].財政科學,2022(6):62-74.
[18] 雷欣南,林樂凡,肖斌卿,等.小微企業違約特征再探索:基于SHAP解釋方法的機器學習模型[J/OL].中國管理科學,2022-11-17.
[19] 陳婧,張金丹,方軍雄.公司債務違約風險影響審計收費嗎[J].財貿經濟,2018,39(5):71-87.
[20] 郝穎.股權結構對盈余管理的治理效應:基于內部控制質量視角[J].會計之友,2022(10):2-9.
[21] DRIFFIELD N,MAHAMBARE V,PAL S.How does ownership structure affect capital structure and firm value?Recent evidence from East Asia[J].Economics of Transition,2007,15(3):535-573.