江海潮,劉一達
(湖南科技大學 商學院,湖南 湘潭 411201)
自2007年中國證券監督管理委員會頒布實施《公司債券發行試點辦法》以來,中國公司債券市場迅速發展。截至2021 年末,中國債券市場上存有公司債券10 302 只,票面總額達9.3 萬億元,占債券市場的7.19%。與此同時,公司債券違約風險明顯增加。根據中國債券信息網披露,不僅民企債券不時發生違約,國企債券也發生過違約,我國債券剛性兌付被打破。僅2021 年,中國公司信用類債券違約金額達854.6 億元,債券違約率為0.95%①數據來源:中央國債登記結算有限責任公司中債研發中心《2021年債券市場分析研究報告》。。因此,結合公司債券信用風險確定不同信用公司債券價格特別是不同信用債券的利差,是識別公司債券風險、保護公司與投資者利益、促進我國債券市場平穩可持續發展的核心課題。
信用利差一般被認為是投資者對違約風險高于無風險利率水平補充的利差,即投資者風險補償。理論上講,不同的信用債券有不同的信用利差補償,不少學者展開了深入研究,探討公司債券信用利差決定因素。早期Merton(1974)[1]利用Black-Scholes(1973)期權定價理論,構建了結構化模型,發現企業資產價值波動、杠桿率、資產負債率等因素均會影響公司債券信用利差,但該模型通常會低估債券信用利差[2]。此后,諸多學者在Merton模型基礎上引入信用風險、利率、所有權結構等因素,以拓展公司債券信用利差解釋能力,進一步發現債券信用利差受公司杠桿率[1]、信用評級[3-4]、產權性質[5]、所有權結構[6]等復雜因素非對稱影響。一些關于我國的經驗研究表明,我國債券具有信用差異性[3][7],信用評級影響債券融資成本[4][7],產生債券信用利差[8-10],并發現債券信用利差由眾多復雜因素決定[5][7][9-12]。陶雄華等(2020)[10]指出了信用風險對債券信用利差的具體貢獻,但沒有系統地討論主要因素對公司債券信用利差的具體貢獻,而且主要采用計量模型方法確定因素的影響效應。趙靜和方兆本(2011)[13]對我國公司債券信用利差影響因素做出過結構化分析。因此,我國公司債券信用利差影響因素有哪些,如何測度因素的信用利差貢獻,各因素的信用利差貢獻有多大仍需要深入探討。為此,本文在已有研究基礎上,以我國上市公司二級市場公司債券為研究對象,運用多種機器學習方法,測度各因素影響公司債券信用利差的SHAP值,進而確定各因素的影響貢獻。
與以往的研究相比,本文的貢獻主要有兩點。第一,與已有研究不同的是,使用多種機器學習方法對影響公司債券利差各主要因素進行學習訓練,極大提高了模型對公司債券信用利差的預測能力與結論的穩健性。第二,創新地使用SHAP方法識別公司債券信用利差影響因素貢獻率,發現了公司債券信用利差影響因素多樣性、不同信用公司債券主要影響因素存在信用異質性。此外,本研究還為債券投資者進行債券投資的決策、識別債券風險、選擇信用利差影響因子提供了相關的參考。
公司債券信用利差影響因素十分復雜。早期Fisher(1959)[14]思考債券定價因素,試圖揭示債券價格差異內在原因。其后Merton(1974)[1]利用Black-Scholes的期權定價理論,提出了結構化模型,分析公司債券定價,拓展了公司債券利差內在決定因素研究。后續研究一是沿著債券微觀個性因素展開研究,發現債券期限、債券發行量、票息利率、債券人保護性條款、債券桿杠比率等因素非對稱影響公司債券利差[8],但Emo等(2004)[15]認為僅僅考慮債券個性影響因素對公司債券信用利差的解釋能力相當有限。二是思考債券信用利差市場決定因素。何平和金夢(2010)[4]、陳關亭等(2021)[7]發現市場債券信用評級對債券發行成本具有重要影響力,進而影響不同信用債券利差。王安興等(2012)[16]通過時間序列回歸分析發現公司債券利差變化受市場投資換手率、月交易天數比例等市場因素的影響。三是關注公司層面因素。方紅星等(2013)[5]發現公司產權結構可能是影響債券利差因素之一,有證據表明國有產權通過直接和間接作用途徑降低投資者面臨的違約風險,從而使公司債券獲得較低的信用利差。Boubakri和Ghouma(2010)[6]發現跨國公司股權結構影響債券利差,因為跨國公司股權集中度被債券持有人和評級機構視為違約風險信號,股權越集中違約風險就越高,進而要求提高債券的信用利差。凌愛凡和謝林利(2023)[12]基于Merton 違約模型,把公司權益極端尾部風險與公司債券信用利差的理論相聯系,實證了公司杠桿率是極端尾部風險影響公司債券信用利差的重要渠道,公司杠桿率與公司債券信用利差具有正相關關系。趙靜和方兆本(2011)[13]認為公司股票波動率、流動性指標、公司杠桿比率、行業類別及市場系統性風險這些影響因素對公司債券信用利差有較好的解釋力。近幾年,隨著股權質押這種新的融資方式的發展成熟,許多學者也研究了股權質押對公司價值和公司融資成本的影響。史永東等(2021)[17]發現公司控股股東股權質押顯著提高了發債企業二級市場信用利差,這種現象在控制權轉移風險較高的企業中表現得更加明顯。四是研究了公司債券信用利差宏觀影響因素。國內外許多學者將利率期限結構、GDP增長率、宏觀經濟波動、貨幣增速、貨幣政策等宏觀因素引入公司債券定價模型,發現宏觀因素非對稱影響公司債券利差[9][11]。
現有研究表明,公司債券信用利差的影響因素眾多、作用機制復雜、效應不一,但究竟哪些因素是公司債券信用利差的主要影響因素,現有研究則關注不多。陶雄華等(2020)[10]、晏艷陽和劉鵬飛(2014)[18]使用傳統線性回歸模型和向量自回歸模型方法,分析公司層面因素與宏觀因素對公司債券信用利差的影響程度。這些文獻對研究我國公司債券信用利差影響因素有重要意義,但線性回歸模型或向量自回歸等模型方法存在方程分析復雜、高維度、具有噪音的金融市場數據解釋能力不高、樣本外的預測誤差較大等缺點,需要用機器學習方法予以完善,進而提高模型的預測能力。
本文側重于公司債券信用利差的微觀影響因素,針對已有研究不足,使用多種機器學習方法對2008—2022年我國公司債券信用利差影響因素進行深入分析,再使用SHAP值解釋性方法計算各影響因素對公司債券信用利差的貢獻率,從而識別出債券信用利差的主要影響因素,并進一步分析債券信用利差主要影響因素的影響。
為深入分析公司債券信用利差影響因素及計算各影響因素貢獻率,識別出主要影響因素,構建如下研究路線。(1)手動整理現有公司債券信用利差影響因素的文獻,篩選影響公司債券信用利差因素。(2)對影響因素進行相關性檢驗。為檢驗因素之間是否存在多重共線性,主要采取方差膨脹因子(Variance Inflation Factor,VIF)檢驗,除去VIF值大于10的因素,確保因素間無多重共線性。由于篇幅原因,VIF檢驗結果未予列示。(3)通過建立多種線性機器學習模型對非線性數據進行訓練,通過調節模型的超參數,得到符合預期擬合優度R2的預測器,比較線性機器學習與非線性機器學習模型的擬合效果。(4)采用SHAP的解釋性方法計算各影響因素的貢獻率,研究公司債券信用利差重要影響因素。(5)通過建立多元回歸模型,探究重要影響因素對債券信用利差預測的影響。(6)通過信用評級分組,探究重要影響因素對不同評級債券信用利差的異質性影響。
本文采用隨機森林模型、BP神經網絡、K近鄰模型和支持向量回歸模型四種經典的非線性機器學習模型以及普通線性回歸、Lasso回歸和Bridge回歸三種線性回歸對樣本進行訓練,各模型設定參數如表1所示。

表1 模型參數設定
機器學習模型相比于傳統的線性回歸模型,往往具有更高的預測準確率,但因過于復雜使其解釋性低下。Lundberg 和Lee(2017)[19]提出了解釋機器學習模型的SHAP(Shapley Additive Explanations)統一框架,用于解釋機器學習模型中每個因素對目標預測值影響的大小。
為確定因素SHAP值,記xij為機器學習模型f(x)上的第i個樣本的第j個因素,集合M為所有特征的全集,|M|為特征集M中元素的數量。機器學習模型f(x)在特定樣本點xi上的預測值f?(xi)可以表示為:
其中,?0為預測值的均值E(f?(x)),作為模型預測的基準值。?ij為樣本xi中的第j個特征的SHAP值,代表了該特征對預測值影響的大小。當?ij>0 時,表示該因素對該樣本正向影響;當?ij<0 時,表示該因素對該樣本具有負向影響。?ij的計算公式如下:
其中,S表示的是集合M中不包含特征j的子集,vi(S)表示在樣本為xi時特征集合S下的預測值,表示在特征集合S中增加特征j所引起的預測值的改變,代表了特征j對特征集合S的邊際貢獻。項目代表了特征集S的權重。
若訓練集有N個樣本,則某一特征j的貢獻值(Contribution Value,CV)由訓練集上該特征上所有樣本的SHAP值絕對值的均值刻畫,其計算公式如下:
本文記某一特征j的貢獻率(Contribution Rate,CR)為CRj,由該特征的貢獻值占所有特征SHAP 值之和的比例來刻畫,其計算公式如下:
為了探究信用利差影響因素對債券信用利差預測的影響,本文參照已有研究設定如下多元線性回模型:
其中,SHAPi,j為樣本i在影響因素j下的SHAP 值,Bondi,jˉ為樣本i的個券層面變量(不包括影響因素j),Cori,jˉ為樣本i的公司層面變量(不包括影響因素j),Yeari為樣本i的時間趨勢項。本文主要關注各影響因素系數β1的方向和大小,為了便于比較各影響因素系數β1的大小,對所有連續變量進行標準化處理,系數β1的絕對值|β1|越大,代表對被解釋變量SHAP 的影響越大。
為研究公司債券信用利差主要影響因素,以2008—2022年我國A股上市公司在滬、深證券交易所的固定利率公司債月度交易數據作為研究樣本,并對樣本進行如下處理:(1)剔除金融行業上市公司樣本;(2)剔除ST、*ST類上市公司樣本;(3)剔除債券計息類型為浮動利率和累計利率的樣本;(4)剔除可贖回、可回售的債券樣本;(5)剔除關鍵變量數據缺失的樣本;(6)對所有連續變量在0.5%和99.5%的水平上進行Winsorize處理,以剔除異常樣本干擾。最終得到11 183個觀測樣本,涉及229家上市公司發行的515只債券。
本文使用python 10.1 軟件中的機器學習算法和SHAP 方法進行樣本訓練,使用了python10.1 中的sklearn庫和shap庫。
債券信用利差(CS)為被解釋變量,定義為公司債券到期收益率與同一交易日具有相同剩余期限的無風險債券到期收益率之間的差額,無風險債券到期收益率通過我國國債到期收益率曲線得到[20],某一月份的公司債券信用利差等于該月有效交易日信用利差的均值。
已有研究表明,債券個性因素是公司定價的基礎性因素。本文考慮信用評級(Rating)、債券發行規模(Bondsize)、月交易天數比例(Day)、債券剩余期限(Term)、換手率(Tyr)作為公司債券個性因素的代表。其中信用等級采用通用做法轉化為有序量表,樣本中信用評級AAA級賦值為3,AA+級賦值為2,AA級及以下賦值為1;債券發行規模為債券發行價格與債券發行數量的乘積;月交易天數比例參考王興安等(2012)[16],為月度有交易天數與月度市場總交易天數之比,取值在0和1之間;債券剩余期限為債券交易月度債券剩余期限的日均值;換手率為債券月度交易額占發行額的比例。
公司個性因素選取產權性質(Soe)、公司規模(Size)、資產回報率(Roa)、資產負債率(Lev)、股價收益波動率(Volatility)、股權質押比例(Pled)、第一大股東持股比例(Firstshare)、公司所屬行業(Industry)。其中產權性質,當發債公司產權性質為國有時賦值1,其他賦值0;公司規模為資產總量;資產回報率為公司凈利潤除以總資產余額;資產負債率為總負債除以總資產;股價收益波動率為每月有效交易日股價收益波動率的均值;股權質押比例,若當月發債公司控股股東不存在股權質押,賦值為0。需要說明的是,由于上市公司只匯報公司規模、資產回報率、資產負債率的季度數據,因此參考張春華等(2017)[21]做法,采用三次樣本插值把季度數據轉化為月度數據,轉化后數據能較好地反映季度數據的變化趨勢。由于公司所屬行業為名義變量,采用均值編碼對上市公司編碼賦值。
使用債券所屬年份(Year)作為時間趨勢項,用以解釋其他自變量解釋不了的因變量的外生增加或下降。
表2展示了樣本相關變量的描述性統計結果。經過Winsorize處理后可以看到,月度公司債券信用利差的均值為1.907%,最小值為-0.378%,最大值為18.09%,說明我國公司債券信用風險普遍存在且存在異質性。債券剩余期限的均值為2.812 年,標準差為2.251 年。月交易天數比例和換手率的均值分別為0.314、0.714%,表明我國公司債券交易市場并不活躍,公司債券的流動性較差。發債上市公司的規模和資產回報率存在較大差異,公司規模最小值為17.76億元而最大值達26 801億元,資產回報率最小值為-8.173%而最大值為12.517%,發債上市公司各月份的資產負債率均值為60.45%,股價收益波動率的均值為2.231%。發債上市公司第一大股東持股占比最小值為7.84%,最大值為86.35%。股東股權質押比例均值為5.699%,標準為18.58%,表明各月份中我國發債上市公司股東以股權質押方式進行融資的比例并不高,但質押比例具有較大差異。
篇幅原因,樣本數據各變量的Pearson相關系數未予列示。
使用多種機器學習方法對2008—2022年我國公司債二級市場的月度樣本進行訓練與預測,以SHAP方法識別公司債信用利差影響因素的貢獻程度,通過對比多種機器學習方法進行重要性程度排名,并針對重要影響因素進行全面分析。
表3報告了機器學習方法進行樣本擬合的比較結果。通過比較訓練集與測試集的均方根誤差(RMSE)和決定系數(R2)可以發現,在相同的訓練集上,采用非線性機器學習方法擁有比線性機器學習方法更好的擬合和泛化能力,其中隨機森林方法無論是在訓練集還是驗證集上的擬合能力與泛化能力均高于其他非線性機器學習方法。

表3 不同機器學習方法擬合效果
表4報告了四種非線性機器學習模型對信用利差影響因素的貢獻率結果,加權貢獻率為以各機器學習模型的Test R2作為權重進行加權。通過全面分析各個影響因素,主要有以下發現。

表4 非線性機器學習方法下各影響因素的貢獻率
第一,以加權貢獻率是否大于平均貢獻率為標準,信用利差影響因素可以分為兩部分。第一部分為重要影響因素,包括信用評級、月交易天數比例、股權性質、時間趨勢、公司規模五個影響因素,具體加權貢獻率分別為17.9%、13.1%、10.9%、10.1%、8.9%,合計貢獻率高達60.9%。其中,信用評級在所有模型中貢獻率均為第一且遠高于其他影響因素,說明債券信用評級是投資者識別債券信用利差的首要因素。時間趨勢的加權貢獻為10.1%,在所有模型中均位列第四,但并不具有明顯的經濟學意義,因此在后續分析中不考慮時間趨勢項。第二部分為次要影響因素,包括企業資產負債率、債券剩余期限、控股股東股權質押比例、資產回報率、公司所屬行業、第一大股東持股比例、公司股價波動和債券換手率,次要影響的因素貢獻率從2%至6.4%不等,合計為39.1%,均低于平均貢獻率,說明這些因素對公司債券信用利差的影響較小。
第二,進一步分析重要影響因素對公司債券信用利差的影響。表5報告了重要影響因素在不同機器學習方法下對SHAP值的線性回歸系數β1,回歸模型使用公式(5)。

表5 重要影響因素在不同機器學習方法下對SHAP值的線性回歸系數
1.信用評級的增加會推動債券信用利差的預測值減小。圖1中左圖展示了隨機森林模型下,不同信用評級的SHAP值分布以及對應經過同一比例放縮后的概率密度曲線,其他模型分布相似不再贅述,下同。其主要存在兩個特征:一是隨著信用評級的增加,SHAP值的分布曲線整體向下移動,表5中信用評級的回歸系數在1%的水平上顯著為負也反映了該特點,說明隨著信用評級的增加會導致信用利差的預測值減小;二是信用評級為AA+級和AA級及以下的SHAP值分布總體處在0以上,而AAA級的SHAP值總體分布處在0以下,說明在不考慮其他因素的作用,當債券擁有AAA級的信用評級時,該債券預期的信用利差會低于債券信用利差的總體水平,反之會高于債券信用利差的總體水平。該結論與已有文獻的結論一致,信用評級可以發揮降低信息成本、提升配置資源效率的作用,高信用評級的公司債券有更低的信用利差。

圖1 信用評級與股權性質概率密度曲線圖
2.產權性質為國有時,債券信用利差的預測值更小。表5中產權性質的回歸系數在1%的水平上顯著為負,圖1中右圖顯示,當公司的產權性質為國有時,SHAP值總體分布處于0以下,表明國有上市公司發行的公司債券具有更低的信用利差。國有企業由于要承擔政府的部分社會職能,過高的風險承擔不利于實現政治目標和社會穩定[22],因此相對于非國有上市公司,國有企業會更加傾向于風險規避與穩健的投資策略[23],在二級債券市場上體現為更低的公司債券信用利差。
3.債券月交易天數比例增加會推動信用利差的預測值增大。月交易天數比例在一定程度上反映了公司債券的流動性水平。不同模型下債券月交易天數比例的回歸系數較為穩定,范圍從0.1656至0.1816,并且均在1%的水平上顯著為正,說明債券交易頻率對債券信用利差具有正向影響。從博弈論的角度對此可能的解釋為,當投資者認為某一資產的信用風險提高時,為了維持資產組合的風險水平,會更傾向于優先交易相對風險更高的資產,使得該資產的交易頻率增加,而市場上其他投資者也同樣明白這一點,因此在交易時會要求更高的信用利差。解文增和王安興(2014)[11]則認為債券月交易天數比例可能是公司債券投機性的代理變量,不能很好地反映公司債券的流動性水平。
4.公司規模的增加會推動信用利差的預測值減小。表5中公司規模的回歸系數均在1%的水平上顯著為負,說明發債公司的公司規模對債券信用利差具有負向影響。與預期一致,公司規模越大,財力雄厚,社會信譽高,融資約束少,融資渠道多,債券違約的可能性越低。
第三,公司債券信用利差的影響因素存在信用異質性。
表6報告了不同信用評級下重要影響因素的貢獻值。結果顯示,月交易天數比例、股權性質、公司規模在不同信用評級的公司債中均存在顯著差異。可以發現,當信用評級為AA級及以下時,月交易天數比例和股權性質的貢獻值顯著高于同模型下信用評級為AAA級和AA+級的貢獻值,表明月交易天數比例和股權性質對低信用評級公司債(AA級及以下)的影響更大。公司規模的貢獻值在同模型不同的信用評級下差距不大,表明公司規模對不同信用評級公司債券信用利差影響的差異性較小。

表6 不同信用評級下重要影響因素的貢獻值
結合使用多種機器學習方法,檢驗了債券個性因素和公司個性因素對2008—2022年我國公司債券二級市場公司債券信用利差的影響。研究結果表明:第一,信用評級、月交易天數比例、公司產權性質、公司規模為公司債券信用利差的重要影響因素,企業資產負債率、債券剩余期限、控股股東股權質押比例、資產回報率、公司所屬行業、第一大股東持股比例、公司股價波動和債券換手率為次要影響因素。第二,公司債券信用利差預測值與信用評級、公司規模、公司產權性質顯著負相關,與債券月交易天數比例顯著正相關。第三,公司債券信用利差的主要影響因素對不同信用評級組別的影響存在異質性。月交易天數比例和股權性質對AA級及以下的低信用評級公司債券信用利差影響更大,公司規模對不同信用評級公司債券信用利差影響的差異性較小。
由研究結論得到的政策啟示是,相關監管部門應該關注信用評級、債券交易頻率、產權性質等多重因素對我國公司債券市場的影響。在我國公司債券信用評級整體偏高的背景下,信用評級依舊是投資者識別公司債券信用風險的主要影響因素,因此監管部門應該采取措施加強信用評級的信息中介功能,強化信用評級機構的行業公信力。此外,民企相對于國企公司債券信用利差更高,反映了較為嚴重的融資約束,政府部門應該加強改善融資環境,紓解民營企業融資難等問題,從金融方面支持其更快更好發展。