
























摘" "要:債券信用評級對債券信用風險防范具有重要作用,而涵蓋信息充分、能有效區分債券信息差異的債券信用評級指標體系是識別債券信用影響因素、提高債券違約鑒別精度、提升債券信用評級可靠性的重要基準。本文選取2012—2022年我國上市公司債券為樣本,引入風險披露指標增大信息充分性、構建宏觀指標與債券其他特征的克羅內克積指標增大信息差異性,并基于AdaBoost算法的預測結果反推最優指標體系。通過計算加入風險披露等指標和宏觀指標與債券其他特征克羅內克積指標前后的多個模型性能評估指標,驗證指標體系的有效性;將AdaBoost模型與其他常用機器學習模型預測結果對比,驗證根據AdaBoost方法確定的最終指標體系可靠性;通過計算指標在模型預測中的重要性程度,提高指標體系的可解釋性。研究發現,在多個預測性能評估指標上,增加指標體系的信息充分性和信息差異性,可顯著優于未加入此類指標的預測結果;基于宏觀指標與債券其他特征克羅內克積的多個指標對債券違約預測有重大影響;上市公司風險信息披露情況等指標是債券違約預測的重要指標。
關鍵詞:債券信用評級指標體系;信息充分性;信息差異性;債券違約鑒別;AdaBoost
DOI:10.3969/j.issn.1003-9031.2024.11.005
中圖分類號:F224.9;F812.5" " " " 文獻標識碼:A" " "文章編號:1003-9031(2024)11-0049-15
一、引言及文獻綜述
1981年國務院決定恢復國債發行,拉開了我國債券市場從無到有、長足發展的序幕。截至2023年12月,我國債券市場托管余額157.9萬億元,同比增長9.1%,實現了債券市場規模的穩定增長,我國債券市場規模穩居全球第二①。債券市場蓬勃發展的背后是債券違約事件的頻發和各種極端風險的挑戰(王培輝和張猛,2023),2023年,全國共有41只債券主體發生違約,違約債券余額高達308.19億元②。為了盡可能地規避風險,減少損失,實現我國債券市場的穩健發展,對債券進行合理的違約風險評估、建立有效的信用評級指標體系顯得愈發重要。目前,在債券信用評級領域中,國內外學者的研究多聚焦于以下兩個方面。
一是債券信用評級影響因素研究。鄒昆侖和陸萍(2018)基于債券發行人的盈利能力、資本結構、償債能力、成長能力、每股指標五個方面,考慮了一系列財務指標對債券信用評級的影響。Ma C et al.(2021)認為債券信息、債券發行主體信息、債券信用評級和宏觀經濟指標等會影響債券信用水平。姚瀟等(2022)將債券違約事件視為一種外生事件,同時考慮發債主體基本信息和財務指標對于債券信用評級的影響。生柳榮等(2019)在篩選信用評級影響因素時,綜合考慮了涵蓋企業屬性、企業償債能力和杠桿水平等六個方面的定性因素和定量因素。蔣敏等(2021)基于上市公司債券違約樣本,從公司經營狀況等內部經營問題和外部經濟環境兩方面出發,探究內部及外部因素對債券違約的“聯合效應”。肖艷麗和向有濤(2021)以上市公司發行的企業債券作為研究樣本,實證發現發債主體的財務指標和債券自身屬性等非財務指標都會對債券信用評級產生一定的影響。陳學彬等(2021)基于債券發行公司的財務指標、債券市場指標、債券評級指標、宏觀經濟環境指標、行業景氣指標、地區經濟景氣指標等六類指標進行信用債違約風險預測。Zhou Lu et al.(2021)采用半年期形式的數據,衡量上市狀態、所有權結構、行業分類和信用評級降級信息四個方面對債券信用水平的影響。近年來,部分學者發現債券發行人的風險信息披露情況也會在一定程度上影響債券的信用水平,如吳育輝和唐浩博(2021)發現債券募集說明書中披露的風險信息對債券信用水平有顯著影響;吳建華等(2017)推導了信息偏誤下資產價值的條件分布、違約概率和信用價差的解析表達式,基于該模型發現信息披露下的財務信息扭曲在一定程度上會影響債券信用水平。
二是債券信用評級指標篩選方法研究。由于確定的初始指標體系往往含有較多的備選指標,為了篩選出信息利用度高的指標,學者們采用了不同的方法對初始指標體系進行降維處理?,F有文獻多在構建信用評級模型前便對指標體系進行篩選,如高秀存等(2022)采用因子分析法對初始指標體系進行篩選,最終確定了包含流動比率、短期債務比總債務等14個指標的最優指標體系。王玉龍等(2022)分別依據相關性和冗余性對初始指標體系進行第一次和第二次指標篩選,最終選定營業凈利率、凈利潤、現金比率、財務費用和資產負債率等5個財務指標共同組成最優指標體系。龐春潮和羅苑瑋(2023)綜合考慮了各指標間的顯著性、相關性和多重共線性,最終構建了包含20個定量指標、24個定性指標的最優指標體系。謝玲玲和范龍振(2020)首先將債券數據分為違約組和非違約組,并針對初始指標體系中的指標依次進行均值差異比較和相關性分析,最終建立了包括14個指標的最優指標體系。徐舒玥和曹艷華(2023)利用Pearson相關分析法對全部特征指標進行篩選,最終保留20個變量組成最優指標體系。
通過回顧現有文獻,發現學者們已經對債券信用評級指標體系構建做出了諸多探索,也取得了眾多成果,但仍存在進一步研究的空間。
一是債券信用評級海選指標信息涵蓋不全面。債券信用評級情況受多方面因素影響,在指標海選時,現有研究雖然是從債券信用評級影響因素出發去選擇指標,但多是考慮了發債主體的財務指標、非財務指標、宏觀指標和債券基本信息等結構化指標,對債券發行人的風險披露信息并未考慮,導致構建的債券信用評級指標體系涵蓋信息不全面,影響信用評級的可靠性。
二是指標篩選方法不科學帶來信息損失。很多研究在構建信用評級模型前便通過相關性等統計量對指標進行篩選,但指標篩選時無法保證保留的指標體系組合對債券違約的預測精度,沒有體現出指標體系應保證債券違約可能性大、其信用評分低的合理思路,這種篩選方法雖然可以降低信用評級指標體系規模,但可能帶來信息損失,進而影響最終信用評級可靠性。
三是不同債券部分指標取值相同,指標差異性不強。現有文獻中所考慮的宏觀指標多為債券發行人所在省級層面的相關數據,這些指標對相同省份公司發行的債券取值相同,當相同地區的債券數量較多時,指標體系中這些債券的宏觀指標取值便會相同,這會導致該類指標不能反映出宏觀因素對債券信用影響的差別,導致錯失重要影響因素。
本文的研究目標是確定一個違約鑒別能力強、復雜度低且具備經濟可解釋性的最優債券信用評級指標體系?;诖四繕?,本文從信息充分性和信息差異性視角出發,在指標海選、指標篩選和宏觀指標差異化方面進行改進。
根據上述分析,本文的主要創新點如下:第一,在債券信用評級指標海選時,將發債主體財務指標、非財務指標、宏觀指標、債券基本信息指標和根據上市公司發布的文本信息處理得到的風險披露方面的指標(如管理層凈語調等)等均納入海選指標體系,保證指標體系涵蓋信息更充分;第二,本文基于AdaBoost的嵌入式特征選擇方法對指標體系進行降維處理,在模型訓練的同時完成最優指標體系篩選構建,保證用篩選后的指標體系進行信用評級可以取得較好的債券違約鑒別精度,減少因只考慮指標相關性等進行指標體系降維而導致的信息損失;第三,考慮到同省份不同債券宏觀指標取值相同導致該部分指標信息差異小的弊端,一方面采用城市層面宏觀指標,增大同省份債券宏觀指標信息差異,另一方面引入克羅內克積構建宏觀指標與債券其他特征指標的相互作用項,并將其加入指標體系,保證指標體系中該類指標能體現不同債券的信息差異性,有助于識別宏觀因素是否影響債券信用評級。
二、我國上市公司債券信用評級指標體系構建原理
(一)樣本數據處理
1.缺失值處理
樣本數據的大量缺失可能會導致模型精度的下降,為了在不損失大量信息的基礎上盡可能地減小分析結果與真實情況之間的誤差,本文在數據預處理階段對樣本存在的缺失值進行處理(白鈺銘和姜昱汐,2024)。
缺失值處理的整體思路是利用樣本數據中的最差值來填補缺失值。對于流動比率、速動比率等正向定量指標,考慮用式(1)來填補缺失值:
其中,ν'代表用于填充缺失值的指標值,i代表債券(i=1,2,…,N),j代表指標,ν代表現有的原始指標值,N代表債券總數。若式(1)得到的ν'偏離了該指標的合理范圍,則用現有指標值中的最小值來填補。
對于有形凈值債務率、長期資本負債率等負向定量指標,考慮用式(2)來填補缺失值:
式(2)中各參數含義同式(1),若式(2)得到的ν'偏離了該指標的合理范圍,則用現有指標值中的最大值來填補。
對于董事會規模、管理層平均年齡等區間指標,考慮用式(3)來填補缺失值:
其中,q代表區間指標的最小值,q代表區間指標的最大值,(q+ q)/2代表區間指標的中間值。
式(1)—(3)為定量指標的缺失值填補方法,對于股權性質等定性指標,考慮按照類別進行等級劃分,并在[0,1]范圍內為其賦分,然后用最低分來填補缺失值。
2.指標數據異常值處理和標準化
在缺失值填補完成后,對獲得的完整數據進行前后1%縮尾的異常值處理(白鈺銘和姜昱汐,2024)。同時,考慮到樣本數據間的單位和量綱不同,本文在數據預處理階段對樣本數據進行標準化處理,即將所有定量指標數據歸于[0,1]之間,便于后續模型的構建與評估,具體標準化公式如下(遲國泰等,2016):
式(4)—(6)為定量指標的標準化公式,其中,式(4)為正向指標的歸一化過程,式(5)為負向指標的歸一化過程,式(6)為區間指標的歸一化過程。公式中各參數含義為:xij代表第i只債券第j個指標標準化后的數值,其它參數含義同前文。
3.基于SMOTE方法的非均衡樣本處理
對于我國上市公司債券信用評級問題而言,違約債券的數量遠少于非違約債券,因此我國上市公司債券數據為非均衡樣本。為了避免非均衡樣本數據可能導致的分類預測精度降低等問題,本文采用SMOTE方法對樣本進行均衡化處理。
不同于隨機過采樣技術直接復制合成新的少數類樣本即違約樣本來解決樣本非均衡問題,欠采樣技術直接刪除多數類樣本即非違約樣本使樣本數據達到均衡,本文采用SMOTE方法通過對違約樣本進行插值來創建新的違約樣本,在實現樣本均衡的同時,幫助提高模型的泛化能力和準確性。
用SMOTE方法實現上市公司債券樣本均衡的過程如下:首先,從違約債券中隨機選擇一個樣本計算它與其k個最近鄰樣本之間的距離,將計算得到的差值乘以0到1之間的隨機數,然后將結果添加到違約樣本中作為新的合成樣本。重復上述過程,直到樣本數據達到均衡。
(二)基于AdaBoost的上市公司債券信用評級指標體系構建與模型精度評估
信用評級是一個全面評估債券違約風險的過程,合理有效的信用評級要求能夠充分反映債券的違約可能性,即能夠滿足債券違約可能性大、其信用評級低的合理條件。因此,本文以債券違約預測精度高和指標體系規模合理為指標體系建立的原則,確立債券信用評級指標體系。
1.指標體系的構建
(1)初始指標體系構建
參照惠譽、標普、穆迪、中誠信等國內外權威評級機構的信用評級指標體系,同時結合已有的經典文獻,從發債主體內部財務指標、發債主體內部非財務指標、債券基本信息指標和宏觀指標等多個方面,選取債券信用評級可能的影響因素,建立本文的初始指標體系,具體包括各種結構化指標和根據上市公司發布的文本信息處理得到的風險披露方面的指標(如管理層凈語調等)。
(2)基于數據可獲性的指標第一次篩選
由于部分指標數據無法獲取或存在大量缺失,若不在模型訓練前對指標進行處理可能會導致模型精度的下降,因此,本文基于指標數據的可獲得性對初始指標體系進行第一次篩選。
(3)宏觀指標差異化處理
為保證每個指標都能反映不同債券的差異,更好地識別債券信用風險因素,本文構造了宏觀指標與債券其他特征指標的相互作用項,即通過計算宏觀指標與債券其他特征指標的克羅內克積,得到具有債券差異性的新的宏觀指標,并將得到的新的特征指標納入指標池,參與指標的第二次篩選。
宏觀指標差異化處理的目的:通過計算宏觀指標與債券其他特征指標的克羅內克積來構造相互作用項,可以保證每一只債券的宏觀指標都能在最大程度上反映債券的真實信息,且在不同債券間具有差異性,進而能更準確識別信用風險關鍵因素;考慮到初始指標池中可能含有大量無法獲取數據的指標,若直接計算宏觀指標與債券其他特征指標的克羅內克積,可能會產生大量數據缺失嚴重的指標,造成信息噪聲增加,同時增加后續計算工作量,因此本文對第一次篩選后的宏觀指標做債券差異化處理。宏觀指標差異化處理的具體公式如下(Leippold M et al.,2022):
(4)基于AdaBoost的指標第二次篩選
為了進一步提高模型的預測精度,同時降低模型的復雜度,本文利用基于AdaBoost的嵌入式特征選擇方法對指標體系進行降維處理,在模型訓練的同時完成指標第二次篩選。
對模型訓練得到的結果進行精度和指標體系精簡性的對比,依據結果反推同時滿足預測精度高且模型更精簡的最優指標體系。
AdaBoost算法作為一種重要的集成學習算法,主要通過不斷將多個弱學習器進行訓練,最終加權組合為一個強學習器,實現模型精度的提高,并對樣本準確分類(Freund Y and Schapire R E,1997)。具體計算步驟如下:
假設債券樣本的訓練集為S=(x,y),(x,y),…,(x,y),其中,xR為q維債券特征空間的樣本,y0,1(i=1,2,…,N)為債券違約狀態(其中yi=1代表債券違約,否則為不違約)。
初始化債券樣本數據的權值分布,對每一個訓練樣本賦予相同的權值w:
進行m(m=1,2,…,M)輪迭代,依次訓練每個弱分類器Cm(x):
選取弱分類器決策樹Cm(x)訓練債券樣本數據的權值,計算每一次迭代時弱分類器的錯誤率em:
計算弱分類器Cm(x)在最終分類器中的權重α:
更新債券樣本數據的權重w:
其中,Z為:
對債券樣本進行反復迭代,直至迭代次數m等于設置的迭代次數M,將多次迭代得到的各個弱分類器進行加權組合,得到f(x):
通過符號函數sign(·)的作用,得到最終的強分類器G(x):
2.模型評估
為了更好地評估模型的分類性能,本文引入了5個經典的判別精度指標對模型進行精度檢驗,分別為準確率(Accuracy)、AUC(ROC曲線下面積)、第一類錯誤(Type I Error)、第二類錯誤(Type Ⅱ Error)以及幾何平均值(G-mean),各精度指標的含義及計算參照經典文獻(遲國泰等,2020),本文不再贅述。選取的上述5個判別精度指標既涵蓋了對模型整體性能的評估,又考慮到了模型的分類性能,可以較好地衡量模型的綜合精度。
三、基于AdaBoost的上市公司債券信用評級指標體系構建
(一)樣本選取及數據來源
1.樣本選取
考慮到信用評級應該對債券違約有預警作用,因此本文通過構建t-1年時間窗對我國上市公司發行的38233只在市債券進行違約預測,并依據違約預測的精度結果反推確定債券信用評級指標體系,即所使用的指標數據為2012—2021年,對應的違約狀態為2013—2022年。
2.樣本數據來源
本文的債券樣本數據來自多個渠道,債券基本信息、發債主體內部財務指標數據和非財務指標數據從國泰安數據庫獲取;債券違約情況從銳思數據庫獲取;宏觀指標數據則從《中國城市統計年鑒》《中國城市建設統計年鑒》及各地級市統計公報獲取。
需要特別指出的是,本文在發債主體內部非財務指標中補充考慮了債券發行人的風險信息披露情況,并采用管理層凈語調對其進行衡量。管理層凈語調無法從國泰安數據庫中直接獲取,需要依據正面詞匯數量和負面詞匯數量進行進一步計算,具體計算如式(16)所示(謝德仁和林樂,2015)。
其中,pos代表管理層信息披露中的正面詞匯數量,neg代表管理層信息披露中的負面詞匯數量,tone則代表管理層凈語調,tone越大,證明管理層信息披露的語調越積極。
(二)樣本數據處理
1.指標數據預處理
依據前文所述,對于獲取的原始指標數據,首先利用已有數據中的最差值對缺失值進行填補(其原因是本文通過預測債券違約來對債券進行信用評級,信息缺失時用最差值填補缺失值,即對信息披露不完全的債券,將缺失的信息視為該方面表現差,這樣處理的目的是為了更好地防控債券違約風險),進一步地,對無缺失值的完整數據進行前后1%縮尾的異常值處理,并將所有指標數據歸于[0,1]之間。
2.樣本劃分和基于SMOTE方法的非均衡樣本處理
對于全部債券樣本,本文首先按照8:2的比例進行分層抽樣,將樣本隨機劃分為訓練集和測試集。劃分后的訓練集樣本中,違約樣本數為200,非違約樣本數為30386,顯然本文選用的樣本數據為類別非均衡數據。根據已有研究可知,對類別非均衡樣本,模型對小類別的特征學習相對不足,因此通常需要對非均衡樣本進行處理。
本文對訓練集樣本數據按照前文所述SMOTE方法步驟進行均衡化處理,來保證訓練集中兩類樣本數量相同,降低樣本類別不均衡對預測結果產生的影響。通過利用SMOTE方法處理上述非均衡樣本數據,得到違約樣本數與非違約樣本數達到1:1的均衡樣本,SMOTE非均衡樣本處理前后對比如表1所示。
為了提高模型的泛化性能,對于均衡化的訓練集樣本,本文利用十折交叉驗證方法將數據按照9:1的比例劃分為新的訓練集和驗證集,參與后續模型的訓練,占樣本總數20%的測試集樣本則用于檢驗訓練完成的模型精度。
(三)指標體系構建
1.初始指標體系構建
本研究所涉及的初始指標共377個,其中包含“資產負債率”“長期借款與總資產比”等157個發債主體內部財務指標,“股權制衡度”“管理層凈語調”等125個發債主體內部非財務指標,“目前狀態”“品種類別”等50個債券基本信息指標以及“城市產業結構高級化”“城市人均GDP”等45個宏觀指標。
2.第一次指標篩選
對于指標海選得到的初始指標體系,刪掉無法獲取數據或數據存在大量缺失的指標。刪除數據獲取困難的指標、保留數據可獲取的指標可以在最大程度上保證構建的指標體系信息的有效性。
經過篩選后保留了“資產負債率”“資產報酬率”“城市數字普惠金融指數”等200個指標,第一次篩選后的指標體系如表2所示。
3.宏觀指標差異化處理
計算第一次指標篩選所得指標體系的宏觀指標與債券其他特征指標的克羅內克積,并將得到的相互作用項作為新的宏觀指標納入后續模型訓練及最優債券信用評級指標體系的構建中,最終得到6951個特征指標。
(四)上市公司債券信用評級指標體系構建與精度檢驗
1.基于AdaBoost的第二次指標篩選
對于第一次篩選完成的指標體系,在宏觀指標完成債券差異化處理的基礎上,通過基于AdaBoost的嵌入式特征選擇方法對指標體系進行第二次指標篩選,并依據模型的精度及降維效果,遴選出對債券違約狀態有顯著影響的特征指標,最終確定本文的最優指標體系如表3所示。
2.債券信用評級違約預測精度測算
模型精度的測算離不開混淆矩陣中的相關指標,本文表4、表5分別給出了模型訓練集和測試集的混淆矩陣。依據表4,可以得到訓練集的鑒別精度結果,其中,acc=98.76%、AUC=99.88%、Type I Error=1.74%、TypeⅡError=0.74%、G-mean=98.76%。
依據表5,可以得到測試集的鑒別精度結果,其中,acc=98.35%、AUC=99.07%、Type I Error=1.62%、Type Ⅱ Error=6.00%、G-mean=96.17%??梢钥闯?,無論是訓練集還是測試集,基于AdaBoost算法的模型鑒別精度均在94%以上,表明用篩選后的指標體系建立模型具有一定的泛化性能,同時對上市公司債券有較強的違約判別能力。
3.不同模型精度對比
為了進一步論證基于AdaBoost算法對指標體系進行篩選的合理性及有效性,本文選取了4個常用模型與AdaBoost模型得到的結果進行精度及指標體系規模對比,4個模型分別為梯度提升樹(Gradient Boosting Decision Tree,GBDT)、邏輯回歸(Logistic Regression,LR)、隨機森林(Random Forest,RF)以及隨機梯度下降(Stochastic Gradient Descent,SGD)。
表6給出了不同違約預測模型的指標體系規模,可以看出,AdaBoost的最優指標體系包含45個特征,指標個數明顯少于其他模型的最優指標體系,因此,對于本文而言,AdaBoost模型降維效果最好。
較訓練集而言,測試集精度可以更好地衡量模型的泛化性能,因此在模型精度對比時,本文僅列出不同模型的測試集精度結果,不同模型測試集精度結果對比如表7所示。
由表7可知,AdaBoost模型的Type Ⅱ Error指標明顯小于LR模型等其他模型。對于債券違約預警問題而言,Type Ⅱ Error是投資者更為關注的精度指標,Type Ⅱ Error越大意味著將違約樣本誤判為非違約樣本的可能性越大,帶來的損失也會越大。同時,AdaBoost模型的其他精度指標雖然不全為最好,但同其他模型中該指標最好值相差很小。因此,在Type Ⅱ Error最小的基礎上,綜合考慮各模型的精度指標,確定AdaBoost模型擁有最好的違約鑒別精度以及泛化能力。
綜合考慮各模型的指標體系規模和鑒別精度,不難看出AdaBoost模型的指標體系規模最小、鑒別精度綜合表現最好,表明本文基于AdaBoost算法篩選得到的信用評級指標體系可信度高。
4.引入風險信息披露情況指標前后的精度對比
為了驗證信息充分性在債券信用評級中的重要作用,表8列出了引入風險信息披露情況指標前后測試集預測精度的結果對比。
由表8可知,在引入風險信息披露情況指標后,模型的綜合精度和類別精度指標均得到了一定的提升,明顯優于未考慮風險信息披露情況指標的樣本模型,其中在債券違約鑒別中重點關注的指標Type Ⅱ Error精度提升了2%,且對非違約的債券鑒別精度也提升了3.26%。顯然,加入風險信息披露情況指標來增大指標體系的信息充分性,的確可以得到更高的債券違約鑒別精度,同時降維效果也更優,即指標信息充分性提高,會提高債券違約的預測精度,因此得到的信用評級指標體系對衡量債券信用評級更可信。
5.宏觀指標差異化處理前后的精度對比
為了進一步驗證使用具有債券差異性的宏觀指標進行模型訓練能夠取得更好的綜合鑒別精度和降維效果,即信息差異對識別債券信用評級關鍵因素具有積極作用,本文計算了宏觀指標差異化處理前后模型的預測精度,表9列出了宏觀指標差異化處理前后測試集的預測精度對比。
由表9可知,當宏觀指標具有債券差異性時,模型的各個精度指標得到了較顯著的提升,其中綜合精度指標acc、G-mean和非違約債券的鑒別指標Type I Error、違約債券的鑒別精度指標Type Ⅱ Error提升較為顯著,最大的提升幅度達到2.12%,且綜合精度指標AUC也有小幅提升。同時,對于使用具有債券差異性的宏觀指標樣本的模型而言,其最優指標體系中指標個數占第一次篩選后的指標體系的0.65%,明顯優于未使用具有債券差異性的宏觀指標樣本模型的15.50%,表明使用具有債券差異性的宏觀指標可以更好地提升指標體系預測精度和降維效率。
綜合考慮模型的精度及降維效率,發現采用克羅內克積構造具有債券差異性的宏觀指標方法有效,得到的債券違約鑒別精度更高,即提升債券信用評級指標體系信息差異的思路可行,指標信息差異性增大,會提高債券違約的預測精度,提升債券信用評級指標體系可靠性。
6.信用評級指標重要性排序
前文已經驗證本文構建的信用評級模型具有不同信用的區分能力,且判別精度較高。在此基礎上,計算該模型對應的各特征指標權重,并對其重要性進行排序,最優信用評級指標體系中各特征指標權重及重要性排序如表10所示。
由表10可知,在包含45個指標的信用評級指標體系中,城市數字普惠金融指數*管理層平均年齡、城市產業結構*監事會規模、綜合收益增長率等指標的重要性得分較高,表明這些指標對于債券違約鑒別、信用評級而言經濟意義更顯著。最終指標體系中包含債券發行人的風險信息披露情況指標(如管理層凈語調)和多個經過差異化處理后的宏觀指標,進一步驗證了具有信息充分性和差異性的指標對模型預測有影響。
四、結論與政策建議
(一)結論
本文通過對我國上市公司發行的債券進行違約鑒別,并依據違約預測精度結果反推最優指標體系,得到主要結論如下:
一是本文構建的最終指標體系包含管理層風險披露信息的管理層凈語調等指標,表明上市公司管理層信息披露對債券信用評級有影響,引入該類指標,可提高債券信用評級指標體系涵蓋信息的充分性。通過對比引入風險信息披露情況指標前后的預測結果,發現指標體系信息充分性的提高能提升預測精度,進而增強債券信用評級指標體系的可靠性。
二是本文利用基于AdaBoost的嵌入式特征選擇方法對指標體系進行降維處理,在指標篩選時能更好地保證指標體系信息充分性。該方法在模型訓練的同時完成指標篩選,相比在預測前進行指標篩選的處理方法,本文的方法在預測時輸入更多特征,因此涵蓋的信息更充分。且根據預測精度結果可知,本文模型的預測精度AUC=99.07%gt;70.00%,且降維后只包含第一次篩選后指標數的0.65%(即從原有的6951個指標降低到45個指標),表明了本文篩選方法的可靠性和有效性。
三是根據最終確定的最優指標體系可知,基于克羅內克積構建的多個差異性指標對債券信用評級有影響,表明信息差異對識別債券信用評級關鍵因素有積極作用。
四是根據宏觀指標的差異性處理前后預測結果對比,引入進行差異性處理的宏觀指標構建的指標體系預測精度更高,表明提高指標體系信息差異性能改善預測精度,提高債券信用評級指標體系可靠性。
(二)政策建議
對于發債主體而言,應充分了解可能影響信用水平的各因素,加強企業自身財務建設、非財務建設,進一步提高企業及其發行債券的透明度和風險信息披露。同時在企業內部建立完善的債券管理和監控機制,依據信用評級影響因素做好自身違約風險評估與防范,提升其發行債券的信用水平。
對于相關機構而言,應及時更新信用評級指標體系,根據企業的發展情況不斷進行自我革新,同時要清晰地披露信用評級標準和方法。此外,相關機構要加強對企業綜合收益增長率等指標的關注,幫助企業有的放矢地提升自身及發行債券的信用水平,為企業健康良性發展營造一個好的信用環境。
對于投資者而言,要對債券信用評級的影響因素有一定的了解,不能盲目投資。不僅要關注企業公布的重要財務指標,還應該關注企業的風險披露信息,同時,要考慮發債主體所在城市的宏觀指標和微觀指標的綜合狀況,對債券信用水平關鍵影響因素表現不佳的債券要謹慎投資,要及時關注相關機構公布的債券信用影響因素變化情況,盡可能地提前規避風險,減少自身損失。
參考文獻:
[1]王培輝,張猛.中國債券市場信息溢出效應研究[J].海南金融,2023(9):3-20.
[2]鄒昆侖,陸萍.基于Z模型對中國企業債信用評級的實證研究[J].宏觀經濟研究,2018(5):72-83+175.
[3]Chi M,Hongyan S,Shaofan W,et al.Bond default prediction based on deep learning and knowledge graph technology[J].IEEE Access,2021(9):12750-12761.
[4]姚瀟,李可,余樂安.非平衡樣本下基于生成對抗網絡過抽樣技術的公司債券違約風險預測研究[J].系統工程理論與實踐,2022(10):2617-2634.
[5]生柳榮,陳海華,胡施聰,等.企業債券信用風險預警模型及其運用[J].投資研究,2019(6):25-35.
[6]蔣敏,周煒,史濟川,等.基于fsQCA的上市企業債券違約影響因素研究[J].管理學報,2021(7):1076-1085.
[7]肖艷麗,向有濤.企業債券違約風險預警——基于GWO-XGBoost方法[J].上海金融,2021(10):44-54.
[8]陳學彬,武靖,徐明東.我國信用債個體違約風險測度與防范——基于LSTM深度學習模型[J].復旦學報(社會科學版),2021(3):159-173.
[9]Lu Z,Zhuo Z.Modelling of Chinese corporate bond default–A machine learning approach[J].Accounting amp; Finance,2021(5):6147-6191.
[10]吳育輝,唐浩博.風險信息披露能預測債券違約風險嗎?——來自債券募集說明書的經驗證據[J].財務研究,2021(5):15-28.
[11]吳建華,張穎,王新軍.信息披露扭曲下企業債券違約風險量化研究[J].數理統計與管理,2017(1):175-190.
[12]高秀存,趙明航,楊倩芳.基于因子分析和SVM的信用債違約風險預警實證研究——以河北省為例[J].征信,2022(8):87-92.
[13]王玉龍,周榴,張滌霏.企業債務違約風險預測——基于機器學習的視角[J].財政科學,2022(6):62-74.
[14]龐春潮,羅苑瑋.基于投資者視角的信用類債券違約風險預警[J].統計與決策,2023(2):152-157.
[15]謝玲玲,范龍振.上市公司信用債違約風險評估[J].管理現代化,2020(2):104-108.
[16]徐舒玥,曹艷華.基于可解釋機器學習的信用債違約研究[J].科學決策,2023(5):190-200.
[17]白鈺銘,姜昱汐.基于特征選擇和違約鑒別的我國上市公司債券違約預警模型研究[J].工程數學學報,2024(1):67-87.
[18]遲國泰,張亞京,石寶峰.基于Probit回歸的小企業債信評級模型及實證[J].管理科學學報,2016(6):136-156.
[19]Leippold M,Wang Q,Zhou W.Machine learning in the Chinese stock market[J].Journal of Financial Economics,2022(2):64-82.
[20]Freund Y,Schapire R E.A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting[J].Journal of Computer and System Sciences,1997(1):119-139.
[21]遲國泰,章彤,張志鵬.基于非平衡數據處理的上市公司ST預警混合模型[J].管理評論,2020(3):3-20.
[22]謝德仁,林樂.管理層語調能預示公司未來業績嗎?——基于我國上市公司年度業績說明會的文本分析[J].會計研究,2015(2):20-27+93.