



摘要:對于債券違約風險的判斷,當前投資者常用的量化研究方法是基于宏觀和微觀財務數據,通過Logistic回歸等線性回歸方法來生成違約模型。既有方法對于更為高頻的市場交易數據、負面輿情數據等因素考量較少,同時主要針對某一時點的截面數據進行建模,較少采用跨度更長的面板數據進行分析。本文在既有方法基礎上進行了數據補充和模型改進,結果顯示新模型債券違約預測的準確度比僅納入財務數據的違約模型有明顯提升。
關鍵詞:信用債違約 邏輯回歸 面板數據 預警模型
從近年信用違約事件的特點來看,在違約之前市場出現不同層次的異動信號,包括但不限于信用基本面數據變化、微觀主體財報數據變化、債券市場交易數據分化等。如果能結合人工智能(AI)等技術手段有效捕捉信息并快速開展信息篩選和分析處理,則有助于提升信用風險預測的效率和精準度。
反映信用債違約信號的四類主要變量
為構建和完善信用債違約預警指標模型,本文將重點圍繞市場交易數據、輿情信息、主體評級變化、財務數據等維度,篩選和評估相對快速有效反映信用債違約信號的四類主要變量,具體如下:
(一)市場交易數據
市場交易數據可快速反映市場情緒面波動以及投資者行為變化,例如,債券違約前通常伴有收益率走高、成交縮量、有價無市、同一發行人境內外債券利差走闊等現象,進而通過交易數據異動實現對違約風險的前瞻捕捉和判斷。根據萬得(Wind)預警信息數據,此類信息主要包括跨市場價差異常(如交易所市場與銀行間市場價差)、成交價異常(最低收盤價與前日收盤價的差異),以及推遲或取消發行等情況。截至2024年9月末,共有140只債券出現成交價格異常,涉及120家發行人,其價差偏離1幅度為-20%~4%。其中,15家發行人已發生實質性違約。因此,通過監測市場異常交易數據,有助于投資者預先識別潛在的違約風險。
(二)輿情信息
輿情信息涉及發債主體經營、財務、股東支持、涉訴糾紛等多個方面,具有正面、中性及負面屬性。其中,負面輿情信息在識別債券風險、揭示發債主體潛在信用瑕疵方面具有關鍵作用,能為風險評估提供關鍵視角,輔助市場參與者精準把握信用狀況,優化投資決策,提升市場穩定性與資源配置效率。根據Wind數據,2023年9月至2024年9月末,共計9家發行人多次出現商票逾期、納入失信被執行人名單等負面輿情,相應債券均出現了違約或展期。這些債券的違約和展期行為進一步加劇了投資者的擔憂,對整個債券市場造成了不利影響。因此,本文在構建債券違約預警模型時,將輿情信息納入基礎數據范疇,以便于更好追蹤和識別風險預警信號,具體包括監管問詢關注或警示(交易所兌付風險警示、交易商協會自律處分)、行政處罰(訴訟糾紛、誠信信息、保薦違規記錄)、發行人內控和風險問題(高層變動/違法違紀、集團系/關聯方有重大輿情或違約風險)、發行人非公開債務逾期(商票/定融逾期、非標負面)等。
(三)主體評級變化
外部評級變動是判斷債券發行人信用資質變化的重要參考指標,當發行人的信用評級或債項評級被下調或者評級展望為負面時,通常意味著其違約風險有所增加。尤其近年市場對于債券隱含評級的關注度不斷提升,債券隱含評級不僅考慮了傳統的評級因素,還納入了債券的價格信號、交易量以及其他市場信息,對傳統評級方法進行了有益補充和完善。根據Wind統計,評級信息變動主要包括主體評級或債項評級、擔保人評級、中債隱含評級以及評級展望的變動,2023年9月至2024年9月共計46家發行人主體的隱含評級被下調,其中約40%的存續債隱含評級下調超過3級。評級被下調主體大多是在最近一年內出現過重大負面輿情或風險事件的公司。因此,通過評級變動跟蹤能夠及時發現債券發行人出現的信用資質劣變風險,從而盡早開展預警分析。
(四)財務數據
財務分析是債券發行人信用分析的核心,涉及企業盈利能力、運營能力、償債能力、資本結構和資產質量等方面,重點包括:
盈利能力指標:聚焦凈利潤、銷售利潤率、資產利潤率、資本利潤率等,用以評估企業盈利水平與潛力。
運營能力指標:主要涉及資產和資本周轉速度,如存貨、應收賬款及總資產周轉率等,反映企業經營效率與資產利用效率。
償債能力指標:核心是衡量企業可支配資金與債務關系,涵蓋有息負債、利息保障倍數等,表外負債和擔保也需考慮,以全面評估債務風險。
現金創造能力指標:著重關注三大現金流及銷售獲現率等,綜合判斷企業資金鏈穩定性與可持續發展能力。
根據Wind數據,2018年初至2024年9月末,共計有70家債券發行人的資產負債狀況呈現惡化趨勢,資產負債率超過50%;42家債券發行人的營業收入同比減少30%;12家債券發行人的短期償債能力顯著減弱。統計分析結果顯示,大約90%的財務指標出現弱化的債券發行人顯示出潛在的資質劣變風險,并已發生違約。因此,將關鍵財務數據納入模型構建指標,對于提前捕捉企業債務違約的預警信號至關重要。通過加強對財務數據的分析,可以有效提升對潛在違約風險的預見性和應對能力。
實證分析
當前市場上對于信用債券違約的預警模型基本采用發債主體在某一時間點上的財務數據進行建模。該方法的局限性主要在于忽略了時間維度上的變化趨勢以及非財務數據的相關影響。基于此,本文在數據層面將市場數據、輿情信息、評級信息和財務數據進行整合,在時間維度上使用跨度更長的面板數據代替截面數據,旨在改進和提升對信用債券違約預警分析的準確性和有效性。
(一)Logistic回歸模型介紹
Logistic回歸模型通常用于研究某個現象發生的概率 p與其影響因素(自變量)之間的關系。由于概率p的取值范圍是[0,1],直接使用線性模型是不合適的。為了解決這一問題,Logistic回歸引入了一種轉換,即概率p的一個嚴格單調函數G(p),這個函數稱為Logit變換。Logit變換的公式為:G(p)=log[p/(1-p)],對函數進行變換G(p)=log[p/(1-p)]=B×X=b0+b1x1+…+bnxn,
p=1/[1+e-(b1x1+b2x2+…+bnxn+b0)],其中自變量X=(x1,x2,…,xn),xi表示第i個因素。
通過邏輯回歸模型可以對企業發生違約的可能性進行預測。模型會輸出一個概率值p,表示企業違約的概率。通常選取0.5作為判斷企業是否違約的分割點,若p<0.5,則認為企業不發生違約;若p≥0.5,則認為企業發生違約。回歸系數顯著性檢驗方面使用瓦爾德檢驗。
(二)風險指標體系的構建
根據上文指標分析,本文首先選取市場指標、財務指標、負面輿情、評級調整四類指標作為風險預警一級指標。其次,根據各類指標特點,同時結合數據可得性,繼續細分了16個二級指標,具體如下:(1)市場指標選取了跨市場價差(銀行間市場和交易所市場)均值、中債估值偏離均值,由于市場指標是按交易日發生,本文選取了季度內市場指標的均值。(2)財務指標選取凈利潤(同比增速,%)、主營業務收入(同比增速,%)、主營業務利潤率(%)、資產負債率(%)、現金比率、經營性現金流/ EBITDA(%)共計6項,均為季度數據。(3)負面輿情數據主要包括內控風險問題發生次數、融資轉弱發生次數、非公開債的逾期次數、監管問詢和警示次數。由于輿情不定期發生,因此本文按照季度統計總數,即發生一次負面輿情則數值加1。(4)評級調整可細分為主體/債項評級下調次數、評級觀察/評級展望下調發生次數、負面展望或列入觀察名單次數、撤銷/推遲評級發生次數,按照季度進行次數統計(見表1)。
(三)模型數據的處理
由于產業債和金融債的財務數據刻畫指標有所區別,本文基于Wind和評級系統數據,選取2018年初至2024年6月所有產業債共計62075只,其中違約債券1142只,未到期、未違約債券有60933只。針對每只違約債券,使用從2018年開始到違約日的上述指標數據,未違約債券使用從2018年開始至債券到期日的上述指標數據。
由于違約債券樣本數量和未違約債券樣本數量偏差大,為確保模型回歸計算的有效性,違約樣本數量和未違約樣本數量需要均衡,故隨機選取了和違約債數量接近的未違約樣本用于分析,同時過濾掉異常和無效數據3,最終用于回歸的樣本包含違約債436只,未違約債617只,共1053只,其中隨機選取近20%共190只債券作為測試樣本,其余863只債券用于回歸建模。同時,由于不同樣本數值偏差較大,通過SPSS進行了歸一化處理。
(四)回歸建模及顯著性分析
將單只債券的16個指標的時間序列構建自變量向量,進而使用自變量X=(X1,X2,…,X16),構建邏輯回歸模型。因變量為債券違約發生的概率p,發生違約的值為1,未發生違約的值為0。邏輯回歸模型公式為ln[p/(1-p)]=BT×X+B0,其中B為系數矩陣,X為自變量矩陣,B0為常量。
選取違約債券356只、未違約債券507只,共計863只4債券開展建模,數據維度包括上述16個指標,每個指標為24維向量。最后,將其中指標X列作為自變量,是否違約列為因變量Y,通過執行邏輯回歸分析操作得到如下回歸方程(對應的回歸系數和顯著性見表2)5。
y= b11×x11+b12×x12+…+b124×x124(第1個指標變量和系數)
+b21×x21+b22×x22+…+b224×x224(第2個指標變量和系數)
+……
+b161×x161+b162×x162+...+b1624×x1624(第16個指標變量和系數)+b06
對模型回歸效果開展檢驗,可知coxamp;Snell R平方=0.734gt;0.5,Nagelkerke R平方=0.989gt;0.5,說明模型擬合度較高(見表3)。從回歸系數顯著性水平來看,市場指標、財務指標、負面輿情和評級調整的幾類指標中都存在可以通過10%顯著性的指標,說明這些指標和結果的線性關系還是比較明顯的。部分指標系數顯著性不足,但模型的擬合有效性總體較好,原因可能為本模型中同一企業的不同債券在財務信息方面存在重復7,以及16個風險預警指標沒有做消除共線性處理。
(五)模型預測檢驗
為驗證已構建的預警模型性能,本文使用測試樣本共190只債券對模型進行檢驗。其中,實際發生違約的債券80只,未違約的債券110只,通過SPSS檢驗后結果顯示,未違約債券樣本的召回率和精確率分別達到98.2%和99.1%,違約樣本的召回率和精確率分別達到98.8%和97.5%(見表4),各指標也都優于僅單獨使用財務指標的模型(未違約債券樣本的召回率和精確率分別為90.9%和75.8%,違約樣本的召回率和精確率分別為40%和82.8%,結果見表5),說明違約預警模型的預測效果比較理想,能夠為債券違約預警提供一定的指導。
模型結果運用及后續建議
本文基于2018年—2024年6月信用債市場違約和非未違約數據,選取了市場指標、財務指標、負面輿情和評級調整作為風險預警指標體系,生成邏輯回歸模型,從回歸方程有效性角度看具備較好的解釋能力。基于上述模型結果,結合信用風險日常管理工作的實操需求提出以下建議:
第一,為更好地對比和驗證傳統財務指標以外的數據對于模型有效性有提升效果,本文將上述6個財務指標進行單獨建模并進行有效性檢驗。同時考慮到上文提及的財務數據重復性問題,因此選取用發債主體的財務數據來開展回歸。具體方法是將上述樣本中財務指標(X3到X8)在2023年四個季度的數據,通過SPSS進行邏輯回歸建模。從輸出結果看,未違約債券樣本的召回率和精確率分別為90.9%和75.8%,違約樣本的召回率和精確率分別為40%和82.8%(結果見表5,回歸系數見表6)。
上述結果表明,在指標體系中引入非財務指標,同時加大相關指標的時間跨度,有效增強了信用違約風險的預警能力。相比傳統數據,輿情行為、機構交易行為、情緒面指標等高頻數據,更能及時反映市場預期變化,較好彌補了財務數據真空期的有效信息缺失,無論在日常風險監測還是量化預測方面都應該更重視此類數據的價值。
同時,輿情類的信息以非結構化的文本信息形式存在的較多,其中部分數據源對這類文本信息做了簡單分類,本文僅是根據分類采用計數處理的簡化模式。實際對于此類數據量大、信息冗余、大部分為非結構化文本的數據,可以采用當前流行的大語言模型如聊天機器人(ChatGPT)對文本進行處理提取更準確的標簽,對新聞輿情、公告、司法數據進行風險事件要素抽取并進行智能化分類,進而可以形成對基礎信用資質評估的補充。
第二,對于上文提到的信用風險承壓行業,本文嘗試將構建的模型運用于違約風險預測,在此選取房地產、建筑施工兩個行業為代表,本模型選取自2014年至2024年6月末未違約、未到期債券,同時滿足數據要求的共計35只債券,將對應的債券基礎信息9輸入上述回歸模型,結果顯示房地產和建工行業預測違約率為22.9%。本模型可以運用于日常投前擇券和投后存續期管理工作中,對重點風險敞口加強跟蹤分析。但由于本模型基于歷史數據分析,在實際工作中應綜合考慮模型結果和政策影響。同時也可在此基礎上進一步生成不同風險預警等級,為具體投資交易提供量化參考。
第三,上述預測模型主要致力于提升日常風險監控工作的效率和精準度,但在數據質量和模型技術層面后續仍有較大改進和升級空間。
一是在基礎數據準確性和完整性方面,對缺失債券信息和風險指標數據進行完善,提高數據完整性,進而提供更多的模型基礎數據樣本。同時伴隨債券市場發展,未來隱含評級、違約率、違約損失率等基礎數據也將不斷迭代和累積,后續可不斷地納入評價分析模型,提高預測的及時性和精準性。
二是建模的理論基礎方面,目前整體分析使用的邏輯回歸模型本質是一種線性模型,對于自變量和因變量之間存在的更復雜的非線性問題處理能力有限。目前市場上主流的信用評價模型主要使用線性加權公式加專家經驗形成打分卡方式,檢驗方式有基尼系數等。同時,為解決不同行業的可比性問題,以及提高行業各主體之間的可比性,將各個行業均進行了精細劃分,不同行業使用不同的指標和模型,這種方式在可解釋性和透明性方面有較大優點,但是在處理更多高頻以及來源多樣的非結構化數據方面能力不足。后續可以考慮將模型升級為非線性模型,同時結合專家經驗庫和主流檢驗方法,形成更為嚴謹有效的評價模型。
三是數據工具的升維,SPSS在處理高維度和大規模數據樣本時,在性能和效率方面存在不足,需要使用更高級的軟件或者編程來實現。后續可以考慮使用神經網絡等更為高級的模型進行分析。