



摘要:為挖掘不同等級信用利差走勢的主要影響因素,同時實現更精確的利差預測,本文建立機器學習模型Lasso-VAR,對不同等級企業債券利差的影響因素進行篩選分析。模型結果顯示,高等級信用債的利差主要受到中長期流動性環境的影響,而隨著債券信用等級的下降,短期資金利率、市場信用環境和經濟增長等因素也會對信用利差產生顯著作用。本文還發現不同期限的流動性指標對利差的作用可能相反,經濟數據對于債券利差的影響相對滯后。
關鍵詞:信用債定價 信用利差 Lasso-VAR模型 時間序列
引言
隨著我國金融市場改革的推進,企業直接融資渠道不斷拓寬,信用債券成為支持企業發展的重要金融工具。在此背景下,加強企業信用債的定價機制研究,一方面,有利于投資者合理評估其持有的債券資產價值,有效管理投資利率風險;另一方面,也有助于政策制定者對企業融資和經濟運行情況進行跟蹤調節,維護國內金融市場穩定運行,對于債券市場高質量發展具有重要意義。
反映信用債定價的指標主要為信用利差,由企業發行的信用債收益率與同期限的無風險利率相減所得。雖然信用利差通常被認為是債券的違約風險補償,但是在實際情況中,發行人的違約概率對信用利差的決定程度十分有限。例如,在2016—2023年,期限為5年的AA等級的中短期票據債券的平均年收益率利差達到近360個基點,而在同一時期全市場的平均年違約率僅不足0.5%1。信用利差大幅超過預期違約損失的現象也被稱為“信用利差之謎”。為了更好地探究企業債券定價機制,構建更為精確的信用利差預測模型,本文建立機器學習Lasso-VAR模型,進一步尋找影響國內公司債券不同級別信用利差走勢的重要因素,為債券市場投資者和研究者提供參考。
國內外已有學者對于信用利差形成機制及其決定因素進行了較為深入的研究。Amato和Eli(2003)提出,信用利差之所以會大幅高于預期違約損失,可能是因為投資者不具備足夠大規模的投資組合對信用風險進行分散,導致其對信用債的投資偏好相對較低。Huang等(2022)利用8個發達國家市場的信用利差數據驗證單純依靠違約風險難以解釋信用利差的水平,并發現如將債券在二級市場的流動性差異加入利差模型后,模型對信用利差的擬合效果可以大幅改善。在國內研究方面,戴國強和孫新寶(2011)發現經濟指標和貨幣發行量對企業債券信用利差存在正向影響,無風險利率和收益率曲線斜率存在負向影響。陳淼鑫和何彪(2017)在研究中利用國債在不同市場的收益率差異構建了描述市場流動性水平的指標,證實市場流動性的收緊會使隨后的AAA和AA級別債券的信用利差增大。
盡管以往的研究已經取得一定成就,但仍然存在一定局限,包括所用模型對影響因子的篩選能力較弱、流動性的指標選取較為單一、缺少對短期信用環境變化的準確估計等。本文為解決上述問題,一是使用機器學習模型Lasso-VAR,更好地進行變量篩選,提高模型的準確性和預測能力;二是在模型中加入多種流動性指標,更具體地研究利差和不同流動性指標間的關系;三是除經濟數據外,加入違約率數據以更精確地捕捉短期內市場的信用變化,以更深入地研究不同級別信用利差走勢的主要影響因素。
信用利差影響因素及數據描述
本文使用中債估值的5年期中短期票據收益率2計算債券信用利差。信用利差具體計算方式為:每個月最后一個交易日的中債中短期票據收益率減去同期對應期限的國債收益率,記為CS。數據樣本為2016年至2023年的月度數據。對信用利差可能產生影響的因子主要有以下幾類。
(一)無風險收益率
無風險收益率可能主要從兩個方面對信用利差的走勢產生影響。一方面,較高的無風險收益率往往對應較高的經濟增長率。此時,企業的經營環境良好,發生兌付風險的概率更低,投資者對于債券風險溢價的要求也會相應下降。另一方面,信用債與利率債之間存在一定的流動性差異,當市場環境發生變化時,利率債往往被投資者優先交易,導致短期內利率債收益率先于信用債收益率作出調整,信用利差被動變化。以上兩種作用對利差的影響效果相反。本文使用5年期中債國債收益率作為無風險收益率走勢指標,記為ifr。
(二)無風險收益率曲線形狀
無風險收益率曲線的形狀是反映市場對未來利率走勢預期的指標,同樣可能影響企業債的定價。當收益率曲線趨于陡峭時,意味著市場預期未來利率的上行和經濟環境的改善,企業違約風險預期降低,進而使信用利差收窄。相反,收益率曲線的平坦化,則反映出經濟潛在的衰退風險,可能使得信用債風險溢價升高。本文選取10年期與1年期中債國債收益率的差值,作為體現無風險收益率曲線形狀的變量,記為Slop。
(三)市場流動性水平
由于信用債是流動性較弱的交易資產,需要更高的收益率彌補其在變現能力方面的不足,進而產生了流動性溢價,成為信用利差的重要組成部分。在構建模型過程中,信用債與利率債之間的流動性差異難以使用數據進行精確的定量描述,因此本文采用市場的資金充裕水平作為間接指標反映貨幣供需水平對流動性溢價的作用。根據經驗分析,當市場中長期流動性趨于寬松時,投資者預期未來應對資金提現的壓力相對較小,會傾向于配置票息更高的信用債品種,推動利差收窄;而當市場短期資金水平趨于寬松時,投資者則可能優先買入流動性較好的利率債,使利率債收益率先于信用債收益率發生變動,帶動利差被動增大。本文分別采用廣義貨幣供應量(M2)同比增速和社會融資規模同比增速描述中長期的貨幣供給和需求情況,記為M2 和FS。短期資金水平使用7天質押式回購利率(DR007)表示。由于質押式回購利率通常在月末時點受到需求擾動,本文使用月末最后10日的DR007平均值作為當月的短期資金利率水平,記為DR。
(四)股票市場收益率和波動率
根據Merton(1974)的結構化模型,企業的杠桿水平即企業的負債與公司的市值之比,是決定其債券違約風險的關鍵因素。企業的市值下降時,其償債能力將有所弱化,債券的信用溢價理論上也會隨之升高。實際情況中,股票市場還可能通過投資者情緒對債券市場產生影響,當股票市場波動幅度加大時,投資者在避險情緒的驅動下調整資產配置策略,進而引發債券市場定價變化。目前,已有研究對股票價格和信用利差之間的關系進行了實證,如謝世清和張夢鴿(2023)在研究中發現,低等級城投債利差與股票收益率呈負相關。本文以股票市場的整體走勢來替代企業市值和杠桿水平的普遍變化,使用股票指數漲跌幅和其波動率作為模型因子,分別記為rs和σs。
(五)宏觀經濟運行情況
宏觀經濟環境的變化與企業的經營狀況密切相關。在經濟繁榮時期,企業通常能夠獲得更多的訂單和業務機會,此時企業利潤增加,信用狀況相對良好,推動信用融資成本降低。相反,在經濟衰退時期,企業資金緊張,違約概率增加,信用風險增加。本文選擇具有代表性的數據,以研究經濟環境變化對利差走勢的影響。具體變量包括:體現市場供給情況的工業增加值同比增速數據,記為Ind;體現市場需求情況的社會商品零售總額同比增速和固定資產投資累計同比增速,分別記為Ret和Inv;體現通脹情況的居民消費價格指數,記為CPI;體現企業對于經濟信心水平的制造業采購經理指數,記為PMI。
(六)市場債券違約概率
債券市場的信用環境是決定信用債定價的基本因素。信用風險環境變化可能通過投資者的配置需求對利差走勢產生重要影響。理論上,當市場上的違約主體增多時,投資者對于信用債的配置情緒也會更趨謹慎,導致更高的信用溢價;相反,市場中信用事件有所減少則可能推動利差收窄。雖然前述變量可以從經濟環境、企業市值等方面,間接體現未來債券發行人信用狀況可能發生的演變趨勢,但由于以上指標存在一定滯后性和自身波動性,難以更直接、精確地反映出市場短期內的信用風險變化,因此無法量化信用變化對投資者情緒的短期沖擊。本文使用市場主體違約率,即“當月違約的公募主體家數除以月初市場存續的公募主體家數”,更直接地反映債券市場信用環境的整體變化,以研究信用環境對信用利差走勢的影響。模型中的違約率指標記為Def。
Lasso-VAR模型介紹
傳統的向量自回歸模型(VAR)被廣泛應用于經濟學、金融學等領域的時間序列研究中。相比于單變量的時間序列模型,VAR模型不僅考慮了被解釋變量自身的回歸效應,還加入了其他相關變量產生的影響,因此其往往具有更高的預測準確性。但是傳統VAR模型存在一定的局限性。當模型中需要擬合的變量過多,或者變量之間存在較為明顯的共線性問題時,VAR模型就有可能出現過擬合問題,導致模型的可解釋性和準確性被削弱。一個較為有效的方法是將機器學習算法Lasso與VAR模型相結合,從而發揮對變量篩選降維,減少噪聲對模型影響的作用。Lasso算法由Tibshirani(1996)提出,是一種用于線性回歸的正則化方法,通過懲罰參數的設置,模型可以對具有較小權重的解釋變量進行稀疏化處理,將對因變量影響較小的解釋變量系數縮減至零,進而提高模型準確性。具體來看,一個包含k個變量的p 階滯后傳統VAR模型可以寫作公式:
其中yt=[y1,t, y2,t,…,yk,t]T,為k個時間序列變量組成的向量;ν是k×1階的截距向量;是k×k階的系數矩陣;?t是k×1階的隨機擾動向量。將VAR模型系數的估計值記為(ν?j,B?j ),則Lasso-VAR模型系數的估計值求解可以寫為公式:
其中,‖.‖是L1范數,即 ;‖.‖2是L2范數,即
在懲罰參數調諧方面,由于VAR模型是時間序列模型,使用交叉驗證會破壞變量間的時間依賴性,降低模型可解釋性和精確性,因此本文使用滾動驗證法選擇模型最優參數,并在調整參數過程中使用最小的均方預測誤差(MSFE)作為篩選指標,具體計算公式如下:
滾動驗證法具體操作如圖1所示。首先,利用1到 T1 的全部數據,構建以λk為參數的模型并進行預測;其次,不斷將數據范圍向前滾動,重復上步預測過程直到時間點 T2-1,計算出λk對應的MSFE;最后,根據最小的MSFE值選擇出對應的最優參數λ。
實證結果與分析
在構建模型前,本文首先對變量進行了差分、標準化處理和平穩性檢驗。考慮到在實際經濟和金融數據研究中,2階VAR模型通常已能較為有效地捕捉時間序列之間的相關影響,為兼顧模型準確性、復雜性和可解釋性,本文將VAR最大滯后階數設置為2,再由Lasso算法進行后續篩選,以避免向模型引入不必要的噪聲,引發過擬合問題。通過Lasso-VAR對變量進行建模后,對利差影響較小的噪聲變量的系數會被縮小至零,即如果變量對應的系數為非零值,則表明該變量對于利差的變化具有較為顯著的解釋作用。表1分別記錄了不同等級模型中各變量對應的系數;圖2中的柱形圖對變量系數進行更直觀的展示。由于變量經過標準化處理,模型中各自變量對應的系數大小也可以認為是各個自變量對于因變量解釋程度的大小。具體而言,各類變量對于信用債利差的影響主要有以下幾個方面。
第一,流動性指標對各等級信用利差均有重要影響,但長、短期流動性指標對利差的作用方向相反。本文分別使用社會融資規模、貨幣供應量和資金市場利率作為監測市場流動性水平的指標。其中,社會融資規模及M2更多反映實體經濟中長期限的融資需求和供給,質押式回購利率反映金融系統短時間內的資金充裕水平。從模型結果看,各等級的信用利差均與社融增速的一期滯后值呈現正相關關系,此外中低等級的信用債利差還與市場質押式回購利率的一期滯后呈現負相關關系;M2對于利差的解釋能力相對較弱。
總體而言,信用利差受市場的流動性指標的影響明顯,但不同的流動性指標對利差的作用方向有所不同,中長期流動性水平收緊推動信用利差增大;而短期資金水平收緊則使利差收窄。分析其原因,當實體經濟對于中長期的融資需求提升并使中長期流動性趨于收緊時,投資者會增加配置在未來更好交易的利率債產品,因此推動信用利差走擴;而當金融機構的短期資金水平收緊時,投資者為緩和短期流動性需求和考核壓力,傾向于優先處置流動性較好的利率債獲取資金,而非出售可能會因為快速變現而出現較大折價的中低等級信用債,進而導致利率債收益率在資金面變化時先于信用債收益率作出反應,形成信用利差的反向變化。
第二,違約率與中低等級信用利差正相關,且債券級別越低,違約率對利差相對解釋程度越高。結果表明,高等級債券利差的走勢相對獨立于信用環境的變化;中低等級債券利差則會根據市場違約情況作出相關調整。具體來看,AAA等級的利差模型中,違約率的一階滯后系數被縮減至零;AA+及以下級別的信用利差模型中,違約率的一階滯后參數均為正值。對中低等級債券而言,違約率的上升顯示市場的信用狀況趨于惡化,此時投資者在避險情緒驅動下,會提高對于信用溢價的要求,導致信用債的價格相對下跌,利差增大;相反,市場信用環境出現緩和,投資者則傾向于降低信用溢價要求,推動利差收窄。
對高等級主體而言,違約率變化不顯著影響利差走勢,這可能是由于高評級發行人的信用資質相對良好,即使市場信用狀況發生變化,投資者仍然預期發行人能免受市場連鎖反應影響維持兌付,不會顯著改變對于高等級債券的配置策略。如袁海霞等(2022)研究發現,雖然債券成交價格與違約率之間普遍存在相關關系,但部分發行人受“國企信仰”等因素影響,其債券定價對于信用風險環境變化的敏感度相對更低。此外,通過對比中低等級別利差模型的系數可以觀察到,與AA+和AA級別相比,AA-級別利差模型中違約率的系數絕對值在全部系數中相對更高,或顯示信用環境的變化對于低級別的利差影響更為顯著。
第三,部分經濟數據對于較低級別債券信用利差存在一定影響,但作用效果相對滯后。對于AAA和AA+級別債券而言,各項經濟運行指標并不會顯著影響其利差的走勢。但在AA和AA-級別利率模型中,經濟數據是影響利差運行的關鍵變量。具體來看,PMI變化的二階滯后顯著影響AA和AA-級別利差運行,工業增加值的二階滯后顯著影響AA-級別利差運行。與預期一致,經濟數據和利差主要呈負相關關系。經濟運行向好反映發債企業經營環境的改善,在此背景下,投資者對于未來企業違約概率的預期有所下降,引起信用利差收窄。值得注意的是,模型篩選后的經濟變量多為二階滯后而非一階,或顯示經濟數據對于利差的影響具有較其他變量更長的時滯效應。除直接描述經濟的數據外,作為間接反映經濟情況的指標,國債收益率對AA+級別以下信用利差同樣存在一定影響,且效果相對滯后。在考慮其他重要的變量后,通脹水平對于信用利差的解釋作用相對有限。
第四,權益市場與中低等級信用利差存在負向聯動。模型結果顯示,在AA+級及以下級別信用利差模型中,股票指數漲跌幅的二階滯后的系數均不為零,即股票市場波動是影響中低等級利差的關鍵因素之一。與股票指數漲跌幅相比,股票市場的波動率對利差影響相對較小。具體來看,信用利差變化與股票指數漲跌二階滯后主要呈現負相關關系,股票價格的上漲或推動后續利差收窄。從原因上看,當權益市場上升時,一方面信用債的違約回收率隨著發行人的市值增加而提升,改善了信用債的相對配置價值;另一方面權益市場高漲也顯示出此時投資者具有相對更高的風險偏好,促使市場追逐更高的票息收益,進而拉低信用利差。
圖3展示了Lasso-VAR模型對各等級信用利差的非樣本預測結果,黑色表示利差的實際數據,紅色表示模型的單步預測值。總體而言,模型預測結果與利差實際水平較為接近,對于債券市場參與者進行投資決策和風險監測具有一定參考價值。然而需要注意的是,盡管VAR模型在Lasso算法幫助下對現有數據呈現較好的預測效果,但由于時間序列模型具有平移外推的特點,未來在利用模型對利差情況進行預測時,仍然可能存在預測結果與實際情況存在偏離的問題,即歷史趨勢或難長期簡單重演。
因此,對于本文提出的Lasso-VAR模型后續或可從以下方面進行進一步完善:一是通過滾動樣本保持對模型參數的高頻更新,提高模型對變量相關性最新變化的適應能力,減少由于數據趨勢變化帶來的預測偏差;二是在模型中引入政策變化、新聞事件等突發事件變量,結合事件研究法等方式進行量化處理,幫助模型更好地捕捉未來可能發生的特定事件對利差預測結果產生的外部沖擊;三是對于違約率、經濟情況等樣本數據加以指數平滑處理,進一步降低時間序列的隨機波動特征,提高模型的預測性能。
總結
本文將機器學習Lasso算法與VAR模型相結合,剔除對利差影響較小的噪聲變量,對不同等級的企業債券定價模型進行降維,提高利差分析模型的準確率。根據模型系數結果,高等級的信用債利差主要受到中長期流動性的影響,而隨著債券信用等級的下降,短期資金流動性、市場信用環境和經濟增長等因素對于利差的解釋性隨之增強。
具體而言,信用利差影響因素的具體特征包括:一是流動性指標對信用利差均具有重要影響,中長期流動性水平下降推動信用利差增大,而短期資金水平的收緊則可能使利差收窄;二是違約率與中低等級信用利差正相關,當市場信用狀況趨于惡化,投資者在避險情緒驅動下提高對于信用溢價的要求,導致信用債的價格相對下跌,而高等級債券利差的走勢則相對獨立于信用環境的變化;三是PMI和工業增加值等部分經濟數據對于較低級別債券信用利差有顯著影響,且作用效果存在一定滯后性;四是股票市場漲跌是顯著影響中低等級利差的因素之一。
當前我國債券市場投資者對于信用利差的管理存在諸多挑戰。未來,隨著我國金融市場市場化機制的不斷推進,做好信用利差走勢預測和風險控制的重要性也將隨之提升,在利差計量技術方面具有優勢的投資者或能取得更穩定的經營機會。總體而言,本文提出的Lasso-VAR模型預測結果與利差實際水平較為接近,對于債券市場參與者進行投資決策和風險監測具有一定參考價值,可以幫助投資者在進行信用債投資時更具針對性地跟蹤市場相關變量,做好利率風險防范。
參考文獻
[1] 陳淼鑫,何彪. 信用利差與債券市場流動性的動態關系分析[J]. 金融與經濟. 2017(4).
[2] 戴國強,孫新寶. 我國企業債券信用利差宏觀決定因素研究[J]. 財經研究,2011(12).
[3] 劉春航,林學冠,陳璐. 銀行賬戶利率風險框架下的信用利差風險監管研究[J]. 金融監管研究,2015(2).
[4] 謝世清,張夢鴿. 城投債信用利差的宏觀影響因素研究[J]. 宏觀經濟研究,2023(2).
[5] 袁海霞,彭月柳婷,王晨. 債券價格對信用風險預警有效性的實證研究[J]. 債券,2022(2). DOI: 10.3969/j.issn.2095-3585.2022.02.015.
[6] AMATO J D, Eli M R. The Credit Spread Puzzle[J]. BIS Quarterly Review, 2003(4).
[7] HUANG J, NOZAWA Y, SHI Z. The Global Credit Spread Puzzle[J]. The Journal of Finance, 2022(1).
[8] MERTON R C. On the Pricing of Corporate Debt: The Risk Structure of Interest Rates[J]. The Journal of Finance, 1974(2).
[9] NICHOLSON W, MATTESON D, BIEN J. VARX-L: Structured Regularization for Large Vector Autoregressions with Exogenous Variables[J]. International Journal of Forecasting, 2017(3).
[10] TIBSHIRANI R. Regression Shrinkage and Selection Via the Lasso[J]. Journal of the Royal Statistical Society Series B: Statistical Methodology, 1996(1).