崔玉征 朱忠念
摘要:隨著債券市場信用違約常態化,一些證券公司發生了信用風險事件。證券公司的信用風險管理水平通常較難識別,但隨著數字金融技術的發展,借助另類數據有助于分析其信用風險管理水平。本文通過選取司法訴訟、資產減值損失、信用減值損失三類數據,對證券公司的信用風險管理水平進行分析。結果表明,信用風險管理水平相對較高的證券公司占比約為28%,大多數證券公司的信用風險管理水平需要進一步提升。建議證券公司建立線上與線下相結合的信用風險評估體系,以更好地適應信用評估的實際需要。
關鍵詞:證券公司??債券違約??信用風險管理能力
信用債市場進入違約常態化階段
自2014年“11超日債”違約以來,中國債券市場進入信用違約周期,尤其是自2018年以來,每年債券市場的違約金額均在1200億元以上,信用債市場進入違約常態化階段。圖1為按年度統計的違約債券金額、只數及其增速分布圖,圖2為按季度統計的違約債券金額、只數及其增速分布圖。
萬得(Wind)數據顯示,截至2021年6月30日,全市場存量債券發行主體約為6170家,其中已違約主體為177家,違約主體數量占比為2.87%(見表1)。從評級來看,違約債券及違約主體占比最高的債券評級均為AA-及以下,AAA級債券違約占比相對較低。從違約債券金額來看,2020年新增債券違約金額為1757.96億元,同比增長40.13%;2021年上半年,新增違約債券金額為967.27億元,同比增長47.61%,信用債券市場仍面臨著較大的違約壓力。
外部評級機構作為債券市場信用風險預警的重要“守門人”,在多數情況下并未對信用違約事件作出有效預警,得出的評級結果也并未反映企業真實的信用風險狀況,因而該結果也未被投資者用于風險定價。筆者分別統計國內的外部評級機構得出的相同信用等級發債主體所發行債券票息的最大值、最小值、平均數、中位數,以及國際三大信用評級機構對中資美元債評級結果所對應債券發行票息的最大值、最小值、平均數、中位數,繪制了雷達圖(見圖3、圖4)。
由圖3可見,國際三大信用評級機構得出的信用評級可用于風險定價,即信用等級高表示企業信用資質較好,融資成本低;信用等級低表示企業信用資質較差,融資成本高。而國內評級機構得出的評級結果并未顯示清晰的分層結構,很難用于風險定價。
在國內信用債券市場風險定價機制有待改進的情況下,一些證券公司也發生了信用風險事件。證券公司作為債券市場的重要參與者和專業機構投資者,其信用風險管理水平至關重要。證券公司的信用風險管理水平通常較難識別,但隨著數字金融手段的不斷發展,特別是互聯網爬蟲技術、文本處理技術的不斷進步,利用大數據即可方便地獲得證券公司的很多輿情信息。利用這些輿情信息所構成的另類數據,可從數字金融的視角來評估證券公司的信用風險管理水平。筆者基于業務實踐,將對此進行探討。
借助另類數據方法評估證券公司的信用風險管理水平
受篇幅所限,本文所列舉的另類數據主要包括司法訴訟、資產減值損失、信用減值損失三類。下文中將對另類數據方法的基本原理及操作步驟進行介紹。
(一)證券公司樣本選擇
為方便獲取數據,筆者只選擇已上市的50家證券公司作為樣本,探討如何應用數字金融方法來分析證券公司的信用風險管理水平。
(二)另類數據獲取
隨著互聯網爬蟲技術的低門檻化,市場上有很多成熟的大數據公司提供另類數據的接口服務,如企查查、天眼查等。爬蟲技術也有基于Python編程語言開發的成熟框架Scrapy。根據筆者多年的技術經驗,建議采用Scrapy爬蟲直接爬取企查查的司法訴訟接口,來獲取每家證券公司的司法訴訟數據。
(三)指標提取
指標提取包括兩部分。一部分是通過Scrapy獲取的互聯網數據,主要是通過文本挖掘、關鍵字匹配等技術來提取結構化指標,在此主要提取以證券公司作為原告的訴訟金額數據(以下簡稱“訴訟金額”)。因為在證券公司發生信用風險事件時,買方通常會采用主動訴訟的方式來挽回可能發生的損失。另一部分是通過Wind獲取證券公司資產減值損失和信用減值損失。在新會計準則實施之前,證券公司的信用風險損失一般記在資產減值損失科目;在新會計準則實施之后,信用風險損失全部計入信用減值損失科目。為保持數據的連續性,筆者使用資產減值損失與信用減值損失的合計值來衡量證券公司的信用風險損失,并在下文統稱為“信用減值損失”。
(四)樣本標簽
為使用統計方法檢驗指標的顯著性和開發分類模型,需要對每家證券公司進行標記。此處,筆者僅說明模型開發的基本原理。為簡單起見,筆者將信用減值損失與凈利潤的比值這個指標值的前20%標記為“壞樣本”,用“1”表示;將其余樣本標記為“好樣本”,用“0”表示。
(五)顯著性檢驗
在開發模型之前,通常需要對原始變量進行編碼,以實現原始變量離散化,并將原始變量轉換為WOE1變量。第i組的WOE計算方法為:
第i組的IV計算方法為:
整個變量的。通常情況下,如果變量的IV值大于0.5,表明該變量是顯著的,可以作為入模指標。
(六)評估方法
鑒于國內債券市場信用違約始于2014年,在進行數據搜集和處理時,綜合考慮數據的完整性并能真實、有效地反映證券公司的信用風險管理水平。筆者統計了2015—2020年50家上市證券公司的信用減值損失和訴訟金額。樣本總體分布圖見圖5。
經過上述顯著性檢驗,筆者發現信用減值損失與凈利潤的比值的平均值、訴訟金額與凈利潤的比值這兩個指標的IV值均大于1。因此,這兩個指標均可作為入模指標。
筆者開發模型的目標是評估證券公司信用風險管理水平的高低,目標變量是二元分類變量,自變量是數值變量。因此,筆者使用邏輯回歸函數來開發邏輯回歸模型,以量化評估證券公司的信用風險管理能力。
邏輯函數的定義為:
當時,,邏輯函數的分布圖見圖6。
上述邏輯函數中的z即為圖5中橫坐標軸的評分,f(z)即為縱坐標軸的概率。由于縱坐標軸的取值范圍是0~1,假設用p表示,則有:
經過簡單的變換,上式可變為:
將樣本經過二元邏輯回歸擬合后得到的通用表達式為:
變量
為名義變量,即為上文中提到的兩個指標(信用減值損失與凈利潤比值的平均值、訴訟金額與凈利潤的比值)。這兩個名義變量不能直接進行邏輯回歸擬合,而是使用其WOE變量進行回歸擬合。假設其分組變量如表2所示。
上式表示,在對WOE變量進行邏輯回歸后,得到的評分模型結構如下:
第一,賦予每個主體一個基礎分值;第二,如果變量取值為,則將增加()分,如果變量取值為,則將增加()分,以此類推;第三,在每個變量都取得對應類別的值后,將所有變量得分匯總,即可得到最終得分z。樣本總體分數的分布圖見圖7。
將上述分數帶入邏輯函數,即可為每家證券公司計算得到一個數值,該數值在0~1的范圍。數值越接近0,說明該證券公司的信用風險管理水平越高;數值越接近1,說明該證券公司的信用風險管理水平越低。
結論及建議
筆者通過定量分析發現,信用風險管理水平相對較高的證券公司占比約為28%,而大多數證券公司的信用風險管理水平需要進一步提升。
隨著信用違約趨于常態化,結合國內信用評估的現狀,筆者建議證券公司建立線上與線下相結合的信用風險評估體系,以更好地適應信用評估的實際需要。其中,線上是指主要采用大數據、人工智能等科技手段搜集發債主體的輿情數據,以對發債主體可能出現的經營惡化、現金流緊張等情況及時預警;線下是指傳統的盡職調查方法,多了解發債主體的最新非線上輿情和經營進展。筆者通過總結多年的實踐經驗發現,線上與線下相結合的信用風險評估體系比較適宜在國內應用。證券公司可根據自身發展實際,建立適合自身的、與時俱進的信用評估體系,進而為股東創造更大的價值。
注:
1.通過計算每個指標IV并用于判斷該指標的顯著性時,需要先計算WOE,然后才能計算得到IV值,因此WOE是計算IV時的中間變量;原始自變量中并未包含因變量的任何信息,而WOE變量則包含了因變量中樣本標簽的信息;對WOE變量進行邏輯回歸時,可以較方便地得到評分模型,而不需要再做其他轉換。
作者單位:深圳華潤元大資產管理有限公司
責任編輯:涂曉楓??鹿寧寧??印穎