吳燁
前言
半個世紀以來,我國債券行業發展迅速,從二十世紀八十年代初啟動國債和企業債的發行,2005年第一批短期融資債券發行,再到2015年證監會出臺《公司債券發行與交易管理方法》,證明我國證券市場正在不斷發展壯大。由百度百科最新數據顯示:2001年我國債券凈供應只有不到4000億人民幣,但到2012年就已超過3.9萬億人民幣;2001年時唯有五個企業發行凈融資48億人名幣的信用債,到如今僅僅單月信用債凈供給就逼近4000億人名幣。截止到2018年12月,國際清算銀行統計顯示中國債券市場余額達8380000億人民幣,在亞洲排名第二、全球排名第三,此中公司信用類債券余額排在亞洲首位、全球排名第二。儼然已經發展為世界中頗具規模且占有相當地位的債券交易市場。
一、債券及債券風險
(一)債券相關定義
債券是政府、銀行、企業等向社會籌集資金時,按法定程序向投資者刊行并應諾依照必需的利率支付息金于指定日清償還本金的有價證券。債券按照發行人來歸類,首先可先考慮發行的主體:國家、中央銀行、政策性銀行、金融或非金融企業,其發行的債券分別是國債、中央銀行票據、政策性金融債券和企業債券。其中因為國債、央行票據和政策性金融債券發行的主體,它們的信用風險基本不被投資者考慮,也常被人稱為“利率債券”。除此,近年來發展迅速的企業債,由于其發行企業可能存在的違約性和不確定性,投資者在投資時必須考慮其信用風險,因此常有人把企業發行的債券稱之為“信用債券”。
(二)債券信用風險概述
按照驅動因素,將投資債券帶來的風險分為信用風險、市場風險、流動性風險、操作風險。此中信用風險在風險領域中常被人認為是年代最久遠的一種金融風險,它是指受信人因為自身的一些原因未依照簽訂契約上的規定履行相應的義務,給授信人帶來的風險。在債券領域里多發生于信用債券操作中,多年來世界范圍內由于信用問題導致的違約事件層出不窮,因此,信用風險也是近現代金融風險之中最需要引起人們重視的一種風險,它在各種金融風險之中總是位列首位。本文將著重圍繞債券風險中公司企業的信用風險來開展內容。
二、研究意義
雖然我國對債券信用風險評估有建立相對完備的信用評估體系,通過選用相應的模型、選用指定指標計算可能的違約率,但在評估過程中對其中眾多信息所產生數據的管理確十分不到位,很多時候會導致效率不高,預測不夠準確。對此,新興的機器學習算法或許可以在一定程度上緩解這個問題,提高風險評估模型的準確性和效率。通過使用大量數據對機器進行“訓練“,使其建立一種模式,對下一次是否會發生債券違約進行更加準確的判斷。另外,機器學習方法在個人信用評級和其他平臺的借貸違約預測上得到越來越多的研究,但在債券市場違約風險預測評估這一方面,并沒有很多詳細說明結合預測的文章,本文希望結合近年來發展頗快且回報頗高的機器學習算法來預測債券市場風險,以此也豐富了債券信用風險預測的框架。
三、機器學習在債券風險評估中研究
(一)模型的選擇
主要運用機器學習來對個人信用風險做出評估預測。以機器學習為工具,選用多項式Logistic回歸、決策樹、神經網絡、隨機森林這四種各異的算法來建立模型,以此來對個人信用風險進行評估。最后對得出的結果數據進行比較,從而觀察哪一種機器學習方法更有優勢,并對最后的結果做出原因分析,對于模型存在的不足之處給出相應的意見。選用的多項式Logistic回歸、決策樹、神經網絡、隨機森林機器學習方法在目前已經比較成熟,國內外的學者都已經做過種機器學習方法的相關研究,已有人把這些算法運用到信用評級上去。且每種方法都有對應的軟件可以進行操作,無需擔心算法過于復雜而無法得到結果。
(二)操作流程
對與機器學習在個人風險評估的過程中,首先選取內容符合且數量相對合適的數據。其次選用多項式Logistie回歸、決策樹、神經網絡、隨機森林這四種機器學習算法分別構建四種算法對應的模型。之后對于四種不同的模型,選用不同的參數估計法進行參數估計。最后利用一些操作軟件,如Eviews、SPSS、R等,操作得到模型的估計結果。再對結果進行比較,這其中分為數據層面的對比分析和模型層面的對比分析,最后對模型進行評價分析。這樣就將機器學習應用到了債券風險預測當中。
(三)模型結果預測
本文將更傾向于使用Logistic回歸能得到不錯的預測概率,因為在債券風險評估中,其結果通常會被認定為“違約”或者是“不違約”,本質上是一個二分類問題。對于這種問題,Logistic回歸無疑是一種非常好的評估選擇,因為其本身適用的范圍就是二分類問題,且最后結果的解釋性也很強,通過特征值的權重就可知這些特征對是否違約的影響大小,一般特征權重越高,對是否違約的影響越大。