999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KMV-CatBoost增強的企業信用債券違約風險評估模型

2024-05-30 04:53:54王培培周小平陳佳佳王涵棋
關鍵詞:價值模型

王培培 周小平 陳佳佳 王涵棋

摘??要:?針對傳統預測模型對于企業信用債券違約預測準確率低、擬合效果差的問題,提出了基于Kaufman-Merton-Voss (KMV)-?Categorical Boosting (CatBoost)的企業債券違約預測模型. 首先對原始樣本數據進行預處理,降低噪聲數據對預測模型的影響;然后,利用KMV模型評估借款公司信用違約概率,計算公司資產市場價值與公司資產市場價值的波動率,獲得企業資產價值與違約點之間的差額Distance-to-Default(DD);最后,利用債務償還期限、短期無風險收益率、公司股權市場價值、公司債務面值計算出的違約距離,將其加入指標中,利用CatBoost算法預測企業信用債券違約風險,通過基于Ordered Boosting方式的CatBoost算法訓練模型,得到無偏梯度估計,以減緩預測偏移,從而增強模型的泛化能力. 實驗結果表明:基于KMV-CatBoost增強的模型能夠提高企業信用債券違約風險識別的準確率,識別正確率約為95.5%.

關鍵詞:?債券違約;?預測模型;?CatBoost;?Kaufman-Merton-Voss(KMV)

中圖分類號:?TP 183 ???文獻標志碼:?A ???文章編號:?1000-5137(2024)02-0247-07

An identification of default risk in corporate credit bonds based on KMV-CatBoost enhanced model

WANG Peipei,?ZHOU Xiaoping*,?CHEN Jiajia*,?WANG Hanqi

(College of Information,?Mechanical and Electrical Engineering,?Shanghai Normal University,?Shanghai 201418,?China)

Abstract:?Aiming at the problems of low accuracy and poor fitting effect of traditional prediction models for corporate credit bond default prediction,?a corporate bond default prediction model based on Kaufman-Morton-Voss (KMV)-Categorical Boosting (CatBoost)?was proposed. Firstly,?the original sample data was preprocessed to reduce the impact of noisy data on the prediction model. Secondly,?the credit default probability of the borrowing company was evaluated by using the KMV model. The market value of the companys assets and the volatility of it were calculated,?in order to obtain the Distance-to-Default (DD)?difference between the companys asset value and the default point. Finally,?the default distance was calculated by adding debt repayment period,?short-term risk-free return rate,?company equity market value,?and company debt face value to the indicators. The CatBoost algorithm was used to predict the default risk of corporate credit bonds. The model was trained using the Ordered Boosting based CatBoost algorithm to obtain unbiased gradient estimation,?which slowed down prediction bias and enhanced the models generalization ability. The experimental results showed that the KMV CatBoost enhanced model could improve the accuracy of identifying default risk in corporate credit bonds,?with a recognition accuracy of approximately 95.5%.

Key words:?bond default;?prediction model;?CatBoost;?Kaufman-Merton-Voss (KMV)

0 ?引言

國外對于企業信用風險的度量研究已取得了很多成果. LIN1證明了Logistic模型在風險識別時效性方面的優良性能. UMEZAWA等2利用神經網絡研究公司的信用決策和欺詐預防. ROSENBER等3利用Logit模型研究企業破產與違約之間的關系,得到了很好的結果. CAMARA等4的研究表明Kaufman-Merton-Voss(KMV)模型與其他幾種模型相比,能夠有效判斷企業的違約概率. NISHA等5利用Bolasso模型篩選特征,并采用隨機森林算法建立模型,研究結果表明所提出的模型具有良好的分類性能.

國內度量企業信用風險的研究晚于國外. 孫小麗等6-8利用相關數據基于KMV模型分析了信用風險. 朱小宗等9采用改進的Credit Metrics模型對我國銀行貸款的信用風險進行度量研究,最終得到適合于中國市場的新解析式. 楊穎10利用XGBoost算法對企業債發行主體進行違約風險研究,得到了對于信用風險識別度較高的信用下調模型. 王澤祺11利用Categorical Boosting(CatBoost)算法構建了債券違約風險識別模型,具有較強的識別與預測能力.周蓮芳12基于改進的反向傳播(BP)-KMV模型對民營企業債券違約風險進行了分析,研究結果表明該模型具有較好的預測能力,對于企業信用風險的度量具有一定的實際意義.

在企業信用債券違約風險的預測模型中,目前主要包括BP經網絡、支持向量機、KMV、XGBoost、LightGBM等模型. BP神經網絡模型雖然對樣本中的模糊數據不敏感,預測的結果具有一定穩定性,但是其結果容易受限于局部最優問題且學習速率慢13-14. 支持向量機模型在樣本數量較小的情況下,也能夠進行有效的學習,但是存在當缺失數據時,該模型容易出現欠擬合的情況. KMV模型采用了Black-Scholes-Merton(BSM)模型的正態分布假設,在企業市值無法真實體現企業價值時,其預測結果會出現較大的誤差15-17. XGBoost模型借鑒了隨機森林的做法,支持列抽樣,不僅能降低過擬合,還能減少計算量,但其預排序過程的空間復雜度過高18-20. LightGBM模型進一步對XGBoost模型進行了優化,提高了算法對噪聲數據的抗干擾能力21. CatBoost算法具有LightGBM與XGBoost模型大部分的優點,且其通過自身特點能夠降低模型過擬合的程度,提高模型的預測準確率及學習速率22.

為了提高對企業信用債券違約風險識別率,本文作者構建基于KMV-CatBoost模型來預測企業信用債券的違約風險. 首先對原始樣本數據進行預處理,降低噪聲數據等對預測模型的影響;然后,利用KMV模型評估借款公司信用違約概率,計算公司資產市場價值與公司資產市場價值的波動率,獲得企業資產價值與違約點之間的差額;最后,將債務償還期限、短期無風險收益率、公司股權市場價值、公司債務面值計算出的違約距離加入指標中,利用CatBoost算法23-24預測企業信用債券違約風險. 實驗結果表明:基于KMV-CatBoost增強模型能夠提高企業信用債券違約風險識別的準確率,增強擬合效果.

1 ?KMV模型

1.1 KMV模型的定義

KMV模型是由美國KMV公司開發并用于評估借款公司信用違約概率的模型15-17. 該模型認為債務到期時,公司的市場價值與債務價值的對比決定了借款公司能否到期按時償還債務,若資產價值大于債務價值,則借款公司有能力償還借款. KMV模型的建立依據是Black-Scholes-Merton期權定價理論,為現代金融體系的研究和發展奠定了基礎.

1.2 KMV模型的主要步驟

KMV的計算過程如下:

1)?計算公司資產市場價值與公司資產市場價值的波動率. KMV模型以BSM期權定價模型為基礎,構造了一個歐式看漲期權,根據該模型,公司的資產價值和股權價值的關系為:

, (1)

, (2)

, (3)

其中,表示公司債務面值(·)表示標準累計正態分布函數表示短期無風險收益率表示債務償還期限,為自然對數的底數.

由公司資產市場價值與股權價值相對彈性公式可以得出:

, (4)

其中,表示相對于公司主體資產的債券價值彈性;表示股權價值的增量;表示公司資產市場價值的增量.

變換后,可以得到公司股權市場價值波動率為:

. (5)

結合式(4),可表示為:

. (6)

聯立式(5)和(6),得到公司資產市場價值的波動率為:

. (7)

2)?確定違約點與計算公司的違約距離,即企業資產價值與違約點之間的差額. 從模型基本思想出發,當公司發生資不抵債時,極有可能產生違約行為. 通常短期債務產生的影響力大于長期債務,KMV定義公司債務違約點價值為:

, (8)

其中,為公司債務違約點價值表示公司短期債務價值為公司長期債務價值. 代入下面的公式,就可以得出違約距離為:

. (9)

3)?計算公司的期望違約概率. 因為我國發生實際違約的公司數量相對較少,期望違約概率計算不夠準確,故將違約距離作為衡量公司是否發生債券違約的依據.

2 ?模型構建

2.1 指標因子的選取

根據孫琦25對中小企業信用風險預測的研究,首先從宏觀經濟、財務指標以及債券自身屬性3個方面選取指標進行研究. 由于單個指標難以準確預測違約風險,盡可能多選指標從各個方面綜合反映債券違約公司的特征. 在原本的指標序列中加入KMV模型中的違約距離.

2.2 原始樣本數據處理

2.2.1 缺失值處理

若單條數據中缺失值過多,則刪除該條數據;否則,用對應年份的行業數值進行替換.

2.2.2 噪聲數據處理

噪聲數據是指錯誤或者異常的數據,這些數據會導致樣本整體分布出現偏差,從而影響模型預測的精度與準確性,故將其直接刪除.

2.2.3 不平衡數據處理

盡管CatBoost可以解決模型過擬合的問題,但是在實際情況中,上市公司中未違約公司的數量多于違約公司的數量,若使用不平衡的樣本數據對模型進行擬合,會使模型的預測結果更加偏向不發生違約.采用自適應合成采樣(ADASYN)方法,先分析樣本數據中易于學習的違約公司樣本,再處理剩余難以學習的違約公司樣本,具體流程如下:

首先,計算需要生成的違約公司樣本數量G,設原始企業數據序列為經過缺失值處理與噪聲數據處理過后,得到新的企業數據序列,則

, (10)

其中,未違約公司樣本數量;是違約公司樣本數量;為隨機數,若=1,采樣后正、負樣本比例為1∶1.

再計算K近鄰中未違約公司的占比為:

, (11)

其中K近鄰中未違約公司的樣本數,. 對進行標準化:

. (12)

根據樣本所屬的權重,每個違約公司生成新樣本所需的樣本數為:

. (13)

在每個待合成的違約公司樣本周圍k個鄰居中選擇1個違約公司樣本,根據如下公式進行合成:

, (14)

其中,是通過上述步驟后合成的樣本類是違約公司樣本中的第個小樣本K近鄰中的樣本中隨機選擇的一個違約公司樣本之間的隨機數. 重復合成違約公司樣本,直到滿足式(13)為止.

2.3 KMV-CatBoost模型

假設最終經過數據處理過后的企業信用債券相關樣本為包括中未違約公司樣本,以及經ADASYN方法處理后的違約公司樣本,最終輸入KMV-CatBoost模型的序列為,其中為對應的真實值即是否違約的判定結果,是選取的企業數據指標對應的數據.對每個樣本,CatBoost算法生成一組回歸樹,預測其是否違約23-24,并計算得到不同回歸樹對違約情況的預測結果:

, (15)

其中,是預測的結果(·)代表回歸樹的預測函數. 由于回歸樹的結構以及葉子節點的權重不同,所生成的回歸樹對價差的預測能力有所不同.

CatBoost的目標是讓違約情況預測結果與真實情況的差異最小化,

, (16)

其中,是企業數據樣本中預測結果與真實違約情況差異的度量(·)表示正則項,用來提高預測結果的穩健性,

, (17)

其中,用于控制葉節點的個數;代表決策樹的葉節點的個數;為固定系數,用于控制葉子的權重,代表葉子權重. 為提高CatBoost模型的擬合性能,把目標函數用泰勒二階近似展開:

, (18)

則CatBoost的目標函數(16)表示為:

, (19)

其中,分別代表損失函數(·)的一階以及二階導數表示樣本所在的葉子區域,在給定回歸樹結構為的情況下,最優葉子權重和目標函數為

, (20)

. (21)

3 ?KMV-CatBoost模型評估

3.1 評價指標

判斷企業信用債券是否違約屬于分類問題,結果為違約或不違約,因此預測的結果與真實的情況只有4種組合:真實值與預測值均為正樣本(TP)、真實值為負且預測為正樣本(FP)、真實值為正且預測為負樣本(FN)、真實值與預測值均為負樣本(TN). 使用常見的4種評價指標來衡量模型,分別為AUC值、準確率A、精確率P及召回率R.

AUC值為受試者工作特征(ROC)曲線下與坐標軸圍成的面積,AUC越大,模型的分類效果越好.

準確率A為預測正確的樣本占所有樣本的比例,即所有樣本中被預測為違約且確實違約和被預測為未違約且確實未違約樣本的占比,

. (22)

精確率P為所有預測為正樣本中真實值為正的比例,即所有預測為違約樣本中實際發生違約的占比,

. (23)

召回率R為所有正樣本能夠被模型成功識別的概率,即所有實際違約樣本被預測為違約的可能性,

. (24)

3.2 模型預測結果

使用2014—2019年的企業樣本數據來預測2015—2020年企業的違約情況,共200個測試樣本,其中有175個是未違約的債券,25個是違約的債券,原始的樣本數據經過缺失值處理、噪聲數據處理以及不平衡數據處理過后,輸入到KMV-CatBoost算法模型中,最終識別出169個不違約債券以及22個違約債券,6個實際不違約債券被識別為違約債券,3個實際違約債券被識別為不違約債券.

3.3 模型對比

選取Logit、BP神經網絡及XGBoost模型與所提出的KMV-CatBoost模型進行對比,對比結果如表1所示,可以看出KMV-CatBoost模型的APR指標均高于所對比的模型.

4 ?結語

結合KMV模型的違約距離構建了基于KMV-CatBoost框架的企業信用債券評估模型,首先對輸入的原始數據進行數據處理,通過所提出的KMV-CatBoost模型計算得到預測結果. 通過與Logit、BP神經及XGBoost模型的實驗對比,結果表明:所提出的KMV-CatBoost模型在準確性與預測精度上都有所提高,證明了KMV-CatBoost模型的有效性,可以較好地檢驗企業的信用違約風險程度.

參考文獻:

[1] LIN T.A cross model study of corporate financial distress prediction in Taiwan:?multiple discriminant analysis,?logit,?probit and neural networks models [J]. Neurocomputing,?2009,72(16/17/18):3507-3516.

[2] UMEZAWA Y,?MORI H. Credit risk evaluation of power market players with random forest [J]. IEEE Transactions on Power and Energy,?2008,128(1):165-172.

[3] ROSENBERG E,?GLEIT A. Quantitative methods in credit management:?a survey [J]. Operations Research,?1994,42(4):?589-613.

[4] CAMARA A,?POPOVA I,?SIMKINS B. A comparative study of the probability of default for global financial firms [J]. Journal of Banking and Finance,?2012,36(3):717-732.

[5] NISHA A,KAUR P D. A Bolasso based consistent feature selection enabled random forest classification algorithm:?an application to credit risk assessment [J]. Applied Soft Computing,?2019,86:105936.

[6] 孫小麗. 基于KMV模型的商業銀行信用風險測算研究?[D]. 北京:?北京郵電大學,?2013.

SUN X L. Research on calculation of commercial banks credit risk based on KMV model [D]. Beijing:?Beijing University of Posts and Telecommunications,?2013.

[7] 毛瑩,?柳云凱,?陸思穎,?等. 基于修正KMV模型的我國信用債券違約風險度量?[J]. 現代商業,?2021(5):145-147.

MAO Y,?LIU Y K,?LU S Y,?et al. Default risk measurement of credit bonds in China based on revised KMV model [J]. Modern Business,?2021(5):145-147.

[8] 徐晨晨. 基于KMV模型的信用債違約風險研究?[D]. 濟南:?山東大學,?2019.

XU C C. Research on credit bond default risk based on KMV model [D]. Jinan:?Shandong University,?2019.

[9] 朱小宗,?張宗益,?耿華丹. 現代信用風險度量模型剖析與綜合比較分析?[J]. 財經研究,?2004(9):33-46.

ZHU X Z,?ZHANG Z Y,?GENG H D. An anatomy and comprehensive comparison analysis of current creditrisk measurement models [J]. The Study of Finance and Economics,?2004(9):33-46.

[10] 楊穎. 基于XGBoost分類算法的企業債發行主體違約風險研究?[D]. 杭州:?浙江大學,?2019.

YANG Y. Research on default risk of corporate bond issuers based on XGBoost algorithm [D].Hangzhou:?Zhejiang University,?2019.

[11] 王澤祺. 基于CatBoost算法的公司債券違約風險識別研究?[D]. 太原:?山西財經大學,?2022.

WANG Z Q. Research on identification of corporate bond default risk based on Catboost algorithm [D]. Taiyuan:?Shanxi University of Finance and Economics,?2022.

[12] 周蓮芳. 基于改進BP-KMV模型的民營企業債券違約風險分析?[D]. 南京:?東南大學,?2021.

ZHOU L F. Bond default risk analysis of private enterprises based on improved BP-KMV model [D]. Nanjing:?Southeast University,?2021.

[13] RUMELHART D,?HINTON G,?WILLIAMS R. Learning representations by back-propagating errors [J]. Nature,?1986,?323:?533-536.

[14] NING J G ,?FENG Y B ,?REN H L,?et al. Prediction model for the failure behavior of concrete under impact loading base on back propagation neural network [J]. Construction and Building Materials,?2024,411:134297.

[15] ZUO J C.Research on the credit risk of listed companies based on KMV model:?taking Gree electric appliances as an example [J]. Academic Journal of Business Management,?2023,5(10):25-29.

[16] YAN B Z,?BAI P X. Research on credit risk assessment of commercial banks based on KMV model [J]. Social Sciences,2021,10(5):204-217.

[17] WANG J Z,?ZHANG H P,?LUO H. Research on the construction of stock portfolios based on multiobjective water cycle algorithm and KMV algorithm [J]. Applied Soft Computing Journal,?2022,115:115-134.

[18] CHENT Q,GUESTRIN C. XGBoost:?a scalable tree boosting system [C]// International Conference on Knowledge Discovery and Data Mining. San Francisco:?ACM,?2016:785-794.

[19] WANG Y L,?JIANG W H. Application of XGBoost model in the field of diabetes prediction [J]. Advances in Computer,?Signals and Systems,?2023,7(8):29-36.

[20] WANG Z D,?WU X H,?WU H. A spatiotemporal XGBoost model for PM2.5 concentration prediction and its application in Shanghai [J]. Heliyon,?2023,9(12):e22569.

[21] MACHADO M R,?KARRAY S,?DE SOUSA I T. LightGBM:?an effective decision tree gradient boosting method to predict customer loyalty in the finance industry [C]// International Conference on Computer Science & Education. Toronto:?ICCSE,?2019:1111-1116.

[22] ZENG X R,?ABDULLAH N,?LIANG B X. A widely applicable and robust LightGBM:artificial neural network forecasting model for short-term wind power density [J]. Heliyon,?2023,9(12):e23071.

[23] PROKHORENKOVA L,?GUSEV G,?VOROBEV A,?et al. CatBoost:?unbiased boosting with categorical features [C]//Advances in Neural Information Processing Systems. Montreal:?NIPS,?2018:6638-6648.

[24] DOROGUSH A V,?ERSHOV V,?GULIN A. CatBoost:?gradient boosting with categorical features support [J/OL]. arXiv:1810.11363,?2018 [2023-10-10]. https:// arxiv.org/abs/1810.11363.

[25] 孫琦. 基于卷積神經網絡的中小企業信用風險預測模型研究?[D]. 北京:?北京交通大學,?2019.

SUN Q. Research on credit risk prediction model of small and medium-sized enterprises based on convolutional neural network [D]. Beijing:?Beijing Jiaotong University,?2019.

(責任編輯:包震宇,郁慧)

DOI:?10.3969/J.ISSN.1000-5137.2024.02.016

收稿日期:?2023-12-23

基金項目:?上海市科學技術委員會項目(22142201900)

作者簡介:?王培培(1989—),?女,?講師,?主要從事人工智能算法方面的研究. E-mail:630184725@qq.com

* 通信作者:?周小平(1981—),?男,?副教授,?主要從事信息技術算法方面的研究. E-mail:zxpshnu@163.com;陳佳佳(1986—),女,?講師,?主要從事信息處理方面的研究. E-mail:xinning_316@163.com

引用格式:?王培培,?周小平,?陳佳佳,?等. 基于KMV-CatBoost增強的企業信用債券違約風險評估模型?[J]. 上海師范大學學報?(自然科學版中英文),?2024,53(2):247?253.

Citation format:?WANG P P,?ZHOU X P,?CHEN J J,?et al. An identification of default risk in corporate credit bonds based on KMV-CatBoost enhanced model [J]. Journal of Shanghai Normal University (Natural Sciences),?2024,53(2):247?253.

猜你喜歡
價值模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
踐行初心使命的價值取向
當代陜西(2019年18期)2019-10-17 01:48:58
價值3.6億元的隱私
華人時刊(2019年23期)2019-05-21 03:31:36
一粒米的價值
“給”的價值
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
一個相似模型的應用
主站蜘蛛池模板: 激情六月丁香婷婷| 很黄的网站在线观看| 欧美成人区| 亚洲中文字幕97久久精品少妇| 美女被操91视频| 国产女同自拍视频| 少妇露出福利视频| 精品国产污污免费网站| 911亚洲精品| 亚洲精品人成网线在线| 国产流白浆视频| 亚洲成AV人手机在线观看网站| 国产福利微拍精品一区二区| 亚洲αv毛片| 潮喷在线无码白浆| 野花国产精品入口| 又爽又大又光又色的午夜视频| 国产乱子伦精品视频| 欧美高清国产| 国产9191精品免费观看| 国产91在线|中文| 日本精品一在线观看视频| 98精品全国免费观看视频| 国产精品人人做人人爽人人添| 成人综合网址| 国产色伊人| 国产精品欧美日本韩免费一区二区三区不卡 | 视频一区视频二区中文精品| 国产人人射| 亚洲精品图区| 日本免费a视频| 国产精品一区不卡| 婷婷色丁香综合激情| 中国精品自拍| 视频一本大道香蕉久在线播放| 毛片大全免费观看| 中文字幕久久精品波多野结| 97在线观看视频免费| 免费无码AV片在线观看中文| 小说 亚洲 无码 精品| 国产精品美人久久久久久AV| 精品国产一二三区| 自偷自拍三级全三级视频| 天堂亚洲网| 黄色一级视频欧美| 国产在线自乱拍播放| 欧美视频在线播放观看免费福利资源 | 高清不卡一区二区三区香蕉| 免费看的一级毛片| 制服丝袜一区| 欧美国产成人在线| 曰韩人妻一区二区三区| 午夜无码一区二区三区在线app| 国产成人精品18| 国产无遮挡猛进猛出免费软件| 一本大道AV人久久综合| 欧美色伊人| 亚洲欧美成aⅴ人在线观看| 亚洲第一色网站| 一级毛片基地| 国产在线91在线电影| 91亚洲视频下载| 国产成人精品一区二区免费看京| 成人国产精品视频频| 亚洲欧美另类日本| 日韩资源站| 精品亚洲麻豆1区2区3区| 国产成人精品免费视频大全五级| 国产精选自拍| 免费一级成人毛片| 青青青国产免费线在| 热re99久久精品国99热| 成人精品亚洲| 一区二区三区四区精品视频| 欧美日韩国产成人高清视频| 亚洲欧美一区二区三区蜜芽| 欧美国产精品不卡在线观看| 男女男精品视频| 久久综合久久鬼| 91精品国产91久无码网站| 亚洲va欧美ⅴa国产va影院| 日本a级免费|