999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Isomap融合樸素貝葉斯分類器的信用預測

2021-02-28 11:53:54許義仿陳晉李林張波司思思
電腦知識與技術 2021年35期

許義仿 陳晉 李林 張波 司思思

摘要:因為金融數據存在海量、高維度、非線性的特點,所以如何選擇原始數據中的本質特征關系到分類器的精度。本文提出了一種基于Isomap算法的樸素貝葉斯分類器。該算法的核心本質是對高維大樣本的金融數據運用Isomap算法進行降維處理,進而在此基礎上運用樸素貝葉斯分類算法進行分類。選取1069家公司的財務指標數據進行實證分析,結果證明該分類器的預測準確率優于樸素貝葉斯分類器。

關鍵詞:Isomap;樸素貝葉斯;信用風險評估

中圖分類號:TP311 ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)35-0125-02

1 引言

信用評估指的是信用評估機構使用專家判斷和數學分析方法, 對企業或個人履約各種承諾能力、詳細評價其信譽程度, 并用簡潔的文字或符號表達出來,進而滿足贖回需要的市場行為。

鑒于此,本文在現有的研究基礎上針對非線性、高維度的財務數據提出了基于Isomap的樸素貝葉斯(ISOMAP-NB)信用評估模型, 把數據降維當成數據預處理中的一步,簡化了樸素貝葉斯分類模型的結構, 并選取了1069家企業的財務指標數據集進行實證研究,結果證明該模型好于樸素貝葉斯分類模型,在企業信用預測方面提高了預測的準確率。

2 ISOMAP-NB模型

2.1 Isomap 算法

Isomap算法是在多維尺度變換(MDS)的根基之上,力圖保持數據點的內在幾何性質,也就是說保持2點間的測地距離。

Isomap算法步驟如下[1]:

步驟1 算出樣本點之間的歐氏距離矩陣, 構建鄰域關系圖[GV,E],對每個[xi(i=1,2,...,N)]計算其[k]近鄰[xi1,xi2,…xik], 記為[Nj], 以點[xi]為定點, 歐氏距離[d(xi,xij)]為邊, 建立鄰域關系圖[GV,E]。

確定近鄰點有2種方法:

i) 利用[ε-]近鄰法, 如果[xi-xj2≤ε],則點對[xi,xj]可視為近鄰點.

ii) 利用[k-]近鄰法, 事先給定近鄰個數[k], 然后確定近鄰點。

步驟 2 計算測地距離[D=(dij)n×n],在近鄰關系圖[GV,E]中尋找最短路徑,即:

[dij=dij?xj∈Ni or xi∈Nminkdij,dik+dkjotherwise]

步驟3 對距離[D=(dij)N×N]運用古典MDS方法,求出最低維嵌入[Y={y1,y2,...,yN}]。

2.2 樸素貝葉斯分類算法

樸素貝葉斯的分類說明步驟如下[2-4]:

(1) 把每個數據樣本數值化,用一個[n]維特征向量[X={x1,x2...xn}]表示樣本屬性的[n]個度量。

(2) 假定[m]個類[C1,C2,...,Cm]。給定一個待分類的樣本[X], 根據貝葉斯定理可得樣本[X]的概率為:

[P(Ci|X)=P(X|Ci)P(Ci)P(X)]

(3) 由于[P(X)]對所有類都是常數,即只需[P(X|Ci)P(Ci)]最大。假如類的先驗概率不明,則通常情況下這些類是等概率的。即[P(C1)=P(C2)=...P(Cm)],所以只需[P(X|Ci)]為最大。

(4) 為了計算[P(X|Ci)],我們往往做類條件獨立的樸素假定. 則:

[P(X|Ci)=k=1nP(Xk|Ci)]

即概率[P(X1|Ci),P(X2|Ci),…P(Xn|Ci)]由訓練樣本估計,其中:

i) 如果[Ak]是分類屬性,則:

[P(Xk|Ci)=SikSi]

其中[Sik]是屬性[Ak]上具有[Xk]的類[Ci] 的訓練樣本數, 而[Si]是[Ci]中的訓練樣本數;

ii) 假如是連續屬性, 則往往假設該屬性服從高斯分布。 因而:

[P(Xk|Ci)=g(xk,uci,σci)=12πσcie(x-uci,)22σci2]其中給定類樣本的[Ci]的訓練樣本屬性[Ak]的值[g(xk,uci,σci)]是屬性[Ak]的高斯密度函數,因而[uci],[σci]分別為平均值和密度差。

(5) 對未知樣本[X]分類, 計算[P(X|Ci)P(Ci)],比較[P(X|Ci)P(Ci)]與[P(X|Cj)P(Cj)],如果[P(X|Ci)][P(Ci)>] [P(X|Cj)P(Cj)],則[X]被分到[Ci]類中,反之則分到[Cj]。

3 實證分析

3.1 研究樣本的獲取

我們利用在滬深交易所上市的1069家企業2015年的財務指標數據(數據均選自新浪財經),并從其中選用了15個財務指標當成關鍵變量,且這15個指標都是數值型屬性變量, 類變量是有兩個狀態{good, bad}, 相應地將1069家企業劃分為兩類:good, 代表“具有信用好的條件”的企業和bad表示“不具有信用好的條件”的企業. 并從其中抽取769個樣本作為訓練集, 剩下300個樣本作為測試集。

3.2 指標體系的選擇

財務指標指的是企業概括和評價財務狀況和經營成果的相對指標。我們往往通過分解和解剖企業的財務指標對企業經濟效益的好壞做出準確的評價與推斷,用來判定銀行是否貸款給這些企業。

經過研究文獻[5-7]以及大公國際信用評級的關鍵財務指標,本文選取了上市公司的15個財務指標。這15個財務指標分為四大類:償債能力指標(現金比率、流動比率、資產負債率、速動比率)、運營能力(存貨周轉率、流動資產周轉率、應收賬款周轉率)、盈利能力(凈資產收益率、毛利率、凈利率、每股主營業收入)、發展能力(股東權益增長率、凈資產增長率、總資產增長率、每股收益增長率)。

3.3 構建ISOMAP-NB模型

通過Isomap算法對數據進行降維并將其當成樸素貝葉斯分類算法的前置數據預處理系統。對非線性、高維度的企業財務樣本實行降維處理,進而精簡了樸素貝葉斯分類模型結構,減少訓練時間, 提高分類精度。

融合Isomap數據降維的樸素貝葉斯分類模型架構圖如圖1所示。

算法描述如下:

(1) 指標體系的建立:從財務數據庫中選取描述企業信用級別的指標。

(2) 特征提取:利用Isomap算法減小特征向量的維數。

(3) 建立分類器:利用樸素貝葉斯算法將樣本進行分類處理。

3.4 離差標準化處理

依據原始數據顯現的特征,如果數據之間存在很大的變異程度, 就考慮實行離差標準化處理[8]。由于本文選取的數據量綱不同且數據的差異很大,故我們對源數據進行離差標準化處理,利用公式[xik=xik-min(xk)Rk]將原始數據變化到(0,1)之間。

3.5 利用Isomap降維

本文利用Isomap算法對高維數據進行降維處理中,我們使用了最近鄰居方法,帶入[k]值[(k=3,…30)], 以此進行參數尋優, 直至找到產生最小殘差的[k]。[k]是Isomap算法中最近鄰居點個數. 本文在Matlab軟件上運行Isomap代碼, 并不斷改變參數[k]的值取得一系列低維嵌入的殘差圖,通過對取不同[k]值得到的殘差圖進行分析,表明[k=4]的時候產生的是最小殘差,殘差圖如圖2。隨著橫坐標維數(Isomap dimensionality)的增加,縱坐標殘差也隨之變小, 這表明了通過Isomap算法是可以實現數據的維數降低的。但是,需要經過尋找曲線突然停止顯著下降的“肘”點來判斷[9]數據的“內在”維度。

從圖2得知,當維數[d<3]時,殘差曲線顯著下降至“肘”點,當維數[d>3]時,殘差曲線明顯變得平緩、殘差幾乎相同, ?這表明我們成功實現對1069家企業的財務數據進行了降維。進而可以得出結果:通過Isomap算法降維后,得出[d=4]是真實“內在”維數。

3.6 對比試驗

為了驗證ISOMAP-NB評估模型的分類性能, 我們選擇未用Isomap算法進行數據降維的樸素貝葉斯模型做對比分析。

非降維的樸素貝葉斯分類器對“good”這類企業數據的預測準確率是99.3%,優于樸素貝葉斯的預測準確率98.95%。這兩種模型對“bad”這類企業數據的預測準確率基本持平。總的來說, 降維后的分類器的準確率為95.4%,非降維的樸素貝葉斯分類器的準確率為95%,結果數據表明ISOMAP-NB評估模型在一定程度上好于樸素貝葉斯模型.綜上所述,基于Isomap的樸素貝葉斯分類模型在經過Isomap的降維處理后,不但簡化了樸素貝葉斯分類模型結構,減小了樸素貝葉斯模型的計算復雜度, 并且提高了模型的分類精度。在一定程度上協助銀行對企業進行較為客觀的信用評估。

4 結束語

針對非線性、高維度的大樣本財務數據進行分類處理,本文首先應用了Isomap算法做降維處理,將原始數據從15維變量降到了4維變量,然后再利用樸素貝葉斯分類器對降維后的數據做分類處理,構建了基于Isomap的樸素貝葉斯分類模型,并選取2015年1069家企業的財務指標數據進行實驗研究,結果顯示該分類模型有效地提高了樸素貝葉斯的分類精度。不但把Isomap用在非線性的金融數據上,還可以為銀行信用評估創新了一種判斷方法。

參考文獻:

[1] 段志臣,芮小平,張立媛.基于流形學習的非線性維數約簡方法[J].數學的實踐與認識,2012,42(8):230-241.

[2] 曹根,葛孝堃,楊麗琴.基于K-近鄰法的局部加權樸素貝葉斯分類算法[J].計算機應用與軟件,2011,28(9):267-268,291.

[3] 孫程,邢建春,楊啟亮,等.基于改進樸素貝葉斯的入侵檢測方法[J].微型機與應用,2017,36(1):8-10,14.

[4] 楊光祖,王國軍.一種新的樸素貝葉斯屬性選擇算法[J].科學技術與工程,2009,9(4):978-980.

[5] 趙志沖,遲國泰.基于似然比檢驗的工業小企業債信評級研究[J].中國管理科學,2017,25(1):45-56.

[6] 遲國泰,張亞京,石寶峰.基于Probit回歸的小企業債信評級模型及實證[J].管理科學學報,2016,19(6):136-156.

[7] 劉麗杰.中國企業債券信用評級指標體系研究與創新[J].中國證券期貨,2010(9):23.

[8] 王志.基于PCA-NBC算法的股票分類研究[D].蘭州:蘭州大學,2014.

[9] Tenenbaum J B,de Silva V,Langford J C.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):2319-2323.

【通聯編輯:李雅琪】

主站蜘蛛池模板: 色妞永久免费视频| 69精品在线观看| 国产乱视频网站| 人妖无码第一页| 亚洲精品国产成人7777| 广东一级毛片| 成年人国产网站| 久久91精品牛牛| 在线永久免费观看的毛片| 综合亚洲色图| 一级毛片无毒不卡直接观看 | 亚洲国产天堂在线观看| 久久久久青草大香线综合精品| 99r在线精品视频在线播放| 亚洲有无码中文网| 国产粉嫩粉嫩的18在线播放91| 国产夜色视频| 中国国产一级毛片| 色综合网址| 国产凹凸一区在线观看视频| jizz国产视频| 国产精品视频白浆免费视频| 国产成人综合久久| 国产又大又粗又猛又爽的视频| 免费人成又黄又爽的视频网站| 国产玖玖玖精品视频| 综合色区亚洲熟妇在线| 亚洲精品在线91| 91国内在线视频| 欧美精品一区二区三区中文字幕| 久久久久国产精品熟女影院| 69av在线| 欧美自慰一级看片免费| 久久久精品久久久久三级| 国产不卡一级毛片视频| 欧美精品色视频| 91九色视频网| 亚洲一区免费看| 91精品伊人久久大香线蕉| 又爽又大又光又色的午夜视频| 福利国产在线| 国产高清精品在线91| 中文字幕有乳无码| 超碰免费91| 午夜a级毛片| 1769国产精品免费视频| 亚洲视频在线网| 国产资源免费观看| 无码中文字幕精品推荐| 福利在线一区| 一本一道波多野结衣av黑人在线| 在线观看国产精品一区| 久久久久亚洲av成人网人人软件| 51国产偷自视频区视频手机观看 | 中文字幕亚洲无线码一区女同| 国产国模一区二区三区四区| 国产主播福利在线观看| 亚洲免费黄色网| 亚洲欧美一区二区三区蜜芽| 国产网友愉拍精品| 丁香六月激情综合| 日本少妇又色又爽又高潮| 国产精品夜夜嗨视频免费视频| 亚洲AV一二三区无码AV蜜桃| 日韩欧美一区在线观看| 国产乱人伦AV在线A| 国产人成乱码视频免费观看| 东京热av无码电影一区二区| 伊在人亞洲香蕉精品區| jizz在线观看| 国产美女无遮挡免费视频网站 | 国产精品v欧美| 免费黄色国产视频| 日韩在线2020专区| 亚洲大尺码专区影院| 91精品视频播放| 婷婷开心中文字幕| 中文字幕无码av专区久久| 久久91精品牛牛| 四虎永久免费地址| 夜夜拍夜夜爽| 五月天丁香婷婷综合久久|