999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

傳統Bayes 判別與非參數核密度Bayes 判別的比較

2015-01-15 06:01:44艾天霞
服裝學報 2015年5期
關鍵詞:分類方法

艾天霞, 張 蕾

(1.榆林學院 數學與統計學院,陜西 榆林719000;2. 云南師范大學文理學院 工商管理學院,云南昆明650222)

判別分析的基本思想是根據對已有的分類數據進行研究,找出樣本數據的分類規律,然后建立判別函數,進而通過判別函數對新樣本的分類情況進行判別的一種分類學科。根據是否需要事先假設總體的分布情況,判別分析分為參數判別分析和非參數判別分析。參數判別分析就是傳統的判別分析,主要有距離判別、Bayes判別和Fisher 判別。非參數判別分析主要分為兩種:一種是非參數核密度估計判別分析;另一種是非參數最近鄰估計判別分析[1]。在參數判別分析方法中,Bayes 判別方法應用最為廣泛;在非參數判別分析方法中,非參數核密度Bayes 判別方法最為普遍。下面介紹這兩種判別分析的基本原理,并對這兩種判別分析方法進行比較。

1 傳統Bayes 判別分析

傳統Bayes 判別分析主要討論正態分布的情況。假設有k 個總體G1,G2,…,Gk,對應的概率密度函數分別為f1(x),f2(x),…,fk(x),Xi服從均值為μi,協方差陣為∑i的正態分布,其中i = 1,2,…,k,Xi的密度函數為

相應的先驗概率分別為p1,p2,…,pk,則有pi≥0 且p1+p2+…+pk= 1。提前假定所有的錯判損失都相同,則多分類Bayes 判別的判別準則為[2]

2 非參數核密度Bayes 判別分析

在非參數核密度Bayes判別分析中,假設有k 個總體G1,G2,…,Gk,p 個指標,相應的核密度函數[3-4]分別為fn1(x),fn2(x),…,fnk(x),先驗概率分別為p1,p2,…,pk,假定所有的錯判損失相等,采用SJ 帶寬,并取核函數為高斯核函數,則總體Gj(j =1,2,…,k)的核密度估計[5-6]可表示為

其 中,i = 1,2,…,nj;j = 1,2,…,k;n = n1+n2+ … +nj;相應的先驗概率的估計為

將先驗概率的估計值代入多分類貝葉斯判別規則中,得到后驗概率,然后進行比較。因此,非參數核密度貝葉斯判別規則為

3 傳統Bayes 判別分析與非參數核密度Bayes 判別分析比較

3.1 兩種判別分析方法的理論比較

傳統Bayes 判別方法是一種參數判別方法,主要討論總體服從正態分布的情形。采用傳統Bayes判別方法時,需要事先假定總體服從正態分布。但是,在實際情況中,總體通常不服從正態分布,或者總體的分布情況是未知的,此時已不再適用傳統Bayes 判別方法。非參數核密度Bayes 判別方法是一種非參數判別方法,運用非參數判別方法時,不需要事先假定總體的分布情況,而是直接通過數據本身來估計總體的概率密度,適用于任何分布形式的總體。從理論上來說,相比于傳統方法,非參數核密度Bayes 判別方法具有更廣泛的適用性。

3.2 兩種判別分析方法的統計模擬

通過統計模擬的方法對傳統Bayes 判別方法與非參數核密度Bayes 判別方法進行比較。若總體所考慮的指標有p 個,那么總體就是p 維數據,所采用的判別分析就是p 維判別分析。為了方便研究,文中僅僅模擬了p = 1 和p = 2 的情形,其他多維情形可以類似推導。

對于一維情形和二維情形,又分別模擬了正態數據和非正態數據,其中正態數據作為對照組,非正態數據作為比較組。總體中參數的取值情況不同,得到的數據也不一樣。針對上述情形,文中將分別模擬參數的不同取值情況,以便更好地說明結果。

3.2.1 一維正態 用R 語言隨機生成服從N(μ,σ2)的一維數據xi(i = 1,2,…,n),其中針對參數μ和σ2的不同取值,模擬了以下6 種情況:(1)μ = 0,σ2= 1;(2)μ = 0,σ2= 0.5;(3)μ = 5,σ2= 1;(4)μ = 5,σ2= 0.5;(5)μ = 10,σ2= 1;(6)μ =10,σ2= 0.5。生成隨機數據后,定義每組數據的原始分類情況,采用的方法是:求出每組數據的中位數,記為Me(xi),對于i = 1,2,…,n,定義

則Si就是每組數據的原始分類情況。如果存在若干數據等于Me(xi)的情況,就需要剔除掉這幾個數據,然后再重新生成幾個隨機數據,直至每組數據中沒有等于中位數的情況為止,最后將保證類別1和類別2 的數據各占數據總量的一半。

3.2.2 一維非正態 不妨采用服從Gamma 分布的數據進行模擬。用R 語言隨機生成服從Gamma(α,β)分布的數據xi(i = 1,2,…,n),其中針對參數α 和β 的不同取值,模擬了以下6 種情況:(1)α = 2,β = 0.1;(2)α = 2,β = 0.5;(3)α = 2,β = 1;(4)α = 2,β = 2.5;(5)α = 2,β = 5;(6)α =2,β = 10.5。生成隨機數據后,定義每組數據的原始分類情況,方法同上。

3.2.3 二維正態 用R 語言隨機生成服從N2(μ,Σ)的二維正態數據,其中第一維數據xi1服從N(μ1,),第二維數據xi2服從N(μ2,),針對參數μ1,,μ2,的不同取值,模擬了以下6 種情況:。生成隨機數據后,定義每組數據的原始分類情況,采用的方法是:令

求出yi的中位數,記為Me(yi),最后,對于i = 1,2,…,n,定義

則Si就是每組數據的原始分類情況。如果存在若干數據等于Me(yi)的情況,就需要剔除再選,直至每組數據中沒有等于中位數的情況為止,最后將保證類別1 和類別2 的數據各占數據總量的一半。

3.2.4 二維非正態 不妨采用混合分布組成的非正態二維數據,具體方法如下:先構造第一維數據xi1,用R 生成兩組具有不同μ 和σ2的一維正態數據,第一組數據ri1服從N(μ1,),第二組數據ri2服從N(μ2,),其中μ1≠μ2且,再生成一組服從U(0,1)的均勻分布數據zi,對于i = 1,2,…,n

則xi1為第一維數據,同理構造第二維數據xi2。針對參數μ1,,μ2,,μ3,,μ4,σ24 的不同取值,模擬以下6 種情況:

生成二維隨機數據后,定義每組數據的原始分類情況,方法同上。

3.2.5 模擬結果 利用隨機生成的數據,采用兩種判別方法進行判別分析。在統計模擬時,分別取樣本容量n = 50,n = 200,n = 500 3 種情況,進行重復數N = 1 000 次的模擬試驗,最后取1 000 次模擬結果的平均值作為最終結果。運行R 軟件,得出每組數據的最終模擬結果,將兩種判別方法的最終模擬結果進行比較。結果顯示,在上述統計模擬的各種情形中,非參數核密度Bayes 判別方法的正判率都明顯高于傳統Bayes 判別方法的正判率。

3.3 兩種判別分析方法的實證比較

3.3.1 對一組正態體檢數據的判別分析 為研究冠心病,某位醫生測定了15 例50 ~59 歲的冠心病人和15 例50 ~59 歲的正常人的舒張壓和膽固醇指標(數據來源于《SPSS 寶典》16.3 實例數據[7])。對這30例數據分別用兩種判別方法進行判別分析,將分類結果與原始分類情況進行比較,結果如表1 所示。

表1 體檢數據的兩種判別結果比較Tab.1 Comparison of two discriminant results for physical examination data

表1 結果表明,在冠心病組的判別中,非參數核密度Bayes 判別方法的正判率是66.7%,高于傳統Bayes 判別方法的正判率;在正常人組的判別中,兩種方法的正判率都是100%。綜合來看,非參數核密度Bayes 判別方法的正判率高于傳統Bayes 判別方法。

3.3.2 對一組非正態企業財務數據的判別分析為研究企業財務預警[8-9]問題,隨機選取了20 家被特別處理的上市公司(ST 公司)和180 家正常的上市公司(非ST 公司)作為研究對象(數據來源于Wind 資訊)。測定這200 家上市公司的8 個財務指標。對這8 個財務指標數據進行正態性檢驗,各指標數據都不服從正態分布。針對這200 例數據,分別采用兩種判別方法進行判別分析,將分類結果與原始分類情況進行比較,計算出兩種方法的正判率,結果如表2 所示。

表2 企業財務數據的兩種判別結果比較Tab.2 Comparison of two discriminant results for enterprise’s financial data

表2 結果表明,在ST 公司的判別中,非參數核密度Bayes 判別方法的正判率是100%,明顯高于傳統Bayes 判別方法的正判率;在非ST 公司的判別中,非參數核密度Bayes 判別方法的正判率略高于傳統Bayes 判別方法的正判率。綜合來看,非參數核密度Bayes 判別方法的正判率明顯高于傳統Bayes判別方法的正判率。

4 結 語

綜上所述,非參數核密度Bayes 判別方法要明顯優于傳統Bayes 判別方法。從理論上看,當總體的分布情況已知,且服從正態分布時,傳統Bayes 判別方法無疑是適用的;但當總體的分布情況未知時,此時應該采用非參數核密度Bayes 判別方法。非參數核密度Bayes 判別方法不需要事先假定總體的分布情況,所以適用范圍更廣。通過統計模擬和實證分析兩方面驗證,結果表明,當總體服從正態分布時,非參數核密度Bayes 判別方法的正判率不低于傳統Bayes 判別方法的正判率;當總體不服從正態分布時,非參數核密度Bayes 判別方法的正判率遠遠高于傳統Bayes 判別方法的正判率。可見,對于任何分布形式的總體來說,非參數核密度Bayes 判別方法都是有效的。

[1]朱干江.非參數密度估計在判別分析中的應用[D].南京:南京信息工程大學,2007.

[2]薛毅,陳立萍.統計建模與R 軟件[M].北京:清華大學出版社,2007:375-397.

[3]馬明衛,宋松柏.非參數方法在干旱頻率分析中的應用[J].水文,2011,31(3):5-12.

MA Mingwei,SONG Songbai.Nonparametric approach for drought frequency analysis[J]. Journey of China Hydrology,2011,31(3):5-12.(in Chinese)

[3]牛玉坤,胡曉華.基于非參數核估計方法的中國股市收益率分布研究[J].湖南師范大學學報:自然科學版,2013,26(4):363-367.

NIU Yukun,HU Xiaohua. The Chinese stock market returns distribution research based on nonparametric kernel estimation method[J].Journal of Hainan Normal University:Natural Science,2013,26(4):363-367.(in Chinese)

[5]ZHANG Jin,WANG Xueren.Robust normal reference bandwidth for kernel density estimation[J].Statist Neerlandica,2009,63:13-23.

[6]Adamowskik.Nonparametric kernel estimation of frequencies[J].Water Resources Research,1985,21(11):1585-1590.

[7]張慶利.SPSS 寶典[M].2 版.北京:電子工業出版社,2011:214-287.

[8]羅怡,鄭春偉.我國企業財務預警實證分析—以2012 年23 家金融機具上市公司為例[J].財經科學,2014(2):88-95.

LUO Yi,ZHENG Chunwei.Financial warning empirical analysis of the financial instrument companies:evidence form 23 listed companies of 2012[J].Finance and Economics,2014(2):88-95.(in Chinese)

[9]黃振,朱珺,張為.基于Bayes 判別分析法的上市公司財務風險研究[J].洛陽理工學院學報:社會科學版,2012,27(3):26-28.

HUANG Zhen,ZHU Jun,ZHANG Wei. Research based on discriminative analysis of bayes into financial risks faced with the exchange-listed companies[J].Journal of Luoyang Institute of Science and Technology:Social Science,2012,27(3):26-28.(in Chinese)

猜你喜歡
分類方法
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
學習方法
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
給塑料分分類吧
主站蜘蛛池模板: 亚洲区第一页| 日韩欧美国产另类| 国产毛片片精品天天看视频| 精品亚洲欧美中文字幕在线看 | 久久综合亚洲鲁鲁九月天| 亚洲婷婷在线视频| 久爱午夜精品免费视频| 永久免费精品视频| 国产区91| 亚洲成人精品久久| 国模极品一区二区三区| 久久99热66这里只有精品一 | 国产精品嫩草影院视频| 91 九色视频丝袜| 91无码国产视频| 亚洲欧美成人网| 亚洲综合婷婷激情| 91视频首页| 中文字幕乱码二三区免费| 99久久免费精品特色大片| 国产美女在线免费观看| 激情网址在线观看| 欧美日韩v| 婷婷激情亚洲| 国产日韩欧美在线播放| 亚洲天堂2014| 亚洲无码精品在线播放| 亚洲午夜天堂| 亚洲不卡影院| 国产精品女人呻吟在线观看| 波多野结衣在线se| 四虎影视国产精品| 免费无码又爽又黄又刺激网站| 萌白酱国产一区二区| 99re精彩视频| 青青网在线国产| 亚洲色图在线观看| 国产精品亚欧美一区二区三区| 亚洲区欧美区| 色悠久久综合| 2020精品极品国产色在线观看| 无码电影在线观看| 日韩国产综合精选| 亚洲精品片911| 欧美色视频日本| 91精品情国产情侣高潮对白蜜| 国外欧美一区另类中文字幕| 72种姿势欧美久久久大黄蕉| 欧美一区精品| 国产在线精品美女观看| 国产91高清视频| 久久超级碰| 高清久久精品亚洲日韩Av| 国产小视频免费观看| 久久亚洲高清国产| 亚洲人成网18禁| 最近最新中文字幕免费的一页| 久久成人国产精品免费软件 | 中国黄色一级视频| 亚洲综合精品香蕉久久网| 成色7777精品在线| 国产成人免费手机在线观看视频| 国产精品手机在线观看你懂的| 欧美一区福利| 亚洲伊人久久精品影院| www欧美在线观看| 国产国模一区二区三区四区| 喷潮白浆直流在线播放| 2021天堂在线亚洲精品专区| 亚洲精品无码AV电影在线播放| 99色亚洲国产精品11p| 五月天在线网站| 怡红院美国分院一区二区| 中文字幕不卡免费高清视频| 无码aaa视频| 99爱视频精品免视看| 真人高潮娇喘嗯啊在线观看| www精品久久| 欧美自拍另类欧美综合图区| 久久人人妻人人爽人人卡片av| 国产成人1024精品| 台湾AV国片精品女同性|