999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

正態性檢驗的幾種方法比較

2015-07-30 12:33:54
統計與決策 2015年14期
關鍵詞:方法

楊 斌

0 引言

正態分布是許多檢驗的基礎,在實際使用統計分析時,人們總是樂于正態假定,但該假定是否成立,牽涉到正態性檢驗。比如χ2檢驗、F檢驗以及t檢驗等在總體不是正態分布時是沒有任何意義的,因此,對一個總體是否來自正態總體的檢驗至關重要。另外,方差分析、回歸分析等統計分析中也都首先驗證待分析的數據是否服從正態分布,檢驗樣本的正態性一直以來都是統計學里比較重要的問題,檢驗方法的多樣性使得這個問題始終保持著活力。歷史上不僅有D'Agostino,Kolmogorov-Smirnov(Lillie檢驗),Shapiro-Wilk,Ryan-Joiner等一系列的檢驗方法,還有Anderson-Darling test(ad檢驗),Cramer-von Mises test(cvm檢驗),Pearson chi-square test(pearson檢驗),Shapiro-Francia test(sf檢驗)等這些都是檢驗樣本正態性的方法[1]。但對這幾種不同的檢驗方法,有些檢驗法針對小樣本,有些針對大樣本,有些則對于任何大小的樣本量都可以用,但可能效果不太好,這些不同的檢驗方法隨著樣本的變化有何不同?檢驗的錯誤率大小如何?檢驗的結果是否合理,這些問題都需要進一步分析和解決。本文概述了Anderson-Darling test(ad檢驗)、Pearson chi-square test(pearson檢驗)以及Kolmogorov-Smirnov(Lillie檢驗)的統計原理,通過隨機模擬實現了這幾種不同檢驗方法的結果,并針對ad檢驗給出了具體檢驗的統計方法,著重比較了ad檢驗、cvm檢驗、lillie檢驗、pearson檢驗、sf檢驗這五種方法的優劣。分析了來自不同總體的樣本數據,并做了結論分析,為更好的做正態性檢驗提供了更加準確的方法參考。

1 檢驗的統計原理

1.1 ad檢驗原理

已知樣本為 X1,X2,…,Xn,做如下檢驗:

H0:Xi~N(0,1)?H1:Xi不服從N(0,1)(i=1,2,…,n)

zi=,其中Φ(x)表示標準正態分布函數 :,mean(x)表示樣本的均值:,sd(x)表示樣本標準差:

可以知道[2],這里 Fn是經驗分布函數,F0是零假設下樣本服從的分布(在本文中F0為標準正態分布)。在文獻[3]中提到了A2的特征函數為:,由逆轉公式及傅里葉變換:

1.2 lillie檢驗原理

該檢驗是對Kolmogorov-Smirnov檢驗的修正,故先介紹Kolmogorov-Smirnov檢驗,Kolmogorov-Smirnov檢驗是基于經驗分布函數(ECDF)的檢驗。其檢驗方法是以樣本數據的累積頻數分布與理論正態分布比較,若兩者間的差距很小,則推斷該樣本取自某正態分布族。F0(x)表示分布的分布函數,Fn(x)表示一組隨機樣本的累計概率函數。,設 D 為 F0(x)與Fn(x)差距的最大值,定義如下式:D=max|Fn(x)-F0(x)|,當原假設為真時,D的值應較小,若過大,則懷疑原假設,從而,對于給定的 α ,拒絕域為:R={D >d },p=P{D >d}=α,結論:當實際觀測 D>Dn,則接受 H1,反之則不拒絕 H0假設。又,該檢驗是對Kolmogorov-Smirnov檢驗的修正,參數未知時,由可計算得檢驗統計量的值。

1.3 pearson檢驗原理(基于經驗分布函數(ECDF)的檢驗)

檢驗統計量為[4]:

其中r是被估參數的個數,fi為樣本中Ai發生的實際頻數,npi為H0為真時Ai發生的理論頻數。若 χ2=0,則 fi=npi,意味著對于Ai,觀測頻數與期望頻數完全一致,即完全擬合。

觀察頻數與期望頻數越接近,則χ2值越小。當原假設為真時,有大數定理,與 pi不應有較大差異,即 χ2值應較小。若 χ2值過大,則懷疑原假設。拒絕域為R={χ2≥d },判斷統計量是否落入拒絕域,得出結論。從而拒絕域為 R={χ2≥d},對于給定的α,P{χ2≥d}=α,又,判斷統計量是否落入拒絕域,得出結論。

2 檢驗方法

2.1 當樣本來自正態總體

本文進行隨機模擬的辦法抽取樣本 X1,X2,…,Xn~N(0,1),而樣本量n我們分別取10,100,1000,來觀察檢驗方法的p值大小(實驗次數為1000次),嘗試對樣本進行程序包nortest里的ad檢驗、cvm檢驗、lillie檢驗、pearson檢驗、sf檢驗五種檢驗方法分別計算得到的p值的箱線圖如下:

圖1 樣本n=10,100,1000時的箱線圖

并且我們得到了判斷錯誤率(得到p值小于0.05的次數占1000次試驗的比例)如表1所示:

表1 判斷錯誤率

我們進行隨機模擬的辦法抽取簡單隨機樣本X1,X2,…,Xn~H(x) ,其中 H(x)=εΦ(x)+(1-ε)Φ(,我們取 ε=0.9 ,樣 本 量 n=10,100,1000 ,以 及 k=3,10,30,100分別對得到的樣本做ad正態性檢驗。我們得到了圖2:

對于不同的樣本量,觀測不同的k值的影響:

從圖1中看出在樣本量較小(n=10)的情況下,lillie檢驗和pearson檢驗的p值均值較大,但是pearson檢驗錯誤率很高,其他檢驗的錯誤較低,同時p值的均值較大。說明在小樣本的情況下,pearson檢驗不夠穩定,我們可以選用其他4個檢驗較好。在樣本量較大(n=100,1000)的情況下,pearson檢驗的p值均值較小,并且錯誤率也較高(在n=100時0.061),sf檢驗的錯誤率也比較高(在n=1000時,0.061),所以在樣本量較大時,選用ad檢驗、cvm檢驗、lillie檢驗較好。

2.2 當樣本來自混合正態總體

圖2 不同樣本量ad正態性檢驗箱線圖

對于不同的k值,觀測不同樣本影響:

圖3 不同的k值ad正態性檢驗箱線圖

從圖2和圖3發現:

對于樣本量比較小n=10,無論k值大小,在ad檢驗下樣本多數為正態,而對于樣本量較大的情況(n=100,1000),除了k=1.5,n=100的情況下檢驗基本上都拒絕零假設,也就是樣本并不從正態總體中得到。所以我們對該問題有如下結論:

當樣本量較小時,無論k值的大小,該混合正態模型在ad檢驗下都服從正態總體。

當樣本量較大時,如果k值較小(k在1到3之間),那么混合正態模型在ad檢驗下也一定依概率服從正態總體,如果k值較大(大于3),那么該混合正態模型在ad檢驗下基本上不符合正態總體。

2.3 當樣本來自t分布總體

對t分布的漸近性質進行隨機模擬的檢驗。從總體中抽取樣本量為n=100的簡單隨機樣本 X1,X2,…,Xn~t(d)我們對于自由度分別為d=5,10,…,100用ad檢驗做正態性檢驗,得到圖4:(x軸為不同的自由度,y軸為對應的p值)。

圖4 d=5,10,…,100時ad正態性檢驗箱線圖

于是我們對自由度d=5,6,…,20重復上面的步驟,得到圖5:(x軸為不同的自由度,y軸為對應的p值)。

圖5 d=5,6,…,20時ad正態性檢驗箱線圖

我們可以從圖5看出當自由度d較小(小于等于20)的時候,該樣本(從t分布中抽取)并不能在ad檢驗下服從正態分布,而當自由度d較大(大于20)的時候,該樣本可以認為是從正態總體中得到。

3 結論

本文介紹了正態性檢驗的原理及概述了幾個常用的正態性檢驗方法,并在取不同樣本量的情況下通過隨機模擬的方法,分別計算得到五種檢驗方法的p值并作出箱線圖。而且分別考慮了當樣本來自正態總體、混合正態總體以及t分布總體的情況下各檢驗方法的特點。并得到如下結論:

(1)在樣本量較小(n=10)的情況下,當樣本來自正態總體時,lillie檢驗和pearson檢驗的p值均值較大,但是pearson檢驗錯誤率很高,其他檢驗的錯誤較低,同時p值的均值較大。說明在小樣本的情況下,pearson檢驗不夠穩定,我們可以選用其他4個檢驗較好。在樣本量較大(n=100,1000)的情況下,pearson檢驗的p值均值較小,并且錯誤率也較高(在n=100時0.061),sf檢驗的錯誤率也比較高(在n=1000時,0.061),所以在樣本量較大時,選用ad檢驗、cvm檢驗、lillie檢驗較好。

(2)當樣本量較小時,無論k值的大小,混合正態模型在ad檢驗下都服從正態總體;當樣本量較大時,如果k值較小(k在1到3之間),那么混合正態模型在ad檢驗下也一定依概率服從正態總體,如果k值較大(大于3),那么該混合正態模型在ad檢驗下基本上不符合正態總體。

(3)當自由度d較小(小于等于20)的時候,樣本(從t分布中抽取)并不能在ad檢驗下服從正態分布。而當自由度d較大(大于20)的時候,樣本可以認為是從正態總體中得到。

[1] 章剛勇,阮陸寧.基于Monte Carlo隨機模擬的幾種正態性檢驗方法的比較[J].統計與決策,2011,(7).

[2] Anderson T W,Darling D A.A Test of Goodness of Fit[J].Journal of The American Statistical Association,1954,(49).

[3] Anderson T W,Darling D A.Asymptotic Theory of Certain Goodness of Fit Criteria Based on Stochastic Processes[J].Annals of Mathemati?cal Statistics,1952,(23).

[4] Stephens M A.EDF Statistics for Goodness of Fit and Some Compari?sons[J].Journal of The American Statistical Association,1974,(69).

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧亚日韩Av| YW尤物AV无码国产在线观看| 精品视频一区在线观看| 欧美一级专区免费大片| 国产剧情一区二区| AV天堂资源福利在线观看| 日韩中文字幕亚洲无线码| 五月综合色婷婷| 久久a毛片| 国产精品亚欧美一区二区| 国产微拍精品| 国产在线精彩视频二区| 秋霞一区二区三区| 精品国产毛片| 91综合色区亚洲熟妇p| 尤物午夜福利视频| 2021天堂在线亚洲精品专区| 国产成人1024精品| 国国产a国产片免费麻豆| 国产香蕉在线视频| 日本久久网站| 久久99热这里只有精品免费看| 永久在线精品免费视频观看| 欧美精品黑人粗大| 欧洲高清无码在线| 国产男人天堂| 一级毛片基地| 999国内精品久久免费视频| 久久精品无码国产一区二区三区 | 四虎国产精品永久一区| 狠狠做深爱婷婷久久一区| 在线日本国产成人免费的| 手机永久AV在线播放| 伊人久久精品亚洲午夜| 午夜激情婷婷| 亚洲成人免费在线| 日韩精品一区二区三区视频免费看| 亚洲欧洲日产国产无码AV| 日韩A∨精品日韩精品无码| 黄色污网站在线观看| 波多野结衣第一页| 99精品免费在线| 国产精品 欧美激情 在线播放| 国产欧美精品一区aⅴ影院| 久久精品66| 国产精品刺激对白在线| 欧美激情视频一区二区三区免费| 欧美无遮挡国产欧美另类| 亚洲IV视频免费在线光看| 99视频国产精品| 欧美日韩精品一区二区在线线| 92午夜福利影院一区二区三区| 在线视频亚洲欧美| 欧美啪啪网| 亚洲女同欧美在线| 露脸国产精品自产在线播| 这里只有精品在线播放| 任我操在线视频| 国产欧美日韩综合一区在线播放| 国产欧美在线视频免费| 中文字幕 91| 亚洲天堂视频网| 亚洲码在线中文在线观看| 青草视频在线观看国产| 538国产视频| 国产av色站网站| 久热中文字幕在线观看| 国产精品夜夜嗨视频免费视频| 在线播放国产99re| 玖玖精品视频在线观看| 99热6这里只有精品| 久久久久青草线综合超碰| 视频二区亚洲精品| 666精品国产精品亚洲| 狠狠色综合久久狠狠色综合| 天天综合亚洲| 2022精品国偷自产免费观看| 国产久操视频| 亚洲 成人国产| 日本免费一级视频| 女人天堂av免费| 综合人妻久久一区二区精品|