摘 要:本文研究了在違背總體正態(tài)性假定時(shí),通過(guò)研究檢驗(yàn)功效的均值來(lái)方差分析與Kruskal-Wallis檢驗(yàn)的優(yōu)劣。文中引入了置換方法,并基于蒙特卡羅模擬的研究?jī)煞N檢驗(yàn)的功效。結(jié)果表明,在總體分布不對(duì)稱(chēng)的情況下,非參數(shù)的Kruskal-Wallis檢驗(yàn)優(yōu)于參數(shù)的方差分析方法。
關(guān)鍵詞:?jiǎn)我蛩胤讲罘治觯恢群蜋z驗(yàn);置換檢驗(yàn);檢驗(yàn)功效
一、引言
統(tǒng)計(jì)學(xué)中總體,樣本,分布,估計(jì)和假設(shè)檢驗(yàn)等都是最基本的概念。這里總體的分布都是事先給定的,我們的大部分工作是對(duì)未知參數(shù)作估計(jì)以及對(duì)參數(shù)各種檢驗(yàn)。而在實(shí)踐案例中,總體的分布類(lèi)型并不能隨便地假設(shè)。實(shí)驗(yàn)數(shù)據(jù)可能不來(lái)自正態(tài)分布總體,而且可能是異方差的,也可能存在異常值,這種情況下使用傳統(tǒng)的參數(shù)統(tǒng)計(jì)方法可能會(huì)導(dǎo)致錯(cuò)誤。所以我們就希望在不假定總體分布的前提下,從樣本數(shù)據(jù)本身入手獲取我們的信息。這就是非參數(shù)統(tǒng)計(jì)的思想。
Wilcox(1995)和Glass et al.(1972)曾經(jīng)做過(guò)關(guān)于違背正態(tài)假定情況下的方差分析研究。Wilcox發(fā)現(xiàn)總體的非正態(tài)性對(duì)第一類(lèi)犯錯(cuò)率有影響,但當(dāng)方差相等時(shí),其影響很小,而對(duì)于第二類(lèi)犯錯(cuò)率非正態(tài)性的影響相對(duì)顯著。Glass et al.則更多地從總體的偏度出發(fā),在方差相等時(shí)得出了和Wilcox相同的結(jié)論。Blair et al.(1980)做了一個(gè)關(guān)于T檢驗(yàn)和Wilcoxon秩和檢驗(yàn)的檢驗(yàn)功效分析,研究發(fā)現(xiàn)當(dāng)參數(shù)過(guò)程的假定滿足時(shí),參數(shù)檢驗(yàn)法比非參數(shù)檢驗(yàn)法更好。那么當(dāng)這些假定都不滿足時(shí),如Likert尺度數(shù)據(jù),當(dāng)我們用傳統(tǒng)的參數(shù)分析法時(shí)這些數(shù)據(jù)往往違背了正態(tài)性和方差齊性的假定。Nanna和Sawilowsky證明對(duì)這種數(shù)據(jù),Wilcoxon秩和檢驗(yàn)比參數(shù)的T檢驗(yàn)更具優(yōu)勢(shì)。Wilcoxon秩和檢驗(yàn)法大、小樣本都有優(yōu)勢(shì),且這種優(yōu)勢(shì)隨著樣本量的增大而增加。我們的研究目的是能否就傳統(tǒng)的參數(shù)方差分析法和Kruskal-Wallis檢驗(yàn)法得到類(lèi)似于Nanna和Sawilowsky的結(jié)論。
二、方差分析和Kruskal-Wallis檢驗(yàn)
1.假定條件
方差分析的F檢驗(yàn)被用來(lái)檢驗(yàn)k個(gè)總體的均值是否相等,可設(shè)原假設(shè)為:
然而,在實(shí)際應(yīng)用中F檢驗(yàn)的正態(tài)性和方差齊性假定常常被忽略和違背,當(dāng)數(shù)據(jù)不滿足正態(tài)分布的假定時(shí),單因子方差分析估計(jì)出的p值也許也是不準(zhǔn)確的。Kruskal-Wallis檢驗(yàn)是一種類(lèi)似于單因子方差分析的非參數(shù)檢驗(yàn)方法,它不需要正態(tài)性的假定。像大多數(shù)非參數(shù)的檢驗(yàn)方法一樣,它是基于觀測(cè)值的秩研究的,另外還假定每組觀測(cè)值都來(lái)自相同的分布。因?yàn)楫?dāng)分布的形狀不同時(shí)Kruskal-Wallis方法的檢驗(yàn)結(jié)果可能是不準(zhǔn)確的(參閱2009年Fagerland和Sandvik的研究)。替代原假設(shè)(1),Kruskal-Wallis檢驗(yàn)的原假設(shè)是樣本來(lái)自相同的總體。
2.Kruskal-Wallis檢驗(yàn)的原理
Kruskal-Wallis方法是用樣本的秩替代原始觀測(cè)值研究的,用1代表最小值,用2代表第二小值,依次類(lèi)推,對(duì)相同的觀測(cè)值取秩的平均。相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量H為:
三、置換檢驗(yàn)均值的功效
1.置換檢驗(yàn)
置換檢驗(yàn)又稱(chēng)為隨機(jī)化檢驗(yàn),是由經(jīng)典統(tǒng)計(jì)學(xué)創(chuàng)始人R.A.Fisher首次提出的,由于當(dāng)時(shí)計(jì)算機(jī)技術(shù)的限制Fisher晚年時(shí)放緩了對(duì)置換檢驗(yàn)的研究。隨機(jī)化檢驗(yàn)是將數(shù)據(jù)重新隨機(jī)的分配以便基于排列后的數(shù)據(jù)計(jì)算出確切的p值。假設(shè)我們有三組數(shù)據(jù),每組有20個(gè)觀測(cè)值,那么就有種排列方法重新分配這三個(gè)小組。在實(shí)踐中這一龐大的工程是不可能實(shí)現(xiàn)的,于是我們采用蒙特卡羅抽樣的方法,即通過(guò)置換后的隨機(jī)樣本來(lái)估計(jì)所有可能的樣本結(jié)果。
多重置換檢驗(yàn)的步驟如下:
2.方差檢驗(yàn)和Kruskal-Wallis檢驗(yàn)的功效比較
這里的檢驗(yàn)效度是通過(guò)R程序指定分布的參數(shù)以產(chǎn)生需要的隨機(jī)數(shù),并通過(guò)蒙特卡羅模擬的方法來(lái)估計(jì)。如果參數(shù)在不同的均值情況下設(shè)定,那么可以得到經(jīng)驗(yàn)的檢驗(yàn)效度。通過(guò)這些結(jié)果,就可以分析方差檢驗(yàn)和Kruskal-Wallis檢驗(yàn)的檢驗(yàn)功效,進(jìn)而觀察在違背假定的情況下哪種方法更好。
四、檢驗(yàn)實(shí)例
選取三種不同大小的樣本,在正態(tài)分布、對(duì)數(shù)正態(tài)發(fā)布、卡方分布下做模擬。設(shè)原假設(shè)為:
通過(guò)表1,可以看到在對(duì)稱(chēng)分布中(正態(tài)分布б=1)Kruskal-Wallis檢驗(yàn)的檢驗(yàn)功效和相同情況下的參數(shù)檢驗(yàn)的結(jié)果相差不大。
通過(guò)表2、表3,可以看到在非對(duì)稱(chēng)分布中(對(duì)數(shù)正態(tài)分布б=1,或者自由度為3的卡方分布)非參數(shù)的Kruskal-Wallis檢驗(yàn)的檢驗(yàn)功效有著更好的檢驗(yàn)性能,且n越大檢驗(yàn)效度越高。所有圖形都基于函數(shù)d來(lái)呈現(xiàn)。
五、結(jié)論
經(jīng)模擬檢驗(yàn)可以看到,在數(shù)據(jù)類(lèi)型分布非對(duì)稱(chēng)時(shí),非參數(shù)的Kruskal-Wallis檢驗(yàn)比傳統(tǒng)的單因子方差分析有更高的檢驗(yàn)功效?,F(xiàn)實(shí)例子中我們大多遇見(jiàn)的數(shù)據(jù)都是非齊性的,且分布的類(lèi)型也沒(méi)法確定,數(shù)據(jù)中也可能會(huì)出現(xiàn)比該組中大部分?jǐn)?shù)據(jù)都要小很多或大的極端值,在這些情況下采用非參數(shù)的Kruskal-Wallis法效果會(huì)更優(yōu)。模擬結(jié)果同時(shí)顯示:在做檢驗(yàn)之前,數(shù)據(jù)的集中趨勢(shì)分析是必要的。盡管文獻(xiàn)和教科書(shū)說(shuō),在違背假定的情況下,F(xiàn)檢驗(yàn)是穩(wěn)健的,但檢驗(yàn)結(jié)果告訴我們其檢驗(yàn)性能顯著降低了。
參考文獻(xiàn):
[1]吳喜之,趙博娟.非參數(shù)統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,2009.
[2]王靜龍,梁小筠.非參數(shù)統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,2009.
[3]于長(zhǎng)春.秩和檢驗(yàn)-Kruskal-Wallis法和Nemenyi法在科室醫(yī)療質(zhì)量動(dòng)態(tài)監(jiān)測(cè)中的應(yīng)用[J].中國(guó)醫(yī)院統(tǒng)計(jì),2009.
[4]王俊.實(shí)際應(yīng)用中方差分析與秩和檢驗(yàn)結(jié)果比較[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2008.