摘 要:本文研究了在違背總體正態性假定時,通過研究檢驗功效的均值來方差分析與Kruskal-Wallis檢驗的優劣。文中引入了置換方法,并基于蒙特卡羅模擬的研究兩種檢驗的功效。結果表明,在總體分布不對稱的情況下,非參數的Kruskal-Wallis檢驗優于參數的方差分析方法。
關鍵詞:單因素方差分析;秩和檢驗;置換檢驗;檢驗功效
一、引言
統計學中總體,樣本,分布,估計和假設檢驗等都是最基本的概念。這里總體的分布都是事先給定的,我們的大部分工作是對未知參數作估計以及對參數各種檢驗。而在實踐案例中,總體的分布類型并不能隨便地假設。實驗數據可能不來自正態分布總體,而且可能是異方差的,也可能存在異常值,這種情況下使用傳統的參數統計方法可能會導致錯誤。所以我們就希望在不假定總體分布的前提下,從樣本數據本身入手獲取我們的信息。這就是非參數統計的思想。
Wilcox(1995)和Glass et al.(1972)曾經做過關于違背正態假定情況下的方差分析研究。Wilcox發現總體的非正態性對第一類犯錯率有影響,但當方差相等時,其影響很小,而對于第二類犯錯率非正態性的影響相對顯著。Glass et al.則更多地從總體的偏度出發,在方差相等時得出了和Wilcox相同的結論。Blair et al.(1980)做了一個關于T檢驗和Wilcoxon秩和檢驗的檢驗功效分析,研究發現當參數過程的假定滿足時,參數檢驗法比非參數檢驗法更好。那么當這些假定都不滿足時,如Likert尺度數據,當我們用傳統的參數分析法時這些數據往往違背了正態性和方差齊性的假定。Nanna和Sawilowsky證明對這種數據,Wilcoxon秩和檢驗比參數的T檢驗更具優勢。Wilcoxon秩和檢驗法大、小樣本都有優勢,且這種優勢隨著樣本量的增大而增加。我們的研究目的是能否就傳統的參數方差分析法和Kruskal-Wallis檢驗法得到類似于Nanna和Sawilowsky的結論。
二、方差分析和Kruskal-Wallis檢驗
1.假定條件
方差分析的F檢驗被用來檢驗k個總體的均值是否相等,可設原假設為:
然而,在實際應用中F檢驗的正態性和方差齊性假定常常被忽略和違背,當數據不滿足正態分布的假定時,單因子方差分析估計出的p值也許也是不準確的。Kruskal-Wallis檢驗是一種類似于單因子方差分析的非參數檢驗方法,它不需要正態性的假定。像大多數非參數的檢驗方法一樣,它是基于觀測值的秩研究的,另外還假定每組觀測值都來自相同的分布。因為當分布的形狀不同時Kruskal-Wallis方法的檢驗結果可能是不準確的(參閱2009年Fagerland和Sandvik的研究)。替代原假設(1),Kruskal-Wallis檢驗的原假設是樣本來自相同的總體。
2.Kruskal-Wallis檢驗的原理
Kruskal-Wallis方法是用樣本的秩替代原始觀測值研究的,用1代表最小值,用2代表第二小值,依次類推,對相同的觀測值取秩的平均。相應的檢驗統計量H為:
三、置換檢驗均值的功效
1.置換檢驗
置換檢驗又稱為隨機化檢驗,是由經典統計學創始人R.A.Fisher首次提出的,由于當時計算機技術的限制Fisher晚年時放緩了對置換檢驗的研究。隨機化檢驗是將數據重新隨機的分配以便基于排列后的數據計算出確切的p值。假設我們有三組數據,每組有20個觀測值,那么就有種排列方法重新分配這三個小組。在實踐中這一龐大的工程是不可能實現的,于是我們采用蒙特卡羅抽樣的方法,即通過置換后的隨機樣本來估計所有可能的樣本結果。
多重置換檢驗的步驟如下:
2.方差檢驗和Kruskal-Wallis檢驗的功效比較
這里的檢驗效度是通過R程序指定分布的參數以產生需要的隨機數,并通過蒙特卡羅模擬的方法來估計。如果參數在不同的均值情況下設定,那么可以得到經驗的檢驗效度。通過這些結果,就可以分析方差檢驗和Kruskal-Wallis檢驗的檢驗功效,進而觀察在違背假定的情況下哪種方法更好。
四、檢驗實例
選取三種不同大小的樣本,在正態分布、對數正態發布、卡方分布下做模擬。設原假設為:
通過表1,可以看到在對稱分布中(正態分布б=1)Kruskal-Wallis檢驗的檢驗功效和相同情況下的參數檢驗的結果相差不大。
通過表2、表3,可以看到在非對稱分布中(對數正態分布б=1,或者自由度為3的卡方分布)非參數的Kruskal-Wallis檢驗的檢驗功效有著更好的檢驗性能,且n越大檢驗效度越高。所有圖形都基于函數d來呈現。
五、結論
經模擬檢驗可以看到,在數據類型分布非對稱時,非參數的Kruskal-Wallis檢驗比傳統的單因子方差分析有更高的檢驗功效。現實例子中我們大多遇見的數據都是非齊性的,且分布的類型也沒法確定,數據中也可能會出現比該組中大部分數據都要小很多或大的極端值,在這些情況下采用非參數的Kruskal-Wallis法效果會更優。模擬結果同時顯示:在做檢驗之前,數據的集中趨勢分析是必要的。盡管文獻和教科書說,在違背假定的情況下,F檢驗是穩健的,但檢驗結果告訴我們其檢驗性能顯著降低了。
參考文獻:
[1]吳喜之,趙博娟.非參數統計[M].北京:中國統計出版社,2009.
[2]王靜龍,梁小筠.非參數統計[M].北京:中國統計出版社,2009.
[3]于長春.秩和檢驗-Kruskal-Wallis法和Nemenyi法在科室醫療質量動態監測中的應用[J].中國醫院統計,2009.
[4]王俊.實際應用中方差分析與秩和檢驗結果比較[J].中國衛生統計,2008.