南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 葉韻韶 陳平雁
常見定量資料應用基于秩轉換類參數方法的可行性*
南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 葉韻韶 陳平雁△
目的針對配對樣本(單樣本)設計、兩個和多個獨立樣本設計的定量資料,分析參數方法、非參數方法以及基于秩轉換類參數方法在資料不滿足參數方法條件下的適用情形。方法介紹基于秩轉換類參數方法的原理及其與非參數方法的關系,采用Monte-Carlo模擬方法,考慮正態和左偏態兩種分布,方差齊與不齊兩種情形,比較三種方法的I類錯誤率和檢驗效能。結果左偏態分布時,無論方差是否齊性,或不涉及方差齊性(單樣本設計),參數方法的I類錯誤率偏離設定水準且明顯大于非參數方法和基于秩轉換類參數方法,而檢驗效能明顯低于其他兩種方法。方差不齊且正態分布時,參數方法的統計性能明顯優于其他兩種方法。非參數方法和基于秩轉換類參數方法在不同資料類型下的統計性能相近。結論基于秩轉換類參數方法與非參數方法條件性能相近,適用于非參數方法處理的數據。
定量資料 參數方法 非參數方法 秩轉換 I類錯誤率 檢驗效能
對于定量數據,參數方法通常需要滿足某些前提條件,如正態分布和方差齊性等,此種情況下使用參數方法優于非參數方法已有定論。然而,當數據不滿足參數方法所需條件時,包括經數據轉換后仍然不能滿足的情形,校正的參數方法(如Welch法等用于方差不齊的情況)和非參數方法都可以考慮[1],同時,基于秩轉換類參數方法(method of ranks,以下簡稱“秩轉換類參數方法”)也是一種選擇[2-5]。雖然Conver等[6]通過理論推導及證明,揭示了常見資料類型秩轉換類參數方法統計量與非參數方法統計量之間的關系,但是,采用秩轉換類參數方法在應用方面是否可行,仍是一個值得探討的問題。為此,本文針對常見的資料類型,即配對樣本(單樣本)設計、兩個和多個獨立樣本設計的定量資料,系統介紹相應的秩轉換類參數方法,并采用Monte-Carlo方法模擬比較其與參數方法、非參數方法的統計性能,以系統論證秩轉換類參數方法應用于數據處理實踐的可行性。
1.配對樣本設計
非參數方法:對于配對樣本設計,用Di表示配對樣本(Xi,Yi)的差值,即Di=Xi-Yi(i=1,2,…,N),N為樣本量。設Ri為Di對應的秩次(差值為0不進行排秩),即Ri=sign(Di)×rank(|Di|),其中sign()表示符號函數,rank()表示|Di|在|D1|,|D2|,…,|Dn|(n是差值非0的對子數)中的秩次,當|Di|相等時,即出現相同秩(ties),此時取平均秩次,由此得非參數方法Wilcoxon signed ranks(WSR)的檢驗統計量[7]:

ZWSR近似服從標準正態分布,其中T+為所有正值的秩和。tj為第j個相同秩的個數。
當無相同秩時,公式(1)等價于:

參數方法:H0∶E(D)=0,參數方法對應的單樣本t檢驗為:

秩轉換類參數方法:用秩次Ri替代原始數據Di,差值為0時做剔除處理,則秩轉換類參數方法的檢驗統計量(單樣本t檢驗):

tWSR服從自由度υ=N-1的t分布。
當不存在相同秩時,可由公式(2)和公式(4)得出檢驗統計量ZWSR與tWSR的關系,即:

對于單組設計,檢驗統計量只需在分子上減去已知參數(常量),其他關系式不變。
2.兩獨立樣本設計
非參數方法:非參數方法常用Wilcoxon-Mann-Whitney(WMW)檢驗。設X1,X2,…,Xn和Y1,Y2,…,Ym表示兩個獨立隨機樣本,其中n≤m,n和m為相應兩組的樣本量。設Ri為兩個獨立樣本數據混合后對應的秩次,Ri的取值從1到N(N=n+m)。當觀測值相等時,取平均秩次,可得檢驗統計量:秩轉換類參數方法:秩轉換類參數方法(兩獨立樣本t檢驗)的檢驗統計量[6]:


tWMW服從自由度υ=N-2的t分布。
當不存在相同秩時,檢驗統計量ZWMW與tWMW有以下關系:

3.多個獨立樣本設計
非參數方法:(X11,X12,…,X1n1),(X21,X22,…,X2n2),…,(Xk1,Xk2,…,Xknk)表示k個獨立隨機樣本,其樣本量依次為n1,n2,…,nk,其中i≤k,j≤nk,即組數為k,第i組例數為ni,設Rij為k個樣本數據混合后對應的秩次,即Rij的取值為1,2,…,N(N=n1+n2+…+nk),當觀測值相等時,取平均秩次,可得Kruskal-Wallis(K-W)檢驗的統計量[8]:

秩轉換類參數方法:用秩次Ri替代原始數據后采用方差分析,其檢驗統計量:


對上式(15)求HKW一階導數,可證明FKW是一個關于HKW的嚴格單調遞增函數。
1.模擬方法及參數設置
模擬研究考慮分布、均數、方差和樣本量等四個因素。因滿足參數方法條件下(方差齊性和正態分布)已有結論,本模擬僅驗證不滿足參數方法的4種情形,即①左偏態分布(單樣本);②方差(兩樣本或多樣本,后同)齊性且左偏態分布;③方差不齊且正態分布;④方差不齊且左偏態分布。樣本量分別取5、6、8、10、12、14、16、20、25、30、35、40、50和100,有平衡和非平衡設計兩種,后者兩組樣本量比例取1∶2。多個獨立樣本設計取3個水平。相同秩次均按平均秩次編秩。均數及方差的設置見后述。雙側檢驗,檢驗水準α=0.05,模擬次數10000次。分別計算三種統計方法的I類錯誤率和檢驗效能。模擬過程采用R 3.1.0軟件。
當方差不齊時,參數方法采用Welch校正。
2.結果
(1)左偏態分布
由圖1可見,單樣本或配對樣本設計,參數方法的I類錯誤率明顯大于秩轉換類參數方法與非參數方法,而檢驗效能明顯低于其他兩種方法,其他兩種方法的統計性能相近。
FKW服從自由度υi=k-1,υ2=N-k的F分布。
當無相同秩時,檢驗統計量HKW公式(12)與FKW公式(14)的關系如下:

圖1 左偏態分布單樣本或配對樣本
(2)方差齊性且左偏態分布
由圖2可見,兩獨立樣本設計,參數方法的I類錯誤率明顯偏離且低于設定的檢驗水準0.05,檢驗效能亦明顯低于其他兩種方法,秩轉換類參數方法與非參數方法的統計性能相近,并優于參數方法。三個獨立樣本設計的結果與兩獨立樣本設計結果相一致。

圖2 左偏態分布且方差齊性(平衡設計)
(3)方差不齊且正態分布
由圖3可見,對于I類錯誤率,當n≤20時,三種方法的波動幅度較大;當n>20時,波動幅度明顯減小,但均未增大趨勢,以參數方法最接近設定的檢驗水準,秩轉換類參數方法次之,非參數方法最差。對于檢驗效能,三種方法相近。

圖3 正態分布且方差不齊(平衡設計)
(4)方差不齊且左偏態分布
由圖4可見,對于I類錯誤率,參數方法較其他兩種方法明顯偏大,而且隨樣本量增大呈增大趨勢;其他兩種方法結果相近,接近設定檢驗水準。對于檢驗效能,參數方法偏低,其他兩種方法相近。
非平衡設計的結果與平衡設計基本一致(因篇幅所限本文未給出)。
對于滿足參數方法條件的資料(正態分布和方差齊性),參數方法優于非參數方法和秩轉換類參數方法已有公認結論,故本研究未考慮這一情形。本研究對于不滿足正態分布的情況選擇了一種左偏態分布,主要是考慮這種分布無法通過變量變換滿足參數方法條件,雖然未考慮更多種類的非正態分布情形,但有代表性。

圖4 左偏態分布且方差不齊(平衡設計)
對于單樣本或配對樣本設計,不服從正態分布的情形不宜使用參數方法,用非參數方法或秩轉換類參數方法均可,且性能相近。
當方差不齊且服從正態分布時,參數方法的統計性能要優于其他兩種方法,這一結果與趙景波等[9]和Skovlund等[10]的研究結果一致。因此,對于此類資料,盡管不滿足參數方法的條件,但仍以選擇經方差校正的參數方法為最佳選擇。
當服從左偏態分布時,無論方差齊或不齊,參數方法的統計性能較差,不推薦使用。而非參數方法和秩轉換類參數方法性能相近,均可使用。Zimmerman[11]對該兩種方法進行了模擬比較,結果與本研究相似。
秩轉換類參數方法實質上屬于非參數方法,我們稱之為“類參數方法”,是因為這是一種經過秩轉換后使用常規參數方法的檢驗。雖然本研究所涉及的最常用的三種資料類型非參數方法和秩轉換類參數方法性能接近,但我們所以進行秩轉換類參數方法的研究,主要是考慮某些資料類型,如析因設計等較復雜設計目前尚無適用的非參數方法,這就為秩轉換類參數方法應用的可能性提供了依據,也是我們的后續研究會進一步考慮的課題。
1.Rosner B.Fundamentals of Biostatistics.USA:Brooks/Cole 7th edit. 2011.
2.Friedman M.The use of ranks to avoid the assumption of normality implicit in the analysis of variance.Journal of the American Statistical Association,1937,32(200):675-701.
3.Iman RL.A power study of a rank transform for the two-way classification model when interaction may be present.Canadian Journal of Statistics,1974,2(1-2):227-239.
4.Iman RL,Hora SC,Conover WJ.Comparison of asymptotically distribution-free procedures for the analysis of complete blocks.Journal of the American Statistical Association,1984,79(387):674-685.
5.Conover WJ,Iman RL.Analysis of covariance using the rank transformation.Biometrics,1982:715-724.
6.Conover WJ,Iman RL.Rank transformations as a bridge between parametric and nonparametric statistics.The American Statistician,1981,35(3):124-129.
7.Conover WJ.Practical Nonparametric Statistics.New York:John Wiley,1980.
8.Kruskal WH,Wallis WA.Use of ranks in one-criterion variance analysis.Journal of the American statistical Association,1952,47(260):583-621.
9.趙景波,李洪源,李康.兩個非正態分布資料比較方法的選擇.中國衛生統計,2003,20(3):185-188.
10.Skovlund E,Fenstad G.Shold we always choose a nonparametric test when comparing two apparently nonnormal distributions.Joumal of Clinical Epidemiology,2001(54):86-92.
11.Zimmerman DW.A note on consistency of non-parametric rank tests and related rank transformations.British Journal of Mathematical and Statistical Psychology,2012,65(1):122-144.
(責任編輯:郭海強)
Practicability of Parametric Test Based on Rank Transform Statistic for Common Quantitative Data
Ye Yunshao,Chen Pingyan(Department of Bio-statistics,Southern Medical University(510515),Guangzhou)
ObjectiveTo explore the practicability of parametric test,nonparametric test and parametric test based on rank transformation for quantitative data of paired-sample(one-sample)designs,two independent sample designs as well as three or more independent sample designs when data violate normality or homoscedasticity.MethodsIntroducing the theory of parametric test based on rank transformation and comparing type I error and power of the three kind methods by means of Monte Carlo Simulation considering that data are normality or negative skewness and homoscedasticity or heteroscedasticity.ResultsThe results indicate that parametric test contributed to type I error inflations,of which type I error are clearly greater than nonparametric test and parametric test based on rank transformation no matter whether homoscedasticity or not.Parametric test is superior to two others when data are normality but heteroscedasticity.Nonparametric test has a good consistency to parametric test based on rank transformation in different designs.ConclusionType I error and power of parametric test based on rank transformation is nearly equal to that of the nonparametric test when data are applicable to nonparametric test.
Quantitative data;Parametric test;Nonparametric test;Rank transformation;Type I error;Power
*:國家自然科學基金項目(No.81273191)
△通信作者:陳平雁,E-mail:chenpy99@126.com