999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種有序數(shù)據(jù)的多組別比較方法

2018-05-11 07:37:12孫豐霖類淑河
統(tǒng)計與決策 2018年8期
關(guān)鍵詞:方法

孫豐霖,類淑河

(中國海洋大學 數(shù)學科學學院,山東 青島 266100)

1 問題的提出

社會調(diào)查往往會收集到大量的定性數(shù)據(jù),一般分為無序的名義數(shù)據(jù)(Nominal Data)和有順序概念的有序數(shù)據(jù)(Ordinal Data)[1],它們所代表的總體分別是名義變量和有序變量。“有序”是指對變量進行分類并按照一定的順序排列,不同類別之間的距離并不需要相等的一種測量尺度[2]。對于有序數(shù)據(jù)的數(shù)據(jù)分析,以一種定量的方式,比如按照順序的概念進行賦值在數(shù)據(jù)處理中十分有益[3]。雖然可以簡單的將有序變量賦值1,2,…,k,但這些數(shù)字除了有次序關(guān)系以外并沒有實際意義。均值、方差以及協(xié)方差對這類數(shù)據(jù)也是沒有意義的[4]。例如:對一種商品售后服務的滿意程度有:1很滿意、2滿意、3尚可、4不滿意、5十分不滿意。雖然“1很滿意”和“2滿意”的差距與“3尚可”和“4不滿意”之間數(shù)字差距都為1,但不能認為二者之間的真實差距是相同的。因此,用于連續(xù)型數(shù)據(jù)的方法不能簡單地應用到有序數(shù)據(jù)上,否則,所得到結(jié)果往往是粗糙甚至完全錯誤的。如果能夠?qū)τ行蜃兞窟M行合理的賦值,找到各個類別真實的代表值,有序數(shù)據(jù)就變成了一種特殊的計數(shù)數(shù)據(jù)(取值離散、有限但非整數(shù)),此時,均值、方差以及協(xié)方差等量就存在意義,應用于連續(xù)數(shù)據(jù)的模型和方法就能夠應用到各類別的代表值上來。丁元林、孔丹莉(2005)[5]借助層次分析法來對各類別進行量化,雖然能夠一定程度上解決各類別之間等距的問題,但還是存在較強的主觀性。因此,一種客觀的賦值方法對于有序變量的處理十分關(guān)鍵。

多總體均值的比較問題在實際數(shù)據(jù)分析中十分常見。在許多領(lǐng)域,ANOVA是最常用的統(tǒng)計方法之一[6]。當數(shù)據(jù)滿足正態(tài)性和方差齊性時,ANOVA的F檢驗被認為是最簡單也是最優(yōu)的方法。不過當假定不滿足時,F(xiàn)檢驗就會變得無效。針對正態(tài)異方差情況,已經(jīng)有許多檢驗方法可以使用,如Weerahandi(1995)[7],Krishnamoorthya、Lu、Mathew(2007)[8]等。對于非正態(tài)異方差情況,Luh和Guo(1999)[6]提出了一種具有較好穩(wěn)健性的方法。此外,還可以對數(shù)據(jù)進行正態(tài)化,不過正態(tài)化的方法有多種多樣,往往難以做出最優(yōu)的選擇,有時還會存在解釋上的困難[9]。其他處理非正態(tài)的方法還有使用更加穩(wěn)健的位置參數(shù)代替均值或者使用秩方法[10],比如Wilcoxon秩和檢驗、Kruskal-Wallis秩和檢驗等。不過需要注意到,從連續(xù)型數(shù)據(jù)轉(zhuǎn)化為秩數(shù)據(jù)時會令原始數(shù)據(jù)損失一部分信息。

以上方法都是針對連續(xù)型數(shù)據(jù)而言的方法,當數(shù)據(jù)來自有序變量時,數(shù)據(jù)的不連續(xù)性和打結(jié)現(xiàn)象(數(shù)據(jù)中存在相同的數(shù)字)會使得前面的方法都不夠穩(wěn)健或者無法使用,這就對新的檢驗方法提出了要求。Lu、Poon、Cheung(2015)[11]提出了針對有序數(shù)據(jù)的多重比較方法,通過正態(tài)潛變量模型解決有序數(shù)據(jù)的一元多總體期望是否一致的問題,該方法假定觀測到的有序數(shù)據(jù)是對某一潛在的連續(xù)正態(tài)變量的一種粗略度量,通過對潛變量總體均值的兩兩比較來得出結(jié)果。魯統(tǒng)宇等(2016)[4]在實際的社會調(diào)查數(shù)據(jù)中應用了此方法,并通過Bonferroni校正來控制總體錯誤率,由于沒有考慮檢驗統(tǒng)計量之間的相關(guān)性,檢驗的功效比較低。

本文提出了一種針對有序數(shù)據(jù)的一元單因素方差分析方法。首先通過潛變量模型對有序數(shù)據(jù)進行客觀合理的賦值,計算各個類別真實的代表值。此時,有序數(shù)據(jù)就轉(zhuǎn)化為可以進行數(shù)學運算的量。然后,通過ANOVA來檢驗多組別數(shù)據(jù)總體期望是否一致。鑒于ANOVA要求各組別數(shù)據(jù)應滿足正態(tài)性和方差齊性,因此采用Bootstrap方法重抽樣進行重構(gòu)數(shù)據(jù)。根據(jù)中心極限定理,合適的自助樣本容量可以保證重構(gòu)后的數(shù)據(jù)滿足正態(tài)性,在保證正態(tài)性的基礎上對各總體的自助樣本容量進行調(diào)整,可以令各組重構(gòu)數(shù)據(jù)的方差近似相等,這樣重構(gòu)數(shù)據(jù)就滿足了正態(tài)性和方差齊性。該過程保證了重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)有相同的總體均值,接下來利用一元單因素ANOVA方法檢驗重構(gòu)數(shù)據(jù)的均值是否一致,對重構(gòu)數(shù)據(jù)進行的方差分析也就是對原始數(shù)據(jù)均值信息的假設檢驗。

2 方法

2.1 潛變量模型

對于有序變量z,假定存在一個潛在的連續(xù)變量x。連續(xù)變量x代表z在各類別下潛在的真實值,通常假設x的取值范圍是從-∞到+∞,潛變量x可以用于有連續(xù)性要求的統(tǒng)計方法和模型。如果z有m個類別,標記為1,2,…,m,則有序變量z和潛變量x的關(guān)系是:

其中:

τi(i=0,1,…,m)稱為臨界值。因為在有序數(shù)據(jù)中所獲得的都是z的信息,而潛變量x的分布并沒有任何信息。原則上來說,可以選擇任何連續(xù)型分布作為潛變量的分布函數(shù)。但在實際應用中,正態(tài)分布應該是潛變量最常見的分布,因此假設潛變量x服從標準正態(tài)分布對處理問題是十分方便的[12]。記標準正態(tài)分布的密度函數(shù)為φ(x),分布函數(shù)為Φ(x)。有序變量z取值為i的概率為:

于是:

Φ-1是標準正態(tài)分布的逆變換。由于在實際中,pi是未知總體的量,一般用的所對應的類別的樣本頻率 pi來代替,即:

各個類別的臨界值確定后,可以通過計算積分平均值的方法得到各類別的代表值,即:

接下來就可以將ai作為各類別的真實代表值計算均值、方差、協(xié)方差等。當假設潛變量服從[0,c]區(qū)間上的均勻分布時,就簡化為陳民肯(2007)[13]中的秩分析方法。

2.2 重構(gòu)數(shù)據(jù)和ANOVA

得到各類別的代表值后,k組有序數(shù)據(jù)就可以表達成來自k個服從離散分布的隨機變量的樣本。設ξi(i=1,2,…,k)是相互獨立的隨機變量,概率分布為:

下面進行數(shù)據(jù)重構(gòu):給定自助樣本容量m1,m2,…,mk和自助樣本數(shù)量n1,n2,…,nk,從x1中有放回的隨機抽取m1個樣本,求所抽出樣本的均值上述步驟重復n1次,可以從x1中得到重構(gòu)數(shù)據(jù),當m1足夠大時,由中心極限定理可得。對總體G2至Gk也進行上述步驟,可以得到各個總體的重構(gòu)數(shù)據(jù)y2,…,yk。當m2,…,mk足夠大時,各總體的重構(gòu)數(shù)據(jù)服從相應的正態(tài)分布。事實上,當m1,m2,…,mk足夠大時,可以保證各組數(shù)據(jù)正態(tài)性,在此基礎上調(diào)整m1,m2,…,mk的取值可以令各重構(gòu)樣本的方差相近,這樣重構(gòu)數(shù)據(jù)就滿足數(shù)據(jù)正態(tài)性和方差齊性條件。在實際應用中,總體方差一般是未知的,可以用樣本方差替代。下面對重構(gòu)數(shù)據(jù)y1,y2,…,yk進行方差分析。記:

當原假設成立時,由yij之間的獨立性和正態(tài)性,可以得到:

3 隨機模擬

假設變量已經(jīng)能夠得到客觀合理的賦值,驗證上文中重構(gòu)數(shù)據(jù)和ANOVA方法。以組別k=2,3,5為例,簡單起見,假設各組別的原始樣本量s和自助樣本數(shù)量n相同。以s=50,100,150,200,250,300;n=10,15,20,25,30為例,隨機生成k組總體均值相同相互獨立的隨機樣本,計算在α=0.05和0.01兩種情況下,該方法對原假設的拒絕率,即實際error I(每個s和n的組合進行105次實驗),結(jié)果見下頁表1。

表1 k=2,3,5時實際error I

從表1可以發(fā)現(xiàn):無論自助樣本數(shù)量和樣本量取何值,實際error I都會發(fā)生不同程度“膨脹”現(xiàn)象。不過隨著樣本量的增大,實際error I會越來越接近名義error I。隨著自助樣本數(shù)量增加,實際error I會逐漸增大,這是因為自助樣本數(shù)量增大會導致檢驗的均值越來越趨近于樣本均值,如果樣本均值與總體均值有一定差距的話,會傾向于拒絕原假設。當類別數(shù)增大時,實際error I也會有一定程度的增加。在實際應用中,可以采取如下方法控制實際error I:

(1)增大原始樣本量。樣本量的增大會使得樣本與總體差距越來越小,樣本代表總體的程度也越來越好,實際的兩類錯誤都會得到控制。現(xiàn)如今,數(shù)據(jù)量往往不再成為限制統(tǒng)計的一個難題,科技的發(fā)展讓大量樣本的獲取成為可能,使得該方法有一定的應用空間。當樣本量由于獲取手段、環(huán)境等因素不可增加時,可采取方法(2)、方法(3)。

(2)減小名義error I。雖然該方法的實際error I無法達到名義error I,但可以通過降低名義error I來控制實際error I。例如表1中,當k=2、s=300、n=10時,給定α=0.05,但此時實際error I達到0.14,但如果將α減小到0.01時,實際error I就可以控制到0.05。

(3)進行多次檢驗。由于本文方法的核心是通過重抽樣進行重構(gòu)樣本,所以允許進行多次抽樣和假設檢驗。例如制定策略:進行10次重抽樣和假設檢驗,當有6次或者6次以上拒絕原假設時,得出拒絕原假設的結(jié)論。當k=2、s=300、n=10、α=0.05時,實際error I為0.29,如果采用該策略,實際error I就會降低到0.04<α=0.05。

4 結(jié)束語

秩方法和潛變量模型都可以對有序變量進行客觀地賦值,雖然前者更加簡單和易于理解,但在實際中,后者應該是更為合適的選擇。重構(gòu)數(shù)據(jù)的過程將有序數(shù)據(jù)轉(zhuǎn)化為連續(xù)數(shù)據(jù),在轉(zhuǎn)換過程中把原始數(shù)據(jù)的總體均值的信息保留下來。在這一過程中,確定合適的自助樣本容量m、自助樣本數(shù)量n和名義error I十分關(guān)鍵,前者保證了重構(gòu)數(shù)據(jù)的正態(tài)性和方差齊性,后兩者保證了假設檢驗結(jié)論的正確性,防止誤判的發(fā)生。由于Bootstrap方法是可放回的隨機抽樣,該方法對原始樣本數(shù)量并沒有要求。當樣本質(zhì)量較高時,即樣本均值、方差等與總體一致,即使是小樣本情況,該方法在控制實際error I和error II方面都有很好的效果。不過,更穩(wěn)妥的適用范圍應該是在大樣本情況。雖然在普通樣本下,會導致該方法的實際error I明顯偏大,但可以通過增大原始樣本量、降低名義error I和進行多次試驗來解決出現(xiàn)的“膨脹”現(xiàn)象。如果一味地選擇降低名義error I,雖然可以使得實際error I降低到給定值,但這樣做可能會使實際error II增加,所以解決方法(2)和方法(3)配合使用時往往能產(chǎn)生很好的效果,這也是該方法的優(yōu)勢所在。

本文實際上為多總體一元有序數(shù)據(jù)提供了一種簡單的比較總體均值一致性的參數(shù)方法,為社會調(diào)查數(shù)據(jù)分析者提供了一種解決多組別比較問題的手段。由于本文只考慮了單因素情況的ANOVA,如何將其應用到多因素甚至多元ANOVA中及該方法的效果有待進一步研究。

參考文獻:

[1]張堯庭等.定性資料的統(tǒng)計分析[M].南寧:廣西師范大學出版社,1991.

[2]Vogt W P,Johnson R B.Dictionary of Statistics&Methodology:A Nontechnical Guide for the Social Sciences[M].Newcastle:Sage,2011.

[3]Agresti A.An Introduction to Categorical Data Analysis[M].New Jersey:John Wiley&Sons,2007.

[4]魯統(tǒng)宇,劉春雨,王珮.社會調(diào)查數(shù)據(jù)中的多組別比較分析[J].統(tǒng)計與決策,2016,(12).

[5]丁元林,孔丹莉.對比標度權(quán)重法在量化有序多分類變量中的應用[J].數(shù)理醫(yī)藥學雜志,2005,18(1).

[6]Luh W M,Guo J H.A Powerful Transformation Trimmed Mean Method for One-way Fixed Effects ANOVA Model Under Non-normality and Inequality of Variances[J].British Journal of Mathematical and Statistical Psychology,1999,52(2).

[7]Weerahandi S.Anova Under Unequel Error Variances[J].Biometrics,1995.

[8]Krishnamoorthy K,Lu F,Mathew T.A Parametric Bootstrap Approach for ANOVA With Unequal Variances:Fixed and Random Models[J].Computational Statistics&Data Analysis,2007,51(12).

[9]鮑貴.方差分析穩(wěn)健性的蒙特卡羅研究[J].外語研究,2004,(1).

[10]吳喜之.非參數(shù)統(tǒng)計[M].北京:中國統(tǒng)計出版社,1999.

[11]Lu T Y,Poon W Y,Cheung S H.Multiple Comparisons With a Control for a Latent Variable Model With Ordered Categorical Responses[J].Statistical Methods in Medical Research,2015,24(6).

[12]J?reskog K G.Structural Equation Modeling With Ordinal Variables Using LisrEL[R].Technical Report,Scientific Software International,Inc.,Lincolnwood,IL,2005.

[13]陳民肯.多分類有序變量間距差異的統(tǒng)計分析與實際應用[D].廈門:廈門大學碩士學位論文,2007.

猜你喜歡
方法
中醫(yī)特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數(shù)學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
可能是方法不對
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲a级毛片| 中国一级特黄大片在线观看| 国产一区二区福利| 国产97色在线| 精品亚洲欧美中文字幕在线看 | 亚洲热线99精品视频| 91九色国产porny| 国产精品免费p区| 天堂中文在线资源| 国产人在线成免费视频| 亚洲天堂首页| 欧美成人免费午夜全| 久久人与动人物A级毛片| 视频一区视频二区日韩专区| 国内熟女少妇一线天| 亚洲自偷自拍另类小说| 国产一级妓女av网站| 日韩一区二区三免费高清| 国内a级毛片| 亚洲欧美日韩另类在线一| 秋霞国产在线| 日本91视频| 欧美a级完整在线观看| 亚洲精品成人片在线观看| 在线观看亚洲天堂| 国产激情影院| 日韩欧美国产另类| 狠狠色噜噜狠狠狠狠色综合久| 伊大人香蕉久久网欧美| WWW丫丫国产成人精品| 国产小视频a在线观看| 无码人中文字幕| 午夜国产理论| 九色视频一区| 欧美19综合中文字幕| 中文字幕欧美成人免费| 波多野结衣中文字幕一区二区| 欧美日本一区二区三区免费| 亚洲天堂高清| 免费人欧美成又黄又爽的视频| 中文字幕人妻av一区二区| 亚洲综合色吧| jijzzizz老师出水喷水喷出| 成人免费视频一区| 日韩欧美亚洲国产成人综合| 久久人人爽人人爽人人片aV东京热| 国产高颜值露脸在线观看| 精品乱码久久久久久久| 日韩AV手机在线观看蜜芽| 国产人妖视频一区在线观看| 欧美笫一页| 综合色88| 尤物特级无码毛片免费| 亚洲欧美日韩中文字幕一区二区三区 | 九色91在线视频| 国产1区2区在线观看| 久久女人网| 毛片久久网站小视频| jizz国产在线| 亚洲无码A视频在线| 91尤物国产尤物福利在线| 亚洲欧洲日韩综合| 伊人查蕉在线观看国产精品| 全部毛片免费看| 欧美天堂在线| 国产一级毛片yw| 国产偷国产偷在线高清| 第一区免费在线观看| 男人的天堂久久精品激情| 99九九成人免费视频精品| 女人18毛片水真多国产| 毛片一级在线| 亚洲精品日产AⅤ| 夜夜操天天摸| 国产免费久久精品99re丫丫一| 国产视频入口| 91年精品国产福利线观看久久| 国产成人成人一区二区| 亚洲第一页在线观看| 国内老司机精品视频在线播出| 国产精品护士| 88av在线看|