(中南財經政法大學統計與數學學院 430073)
多項選擇題數據的非參數統計方法探究
程 曦
(中南財經政法大學統計與數學學院 430073)
在統計研究中的各類問卷調查中,多項選擇題的應用十分普遍。多項選擇題有較多備選項,可以同時選擇多個選項,其復雜度也強于一般分類數據。因此,本文運用本學期所學的非參數統計檢驗知識,針對各選項的顯著性,嘗試運用多種方法對該類數據進行檢驗與分析,也對各類方法的效果進行分析和比較。
在記錄多選題調查結果時,為了便于定量分析,采用多重二分法(Multiple Dichotomy Method)的編碼方法,即將多項選擇題的每一個選項視為一個“處理”,每一份問卷看作一個“區組”,并用“0”表示沒有被選中、“1”表示被選中。這樣,多項選擇題的數據可以表示為二元完全區組數據。
本文的例證數據采用以下多選題的調查數據:請問您日常飲用下列哪種水?(多選)A 自來水,B井水,C 家用凈水器處理后的水,D 桶裝水或瓶裝水。
選取調查結果中的25份問卷,其調查結果以多重二分法編碼如下:
(一)模型建立
游程檢驗是用于檢驗取值“1”概率為p的Bernoulli試驗中的“1”和“0”是否隨機出現的方法。其原理是,將連在一起的“0”或“1”作為一個游程,當已知出現了多少個“1”和“0”時,游程個數R服從固定的分布。
其假設為:H0:有隨機性;H1:無隨機性(有聚類傾向)
統計量及其分布為:R=游程數~Y(m ,n)
其中m為“0”的個數,n為“1”的個數,Y代表游程分布。
其具體計算是通過累加概率求得P值:……p>