褚啟龍
醫學統計中常用的χ2檢驗在SPSS軟件中的實現途徑
褚啟龍
(湖北職業技術學院,湖北 孝感 432000)
χ2檢驗是一種常用的非參數統計分析方法,在實際工作中,不少醫學研究者仍采用傳統的手工分析方式,效率較低;也有部分研究者采用SPSS軟件進行分析,但由于研究目的和設計方式不同,不同資料形式的χ2檢驗在軟件操作步驟和分析結果解釋上容易混淆。本文通過實例,采用SPSS軟件,以圖解的形式對常用的χ2檢驗方法進行介紹,供醫學研究者參考。
χ2檢驗;SPSS軟件;醫學統計學
醫學統計方法在醫學研究領域應用廣泛,其統計分析結果用以支撐研究結論的科學性,常用的有t檢驗、方差分析、χ2檢驗、秩和檢驗和回歸分析等經典的統計學方法[1,2]。χ2檢驗是一種非參數檢驗,用途很廣,常用于率或構成比的比較。目前仍有不少醫學研究者采用手工計算的方式進行χ2檢驗,但計算量較大且較繁瑣;也有部分研究者采用SPSS軟件進行分析,但由于研究目的、設計方式不同,不同資料形式的χ2檢驗在軟件操作步驟和分析結果解釋上存在很多差異,極易混淆。鑒于此,本文擬以最常用的SPSS軟件為工具,通過實例介紹幾種醫學上常用的χ2檢驗的實現途徑及其分析結果解讀,為廣大醫學研究者提供參考。
四格表資料的χ2檢驗一般用于兩個率或兩個構成比的比較。下面以《預防醫學》教材[3]中的實例,從四格表的表現形式、SPSS軟件操作及分析結果解讀等方面進行說明。
1.1四格表的基本形式
四格表中有4個基本數據,周邊合計都通過這4個數據計算而來。基本數據是否準確直接影響到分析結果,必須予以重視,具體形式如表1所示。

表1甲乙兩種治療方案治療急性胰腺炎的有效率比較(例)
1.2用SPSS軟件進行四格表資料卡方檢驗的操作步驟
根據表1所給出的資料,先輸入數據(如第1行第1列的數據為32,第1行第2列的數據為10,其余數據類似),點擊表上“數據”菜單中的“加權個案”,將“頻數”移入“頻率變量框”中后點擊“繼續”(如圖1所示);點擊“分析”菜單下浮動菜單“統計描述”中的“交叉表”(如圖2所示);將變量“行”和“列”分別移入相應的變量框后,點擊“統計量”按鈕,在彈出的小對話框中勾選“卡方”(見圖3);最后點擊“確定”按鈕,出現如圖4所示的分析結果。

圖1 數據輸入與個案加權截圖

圖2 在SPSS軟件中分析方法選擇截圖
1.3對SPSS軟件分析結果的解讀
軟件分析結果共3張表,主要看最后一張表。此表不僅給出了Pearson卡方和連續校正的卡方值、自由度和具體P值,還給出了Fisher精確概率計算法所算出的具體概率值。我們只需根據條件進行判斷(總例數n、理論值T的大小,此條件在各種醫學統計學教材中均有表述。此時總例數n的大小可從分析結果中的第二張表中看出,理論值T的大小可從第三張表下的說明中看出),選取其中對應的一組結果即可。如此例數n=82(大于40),且沒有一個格子的理論數小于5(最小的理論數T= 6.83),不需校正,因此直接選“Pearson卡方”所對應的結果:P=0.097>0.05(常用檢驗水準),表明甲乙兩種方案的有效率差異無顯著性。

圖3 操作過程截圖

圖4分析結果截圖
2.1配對四格表的基本形式
配對四格表中也有4個基本數據,但它與四格表不同,是配對設計的,而且在形式上與四格表也存在差異,如《衛生統計學》教材中的表2[4]所示。

表2 甲乙兩種白喉桿菌培養基培養結果比較(例)
2.2用SPSS軟件進行配對四格表資料卡方檢驗的操作步驟
根據表2所給出的資料,先將數據按圖5所示輸入后(此處“1.00”表示陽性,“2.00”表示陰性),點擊表上“數據”菜單中的“加權個案”,將“頻數”移入“頻率變量框”中后點擊“繼續”;點擊“分析”菜單下浮動菜單“統計描述”中的“交叉表”(如圖6所示);將變量“甲培養基”移入“行”變量框、“乙培養基”移入“列”變量框后,點擊“統計量”按鈕,在彈出的小對話框中勾選“McNemar(M)”(見圖7);最后點擊“確定”按鈕,出現如圖8所示的分析結果。

圖5 數據輸入與加權個案截圖

圖6在SPSS軟件中分析方法選擇截圖

圖7操作過程截圖

圖8分析結果截圖
2.3對SPSS軟件分析結果的解讀
軟件分析結果也是3張表,主要看最后一張表。此表沒有給出具體的卡方值,但直接給出了P值(Exact Sig(2-sided)),只需看其即可。此例中P=0.021<0.05,表明甲乙兩種培養基的培養結果有顯著性差異。
行×列表資料可以看作是四格表資料的延伸,其χ2檢驗主要用于多個率或多個構成比的比較。采用SPSS軟件進行分析時,其數據輸入方式、基本操作步驟與四格表資料的卡方檢驗完全一致,主要區別在于對結果的解讀:只需看“Pearson卡方”所對應的P值即可。但應注意兩點:(1)對行×列表資料進行卡方檢驗時,要求不得有1/5以上格子的理論數小于5,也不得有1個格子的理論數小于1,這一點很容易從分析結果表下的說明看出來;(2)如果分析結果顯示多個率或構成比有差異,只能說它們總體上有差異,如想進一步具體了解兩組間是否有差別,可對行×列分割后進行分析。
從以上介紹不難看出:用SPSS軟件進行卡方檢驗,其操作不僅程序化,還比較簡單;分析快捷而準確,直接給出P值而無需查卡方界值表,極大地提高了分析效率。即便是初學者,也極易掌握此分析技術。但要準確解讀分析結果,一定要具備一定的醫學統計學基本理論知識,否則將無法通過眾多相似的分析結果得出準確結論。
[1]張立群,魏麗惠.醫學科研論文中常見統計學錯誤分析[J].中國婦產科臨床雜志,2006,7(6):473-474.
[2]王書平.1∶M配對病例——對照研究中兩種可信區間的SAS分析方法[J].中國衛生統計,2011,28(5):606-607.
[3]孫要武.預防醫學[M].4版.北京:人民衛生出版社,2012.
[4]楊樹勤.衛生統計學[M].2版.北京:人民衛生出版社,1990.■
G434
B
1671-1246(2016)17-0042-03