劉方針
(黑龍江醫藥科學編輯部,黑龍江 佳木斯 154003)
統計資料分析方法的選擇,是我們醫學研究者應該掌握的基本常識。如果選擇不當,不僅影響實驗研究的結果,也可能對工作實踐起誤導作用。所以說,統計資料分析方法的選擇至關重要。現就常見統計資料分析方法的選擇簡述如下。
目前對資料的分類大致為兩類[1]:即數值變量和分類變量,也就是以往的計量資料和計數資料。也有文獻分出第三種資料 ,即等級資料[2],但我認為,等級資料可以歸類于計數資料,因為等級資料的統計分析方法多與計數資料一致。
計量資料或稱數值變量,為測定每個觀察單位指標大小而獲得的資料,系定量指標,多有計量單位。如身高(厘米)、體重(公斤 )、血壓(毫米汞柱)等。這類資料據其分布可大致分為正態資料、偏態資料、成倍數資料。資料分布不同則統計分析方法不同,所以,資料到手后,先分析資料的分布情況,然后選擇適宜的統計分析方法。
成倍數資料是指資料的觀察值相差較大,有的成倍數分布,較簡單明了,一看便知。如臨床檢驗的抗體滴度、生物效價等。這類資料可計算其幾何均數,如資料是樣本與總體比較,可選擇樣本幾何均數與總體幾何均數比較的檢驗方法,如是樣本之間比較,可選擇樣本之間幾何均數比較的檢驗方法。其具體步驟請參考相應工具書。
正態資料一般來說是分布相對均勻的資料,即頻數分布以均數為中心,左右側數據分布基本對稱,靠近均數兩側頻數較多,離均數愈遠頻數愈少,形成一個中間數據多、兩側數據逐漸減少、基本對稱的分布。符合上述條件的資料,基本可以確定為正態資料,必要時可以對資料進行正態性 D檢驗,以確定資料分布。正態資料多計算均數和標準差。樣本與總體、或樣本之間的比較,可進行相應的 U檢驗或 t檢驗 ,兩樣本或多樣本之間比較可進行 t檢驗或方差分析。多變量(多指標)間資料可以進行多元分析。
偏態資料不像正態資料那樣分布均勻,而是分布不均勻,可能數據集中于小值一側或大值一側,即數據分布較離散。偏態資料計算中位數(M),同時給出范圍值(最小-最大)。對這類中位數資料可進行中位數間的比較,如樣本中位數與總體中位數、樣本中位數之間的比較。此類資料亦多用秩和檢驗(此法簡單實用,不考慮資料的分布型),也可用超過數檢驗(此法精確度差)。
計數資料亦稱定性資料或分類變量,是對觀察指標按某種屬性或類別分組計數所得的資料,如按年齡、性別、病情、(輕、中、重 )、療效 (痊愈、顯效、好轉、有效 )等。此類資料可計算率或構成比,即計算相對數。根據資料的不同,如樣本率與總體率的比較、樣本率之間的比較,可選擇相應的 U檢驗或t檢驗,亦可選擇卡方檢驗(由于資料不同 ,具體公式不同,如四格資料、配對資料、多行多列資料,應據具體資料選擇相應公式。)、秩和檢驗、Ridit分析等。其中卡方檢驗比較常用 ,且簡便快捷。
統計分析方法的種類繁多,初學者在分析方法的選擇上常不知所措。本文旨在為初學者在統計資料分析方法的選擇上起到相應作用,這些是基本的、也是常用的方法,僅供參考。
[1]四川醫學院主編.衛生統計學 [M].北京:人民衛生出版社,1978,13
[2]孫振球.醫學統計學[M].北京:人民衛生出版社,2002,2