王建強 李云
【摘要】醫學統計學是應用數理統計的原理和方法研究有變異的醫學事件數量特征的一門應用科學,是認識社會和自然現象客觀規律數量特征和醫學科研中不可缺少的重要工具。它涉及醫學數據資料的搜集、整理、分析和推斷,而統計推斷的核心內容就是假設檢驗,是醫學統計學教學中的重點和難點。在實踐中,由于通常難以完全知道所關心的總體的某些數量特征及其變化情況,因而對總體進行比較研究時,常常需要通過假設檢驗對總體做出推斷。
【關鍵詞】醫學統計學;假設檢驗;應用;注意事項
引言
在醫學科研中,一般只能用樣本來進行各種試驗,最后通過樣本得出的結論推斷到總體結論,這就必然需要假設檢驗,通過已知的樣本對未知的總體做出推斷。然而,由于假設檢驗的方法不一、條件不同,它的基本思想、運算過程和結果分析有時難以理解,易造成誤解甚至錯誤。
一、醫學統計資料中假設檢驗的意義
假設檢驗又稱顯著性檢驗,是指判斷樣本統計量與總體參數或樣本統計量與樣本統計量之間的差異有無顯著性意義的一種統計方法。在計量資料分析中,常常遇到一個樣本均數與某一總體均數有差別,或兩個或多個樣本均數間有差別,此時就需要判斷這種差別的性質和意義。例如,根據大量調查資料,健康成年男子脈搏均數為72次/min,可視此為總體均數。某醫生抽查了山區25名健康成年男子,得其脈搏均數均數為74.2次/min,與已知總體均數相差2.2次/min。引起這種差別的原因為:第一,總體均數與該樣本均數本來是相等的,但由于抽樣誤差的影響,導致二者出現差別,統計學上認為此差別無統計學意義;第二,總體均數與該樣本均數存在本質差別,其差別不能用抽樣誤差來解釋,統計學上認為這種差別有統計學意義。因此,判斷樣本均數與總體均數差別的性質(即判斷差別是抽樣誤差所致還是存在本質差別)需用假設檢驗。
二、醫學統計資料中假設檢驗的基本步驟與方法
假設檢驗的方法很多,但其基本步驟是一致的。
首先,假設被比較的數據或指標均來自同一個總體(即假設其差別由抽樣誤差所致),這種假設稱為無效假設或零假設;再根據原始資料計算由抽樣誤差引起差別的概率一值,如果P值≤0.05,則其差別有顯著性;若P值>0.05,則其差別無顯著性。選擇假設檢驗方法應注意以下幾點:第一,資料性質:不同性質的資料分析指標往往不同,如計量資料常做均數間的比較,可采用t檢驗或方差分析;計數資料常做率或構成比的比較,可采用u檢驗或X2檢驗;等級資料可采用秩和檢驗或Ridit分析。第二,資料分布類型:正態分布資料常用參數檢驗法,如t檢驗、u檢驗和方差分析等;偏態分布資料常用非參數檢驗法,如秩和檢驗、游程檢驗等。第三,兩組或多組比較:在完全隨機設計中,兩樣本均數比較常用t檢驗,多樣本均數比較多用F檢驗,多樣本均數的兩兩比較用q檢驗,兩樣本率的比較用u檢驗,多樣本率的比較用X2(卡方)檢驗等。第四,單側或雙側檢驗:臨床上常對兩藥或兩種療法的有效率進行比較,若要判斷兩組總體率有無差別,應該用雙側檢驗;但對已明確甲組有效率不會低于乙組,而又要求判斷甲組有效率是否高于乙組時,則應該用單側檢驗。一般以采用雙側檢驗為宜。選用雙側還是單側檢驗,在實驗設計時即已確定,切不可先采用雙側檢驗,當結論無顯著性時再改用單側檢驗。
三、醫學統計資料中假設檢驗需注意的事項
假設檢驗涉及的問題很多,主要應注意以下幾點:第一,統計結論是有概率性的,不能絕對化。假設檢驗需要事先確定檢驗水準,檢驗水準不同,統計結論可能不同。當得出P<0.05或<0.01,差別有統計學意義時,不能認為其差別是絕對存在的,此時仍有5%或1%的假陽性率。同樣,當得出P>0.05差別無統計學意義時,也不能認為其差別是肯定不存在的。第二,統計學上是否有統計學意義不代表指標問實際差別的大小。事實上,P值的大小,其與被比較的指標間的實際差別無內在聯系。因此,不能將P<0.05認為是指標間差別大或有實用價值,或將P<0.01認為是指標間差別非常大或有極大實用價值。第三,多組比較時的顯著性水準。在實際工作中,經常遇到對多組資料的比較,如多個均數的兩兩比較采用t檢驗,多個率的兩兩比較采用X2(卡方)檢驗,這都是錯誤的。其理由是:當有m個試驗組共用一個對照組時,需進行m次假設檢驗;當有k個試驗組進行任意兩組比較時,則需進行m=k(k-1),2次假設檢驗。若每次假設檢驗以A=0.05為檢驗水準時,其假陽性錯誤可大大增加。因此,應采用適當的方法,使總的檢驗水準不超過預定的檢驗水準。