摘要:本文通過對假設檢驗的原理的分析,說明了假設檢驗的方法是在一定情況下,否定原假設,而不能肯定原假設,舉例說明了交換原假設與備擇假設,產生相反結果的原因,并指出了設定原假設與備擇假設的合理方法。
關鍵詞:假設檢驗;原假設;備擇假設;小概率事件
中圖分類號:G642 文獻標志碼:A 文章編號:1674-9324(2013)52-0093-02
在統計學教學實踐中,參數的假設檢驗占有獨特、重要的地位。在教學中,筆者發現大多數學生及統計工作者甚至個別青年教師假設檢驗的原理理解不到位,突出表現在對原假設與備擇假設的設定上覺得無從下手,掌握不好,有時在判斷結論上會出現截然相反的結論,這種情況的發生,使得在教學過程中引起混淆,甚至懷疑假設檢驗本身的正確性?;诖?,本人談幾點看法。
一、假設檢驗的基本思想及基本原理
假設檢驗是事先對總體參數或分布形式作出某種假設,隨后由所抽取的樣本構成檢驗統計量,根據統計中的小概率原理,即“小概率事件在一次試驗中幾乎不可能發生的”。依據樣本信息,對于提出的假設作出判斷:是接受,還是拒絕,這種基本思想是帶有概率性質的“反證法”。為了判斷一個“結論”是否成立,先假設該“結論”成立,稱此“結論”成立為原假設,記為H0,與之對立的“結論”,稱為備擇假設,記為H1,在原假設H0成立的前提下運用統計分析的方法進行推導和計算,如果得到一個不合理(小概率事件在一次試驗中發生了)的現象,就有理由懷疑原假設H0的正確性,從而拒絕原假設H0。反之,若沒有出現上述這種不合理現象的發生,就沒有理由拒絕原假設H0,即可以接受原假設H0。由于樣本的隨機性,無論是拒絕H0,還是接受H0,我們都無法保證假設檢驗的結果絕對或者是完全的正確,也可能會出現錯誤判斷,從而導致犯兩類錯誤。第Ⅰ類錯誤一般叫做“棄真”錯誤:如果原假設H0為真時,錯誤地拒絕了H0,那么就犯了棄真錯誤,記為P{拒絕H0|H0為真}=α,α為顯著性水平。第Ⅱ類錯誤一般叫做“取偽”錯誤:如果原假設H0不真時,錯誤地接受了H0,那么就犯了取偽錯誤,記為P{接受H0|H0不真}=β。由于犯兩類錯誤的概率不能同時控制變小,通常我們控制犯第Ⅰ類錯誤的概率,使它不超過a,這里所說的“顯著性”是“顯著性不合理”,是指只有當H0成立時,顯著不合理的狀態才拒絕H0,否則就要“接受”H0,這里的接受是指不拒絕H0,原因是由于沒有獲得充分的理由拒絕H0而勉強接受而已。因此,使用顯著性檢驗時,當檢驗結果為拒絕H0時,結論比較可靠,是很有說服力的,因為檢驗結果為拒絕H0時,犯錯誤的概率不超過α,換一句話說,我們有1-α的把握相信這種拒絕H0是正確的。反過來,如果獲得“不拒絕”原假設的結論,那么“接受”原假設就顯得沒有說服力,所以這是僅僅表明的是樣本數據與原假設沒有矛盾,但這并不能說明原假設是應該被接受的,不拒絕并不等于接受,那么如何合理地設立原假設和備擇假設呢?
二、原假設H0及備擇假設H1的確定
從經常遇到的實際問題的背景來看,我們真正感興趣的可能是備擇假設,因為接受備擇假設可能表明會得到特別意義的結論,或意味著采取某種重要決斷,因此,對備擇假設應取慎重態度,沒有充足的理由不能輕易接受。一般來說,應遵循以下原則來確定原假設與備擇假設。第一、把具有保守經驗的選擇為原假設,也就是設為原假設應該是不能被輕易否定的結論,這些結論通常是指原有的基本理論、基本方法、基本狀況等,也可以說是公認的、經驗的、歷史的一些結論。在假設檢驗中,由于原假設已經默認為真,對應著大概率的情況,在沒有獲取足夠的證據時是否定不了它的,要想把這種默認改變,那么所對應的樣本觀測值就必須有顯著性的發生改變。而對于那些不能輕易否定的結論,在沒有足夠的理由證明它的錯誤之前,人們總是不會做出輕易否定的結論,這就是通常把不能被輕易否定的結論作為原假設的基本原理和基本依據。特別地,在進行單側檢驗時,一般取與預想結果的相反面為原假設。比如說,當病人前來問診時,醫生要對病情作出診斷,這時醫生可能會犯“無病看成有病”或者“有病看成無病”的錯誤,而這兩種結果相對比較來說,更嚴重的錯誤是把“有病看成無病”的結論,所以應將“看病的人有病”作為原假設H0,“看病的人無病”作為備擇假設H1。
三、實例應用,對假設檢驗一個誤區的解釋
在統計學教學實踐中,有些學生甚至是教師,對于下面的假設檢驗問題常常會得出一個令人困惑的結論。問題如下:從某廠生產的一批燈泡中隨機地抽取20只進行壽命測試。由測試結果計算得這批燈泡的平均壽命為x=1960(小時),s=2000(小時)。假定燈泡壽命服從正態分布:X~N(μ,σ2)其中μ,σ均未知。那么在顯著性水平α=0.05下能否認為這批燈泡的平均壽命達到國家標準2000小時?
對上述問題,給出以下有兩種解法,確得到了截然相反的結論。
解法1:提出原假設H0:μ≥2000備擇假設H1∶μ<2000,作檢驗統計量T=■,顯然,該統計量符合自由度為19的T分布,即:T=■~t(19).
結合假設,確定拒絕域的形式為{T<-t0.05(19)}由α=0.05,查t分布表,定出臨界值-t0.05(19)=-1.729,從而求出拒絕域 {T<-1.729}.由測試結果得到:
T=■=■=-0.894,
由于T>-1.729,作出接受假設H0的判定,即認為這批燈泡的平均壽命達到國家標準2000小時.
解法2:提出原假設H0:μ<2000備擇假設H1μ≥2000,
作檢驗統計量T=■,顯然,該統計量符合自由度為19的T分布,即:T=■~t(19).
結合假設確定拒絕域的形式{T>t0.05(19)}由α=0.05,查t分布表,定出臨界值t0.05(19)=1.729,從而求出拒絕域{T>1.729}。由測試結果得到:T=■=■=-0.894,
由于T<1.729,作出接受假設H0:μ<2000的判定,即認為這批燈泡的平均壽命未達到國家標準2000小時。
我們看到,隨著問題提法的不同(把哪個斷言作為原假設的不同),得出了截然相反的兩種結論。對同一問題,為什么出現這種結果,錯在哪里?基于上述過程也使得一些對統計思想不甚理解的人感到迷惑不解。實際上,以上問題的解法,是基于我們不同的著眼點。在解法1中,提出原假設H0:μ≥2000是依據該廠產品以往的質量和信譽一直良好,達到國家標準,所以對其斷言已有了較大的信任度,沒有充分的理由就難以改變我們對該廠產品的信任度,所以一開始就對該廠產品持有肯定的態度。解法2中,提出原假設H0:μ<2000是根據該廠產品一直質量較差,信譽低,沒有達到國家標準,從一開始我們就對該廠產品質量持有懷疑態度,如果不是很有利于該廠產品質量的良好結果,那么就很難改變對該廠的看法。因此我們的著眼點不同,也就決定了所得到的相應的結論。從實際問題來看,對同一問題進行分析時選取不同的原假設是具有不同含義的,也就是說,原假設和備擇假設在設定的本質上是帶有一定的主觀因素和情感的。這樣,在解決某一個具體的實際問題時,由于不同的人感興趣的問題不同,研究的目的不同,出發點也不相同,即使是研究同一個問題,也可能會提出完全相反的原假設和備擇假設。如果把原假設和備擇假設兩者的意義交換,那么,原假設和備擇假設受保護的地位就會發生轉變,這樣的話,原來努力去論證正確的備擇假設就變成研究人員想辦法收集證據予以達到反對的假設,這就改變了研究人員的研究初衷和研究目的。所以,進行假設檢驗的關鍵應該是合理地選取原假設和備擇假設。對于同一個實際問題,在顯著性水平α之下,由于原假設和備擇假設不同,所進行的假設檢驗將會導致不同的研究意義和研究目的。
假設檢驗是統計分析中的一種重要方法,理論上,假設檢驗中的原假設和備擇假設可以以任意的方式設定。但在實際問題中應合理、辯證地選取原假設和備擇假設,這樣可以得到更明確而有效的結論.在統計學的假設檢驗教學過程中,如何設定原假設和備擇假設,這種基本的問題我們應重點強調清楚,有助于學生對假設檢驗的清晰、透徹理解, 能夠使學生更好地掌握假設檢驗的思想方法,具體在實踐中應用假設檢驗方法解決實際問題,并對后續的理論學習產生良好的作用。
參考文獻:
[1]李延忠,孫艷,等.概率論與數理統計[M].北京:高等教育出版社,2011.
[2]吳贛昌.概率論與數理統計[M].北京:中國人民大學出版社,2008.
作者簡介:孫艷(1964-),女,學士,副教授。