黃文蝶 周江霖
摘 要:假設檢驗是統計教學中的一個重點和難點。本文以案例式教學方法為主導,結合啟發式教學,力圖將這一問題的基本思想與步驟闡述清楚,引導學生在掌握原理的同時進一步深化統計思想的培養。
關鍵詞:假設檢驗;案例式教學;啟發式教學
假設檢驗是統計推斷中非常重要的一個問題,也是統計教學中的一個難點所在。本文以案例式教學方法為主導,結合啟發式教學,力圖將這一問題的基本思想與步驟闡述清楚,引導學生在掌握原理的同時進一步深化統計思想的培養。
一、提出問題
產品質量問題是當今社會的一個熱門話題,這節課我們就用假設檢驗的方法來檢驗一種非處方藥的質量是否合乎規定。
例:一種無需醫生處方可得到的治療咳嗽和鼻塞的藥,按規定其酒精含量為5%.今從已出廠的一批藥中,隨機抽取10瓶,測試其酒精含量為:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06。已知酒精含量服從正態分布N(μ,0.00016)。
向學生提出問題:如果現在你是一名質檢員,那么你認為這批藥品是否合格?
二、分析問題
引導學生對這一問題進行逐步深入地分析:現在關注的是這一批藥的酒精含量——這是我們的研究總體;手頭掌握的資料有,10瓶藥品的酒精含量數據以及總體所服從的分布。
判定這批藥品是否合格,關鍵是看總體均值μ是否為5:若μ=5,則藥品合格;若μ≠5,則藥品不合格。
通過點估計的學習,我們知道總體均值可以用樣本均值去估計,容易得到μ的估計值為4.989,顯然4.989≠5,那么這個時候能否下結論:這批藥品不合格?如果貿然下這樣的結論,既不能讓人信服,自己也會存在疑惑:一方面,樣本均值只是總體均值的一個估計量,并不能完全代表總體均值;另一方面,樣本均值受隨機因素的影響比較大,而4.989與5相差這么小,這個誤差似乎是可以接受的。到底可以容忍的最大誤差是多少呢?這成了我們最終關注的問題。
將上述分析過程條理化,我們便得到了假設檢驗的基本步驟。
三、解決問題
1.建立原假設和備擇假設
正所謂萬事開頭難,能否合理地建立原假設,關系著整個假設檢驗的成敗。關于如何建立原假設,學者們各抒己見:茆詩松主張以“不能輕易否定”為原則,何書文以“與事實相反”為原則……總之一句話,原假設是受到保護的、不會被輕易推翻的。
在我們研究的這個問題中,建立原假設與備擇假設如下:
H0:μ=5, H1:μ≠5
2.構造檢驗統計量
在提出原假設后,要構造一個特殊的統計量:其分布在原假設下是已知的,其數值直接影響最后的結論。通常情況下,將原假設中未知參數的數值代入區間估計中的樞軸變量,即可得到我們需要的檢驗統計量。
在σ2已知的條件下,μ的區間估計中用到的樞軸變量為,將μ=5,σ2 =0.00016,n=10代入,檢驗統計量為,且Z~N(0,1)。
3.確定H0的拒絕域
在H0成立時,觀察檢驗統計量取值的特點(偏大、偏小、絕對值偏小等),給出對H0不利的小概率事件,使得小概率事件發生的樣本觀測值的集合,稱為H0的拒絕域。
為了解釋拒絕域的定義,帶領學生回顧“小概率事件原理”—小概率事件在一次試驗中是不會發生的。在學習古典概率的時候,我們曾經舉了一個“女士品茶”的例子:一位常飲牛奶加茶的女士稱,她能從一杯沖好的飲料中辨別出先放茶還是先放牛奶。她在10次試驗中都正確地辨別出來了,問該女士的說法是否可信。
我們假設該女士說法不可信,計算得出事件A=“10次試驗都能正確指出放置茶和牛奶的先后次序”發生的概率為0.0009766,這是一個非常小的概率。依據小概率事件原理,A應該是不會發生的,這與實際結果相矛盾,因此認為假設“該女士說法不可信”不成立,有理由斷言該女士的說法是可信的。
實際上,在假設檢驗的過程中正是利用了“小概率事件原理”,思路與上述例子是完全一致的:先假定H0成立,如果從試驗數據計算出檢驗統計量Z的值非常罕見,此時,我們認為小概率事件發生了,這是由于H0所導致的矛盾,因此,拒絕H0;否則,接受H0。
回到我們研究的問題:若H0成立,則樣本均值與5的差距比較小,即|Z|較小。因此,拒絕域的形式為{|Z|>a},數值a應該如何確定呢?
如果在H0成立的條件下,作出了拒絕H0的結論,稱之為第一類錯誤,將第一類錯誤的概率記為α,有時又稱α為顯著性水平。通常情況下,我們控制犯第一類錯誤的概率,α一般取0.05,即P (|Z|>a| H0 ) =0.05。此時,查標準正態分布表可知,a=1.96,拒絕域為{|Z|>1.96}。
4.作出結論
計算檢驗統計量的值,觀察其是否落入拒絕域,下結論。
將樣本均值代入,得到Z=2.75,|Z|>1.96,落入拒絕域中,因此,該批藥品的酒精含量不符合規定。
四、問題的深入與探索
如果我們將α的值選為0.002,查表可得a=3.090,此時,|Z|在確定拒絕域時,我們介紹了第一類錯誤——在H0成立的條件下,作出了拒絕H0的結論。有一就有二,如果在H0不成立時,作出了接受H0的結論,稱之為第二類錯誤。請同學們思考:犯第一類錯誤的概率與犯第二類錯誤的概率,兩者之間是否存在關系?如果存在關系,是一種什么樣的關系?
參考文獻:
[1]胡發勝.宿潔.數理統計[M].山東大學出版社,2004.
[2]茆詩松.概率論與數理統計[M].北京:中國統計出版社,2000.
[3]同濟大學應用數學系.概率統計簡明教程[M].北京:高等教育出版社,2012.
(作者單位:武警警官學院)