葉鴻烈
【摘要】以具體工作中的假設檢驗的兩個例子,嘗試回答假設檢驗教學中經常碰到的幾個問題,如果某事件在一次實驗中發生了,就有足夠的理由認為這個事件不是小概率事件,在參數估計中,根據樣本所提供的信息,求出總體參數置信區間,就能以一定的置信水平保證總體參數落在該置信區間內。在假設檢驗中,如果原假設為真,樣本對應的統計量值落在置信區間外的可能性是很小的,而假如一旦落在置信區間內,就可以拒絕原假設。對于如何建立原假設,本文提出兩個原則,拒絕原則和棄真成本比較原則,對具有方向性的并且統計量值在置信區間內的假設檢驗具有實踐指導作用。
【關鍵詞】假設檢驗參數估計小概率原理
【基金項目】2013年廣西高等教育教學改革工程立項項目(編號:2013JGA427)資助。
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2014)05-0248-02
《統計學》是教育部規定的經管類專業必須開設的核心課程,為決策者提供數量依據的一門方法論學科。該課程在本科經管類專業的內容主要分三大塊,描述統計、推斷統計,統計應用部分,其中統計應用部分主要是講述基于推斷統計基礎上特別是應用假設檢驗方法解決具體問題。因此推斷統計中的假設檢驗是一個重點內容,但這部分內容學生以前沒有接觸過,特別是經管類專業招生時為文理兼招,數學的基礎不是特別理想,學生在學習的很多時候,知其然而不知其所以然。如何講清楚假設檢驗內容是一個難題,本文嘗試在疏理傳統教材的前提下,提出一些的新的講述方法。
1.假設檢驗授課的困惑
傳統的教學順序是,從小概率原理出發,說明假設檢驗的基本思想,介紹假設檢驗的兩類錯誤,建立假設檢驗的基本步驟。但存在下面幾個問題,試以下面例子說明。某燈泡生產企業欲向某超市提供一批燈泡,按合同規定,燈泡的使用壽命平均不能低于2000小時。假定燈泡使用壽命服從正態分布,且標準差為250小時。燈泡生產企業為確認這批燈泡的使用壽命,隨機測試了30只燈泡,并算得樣本均值為1998小時。現在來研究超市是否應該接受這批燈泡?(α=0.05)。首先,使用區間估計方法,這里,■■=1998,n=30 , Z■=1.96 , σ=250 ,■±Z■×■=1998±1.96×■=1998±89.42 即,(1908.58,2087.42),這里包含了2000,顯然超市是應該接受這批燈泡的。但是,學生的困惑是,這里面不是也有很多的數據處在2000以下嗎?現試用假設檢驗,這是一個關于單個正態總體均值的具有方向性的單邊檢驗問題,可以設立兩種原假設,原假設一,H0:μ≥2000,H1:μ<2000,Z=■=■=-0.044,大于-Z0.05=-1.645因此結論是沒有證據表明能夠拒絕原假設,超市是應該接受這批燈泡。另外原假設二,H0:μ≤2000,H1:μ>2000,Z=■=■=-0.044 ,小于Z0.05=1.645,因此,結論是沒有證據表明能夠拒絕原假設,超市是不應該接受這批燈泡。學生在此又有一個困惑,原假設不同,得到的結論卻是不同的。其實,關鍵的地方應該給學生講清楚下面幾個問題,第一,有了教材前面的區間估計方法,為什么還要講述假設檢驗?假設檢驗和區間估計有什么異同?它們各自的適用范圍。第二,顯著性水平的含義α=0.05是什么?第三,原假定的建立有什么原則嗎?采用不同的原假設,得出相反的兩個結論原因是什么。第四,兩類錯誤的關系如何理解?在傳統假設檢驗的教學中,老師重點放在讓學生對在給定的原假設基礎上如何選擇合適的檢驗統計量并進行計算,讓學生判斷樣本數據是否落入拒絕域從而做出拒絕或接受原假設,結果是大部分學生在學習假設檢驗過程中總是死記硬背各類檢驗統計量和拒絕域的具體形式,忽略假設檢驗的統計思想的培養與統計方法的掌握,沒能達到“舉一反三”的學習效果。
2.問題的解決
首先,我們要講清楚小概率事件原理,小概率事件在一次試驗中幾乎不可能發生。小概率事件沒有發生不奇怪,我們感興趣的是奇怪的事情,小概率事件發生了,這說明原設定的小概率事件不是小概率事件,另外還要明確假設檢驗中到底什么是小概率事件。上面的例子計算的Z值對應的概率換算為0.4825,比0.05大多了,顯然不是一個小概率事件。區間估計和假設檢驗有什么異同?置信區間可以回答假設檢驗的問題,算得的置信區間如不包含原假設,則拒絕原假設。如包含了原假設,則不拒絕原假設,但可信區間不能代替假設檢驗, 可信區間只能在預先規定的α水準下計算, 而假設檢驗能計算較為確切的 P 值。參數估計解決的是范圍問題,假設檢驗則判斷結論是否成立。另外 ,兩者對問題的了解程度各不相同。進行區間估計之前不了解未知參數的有關信息。而假設檢驗對未知參數的信息有所了解,但作出某種判斷無確切把握。現實工作中更多的是使用假設檢驗,比如,上例的燈泡案例用參數估計計算出來的范圍盡管包含了2000,但也包含了太多的2000以下的數據,給管理者作出決策帶來太多的風險。但假設檢驗就能定性地給出結論,并告訴管理者有多大的把握。那么,如何建立原假設?上面的例子,由于采用不同的原假設,得出絕然相反的兩個結論。根據NEYMAN和 PEARSON提出的“在控制犯第一類錯誤的概率α的條件下,盡量使犯第二類錯誤的概率β減小”原則,在解決具體問題時只限制α的大小而忽略β ,在假設檢驗時更傾向拒絕原假設而不是接受。因為假如拒絕了原假設,我們就有1-α信心相信原假設為偽,即只有α的概率大小犯錯誤,從實際上說就是因為事先已經對原假設產生了懷疑而純粹為了推翻或拒絕它。基本原則是從檢驗者本身的目的出發,將希望推翻或拒絕的結論設為原假設,這一原則或者叫拒絕原則。另外,從可能犯錯成本角度來看,否定原假設的概率是α,假如原假設是對的,我們拒絕了,拒真錯誤概率就是α,如果拒真造成的犯錯成本很高,說明這時設定的原假設就設對了,因為要有更多更嚴格的證據才能拒絕原假設。具體到上面的燈泡例子。使用拒絕原則,我們認為該批產品不合格,原假設H0:μ≥ 2000.,H1:μ<2000,原假設是我們拒絕的。如果我們認為該批產品合格,H0:μ≤2000,H1:μ>2000,原假設是我們拒絕的。具體到實際工作中,我們找證據證實產品合格比證實不合格要困難得多。使用拒真成本最高原則分析,產品實際上是好的,被我們拒絕了:H0:μ≥ 2000.,H1:μ<2000,造成的損失,和這批產品是差的但我們沒有拒絕H0:μ≤2000,H1:μ>2000,造成的損失相比那個更大?現實工作中,使用不合格產品比不使用合格產品造成的損失要大得多。所以,對于具有方向性的統計量的假設檢驗分析,假如計算出來的統計量值在(-1.65,1.65.α=0.05)或者(-1.96,1.96.α=0.01)之間,或者轉換概率P值大于0.05或者0.01,則建議加大樣本量,或者根據拒真成本最高原則來設定原假設,比如上述燈泡例子,建議取H0:μ≤2000,H1:μ>2000,結論是超市不應該接受這批燈泡。再者,顯著性水平的含義是什么?小概率事件在一次實驗中居然發生了, 說明原假設顯著的不成立,此時我們拒絕原假設犯錯誤的概率為α,因為α很小,一般是0.05, 0.01等, α也稱為顯著性水平,也就是拒真的概率,也就是說,樣本證明要拒絕原假設,但畢竟是樣本,要冒概率α犯錯誤的風險。這就是所謂的第一類錯誤,如果樣本證明沒能拒絕原假設,只能說明觀測值與零假設不矛盾,但并不能肯定原假設為真,此時接受原假設會以概率β冒取偽的風險,這就是第二類錯誤,在一定的樣本量條件下,犯第一類錯誤概率小,則犯第二類錯誤概率就大。
以下面的例子結束我們的討論。 咖啡生產廠商在其產品標簽上聲稱,其出品的咖啡罐頭平均重量為1.5千克或者以上,監督部門對其咖啡罐頭產品進行質量檢查,根據以往的數據得知,咖啡罐頭重量標準差為0.05千克。今隨機抽取了49聽咖啡罐頭,測量其重量,平均重量為1.49千克。要求在0.05的顯著性水平下,檢驗咖啡罐頭重量的總體均值是否與標簽上聲稱的內容相符?
這是一個具有方向性的檢驗問題。這里也有兩個原假設。如果使用上述的拒絕原則,原假設是H0:μ≥1.5,Z=■=■=-1.4>-1.645,沒有證據表明能夠拒絕原假定,但從犯拒真的成本的大小來分析,使用了不合格的產品的風險成本比不使用合格的產品的風險成本要大,所以,原假定應該是:H0:μ≤1.5, Z=■=■=-1.4<1.65,沒有證據表明能夠拒絕原假設。實際檢驗工作中,對于方向性明確的問題,一定要從風險成本出發確定原假設,否則,增大樣本量,或者做出讓步。
本文以具體工作中的假設檢驗的兩個例子,嘗試回答假設檢驗教學中經常碰到的幾個問題,主要是要求學生正確理解小概率事件原理,顯著性水平的含義等概念,要求學生掌握如果某事件發生的概率很小,在一次實驗中,是可以忽略它的,也就是說明在一次實驗中該事件是不會發生的,如果某事件在一次實驗中就發生了,就有足夠的理由認為這個事件不是小概率事件,也就不能忽略它等基本思想。回答了參數估計與假設檢查的異同,在參數估計中,我們是根據樣本所提供的信息,求出總體參數置信區間,以一定的置信水平保證總體參數落在該置信區間內。在假設檢驗中,由臨界值圍成的區域就是以總體均值為中心的置信區間。如果原假設為真,樣本對應的統計量值落在置信區間外的可能性是很小的,而假如一旦落在外面,利用“小概率原理”就可以拒絕原假設。對于如何建立原假設,本文提出兩個原則,拒絕原則和棄真成本原則,特別是對具有方向性的并且統計量值在置信區間內假設檢驗具有實踐指導作用,教師的教學不僅要向學生傳授學科知識,更為重要的是培養學生主動學習、思考的學習方式。在實際教學環節中,這就要求授課教師要做到能夠準確的把握重點和難點,對重難點內容既要能夠擴展引申,也要能夠深入剖析。 此外,教師還必須對重點問題做好總結歸納,將實際問題與理論相結合,通過案例教學的方式,最大程度上調動學生的學習積極性,培養學生創新思維,特別是統計學教學尤其是這樣,激發學生學習熱情,提高學習效果,實現有效學習與有效教學,解決學生對該課程學習的難學難記的問題,培養他們利用《統計學》知識分析、解決實際問題的能力,使學生具有較強的理論與實踐應用能力、獨立分析與解決問題能力、交流與合作能力等,為學生學習相關課程以及今后實際工作中打下扎實的統計學基礎,提高學生的就業能力。
參考文獻:
[1]蒲冰.對假設檢驗的教學探討[J].重慶科技學院學報(社會科學版)2011年第2期:193-194.
[2]王藝明. 假設檢驗教學和應用中的幾個問題探討[J].廈門廣播電視大學學報,2007年第1 期:57-59.
[3]曹遠紅. 體育統計教學中假設檢驗的教學方法建議[J].湖北經濟學院學報(人文社會科學版),2011年第2期:203-204.
[4]郭寶才,孫利榮.關于假設檢驗中的幾個問題的探討[J]. 統計與決策,2010年第6期(總第 306 期):10-11.
[5]劉群鋒. 假設檢驗中的三個問題及其思考[J].大學數學,2008年10月第24卷第5期:190-193.
[6]詹曉琳,沈薇薇. 顯著性假設檢驗中原假設的建立[J].上海第二工業大學學報,2010年6月第 27卷第 2 期:156-159.
[7]馮力.統計學[J].東北財經大學出版社,2011年1月第1版.