【摘要】假設檢驗是統計學課程中十分重要的內容。假設檢驗教學中的難點是單尾檢驗。本文闡述了如何通過分析專門設計的實例以及運用統計分析軟件等方法講解單尾檢驗的原理,以使學生能更深入地理解這部分內容。
【關鍵詞】假設檢驗單尾檢驗統計分析軟件
【中圖分類號】G642.4【文獻標識碼】A 【文章編號】2095-3089(2014)05-0209-01
統計假設檢驗是統計學中重要而又獨特的一種思維方式,也是在實際中應用十分廣泛的統計分析方法。筆者在多年的統計類課程的教學中發現,假設檢驗中的單尾假設檢驗(one?鄄tailed hypothesis test)是教學中的一個難點。單尾假設檢驗指要檢驗總體參數值不大于或不小于某個特定值時所使用的一種假設檢驗方法;因其拒絕域只是在抽樣分布的一側(左尾或右尾),故稱單尾檢驗。對于單尾檢驗,學生通常覺得最難理解的是如何設定零假設(H0)和備擇假設(H1),比如,對一個給定的關于均值假設檢驗的實際問題,是應設定H0:μ≥μ0,H1:μ<μ0;還是設定H0:μ≤μ0, H1:μ>μ0。另外,對于使用兩種不同的設定而得出的不一致的結果應如何解釋,學生一般也覺得較難理解。
筆者運用了結合對特別設計的實例進行深入分析和應用統計分析軟件SPSS輔助教學的方法來解決這一難題,取得了良好的效果。
一、運用實際例子深入剖析原理
在講了單尾檢驗的概念之后,給出如下例子。
例1. 一個汽車輪胎制造廠商聲稱,該廠一等品輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于25000公里。而某批發商提出,如果使用隨機樣本的檢驗結果能充分支持該廠商的說法,他將購買大批這種輪胎。對一個由15個輪胎組成的隨機樣本作了試驗,得到的輪胎壽命(公里)分別為:24500、27230、21900、28900、32500、23200、25950、26620、21060、30500、31900、29200、27890、22530、24100。假定輪胎壽命近似服從正態分布,試問能否從這些數據做出結論:該廠商的產品同他所說的標準相符?(顯著性水平α=0.05)
首先讓學生試做這一例子。為了便于計算,給出樣本均值=26532和樣本標準差=3627。
試做的結果,大家的做法大致可歸納為兩種。
第一種,做出如下假設:
H0:μ≤25000 , H1:μ>25000。
應用t-檢驗,在這種假設下,拒絕域為T≥t0.05(14)=1.761,而實際計算的T值為:T=1.636;因而,結論是不拒絕H0。
第二種,做出如下假設:
H0:μ≥25000 ,H1:μ<25000 。
在這種假設下,拒絕域為T≤-t0.05(14)=-1.761,實際的T值同樣為1.636;因而,結論是不拒絕H0。
接下來,讓學生思考:如何解釋這兩種看起來“矛盾”的結論?在討論中引導學生認識這樣一點:由于這兩種做法的結果都是不拒絕H0,因而兩者都有可能犯第二類錯誤(即“取偽錯誤”),而且第二類錯誤的概率通常比第一類錯誤(棄真錯誤)的概率大,并且難以事先控制;從這個角度看,我們并沒有得出完全矛盾的結論。
至此,大家很自然就會提出:到底能否判斷哪種作法才是“對”的?實際中我們應如何在兩種不同的假設中做出選擇?
在對這些問題的討論中,應引導學生認識選擇假設的一般原則是“將‘有很高可靠度才愿意接受’的結論放到H1”。原因在于,當拒絕H0(接受H1)時,犯錯誤的概率被控制在α(即顯著性水平,通常是很小的數,如,0.05)之內,即很有把握據此做出正確決策。但當不拒絕H0(實際決策則為接受H0)時,犯錯誤的概率通常較大且難以確定,即并非很有把握據此做出正確決策。
因此,最后應指出的是,選擇哪種假設歸結為一個“立場”問題(在本例中,即:是站在“買家”還是“賣家”的立場)。對于“買家”而言,他們會選擇第一種假設方式;因為他們的想法是:要很有把握我才愿意購買這種輪胎。而對于“賣家”而言,他們愿意選擇第二種假設方式;因為他們認為:你要很有把握才說我的輪胎質量不行。
二、運用SPSS加深對問題的理解
由上所述,可以看出,“買家”與“賣家”存在一個“矛盾域”,即如果T值落在區間(-1.761,1.761)之中,則雙方會有矛盾的結論。(如果T值不小于1.761,“買家”也會認為輪胎質量不錯,而如果T值不大于-1.761,“賣家”也不得不承認質量不行。)
通過增大樣本容量n,可緩解雙方的矛盾。從“矛盾域”的范圍來看,若n不是15而是20,則存在矛盾的區間變為(-1.729,1.729);若n為30,則區間變為(-1.699,1.699)。而n的增大對緩解雙方矛盾的更主要作用體現在它使實際T值的絕對值增大(T值與n的平方根成正比)。兩個不同容量的樣本,即使其均值和標準差都相同,其實際T值也不同,從而可能導致不同的檢驗結論。
筆者運用統計分析軟件SPSS設計出第二個例子,其樣本容量n=20,而樣本均值、標準差都與例1相同。通過使用SPSS對這兩個例子進行對比分析,使學生充分認識樣本容量在單尾檢驗中扮演的角色,從而更深入理解單尾檢驗的原理。
由于兩個例子中的樣本均值都大于檢驗值(25000),故第二種假設的檢驗結果必然都是不拒絕H0。下面我們對第一種假設進行分析。
運用SPSS進行t-檢驗的步驟為:
菜單操作:Analyze→Compare Means→One-Sample T Test→把要檢驗的變量選入變量框→在檢驗值框中輸入25000。
結果分析:例1的運行結果為:T值=1.636,Sig.(2-tailed)=0.124。
SPSS的Sig.值即通常說的p-值,應注意的是,由于系統中的Sig.值為雙尾的,故在做單尾檢驗時,應取該值的一半作為單尾的p-值。因而,在這一例子中,p-值為0.062;按照當p-值小于α值(在本例中為0.05)時拒絕H0的原則,檢驗結論為不拒絕H0。
例2. 在例1的基礎上,再隨機抽取5個輪胎,其壽命(公里)分別為:29720、24430、25445、21532、31533。以20個輪胎為樣本進行檢驗。(α=0.05)
用SPSS對例2進行分析,運行結果為:
T值=1.889;Sig.(2-tailed)=0.074。即,在例2中,單尾的p-值為0.037,故檢驗結論為拒絕H0。也就是說,接受輪胎平均壽命大于25000公里的結論。
注意到例2中的樣本均值=26532,樣本標準差=3627,與例1完全相同。但由于n的不同,導致T值和p-值都不相同,結論也完全不同。由此,可以看到n的增大對“買家”與“賣家”的矛盾有緩解作用,我們還可以將此與日常生活中的相應情形聯系起來理解——“你如果還不相信,就再多試幾次嘛”。
這樣的統計分析軟件演示不但使學生更深入地理解了假設檢驗的原理,而且也理解了樣本量在統計分析中的作用和重要性。
參考文獻:
[1]陳秀虎,楊敏,白厚義.單尾假設檢驗假設設置的探討[J].統計教育.2007(2):8-9.
[2]鐘路.對參數單尾假設檢驗中存在的問題的探討[J].統計與決策.2004(11):27-28.
[3](美)戴維 R.安德森 等 著.張建華 等 譯.商務與經濟統計(第11版)[M].北京:機械工業出版社.2012.