屈麗娜
【摘 要】假設檢驗在統計推斷中是一項十分重要內容,它在數理統計中占有相當重要的地位。它是對總體參數的取值給出某種假設后,根據樣本信息來判斷所做的假設是否成立,最后做出某種決策的一種推斷方法[1]。本文主要介紹了對假設檢驗中原假設的選取問題和假設檢驗中產生兩類錯誤的原因進行研究,并且計算兩類錯誤的概率。
【關鍵詞】假設檢驗 原假設 兩類錯誤
一、假設檢驗的基本思想及方法
假設檢驗是指總體提出某項假設,然后利用從總體中抽樣所得的樣本值來驗證所提出假設是否正確。在給定備擇假設H1的情況下對原假設H0,如果我們拒絕了原假設H0,這也就意味著我們必須接受備擇假設H1,相反的,我們就只能接受原假設H0。
我們一般可以把假設檢驗分為四步進行:(1)依據實際的問題提出原假設H0與備擇假設H0;(2)選擇合理的檢驗統計量,并且在原假設H0成立的情況下確定統計量的分布;(3)按問題的具體要求,選取恰當的顯著性水平α,并且確定原假設H0的拒絕域;(4)依據樣本觀察值來計算統計量的觀察值,并與原假設的拒絕域進行比較,從而做出拒絕或接受原假設H0的判斷。在假設檢驗的四步中,提出原假設H0與備擇假設H1是第一步,這一步在假設檢驗中占有舉足輕重的地位。以下將通過實例對原假設的選取問題進行深入的分析[2]。
二、原假設的選取
(一)問題的提出
利用假設檢驗解決一些實際問題時,常會發生一種狀況,即對于同一個樣本信息,由于原假設H0的選取不同,可能會得到兩種完全相反的檢驗結果。下面我通過兩個實例來說明一下:
例1:某廠批量生產的電燈泡的質量標準為平均使用壽命1000小時。該廠稱他們引進了一種新技術后生產的電燈泡質量高于規定標準。為了證實廠家所說的真實性,工作人員隨機抽取了250個燈泡作為樣本,測試電燈泡的平均使用壽命1035小時,其標準差為100小時。能否說該廠生產的電子元件質量顯著地高于規定標準?
μ值未落入了拒絕域內,因此接受原假設H0,即不能說該廠生產的電子元件質量顯著地高于規定標準。
通過例1我們觀察到在同一顯著性水平α下,由于將原假設H0與備擇假設H1的位置調換,產生了完全相反的檢驗結論。這就說明了原假設的選取對假設檢驗問題的解決有著至關重要的地位。
假設檢驗問題的第一步即為建立假設,正確合理地確定原假設與備擇假設。這對檢驗結果的正確與否起到很大的作用,因此正確建立假設是解決問題的關鍵。在解決假設檢驗問題時,在假設檢驗中原假設和備擇假設地位是不平等的,原假設是受到保護的。
(二)原假設的選取原則
因為原假設是處于被保護地位,在實際問題中選取原假設時應該遵循以下三點原則:
1.參考過去的有效信息
2.將希望否定的作為原假設
3.將拒絕后導致嚴重后果的作為原假設
三、假設檢驗的兩類錯誤
(一)兩類錯誤產生的原因
在假設檢驗中,檢驗結果與實際的情況可能吻合也可能不吻合,因此,檢驗中犯錯誤是很有可能的[3]。檢驗可能犯的錯誤有兩類:第一類是當H0為真時,由于隨機性使得樣本觀測值落入拒絕域中,導致結果拒絕原假設H0,這種錯誤稱為第一類錯誤,其發生的概率稱為犯第一類錯誤的概率,或稱拒真概率,通常記為α;第二類錯誤是當H0不是真的,即H1為真時,由于隨機性使得樣本觀測值落入接受域中,導致結果為接受原假設H0,這種錯誤稱為第二類錯誤,其發生的概率稱為犯第二類錯誤的概率,或稱取偽概率,通常記為β[2]。
(二)兩類錯誤的概率的計算
當我們知道了假設檢驗的兩類錯誤發生的原因時,這就為我們計算它們出現的概率奠定了基礎。從之前的分析,我們知道了,第一類錯誤是由于實際推斷原理所引起的,即“小概率事件不會發生”的假定引起的,所以小概率事件發生的概率即顯著性水平α就是第一類錯誤發生的概率[4]。
犯第二類錯誤的概率計算相比較而言是復雜的,因此我們在上述例子的基礎上進行進一步的設計:該公司職員實際工資不是870元,而是860元,原假設為假,我們依舊假設實際工資是870元。下面我們分別作出總體均值為860元和870元這兩種情況下的正態分布曲線(A和B)我們能夠明確地知道,在理論上存在的若干個樣本均值中,一旦某個樣本均值864.4<<875.6時,我們將把870元誤認為總體均值,不拒絕原假設。由于860元才是真實的情況,所以我們就犯了第二類錯誤,即取偽錯誤。犯第二類錯誤概率的大小是相對于正態曲線A而言的,圖1中陰影部分的面積計算:
結論
本文主要探討了假設檢驗中的幾個問題。首先說明了假設檢驗的基本思想以及假設檢驗的一般步驟;然后論述了假設檢驗的第一步原假設的選取,最后簡述了假設檢驗中兩類錯誤,說明產生“棄真錯誤”和“取偽錯誤”的原因,文中又進一步給出例題進行說明,并計算出兩類錯誤的概率[5]。
【參考文獻】
[1]詹曉琳,沈薇薇.顯著性假設檢驗中原假設的建立[J].上海第二工業大學學報,2012(2).
[2]茆詩柳,程依明,濮曉龍.概率論與數理統計教程[M].北京.高等教育出版社,2004.
[3]韓兆洲等.假設檢驗的一個常見誤區[J].統計與信息論壇,2005(1).
[4] 李文華.雷金星.假設檢驗中兩類錯誤的成因、發生概率及其相關問題[J].統計與決策,2005(4):117-119.
[5]曹遠紅.假設檢驗在體育統計應用中注意的兩個問題[J].湖南科技學院學報,2011(12).endprint