孫辰展


摘 要:假設檢驗是數理統計學中由樣本推斷總體的一種常見方法。本文主要研究了假設檢驗的基本思想和原理,并列舉了包括均值檢驗、比例檢驗、方差檢驗三種常見的檢驗方法,并以具體案例探討了假設檢驗方法的實際計算與運用。
關鍵詞:假設檢驗 基本思想 運用
引言
客觀世界是復雜的,人類探索未知世界的歷程,正是不斷提出猜想,并驗證一個個主觀假設的過程。而統計學中的推斷方法,正是輔助人類進行科學、理性判斷的重要利器。
一、假設檢驗的基本思想
1.基本概念
一般來說,我們可以把統計學分類為描述統計和推斷統計兩種類別,而假設檢驗正是一種常見的推斷統計方法。假設檢驗(Hypothesis Testing)是一種利用樣本推斷總體的推斷統計,首先會對總體的某個參數提出假設,在設定原假設成立的情況下進行取樣并計算樣本發生的概率,如果發生概率足夠小,則認為原假設不成立。假設檢驗利用了“小概率”的數學思想,在科學界得到了廣泛運用。
假設檢驗起源于國外著名的“品茶試驗”。著名的統計學家Fisher在論文中提到:在一場英式下午茶中,一位女士告訴大家她有一項神奇的本領,即她可以通過品茶來辨別奶茶制作過程中牛奶和茶倒入杯中的先后順序。為了驗證女士的神奇能力,Fisher為她設定了一個檢驗方式:調配了6杯除了倒入順序不同,其他條件完全一樣的奶茶讓女士進行辨別,以判斷女士是否說謊。
Fisher利用了這樣的思想,首先他假設:女士沒有這樣的能力,這樣的原假設顯然符合大家的常識判斷。在這個假設成立的情況下,女士所謂的“品茶”實則便是毫無依據的瞎猜了。在這樣的情況下,女士如果猜對的杯數足夠多,那說明在原假設的情況下發生了一個小概率的事件,我們傾向于認為我們的原假設是存在錯誤的,即否定我們的原假設,認為該女士存在這樣的能力。實驗的結果令人吃驚,該女士真的把6杯奶茶的倒入順序全都答對了。不難計算,如果是瞎猜的話,全猜對的概率為1/64,這顯然是一個小概率事件。因此,Fisher推翻了原假設,認為該女士確實存在這樣的神奇能力。
2.基本步驟
不難發現,在實際運用中,假設檢驗方法有其固定的操作步驟,基本流程分別為:
(1)提出原假設和備則假設。
原假設一般用H0表示,備則假設使用H1表示,需要注意的是,原假設和備則假設都是對于總體特征的假設,它們是相互聯系且互相對立的假設;
(2)選定檢驗方法,構造合適檢驗統計量。
檢驗統計量是根據抽取樣本所構造出的隨機變量,包含了所要檢驗的總體參數,以便用于檢驗原假設是否成立。需要特別注意的是,檢驗統計量一般在原假設成立時服從特定的分布,從而便于計算樣本概率。
(3)確定顯著性水平a,計算P值,做出判斷。
根據上面的“品茶”案例我們發現,小概率事件的判定是具有主觀性的,這一標準稱為顯著性水平a。顯著性水平的定義將直接影響到推斷結果。在上個案例中,在女士成功品出六杯奶茶后,如果我們把顯著性水平定為0.05,則小概率事件發生了,我們需要拒絕原假設;而當我們把顯著性水平定為0.01,則小概率事件并未發生,我們需要接受原假設。P值,則是檢驗統計量超過樣本觀測值的概率,也即是能夠拒絕原假設的最小顯著性水平。當我們計算出P值后,當 時,我們便拒絕原假設,反之則接受原假設。
3.假設檢驗中的兩類錯誤
由于假設檢驗總是利用有限的樣本信息對總體進行推斷,檢驗和推斷中是可能發生錯誤的。一般來說,假設檢驗可能會犯兩種錯誤,分別為第一類錯誤和第二類錯誤。
一般來說,我們主要控制第一類錯誤發生的概率,即顯著性水平a。
二、假設檢驗的常見類型
1.均值檢驗
(1)基本方法
均值檢驗主要檢驗的是總體的均值是否符合我們的假設,這里主要列舉當總體服從正態分布,且總體方差已知的情況。
通過查表可知 則 ,檢驗統計量落入了拒絕域,則拒絕原假設,認為該機器已經不符合生產標準。
2.比例檢驗
(1)基本方法
比例檢驗主要檢驗的是總體中符合某些特征的個體占比是否符合我們的假設。當樣本數量較大時,假設檢驗可以幫助我們進行某些特定比例的檢驗。
我們使用π表示總體比例,其中π0為已知常數,給出原假設和備則假設:
此時,確定顯著性水平a,則當 時,我們拒絕原假設,反之,我們則接受原假設。
(2)實際案例
一款手機app負責人聲稱其受眾有60%為女性,為了驗證這一判斷,調查者隨機抽取了100位用戶進行驗證,發現有50人為女性。設定顯著性水平a為0.05,試問該負責人的說法是否準確?
通過查表可知 則 ,檢驗統計量落入了拒絕域,則拒絕原假設,認為該負責人的說法不夠準確。
3.方差檢驗
(1)基本方法
方差檢驗主要檢驗的是總體的方差或者標準差是否符合我們的假設,這里主要列舉一個總體的情況。
已知 ,μ未知,其中 為已知常數,需要檢驗總體方差:
我們只需取總體的隨機樣本 ,由于樣本方差 是 的無偏估計,當原假設為真,即 時,構造檢驗統計量 :
此時,確定顯著性水平a。由于卡方分布是大于零的單側分布,則當 或 時,我們拒絕原假設,反之,我們則接受原假設。
(2)實際案例
白酒生產企業采用機械化生產線,生產標準規定每瓶酒的裝填量的標準差應該維持在4ml附近。為了檢驗每瓶酒的裝填量的誤差,工廠負責人設計了一個假設檢驗:隨機抽取了10瓶酒,發現樣本標準差s=3.9ml,假設顯著性水平為0.1,請問該生產線是否符合標準?
首先,設定原假設和備則假設:
檢驗統計量:
通過查表可知 ,則檢驗統計量8.556并未落入拒絕域,因此接受原假設,認為生產線符合生產標準。
結語
假設檢驗是一種理性科學的推斷方法,在數據有效性、質量控制等領域起到了重大效用,因而廣泛運用于學界、工業界。合理掌握假設檢驗方法,有助于輔助人類決策,避免主觀誤差,提高管理效率。
參考文獻
[1]吳啟富,張玉春.統計假設檢驗中小概率原理的辨析[J].統計與決策,2012(17):70-71.
[2]魏立力,張定強.確定假設檢驗拒絕域的證據原理[J].數學的實踐與認識,2018,48(16):196-200.
[3]康鐵祥.深入理解假設檢驗原理[J].統計教育,2001(01):22-23.