張超


【摘要】假設檢驗是數理統計學中根據一定假設條件由樣本推斷總體的一種方法,具體作法是:根據問題的需要對所研究的總體作某種假設,記作H0;選取合適的統計量,這個統計量的選取要使得在假設H0成立時,其分布為已知;由實測的樣本,計算出統計量的值,并根據預先給定的顯著性水平進行檢驗,作出拒絕或接受假設H0的判斷.
【關鍵詞】數學歸納法;歸納原理
一、引 言
假設檢驗是抽樣論斷中的一項重要內容,它是根據資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法.
用樣本指標估計總體指標,其結論有的完全可靠,有的只有不同程度的可靠性,需要進一步加以檢驗和證實,通過檢驗對樣本指標與假設的總體指標之間是否存在差別作出判斷,是否接受原假設.這里必須明確,進行檢驗的目的不是懷疑樣本指標本身是否計算正確,而是為了分析樣本指標和總體指標之間是否存在顯著差異,從這個意義上,假設檢驗又稱為顯著性檢驗.
二、預備知識
在統計學界有一個很有趣的典故,叫女士飲茶.據說20世紀20年代,在英國劍橋的一個夏日的午后,一群人圍坐一起享用下午茶.在閑聊中,有一位女士堅稱把茶加進奶里,或把奶加進茶里,不同的做法,會使茶的味道品起來不同.她能通過品茶,說出是先加的茶還是先加的奶.假設現在讓服務生隨機配制了10杯奶茶,有的是先加的茶,有的是先加的奶,然后讓這位女士進行鑒別.如果這位女士準確鑒別出8杯奶茶的配制順序,你認為這位女士是有這種特殊味覺呢,還是沒有這種特殊味覺呢?統計上構造了一種特殊的方法——假設檢驗,對這類問題作出判斷.
三、假設檢驗的基本思想與概念
1.假設檢驗的基本思想
我們繼續以女士飲茶為例,闡述假設檢驗的基本思想.在該案例中,我們面臨兩種判斷可能,統計上把這兩種可能的結果稱作為假設.
假設一:該女士沒有特殊味覺,她從10杯奶茶中指出8杯奶茶的配置順序,純屬偶然;
假設二:該女士有特殊味覺,她從10杯奶茶中指出8杯奶茶的配置順序,屬于確切判斷.
顯然,這兩種假設都有可能發生.無論我們作出何種判斷,都有猜對的概率,也都有猜錯的概率.在這種情況下,我們需要一個作出判斷的原則.
一個假設檢驗問題就類似于一個司法審判問題.在女士飲茶這個假設檢驗問題中,沒有特殊味覺,不能區分奶茶的配置順序是絕大多數人的正常狀態,所以我們事先假定該女士沒有特殊味覺,在假定該女士沒有特殊味覺的情況下,測算該女士10杯奶茶能有效區分出8杯配置順序的發生概率.只有當這個概率非常非常小,小到幾乎不可能發生時,我們才推斷該女士不是普通人,她具有特殊味覺,否則都認為沒有顯著證明該女士具有特殊味覺.這就是假設檢驗的基本思想.
2.假設檢驗的概念
①原假設與備擇假設.在一個假設檢驗問題中,首先需要確定的是兩個假設條件,一個稱為原假設,一個稱為備擇假設.原假設和備擇假設不是任意確定的.通常把觀察現象原來故有的性質或沒有充分證據不能輕易否定的命題設為原假設,記作H0;通常把該觀察現象新的性質或不能輕易肯定的結論為備擇假設,記作H1.
在女士飲茶案例中,由于普通人通常是沒有特殊味覺,不具備區分奶茶的配置順序,所以原假設和備擇假設分別為:
H0:該女士沒有特殊味覺,不能有效區分奶茶的配置順序
H1:該女士有特殊味覺,能有效區分奶茶的配置順序
很多假設檢驗問題剝離它的應用背景,實質是對總體分布參數空間Θ的兩個不相交的子集,分別記作Θ0,Θ1.這時原假設和備擇假設可以分別記作
H0:θ∈Θ0H1:θ∈Θ1
在女士飲茶案例中,這位女士每次品茶就是一個伯努利實驗,品茶結果X服從兩點分布.
品嘗結果X
說對奶和茶的放置順序
說錯奶和茶的放置順序
概率
P
1-P
通常,普通人沒有能力鑒別奶和茶的放置順序,即P=12,而如果該女士有特殊味覺,則P>12.所以本例中,Θ0=P|P=12,Θ1=P|P>12.
原假設和備擇假設等價于
H0:P=12H1:P>12.
②檢驗統計量.假設檢驗的目的就是要根據樣本提供的信息,判斷是原假設成立還是備擇假設成立.由于樣本中蘊含的信息量非常豐富,而我們通常只需要其中的部分信息進行判斷.所以假設檢驗的第二步是對樣本信息進行加工,即構造適當的統計量,利用這個統計量的數值進行判斷.這個統計量稱為檢驗統計量.
檢驗統計量的構造原理與區間估計統計量的構造原理類似.一個好的檢驗統計量通常具有明確的抽樣分布,借助該統計量的分布特征和樣本取值,我們可以作出判斷是接受原假設還是拒絕原假設.
在女士品茶案例中,這位女士每次品茶的結果記作Xi
Xi=1,正確判斷茶和奶的放置順序0,錯誤判斷茶和奶的放置順序
記Y=∑ni=1Xi,Y實 際上是這位女士品嘗n杯茶后,正確判斷出茶奶配置次序的次數.在此統計量Y即可作為本例的檢驗統計量,它服從二項分布B(n,p).
P(Y=y|p)=CynPy(1-P)n-y,y=0,1,2,…,n
③接受域和拒絕域.有了檢驗統計量之后,我們需要確定一個界限,這個界限可以將檢驗統計量的取值空間劃分為兩個區域.其中一個區域是原假設為真時,樣本通常會落入的區域.如果檢驗統計量的樣本值落在這個區域里,我們就判斷接受原假設,所以該區間稱為接受域,即接受原假設的區域.
另一個區域是原假設為真時,樣本落入該區域的概率非常小,小到幾乎可以認為這種情況幾乎不會發生.而在備擇假設成立時,樣本落入這個區域的概率就很大.如果檢驗統計量落在這個區域里,我們將拒絕原假設,認為備擇假設成立,所以該區間稱為拒絕域,即拒絕原假設的區域.
在女士飲茶案例中,如果該女士確實有特殊味覺,能有效區分奶和茶的配置順序,那么在品嘗n杯茶后,她判斷正確的次數Y應該大于普通人隨機猜對的次數.所以可以找到一個界限K,當Y≥K時,我們將拒絕原假設,認為該女士具有特殊味覺.這時拒絕域為:
W={(X1,…,Xn),Y=∑ni=1Xi≥k}.
當Y W-={(X1,…,Xn),Y=∑ni=1Xi 假設這位女士能準確到8杯奶茶的配置順序,則當顯著性水平取0.05時,檢驗統計量落入接受域,這意位著我們沒有95%的把握拒絕原假設,所以認為該女士沒有特殊味覺,不能有效識別奶和茶的配置順序. 而當顯著性水平取0.1時,檢驗統計量落入拒絕域,這意味著我們有90%以上的把握拒絕原假設.認為該女士具有特殊味覺,能有效識別奶和茶的配置順序. 【參考文獻】 [1]陳魁.應用概率統計[M].清華大學出版社,2000. [2]陳家鼎.概率統計講義[J].高等教育出版社,1982. [3]沈恒范.概率論講義[M].人民教育出版社,1966. [4]賈俊平.統計學[M].清華大學出版社,2000.