郭 文
樣本容量是指按照某種規則從總體中抽取出來的樣本觀察單位的數目。在抽樣調查中,樣本容量的研究是一個非常重要的問題,樣本容量直接影響著犯兩類錯誤的概率。在假設檢驗中,一般討論的是犯第一類錯誤的情況,通常只給出犯第一類錯誤的概率,那么在樣本容量自由選擇的情況下,犯第二類錯誤的概率是無法控制的。而犯第二類錯誤的情形一般在醫學、風險控制、質量控制等領域應用較多。在研究這些領域時,我們希望能同時控制兩類錯誤的概率,那么樣本容量就需要通過計算來確定。目前國內外對樣本容量的研究大多是建立在調查精度和費用控制的基礎上。本文研究樣本容量的角度與之不同,是在控制兩類錯誤的前提下,對方差檢驗中樣本容量進行探討。
如果把假設檢驗中構造的統計量記為T,把顯著性水平α下確定的拒絕域記為,把接收域記為W,則當T服從正態分布時,雙側檢驗的與W如圖1所示。圖中陰影部分為拒絕域,非陰影部分為接受域W。
當原假設H0為真時,由于樣本的隨機性,仍然有可能以α的概率拒絕原假設H0,這就是第一類錯誤,簡稱棄真,α為棄真的概率。如圖1,棄真顯然就是H0為真時T落入拒絕域Wˉ的事件,所以

圖1 雙側檢驗的拒絕域與接收域
當原假設非真時,我們也仍然有可能接受它,這就是第二類錯誤,簡稱取偽,取偽的概率以β表示。取偽顯然是當H0為非真時,T落入接受域W的事件,所以
P{T ∈ W| H0非真} =β
設隨機樣本(X1,X2,…,Xn)來自正態總體X~N(μ,σ2),μ=μ0已知。
對于右側檢驗,首先建立假設檢驗:

其次構造χ2統計量:
當H0為真時:
當 H1為真時:
根據定義,有

因此


uα、uβ為標準正態分布的上α分位點、β分位點。
將式(2)、(3)代入式(1)得:

解得:

同理,可計算出左側檢驗樣本容量為:

雙側檢驗時樣本容量為:

設隨機樣本(X1,X2,…,Xn)來自正態總體 X~N(μ,σ2),μ未知。
對于右側檢驗,首先建立假設檢驗:

構造χ2統計量:
當H0為真時

當H1為真時


因此

同樣,當n充分大時(通常n>45),有

這里uα、uβ為標準正態分布的上α分位點、β分位點。
將式(5)、(6)代入式(4)得:

解得

同理,可計算出左側檢驗樣本容量為:

雙側檢驗時樣本容量為:

設 X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個母體中抽出的獨立子樣,μ1、μ2已知。
首先建立假設檢驗:

其次構造F統計量:

對于右側檢驗,建立假設檢驗:

則

則

當n→∞時,有 Fα(m,∞)=
又因為

因此

同理

所以,當n→∞時,有

解得:

同理,可計算出左側檢驗時樣本容量為:

雙側檢驗時樣本容量為:

設 X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個母體中抽出的獨立子樣,μ1、μ2未知。
首先建立假設檢驗:

其次構造F統計量:

當H0成立時,F~F(m-1,n-1)。
對于右側檢驗,建立假設檢驗:

則

則

當n→∞時,有 Fα(m-1,∞)=
又因為

因此

同理

所以,當n→∞時,有

解得:

同理,可計算出左側檢驗樣本容量為:

雙側檢驗時樣本容量為:

以上我們對方差檢驗中單母體及雙母體方差已知、方差未知情形下兩類錯誤與樣本容量的關系進行了探討,并在控制兩類錯誤的條件下,給出了確定樣本容量的公式。從上面的討論可以看出,方差檢驗中樣本容量的確定是件比較復雜的事情,必須給予足夠的重視。在實際操作中,樣本容量的確定既要考慮精度要求,又要考慮經費預算、可操作性等,必須通過綜合考慮,以達到一個最優樣本容量的選擇。
[1] 陳國銘,李世英.統計質量控制:估計和檢驗[M].北京:中國石化出版社,北京,1995.
[2] 陳希孺.概率論與數理統計[M].合肥:中國科學技術大學出版社,2009.
[3] 魏宗舒.概率論與數理統計教程(第二版)[M].北京:高等教育出版社,2008.
[4] 馮士雍,施錫銓.抽樣調查——理論、方法與實踐[M].上海:上海科學技術出版社,1994.
[5] W.G.Cochran.Sampling Techniques[M].Chichester:John Wiley&Sons,1997.