劉素兵 曹大志 張華
摘要:從參數的區間估計角度審視假設檢驗問題,剖析知識點的內在聯系,梳理置信區間與假設檢驗中的拒絕域之間的關系,認為可以用置信區間進行假設檢驗。
關鍵詞:區間估計;置信區間;抽樣分布;假設檢驗
中圖分類號:G642.0文獻標識碼:A
Assumption of Confidence Interval Method
LiuSubing1CaoDazhi1ZhangHua2
1.Rocket Force University of EngineeringShanxiXian710025;
2.The Hitech College ofXian University of TechnologyShanxiXian710109
Abstract:The hypothesis test is analyzed from the perspective of the interval estimation of the parameters,the internal relations of the knowledge points are analyzed,the relationship between the domains in the confidence interval and the hypothesis test is combed.Finally,the hypothesis test is carried out in the confidence interval.
Key words:interval estimation;confidence interval;sampling distribution;hypothesis test
數理統計中的重點內容就是利用樣本信息對總體參數進行某種推斷和預測,其中有兩個重要的組成部分是參數估計和假設檢驗。從推斷角度上看,參數估計時,估計前總體參數是未知的,主要討論用樣本統計量對總體參數進行估計;假設檢驗時,則是先對未知參數提出一定的假設,然后再利用樣本信息去檢驗所提假設是否成立。雖然考慮問題的出發點不同,但在參數的區間估計和假設檢驗這兩部分學習中,仔細觀察發現有諸多相似之處:均用到了正態總體的抽樣分布、假設檢驗中的檢驗統計量同置信區間的樞軸量相似、都有一個給定的α。那么它們之間有沒有聯系呢?很多同學在學習中都存在這樣的困惑。進一步講,除了假設檢驗本身方法外,能不能用區間估計中的置信區間來進行假設檢驗呢?
在參數的置信區間估計中,記1-α為置信度,反映區間估計的可信度,α為置信水平,在置信水平下,利用樣本信息對未知參數進行估計,并以1-α的概率保證總體參數落在該區間內,α越小,置信區間也就越寬。在假設檢驗中,一旦顯著性水平α和檢驗統計量確定,臨界值的位置也就確定了。比如,在對總體均值α進行假設檢驗時,由對應臨界值所圍成的區域組成以μ0為中心的置信區間,因此,是否可以接受原假設μ=μ0,取決于μ的統計量是否落在這個區間內。若原假設H0∶μ=μ0為真,則在假設下,自然認為μ的統計量幾乎不可能落在置信區間外,而若落在外面,就認為小概率事件發生了,利用“小概率原理”,則推斷H0為假,從而拒絕H0。α越小,置信區間就越寬,從而使得犯“棄真錯誤”可能性變小。因此,可以用置信區間進行假設檢驗。
1 用置信區間進行假設檢驗
設X1,X2,…,Xn來自正態總體N(μ,σ2)的樣本,討論σ2已知關于均值μ的檢驗問題。分三種情況:
①H0∶μ=μ0H1∶μ≠μ0(雙側檢驗)
②H0∶μ≤μ0H1∶μ>μ0(右側檢驗)
③H0∶μ≥μ0H1∶μ<μ0(左側檢驗)
其中,μ0已知,總體方差σ2分已知和未知討論。討論在σ已知情況下假設問題。
①H0∶μ=μ0H1∶μ≠μ0(雙側檢驗)
在α下的檢驗的接受域為:
W-1=|U|≤uα/2=X--μ0σ/n≤uα/2,
此接受域可改寫成
W-1=X--μ0≤uα/2σn=X--uα/2σn≤μ0≤X-+uα/2σn,其中μ0并無限制,若讓μ0在(-∞,+∞)內取值,就得到μ的置信度1-α置信區間:X-+uα/2σn。
反之,若有一個如上的置信度1-α的置信區間:,也可以獲得關于H0∶μ=μ0H1∶μ≠μ0的顯著性水平為α的顯著性檢驗。因此,正態均值μ的1-α的置信區間與關于H0∶μ=μ0H1∶μ≠μ0的雙側檢驗問題的顯著性水平為α的顯著性檢驗一一對應。
正態總體均值μ的置信區間由點估計值和描述估計量精度的邊際誤差兩部分組成,記允許誤差為Δ=uα/2σ[]n,可得,利用置信區間進行雙側假設檢驗的決策為:
若|X-μ0|≤Δ,不能拒絕H0;若|X-μ0|>Δ,拒絕H0。
②H0∶μ≤μ0H1∶μ>μ0(右側檢驗);
在顯著性水平μ下的檢驗的接受域為:
,這就給出了參數μ的1-α的置信上限。反之,對上述給定的μ的1-α的置信上限,我們也可以得到關于H0∶μ≤μ0H1∶μ>μ0的單側檢驗問題的顯著性水平α的檢驗,它們之間具有一一對應關系。
對于單側置信區間,記Δ=μασ[]n,于是利用置信區間進行右側假設檢驗的決策為:
若X-μ0≤Δ,不能拒絕H0;若X-μ0>Δ,拒絕H0。
③類似于②,對于單側置信區間,記Δ=uασ[]n,于是利用置信區間進行左側假設檢驗的決策為:
若X-μ0>-Δ,不能拒絕H0;若X-μ0<-Δ,拒絕H0。
綜上所述,若記允許誤差為Δ=uα/2σ[]n(單側檢驗中為μασm),則利用置信區間進行假設檢驗的決策準側統一概括為:
若|X-μ0|≤Δ,不能拒絕H0;
若|X-μ0|>Δ,拒絕H0.
類似可考慮方差未知時的假設檢驗問題:若σ未知,用s進行估計,用t代替正態分布即可,見下表。
由上,對同一實例,當進行參數估計和假設檢驗,用的是同一樣本,統計量和分布也相同時,可以利用置信區間進行假設檢驗。以幾個例子作為進一步的說明。
2 若干應用
例1[1]有一種元件,對其平均使用壽命要求是應達1000小時,已知該種元件壽命服從正態分布,標準差為100小時,現從一批這樣的元件中,隨機抽取了49件,測得其平均壽命是950小時。試確定這批元件是否合格(α=0.05)。
解若使用壽命高于所要求的標準1000小時,自然認為元件為合格品,所以更關心置信下限值,因此,認為這是左單側下限的檢驗問題。
H0∶μ≥1000H1∶μ<1000(左側檢驗)
當α=0.05時,uα=1.645,置信區間的下限值:
μ0-uασn=1000-1.645×10049=976.5
進行決策示意圖如下所示
由上圖看出,若樣本均值x->976.5,不能拒絕原假設,可以認為這批元件合格;若x-≤976.5,則拒絕原假設,認為這批元件不合格。經計算,本題中x-=950>976.5,故拒絕原假設,認為這批元件不合格。
置信區間中的允許誤差Δ=uασn=1.645×10049=23.5,利用置信區間進行假設檢驗,|x--μ0|=|950-1000|=50,因為|x--μ0|>Δ,所以拒絕H0。
用置信區間進行檢驗時,好處是可以同時對幾個統計量進行檢驗。例如,從三批這樣的元件中分別抽取隨機樣本,測得使用壽命的均值分別為980,976,970,問這三批元件是否合格?
解由以上討論,此問題十分簡單,若x-i(i=1,2,3)>9765,則認為元件達到合格標準,否則便認為不合格。
例2[1]某種元件壽命記為X(小時),設X~N(μ,σ2),其中,μ,σ2未知,隨機抽取了16只元件,壽命測得如下:
280,264,149,170,101,159,224,168,379,212,179,222,485,362,250,260
問是否可以認為該元件的平均壽命大于225小時?(α=0.05)
解本題σ2未知,是關于μ右單側上限檢驗問題。
H0∶μ≤225H1∶μ>225(右側檢驗)
置信區間的上限值:μ0+ta(n-1)sn=225+1.7531×98.72616=268.2691
(α=0.05,t0.05(15)=1.7531)
由上圖看出,若樣本均值x-<268.2691,不能拒絕原假設,可以認為這批元件的平均壽命大于225小時,否則,拒絕原假設。本例中x-=241.5<268.2691,故不能拒絕原假設。
置信區間中的允許誤差Δ=tα(n-1)sn=1.7531×98.72616=43.2691,利用置信區間進行假設檢驗,|x--μ0|=|241.5-225|=16.5,因|x--μ0|<Δ,無充足理由拒絕H0。
參考文獻:
[1]賈俊平,何曉群,金勇進,等.統計學(第三版)[M].北京:中國人民大學出版社,2007.
[2]楊萍,敬斌.工程數學(下冊)[M].西安:西安電子科技大學出版社,2016.
[3]茆詩松,程依明,濮曉龍.概率論與數理統計教程(第二版)[M].北京:高等教育出版社,2011.
[4]蘭沖鋒.統計學教學中關于假設檢驗問題探討[J].湖南城市學院學報(自然科學版),2016,25(2)303304.
基金項目:陜西省教育廳專項科研計劃資助項目(17JK1023)
作者簡介:劉素兵(1980),女,河北邢臺人,碩士,講師,主要從事統計研究。