陳宏道
摘 要 本文通過對一個總體均值假設檢驗教學中的幾個方面做了簡要剖析,隨機變量的分布函數與統計量的分布是基礎,假設的提出和決策是假設檢驗的關鍵,搞好這部分教學對假設檢驗的教學起著至關重要的作用。
關鍵詞 假設檢驗 分布函數 決策
中圖分類號:G642文獻標識碼:A
假設檢驗是統計推斷的重要方法之一,樣本數據的特征推廣到總體的特征要進行假設檢驗,而假設檢驗的教學歷來是教學的一個難點,如何克服難點,使學生易懂,是教師研究的問題。本文結合一個總體均值的假設檢驗教學談幾點體會。
1隨機變量的分布函數與統計量的分布
隨機變量的分布函數與統計量的分布是假設檢驗的基礎,在進行假設檢驗教學時,對其復習,有利于對分位點、接受域、拒絕域、P值的理解。
1.1連續隨機變量的分布函數
連續隨機變量X的分布函數為F(x)=P(∞ 正態分布、t分布是常見的兩個連續型概率分布,它們都是對稱分布,正態分布關于x= 對稱,t分布關于x=0對稱。t分布隨自由度的增大逐漸趨于正態分布。正態分布概率的計算通常化為標準正態計算,標準化公式為Z=(X )/ 。 1.2樣本均值的分布 均值是總體的重要參數,實踐中由于總體數據不易得到,因而總體均值也是未知的,現代統計學可以利用樣本均值來估計總體均值。 可以證明:如果總體服從正態分布,那么,無論樣本量的大小,樣本均值的分布都近似服從正態分布;如果總體不是正態分布,但隨著樣本量n的增大,樣本均值的概率分布都趨于正態分布。當總體服從正態分布或大樣本且均值 、方差 已知時,樣本均值標準化后;當方差 未知且小樣本時,統計量。 2提出假設 進行假設檢驗首先要根據實際問題提出假設(原假設和備擇假設),原假設是研究者想收集證據予以推翻的假設,用H0表示,備擇假設是研究者想收集證據予以支持的假設,用H1表示,二者是相互對立的,原假設中總帶有等號,它是我們提出假設和推斷的基礎,根據假設提出的不同分為雙側檢驗、左側檢驗、右側檢驗。實際問題中確定假設往往根據語言的特點確定。如“……檢驗該生產線是否符合標準要求”,由此確定H1: ≠ 0。又如“……檢驗新生產線產量是否顯著提高”,由此確定H1: > 0。又如“……檢驗新機床加工零件尺寸的平均誤差是否顯著降低”,由此確定H1: < 0。 3決策 3.1決策的依據 假設檢驗決策的依據是小概率事件原理,即在一次試驗中,小概率事件是不易發生的,一旦某事件在一次試驗中發生了,則可以認為這個事件不是小概率事件。在假設檢驗中小概率用 表示,又稱為顯著性水平,是原假設為真時拒絕原假設的概率。 如~( , 2)且均值 、方差 已知,檢驗假設為H0: ≥ 0;H1: < 0,在原假設成立的前提下,抽樣一次的均值不應該離 0太遠,否則,就可以拒絕原假設,即統計量就拒絕原假設。 3.2兩類錯誤 由于決策是建立在樣本基礎之上,因而決策可能犯兩類錯誤:第一類錯誤是原假設為真時拒絕原假設(這類錯誤概率用 表示),第二類錯誤是原假設錯誤時沒有拒絕原假設(這類錯誤概率用 表示)。在樣本一定的情況下,兩類錯誤的關系形如蹺蹺板,要想同時減小兩類錯誤的概率,只有增大樣本容量,但又會費時費力費經費。實踐中,人們一般先控制 。 3.3決策的方法 3.3.1臨界值法 臨界值法是根據檢驗統計量落入的區域作出是否拒絕原假設的決策方法.在確定顯著性水平 后,拒絕域也就相應確定。雙邊檢驗時,z檢驗的臨界值為眤 /2,t檢驗的臨界值為眛 /2;左側檢驗時,z檢驗的臨界值為-z ,t檢驗的臨界值為-t ;右側檢驗時,z檢驗的臨界值為z ,t檢驗的臨界值為t 。 3.3.2 P值法 P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。當雙邊檢驗時,雙尾P值是概率密度曲線下方小于或大于檢驗統計量部分面積的2倍;當左側檢驗時 ,P值為概率密度曲線下方小于檢驗統計量部分的面積;當右側檢驗時,P值為概率密度曲線下方大于檢驗統計量部分的面積。P值也稱為觀察到的顯著性水平,P 值越小,拒絕原假設的理由越充分,決策規則永遠是 P < ,拒絕原假設。 3.4決策的表述 假設檢驗的目的是收集證據拒絕原假設,從而支持備擇假設,證據的強弱取決于P值的大小,P值越小拒絕原假設的理由越充分。當沒有拒絕原假設時,也不能說明原假設是正確的,這時我們說“不拒絕原假設”或“樣本沒有提供充足的證據拒絕原假設”。 4結語 一個總體均值的假設檢驗是這部分教學的開始,搞好過渡,理解假設檢驗的原理,對假設檢驗的教學起著至關重要的作用。 參考文獻 [1] 賈俊平.統計學(第4版)[M].北京:中國人民大學出版社,2011:63. [2] 楊剛.假設檢驗中的P值研究[J].河南工程學院學報(自然科學版),2012,24(02):65-67.