999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

探究區間估計與假設檢驗的關系

2021-08-23 06:08:50
四川職業技術學院學報 2021年4期

朱 海

(重慶工商大學 數學與統計學院,重慶 400067)

1 背景與意義

近年來,有很多國內外學者都研究了區間估計與假設檢驗的關系.學者吳純[1]通過證明提到:“一般情況下,利用假設檢驗可以建立區間估計,反之亦然”、“假設檢驗和區間估計的結果在解釋上可以有差別”等結論,告誡大家統計學上的結論一定要注意其實質,不能只停留在問題表面;學者王建華[2]通過論證,糾正了“區間估計和假設檢驗是統一的,是一個問題的兩個方面”這個似是而非的說法,說明了區間估計和假設檢驗既有聯系,又有區別;也有學者通過“順推法”和“反推法”[3]進行區間估計和假設檢驗關系的研究,最終確定了兩者的區別和聯系.現在,區間估計和假設檢驗的應用極為廣泛,去年國外一篇論文發表出來,論文題目為:In‐fluence of multiple hypothesis testing on reproducibility in neuroimaging research: A simulation study and Python-based software[4],講的是神經影像研究中多重假設檢驗對再現性的影響,整篇文章圍繞假設檢驗進行了一系列模擬分析,這從側面說明了假設檢驗應用范圍之大.

本文對區間估計和假設檢驗的關系探究源自教材《概率論與數理統計教程第二版》(茆詩松,高等教育出版社,2011 年)中數理統計部分,該書在介紹參數估計和假設檢驗時,很多知識點覆蓋面很廣,但都只是單一的指出基本概念,至于其中多種統計推斷方法是否有聯系并未做過多介紹,比如在談及區間估計和假設檢驗的關系之時,所用篇幅較少,只是談及了區間估計時的樞軸量和假設檢驗時的檢驗統計量相同并非偶然,當然,樞軸量和檢驗統計量的相同的確很大程度的說明了區間估計和假設檢驗的關系匪淺.但是,區間估計和假設檢驗關系僅僅如此嗎?區間估計中的置信水平和假設檢驗中的顯著性水平有聯系嗎?區間估計和假設檢驗方法選擇有啥參照嗎?本文在此基礎上,大篇幅地探究了兩者的關系,包括區間估計和假設檢驗的基本概念、應用方面、優劣方面、聯系及不同以及相關問題的深度剖析,都進行了總結和討論,并通過一些例子對一些問題進行舉例論證,并查閱了一些相關書籍和文獻,整理結論并討論,使得大家對這兩種統計推斷方法更加熟悉和深層次了解,一定程度上,能夠幫助讀者在處理相關問題時避免一些錯誤.

2 區間估計和假設檢驗的基本論述

2.1 區間估計概念

區間估計,顧名思義,是包含一個區間的估計,這個區間是用來度量一個點估計的精度.參數的點估計經計算得到了一個具體的數值,這樣一個具體的數值方便計算和使用.但計算出來的點估計精度如何,點估計本身并不能說明,需要依靠對應的分布去反映,現實中,我們通常用一個區間去覆蓋已知的點估計,也可以說求得點估計的取值范圍,它應該是一個區間,下面給出具體定義[5]:

設θ是總體的一個參數,x1,x2,…,xn是樣本,求得統計量θL(x1,x2,…,xn),θU(x1,x2,…,xn),使得θL<θU,得到樣本觀測值之后,便把θ估計在區間[θL,θU]內 . 由于樣本具有隨機性,區間 [θL,θU]覆蓋參數θ的可能性并不確定,這里通常需要我們人為給定一個概率,誠然,我們肯定想區間覆蓋θ的概率P越大越好,但是這必然會導致區間長度增大,這里把區間[θL,θU]覆蓋住θ的概率給定為 1 ?α,則有Pθ( )θL≤θ≤θU≥ 1 ?α,則 稱隨機區間[θL,θU]為θ的置信水平為 1 ?α的置信區間,θL和θU分別稱為θ的(雙側)置信下限和置信上限.

2.2 置信區間計算方法

通常,要計算置信區間,一個最常用的方法就是樞軸量法[5].對于這種方法,尋找置信區間最關鍵的步驟就是要找準未知參數所對應的合適的樞軸量,這里記G為樞軸量,構造一個樣本和未知參數θ的函數G(x1,…,xn,θ)使得G的分布不依賴于未知參數θ.另外樞軸量的尋找一般從θ的點估計入手.

區間估計適用范圍:在參數的點估計不易計算,或者探究點估計精度如何時,區間估計往往能起到至關重要的作用,它能夠指定概率(即置信水平)求得相應比較精確的區間進行估計,這些都是點估計無法做到的.例如眾多分布中最常用的雙參數正態分布,記正態總體為N(μ,σ2),在一個參數已知,另一個參數未知時,都可以求得未知參數對應的置信區間,得到對應的區間估計.

2.3 假設檢驗概念

所謂假設檢驗,顧名思義,就是一個檢驗假設是否成立的過程,又稱統計假設檢驗.它是用來判斷樣本與樣本之間、樣本與總體之間的差異到底是由抽樣誤差引起,還是由樣本之間本質差異造成的一種統計推斷方法.假設檢驗有很多方法,顯著性檢驗作為一種最常用的假設檢驗方法,其基本原理是先根據一些非樣本信息對總體某個參數做出某種假設,然后通過對抽樣信息的統計推理,對這個假設是否應該被拒絕做出判斷.一些常用的假設檢驗方法有Z檢驗、T檢驗、卡方檢驗、F檢驗等.一個很經典的假設檢驗問題,例如女士品茶試驗[5],女士每次猜對的概率為0.5,10 次都猜中概率為 2?10,很小的概率,幾乎不可能發生的事件,竟然發生了,這樣一個小概率原理,偉大的費希爾對這一試驗諸多細節進行研究,最終形成了假設檢驗理論.

2.4 假設檢驗的基本步驟

ⅰ.建立假設:根據要求對參數設置原假設H0和備擇假設H1.如一對假設為

原假設有簡單原假設和復雜原假設,相應的備擇假設也有簡單備擇假設和復雜備擇假設之分,其界限是考慮到假設里面θ0和θ1所包含的點的個數.因而整個假設又有雙側假設和單側假設之分.

ⅱ.選擇檢驗統計量,給出拒絕域形式:記W為檢驗的拒絕域,而Wˉ為檢驗的接受域.

ⅲ.選擇顯著性水平:一個是α,稱犯第一類錯誤(也稱棄真錯誤)的概率;另一個是β,稱犯第二類錯誤(也稱納偽錯誤)的概率.

ⅳ.確定拒絕域:根據假設單側或雙側檢驗,給出相應的拒絕域.

ⅴ.進行判斷:通過樣本觀測值,觀察相應參數值是否落在給出的拒絕域內.

2.5 假設檢驗 p 值與 α 的關系

(1)檢驗的p值:一個假設檢驗問題中,利用樣本觀測值能夠作出拒絕原假設H0的最小顯著性水平.每一個假設檢驗問題都對應一個確定的p值.

(2)檢驗的p值與人們心目中的顯著性水平α進行比較可以對假設檢驗做出判斷:

ⅰ.若α≥p,則拒絕原假設.

ⅱ.若α

3 理論論證

3.1 區間估計和假設檢驗的統計學意義

區間估計主要是根據一個樣本的觀測數據得到參數的估計范圍,在這個范圍內,參數落在區間中的概率已知(一般人為給出),不僅能夠很直觀的檢驗對未知參數所做的點估計的準確性,也可以在大樣本的情況下對參數進行估計,所得到的估計值應落于所得到的區間內;而假設檢驗首先則主要是對總體參數做出一個假設,然后利用樣本信息和相關檢驗統計量的分布特征去檢驗這個假設,最終做出是否接受原假設的結論.如此看來,區間估計和假設檢驗在主要功能方面還是有交叉之處,都可以對參數的準確性進行判定.但要說明的是,假設檢驗是統計推斷中的一項重要內容,它是根據原有資料作出一個對總體指標的限定,某一隨機變量是否服從某種概率分布的假設,然后利用樣本數據,采用合理的統計方法,計算出相關假設的檢驗統計量,然后依據小概率事件原理,以較小的風險度去判斷估計值與總體值是否存在顯著差異,是否應當接受原假設的一種檢驗方法.但是,在面對樣本指標和總體指標時,一味地用樣本指標去估計總體指標,其結果并非完全可靠,換句話說,對于諸多假設檢驗問題,不同問題具有不同程度上的可靠性,需要我們進一步對檢驗結果去加以檢驗和論證.通過對問題的檢驗,對樣本指標與總體指標之間是否存在差異作出正確的判斷,是否應該接受原假設.當然,這里也必須明確,進行假設檢驗的目的不是驗證樣本指標本身是否出錯,而是為了分析樣本指標與總體指標之間是否存在顯著差異.從這個實際意義出發,假設檢驗又稱為顯著性檢驗,這在統計學意義上與區間估計有所不同.區間估計重在估計,是參數估計的一項重要內容,它為總體參數服務,但凡數理統計書中,首先總是會引入統計量的概念,讓學者們第一時間弄懂統計量的相關知識,其目的在于對一些深層次問題進行統計推斷,而在實際生活中,我們往往會向眾多分布中的未知參數靠近,這樣一來,區間估計出現也不足為奇了.

3.2 區間估計和假設檢驗應用

區間估計不僅是統計推斷中的重要內容,也可以應用于抽樣推斷.根據區間估計和假設檢驗的定義以及步驟來看,對于這兩種統計推斷方法,在應用領域方向,不僅僅是書本上的理論推理,現實中也可以運用于科學研究、醫療衛生、金融投資等各個方面.但是若真要比較兩種方法的用途誰廣泛,還真得分類討論.對于區間估計來說,它是一個非常依賴樣本信息的一種推斷方法,樣本信息包含越全面、越準確,得到的置信區間也就越精確,這樣一來,便對研究者提出了要求,如果樣本信息量足夠說明真實情況,此時使用區間估計便沒什么問題.對于假設檢驗而言,首先在人們拿到一個假設檢驗時,必須根據需要設置一對假設,原假設H0和備擇假設H1,然后根據得到的數據信息,對假設進行判斷.然而,假設檢驗人為的確定的假設必須要避免偏差,否則會對結果產生巨大影響,甚至可能導致判斷偏差.假設檢驗一般而言是研究者偏向于拒絕域進行統計推斷方法,由于原假設與樣本信息無多大關系,故而假設檢驗對樣本信息的敏感度沒有區間估計那般強烈.綜上,區間估計和假設檢驗的應用各有側重,當研究者所研究的問題需要確切的樣本信息時,這時候選擇區間估計較好;當研究者所研究的問題需要較多非樣本信息(如前人經驗、無法看做樣本信息的信息)時,建議選用假設檢驗.

3.3 區間估計和假設檢驗的區別

(1)區間估計屬于參數估計的一種,參數估計是以樣本數據為基礎,進而去準確的估計總體參數的確定值;然而假設檢驗則是以樣本數據的相關信息去檢驗總體參數原始假設是否成立.

(2)區間估計事先需要給定一定概率(也稱置信水平),區間估計要求概率越大越好,得到的估計區間會更加精確;而假設檢驗是在小概率原理上立足的,最終所求的概率p值越小越顯著.

(3)區間估計最終得到的是雙側置信區間;而假設檢驗會根據題意確定雙側檢驗或者單側檢驗.

3.4 區間估計和假設檢驗的聯系

通過下文區間估計和假設檢驗應用舉例可以看出,區間估計所使用的樞軸量與假設檢驗所使用的檢驗統計量是一樣的.這是為什么呢?現從假設檢驗的右側、左側、雙側分三種情況進行討論(假設σ已知,樣本為x1,x2,...,xn來自正態總體N(μ,σ2):

3.4.1 右側檢驗

3.4.2 左側檢驗

3.4.3 雙側檢驗

綜上所述,正態總體參數的置信區間與假設檢驗問題的檢驗存在非常密切的聯系,樞軸量與檢驗統計量的相同不是偶然,而是這兩種統計推斷方法中存在一一對應關系,兩種問題可以相互轉化,假設檢驗問題能夠成為區間估計問題,區間估計也能夠成為假設檢驗問題.

3.5 區間估計和假設檢驗的誤區

3.5.1 置信區間誤區

以下文例1 為例,有些熟悉區間估計定義的人可能會說:“題中得到的95% 置信區間為[12.282,12.518],它是以0.95 的概率覆蓋總體均值(即題目中的平均長度)”,其實,仔細琢磨,這種說法欠妥.為什么呢?因為在這里,如果換成是在大量樣本中得到的置信區間,只能說大約95%會覆蓋總體均值,題目中只是由一個樣本得到的置信區間,到底包含或者不包含總體均值,沒有概率可言.我們都知道,總體均值其實是一個固定的數值,而求得的置信區間也是一對固定的數值,這里不存在隨機變量,故而不可能存在覆蓋的概率,最初的隨機區間一旦實現,就變成了兩個固定數字,便失去了隨機性,進而也無法談及概率.

3.5.2 假設檢驗誤區

(1)大家都知道,做假設檢驗的目的是從假設中找到需要的答案,所以說拒絕原假設的顯著性水平α的選擇很重要[6].拋開書本理論,選擇α時必須與實際問題相結合,具體問題具體分析,課程當中的例子過于理想化,很多影響問題的敏感因素都未曾給出,但是在實際生活中往往缺乏可信度.比如警察在通過DNA 或者指紋去判斷作案兇手、血緣關系時,對于這種非常敏感的問題,α取值稍微過大,都會使得到的結果可信度大打折扣,此時α應該是一個非常小的數.相反,如果實際要求α不宜過小,α就應該取相對大,否則,一些大的影響因素可能就會錯過.總之,α的大小選擇并不能簡單的全默認看成是0.01、0.05、0.1,應該靈活處理.

(2)通常我們在面對假設檢驗結果的時候,認為落入了拒絕域,則表示拒絕原假設,這個判斷沒有錯誤;但是反之,當我們不能拒絕原假設的時候,很多人就會很自然的認為應該接受原假設,這便是不夠嚴謹了.舉一個例子如下:判斷一個罪犯是小偷,設置原假設為H0:不是小偷,備擇假設H1:是小偷.當在小偷身上或家里發現別人的東西,在幾乎不太可能( )p→0有一模一樣的東西的前提下,這時候就拒絕原假設:不是小偷,認為他是小偷.當在小偷身上或家里沒有發現別人的東西,就說明沒有證據說明拒絕原假設:不是小偷,但是這不能說明小偷從未偷過東西,只是證據不足而已.因此,證據不足接受原假設和實際上就接受原假設是有差別的.

4 例題論證:區間估計和假設檢驗關系舉例

例:某公司規定一批零件直徑為10cm時為合格,現在隨機抽取50 個零件作為樣本進行檢測,根據樣本數據顯示,得到樣本均值xˉ= 10.2,已知標準差為0.4,假設取α= 0.05,檢驗這批零件是否合格.

(1)區間估計法

(2)假設檢驗法

根據題意設置假設 :H0:μ0= 10vsH1:μ0≠ 10 ,

綜上可知,在同樣的顯著性水平下,區間估計和假設檢驗的結果一樣,說明這兩種方法可以相通.

5 顯著性水平的進一步討論

5.1 顯著性水平概念

5.1.1 區間估計中

顯著性水平是估計總體未知參數落在某一區間內的一個概率,也表示為可能犯錯誤的概率,一般用α表示,但是,通常以置信水平(1 ?α)為蓋住區間的概率而被我們事先給定.

5.1.2 假設檢驗中

根據人們做判斷時誤判的錯誤類型,將犯第一類錯誤概率(即棄真錯誤)叫做顯著性水平,用α表示 .

5.2 兩者關系

相同問題條件下,區間估計中1 ?α置信區間問題與顯著性水平為α的假設檢驗問題一一對應,且判斷結果相同.

5.3 兩類錯誤的關系及深度探究

假設檢驗過程中,在選擇顯著性水平時,引入了兩類錯誤:第一類錯誤(棄真錯誤),用α表示,第二類錯誤(納偽錯誤),用β表示.任何一個假設檢驗問題,我們不可能找到一個檢驗同時使這兩類錯誤都盡可能小,只能選擇其中一種錯誤,讓它盡可能小.書中引入功效函數[7]進行說明兩類錯誤的關系,結果是α與β中一個減小必然導致另一個增大,但是α+β并不一定等于1,且這個結論具有一般性.那么為什么要選擇α作為顯著性水平,而不是β呢?原因有以下幾點:

(1)從心理學角度來看,第一類錯誤為棄真錯誤,認為本來原假設是真的,卻被拒絕,這會讓人懊悔不已;第二類錯誤為納偽錯誤,認為原假設不是真的,卻被接受,這種錯誤即使發生了,頂多就說判斷錯誤,或者說找“學藝不精”的理由,相對來說,犯第一類錯誤更不能讓人接受;從現實危害角度來看,犯第一類錯誤可能會產生巨大影響,它的不良后果會更加大于犯第二類錯誤,比如所有人都犯了第一類錯誤,后面人可能一直無法找到真的;相反,犯第二類錯誤之后,如果重新設計實驗便可能快速發現問題所在.

(2)一般而言,第二類錯誤概率對具體參數要求頗高,相比較于α來說,β在不少場合不容易求出,產生β的原因多與實驗設計、樣本數據、處理效應等因素有關,α更容易被計算出.

此處對顯著性水平的進一步分析并非偶然,而是通過對顯著性水平的了解,我們能夠對區間估計和假設檢驗的關系更加明確,雖說兩處定義不一樣,但是只有在α一定的情況下,研究區間估計和假設檢驗才有價值;再者顯著性水平的選擇存在很多誤區,能夠很好的了解它,就能更好的學習假設檢驗.

6 結論和建議

從上述分析有如下結論:區間估計和假設檢驗可以應用于金融、醫藥、農業等各個領域;區間估計問題和假設檢驗問題可以相互轉化;選擇區間估計和假設檢驗方法時應該觀察問題本身是否與樣本信息相關聯;顯著性水平在兩種統計推斷方法起重要樞紐作用等.通過討論,可以看出這兩種統計推斷方法在理論和實際中的應用都非常復雜,日常生活中,有些人對兩種方法認識不夠,存在個別誤區;在解決一個實際問題時,并未首先關注問題的實質,以致于容易犯錯.在處理任何一個問題時,均需要對兩種方法足夠熟悉,才能更好地避免犯錯.統計學作為一門學科,但并非是一門獨立的學科,它依賴于很多數學、計算機等專業知識;要想做好統計研究,必須具備豐富的專業知識以及較強的邏輯分析能力,不能一貫地參考經驗,也不能一味地關注樣本本身,要學會具體問題具體分析.通過本文的討論,我們能夠對區間估計和假設檢驗這兩種推斷方法更加熟悉和了解,能夠將這兩種方法應用于一些實際問題之中.

主站蜘蛛池模板: 91九色国产porny| 精品久久777| 国产精选小视频在线观看| 成人永久免费A∨一级在线播放| 国产亚卅精品无码| 精品91视频| 欧美啪啪视频免码| 成人噜噜噜视频在线观看| 欧美另类第一页| 国产成人AV男人的天堂| 亚洲美女AV免费一区| 国产无码在线调教| 国产丝袜一区二区三区视频免下载| 欧美日韩福利| 高潮毛片免费观看| 中文字幕在线不卡视频| 青青操国产| 少妇高潮惨叫久久久久久| 自慰网址在线观看| 久久久久九九精品影院| 91激情视频| 欧美高清三区| 91色老久久精品偷偷蜜臀| 午夜福利免费视频| 91久久偷偷做嫩草影院电| 亚洲中文字幕国产av| 免费高清a毛片| 国产麻豆精品手机在线观看| 中文字幕伦视频| 一本色道久久88亚洲综合| 国产精品手机在线观看你懂的 | 日本一本正道综合久久dvd| 久久国产精品77777| 国产精品尤物在线| 777国产精品永久免费观看| 亚洲人人视频| 国产亚洲高清视频| 亚洲精品无码日韩国产不卡| 亚洲国产成人在线| 久久久久久久久久国产精品| 国产精品久线在线观看| 综合色88| 99精品国产自在现线观看| 亚洲成在线观看| 自拍亚洲欧美精品| 五月丁香在线视频| 日本成人在线不卡视频| 国产精品亚洲专区一区| 成人福利在线观看| 激情无码视频在线看| 国产免费a级片| 97视频免费在线观看| 最新日韩AV网址在线观看| 亚洲国产欧美自拍| 在线欧美国产| 久久久精品无码一区二区三区| 国产精品亚欧美一区二区| 欧美午夜视频| 91久久天天躁狠狠躁夜夜| 91麻豆国产视频| 国产无码高清视频不卡| 久久精品一卡日本电影| 人妻熟妇日韩AV在线播放| 日韩福利视频导航| 91免费在线看| 人妻一本久道久久综合久久鬼色| 另类重口100页在线播放| 精品第一国产综合精品Aⅴ| 久久国产亚洲欧美日韩精品| 亚洲男人在线天堂| 9999在线视频| 亚洲无码精彩视频在线观看| 欧美黄网站免费观看| 亚洲日本在线免费观看| 精品无码日韩国产不卡av| 国产欧美日韩综合在线第一| 欧美一级高清片久久99| www.精品国产| 中文字幕资源站| 欧美精品aⅴ在线视频| 亚洲天堂视频在线观看免费| 呦女亚洲一区精品|