999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

假設檢驗中P值的深入分析

2021-07-21 09:07:10
統計理論與實踐 2021年6期
關鍵詞:研究

高 娟

(衡水學院 經濟管理學院,河北 衡水 053000)

一、引言

毋庸置疑,P值讓很多研究者感到困惑。關于P值的內涵和怎樣合理運用它解決實際問題,數據科學家Admond Lee花費了比較長的時間,才對其有了真正深刻的理解,有些學者甚至提出要擯棄P值的極端觀點[1]。人們的日常生活已經受到P值潛移默化的影響。在實際生活中做決定或者研究人員做某項檢測,按照概率值P,給最終結果提供理論支持;公司管理人員做決策,依據過去相關數據的抽樣分布,估計出P值,給出決策結論。值得指出的是,由于它只是整個決策過程中的一小部分,所以研究者不應該過度依賴P值。事實上,P值是否完全可靠有必要進行深入思考。接下來就針對P值的使用誤區,談一些個人觀點。

二、基本概念解析

(一)P 值定義

當原假設(零假設)為真時,所得到的樣本觀察結果或更極端結果出現的概率,稱為P值(P-value),也稱為觀察到的顯著性水平(observed significance level)。如果P值很小,說明這種情況發生的概率很小,而如果出現了,根據小概率原理,就有理由拒絕原假設[2]。

以標準正態分布為例給出P值的計算方法如下:

檢驗統計量的樣本觀測值記為Z0,則總體均值假設檢驗P值可按下述方法計算[3]:

雙側檢驗:H0:μ=μ0,H1:μ≠μ0,則P值=2P(Z≥|Z0|)

右單側檢驗:H0:μ≤μ0,H1:μ>μ0,則P值=P(Z≥Z0)

左單側檢驗:H0:μ≥μ0,H1:μ<μ0,則P值=P(Z≤Z0)

(二)P值的解讀

P值的一個通俗理解是,在原假設為真的條件下,在具體的樣本統計量觀測值和對應的總體參數假設值之間的差異中,由抽樣隨機誤差引起的可能性大小。

P值越小,拒絕原假設的理由就越充分,然而一個十分小的P值不能推斷出原假設和備擇假設哪一個是錯誤的。這是由于P值非常小可能是因為原假設不正確導致的,也可能只是由于違背研究設計形成的,抑或是由于研究人員選取的樣本容量比較大引起的。較大的P值意味著在原假設成立前提下,樣本數據的出現并非是罕見情況,但是并不意味著原假設是對的。也許是因為出現了違背研究設計的情形,或者是由于研究人員選取的樣本容量比較小造成的。

(三)P值和經典臨界值差異

P值是取值在(0,1]范圍的一個數值,歸根結底是一個概率。臨界值是由事先給定的顯著性水平α查相應分布表得到的數值。研究者對于P值非此即彼的觀點削弱了其意義:如果P值<α,則稱為“統計上是顯著的”,否則就被認為“統計上不顯著”。

由于臨界值是基于顯著性水平查表得到的數值,而顯著性水平α通常情況又是事先給定的(若沒有規定α數值,通常選取α=0.05),所以臨界值是不隨抽樣數據變化而變化的;P值是基于樣本數據,因而是計算之前無法獲取的分析結果,故P值被稱為實際觀測到的顯著性水平。

P值檢驗是計算機時代通行的檢驗方式,無須按照不同的顯著性水平查相關分布表來確定臨界值。目前,一般的數據分析軟件,在推斷參數的同時都會給出相對應的P值。因此,在計算機時代P值檢驗更加方便可行。

三、常見問題總結剖析

(一)P值很小拒絕原假設時,檢驗結果一定有實際意義

某個結論在統計上是顯著的,但是不一定有實際價值。由于P值和抽樣的樣本容量n緊密相關,檢驗統計量的值會隨著樣本容量的增大而增大,而此時P值卻越來越小,就越容易拒絕原假設。事實上,只要主觀上想拒絕原假設就一定能拒絕它,只要無限增加樣本容量,幾乎總是可以拒絕原假設,這就是“欲加之罪,何患無辭”。因此,研究者為了研究結果可以發表或者使結果具有統計顯著性可以人為選擇一些數據和方法,基于此,不應過于關注P值的統計學意義。如果研究總體規模比較小,噪聲也會把一個極其大的效應量淹沒,在這種情形下難以利用統計假設檢驗得到統計顯著性。

(二)P≤α表示原假設為假或應拒絕原假設

P值越小,意味著包括原假設在內的所有假設均為真的前提下,現有樣本數據出現的可能性是越小的;但P值較小也可能是由于抽樣不具有代表性或者統計推斷過程中違反了除原假設以外的其他假設。

(三)P值是原假設為真的可能性[4]

也就是說,假如在原假設為真的條件下,根據樣本數據計算得到P=0.02,那么原假設為真的概率只有2%;如P=0.30,原假設為真的概率則有30%。P值是在原驗假設為真的條件下計算得到的,它只反映現有樣本數據與在包括原假設在內的所有假設成立的前提下預測情況的一致程度。所以,P=0.02意味著樣本數據和根據模型預測的情況不是很接近,P=0.30相比之下暗示樣本數據和模型分析預測情況相對來說更為相近。P值并不能體現某一理論是否存在的概率,只是表示在其不正確的前提下,現有樣本數據以及有可能獲取但是沒得到的更加極端數據出現的可能性。

(四)P值表明的是所觀測到的一致程度是只因偶然因素產生的可能性

例如,若在原假設成立條件下,得出P值為0.08,則說明有8%的機率是來自偶然引起的關聯。此思想的不盡合理之處在于:以為只由偶然因素造成了現有觀測結果,也就意味著在邏輯上承認包含原假設在內的所有用來計算P值的假設均是對的。

(五)統計不顯著的檢驗結果意味著原假設為真或應被接受

P值較大只表明,包括原假設在內的所有假設均成立時,出現現有樣本數據的可能性不是小概率。并不表示零假設是對的,零假設錯誤的可能性仍是非常大的,只能說還沒有找到充足的理由去拒絕零假設。因此,對于原假設規范的說法通常是采用“拒絕或不拒絕”,而不是“接受”。

(六)如果P>α,表明沒有觀測到差異或證明了沒有差異

P>α只能說明零假設是使P值大于α的諸多假設之一。切記統計推斷(包括參數估計和假設檢驗)都是在一定的概率把握程度下討論的,在假設檢驗中,不管是拒絕還是不拒絕原假設都不能保證100%正確,因此在假設檢驗中,“證明了原假設正確”或“證明了沒有差異”這一表述是錯誤的。

(七)如果依據 P≤α拒絕原假設,則犯錯誤的可能性為α

如零假設為真,則當拒絕零假設時,若給定α=0.01,顯然犯錯誤的概率是100%,而非1%。在零假設及所有其他假設均成立時,如果反復抽樣,則可以實施多次檢驗,1%只表示在多次檢驗結論中,錯誤否定零假設的頻率。

(八)統計假設檢驗中均利用雙側檢驗P值

如果是單側檢驗時,使用單側P值更為合適。建議在使用單側檢驗P值時,可做必要解釋說明和進行特別強調。

(九)若前期研究計算得到了較小的P值,那么針對同一假設后期實施的另一研究觀測到的P值絕大可能不會高于該P值

即便在相互獨立且各自所有假設均為真這一理想狀態下進行分析,此種說法也是不正確的。有這種情形,若一項研究結果為P=0.02,則新研究只有2%的概率結果為P≤0.02。所以,已觀測到的P值即為后來研究獲得的P值結果不大于原研究P值結果的可能性。基本上,諸如研究規模,包括零假設在內的其他所有假設能否被滿足在很大程度上都會對新研究的P值產生影響。

(十)若因為P值>0.05和所得檢驗功效為99%而不拒絕零假設,那么犯錯誤的概率為1%

如備擇假設和研究中其余一切假設均為真,則在各個研究中實施多次檢驗時,意味著其中出錯的頻率是1%,而不是針對單獨一次檢驗進行說明。也就是說,1%沒有辦法說明用以估算功效的效應量外的其他效應量的出錯率。

四、結語

一直以來,學者們對P值的弊端進行著激烈爭論。研究者已慣于用P值衡量實驗數據的可靠性,實際上,P值不具有測量實驗結果的能力,很多論文的研究結果是不可靠的。P值大小僅表示數據差異在統計學上是否顯著,不代表實際顯著性,因此要客觀看待P值,做結論時應將統計學結果和實際問題結合起來。鑒于P值在實際運用中存在的諸多問題,要善于運用和慎用P值,要懂得接受不確定性,也可以合理選取二代P值或采取基于真實數據基礎上的其他P值統計原則[5]。◆

猜你喜歡
研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側面碰撞假人損傷研究
關于反傾銷會計研究的思考
焊接膜層脫落的攻關研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 国产乱人乱偷精品视频a人人澡| 亚洲欧美极品| 久青草免费在线视频| 婷婷99视频精品全部在线观看| 国产高潮视频在线观看| 亚洲午夜福利精品无码不卡| 青青青伊人色综合久久| 日本91在线| av在线无码浏览| 久久无码av一区二区三区| 亚洲高清国产拍精品26u| 亚洲精品色AV无码看| 色老头综合网| 国内熟女少妇一线天| 国产午夜人做人免费视频中文| 日韩精品无码免费一区二区三区| 亚洲一区二区日韩欧美gif| 日本高清在线看免费观看| 婷婷久久综合九色综合88| 永久免费AⅤ无码网站在线观看| 视频二区国产精品职场同事| 国产幂在线无码精品| 亚洲人妖在线| 日韩欧美国产三级| 国产精品v欧美| 国内a级毛片| 91在线无码精品秘九色APP | 亚洲成人77777| 99久久精品视香蕉蕉| 国产激情无码一区二区免费| 高清无码一本到东京热| 日本欧美一二三区色视频| 国产高清又黄又嫩的免费视频网站| 高清不卡毛片| 香蕉久人久人青草青草| 狠狠做深爱婷婷久久一区| 日本欧美中文字幕精品亚洲| 播五月综合| 亚洲欧洲美色一区二区三区| 午夜一级做a爰片久久毛片| 国产福利在线免费| www.91中文字幕| 毛片一级在线| 国产精品大白天新婚身材| 正在播放久久| 日韩精品免费一线在线观看| 最新国产麻豆aⅴ精品无| 日本在线国产| 国产香蕉国产精品偷在线观看| 亚洲成年网站在线观看| 亚洲成人一区二区三区| 中字无码av在线电影| 亚洲一级无毛片无码在线免费视频| 六月婷婷精品视频在线观看| 玖玖免费视频在线观看| 久久综合久久鬼| 久久中文字幕不卡一二区| 国产免费好大好硬视频| 国产黑丝一区| 乱人伦中文视频在线观看免费| 国产美女在线免费观看| 无码AV高清毛片中国一级毛片| 婷五月综合| 91久久性奴调教国产免费| 天天躁日日躁狠狠躁中文字幕| 99人妻碰碰碰久久久久禁片| 日a本亚洲中文在线观看| 三上悠亚在线精品二区| 亚洲精品图区| 久久国产精品国产自线拍| 国产爽妇精品| 久久久久人妻一区精品| 亚洲综合色区在线播放2019| 99热线精品大全在线观看| 成人在线欧美| 亚洲AV无码乱码在线观看代蜜桃| 91精品福利自产拍在线观看| www亚洲天堂| 亚洲色图欧美一区| 日韩色图区| 亚洲A∨无码精品午夜在线观看| 四虎影视8848永久精品|