999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于推斷模型的Behrens-Fisher問題的精確檢驗

2018-10-09 05:53:40梁成揚何美儀譚銀冰
統計與決策 2018年17期
關鍵詞:療效方法模型

梁成揚,金 華,何美儀,譚銀冰

(華南師范大學 數學科學學院,廣州 510631)

0 引言

非劣檢驗指主要研究目的是顯示對試驗藥的反應,在臨床意義上不差于(非劣于)對照藥的試驗。設A藥為待確證療效的試驗藥,B藥為對照藥,下同。非劣檢驗的假設檢驗如下:

原假設H0:A藥療效-B藥療效≤-δ

備擇假設H1:A藥療效-B藥療效>-δ

如果p>0.05,按單側α=0.05的檢驗水準不能拒絕H0假設,即無法判斷A藥不差于B藥;如p≤0.05,則接受H1假設,可認為A藥不差于B藥。假設服用A藥的樣本為,服用B藥的樣本為上述非劣檢驗問題等價于:

在統計學上,該問題也稱為Behrens-Fisher問題。

針對上述問題,Welch[1,2]給出一種基于隨機自由度的近似方法(常稱為Welch近似t檢驗),他認為檢驗統計量在原假設H成立時近似服從自由度

0為l的t分布,其中自由度(非整數時四舍五入)。l=Scheffe[3](1970),Best 和Rayner(1987)[4],以及 Moserb和Stevensg(1989)[5]都認為:如果既要考慮檢驗的無偏性,又要兼顧實際應用的方便,Welch近似t檢驗或許是最好的方法,因為它只需t分布表,而Welch-Aspin檢驗的臨界值計算相當麻煩。現在的大學教科書大都采用Welch近似t檢驗這種方法[6,7]。但是該方法下的檢驗結果不能很好地控制住第一類錯誤。

最近學術界提出了一種新的推斷體系,稱為推斷模型(Inferential Model,簡記為IM)體系,而IM體系來源于對置信及其拓展——信仰函數的Dempster-Shafer理論的探討。IM的原創基本思想來自Martin等[8]、Zhang和Liu[9]以及Zhang[10]文中提出的對Dempster-Shafer理論修正。推斷模型方法發表在國際統計學最頂尖的雜志Journal of the American Statistical Association和Journal of the Royal Statistical Society上,所以基于IM模型,下面給出精確檢驗方法。而且通過模擬驗證,基于IM模型的方法可以控制住第一類錯誤,比Welch近似t檢驗好。

1 基于推斷模型的方法

對于此問題,可以轉化為對斷言A={μ1-μ2:μ1-μ2≤-δ}={μ:μ≤-δ}的推斷,其中μ1-μ2=μ

根據文獻[11,12],得到條件聯結模型:

其中輔助變量為ω=FD(T)且ω~U(0 ,1),FD(·)為給定樣本X1,X2,...,Xn1,Y1,Y2,...,Yn2后T的條件分布函數。

(P步) 對斷言A來說,輔助變量ω的隨機預測集是:

(C步) 組合ΘZ(ω)和S得到μ的隨機預測集:

于是斷言A的可能性函數為:

此方法是有效的(證明略),但由于FD(·)給定樣本后的條件分布函數,此分布的概率密度函數是未知的,從而無法直接計算plZ(A)的值,故需要利用計算機模擬計算其估計值:

給定X1,X2,...,Xn1,Y1,Y2,...,Yn2后,分別產生n個t1與t2隨機數,其中t1~t(n1-1),t2~t(n2-1),記m為T≤-+δ的個數,利用頻率估計概率的方法,得:

則plZ(A)的估計值為:

但是,為了確保估計的精度,即:

對于給定的最大允許誤差,需要重復的次數大約為:

然而此估計值并不是plZ(A)的真實值,當p?≤α時,并不意味著有plZ(A)≤α。plZ(A)有95%的概率落在的置信區間上。為保證精度與可信性,考慮到本文的非劣檢驗為右側檢驗,故使用做統計推斷。這里,本文選擇n=10000。

2 模擬實驗及結果

2.1 實驗結果

為比較小樣本情形下Welch近似t檢驗和基于推斷模型的新方法的第一類錯誤,本文利用R語言編程進行隨機模擬。

為考察兩種方法的第一類錯誤,取顯著性水平α=0.05,重復試驗200000次,則其置信水平為95%的置信區間為(4 .904%,5.096% )。

2.2 結果分析

根據模擬結果來看,在樣本量不等的小樣本情況下,Welch近似t檢驗的第一類錯誤率大部分(58.3%)都超過了預先指定的顯著性水平α=0.05的置信上限;只有在樣本量相同的情況下,頻率方法才可以控制第一類錯誤。而在本文模擬的所有情況下,推斷模型的第一類錯誤率都較為接近5%,表明推斷模型方法能保證控制第一類錯誤。對于功效,推斷模型方法與Welch近似t檢驗相差不大,比較接近。

綜上,在樣本量不等的情況下,推斷模型方法要比Welch近似t檢驗優,而在樣本量相等的情況下,兩種方法相差不大。

3 總結

本文提出了基于推斷模型的非劣檢驗的新方法,通過比較頻率方法的Welch’s近似t檢驗,發現推斷模型有重要的應用價值,它可以完全控制第一類錯誤,不需要大量重復試驗就可以得到理想的結果,這對醫學藥效檢驗具有重大意義。然而,推斷模型的結果較為保守,難以作出精確的判斷,還是需要對具體問題進行具體分析。本文總結的這個推斷模型方法可以為實證研究人員提供一些參考,可以嘗試應用在醫學藥效檢驗的領域中。

表1 Welch近似t檢驗(T)和推斷模型(IM)的第一類錯誤模擬比較

猜你喜歡
療效方法模型
一半模型
重要模型『一線三等角』
止眩湯改良方治療痰瘀阻竅型眩暈的臨床療效觀察
重尾非線性自回歸模型自加權M-估計的漸近分布
冷噴聯合濕敷甘芩液治療日曬瘡的短期療效觀察
中西醫結合治療慢性盆腔炎的療效觀察
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产毛片片精品天天看视频| 亚洲无码视频喷水| 亚洲系列无码专区偷窥无码| 亚洲第一视频区| 午夜成人在线视频| 亚洲swag精品自拍一区| 亚洲天堂伊人| 亚洲天天更新| 特黄日韩免费一区二区三区| 在线观看视频99| 亚洲精品视频网| 国产尹人香蕉综合在线电影| 欧美精品v| 91精品情国产情侣高潮对白蜜| 91破解版在线亚洲| 日本不卡免费高清视频| 日韩 欧美 国产 精品 综合| 国产美女91视频| 免费又爽又刺激高潮网址| AV天堂资源福利在线观看| 国产丝袜无码一区二区视频| 日本黄色a视频| 日本不卡在线| 成人日韩精品| 尤物精品国产福利网站| 国产办公室秘书无码精品| 青青草国产在线视频| 亚洲天堂在线视频| 亚洲一区二区三区麻豆| 欧美性猛交一区二区三区| 亚洲h视频在线| av一区二区三区在线观看| 国产成人精品日本亚洲77美色| 亚洲第一成年人网站| www.91中文字幕| 亚洲午夜福利精品无码不卡| 亚洲 欧美 偷自乱 图片 | 日韩精品免费一线在线观看| 色有码无码视频| 国产在线观看第二页| 欧美视频在线观看第一页| 白浆免费视频国产精品视频| 国产精品99久久久久久董美香| 一级毛片免费观看不卡视频| 日韩欧美一区在线观看| 欧美人与牲动交a欧美精品| 在线不卡免费视频| 亚洲欧美激情小说另类| 国产福利微拍精品一区二区| 素人激情视频福利| 国产亚洲精品自在久久不卡 | 国内黄色精品| 91无码人妻精品一区二区蜜桃 | 亚洲成人77777| 无码人妻免费| 最新国语自产精品视频在| 国产成人亚洲精品无码电影| 久久国产毛片| 成人在线观看不卡| 国产精品成人一区二区不卡| 日本三级黄在线观看| 亚洲欧美成人在线视频| 亚洲不卡无码av中文字幕| 永久免费无码成人网站| 成年女人a毛片免费视频| 狼友av永久网站免费观看| 一区二区理伦视频| 亚洲丝袜中文字幕| 免费看a级毛片| 色婷婷啪啪| 亚洲经典在线中文字幕| 婷婷六月激情综合一区| 欧美日韩导航| 亚洲青涩在线| 亚洲婷婷六月| 91蝌蚪视频在线观看| 亚洲AV色香蕉一区二区| 自偷自拍三级全三级视频| 国产美女在线观看| 美女扒开下面流白浆在线试听| jizz在线观看| 在线观看亚洲精品福利片|