999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

輪廓似然函數(shù)及其應(yīng)用*

2012-03-11 14:01:34陳平雁NakamuraTsuyoshi
中國衛(wèi)生統(tǒng)計 2012年4期
關(guān)鍵詞:方法

韓 棟 陳 征△ 陳平雁 Nakamura Tsuyoshi

在回歸分析中,似然函數(shù)通常會含有多個參數(shù),但有時只有其中一個或幾個是欲研究的參數(shù),稱為興趣參數(shù)(parameter of interest),其他參數(shù)就被稱作多余參數(shù)(nuisance parameter),這些多余參數(shù)對模型的求解有時會有阻礙作用。當存在多個多余參數(shù)時,標準的似然方法無法消除或減少它們,所以變得不可靠或完全無效,而輪廓似然(profile likelihood,PL)作為一種處理多余參數(shù)的方法能夠解決多余參數(shù)過多的問題。1970年,Kalbfleisch和 Sprott等〔1〕首次將輪廓似然方法應(yīng)用于帶有多余參數(shù)的參數(shù)推斷,并稱最大輪廓似然函數(shù)為最大相對似然函數(shù)(maximum relative likelihood function)。Barndorff-Nielsen〔2〕首先使用“輪廓似然”命名該方法,之后該名字被廣泛接受〔3〕。2000年,Murphy等〔4〕證明了在一般情況下最大輪廓似然點估計等價于最大似然估計。

另外,在興趣參數(shù)呈非正態(tài)分布時,如果計算基于正態(tài)分布的Wald型置信區(qū)間(Wald CI)將會產(chǎn)生偏差〔5〕,尤其在無法計算興趣參數(shù)的標準誤時,Wald CI也無法計算。而輪廓似然置信區(qū)間(PL CI)是基于χ2分布且無需計算標準誤,因此,PL CI能夠解決參數(shù)不服從正態(tài)分布和標準誤無法計算時置信區(qū)間的計算問題。Venzon等〔5〕于1988年提出了簡化輪廓似然置信區(qū)間計算的一種新方法。

本文將描述輪廓似然的定義及其兩個應(yīng)用,模擬比較PL CI與Wald CI的優(yōu)劣并運用PL方法解決多余參數(shù)過多和參數(shù)呈非正態(tài)分布時的問題。

原理與方法

1.輪廓似然定義

輪廓似然函數(shù)是固定興趣參數(shù)時,對多余參數(shù)求最大化后的函數(shù),因而不是真正的似然函數(shù)。設(shè)θ表示興趣參數(shù)或興趣參數(shù)向量,γ表示多余參數(shù)或多余參數(shù)向量,假設(shè)X1,…,Xn為獨立同分布且密度函數(shù)為,然后輪廓似然函數(shù)被定義為pl(θ)=l[θ,^γ(θ)],其中,^γ(θ)為固定θ時,γ的最大似然估計值(MLE),即:pl(θ)=maxγl(θ,γ)。

2.輪廓似然置信區(qū)間

Wald CI是根據(jù)一個預(yù)先給定的置信水平和參考分布(在線性回歸分析中選用t分布,其他為標準正態(tài)分布)選定分位數(shù),采用“估計值±分位數(shù)×估計值的標準誤”來計算模型中某個參數(shù)的置信區(qū)間。如果興趣參數(shù)的分布呈偏態(tài)分布或無法計算其標準誤時,Wald CI的結(jié)果不可靠,而PL CI對以上特殊情況并不敏感,是一種更加穩(wěn)健的方法。PL方法可應(yīng)用于所有基于似然理論的統(tǒng)計分析。

興趣參數(shù)θ的95%PL CI是由檢驗水準為0.05時似然比檢驗無統(tǒng)計學(xué)意義的所有θ構(gòu)成,即所有使似然比統(tǒng)計量小于等于3.84)的 θ值。用公式表示為滿足ln[pl(θ)]≥ln[pl(θ^)]-3.84/2=ln[pl(θ^)]-1.92的所有 θ值構(gòu)成了95%PL CI,其中 θ^是θ的最大輪廓似然估計值。用代替 3.84 可以計算其他置信水平為100(1-α)%的置信區(qū)間。

實 例

1.多個多余參數(shù)出現(xiàn)的問題

在對2003年SARS病死率估計的研究中,陳征等〔6〕基于競爭風(fēng)險理論〔7〕建立模型:令 ni、di、ci和 ai分別指代在第i點的新增患者、死亡人數(shù)、治愈康復(fù)人數(shù)和觀察人數(shù),h1i、h2i分別表示死亡與治愈的危險率,其中i=1,…,s,表示不同時間點。根據(jù)實際數(shù)據(jù)觀察可假設(shè)治愈-死亡危險率比Ri=h2i/h1i≡R是一個常數(shù),則病死率估計值為(1+R)-1。關(guān)于R和h1i的對數(shù)似然函數(shù)為:

因為病死率估計公式只與R有關(guān),因此上式中R為興趣參數(shù),其他參數(shù)(h1i,i=1,2,3,…,s)為多余參數(shù),此時似然函數(shù)中有(s+1)個參數(shù),而且隨著觀察時間點增多(s增大),多余參數(shù)個數(shù)在不斷增加,因此不能直接使用標準最大似然估計求解參數(shù)?;趯嶋H數(shù)據(jù)研究〔8〕及Lam〔9〕研究,模型又假設(shè)h1i≡h1為常數(shù),從而將對數(shù)似然函數(shù)中的參數(shù)個數(shù)減至可求解的兩個(R和h1)。將每個時間點的兩個危險率均設(shè)為常數(shù)的條件過于苛刻,但無此假設(shè)無法使用MLE估計參數(shù)。

使用輪廓似然方法解決上述問題:

此處僅假設(shè)Ri為常數(shù),即Ri=h2i/h1i≡R,基于似然函數(shù)公式(1),解方程組 ?l/?h1i=0,得出 ^h1i=(di+ci)/[ai(1+R)],然后將 ^h1i代替 h1i代入公式得出對數(shù)輪廓似然函數(shù):則R的近似方差估計是:

本例也驗證了Murphy的結(jié)論,即最大輪廓似然點估計(式(2)和(3))與MLE結(jié)果〔6〕一致。由于輪廓似然方法的假設(shè)相比MLE方法〔6〕的假設(shè)弱化了很多,因此當存在多余參數(shù)時,使用輪廓似然方法可以提高方法的適用性。

2.偏態(tài)分布的輪廓似然置信區(qū)間

(1)數(shù)值模擬

此節(jié)對不同偏態(tài)分布情況下PL CI和Wald CI的置信水平進行檢測。為了模擬非正態(tài)分布參數(shù),選取logistic模型 log(pi/1-pi)=β1+β2xi,并設(shè)定 xi分別為(60,65,75,90),β1= - 6.5,β2=0.1。采用二項分布,每個x下的試驗次數(shù)分別設(shè)定為3、8、20,以每一個pi為發(fā)生率,模擬出每個試驗次數(shù)下的事件發(fā)生次數(shù)與失敗次數(shù),擬合logistic回歸模型并計算PL CI和Wald CI界值在χ2(1)分布下的置信水平。相對輪廓似然值(relative PL,RPL)定義為:輪廓似然值/最大輪廓似然值。根據(jù)似然理論,RPL表示數(shù)據(jù)對兩個參數(shù)估計值支持程度的比值,取值為(0,1],因此可采用RPL比較不同數(shù)據(jù)情況下的置信限處的似然。輪廓似然不對稱性指標的計算公式〔11〕為:

表示置信限到估計值距離之差占置信區(qū)間長度的百分比,不對稱性越趨近于0,表示PL CI越趨于對稱。模擬結(jié)果反映在表1和圖1上。

表1 輪廓似然置信區(qū)間與Wald置信區(qū)間的置信水平

圖1 不同試驗次數(shù)下的相對輪廓似然值(左1-A,n=3,右1-B,n=20)

由表1和圖1可以看出,隨著試驗次數(shù)增大,Wald CI與PL CI趨于一致,PL CI也逐漸趨于對稱。試驗次數(shù)較小時(n=3),PL CI不對稱性為28.9%,95%Wald CI的置信水平僅為93.0%,由于采用PL方法,95%PL CI的置信水平被控制在95.0%。

圖1-A中,Wald CI下限至PL CI下限間的RPL值在0.03~0.15之間,而Wald CI上限至PL CI上限間RPL值的區(qū)間為0.15~0.36,由于兩個CI上限間的RPL值均大于兩個CI下限間的RPL值,根據(jù)似然理論以及似然比檢驗的原理,Wald CI下限至PL CI下限間包括真實值的可能性均比Wald CI上限至 PL CI上限間包括真實值的可能性要低。圖1-B的結(jié)論與此類似,因此PL CI置信區(qū)間更可信。

(2)白鼠毒性實驗

利用PL來分析白鼠毒性實驗〔12〕,ni表示總的白鼠數(shù),ri表示死亡鼠數(shù),xi表示毒藥劑量,數(shù)據(jù)如下表:

表2 白鼠毒性實驗數(shù)據(jù)

對以上數(shù)據(jù)擬合logistic回歸模型:log(pi/(1-pi))=β1+β2log xi(i=1,…,4)。結(jié)果見表 3,經(jīng) Wald檢驗,毒藥劑量的對數(shù)值對白鼠的死亡率沒有影響(P=0.119),但由圖2可以看出,β2的輪廓似然函數(shù)值呈正偏態(tài),不對稱性達到41.2%,因此采用Wald法不可靠。如果采用似然比檢驗,由表3的結(jié)果顯示,毒藥劑量的對數(shù)值對白鼠的死亡率的影響有統(tǒng)計學(xué)意義(P<0.001),毒藥劑量對數(shù)值系數(shù)的 PL CI為(2.283,21.491)。

表3 似然比檢驗與Wald檢驗

圖2 白鼠毒性實驗中系數(shù)值的相對輪廓似然值

討 論

本文就輪廓似然方法及其應(yīng)用進行了闡述,并用模擬與實例說明輪廓似然在估計參數(shù)值和計算置信區(qū)間等方面都有較強的實用性。除了文中所述的一些性質(zhì)外,在參數(shù)模型中,對數(shù)輪廓似然函數(shù)的二階導(dǎo)函數(shù)是觀察信息量的估計值,甚至是在輪廓似然函數(shù)不能寫成外顯函數(shù)的情況下,數(shù)值計算方法也可以計算出信息矩陣的估計值。輪廓似然方法還有其他特殊的性質(zhì),如利用輪廓似然方法消去普通似然函數(shù)中的基準危險率,從而推導(dǎo)出擬合Cox回歸時使用的偏似然函數(shù)〔4〕;也可以利用輪廓似然方法消去基準危險率后,構(gòu)造全輪廓似然函數(shù)〔13〕,在中小樣本情況下,最大全輪廓似然估計值比最大偏似然估計值更有用;與標準的似然方法相比,利用輪廓似然方法處理有刪失的生存時間數(shù)據(jù)時,無需對刪失類型進行假設(shè)〔14〕。除了輪廓似然方法外,處理多余參數(shù)的方法還有邊際似然、條件似然、聯(lián)合似然等。由于以上三種似然方法的使用都需要依賴一定的特殊結(jié)構(gòu),而本文所述的輪廓似然沒有這種限制,甚至在輪廓似然函數(shù)不能被寫成顯性函數(shù)的形式時,輪廓似然方法依然適用。因此輪廓似然作為一種處理多余參數(shù)的方法更可行〔15〕。

1.Kalbfleisch JD,Sprott DA.Application of likelihood methods to models involving large numbers of parameters.Journal of the Royal Statistical Society.Series B(Methodological),1970:175-208.

2.Barndorff-Nielsen O.On a formula for the distribution of the maximum likelihood estimator.Biometrika,1983,70(2):343

3.Bjφrnstad JF.Predictive Likelihood.Encyclopedia of Statistical Sciences,2006,9:6369-6375.

4.Murphy SA,Van der Vaart AW.On profile likelihood.Journal of the A-merican Statistical Association,2000,95(450):449-465.

5.Venzon DJ,Moolgavkar SH.A method for computing profile-likelihoodbased confidence intervals.Applied Statistics,1988,37(1):87-94.

6.陳征,Nakamura T.基于競爭風(fēng)險理論和概要型數(shù)據(jù)的病死率估計模型.中國衛(wèi)生統(tǒng)計,2010,27(3):249-252.

7.江一濤,胡海蘭,魏巧玲,等.競爭風(fēng)險模型的發(fā)展與應(yīng)用.中國衛(wèi)生統(tǒng)計,2009,26(4):445-447.

8.Chen Z,Nakamura T.Statistical evidence for the usefulness of Chinese medicine in the treatment of SARS.Phytotherapy Research,2004,18(7):592-594.

9.Lam KF,Deshpande JV,Lau E,et al.A test for constant fatality rate of an emerging epidemic:with applications to severe acute respiratory syndrome in Hong Kong and Beijing.Biometrics,2008,64(3):869-876.

10.Tsodikov A,Garibotti G.Profile information matrix for nonlinear transformation models.Lifetime data analysis,2007,13(1):139-159.

11.Royston P.Profile likelihood for estimation and confidence intervals.Stata Journal,2007,7(3):376-387.

12.Aitkin M.Statistical modelling:the likelihood approach.The Statistician,1986,35(2):103-113.

13.Ren J,Zhou M.Full likelihood inferences in the Cox model:an empirical likelihood approach.Annals of the Institute of Statistical Mathematics,2011,63(5):1005-1018.

14.Zhang Z.Profile likelihood and incomplete data.International Statistical Review,2010,78(1):102-116.

15.Montoya J,Díaz-Francés E,Sprott D.On a criticism of the profile likelihood function.Statistical Papers,2009,50(1):195-202.

猜你喜歡
方法
中醫(yī)特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數(shù)學(xué)教學(xué)改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學(xué)習(xí)方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 久久人体视频| 午夜a视频| 这里只有精品在线播放| 最新国产成人剧情在线播放| www.91中文字幕| 午夜精品福利影院| 欧类av怡春院| 97成人在线观看| 中国一级毛片免费观看| 精久久久久无码区中文字幕| 成人国产免费| 亚洲成人www| 国产欧美综合在线观看第七页| 亚洲无码精彩视频在线观看| 成人国产一区二区三区| 国内自拍久第一页| 中文字幕永久在线看| 欧美在线观看不卡| 19国产精品麻豆免费观看| 国产高清毛片| 成人小视频在线观看免费| 国产农村妇女精品一二区| 久久伊人操| 国产免费自拍视频| 日韩在线1| 四虎成人免费毛片| 国产激情在线视频| 亚洲无码日韩一区| 亚洲一区二区在线无码| 18禁高潮出水呻吟娇喘蜜芽| 久久精品人人做人人爽97| 国产成人高清精品免费| 亚洲av日韩综合一区尤物| 欧美日韩动态图| 69视频国产| 日韩美一区二区| 国产美女精品人人做人人爽| 国产导航在线| 久久夜色精品| 日韩少妇激情一区二区| 欧美特黄一级大黄录像| 一级成人欧美一区在线观看| 国产精品毛片一区| 91在线中文| 色婷婷成人| 精品国产一区二区三区在线观看| 精品无码国产自产野外拍在线| 欧美日韩另类国产| 亚洲男人的天堂久久精品| 狠狠干综合| 香蕉伊思人视频| 久久99热这里只有精品免费看| 久久青青草原亚洲av无码| 婷婷午夜天| 一区二区三区在线不卡免费 | 精品国产Av电影无码久久久| 色老二精品视频在线观看| 婷婷色狠狠干| 日韩精品毛片| 国产小视频在线高清播放| 欧美亚洲中文精品三区| 国产区网址| 日韩免费无码人妻系列| 成人免费午间影院在线观看| 久久精品人人做人人综合试看| 亚洲天堂色色人体| 青青青伊人色综合久久| 国产91无码福利在线| 黄色网页在线观看| 婷婷亚洲视频| 色综合中文字幕| 亚洲视频一区| 国产精品久久国产精麻豆99网站| 亚洲婷婷在线视频| 免费播放毛片| 国产一区免费在线观看| 亚洲熟妇AV日韩熟妇在线| 亚洲精品爱草草视频在线| 57pao国产成视频免费播放| 久久精品丝袜| 国产精品三区四区| 亚洲欧洲一区二区三区|