999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

響應(yīng)變量缺失下部分線性模型的異方差檢驗

2019-03-19 04:44:10康新梅
關(guān)鍵詞:模型

劉 鋒,胡 悅,康新梅

(重慶理工大學(xué) 理學(xué)院, 重慶 400054)

部分線性模型是20世紀(jì)80年代發(fā)展起來的一類重要的統(tǒng)計模型,既包含了參數(shù)部分,又包含了非參數(shù)部分。部分線性模型融合了參數(shù)模型和非參數(shù)模型的優(yōu)點,可以概括和描述現(xiàn)實中的許多實際問題,較單純的參數(shù)模型或非參數(shù)模型具有更大的適應(yīng)性、更強的解釋能力。因此,該模型引起了廣泛的重視和研究,在工業(yè)、農(nóng)業(yè)、經(jīng)濟、生物統(tǒng)計等領(lǐng)域得到了廣泛的應(yīng)用。

在實際問題中,往往由于諸多原因?qū)е聰?shù)據(jù)缺失,比如獲取數(shù)據(jù)花費的代價大、研究個體由于藥物的副作用而停止試驗等。用缺失數(shù)據(jù)擬合模型的統(tǒng)計推斷已經(jīng)有很多的研究,但是大部分的研究還是在模型的估計方面。如果用錯誤的模型擬合數(shù)據(jù),得到的結(jié)果可能是不合理的,所以關(guān)于模型的檢驗具有非常重要的意義。

在回歸模型中,一般假定模型的誤差項εi是相互獨立的,且具有相同方差的隨機變量。對于一個擬合理想的模型,殘差中不再含有模型的信息,即殘差為白噪聲序列,所以模型的誤差項的獨立同方差是模型的一個基本假定。如果模型存在異方差會導(dǎo)致參數(shù)估計量非有效,變量的顯著性等檢驗失去意義,會出現(xiàn)模型預(yù)測失效,甚至模型被誤用等問題。因此,在統(tǒng)計推斷之前,檢驗?zāi)P褪欠窬哂挟惙讲钍欠浅S斜匾摹?/p>

考慮如下部分線性模型:

(1)

其中:β0是p維參數(shù)向量;g(·)是未知函數(shù);{(Xi,Ui,Yi),1≤i≤n}是來自(X,U,Y)的獨立同分布樣本;εi是隨機誤差,且?guī)缀跆幪幱蠩(εi|Xi,Ui)=0。 通常假設(shè)Ui的維數(shù)為1。不妨設(shè)Ui∈[0,1],此時g(·)為定義在[0,1]的未知函數(shù)。

1 方法和主要結(jié)果

1.1 響應(yīng)變量缺失的處理方法

假設(shè)響應(yīng)變量Y是隨機缺失(MAR)的,即在給定X和U時,Y是否缺失與Y的值條件獨立。定義δi為指示第i個個體的響應(yīng)變量值Yi是否缺失的變量,當(dāng)Yi觀測到時δi=1,當(dāng)Yi缺失時δi=0,MAR缺失機制表示為P(δ=1|Y,X,U)=P(δ=1|X,U)。 MAR是經(jīng)常使用的缺失機制之一并且與很多實際情況基本吻合,可以參考文獻[1]。 假設(shè)得到了模型(1)的一個隨機樣本(Yi,δi,Xi,Ui),i=1,2,…,n。

首先估計參數(shù)β0,將式(1)兩端分別乘以δi可得

再將上式兩端取關(guān)于Ui的條件期望,得

E(δi|Ui=u)g(u)

由此可得

其中:

g1(u)=E(δX|U=u)/E(δ|U=u)

g2(u)=E(δY|U=u)/E(δ|U=u)

那么它們對應(yīng)的估計量是

(2)

當(dāng)Yi缺失時,用回歸借補的思想對Yi進行補齊,

1.2 異方差檢驗的方法

(3)

下面考慮模型(1)響應(yīng)變量隨機缺失下的異方差檢驗問題。

假定模型的隨機誤差項εi,i=1,2,…,n,有E(εi)=0,Var(εi)=σ2·mi,其中mi>0,假設(shè)mi滿足下面的函數(shù)形式:

mi=m(zi,γ),i=1,2,…,n

其中mi僅取決于q×1維向量zi和q×1維的未知參數(shù)γ。接下來假定m(·)是關(guān)于γ的可微函數(shù)且存在一個唯一的γ的特定值γ*使得對于所有的zi,使得m(zi,γ*)=1。因此檢驗?zāi)P?1)的異方差性等價于檢驗下面的假設(shè):

H0:γ=γ*?H1:γ≠γ*

為構(gòu)造經(jīng)驗似然比,定義如下估計方程:

其中:

i=1,2,…,n

上述經(jīng)驗似然比函數(shù)不僅含有未知討厭參數(shù)β0,σ2和感興趣的參數(shù)γ,而且還包含未知函數(shù)g1(·),g2(·), 因此L(γ,β0,σ2)不能直接用于統(tǒng)計推斷。一個直接的想法是分別利用它們各自的估計來代替,利用上述所介紹的估計方法得到它們的估計量。

代入未知函數(shù)及參數(shù)β0的估計量,得到估計函數(shù):

其中

i=1,2,…,n

利用Lagrange乘數(shù)法求得pi的最優(yōu)值為

其中λ為下面方程的解:

所以可以得到

(4)

接下來將通過一些假設(shè)條件,建立經(jīng)驗似然的非參數(shù)版本的Wilk’s定理,具體假設(shè)如下:

A3:wnj(t)滿足一階Lipschitz條件;

A4:g(·),g1(·),g2(·)滿足一階Lipschitz條件;

A6:Cov(xi-E(xi|ti))為正定陣;

A7:

且矩陣A11和A22正定。

定理1 在零假設(shè)及假設(shè)條件A1~A7下,當(dāng)n→∞時,l0(γ,σ2)具有自由度為q+1的漸近卡方分布,即

為了處理討厭參數(shù)σ2,定義

l0(γ)

則在上述假設(shè)條件及零假設(shè)下,當(dāng)n→∞時,有[7]

2 數(shù)值模擬

本節(jié)通過數(shù)值模擬來研究本文提出的基于經(jīng)驗似然的異方差檢驗方法的可行性。

為了簡單起見,考慮如下模型:

核函數(shù)K(·)為Beweight核:

考慮下面4種響應(yīng)變量缺失情形:

情形A:

P(δ=1|X=x)={1/(1+0*exp(x))}

情形B:

P(δ=1|X=x)={1/(1+0.1*exp(x))}

情形C:

P(δ=1|X=x)={1/(1+0.25*exp(x))}

情形D:

P(δ=1|X=x)={1/(1+0.65*exp(x))}

這4種情形下,平均缺失率分別約為:0、0.1、0.2、0.4。樣本量n=100,200,300,各進行1 000次模擬,顯著性水平α=0.05。結(jié)果如表1所示。

從表1、2的模擬結(jié)果來看,不論誤差服從正態(tài)分布還是均勻分布,都可以得到比較滿意的結(jié)果。當(dāng)在同一缺失情形下,隨著樣本量的增大,檢驗的準(zhǔn)確度隨著提高:在原假設(shè)(γ=0)下,檢驗水平(size)逐漸接近顯著性水平0.05;在備擇假設(shè)下,功效(power)逐漸接近于1。但可以看到,在原假設(shè)下,當(dāng)小樣本時,檢驗水平(size)偏高,這主要是由于經(jīng)驗似然比檢驗統(tǒng)計量是漸近服從卡方分布的。當(dāng)樣本量一定時,隨著缺失率的增大,檢驗的準(zhǔn)確性隨著降低,如表2所示,在缺失情形A、B、C、D下,當(dāng)n=300時,在原假設(shè)(γ=0)下,檢驗水平分別為0.050 3、0.050 4、0.050 8、0.051 0,隨著缺失率的增大檢驗水平增大,但還是能達到比較滿意的效果。以上模擬結(jié)果可以說明:缺失率越大,即數(shù)據(jù)的完整性越低,檢驗的不穩(wěn)定性和不準(zhǔn)確性越大。但是在缺失率增大時,得到的結(jié)果依然比較滿意,這說明運用本文提出的方法對響應(yīng)變量缺失下部分線性模型進行異方差檢驗的效果是比較好的。

表1 不同缺失情形下經(jīng)驗似然比檢驗結(jié)果(誤差服從正態(tài)分布)

表2 不同缺失情形下經(jīng)驗似然比檢驗結(jié)果(誤差服從均勻分布)

3 定理的證明

為了給出主要結(jié)果的證明,首先給出如下引理。

1) 存在絕對常數(shù)C1>0,C2>0,使得關(guān)于t∈[0,1]一致地有:

對充分大的n成立。

2) 存在絕對常數(shù)C3>0使得關(guān)于s,t∈[0,1]及n≥1一致地有:

那么對充分大的n有

證明過程見文獻[8]。

注權(quán)ani(t)為隨機時結(jié)論依然成立,見文獻[10]。

引理2 在假設(shè)條件A1~A6以及零假設(shè)下,有

證明由假設(shè)A1~A6與引理1即得,見文獻[8]。

引理3 設(shè)

b1≥b2≥…≥bn≥0,

M=max{S1,…,Sn}

(5)

為了應(yīng)用Abel不等式,式(5)可變形為

(6)

其中(j1,j2,…,jn)為(1,2,…,n)的任意重排。若序列bi的非負性限制去掉,有

(7)

對式(7)的后兩項分別進行如式(6)的處理,最后得到:對任意2個序列{ai},{bi},總有

(8)

其中(j1,j2,…,jn)為(1,2,…,n)的任意重排。

(9)

證明過程見文獻[9]。

(a)A>0?A22>0,A11.2>0

(b) 若A22>0,則A≥0?A11.2≥0

證明過程見文獻[11]引理3.2.1。

引理6 在零假設(shè)及假設(shè)條件A1~A7下,有

證明首先證明

接下來證明:

又有

由引理2,有

由引理2,式(8)及(9)可得:

其中(j1,j2,…,jn)為(1,2,…,n)的任一置換。因此,Δn2=op(1),Δn3=op(1)。

記ε的i階矩為μi,P(δ=1|X,U)=p,有Ε(ζi)=0及

為正定矩陣。

因此,

當(dāng)n→∞時,從而可得

由上述結(jié)論及條件A5,可得Lindeberg條件成立。由Lindeberg中心極限定理,有

從而由Cramer-Wold方法,有

引理7 在零假設(shè)及假設(shè)條件A1~A7下,有

證明定義

Rn4+Rn5+Rn6-Rn7

由假設(shè)條件A7與引理2,有

接下來考慮Rn3中的一項

由假設(shè)A5、 A7、 引理2以及大數(shù)定理,對任意q+1維非零向量θ,有

因此,

Rn1=op(1),Rn3=op(1),Rn4=op(1)

Rn5=op(1),Rn6=op(1)

由大數(shù)定理得

從而

同理

再由文獻[4]引理2,有

引理 7得證。

證明類似于文獻[2]。

引理9 在假設(shè)條件A1~A7及零假設(shè)下,有

證明類似于文獻[3]的引理3。

定理1的證明:

由引理8及引理9,將式(4)泰勒展開,可以得到

由引理6~9,文獻[7]中定理3.5,通過簡單的計算,有

l0(γ,σ2)

最后結(jié)合引理6、引理7,定理得證。具體證明類似于文獻[12]。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 四虎永久免费在线| 亚洲精品视频免费看| 美女免费黄网站| 亚洲一区二区精品无码久久久| 日韩精品一区二区三区免费在线观看| 亚洲国产日韩一区| 中文字幕日韩久久综合影院| 第一页亚洲| 国产凹凸视频在线观看| 国产美女自慰在线观看| 97青青青国产在线播放| 国产精品久久久久鬼色| 欧美激情福利| 天天视频在线91频| 国产精品视频a| 国产女人在线观看| 99无码中文字幕视频| 日韩精品一区二区三区swag| 97超爽成人免费视频在线播放| 少妇极品熟妇人妻专区视频| 国产大片黄在线观看| 欧美中文字幕在线视频| 亚洲av日韩综合一区尤物| 波多野结衣无码视频在线观看| 欧美不卡二区| 中文字幕色在线| 一区二区欧美日韩高清免费| 日韩毛片视频| 国产一区二区三区在线观看视频| 成年网址网站在线观看| 在线欧美a| 麻豆精品视频在线原创| 国产日韩欧美成人| 久久黄色一级视频| 欧洲亚洲欧美国产日本高清| 综合五月天网| 国产主播一区二区三区| 最新日本中文字幕| 久久人妻xunleige无码| 精品福利网| 亚洲无码在线午夜电影| 久久99蜜桃精品久久久久小说| 国产99精品久久| 久久影院一区二区h| 99无码中文字幕视频| 亚洲综合在线网| 国产精品不卡永久免费| 国产成年女人特黄特色毛片免| 国产在线自揄拍揄视频网站| 亚洲bt欧美bt精品| 日韩免费中文字幕| 国产粉嫩粉嫩的18在线播放91| 九九久久精品免费观看| 国产人人射| 网久久综合| 亚洲国产无码有码| 国产二级毛片| 色久综合在线| 亚洲熟妇AV日韩熟妇在线| 欧美视频免费一区二区三区| 亚洲日韩精品无码专区| 国产精品白浆无码流出在线看| 亚洲日本www| www.99精品视频在线播放| 亚洲第一福利视频导航| 高清无码手机在线观看 | 国产幂在线无码精品| 国产亚洲精品资源在线26u| 亚洲精品大秀视频| 国产免费网址| aⅴ免费在线观看| 国产精品无码久久久久久| 中国成人在线视频| 久久久波多野结衣av一区二区| 亚洲精品无码抽插日韩| 婷婷色婷婷| 夜精品a一区二区三区| 成人国产精品一级毛片天堂| a色毛片免费视频| 日本成人不卡视频| 国产精鲁鲁网在线视频| 日韩无码黄色网站|