摘 要 在一般多元線性模型中就基于嶺估計的預測量與最優線性無偏預測量的最優性判別問題進行了討論,得到了基于嶺估計的預測量在矩陣跡意義下優于最優線性無偏預測量的充要條件.
關鍵詞 多元線性模型;最優線性無偏預測;嶺型預測
中圖分類號 O 212.1 文獻標識碼 A
Discrimination of Superiority of Two Predictions in the Multivariate Linear Model
HUANG Jiewu
(School of Science, Guizhou University for Nationalities,Guiyang,Guizhou 550025, China)
Abstract The optimality of the prediction based on the ridge estimation and the optimal linear unbiased predication in the multivariate linear model was investigated. A sufficient and necessary condition of the superiority of the ridge prediction to the optimal linear unbiased prediction was given under the condition of the criteria of matrix trace function.
Keywords the multivariate linear model, the optimal linear unbiased prediction, the ridge prediction
1 引 言
設n×q的觀察值矩陣Y滿足一般的多元線性模型:
Y=XB+ε,E(Vec(ε))=0,Cov(Vec(ε))=ΔΣ.(1)
其中,B是p×q的未知回歸系數矩陣,ε是n×q的隨機誤差矩陣,X為n×p已知設計陣,且rank(X)=p,Δ和Σ分別為已知的q階和n階正定矩陣.
式中Vec(ε)為把ε的列按先后次序排列得到的列向量,ΔΣ表示Δ與Σ的Kronecker乘積,E(#8226;)和Cov(#8226;)分別表示隨機向量的期望與協方差陣,rank(#8226;)表示矩陣的秩.
模型(1)的預測問題就是利用已知觀察值矩陣Y預測未觀察值矩陣
Y0=X0B+ε0.
其中E(Vec(ε0))=0,Cov(Vec(ε0))=ΔΣ0,E(Vec(ε)Vec′(ε0))=0,X0為m×p的已知矩陣,Σ0為已知的m階正定矩陣,ε0是m×q的隨機誤差陣.
針對有偏估計的預測問題,文獻[1]在線性模型(y=Xβ+ε,ε~N(0,σ2Σ))中針對三類特殊的估計量(1=β,2=(X′Σ-1X)-1X′Σ-1y,3=ββ′X′Σ-1yσ2+β′(X′Σ-1X)β),對未知觀察向量y0的最優預測量與經典預測量關于風險函數R()=E(-y0)′A#8226;(-y0)的最優性判別進行了討論,這里矩陣A≥0.而文獻[2]就y0的最優預測量與經典預測量關于離差矩陣M()=E(-y0)(-y0)′的最優性判別進行了討論.
本文在一般多元線性模型中對基于嶺估計的預測量與最優線性無偏預測量的最優性判別進行了討論,得到了基于嶺估計的預測量在矩陣跡意義下優于最優線性無偏預測量的充要條件.
2 嶺型預測與最優線性無偏預測
的最優性判別
記L=(X′Σ-1X)-1X′Σ-1Y,L=X0L,易知L=X0L為Y0的最優線性無偏預測,即有E(L)=B,且Cov(Vec(L))=Δ(X′Σ-1X)-1.
定義1 記k=(X′Σ-1X+kI)-1X′Σ-1Y,k=X0k,則稱k=X0k為Y0的嶺型預測.這里k>0是可選擇的參數,稱為嶺參數或偏參數[3].
易知E(k)=(X′Σ-1X+kI)-1X′Σ-1XB,E(k-Y0)≠0,即k為Y0的有偏預測,且 Cov(Vec(k))=Δ(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1.
定義2 設1、2為Y0的兩個預測量,RT(,Y0)trE(-Y0)′(-Y0),若它們滿足:
RT(1,Y0)-RT(2,Y0)≥0,
則稱預測量2關于RT(#8226;)優于預測量1,或簡稱為RT(#8226;)準則[4].
引理1 設M≥0,N≥0,則M≥Nμ(N)μ(M),λ1(NM-)≤1.其中λ1(NM-)與M-的選擇無關[5].
引理2 設Σ是n階正定陣,Q是n×m的矩陣,則
Q′Σ-1Q≤IQQ′≤Σ.
證 若Q′Σ-1Q≤I則λ1(Q′Σ-1Q)≤1λ1(Σ-1QQ′)≤1λ1(Σ-1QQ′Σ-1Σ)≤1,又μ(Σ-1QQ′Σ-1)μ(Σ-1),所以有:
Σ-1QQ′Σ-1≤Σ-1QQ′≤Σ.
若QQ′≤Σ,則Σ-1QQ′Σ-1≤Σ-1λ1(Σ-1QQ′Σ-1Σ)≤1λ1(Σ-1QQ′)≤1λ1(Q′Σ-1#8226;Q)≤1,又μ(Q′Σ-1Q)μ(I),所以有
Q′Σ-1Q≤I.
引理證畢.
經 濟 數 學第 28卷第1期黃介武:多元線性模型中兩類預測的最優性判別
定理1 Y0的嶺型預測k關于RT(#8226;)準則優于它的最優線性無偏預測L,即RT(L,Y0)-RT(k,Y0)≥0的一個充要條件是:
BB′≤tr(Δ)(2kI+(X′Σ-1X)-1).
證 因RT(L,Y0)=trE(X0L-Y0)′(X0L-Y0),由E(X0L-Y0)=0,
Cov(Vec(X0L-Y0))=ΔX0(X′Σ-1X)-1X′0
+ΔΣ0,
通過計算可知:
RT(L,Y0)=tr(X0(X′Σ-1X)[-1X′0)tr(Δ)+
tr(Σ0)tr(Δ) .
由E(X0k)=X0(X′Σ-1X+kI)-1X′Σ-1XB,
Cov(Vec(X0k-Y0))=
ΔX0(X′Σ-1X+
kI)-1X′Σ-1X(X′Σ-1X+kI)-1X′0+ΔΣ0,
E(X0k-Y0)=-kX0(X′Σ-1X+kI)-1B計算可得
RT(k,Y0)=tr(k2X0(X′Σ-1X+kI)-1#8226;
BB′(X′Σ-1X+kI)-1X′0)+tr(X0(X′Σ-1X+
kI)-1X′Σ-1X(X′Σ-1X+kI)-1X′0)tr(Δ)+
tr(Σ0)tr(Δ) ,
RT(k,Y0)≤RT(L,Y0)
tr(k2X0(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1X′0)
≤[tr(X0(X′Σ-1X)-1X′0)-tr(X0(X′Σ-1X+
kI)-1X′Σ-1X(X′Σ-1X+
kI)-1X′0)]tr(Δ).(2)
因為
X′Σ-1X+kI>X′Σ-1X,
所以
(X′Σ-1X+kI)-1(X′Σ-1X+kI)(X′Σ-1X+kI)-1
>(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1.
而
(X′Σ-1X+kI)-1<(X′Σ-1X)-1.
所以
(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1<
(X′Σ-1X)-1X0(X′Σ-1X+kI)-1#8226;
X′Σ-1X(X′Σ-1X+kI)-1X′0≤
X0(X′Σ-1X)-1X′0.
當k2(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1≤
(X′Σ-1X)tr(Δ)-(X′Σ-1X+kI)-1X′Σ-1
X(X′Σ-1X+kI)-1tr(Δ).
必有
k2X0(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1X′0≤
X0(X′Σ-1X)X′0tr(Δ)-X0(X′Σ-1X+kI)-1#8226;
X′Σ-1X(X′Σ-1X+kI)-1X′0tr(Δ).
即式(2)一定成立.而
k2(X′Σ-1X+kI)-1B′(X′Σ-1X+kI)-1≤
(X′Σ-1X)-1tr(Δ)-(X′Σ-1X+kI)-1#8226;
X′Σ-1X(X′Σ-1X+kI)-1tr(Δ)BB′≤
tr(Δ)(2kI+(X′Σ-1X)-1)B′X′Σ-1XB≤tr(Δ)I
λ1(B′X′Σ-1XB)≤tr(Δ).
定理證畢.
推論1 若λ1(B′X′Σ-1XB)≤tr(Δ),則對一切k>0,在矩陣跡意義下,k優于L.
定義3 設1、2為0的兩個預測量,M(,Y0)E(-Y0)(-Y0)′若它們滿足
M(1,Y0)-M(2,Y0)≥0,
則稱預測量2關于MDE-優于預測量1,或簡稱為MDE-準則.
定理2 RT(1,Y0)-RT(2,Y0)≥0等價于M(1,Y0)-M(2,Y0)≥0.
證 因為RT(,Y0)=trE(-Y0)′A(-Y0),M(,Y0)=E(-Y0)(-Y0)′,
從而
RT(1,Y0)-RT(2-Y0)=trE(1-
Y0)′A(1-Y0)-trE(2-Y0)′A(2-Y0)
=EtrA(1-Y0)(1-Y0)′-EtrA(2-Y0)#8226;
(2-Y0)′=trA[M(1,Y0)-M(2,Y0)]
RT(1,Y0)-RT(2,Y0)≥0.
M(1,Y0)-M(2,Y0)≥0.
定理證畢.此結論說明以上兩種判別準則等價.
定理3 Y0的嶺型預測k關于MDE-準則優于它的最優線性無偏預測L,即M(L,Y0)-M(k,Y0)≥0的一個充分條件是:
BB′≤tr(Δ)(2kI+(X′Σ-1X)-1).參考文獻
[1] Bibbyj Toutenburgh. Prediction and Improved estimation in linear models [M] New York: Wiley, 1977.
[2] C R Rao , H Toutenburg. Prediction and improved estimation in linear models [M].New York: SpringerVerlag, 1995.
[3] Rao Toutenburg.Linear models least square and alternatives[M].New York:SpringerVerlag,1995.
[4] 楊婷,楊虎,張洪陽.基于嶺估計的最優預測與經典預測的最優性判別.重慶大學學報,2002,25(6):56~58.
[5] 喻勝華 何燦芝任意秩多元線性模型中的最優預測 應用數學學報,2001,24(2):227-236.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文