石巖濤
為了實現用SPSS軟件進行單總體均值向量的檢驗的目的,文[1]巧妙地運用了SPSS軟件,成功地實現了對單總體均值向量的假設檢驗。在檢驗中,文[1]用到了SPSS運行后的一個結果,該結果是被稱作F統計量的F值,再通過兩總體均值的比較與單總體均值向量的假設檢驗間的Hotelling T2統計量T2、T1的關系轉換求得T1的值,再利用T2分布的性質實現了均值向量的檢驗。文[1]的方法彌補了不能用SPSS軟件直接做多元均值檢驗的缺憾。然而,均值向量的檢驗是可以通過F-檢驗法來實現的。如果在做均值向量的檢驗時,有一種方法能夠更便捷地利用文[1]中得到的F值,那么,這種方法也更容易得到推廣。
由文[2]、[3]可知,正態總體的多元均值檢驗,是對假設

做檢驗。

即

且:

而在兩總體均值比較的假設檢驗中,若假設兩總體的協方差陣相等,則統計量:

其中,樣本 X、Y皆來自p維正態總體,即X~N(μ1,Σ )、Y~N(μ2,Σ ) ;n1,n2是樣本容量;協方差陣Σ的估計值:

其中,SX、SY為兩樣本的協方差陣;LX、LY是兩樣本離差陣。
當n1=n,?n2=1時,隨機樣本Y就退化成一組觀測,此時,兩總體均值比較的假設檢驗就可視作單總體均值向量的檢驗,即:

而樣本離差陣:

將(5)式代入(4)式有:

將(6)式代入(3)式得:

即:

比較(1)、(7)兩式,可得:

由于在兩總體均值的比較的假設檢驗中,有:

由(8)、(9)兩式及 n1=n,?n2=1的假設前提,有:

將(10)代入(8)式得:

將(11)式代入(2)式得:

由于F2的值是可以把對均值向量的檢驗視作兩總體均值比較的問題時而通過運行SPSS得到,進而通過(12)式求得F1,于是,均值向量的假設檢驗問題便可迎刃而解了。
[例]【4】人的出汗多少與人體內鈉和鉀的含量有一定的關系,今測了20名健康成年女性的出汗多少(x1)、鈉的含量(x2)和鉀的含量(x3),其數據列于表1,假定x=(x1,x2,x3)'服從三元正態分布。試在顯著性水平α=0.05下,檢驗 H0:μ=μ0=(4 ,50,10)',H1:μ≠μ0

表1 成年女性出汗成分數據
解:將表1的觀測數據看作是兩總體均值比較檢驗的樣本X,即設n1=20,對應的群組變量值設為1;設全國平均值 μ0=(1 7.5,?27.5,?5,?35)'為樣本 Y ,即 n2=1 ,且對應的群組變量值設為2。然后,如文[1]那樣,在SPSS17.0中點擊“ Analyze→General Linear Model→Multivariate”,將x1、x2、x3選入“Dependent variebles”,將group選入“fixed factor(s)”中,點擊OK即可得到輸出結果(表2)。

表2 兩總體均值比較檢驗表
在輸出結果中“Multivariate Tests”框中“Hotelling’s Trace”的F統計量的值為0.138,也即F2=0.138,將此F2值代入(12)式,得:

查F分布表知 F0.05(3,?17)=3.20
因為 F1=2.9<3.20=F0.05(3,?17)
所以,在顯著性水平α=0.05情況下,接受原假設H 0。
通過本例可知,新方法對于運用SPSS軟件進行均值向量的檢驗是比較理想的。
[1]程瑩,陳希鎮.巧用SPSS進行均值的假設檢驗[J].統計與決策,2008,(18).
[2]何曉群.多元統計分析(第二版)[M].北京:中國人民大學出版社,2008.
[3]方開泰.實用多元統計分析[M].上海:華東師范大學出版社,1989.
[4]王學民.應用多元分析(第三版)[M].上海:上海財經大學出版社,2009.