史亞楠
(西北師范大學(xué) 經(jīng)濟(jì)學(xué)院,甘肅 蘭州730070)
我國(guó)28個(gè)省、市、自治區(qū)社會(huì)經(jīng)濟(jì)發(fā)展的多元統(tǒng)計(jì)分析
——基于2012年統(tǒng)計(jì)數(shù)據(jù)
史亞楠
(西北師范大學(xué) 經(jīng)濟(jì)學(xué)院,甘肅 蘭州730070)
通過主成分分析、因子分子對(duì)我國(guó)28個(gè)省、市、自治區(qū)的8項(xiàng)社會(huì)經(jīng)濟(jì)發(fā)展指標(biāo)數(shù)據(jù),旨在提取能近似且具有綜合性解釋社會(huì)經(jīng)濟(jì)發(fā)展的主因子成分,以據(jù)此對(duì)各地區(qū)社會(huì)經(jīng)濟(jì)發(fā)展?fàn)顩r進(jìn)行分類、比較和綜合排序評(píng)價(jià)。
經(jīng)濟(jì)發(fā)展;主成分分析;因子分析;綜合評(píng)價(jià)
本文選取了其中28個(gè)省 (其他三省的數(shù)據(jù)留待判別分析時(shí)使用)的8項(xiàng)指標(biāo)來綜合評(píng)價(jià)各地的經(jīng)濟(jì)發(fā)展?fàn)顩r:GDP(單位:億元)、居民消費(fèi)水平(單位:元)、固定資產(chǎn)投資(單位:億元)、職工平均工資(單位:元)、貨物周轉(zhuǎn)量(單位:元)、居民消費(fèi)價(jià)格指數(shù)(單位:%)、商品零售價(jià)格指數(shù)(單位:%)、工業(yè)總產(chǎn)值(單位:億元)。為了保證分析結(jié)果的有效性,需要將量綱不同的各指標(biāo)值標(biāo)準(zhǔn)化。
因子分析的重要前提是要求原始變量具有較強(qiáng)的相關(guān)性。經(jīng)過計(jì)算相關(guān)系數(shù)矩陣后得得出,本文所選取的八個(gè)變量之間存在顯著的相關(guān)性,且通過了檢驗(yàn),可以進(jìn)行主成分分析和因子分析。
為了保證分析結(jié)果的有效性,在這里運(yùn)用巴特利特球體檢驗(yàn) (Bartlett’s test of sphericity)對(duì)所選指標(biāo)進(jìn)行再次檢驗(yàn)。由檢驗(yàn)結(jié)果可知,統(tǒng)計(jì)量的值比較大,為175.569,其對(duì)應(yīng)的伴隨概率值小于預(yù)先給定的顯著性水平(α=0.05)。所以認(rèn)為與原始變量之間存在相關(guān)性,數(shù)據(jù)適合做因子分析。
一般而言,當(dāng)分析中所選擇的變量具有不同的計(jì)量單位,或變量水平差異很大時(shí),應(yīng)該選擇基于相關(guān)系數(shù)矩陣的主成分分析。否則,基于協(xié)方差陣作主成分分析效果可能更好。本文選擇用相關(guān)陣作分析。
做出變量共同度,從表中可以看出,除貨物周轉(zhuǎn)量和居民消費(fèi)價(jià)格指數(shù)的共同度較低外,其余指標(biāo)的共同度都大于0.85,表明提取的主成分對(duì)每個(gè)變量的解釋程度都較高。利用相關(guān)陣求得的特征根及對(duì)應(yīng)標(biāo)準(zhǔn)化特征向量如表1所示。

表1:總方差解釋(Total Variance Explained)
由表1可以看出,SPSS提取了三個(gè)主成分,其特征根的值均大于1。第一個(gè)主成分的特征根為3.852,方差貢獻(xiàn)率為48.149%,第二個(gè)主成分的特征根為1.377,方差貢獻(xiàn)率為17.212%,第三個(gè)主成分的特征根為1.336,方差貢獻(xiàn)率為16.696%,三個(gè)主成分的累計(jì)方差達(dá)到82.058%,即三個(gè)主成分共解釋了總變異的82.058%,進(jìn)一步說明提取的三個(gè)主成分是比較合適的。
由碎石圖選擇主成分也可得到相同的結(jié)果。碎石圖是以主成分為橫坐標(biāo),特征根為縱坐標(biāo)的圖形。根據(jù)本文所選數(shù)據(jù)做出的碎石圖如圖1所示。

圖1
實(shí)際上,碎石圖就是按特征根大小排列的主成分折線圖。圖1在第四個(gè)特征根處變得比較平緩,表明可以提取三個(gè)主成分。
因子載荷矩陣中的數(shù)值是主成分與原始變量的相關(guān)系數(shù),絕對(duì)值的大小代表了主成分與原始變量的相關(guān)程度,據(jù)此可以看出每一主成分所代表的原始變量的信息。提取的主成分在變量之間的載荷有時(shí)相差不大,所以無法明確解釋各個(gè)主成分所代表的信息,也就無法進(jìn)行因子命名。因此,必須進(jìn)行因子旋轉(zhuǎn)。

表2:旋轉(zhuǎn)后的總方差解釋
由表2可以發(fā)現(xiàn):前三個(gè)公因子的累計(jì)貢獻(xiàn)率相同(均為82.058%),但每個(gè)公因子的特征根發(fā)生了變化,其貢獻(xiàn)率也發(fā)生了變化。由此看來,因子旋轉(zhuǎn)相當(dāng)于在確定公因子數(shù)目的前提下,將共同的累計(jì)貢獻(xiàn)率在各個(gè)公因子上重新分配。

表3:旋轉(zhuǎn)后的因子載荷矩陣
由表3可以看出,因子1在GDP、固定資產(chǎn)投資、工業(yè)總產(chǎn)值、貨物周轉(zhuǎn)量這四個(gè)變量上有較大載荷,所以因子1主要反映了這四個(gè)變量的信息,可命名為“經(jīng)濟(jì)發(fā)展總量因子”;因子2在居民消費(fèi)水平和職工平均工資上有較大載荷,可命名為“消費(fèi)因子”;因子3在居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)上有較大載荷,可命名為“價(jià)格因子”。
運(yùn)用SPSS得出因子得分系數(shù)矩陣后,將系數(shù)代入因子得分函數(shù),所以綜合指標(biāo)體系的因子得分函數(shù)為:

運(yùn)用SPSS得到了“fac1_1”、“fac2_1”、“fac3_1”三列數(shù)據(jù),即為因子得分值,將其儲(chǔ)存,運(yùn)用在后邊的綜合比較排序中。
表4為所選取的28個(gè)省、市、自治區(qū)的因子得分排名情況。
第一主因子(即經(jīng)濟(jì)發(fā)展總量因子)得分較高的省市主要有:廣東、江蘇、山東、浙江、上海、河南、遼寧、河北、湖北、湖南。從這項(xiàng)結(jié)果,我們不難得出以上這些省市之所以在第一主因子中排到較為靠前的位置,一方面是由于其經(jīng)濟(jì)實(shí)力本身較強(qiáng),但另一方面也和其地域大小有關(guān)。比如,上海在這項(xiàng)因子中并未排得十分靠前,北京甚至不在此列,其原因在很大程度上是由于盡管北京、上海發(fā)展速度驚人,但其畢竟只是城市,從地域廣闊程度上講要大大小于其他某些省份,因此在總量上也要處于劣勢(shì)。

表4:各省、市、自治區(qū)的因子得分排名
第二主因子(即消費(fèi)因子)能更為客觀地反映經(jīng)濟(jì)發(fā)展,其中得分較高的省市有:北京、上海、天津、浙江、廣東、江蘇。職工平均工資和居民消費(fèi)水平從側(cè)面反映了人民生活水平的高低,但是其必須與物價(jià)水平高低相聯(lián)系,否則也不能解釋經(jīng)濟(jì)運(yùn)行的真實(shí)狀況。由于此項(xiàng)因子去除了地域大小的影響,具體到每個(gè)居民身上,因此較為公平,也能提供更為清晰的認(rèn)識(shí)。
第三主因子(即價(jià)格因子)得分較高的省市主要有:北京、天津、河北、山西、吉林、山東、河南、上海、四川、寧夏。這項(xiàng)因子可以在一定程度上反映各個(gè)省市的物價(jià)情況,在價(jià)格因子的得分上排名較為靠前的省市基本上在綜合因子得分上排名也較為靠前,但同樣可以看到在近年來的經(jīng)濟(jì)發(fā)展較有起色的地區(qū),如寧夏,它們的經(jīng)濟(jì)發(fā)展綜合得分并不十分靠前,均居全國(guó)平均水平之下,但是物價(jià)指數(shù)都比較高,在一定程度上也說明這些地區(qū)的居民生活水平有待提高。
[1]汪冬華.多元統(tǒng)計(jì)分析與SPSS應(yīng)用(第二版)[M].華東理工大學(xué)出版社,2011,(6).
[2]Wolfgang Hardle,Leopold Simar.應(yīng)用多元統(tǒng)計(jì)分析(第二版)[M],北京大學(xué)出版社,2011,(1).
[3]陳勝可.SPSS統(tǒng)計(jì)分析[M],清華大學(xué)出版社,2010,(8).
[4]馮燕,張梅青.我國(guó)各省(市、自治區(qū))區(qū)域競(jìng)爭(zhēng)力的多元統(tǒng)計(jì)分析[J].2007,(6).
[5]何雄浪.我國(guó)地區(qū)經(jīng)濟(jì)差異的實(shí)證分析[J].2004,(11).
湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào)·人文社科版2014年8期