劉彥慧LIU Yan-hui
(黑龍江科技大學,哈爾濱 150022)
(Heilongjiang University of Science and Technology,Harbin 150022,China)
消費是拉動經濟增長的主要因素之一,消費是國民經濟運行的關鍵因素之一,消費對社會穩定和經濟發展有著重要作用。通過對消費狀況的研究,可以知道我國的經濟成就,也可以了解我國的經濟競爭力。
因子分析是多元統計分析中常用的處理降維的統計方法。方法客觀,評價結果正確。是將具有錯綜復雜關系的變量綜合為數量較少的幾個因子,以再現原始變量與因子之間的關系,主要是通過變量的相關系數矩陣內部結構的研究,找出能控制所有變量的少數幾個隨機變量去描述多個變量之間的相關關系,但是,這少數幾個隨機變量是不可觀測的,通常稱之為因子[1]。然后根據相關性的大小把變量分組,使得同組內的變量之間相關性較高,不同組的變量相關性較低。
1.1 R 型因子的數學模型

且滿足以下條件:①m≤p;
②Cov(F,ε)=0 即F 和ε 是不相關的;
即F1…Fm不相關且方差皆為1。

即ε1,ε2,…,εp不相關,且方差各不相同。
1.2 因子載荷陣及其估計方法
①因子載荷的統計意義。因子載荷aij的統計意義就表示第i 個指標變量和第j 個公共因子的相關系數即表示Xi依賴于Fj的比重。它反映了第i 個指標變量在第j 個公共因子上的相對重要性。
②因子載荷陣的估計方法(主成分法)。設隨機向量X=(X1,X2,…,Xp)′的協方差矩陣為∑,λ1≥λ2≥…≥λp>0為∑的特征根,e1,e2,…,ep是對應的特征向量,則∑可分解為:
上式是公共因子與變量個數一樣多且特殊因子的方差為0 時,因子模型中協方差陣的結構。∑=AA′。
通常應用中總是希望因子的個數小于變量的個數,當最后p-m 個特征根較小時,通常是略去λm+1em+1em+1′+…+λpepep′對∑的貢獻,于是。此時假定了因子模型中特殊因子是不重要的,如果考慮特殊因子以后,協方差陣為:

當∑未知,可用樣本協方差陣S 去代替,要經過標準化處理,則S 與相關陣R 相同。
1.3 因子旋轉
建立因子分析數學模型的目的不僅要找出公共因子以及對變量進行分組,更重要的是要知道每個公共因子的意義,以便對實際問題作出科學的分析和解釋,這時根據因子載荷陣的不唯一性,可對因子載荷陣實行旋轉,使旋轉后的因子載荷陣結構簡化。
數據來源:
本文以2012 年我國31 個省、市、自治區城鎮居民家庭人均消費支出數據為研究對象,這里選取了8 個指標作為反映城鎮居民家庭人均消費支出結構的因素,這8 個指標分別是:


表1 城鎮居民家庭平均每人全年消費性支出(2012 年)[2]
實驗步驟[3]:
3.1 對原始數據進行初始化

表2
3.2 建立變量的相關系數矩陣

表3 Correlation Matrix
3.3 KMO 檢驗

表4 KMO and Bartlett's Test
3.4 求R 的特征值和特征
從表5 看出前2 個特征值的累積貢獻率已經達到83.338%,說明前2 個主成分基本包含了全部指標具有的信息,因此取前2 個特征值,并計算相應的特征向量,得到的前三個主成分為:

表5 Total Variance Explained
第一主成分:F1=0.832X1+0.583X2+0.824X3+0.905X4+0.923X5+0.939X6+0.577X7+0.925X8
第二主成份:F2=-0.426X1+0.670X2+0.008X3-0.110X4-0.244X5-0.089X6+0.710X7-0.048X8
由上式可以看出:在第一主成分中各項指標的系數都較大,且都比較接近,第一主成分反映的原始指標信息比較多,比較平均。在第二主成分中,只有第二項和第七項的系數比較大,這樣不利于對原始指標進行分組,也不利于定義因子。
建立因子載荷陣(表6)。

表6 Component Matrixa
為了能更好地讓主成分全面突出地反映原始信息。我們進行因子旋轉。
3.5 對因子載荷陣實行方差最大旋轉 旋轉后的矩陣如表7 所示。

表7 Rotated Component Matrixa
因而得到旋轉后的主因子表達式為:
第一主因子:F1=0.935X1+0.221X2+0.733X3+0.858X4+0.934X5+0.879X6+0.198X7+0.848X8
第二主因子:F2=-0.007X1+0.861X2+0.376X3+0.307X4+0.195X5+0.341X6+0.893X7+0.371X8
由上式可以看出,經旋轉后得到的主成分能更突出、更全面地反映相應的各個指標的信息。
3.6 將八指標按高載荷分類 將八指標按高載荷分成兩類,并結合專業知識給出各因子的命名,如表8 所示。

表8
在第一因子中,X1、X3、X4、X5、X6、X8六項指標有較大的載荷,這些是從不同方面反映消費支出情況的,因此命名為綜合消費因子。
在第二因子中,X2、X7這兩項有較大的載荷,這些是從醫療保健和衣著兩個方面反映消費狀況的,因此命名為衣著醫療因子。
3.7 計算綜合得分 根據各省市的因子得分計算相應綜合得分,綜合得分的計算公式為(加權系數):

表9
由表9 可知,第一因子得分較高的是上海、北京、天津、廣東、浙江,說明這些地區的消費能力比較強,第二因子得分較高的是北京、上海、浙江,說明這幾個地區的居民在衣著和醫療衛生方面消費較大。排名也比較靠前,綜合得分較高的是上海、北京、廣東、浙江、天津、江蘇等地,綜合得分較低的是西藏、貴州、青海、江西、山西。
根據中國國家統計局的實際結果為:
2012 年全國排名城鎮家庭人均消費支出排序:
上游區(1-10 位):上海、北京、廣東、浙江、江蘇、天津、福建、內蒙古、遼寧、重慶。
中游區(11-20 位):山東、陜西、四川、安徽、吉林、湖南、湖北、海南、廣西、寧夏。
下游區(21-31 位):新疆、云南、河南、黑龍江、甘肅、江西、貴州、甘肅、河北、青海、山西、西藏。
從中可以看出筆者所得到的結果和國家統計局公布的結果基本一致。從中可以看出因子分析方法處理數據的有效性。
城鎮居民的支出同收入相聯系,有著明顯的地區性,如,北京、天津和東部地區排名較高,西部城鎮排名一般不高。這與我國地區經濟的發展結果基本一致。
第一因子體現的是綜合指標,第二因子體現的是醫療衛生和衣著,但兩類因子在分類上并不明顯。一般來說第一因子大的地區,第二因子得分也是較高的。但本文僅用兩個主因子就得到8 個變量的城鎮家庭人均消費支出分類和排序,說明因子分析方法的正確性和合理性。
[1]余錦華,楊維權.多元統計分析與應用[M].中山大學出版社2006:210-224.
[2]中華人民共和國國家統計局.中國統計年鑒-2013[M].中國統計出版社.
[3]汪東華.多元統計分析與SPSS[M].華東理工大學出版社,2010:187-226.