郝靜+楊菁蓓+尹子璋

【摘 要】 本文采用2007年我國31省、市、自治區城鎮居民平均每人全年消費性支出數據,包括以下八個變量:X1:平均每人全年總消費支出;X2:平均每人全年食品支出;X3:平均每人全年住房支出;X4:平均每人全年醫療保健支出;X5:平均每人全年教育文化娛樂支出;X6:平均每人全年可支配收入;X7:東部地區虛擬變量:X8:西部地區虛擬變量,其余為中部地區省份。本文通過描述統計大致分析東西部地區的經濟收入與消費水平狀況;利用因子分析方法將具有復雜關系的變量綜合為數量較少的幾個公共因子,并對其進行評價分析。
【關鍵詞】 消費水平 描述統計 因子分析
研究背景
居民平均每人全年的各項支出以及全年可支配收入均有東部地區>中部地區>西部地區,這與我國經濟發展的不平衡狀況相一致。
一、圖示
在東部地區,中部地區,西部地區中分別選擇一個城市,以北京,山西,貴州為例,使
用MATLAB中的 parallelcoords(X),glyphplot(X), andrewsplot(X)命令繪制輪廓圖,蛛網圖以及調和曲線圖如下。
由圖示可以看出,東部地區經濟發展狀況最好,且居民在各個方面的消費支出比例大致
相等,而中西部地區經濟發展狀況偏低,且居民在各個方面的支出情況極端不平衡。
二、因子分析
由所給數據,評價我國各地區消費水平的指標共有6個,現使用因子分析的方法,將這6個變量綜合為更少的幾個公共因子,即根據變量相關性大小將變量分組,把相關性較高的變量歸在同一組中,使不同組的變量相關性較低。
首先,選擇3個公因子,因子分析結果如下:
rownames(X)=X[,1]
fact=factanal(X[2:7],3,scores="Bartlett",rotation="varimax"); fact
由上述結果可知,前兩個公因子的方差貢獻率為83.3%,若以80%為標準,則選擇兩個公因子為好。
現在選擇2個公因子重新進行因子分析:
fact=factanal(X[2:7],2,scores="Bartlett",rotation="varimax"); fact
factanal(x = X[2:7], factors = 2, scores = "Bartlett", rotation ="varimax")
因子模型:
X1*=0.807f1+0.586f2
X2*=0.971f1+0.230f2
X3*=0.580f1+0.658f2
X4*=0.215f1+0.772f2
X5*=0.693f1+0.680f2
X6*=0.792f1+0.573f2
可見,公因子f1在變量X1,X2,X6上的載荷很大,反映了居民總支出與總收入情況,尤其是食品支出情況,公因子f2在變量X3,X4,X5上的載荷很大,反映了居民住房,醫療保健,教育文化的支出情況。
【參考文獻】
李素蘭.數據分析與R軟件.科學出版社.2013.06。
作者簡介:郝靜(1994—),女,漢族,山東煙臺人,中國石油大學(華東)理學院,2013級本科生,數學與應用數學專業 快遞地址:山東省青島市黃島區長江西路66號中國石油大學(華東)電話:18706487297 郵編:266580
楊菁蓓(1995—),女,漢族,河南人,中國石油大學(華東)理學院,2013級本科生,數學與應用數學專業 。