陳炫輪 蔣澤坤

◆摘? 要:本文以31個省份和地區為例,分析了2019年城市居民的消費支出狀況,使用主成分分析和聚類分析的方法,結合SPSS軟件和JMP軟件,對31個省市自治區的消費支出差異情況進行研究,并對其進行分類。結論是地區間經濟發展水平的差異以及地理位置因素的影響導致了我國不同地區城鎮居民消費支出情況的差異性。
◆關鍵詞:主成分分析;消費支出差異性;聚類分析
一、引言
伴隨著我國經濟的高速發展,31個省市、自治區的城市居民的生活水平也在逐步提高,消費水平也在逐步提升,但消費結構也在不斷地改變。此外,由于各省市自治區經濟發展水平各不相同,受地理位置影響,他們的居民消費支出情況也各不相同。正確認識我國31個省市自治區之間居民消費支出的差異情況,并探究其原因,對于提高我國城鎮居民消費水平有著十分深遠的意義。
國內有關城市居民消費支出的研究從未間斷,而主成分分析和聚類分析是本文的主要研究方法。王傳仕等運用主成分分析法對我國城市居民的消費狀況進行了研究,并運用綜合得分進行了排序;朱建軍分析了中國城市居民的消費行為,由此得到城市居民的主要消費傾向,并提出了自己的對策和建議;蘇靜初在調查河南省城市居民的消費行為時,找到了他們的消費熱點和焦點;張月等運用恩格爾指數來表示城市居民的生活水準,并運用聚類分析方法對城市居民的消費構成進行了比較分析,得出了各區域的消費特征。
二、理論基礎
2.1協方差矩陣與相關矩陣
在應用主成份分析法進行實際問題時,一般有兩種方法,一種是先由原變量的協方差矩陣,再協方差矩陣來進行主成分分析;另外一種是從原始變量的相關系數矩陣來進行主成分分析。所以,在實踐中,我們到底應該怎么做?
在通常的情形下,我們會根據原變量的協方差矩陣來進行主成分分析,這是由于原變量的相關系數矩陣等于是將原變量的協方差矩陣進行了歸一化處理,而由相關系數矩陣進行的主成分分析則是對原資料進行歸一化后的數據進行研究,而在這個時候,數據就不再是原來的數據了。在資料的維度和變異值差異很大的情況下,采用基于原變量的相關系數矩陣進行主成分分析。另外,在選擇的主要成份時,基于相關系數矩陣的主成分分析所生成的負荷矩陣與相關矩陣的功能是相同的,只須選擇一個矩陣就可以對其進行說明。
三、實證分析
3.1數據來源與處理
本文收集了31個省市2019年城鎮居民消費支出的8個指標,即X1-X8,食物煙酒、服裝、住房、生活、交通通訊、教育、體育衛生、其他用品和服務。資料來源于《中國統計年鑒2020》。
由于各項數據的差異相對較大,為了便于后續的分析處理,故首先對原始數據進行標準化處理。本文采用標準差標準化方法對原始數據進行處理,操作軟件為SPSS。
3.2相關系數矩陣
在得到了規范化的資料之后,還要對所選取的變量進行相關性檢驗,檢驗所選取的指標是否具有進行主成分分析的前提。通常,在主成分分析中,選擇的各變量間相關性越高,就越適宜進行相關的研究。本文使用SPSS對各個變量進行了相關分析。
結果顯示,除了食品煙酒與醫療保健之間的相關系數僅為0.097以后,大部分變量的相關性都大于0.6。這說明所選擇的指數具有很高的關聯度,符合主成分分析的前提。
3.3主成分結果展示
采用 JMP軟件,對31個省區的8個變量進行了主成分分析。首先求出各個主要成份的特性值和累積貢獻率,見表4。在選擇主成分時,原則上通常采用的是大于1的特征值。前兩種主成分的特征值分別為5.2926和1.1077,都超過1,兩種主要成分的累積貢獻率高達80%,說明前面兩個主要成份包含了31個省市的絕大部分城市居民的消費情況,所以我們可以選擇前面兩個主要成份進行分析。
由主成分的載荷矩陣(參見下表),得出了上述兩個主要成分的表達式:Y[1]=0.7328X[1]+0.5315X[2]+0.9032X[3]+0.8791X[4]+0.9148X[5]+0.8452X[6]+0.6667X[7]+0.9427X[8] (1)
Y[2]=-0.5726X[1]+0.5841X[2]-0.1677X[3]+0.0070X[4]-0.2271X[5]-0.0452X[6]+0.5858X[7]+0.1167X[8] (2)
根據主成分表達式,我們可以給出一個關于兩個主要成分是否與真實的上下文和語義相符的解釋。根據的表達式,的值可以衡量全國31個省份城鎮居民消費水平的高低;根據的表達式,我們可以根據的值來衡量全國31個省份城鎮居民受氣候影響的消費性支出占比的情況,主要影響變量是衣著以及醫療保健。
四、結論及建議
結合主成分分析對全國31個省份城鎮居民消費支出情況分析的結果,我們得到如下結論和建議:
區域的發展水平對居民的消費支出有很大的影響,區域內的經濟發展水平越高,消費支出也就越多,因而總成分的得分也就越高。從總體得分上看,31個省市居民的消費支出呈現出明顯的區域失衡。在東部,居民的消費水平比較高,而在中西部,他們的消費水平比較低。北京市、上海市、天津市、廣東省、浙江省、江蘇省六個省市主要成分的綜合得分最高。由于經濟發展程度比較高,所以他們的消費也比較高。要解決區域發展的不平衡問題,必須在宏觀上調整和調整中西部的經濟發展,提高經濟發展的速度,同時要加強與中西部、東部的合作與交流,以逐漸減少區域間的不平衡。
參考文獻
[1]王傳仕.我國城鎮居民消費水平主成分分析[J].技術經濟,2002(09):40-41.
[2]朱建軍.我國城鎮居民消費結構主成分分析[J].無錫商業職業技術學院學報,2009,9(01):21-22.
[3]蘇靜.河南城鎮居民消費結構的計量分析[J].河南財政稅務高等專科學校學報,2011,25(03):48-51.
[4]張月,張金鳳,王泓娜,關靜.聚類分析在我國城鎮居民消費結構研究中的應用[J].遼寧大學學報(自然科學版 ),2004(01):47-49.
作者簡介
陳炫輪(1997-),男,河南信陽人,碩士研究生,主要研究方向大數據分析。