劉婉琪
(重慶工商大學數學與統計學院,重慶南岸400067)
基于主成分和聚類分析的省際城鎮居民消費結構研究
劉婉琪
(重慶工商大學數學與統計學院,重慶南岸400067)
精準判識省際城鎮居民消費結構發展現狀及空間格局,對于我國擴大內需戰略與區域協調發展有重要意義。結合2013年分地區城鎮居民人均現金消費支出的數據,選取影響居民消費結構的八項指標,利用主成分分析法對各地區綜合得分進行排名,通過聚類分析法研究省際城鎮居民消費結構的區域差異性,結果表明我國31個省區市(不含港澳臺)可分為五類,呈“金字塔”型布局。最后結合分析成果提出相應的對策建議。
城鎮居民;消費結構;主成分分析;聚類分析
消費結構是國民經濟增長的原動力之一,是我國經濟發展路徑由投資刺激向內需驅動轉變的重要戰略問題。“十二五”期間,我國經濟得到了穩步增長,經濟增長伴隨著居民收入的增長,居民收入增加又促使居民消費水平的提升和消費結構的優化,這無疑是中國經濟社會建設的巨大成就。然而,由于要素稟賦、區位特點和國家政策等方面的不平衡,使得我國各地區的經濟發展水平存在著巨大差異。而這種差異在居民消費上表現為消費水平和消費結構的差異,經濟發達地區在居民消費水平和消費結構方面明顯優于落后地區。隨著我國經濟進入新常態,保證居民消費水平和消費結構的健康發展成為“十三五”規劃中的重要內容。
城鎮居民消費結構優化問題,一直以來受到廣大學者的關注,運用的方法也多種多樣,其中主成分分析與聚類分析法研究消費結構得到了廣泛的應用。趙麗棉、黃基廷運用主成分分析法研究了全國各省城鎮居民消費結構,得出各省城鎮居民消費水平與其經濟發達程度存在相關性,沿海地區與內地城鎮居民消費結構有較大差異的結論[1];辛燕基于主成分分析的視角研究我國城鎮居民消費結構,分析出城鎮居民消費的特點[2];楊青運用主成分分析法探討了四川省農村居民消費結構,并提出改善農村居民消費結構、提高農村居民消費水平的建議[3];劉惠敏在聚類分析法的基礎上,通過計算分析不同時期我國城鎮居民消費結構的灰色關聯度得出消費結構的演變規律[4];許國瓊基于聚類方法對我國各省城鎮居民消費結構進行了研究,并結合各類消費結構的特點提出建議[5];王術分別從地區分布和消費結構動態變化兩個方向對我國各省城鎮居民消費結構進行了聚類分析[6];李博、劉韜運用灰色聚類分析法研究了貴州省行政區劃的調整,并提出相應的對策方案[7]。
已有文獻在區域差異、城鄉差異的維度下探索居民消費結構的發展狀況及演變趨勢,并在指標體系和研究方法上為本文提供了牢固的邏輯基礎。本文運用主成分和聚類分析相結合的方法對我國城鎮居民消費結構進行綜合評價,把握主要矛盾中矛盾的主要方面,明確各地區消費結構的特點和影響因素,以便提出能提升我國城鎮居民消費水平和生活質量的建議。
消費結構能反映居民消費偏好、生活質量和地區整體經濟的發展水平。探索城鎮居民消費結構的現狀,最重要的是要結合當今社會實際情況選取有效指標,分析結果能否反映實際情況取決于所選指標是否具有代表性和實際意義。本文根據對文獻的分析研究,結合《中國統計年鑒2014》中“分地區城鎮居民人均現金消費支出(2013年)”的數據,選取了反映居民消費結構的八項指標:食品(X1)、衣著(X2)、居住(X3)、家庭設備及用品(X4)、交通通信(X5)、文教娛樂(X6)、醫療保健(X7)、雜項商品與服務(X8)。為辨析我國城鎮居民消費結構的區域、風俗、偏好等特點,將31個省區市按照東部、中部、西部和東北地區進行分區域處理,具體結果如表1所示。

表1 2013年全國城鎮居民分區域人均現金消費支出(單位:元)
由表1可以看出,東部地區(包括北京、天津、上海、江蘇等地)在這八項消費指標上的均值都超過全國平均水平,特別是在食品、交通通信和文教娛樂方面遙遙領先于中部、西部和東北地區;中部地區(包括山西、安徽、河南等地)在醫療保健方面低于全國平均水平,在雜項商品與服務方面的消費支出也較低;西部地區(包括內蒙古、重慶、四川、西藏等地)在這八項消費指標上的均值都略低于全國平均水平;東北地區(包括遼寧、吉林和黑龍江)在衣著和醫療保健方面的支出都高于東、中、西部地區的平均水平。通過比較各地區八項消費支出的最大值和最小值,可以看出我國31個省區市的消費水平還存在較大差異,兩極分化現象嚴重。
(一)主成分分析法(Principal Component Analysis)
主成分分析是一種分析、簡化數據集的技術,具有減少數據集的維數,同時保持數據集對方差貢獻最
大的特征,這是通過保留低階主成分,忽略高階主成分做到的[8]。主成分分析的基本數學模型表示為:

本文運用八個變量來研究居民消費結構,由于這八個變量之間存在一定的相關性,所以數據之間會有重疊的信息。為了能使用較少變量反映大量信息,并達到降維的目的,可以將八個相關變量進行線性組合,得到一組不相關的主成分Yj(j=1,2,3,…,8),新得到的主成分具有綜合反映這八個指標的能力,且其變異性越大,表明它提供的關于這八個指標的信息就越多。通常情況下,Yj(j=1,2,3,…,8)的變異性用方差來表示。
主成分表達式中變量的系數即單位特征向量,其計算公式為:

(2)式中,aij為成分矩陣中第i行第j列的元素,λj為第j個主成分的特征值。
依據主成分分析原理,以特征值為權重,主成分的綜合得分計算公式為:

(3)式中,λj(j=1,2,3,…,n)為各主成分對應的特征值,n為選取的有效主成分個數。
(二)聚類分析法(Cluster Analysis)
聚類分析是認定變量或者樣本之間存在著不同程度上的相似性,并依據研究對象的個體特征,將那些相似程度較大的變量或者是樣本聚為一類[9]。在統計模型中,自變量間的相關關系會影響模型的準確性和可解釋性,運用聚類分析法來探索全國31個省區市城鎮居民消費結構的地區差異性和相似性,可以很好地解決這個問題。
本文運用各地區城鎮居民消費結構主成分的綜合得分數據,結合歐氏距離作為相似性的度量標準,采用組間平均鏈鎖距離法進行層次聚類分析。其中,歐式距離的計算公式為:

(4)式中,xi和yi分別表示樣本x和y的第i個變量值。
(一)主成分分析
利用SPSS軟件對《中國統計年鑒2014》中“分地區城鎮居民人均現金消費支出(2013年)”的數據進行處理,將相關輸出結果進行整理,如表2至表5所示。
由表2可以看出,除了食品和衣著、醫療保健;衣著和居住、交通通信、文教娛樂;醫療保健和文教娛樂、交通通信、家庭設備及用品之間的相關系數未達到0.50,其余變量之間的相關系數都較大,且居住和交通通信;家庭設備及用品和文教娛樂;交通通信和文教娛樂之間達到0.85,說明這八個變量之間存在一定的相關關系,且都為正相關,適合使用主成分分析法進行降維。

表2 相關系數矩陣
由表3可以看出,Bartlett檢驗統計量的觀測值為224.50,概率p值小于顯著性水平0.05,且KMO檢驗系數為0.83,根據KMO度量標準可知,本文數據均來自多元正態總體,適用于主成分分析。

表3 KMO和Bartlett檢驗

表4 解釋的總方差
由表4可以看出,前三個主成分的累積方差貢獻率達到89.61%,各自對指標變異性的解釋程度分別為68.78%、14.91%和5.91%,且前三個主成分的特征值分別為5.50、1.19和0.47。從第四個主成分開始,其特征值和方差貢獻率的大小有所減少,綜合八項指標信息的能力較低,所以選取前三個主成分進行分析比較合適。

表5 成分載荷和特征向量矩陣
表5中的a1、a2和a3列分別表示第一主成分、第二主成分和第三主成分對八個變量的載荷大小,即與八個指標之間的相關關系。由表5可以看出第一主成分和交通通信、文教娛樂、雜項商品與服務、家庭設備及用品之間的相關性較大,達到0.90以上,為高度正相關;第二主成分和衣著、醫療保健之間的相關性較大且為正相關,但和食品、居住、交通通信、文教娛樂、家庭設備及用品之間呈負相關關系;第三主成分和衣著、居住、醫療保健和家庭設備及用品之間的相關性較大,且和居住、交通通信和醫療保健之間呈負相關關系。根據公式(2)計算得到表5中的t1、t2和t3列,即八個變量對應的特征向量,得出所需主成分的表達式為:

結合SPSS輸出的各主成分得分及(3)式,得到具體的主成分綜合模型表達式為:

由此計算出各地區城鎮居民消費結構的綜合得分,并對其進行排序,如表6所示。

表6 各地區主成分得分及排名
第一主成分的表達式中八個變量的系數符號都為正數,且系數值都相差不大,該主成分可代表當地城鎮居民的整體消費水平,命名為綜合消費成分。生活在相對發達地區的城鎮居民在這八項支出上的現金消費都較高時Y1的值較大,反之現金消費越小,則Y1的值越小。同時,綜合消費成分也表明這八項指標對城鎮居民消費結構都有一定的影響,只是相應的影響程度有差異,但都屬于消費結構的重要組成部分。由表6可以看出,綜合消費成分得分排名前五的地區是上海、北京、廣東、浙江和天津,其中上海和北京得分高達2.50以上,超出其他地區得分較多,說明當地城鎮居民現金消費水平較高,居民生活質量較高。而貴州和西藏兩個地區的得分則排名靠后,說明當地城鎮居民生活水平較我國其他地區有一定的差距,還有很大的提升空間。
第二主成分的表達式中八個變量的系數符號有正有負,系數為正的變量有衣著(X2)、醫療保健(X7)和雜項商品及服務(X8),城鎮居民在這三個方面的現金消費支出較大時,Y2的值就較大,反之則較小。變量的系數絕對值大小表明相應變量對該主成分的影響程度大小,可以看出衣著和醫療保健支出對消費結構的影響程度較大。醫療保健的影響程度較大,顯示出城鎮居民對提升自身身體素質的意識較強,是全民健康發展的體現。家庭設備及用品的影響程度較小,說明隨著當今社會的多樣化發展,居民對家庭設備的需求正逐漸降低。結合表6看出該主成分得分和各地區地理差異有關,可命名為區域消費成分。區域消費成分得分排名靠前的地區是內蒙古、吉林、黑龍江和北京,其中,內蒙古和北京屬于華北地區,吉林和黑龍江屬于東北地區。當地城鎮居民消費結構的變動受衣著的影響較大,正好符合華北和東北兩大區域的氣候特點,夏季氣溫高,冬季氣候寒冷干燥,當地居民對衣著的需求程度較我國其他地區居民高出很多。
第三主成分的表達式中八個變量的系數符號也是有正有負,系數較大且為正的變量有食品(X1)、衣著(X2)和家庭設備及用品(X4)。消費結構隨著各地區城鎮居民的消費偏好而變化,主成分可命名為偏好消費成分。偏好消費成分得分排名前兩名的地區是重慶和西藏,其中,重慶作為我國直轄市之一,經濟發展迅速,結合當地居民生活觀念和生活態度較前衛的特點,其對日常生活質量要求較高,主要體現在食品、衣著和家庭設備及用品消費方面,而西藏地區氣候特點和地理環境的特殊性,造成當地城鎮居民將更多的收入花費在滿足基本的生活上面。
主成分綜合得分排名前三的地區是北京、上海和浙江,這三個省市都屬于我國經濟較發達地區,說明居民消費結構和地區經濟水平有密切關系。地區經濟水平越高,城鎮居民生活質量越高,現金消費支出也相應較高。
(二)聚類分析
利用SPSS軟件對表6中各地區主成分綜合得分數據進行處理,得到聚類分析樹形圖,如圖1所示。依據圖1,若選擇分類數為5,可以得到如表7所示的分類結果。
根據圖1與表7的結果,可以看出我國城鎮居民消費結構的區域等級差異呈“金字塔”型。其中,東部發達地區處于金字塔的塔尖位置,而中西部欠發達地區處于金字塔的底部。

圖1 各地區綜合得分的聚類分析樹形圖

表72013 年我國城鎮居民消費結構分類(不含港澳臺地區)
在此次聚類分析中,北京、上海被歸為第一類,這兩個地區經濟發達,屬于我國的一線城市,當地城鎮居民生活水平都較高;與第一類地區相比,第四類中青海、廣西、貴州、西藏等地的經濟發展水平則較低,當地城鎮居民可支配收入較少,這些因素導致當地居民的消費觀念和消費環境與其他地區的差異,因而其消費結構與第一類地區的差別較大。由此可見,經濟發展水平和消費結構之間存在相關性,經濟發展水平會影響居民的生活方式、消費觀念和環境等,消費結構也會在一定程度上影響經濟的發展趨勢和產業的結構調整。第一類地區中的高消費、高質量生活必定會帶動該區域中相關產業的發展。比如2013年上海的文教娛樂支出位居全國首位,這也促進了上海的教育業、文化業以及娛樂服務業的發展。
第一類地區的文教娛樂和醫療保健支出明顯多于第四類地區,而第四類地區的基本生活支出(食品、衣著和居住支出)則占總消費支出的較大比重。這種現象產生的原因主要是第一類地區居民生活質量較高,當地城鎮居民在滿足了基本生活需求之后,愿意將消費熱點轉向更高的層次(如精神消費等)。
第一、二類地區的八項消費支出都高于其他地區,特別是北京、上海和廣東,其居住消費支出較其他地區高出很多,北上廣地區有優質的經濟基礎和產業基礎,經濟發展迅速,各領域資本投資活躍,就業機會多,成為全國各行業人才的聚集地。內蒙古自治區屬于國家重點扶持地區,擁有豐富的自然資源,畜牧業發達,有眾多的工業基地,這些產業發展帶動了當地整體經濟發展,城鎮居民消費水平較高。第三、四類地區在八項消費領域的支出處于中等水平,經濟水平還有很大的提升空間。第五類地區與前幾類地區的各項支出額都相差甚遠,與第一類地區相比,該類地區居民的消費結構和消費水平更是差距明顯,這說明我國地區經濟發展存在兩極分化現象。
本文選取食品、衣著、居住、家庭設備及用品、交通通信、文教娛樂、醫療保健和雜項商品與服務八項綜合反映消費結構的指標,運用主成分和聚類分析法對我國31個省級行政區(不含港澳臺)城鎮居民消費結構進行綜合評價。共提取三個主成分,分別命名為綜合消費成分、區域消費成分和偏好消費成分,并將31個省區市主成分綜合得分進行排名和聚類分析,結果分為五類。得出的主要結論及啟示如下。
(1)地區居民消費結構與當地經濟發展狀況高度相關。由綜合消費成分看出,排名靠前的都是我國經濟較發達地區,當地城鎮居民收入較高。收入水平是制約居民消費的關鍵因素,結合當今國家經濟形勢,應適當調整收入分配結構,建立居民收入的持續增長機制。長期以來我國居民收入的增長慢于GDP的增長。我國經濟進入新常態,經濟增速放緩。在這樣的背景下,只有合理調節收入的分配結構建立城鎮居民收入的持續增長機制,才能繼續優化我國居民的消費結構。同時,也應當進一步完善社會保障體系,鼓勵保險行業的發展。“十二五”以來,我國城鎮居民的收入水平有了明顯的增長,然而,收入增長所帶來的消費增長卻不明顯。高昂的醫療成本、不斷攀升的房價、收入的不確定性都成了城鎮居民消費增長的阻礙因素,克服這一系列障礙的有效措施是完善的社會保障體系和建立在社會保障體系基礎上的商業保險體系。政府應進一步完善社會保障體系,同時還應當鼓勵民間資本投資保險領域。
(2)不同地區城鎮居民的消費偏好存在差異性。由偏好消費成分看出,發達地區的消費結構更偏向于非物質性消費和服務性消費,部分欠發達地區則更偏向于滿足生活需要的基本消費。為了讓我國各個地區消費結構呈現平衡發展趨勢,政府應加強基礎設施建設,降低居民的交通通信成本。交通通信服務既是居民的消費對象也是重要的生產資料。交通通信服務的水平制約著我國城鎮居民的消費。政府應大力提升公路、鐵路、航空的運營效率。同時,政府還應當適時地放寬民間資本進入通信行業的限制,促使我國的三大通信業務運營商降低服務費用,讓通信服務多樣化發展。
(3)各個地區經濟發展存在兩極分化現象。在聚類結果中,第一和第二類地區均分布在我國東部沿海地區,第三、第四和第五類地區大部分分布在我國中西部地區,表明我國東西部地區的居民消費結構存在明顯的區域差異,西部地區的消費結構和消費水平明顯劣于東部地區。長期以來,不同地區間產業結構的簡單重復現象在我國普遍存在,各個地區的經濟發展仍不平衡。國家應加強西部地區定向財政轉移力度,鼓勵沿海地區對口支援西部大開發,破解當前我國居民消費支出兩極分化格局。不同地區政府之間應相互合作,實現各領域包容性增長,使社會和經濟走可持續發展路線。東部地區應該積極主動地推進產業結構的轉型升級,西部地區應該發揮后發優勢努力縮小與東部地區的差異。地區差異的縮小對促進我國城鎮居民消費結構的升級具有重要意義。
[1]趙麗棉,黃基廷.基于主成分分析法的中國城鎮居民消費結構研究[J].廣西科學,2012(2):121-124.
[2]辛燕.基于主成分分析視角的我國城鎮居民消費結構[J].商業文化,2010(7):167-168.
[3]楊青.基于主成分分析法的四川省農村居民消費結構分析[J].現代商業,2015(23):105-106.
[4]劉惠敏.城鎮居民消費結構演變的聚類分析與灰色預測[J].統計與決策,2009(3):93-95.
[5]許國瓊.基于聚類方法的我國各省市城鎮居民消費結構分析[J].科技風,2009(12):70-71.
[6]王術.基于聚類分析的城鎮居民消費的時域差異分析[J].特區經濟,2013(12):218-219.
[7]李博,劉韜.基于灰色聚類分析的貴州行政區劃調整[J].重慶文理學院學報(社會科學版),2011,30(4):68-71.
[8]彭博,羅澤舉.河南省各地區農業經濟評價——基于聚類和主成分分析[J].重慶工商大學學報(自然科學版),2015,32 (4):91-96.
[9]劉林軍,吳黎軍.基于因子分析與聚類分析的新疆15個城市(地區)產業綜合實力研究[J].重慶工商大學學報(自然科學版),2010,27(6):600-604.
責任編輯:吳強
Study on the Consumption Structure of Chinese Urban Residents Based on the Principal Component and Cluster Analysis
LIU Wanqi
(School of Mathematics and Statistics,Chongqing Technology and Business University,Nan’an Chongqing 400067,China)
Analysis of the development and spatial framework of the consumption structure of urban residents in the provinces is of great significance for the strategy of expanding domestic demand and coordinated development.This paper utilizes the data of consumption per urban residents at provincial level in 2013,selects 8 evaluation indexes of consumption structure,uses the principal component analysis to rank the composite score in different regions,discusses the regional difference of consumption structure of urban residents in China by cluster analysis and divides 31 provinces(except Hong Kong,Macao,Taiwan)into 5 categories with the layout of pyramid type and finally designs corresponding strategies based on the analysis results.
urban residents;consumption structure;principal component analysis;cluster analysis
F063.2
A
1673-8004(2017)02-0133-08
10.19493/j.cnki.issn1673-8004.2017.02.023
2016-05-11
重慶工商大學研究生創新型科研項目“三峽庫區基礎設施投資的減貧效應與益貧效應對策研究”(yjscxx2016-060-01);重慶工商大學研究生創新型科研項目“長江經濟帶霧靄污染的省域異質性與空間溢出效應研究”(yjscxx2016-060-11)。
劉婉琪(1993—),女,重慶九龍坡人,碩士研究生,主要從事宏觀經濟統計研究。