



摘要:本文選取了國家統計局出版的2008年中國統計年鑒中的一組數據,采用了可以大致代表各省市綜合實力狀況的13個指標,然后使用系統聚類的Ward's Method: Ward(最小離差平方和法)的Squared Euclidean distance(歐氏距離的平方)量來對2008年全國主要省市綜合實力狀況主要指標進行聚類分析,確定了全國的4類社會發展區域,并給出了各類發展區域的優勢和特點。再對其中幾個沒有參加聚類分析的省份(甘肅、青海、寧夏、新疆)進行判別分析,并利用判別分析方法對聚類分析的評價結果進行校驗,最終確定全國的4類社會發展區域,希望可以為政府決策部門對社會發展的規劃提供一定的依據。
關鍵詞:主要省份 綜合實力 聚類分析 判別分析
一、引言
本文根據各省的綜合實力發展指標,將全國主要省份綜合實力發展分為4個等級,從而可以為政府決策部門對社會發展的規劃提供一定的依據。日后通過政府政策的調整,各省再發揮各自優勢力量,抓住機遇,社會全面發展和可持續發展能力一定會進一步提高。
而綜合實力發展狀況評價的難點在于反映綜合實力發展的指標眾多,每項指標又會從不同角度反映綜合實力發展狀況。所以,依據它們作綜合評價有一定難度。但我們可以看到,多元統計分析正是將多維因子納入同一體系加以綜合研究的定量化方法,從而很好解決了這一問題。為了更好地分析綜合實力發展狀況,本文對樣品進行了分類。
在多元統計分析中,常常會使用聚類分析和判別分析來解決樣本的分類問題。在事先并不知道應將樣品或指標分為幾類的情況下,可以使用聚類分析根據樣本或指標的相似程度,將樣本或指標歸組分類;而在事先已經建立了樣品分類,需要將新樣本歸入到已知分類的樣本組中時,就可以使用判別分析。
中國作為全世界最大的發展中國家,經過這些年不斷的發展,在整體綜合實力發展上取得了長足的進步。但由于歷史和現實的原因,全國的發展存在地區不均衡狀況。所以,根據社會發展狀況和區域特點,可將全國規劃為4個社會發展圈。
而這種根據區域規劃劃分的社會發展圈,雖對全國各省的社會發展有著重要的意義,但一個不容忽視的問題是:4種社會發展圈內不同的省由于各種原因,其在社會發展上存在不均衡和發展水平不相同的情況。因此,本研究的目的是根據各省的綜合實力發展指標,將全國主要省份綜合實力發展程度分為4個等級,為政府決策部門對今后發展的規劃提供一定的依據。
二、指標體系的選取
文中將根據中國統計年鑒中反映2008年全國主要省市綜合實力發展的主要指標: 人均GDP(X1)、人均新增固定資產(X2)、人均居民消費支出(X3)、人均高等學校數(X4)、人均衛生機構數(X5)、參加城鎮職工基本醫療保險人數與人口數的比例(X6)、人均全社會建設總規模(X7)、城鎮單位就業人員數與人口數的比例(X8)、人財政收入(X9)、人均城市綠地面積(X10)、城鎮居民人均家庭可支配收入(X11)、國際旅游(外匯)人均收入(X12)、教育經費人均情況(X13)等13項主要指標對全國29個省(自治區)和直轄市進行聚類分析和判別分析,并根據分析結果對各省市的綜合實力發展狀況進行研究。
三、聚類分析的具體應用和結果
本文采用系統聚類的Ward’s Method: Ward(最小離差平方和法)的Squared Euclidean distance(歐氏距離的平方)量來對全國各省社會發展主要指標進行聚類分析,使用的是SPSS13.0的Classify->Hierarchical Cluster程序。
需要說明的是,在通常的分析中,由于各個指標的量綱差異,通常需要先使用SPSS的Discriptives Statistics->Discriptives程序將各變量進行量綱標準化處理,然后將處理結果存儲到新的變量中,最后在進行聚類分析時使用標準化后的變量進行聚類分析。具體的指標數據見表1。
分析得到的結果見以下的分類表和龍骨圖:
通過分類表和龍骨圖可以清楚地看到,2008年各省綜合實力發展的層次是:
Ⅰ類區:北京、上海。
其中,北京是全國的政治、經濟、科學文化與國際交往中心,其綜合經濟實力保持在全國前列。第三產業規模也居中國大陸第一。北京還是中國重要的金融中心和商業中心之一,并且作為重要的旅游城市,2008年奧運會的舉辦更是帶動了它的發展。上海是中國第一大城市,交通便利,腹地廣闊,地理位置優越,是一個良好的江海港口。作為中國大陸經濟最發達的城市之一,它是全國最大的商業中心,有著眾多的國際商業組織和跨國公司,諸此種種都帶動著上海的建設發展和居民收入的普遍提高。這兩個直轄市的綜合實力發展情況在全國屬于最高水平。
Ⅱ類區:江蘇、浙江、天津和廣東。
江蘇是中國的經濟大省,全省綜合經濟實力在全國一直處于前列,近年來對外開放也日益擴大。浙江是我國高產綜合性農業區,旅游資源亦非常豐富。天津是華北一大工業城市,油氣、海鹽資源豐富,又有一定的工業技術基礎。而且天津港是中國北方最大的綜合性貿易港口,近年來天津迅猛發展,充分反映了它在濱海新區開發開放強有力的帶動下,經濟發展質量顯著提高,發展速度明顯加快。而廣東改革開放以來創新發展觀念,轉變發展方式,發展迅速,省內有許多規模和效益較好的大型工業企業。總而言之,Ⅱ類區省份的綜合實力水平較高,處于全國的第2類水平。
Ⅲ類區:河北、山西、內蒙古、遼寧、吉林、黑龍江、福建、山東、河南、湖北、湖南、海南、陜西。
Ⅳ類區:安徽、江西、廣西、四川、貴州、云南。
它們中的大部分處于全國的中部地區,經濟欠發達。由于歷史和地理等原因,不僅在2008年,直至現在,這類省份的綜合實力發展水平仍處于全國的比較落后的水平,在以后的發展中需要利用國家西部大開發和開發中部等有利政策,結合自身優勢和特點,提高該類省份的綜合實力發展水平。
四、判別分析的具體應用和結果
聚類分析后,需要再對其中幾個沒有參加聚類分析的省市(自治區)進行判別分析,才能最終確定全省的4類綜合實力發展區域。使用SPSS13. 0的Classify ->Discriminant程序對先前未進行聚類分析的甘肅、青海、寧夏和新疆等省份進行判別分析,以確定這些省份所屬的綜合實力發展區域。
1.判別分析的檢驗結果見表3
檢驗協方差矩陣相等的Box’s M值為70.765,遠遠大于0. 05,因此,顯著性水平0. 05下,認為各類協方差矩陣相等;另外,F檢驗的顯著性概率 ,說明判別是顯著性的,即判錯的可能性很小。
2.判別結果
根據上面的Fisher線形判別函數模型和系數表,然后依據待判區,我們可以得到各類Fisher線形判別的模型。然后依據待判省份的各指標值,利用上面的判別函數得出判別結果見下表4:
從判別結果中可以看出,甘肅、青海、寧夏和新疆都屬于社會發展的Ⅳ類區,這種判別結果與現實生活中這些省份所處的社會地位是大致相符的。這說明我們前面的聚類分析結果是成功的。
五、 結束語
通過上面的聚類分析和判別分析,根據各省市綜合實力發展的主要指標,結合SPSS軟件的應用,我們將2008年全國主要省市的綜合實力發展水平劃分為4類水平:Ⅰ類區、Ⅱ類區、Ⅲ類區和Ⅳ類區。通過分析比較各類省市的綜合實力發展狀況,可以為全國的社會協調發展提供依據。相信通過政府政策的調整,各省市(自治區)發揮各自優勢力量,抓住機遇,它們的經濟發展一定會再上新臺階,質量和水平會明顯提高;民主法制建設會不斷加強;社會全面發展和可持續發展能力會進一步提高;城鄉居民收入會不斷增加,生活質量也將明顯改善。
參考文獻:
[1]國家統計局,中國統計年鑒2006-2008[M].北京:中國統計出版社,2006.
[2]于秀林,任雪松,多元統計分析[M].中國統計出版社,2006.
[3]劉大海,李寧,晁陽. SPSS15.0統計分析從入門到精通[M].清華大學出版社.
[4]潘淑霞,孫王杰,張若東,吳希,數據分析與SPSS軟件應用[J].吉林醫藥學院學報,2005(9).
[5]方開泰,潘恩沛,聚類分析[M].地質