郭云飛 肖雅 林紅飛



摘要:本文根據我國31個省市自治區的全面建設小康社會指標體系,利用聚類分析法計算各地級市在綜合指數、社會結構、經濟與技術發展、人口素質、生活質量、法制與治安等子系統上的進行分類。利用聚類分析法對這些地級市進行聚類分析。第一類有三個城市,有北京、上海、天津;第二類有6個省市,有江蘇、山東、遼寧、浙江、廣東、福建;第三類有22個城市,有甘肅、江西、貴州、青海、安徽、廣西、河南等22個城市。最后根據各類區域全面建設小康社會的特點,提出相應的政策建議。
關鍵詞:綜合指數 社會結構 經濟與技術發展 人口素質 生活質量 法制與治安 聚類分析
一、引言
利用全國31個省市自治區各類小康和現代化指數的數據,對地區進行聚類分析。該份數據中包括六類指數,分別是綜合指數、社會結構指數、經濟與技術發展指數、人口素質指數、生活質量指數、法制與法治指數。其中,社會結構指數是由第三產業從業人員比重等五項指標組成,反映了社會化、城市化、非農化、外向型經濟和智力投資等方面;經濟與科技是實現小康和現代化的經濟基礎和知識創新新手段,經濟與技術發展指數是由人均GDP等七項指標組成,反映了綜合經濟的投入產出、就業率、知識創新投入和發明創造能力等方面:文化科技素質是對實現目標起決定作用的,人口素質指數是由人口自然增長率、專業技術人員等六項指標組成;生活質量指數由恩格爾系數等六項指標組成,反應了生活現代化和電氣化等方面;法制與治安是現代化建設的穩定機制,法制與治安指數是由刑事案件、治安案件、律師數和交通事故死亡率四項指標組成,是個逆向指標。
二、原始數據
X1代表綜合指數;X2代表社會結構指數;X3代表經濟與技術發展指數;X4代表人口素質指數;X5代表生活質量指數;X6代表法制與法治指數:
三、聚類分析思想
分析時對樣品即個體以某種相似性為度量標準進行分類的種計量方法。常用的方法是,一是用相似系數,將性質比較相似的個體分為一個類,不太相似的個體分為不同的類;另一個是將每一個樣本看成是空間的一個點,距離近的點分為一個類,距離較遠的點分為不同的類。
系統聚類是聚類分析中應用最廣泛的一種方法。它的基本思想是:首先是將每一個樣品(或指標)各自看成一類,根據樣品(或指標)間的距離,將距離最近的合并為一類,然后考慮合并后的類與其他類之間的距離,再進行合并;重復這過程,直至將所有的樣品合并為類,最后分類結束,得出相應的分類圖表。
本文采用系統聚類法,樣品之間的距離使用的是歐式距離,計算類間的距離采用的是類間鏈接法,得出分類結果。
利用spss層析聚類的Q型聚類對31個省市自治區進行分析。其中,個體距離采用平方歐式距離,類間距離采用組間平均鏈鎖距離,由于數據不存在數量級上的差異,因此無須進行標準化處理。生成的聚類分析樹狀圖如下。
四、分析結果
第一類有三個城市,有北京、上海、天津,其綜合指數、社會結構指數、經濟與技術發展指數、人口發展指數、人口素質指數、生活質量指數均名列三類之首,法制治安指數最低,各項指數都是最優的;第二類有6個省市,有江蘇、山東、遼寧、浙江、廣東、福建,其六個指數均位于第二,各項指數均處于中游水平;第三類有22個城市,有甘肅、江西、貴州、青海、安徽、廣西、河南等22個城市,其法制和治安指數最高,其余各項指數均最低,各項指數均處于下游。