朱薇姍,張 笑
(河北經貿大學,河北 石家莊 050061)
城市的高質量發展可以改善人民的生產、生活狀況,創造優良的宜居環境。2019年山西省人民政府辦公廳印發了 《山西省城市品質提升行動方案(2019—2022年)》,旨在推進山西省城市高質量發展[1]。要了解山西省各地區城市建設與發展現狀,需從多方面進行綜合評價。
關于城市發展的文獻研究視角主要包括兩方面:一是度量城市建設與發展的指標方面,寧越敏和唐禮智[2]探討了城市競爭力的概念并設計了影響城市競爭力的十大指標體系;徐秋云[3]構建了濟寧市城市競爭力的六大指標體系,并利用主成分分析對濟寧市的城市發展進行了綜合評分與評價。二是研究方法方面,張士杰[4]利用主成分分析,對阜陽市城市競爭力進行定量分析,得出阜陽市目前發展存在的問題并提出相應建議;陳智波和尹紅[5]利用聚類分析和主成分分析,對陜西省地級市的城市發展進行了綜合評價并提出相應建議。由文獻分析可知,關于城市建設與發展的研究不少,但關于山西省城市建設與發展的研究少之又少,且大多只以山西省某一個市為例。因此,以山西省的11個主要城市為研究對象,通過主成分分析和聚類分析研究山西省各地區的城市建設與發展很有意義。
本次報告的指標主要通過參考其他文獻選取,最終選取的10個指標如下[5]。
x1常住人口數 (萬人)、x2一般預算收入 (億元)、x3住宅面積 (萬m2)、x4衛生機構數 (個)、x5高速公路 (km)、x6中學個數 (個)、x7地區生產總值 (億元)、x8農林牧漁業總產值 (億元)、x9工業企業單位個數 (個)、x10國內旅游人數 (萬人次)。本文所有數據均來自 《山西統計年鑒2019》[6],為山西省11個市2018年的城市發展主要指標。
主成分分析的基本思想是多個變量之間往往存在一定程度的相關性,可以通過線性變換將原始指標轉換成少數幾個相互獨立且能反映原始數據絕大多數信息的變量,轉換后的變量稱為主成分。基本模型為

式中:F1,F2,…,Fn為提取的n個主成分;bpn為特征向量;N1,N2,…,Np為經過標準化處理后的數據;λ1,λ2,…,λn為特征根。
聚類分析是通過數據建模簡化數據的一種方法。傳統的統計聚類分析包括系統聚類法、分解法、加入法、動態聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。簡單來說就是分析如何對樣品或變量進行量化分類,根據不同的分類對象,可以分為Q型聚類和R型聚類,Q型聚類是對樣本進行分類處理,R型聚類是對變量進行分類處理[7]。
聚類分析依據的基本原則:直接比較樣本中各事物的性質,將性質相近的歸為一類,將性質差別比較大的分在不同類。也就是說,同類事物之間性質差異小,類與類事物之間性質相差較大。
系統聚類的基本思想:將距離相近的樣本或變量先聚成類,距離相遠的后聚成類,一直進行下去,直到每個樣本或變量都聚到合適的類中。
本文主要采用系統聚類法,基本模型如下。
將每個單元看成一類,則單元i與單元j之間的歐幾里得距離為

將距離最近的兩個單元歸為一類,然后通過離差平方和法進行兩個族群間距離的計算,即

由于各指標存在差異,因此在進行主成分分析之前先對數據進行標準化處理,然后用標準化后的數據進行主成分分析。
進行主成分分析之前,先進行KMO檢驗和Bartlett's球形度檢驗,檢驗結果見表1。可以看出,KMO檢驗值為0.649(>0.6),且標準化后的數據顯著性為0(<0.05),因此判斷其是適合做主成分分析的。

表1 KMO檢驗和Bartlett's球形度檢驗
公因子方差表 (見表2)給出了這次分析中從每個原始變量中提取的信息,從中可以看出除了高速公路 (km)信息損失程度略大外,主成分幾乎包含了其余各變量至少90%的信息。

表2 公因子方差
從碎石圖 (見圖1)也可以看出,第一個主成分與第二個主成分,第二個主成分與第三個主成分特征值相差較大,其他特征值差值都較小,因此保留兩個主成分就可以概括絕大部分信息。

圖1 碎石圖
解釋的總方差見表3,從旋轉后的平方和可以看出保留了兩個主成分 (SPSS默認特征值大于1),第一個主成分的特征根λ1=4.193,解釋了總變量的41.931%;第二個主成分的特征根λ2=4.124,解釋了總變量的41.239%,前兩個主成分的累計方差貢獻率達到了83.170%,說明這兩個公因子基本反映了原始變量的絕大部分信息,即這兩個主成分可以代替最初選取的10個衡量山西省建設與發展基本情況的指標,分別記為F1,F2。

表3 解釋的總方差
旋轉后的成分矩陣表見表4,可以看出第一個主成分在 x1,x5,x6,x8,x9,x10上有較大的載荷,第二個主成分在x2,x3,x4和x7上有較大的載荷。

表4 旋轉成分矩陣
表5為成分得分系數矩陣,可以得出兩個主成分的表達式為


表5 成分得分系數矩陣
根據上面得到的主成分的線性方程,將標準化后的數據代入,得到綜合得分與排名,見表6。

表6 綜合得分與排名
在本次運用主成分分析方法對山西省各地區的城市建設與發展進行分析時,最后保留兩個主成分因子。用這兩個主成分因子來代替10個指標進行分析,將標準化后的數據代入所得主成分的線性方程中,得到各城市的綜合得分與排名。綜合得分為正值,說明該城市建設與發展高于平均水平,反之,綜合得分為負值的說明該城市建設與發展低于平均水平。排名由大到小依次為太原、運城、晉中、臨汾、呂梁、長治、大同、忻州、晉城、朔州、陽泉。
運用系統聚類分析方法,在聚類過程中,11個城市都參與了聚類,所以可以進行下一步分析。根據聚類的譜系圖 (見圖2)可以得出,若將樣本聚為4類的話,可以得到最終聚類結果,見表7。

圖2 譜系圖

表7 聚類結果
綜合主成分分析和聚類分析的結果,得到各市綜合得分、排名與聚類情況,見第8頁表8。

表8 綜合得分、排名與聚類情況
本文在對山西省各地區的城市建設與發展狀況進行分析時,采用了主成分分析與聚類分析方法,根據表8各市綜合得分、排名與聚類情況可以得到以下結論。
1)在調研的11個城市中,太原、運城、晉中、臨汾和呂梁的綜合得分是大于0的,說明這些城市的發展水平在平均發展水平之上,其他城市均低于平均發展水平,說明其城市建設與發展狀況與前面的城市相比還有一定差距。
2)太原市作為山西省的省會城市,綜合得分不出意外地排在了第一,與其他城市相比自成一類。運城綜合得分排在第二,也自成一類,可以看出運城與綜合得分第三的晉中綜合得分相差較大,說明運城雖然發展比不上省會城市太原,但是相比其他城市還是拉開了一定差距。
3)晉中綜合得分排在第三,晉中與省會相鄰,所下轄的城市在多個方面都有著不錯的發展。中心城區榆次區已經與太原中心城區相連,城市之間的交往也十分密切。晉中與臨汾、呂梁、長治、大同、忻州和晉城歸為一類,發展處于全省平均發展水平。朔州和陽泉的綜合得分最低,歸為一類。