山東師范大學 田璐
自改革開放以來,中國的高鐵營業里程達到了3.8萬公里,高速公路近15萬公里,都位居世界第一[1]。復興號動車組、港珠澳大橋、北京大興機場等一批新的基建項目,成為靚麗的中國名片。此外,中國也建成了全球最大規模的光纖和移動通信網絡,基本實現了城市光纖到樓到戶,農村寬帶進鄉入村。
首先,基礎設施作為經濟社會發展的必備條件,是一個城市發展的動力,而基礎設施建設滯后則可能成為制約城市發展的因素。其次,基礎設施與城市相輔相成,城市基礎建設是社會經濟活動正常運行的前提,是城市生活及各種活動的基本條件,也是城市競爭力的重要因素[2]。
本次課題研究從城市基礎設施建設出發,對城市給水、城市道路、城市交通、城市能源、城市排水、衛生綠化系統發展水平進行統計分析,并以此對我國31個地區進行聚類分析,使得我國城市基建向良好方向發展,從而促進經濟水平的提高。
為了能夠更好地了解各地區基礎設施建設及發展狀況,筆者選取2020年我國31個地區關于省市基礎建設的數據,這些數據均來自國家統計年鑒[3]。在開始分析之前,為了消除單位和量綱所帶來的影響,先對數據進行標準化處理。處理方法如下:對序列x1,x2,……,xn進行變換:

我們在SPSS中進行相關分析時,選擇皮爾遜相關系數。其取值范圍是[-1,1]。相關系數的絕對值越大,則表明和的相關度越高。
以下分別對城市給水、城市道路、城市交通、城市能源、衛生綠化系統中涉及的變量進行相關性分析,選擇最能代表各個系統的最佳指標變量。
為了了解其發展狀況,我們選取自來水綜合生產能力(單位為萬立方米/日)、人均生活用水(升/日)、城市人口用水普及率(%)三個變量對各地區的城市給水系統進行分析。下述檢驗規定顯著性水平α=0.05.
根據輸出結果,可以得到自來水綜合生產能力和人均生活用水之間相關系數為0.2,且未通過顯著性檢驗,因此將自來水綜合生產能力作為變量x1,人均生活用水作為變量x2。
城市道路建設被稱為城市連接鄉鎮,工業連接農業的重要樞紐,也是城市規劃規范性、科學性、可持續發展性的重要體現方式之一。
我們選擇城市道路總長(公里)、城市道路面積(萬平方米)、城市道路網密度(表示城市建成區或城市規劃區內平均每平方公里城市建設用地上擁有的道路長度,單位為公里/平方公里)、人均道路面積(平方米)作為評價城市道路的指標。
城市道路總長與城市道路網密度、人均道路面積相關程度較低,且未通過顯著性檢驗,但與城市道路面積相關系數為0.987,通過了顯著性檢驗,從現實意義來看,道路面積與道路總長關系密切,因此選擇其中一個變量作為評價指標即可。雖然城市道路網密度與人均道路面積通過了顯著性檢驗,但相關系數為0.41,相關程度不是很高。因此,將城市道路總長、城市道路網密度、人均道路面積分別作為變量x3,x4,x5。
城市交通作為城市基礎設施建設最重要的內容之一,是改變產業布局、推動本地經濟發展、促進人口遷移的主力軍。因此,我們選取公共車輛總數(輛)、公交車營運總長(公里)、每萬人公交車輛數(臺)作為衡量指標。
可以得出,公交車輛總數與公交車運營總長之間高度相關,相關系數為0.944,并且通過了顯著性檢驗。此外,公共車輛總數與每萬人公交車輛數相關系數為0.401,為中度相關,且通過了顯著性檢驗。公交車運營總長與每萬人公交車輛數之間的相關系數為0.359,也通過了顯著性檢驗。因此,我們只要選取其中一個指標進行分析即可,這里將公共車運營總長作為變量x6。
城市能源是一個城市運行的動力,傳統能源有其發展的弊端,污染問題亟待解決,為推進新能源的發展,我們針對城市中人工煤氣供應量(億立方米/年)、液化石油氣供應量(噸/年)等進行研究,將液化石油氣供應量作為自變量x7。
為了更好地了解各個城市排水系統的優劣性,選擇排水管道長度(公里)、排水管網密度(公里/平方公里)為研究對象,進行相關分析。根據輸出結果可以發現,兩者相關系數為0.345,但是未通過顯著性檢驗。則將排水管道長度、排水管網密度作為變量x8,x9。
從數據中可以看出,各大城市的衛生無害化處理率大都達到了96%以上,公共綠地率基本在35%-48%之間,選取污水日處理能力(萬立方米)、城市環衛車輛數(臺)、城市綠地面積(公頃)的數據進行研究。
從輸出結果得到,污水日處理能力和城市綠地面積相關系數為0.962,且通過顯著性檢驗,說明兩者之間高度相關。污水日處理能力、城市綠地面積與城市環衛車輛數相關系數分別為0.886、0.837,都通過了顯著性檢驗。由此得出,三個變量之間相關程度很高,故只需要選取其中一個指標衡量衛生綠化系統即可,則將城市綠地面積作為變量x10。
我們要對城市基礎建設作出整體性評價,需要綜合考慮各個指標,本文將采取主成分分析法分析31個城市的基礎建設水平。
主成分分析法利用原先變量,通過空間投影和線性變換找到一些新的變量,這些新變量稱之為主成分,最后利用主成分對課題進行研究,簡化分析過程,最后得出結果[4]。
聚類分析就是指相似元素的集合,而不同的系統聚類方法是因為定義類與類間的距離方法不同,本文采用離差平方和法,類中各樣品到類重心的平方歐氏距離之和稱為離差平方和。
采用SPSS軟件作為分析工具,對十個變量進行主成分分析,得到了相關系數矩陣、方差貢獻分析表、成分矩陣、成分得分系數矩陣。
由相關系數矩陣可以看出,評價城市基礎建設的十個變量之間存在相關性,例如,x1與x3,x6,x7,x8,x10與之間的相關程度都比較高,適合用主成分分析法。
由方差貢獻分析表可以得到,前三個主成分的累計貢獻率已經達到了82%,因此,只需提取三個主成分就可以概括出絕大部分信息了,分別作為第一主成分、第二主成分、第三主成分,其中對應的特征值分別為。
三個主成分的特征值如下:第一主成分與相關程度較高,第二主成分與、相關性較強,第三主成分與相關性較強。
由成分得分系數矩陣得出主成分表達式如下:

第一主成分對大部分(標準化)變量都有近似相等的正載荷。大的值表示十個變量普遍有大的值,表示基礎設施建設比較全面,因此我們稱第一主成分為(基礎設施)綜合成分。第二主成分在城市道路網密度、排水管網密度上有比較中等的載荷量,在人均生活用水變量上有比較大的負載荷,也就是說,大的y2值意味著x4、x9偏大,x2偏小,說明城市基礎建設比較落后,正在發展階段,稱第二主成分為基礎成分。第三主成分在人均道路面積和城市道路總長上有較大正載荷,在排水管網密度、液化石油氣供應量上有較大負載荷,解釋含義和第二主成分類似,都屬于基礎成分。因此在接下來的關于地區分類中可以僅使用第一和第二主成分。
根據第一主成分和第二主成分得分繪制出散點圖,圖1便可以看成十維變量(標準化)在二維平面上的投影。圖1可以清晰描述各個地區的城市建設水平和劃分。

圖1 前兩個主成分的散點圖及聚類
由圖1可以看出,將各個地區按照第一主成分和第二主成分得分劃分成四類。也可計算各個地區的綜合得分,公式如下:

綜合得分也可以將31個地區分為四類,第一類包括廣東、江蘇、山東、浙江;第二類包括四川、天津、河南、黑龍江、安徽、江西、湖北、福建;第三類包括新疆、河北、湖南、遼寧、陜西、上海、云南、廣西、北京、重慶、山西;第四類包括內蒙古、甘肅、海南、吉林、青海、貴州、寧夏、西藏。
現通過系統聚類法對31個地區進行分類,采用離差平方和法,實際上就是在每一步合并使離差平方和增量達到最小的兩個類。
由聚類結果表將31個城市分為四大類,第一類包括浙江、山東、江蘇、廣東;第二類包括遼寧、吉林、貴州、重慶、上海、北京、西藏、海南、廣西;第三類包括天津、新疆、江西、黑龍江、河南、四川、湖北、安徽、湖南、福建;第四類包括寧夏、內蒙古、河北、青海、陜西、云南、甘肅、山西。
根據以上主成分分析和聚類分析結果來看,利用第一和第二主成分繪制的散點圖與聚類分析得到的結果比較接近,而綜合得分聚類的效果不如其他兩個方法。其一是因為主成分y1,y2,……,ym的線性組合一般沒有意義,其二是因為第一主成分對綜合得分的貢獻率很大,導致綜合得分只是一味地在重復y1的信息,而含有比較少的y2的信息。因此,綜合得分聚類效果不佳。
因此,綜合考慮散點圖和系統聚類分析,將31個地區重新分成四類,第一類包括廣東、江蘇、山東、浙江,這四個地區經濟發展快速,都在東部沿海地段,它們的基礎建設也領先于其他地區,其中用電量一直被視為經濟運行的“風向標”,能在一定程度上反映各地經濟走勢,根據國家電網發布的數據,山東的社會用電量居全國第一,廣東緊隨其后,江蘇位居第三,由此也可看出,這四個地區的經濟發展與基礎建設并駕齊驅。
第二類包括北京、上海、西藏、遼寧、吉林、貴州、重慶七個地區,由于北京、上海、吉林、遼寧、重慶地區基礎設施建設已經較為完善,因此這些地區致力于經濟發展,而西藏和貴州地區,近年來,國家大力投資于其基礎設施建設,“十三五”期間,西藏的城鎮基礎設施建設就交出了新答卷。
第三類包括天津、江西、黑龍江、四川、湖北、安徽、湖南、福建、廣西、海南、河北、內蒙古、黑龍江,這些地區大多分布在中部和北部地區,經濟欠發達,基礎設施建設投入較少。
第四類包括山西、陜西、新疆、河南、甘肅、寧夏、青海地區,這些地區是“西部大開發”重點扶持地區,更注重水資源和道路方面的建設,忽略了經濟發展效益。
首先,我國目前面臨著地區發展不平衡不充分的問題,根據以上聚類結果,可以發現大部分地區經濟與城市基礎建設共同發展,例如廣東、江蘇、浙江、重慶等地區,但也有少部分地區基礎建設落后于經濟發展,例如北京、上海地區。
面對以上分析,給出下列對策和建議:
(1)合理規劃城市建設,加大對于經濟發展薄弱地區的基礎建設投資,帶動本地城市發展。
(2)充分考慮城市地勢地貌,建立特色基礎設施建設,提高城市管理水平。
(3)關注城市環境,做好垃圾分類,提升城市面貌。