蘇光輝
(中國人民大學,北京 100872)
河北省地處華北平原,環繞京津,屬環渤海經濟圈。河北省面積遼闊,省內地形多樣,是中國唯一兼有高原、山地、丘陵、平原、湖泊和海濱的省份。省內縣域經濟發展多元,水平不一。根據經濟發展水平對河北省縣域地區進行分類,對于理解河北縣域經濟、給出相應的政策建議、推動科學決策,具有重要意義。
文章基于《中國縣域統計年鑒2020》,將河北省縣域數據進行整理,挑選出10個經濟社會發展指標,分別是戶籍人口、第二產業從業人員、第三產業從業人員、地區生產總值、第一產業增加值、第二產業增加值、一般公共預算收入、一般公共預算支出、居民儲蓄存款余額、年末金融機構各項貸款余額。刪除含有缺失值的樣本,共整理出94個區、縣和縣級市樣本,基于此數據進行分析。
根據樣本數據可以計算出描述河北縣域經濟總體特征的統計量,如表1所示。
從總體數據的描述性統計表格及各指標箱線圖(由于篇幅有限且與表1所表達信息有部分重復,文章不做展示)可知,河北省縣域經濟發展各指標不平衡現象較為明顯。戶籍人口中位數小于均值,而最大值遠大于均值,說明人口分布不均勻。第二產業從業人員、第三產業從業人員數據分布受極端值影響較大,最大值分別是最小值的28倍和15.5倍,說明有些地區第二、三產業發達,人口分布集中,有些地區較為落后,人口稀疏。地區生產總值,最大值是最小值的23倍,一般公共預算收入指標最大值與最小值之比達到31倍,而第二產業增加值這一指標的最值之比更是達到了驚人的近43倍,可見內部區域發展不平衡之大。其他各指標最大值與最小值的差距基本都在10倍以上。各指標中位數均小于均值,受到極端值的影響,數據均呈現不同程度的右偏。最大值與最小值之比、最大值與均值之比均呈現出明顯的不平衡性,由此可見,對河北縣域經濟發展狀況進行分類評估,從而因地制宜提出政策建議很有必要。下面采用系統聚類的方式對河北縣域進行分類。
表1 河北省縣域經濟的總體特征
總體特征 戶籍人口/人第二產業從業人員/人第三產業從業人員/人地區生產總值/萬元第一產業增加值/萬元第二產業增加值/萬元一般公共預算收入/萬元一般公共預算支出/萬元居民儲蓄存款余額/萬元年末金融機構各項貸款余額/萬元計數 94949494949494949494均值 488241.0696884.7878405.971897685.7229297.9868879.89103233.57300435.491934984.71142819.8標準差 204606.3158115.8947416.051784444.1143655.071102058.2104428.98141124.91178199.3757593.54最小值 1772461426017046418090586791377901950311917053807129858025%分位數 341746.562548.7547312804523.5131438.5289383.544762.75206855.251103010.8623521.550%分位數 4453548542466562.5120459919211446228068052.52564161644594957612.575%分位數 591653.2511395096034.252165390280503941415.75115613346783.752346897.31227827.3最大值 12378314003622644509653637754411591573861018389082061827884131909最大值/均值(倍數) 2.54.13.45.13.36.85.933.23.6最大值/中位數(倍數) 2.84.7483.912.893.53.84.3最大值/最小值(倍數) 728.115.523.112.942.931.37.511.513.8
聚類分析,就是將研究對象按照某種標準分成若干類。聚類時,可以按照變量對觀測值進行聚類,稱為Q型聚類;也可以按照觀測值對變量進行聚類,稱為R型聚類。聚類分析方法多樣,有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、K均值聚類法等。文章采用Q型系統聚類法進行分析。
系統聚類法的基本思想是首先把所有的樣品或者變量(指標)看成n
類(一種樣品或是變量/指標即為一類),隨后將這n
類中性質、屬性等相似程度較高的兩類合成新的一類,這樣就會得到n
-1類,再從這n
-1類按上述依據找出兩類合成一類,就可以得到n
-2類,如此進行下去每次都會減少一類,進行到最后所有的會在一類,再把上述合成的過程畫成圖(稱為譜系圖),根據自身需要決定分多少類。系統聚類法是從多到少的聚類方法,并類過程中的關鍵是相似程度最高的優先并為一類。相似程度通常用距離衡量,分為樣品間相似度與類間相似度的度量。樣品間相似度的度量,計算距離的方法有歐氏距離、絕對距離、切氏距離、馬氏距離、蘭氏距離等。文章采用歐氏距離度量。兩類間的相似程度度量的方法有最短距離法、最長距離法、中間距離法、重心法、離差平方和法(瓦爾德法)等。文章使用的是社會科學常用的離差平方和法。
由于各指標數值差別較大,單位不一,為統一量綱與量級,首先采用極差標準化方法對數據進行標準化,得到無量綱化的數據。然后使用SPSS導入無量綱化的數據,點擊分析→分類→系統聚類,將10個標準化指標數據選為變量,將地區選為個案標注依據。聚類方法選擇瓦爾德法,度量標準為平方歐氏距離,圖類型選擇譜系圖。
由聚類譜系圖可知,將各地區經濟發展水平分為四類較為合理,根據譜系圖整理出分類表格,如表2所示。
表2 河北省縣域經濟的聚類結果
類別 區縣個數 區縣名稱16 藁城區,豐南區,豐潤區,遷安市,武安市,任丘市218鹿泉區,正定縣,辛集市,灤南縣,樂亭縣,玉田縣,遵化市,灤州市,昌黎縣,永年區,魏縣,寧晉縣,徐水區,定州市,滄縣,泊頭市,黃驊市,河間市338欒城區,行唐縣,平山縣,元氏縣,趙縣,遷西縣,盧龍縣,肥鄉區,臨漳縣,成安縣,磁縣,曲周縣,邢臺縣,隆堯縣,南和,威縣,清河縣,南宮市,沙河市,滿城區,清苑區,定興縣,唐縣,安新縣,易縣,曲陽縣,蠡縣,安國市,青縣,鹽山縣,肅寧縣,獻縣,冀州區,棗強縣,故城縣,景縣,阜城縣,深州市432井陘縣,靈壽縣,高邑縣,深澤縣,贊皇縣,撫寧區,邱縣,雞澤縣,廣平縣,館陶縣,臨城縣,內丘縣,柏鄉縣,任縣,巨鹿縣,新河縣,廣宗縣,平鄉縣,臨西縣,淶水縣,高陽縣,容城縣,望都縣,順平縣,博野縣,東光縣,海興縣,吳橋縣,孟村回族自治縣,武邑縣,武強縣,饒陽縣
由聚類結果,可以計算出各類別下各個評價指標的平均值及各類各指標的數值區間,如表3、表4所示:
表3 各類別區域下的指標均值
系統聚類結果 戶籍人口/人第二產業從業人員/人第三產業從業人員/人地區生產總值/萬元第一產業增加值/萬元第二產業增加值/萬元一般公共預算收入/萬元一般公共預算支出/萬元居民儲蓄存款余額/萬元年末金融機構各項貸款余額/萬元1774829.3181940166086.27264276312064.54406297429836.2604713.3491775729400742703608.5158899.7121532.23221519405461.21409751162398.1439079.2304306818307993498575.889541.6173369.921365807204145.355615574787.45280488.11700167994079.44301089.154773.5343687.75778400.3144556272735.242495.31189083.81031264595475.9全省平均值 488241.0696884.7878405.971897685.7229297.9868879.89103233.57300435.491934984.71142819.8
表4 各類別區域下的指標數值區間
地區類別戶籍人口/人第二產業從業人員/人第三產業從業人員/人地區生產總值/萬元第一產業增加值/萬元第二產業增加值/萬元一般公共預算收入/萬元一般公共預算支出/萬元居民儲蓄存款余額/萬元年末金融機構各項貸款余額/萬元1536928~861593121552~227160121090~2173516042175~9653637121034~4107323238232~5915738269574~610183432735~8223783117217~61827881680777~41319092441266~123783166147~40036265848~2644501820277~5032896154516~754411549619~296713386420~290581302751~8908201742549~43968181095857~29263433345375~75620045507~13575237055~123702584845~385047158679~459445185944~205708628768~172105211743~409573901742~2516591465873~23207644177246~43141614260~9435217046~94391418090~166142858702~304143137790~56126019503~76629119170~256196538071~1974417298580~1189997
第一類地區特點:數量最少,僅占全省統計區縣的6%,卻占到所有地區生產總值的24%,接近1/4。此類別基本都是經濟發達地級市的區和縣級市,各個評價指標相較于其他類別的地區均優勢明顯。境內以平原為主,靠近經濟發達市,交通區位優勢明顯,要么境內有鐵路站點,要么有機場,要么處于沿海港口。人口較多,且第二、三產業發達,從業人口占比較大,財政收入支出均較高,金融機構各項貸款余額、居民平均儲蓄存款余額遠高于其他類別的地區。屬于省內較發達的區縣。
第二類地區特點:數量較少,約占全省統計區縣的19%,地區生產總值占比為33%,主要為大城市周邊區縣和地級市,緊鄰京津及石家莊等發達區域,主要位于平原地區,第一產業發達,第二、三產業相對發達,從業人口較多,人口相對密集,比第一類地區人口要多,經濟發展水平總體上屬于稍遜色于第一類地區,部分指標與第一類地區相差不大,經濟發展水平遠超全省平均發展水平,遠勝于第三、四類地區,屬于省內相對發達的區縣。
第三類地區特點:數量最多,約占40%。全省2/5的區縣均屬于此類型,各市均有分布。多數在地理上屬于發達城市中心與第四類不發達地區的過渡地區,整體區域面積廣闊,既有以山區為主的地區又有以平原為主的地區,平均人口相對較多,但比第二類人口少,遠多于第四類,總體經濟發展水平一般。第三類地區各項評價指標基本上都接近全省平均值,體現出一般性,基本上代表了省內大多數區縣的發展水平,屬于相對不發達的區縣。
第四類地區特點:數量較多,約占34%。境內多山區,平原較少,交通基礎設施較差,遠離城市核心區,也不屬于沿海地區,基本上是中心城市的邊緣區縣。經濟較為落后,人口遠少于其他三類地區,一、二、三產業均較其他類別地區落后,居民儲蓄存款余額較低。各個經濟評價指標數值普遍比其他地區同類指標低,屬于省內相對落后地區。
河北四類區縣各經濟發展評價指標呈階梯性趨勢,第一類地區最高,第二類、第三類次之,第四類地區最低。從各類地區數量的占比可知,第一、二類較發達區縣數量僅占全省區縣的1/4,其余3/4的廣大地區都屬于相對不發達區域,總體發展水平有待提高。區域發展地區不平衡較為嚴重,東部沿海地區、京津附近平原地區的區縣發展較好,其他廣大地區仍有很大的發展潛力,山區發展較為落后。數量最多的第三類地區,處在廣大的平原地區,但發展水平相對不高,不少地區與第一、二類地區有較大差距。與此同時,第三類地區的發展潛力巨大。一方面,此類地區并不集中,而是分散圍繞在北京、天津、唐山、石家莊、保定等大城市核心區周邊,且平原面積廣闊,交通便利,資源豐富;另一方面,第三類地區數量較多,內部差異較大,許多地區的經濟發展指標接近第二類地區,擁有向第二類地區發展的趨勢。
總體來講,河北省縣域經濟少數地區發展較好,多數地區經濟發展水平相對不高。第三類地區數量眾多且潛力巨大,應努力發展第三類地區,增加第二類地區的數量,縮小地區發展差距。