隨著京津冀一體化進程的不斷推進,以及2022年冬奧會將在河北省張家口舉辦,河北省的經濟發展狀況成為了中央政府和河北省地方政府重要關注的方面,河北省豐富的旅游資源和自然資源,構成其經濟發展的主要來源。作為京津冀協同發展的一員,良好的經濟狀況可以帶動其他兩個城市的發展。為了滿足北京作為國家首都的經濟需求,中央十分關注河北省的發展,加大對河北省經濟的扶持力度,河北省自身也不斷挖掘自身的優勢及潛力使得其整體綜合經濟實力顯著提升。故本文采用因子分析和聚類分析,對河北省2016年11個市的經濟指標進行了研究和分析,并在研究結果的基礎之上提出相關的經濟建議。
1.原理及方法
因子分析法,根據眾多變量的內部關系,通過減少變量的數目,得出較少的并且不相關的綜合因子,表示原始變量[1]。
其模型表達式:


從以上模型表達中可知,該模型有有p個原始變量,m個提取因子,當m<p時。其矩陣表達形式:X=AF+aε
F是公共因子;A為矩陣;ε被稱作特殊因子,用于解釋無法被提取的因子,即殘差[2]。
2.因子分析步驟
(1)確定待分析的原有若干個變量是否適合做因子分析
(2)構造因子變量
(3)利用旋轉方法使因子變量更具有可解釋性
(4)計算因子得分
1.系統聚類的基本原理
聚類分析也被稱為群集分析,根據指標或者樣品的各自特征聚為不同類(簇),將特征相似的指標或樣本分為一類(簇),同一類(簇)內部的樣本具有高的相似度,不同類(簇)之間的樣本具有較高的差異性[3]。
2.系統聚類的基本思想
將n個樣品或變量看成不同的n類,然后將距離接近(針對樣品聚類)或者性質接近(針對變量聚類)的兩類合并為一類,再從著n-1類中找到最接近的兩個類合并,以此類推,直到所有的樣品或變量被合為一類[4]。

圖1 相關系數矩陣
根據指標體系選取所遵循的基本原則,本文選取的指標體系主要有以下特征:
① 反映河北地區經濟發展水平及規模的指標;② 衡量河北地區總體人民生活水平及個體人民生活水平的指標;③ 反映河北地區經濟效率的生產力因素以及該地區的經濟效率、零售額等;④ 反映河北地區經濟增長的指標;⑤ 反映河北地區醫療狀況的指標;⑥ 反映河北地區產業結構水平的指標;
基于上述原則,本文選取指標有:X1:人口;X2:地區生產總值GDP;X3:社會消費品零售總額(億元);X4:固定資產投資(億元);X5:第三產業產值(億元);X6:人均可支配收入(萬元);X7:衛生機構數量;X8:進出口總額(億元)
本文選擇河北省的11個市為樣本城市,分別是石家莊、唐山、邯鄲、保定、滄州、邢臺、廊坊、承德、張家口、衡水、秦皇島。所有的數據均來源于河北省統計局。
1.KMO和Bartlett檢驗
通過SPSS軟件對現有數據進行處理,第一步,通過對指標的相關系數進行的檢驗(如圖1),發現所選取的8個指標之間具有一定的相關關系,可以采用主成分分析。其次,對所選取指標進行KMO和Bartlett檢驗,以便進一步說明所選取的數據適合采用因子分析,圖2為KMO檢驗和Bartlett的檢驗結果,可知KMO為0.570,Bartlett檢驗中Sig值為0.000,表示本文選取的樣本數據服從正態分布,可進一步的分析。
2.主成分提取
圖3和圖4為樣本的特征值及累計方差率和碎石圖,可知在8個樣本特征值中,前兩個因子符合大于1條件,并且兩個因子的累計方差貢獻率為85.868%,故本文選取前兩個因子即可較好地解釋和代替原始變量,同時具有較好的實際意義。

圖2 KMO和Bartlett檢驗

圖3 特征值及累計方差率

圖4 碎石圖
3.公因子載荷情況分析
圖5為旋轉成分矩陣,可知提取出的第一個主成分主要反應人口、地區生產總值、社會消費品零售總額、第三產業產值、進出口總額、固定資產投資額的情況,具體反映了綜合的經濟水平,因此將該主成分因子命名為“綜合經濟水平因子”。第二個主成分因子主要反映人均可支配收入、衛生機構數量的情況,具體反應了居民生活水平質量。因此可以將其命名為“居民生活水平因子”。

圖5 旋轉成分矩陣
4.公因子表達式
由圖6的成分得分系數矩陣,可得各因子的表達式為:
F1=0.79×X1+0.966×X2+0.995×X3+0.968×X4+0.967×X5+0.265×X6+0.17×X7+0.877×X8,
F2=0.554×X1-0.182×X2+0.32×X3-0.91×X4-0.229×X5-0.700×X6+0.463×X7-0.838×X8

圖6 成分得分系數矩陣
由上兩個單因子的因子得分表達式,得出綜合因子的得分值,代表各個市的綜合經濟實力,同時對F1,F2,F綜合分別進行排序(見表1)。

表1 綜合經濟水平因子的得分情況以及排名
表1具體的分析結果為:
①在 F1(綜合經濟水平因子的得分以及排名)上,石家莊的得分高于其他市,作為河北省的省會,有著優質的先天政治和公共設施條件,優先吸引投資,其經濟發展打下了良好基礎,因此經濟發展水平會優于其他市。②在 F2(居民生活水平因子的得分以及排名)上,明顯看到邯鄲和保定的得分較高。F2主要反映人均可支配收入、衛生機構情況,這說明這兩個區域的人民生活水平要優于其他地方。③由 F 綜合(各地區的綜合實力水平得分以及排名)指標可知,河北省11個市級地區之間的差異十分的明顯,區域發展不平衡,石家莊及唐山市的經濟發展程度明顯優于其他市的經濟發展水平,并且數據之間具有較大的差異。其次邯鄲人民生活水平明顯優于其他市。
5.聚類分析
在上文分析的基礎之上,對已選取的指標和其權重進行聚類分析,得到樹狀圖,如圖7所示。

圖7 樹狀圖
通過對河北省11個市級地區的數據指標的因子分析及聚類分析,結合各個地區經濟發展區域的不同,找出各個地區經濟發展差異較大的原因,旨在促進各個地區協同發展,縮小地區發展差異、促進河北省高效的發展提出了相關建議。
通過因子分析的最終得分排名以及聚類分析圖,可以將河北省11個地區分為三類:
(1)石家莊、唐山。
(2)廊坊、秦皇島。
(3)張家口、邯鄲、保定、滄州、邢臺、承德、衡水。
1.石家莊和唐山市的綜合經濟實力排在前兩位,可以看到石家莊不僅是河北省的省會城市,同時也是河北省的經濟中心,拉動著河北省的經濟實力,對河北省整體經濟發展具有很強的影響力。唐山市具有很強的地理優勢,地處華北地區與東北地區的重要地帶,擁有與國際通航的唐山港,同時,具有較高的先天性資源稟賦,使得唐山市的經濟生產總值位于河北省前列,為河北省的經濟發展做出著重大貢獻。作為河北省綜合經濟實力最強的兩個城市,除了發展其自身之外,還需帶動其他市,以發揮各自優勢,促進河北省各市,特別是欠發達的地區的協調發展,共同發展。
2.河北省的綜合經濟實力取得了明顯的進步,但對于河北省內部,有著經濟和社會發展的差異性,一直是阻礙河北省綜合發展的重要問題。落后地區需要給與更多的關注,如給與更多的資金支持、稅收優惠等政策扶持,利用政策優勢吸引人才流入,為地區發展做出貢獻。以便更好的地區間的經濟和社會發展,促進河北省的長治久安。
3.應該加強張家口、邯鄲、保定、滄州、邢臺、承德、衡水的經濟發展和居民生活水平、加強基礎設施建設;加快推進社會事業的發展等。其次應該大力發展張家口地區的經濟,作為舉辦奧運會的城市,應該具備一定的經濟能力,在2022年更好的展現我國風采。