蘇理云,余海琴,郭 雯
(重慶理工大學 理學院,重慶 400054)
近年來,我國人口總量盡管還在不斷上升,但人口出生率在總體上卻不斷下降,人口老齡化問題嚴峻。在此背景下,國家采取了新的鼓勵生育政策,但效果并不明顯。長此以往,人口結構比例的失調將會帶來一系列不良影響,使社會勞動人口的養老負擔加重,進而制約我國經濟的未來發展。因而,調整人口結構比例已成為我國當前的重要工作。
中國著名人口地理學家胡煥庸教授[1]于20世紀30 年代在《中國人口之分布》中用一條簡短的線條描述了中國自然地理、人口地理與經濟地理分布不平衡的特點:從黑龍江省璦琿縣(今黑河)到云南省騰沖縣之間,將中國分為東南、西北2個部分。直線的東南部,土地占全國36%,人口占全國96%;而直線的西北部,土地占全國64%,人口占全國4%。人口的區域差異問題成為關注熱點,眾多學者從空間的角度對數據進行分析,并將其廣泛應用于具有空間異質性的數據之中。例如,蘇理云等[2]在中國人口出生率的空間非均衡性及地域差異一文中指出,中國出生率呈現出由東向西增強的空間非均衡性,空間聚集性顯著,且地域差異顯著,表現為區域內差異大于區域間差異。陳明華等[3]運用泰爾指數分析法測算1995—2011 年中國人口老齡化地區的差異,發現中國人口老齡化具有非均衡空間分布的特征,地區差異明顯且呈現反復波動趨勢;總體上,區域內老齡化差異遠大于區域間差異,老齡化總體差異主要是由區域內差異引起的。區域差異問題不僅廣泛應用于人口社會學[4-7],在醫療衛生[8-11]領域中也大量采用。俞佳立等[12]運用熵權法和可分解泰爾指數法測度發現,中國醫療衛生資源供給水平總體呈上升趨勢,各省份之間的醫療衛生資源供給水平存在差異,且這種差異主要是由四大經濟區域內部差異造成的。趙雪雁等[13]采用GDI、ESDA 等方法分析了我國優質醫療資源的時空差異,并采用地理探測器方法識別影響不同尺度優質資源分布的關鍵因素。
隨著當前人口結構的重大改變,出生率問題已成為社會學關注的重點,而人口出生率的區域差異則成為地理學研究的新熱點。為此,從東、中、西部地域劃分角度研究中國人口出生率的發展趨勢,逐步深入地揭示造成中國人口出生率地域差異的原因。首先,通過地理探測器q 統計發現中國人口出生率存在顯著的空間分層異質性;其次,通過Brown-Mood 中位數檢驗出東、中、西部3 個地域之間的差異;最后,采用層次聚類法進一步分析主要影響各區域內人口出生率差異的省份。
1.1.1 地理探測器
空間自相關性和空間分層異質性是空間現象的2 個主要特征。其中,空間分層異質性是指某一屬性值在不同類型或區域之間存在差異,可用于氣候分帶、土地利用和地理區劃等。地理探測器q 統計可以探測某屬性(Y)的空間分層異質性,即空間各類型之間的整體差異性。地理探測器q統計的表達式[14]為:

式中:h=1,…,L 是變量Y 的分層,即分區;Nh和N 分別為子區域h 的樣本單元數和整個研究區域的樣本單元數;和σ2分別是子區域h 和整個研究區域的Y 的方差。q 的取值范圍為[0,1],值越大則表明Y 的空間分層異質性越明顯。
q 值可以變換為非中心F 分布:


式中:α 是統計量q≥x 的概率。地理探測器q 統計的假設檢驗為:
H0:沒有分層異質性(即分層不顯著)
H1:存在分層異質性(即分層顯著)
在顯著性水平α 給定條件下,若F>Fα(臨界值)或p 值小于α 則拒絕原假設,接受備擇假設。
1.1.2 Brown-Mood 中位數檢驗
Brown-Mood 中位數檢驗[15]的主要思想:將兩樣本混合起來排秩,將其中大于或小于混合樣本中位數mexy的數據個數進行計數,繪制四格表,利用超幾何分布進行檢驗。
對于2 個獨立分布的總體X 和Y,設其分布為X=F1(x),Y=F2(x-μ),中位數分別為mex和mey。假設檢驗為:
H0:mex=mey?H1:mex<mey
在原假設H0成立時,2 組數據有相同的中位數,則2 組數據混合后,混合中位數mexy與mex,mey相等,2 組數據將會均勻分布在混合中位數mexy兩邊。
表1 中A、B、C、D 表示4 個類別的樣本個數,其中A 表示樣本X 中大于中位數mexy的個數,t 表示混合樣本中大于中位數mexy的個數。在給定m、n 和t 時,原假設成立條件下,A 服從超幾何分布A~H(t,m,N),概率公式為:

表1 Brown-Mood 中位數檢驗的列聯表

1.1.3 層次聚類
聚類分析是一種數據歸約技術,可以發現一個數據集中觀測值的子集。其中,最常用的聚類方法是層次聚類和劃分聚類。相對于劃分聚類,層次聚類不需要指定聚類的數量,且對距離度量的選擇不敏感。
層次聚類通過計算不同類別數據點之間相似度來創建一棵有層次的嵌套聚類樹。其基本思想是:首先,將聚類的樣本或變量各自看成一類;然后,確定類與類之間的相似統計量,并選擇最接近的兩類或若干個類合并成一個新類,計算新類與其他各類之間的相似性統計量;再選擇最接近的兩群或若干群合并成一個新類,直到所有樣本或變量都合并成一類為止。層次聚類法常以距離為相似統計量,常用的算法是單聯動、全聯動、平均聯動、質心和Ward 方法。本文中采用平均聯動聚類,它定義了2 個聚類之間的距離,即第1 個聚類中的數據和第2 個聚類中的數據點之間的平均距離。
人口出生率指某地在一個時期之內(通常指一年)出生人數與平均人口之比,反映人口的出生水平或強度,一般用千分數來表示。計算式為:

式中:B 為年內出生人口數;P 為年內平均人口數。
研究對象為除中國港、澳、臺地區的其他31個省份??紤]到數據獲取的可行性與相對完整性,選取考察時期為1979—2019 年。數據來源于中國經濟社會大數據研究平臺和國家統計局的統計數據[16]。
綜合文獻發現,人口出生率具有空間聚集性,不僅有空間同質性,也有空間異質性。
改革開放四十多年來,我國東部地區率先發展,帶動國民經濟發展的同時,也加劇了區域發展差異問題,造成了勞動力、資本等資源加速向經濟發達地區轉移,收入的不平衡也影響了各地區的人口出生率。為更好地分析人口出生率的地域差異,根據經濟發展水平,對除中國港澳臺地區以外的31 省份進行東中西部區域劃分(如表2 所示):

表2 中國東中西部地域劃分
1)東部(east):最早實行沿海開放政策并且經濟發展水平較高的地區。
2)中部(center):經濟次發達地區。
3)西部(west):經濟欠發達地區。
根據表2 的區域劃分可知,中國除港澳臺地區外被劃分為3 個區域,即分層數L=3,每一層(h=1,2,3)的樣本單元數Nh分別為11、8 和12,全區的單元數N 為31。通過地理探測器軟件計算出中國人口出生率自1979 年至2019 年間每5 年之間的地理探測器q 統計值。q 統計值越大表示人口出生率(y)的空間分層異質性越明顯,如表3所示。

表3 1979—2019 年中國人口出生率的q 統計值
在1994—1999 年,中國人口出生率的q 統計值達到最大,且p 值小于顯著水平α=0.05,表明中國人口出生率存在顯著的空間分層異質性,但其他年份的p 值卻不顯著。雖然這樣的p 值在統計中顯然不是一個好的結果,但是現實中,空間分層異質性不能簡單地通過p 值大小來判斷。從表3 各年q 統計值差異變化可以看出,我國人口出生率存在空間分層異質性。自1984 年我國開放部分沿海城市,這部分城市經濟率先發展起來,帶動內地經濟發展的同時,也導致區域發展差異問題加劇,故表3 中q 統計值先迅速增大再緩慢降低,但總體呈增加趨勢。因此,分層對人口出生率分布有所影響,東、中、西部地域之間的人口出生率存在地區差異,但短期變化趨勢并不穩定,呈現反復波動態勢。
由于東部、中部和西部地域之間存在明顯的空間分層異質性,進一步探究各區域間的差異有利于加深對人口出生率的地域差異認識,故采用Brown-Mood 中位數檢驗法分別對東、中、西3 個地域進行兩兩檢驗。采用卡方檢驗對東部、中部與西部的人口出生率進行獨立性檢驗,原假設為2個地域之間相互獨立。
如表4 所示,在顯著水平α=0.05 條件下,卡方檢驗的p 值均大于顯著水平0.05,表明東部、中部和西部的人口出生率之間相互獨立,因此可以進行Brown-Mood 中位數檢驗(表5,圖1)。

表4 卡方檢驗
表5 給出了1979—2019 年東-中部,中-西部和東-西部人口出生率的Brown-Mood 中位數檢驗的p 值。在顯著性水平α=0.05 條件下,若p值大于0.05,則接受原假設,表明2 個地域的人口出生率沒有顯著差異;反之,則不接受原假設,表明兩個地域間的人口出生率存在顯著差異。

表5 Brown-Mood 中位數檢驗

續表(表5)
結合表5 中的p 值數據繪制線形圖(圖1 所示),可以發現,東-西部的人口出生率在1986—2003 年期間存在顯著的地域差異,且呈現短期反復波動的情形,說明東部的年平均人口出生率水平小于西部的年平均人口出生率水平。同理,1994—1996 年中部的年平均人口出生率水平顯著小于西部的年平均人口出生率水平,且中部-西部的Brown-Mood 中位數檢驗p 值在1994—1996年這3 年達到最低??傮w上,區域間人口出生率差異呈現擴大趨勢后逐漸收斂,東-西部和中-西部差異對人口出生率總體差異影響較大。

圖1 Brown-Mood 中位數檢驗結果
為了更全面、準確地探索中國各省人口出生率地域差異及其發展變化規律,采用層次聚類分析方法[17],將各區域人口出生率中具有相似性的省份聚成一類,從而反映區域內各省份之間的內在差異與聯系。
圖2 的聚類分析樹狀圖從下往上展示了各地域省份如何被結合成類。每個省份最初自成一類,然后相距最近的兩類合并,直到所有省份合并成一類。樹的高度代表了這個高度的類之間合并的判定值。本文中采用平均聯動聚類,標準是一類中的點和其他類中點的距離平均值。根據層次樹的高度,將東、中、西部區域內省份劃分為兩簇,其中樹高的那一簇作為影響區域人口出生率差異的主要省份。

圖2 聚類分析樹狀圖
表6 展現了1979—2019 年5 個時期的東、中、西部區域的聚類結果,可以看出:東部地區的人口出生率差異主要受廣東、福建、海南、浙江等省份的影響,顯然沿海地區是我國經濟最活躍、工業最發達、國內生產總值最高的區域,促使該地區人口數量急劇上升,人民生活水平提高,人口出生率隨之提升;中部地區的人口出生率差異主要受吉林和黑龍江的影響,這兩個地區的經濟相對中部地區其他省份而言,屬于經濟發展比較好的地區,人們的傳統觀念有所淡化,追求人口素質的發展,“少生”和“優生”的觀念逐步深入人心,這與經濟發展狀況相符;西部地區的人口出生率差異主要受到西藏、云南、廣西、寧夏、貴州和青海的影響,由于地理位置和資源欠缺的原因,經濟發展相較于東、中部地區不是很好,盡管人均可支配收入較低,但是育兒成本較發達地區而言小得多,且西部地區的老舊觀念未得到改變,人們選擇多生、早生,使得這些地區人口出生率較高。

表6 1979—2019 年影響各區域內人口出生率差異的省份
1)我國人口出生率存在空間分層異質性,短期變化趨勢并不穩定,呈現反復波動態勢;結合Brown-Mood 中位數檢驗東、中、西部兩兩地域間平均人口出生率的變化,發現東部和中部之間沒有顯著差異,而東部-西部和中部-西部在1986—2003 年間存在顯著的地域差異,區域間人口出生率差異呈現擴大趨勢后逐漸收斂。
2)采用層次聚類法探究影響各區域內人口出生率差異的省份,發現廣東、福建等沿海城市的快速發展吸引各地人民前往,人口流動增大,生活節奏加快;生活成本提高使得東部和中部地域的人們對于孕育下一代非常慎重,更注重下一代的質量,而西部欠發達地區則秉承舊觀念,超生現象依然普遍。
結合本文的分析與結論,給出以下建議:
1)國家制定生育政策時需要重視人口的空間非均衡性,率先考慮地域差異和各省市的發展趨勢,統籌解決人口出生率較低的問題。
2)加強各區域合作,協力解決人口生育問題。地域間既有同質性也有異質性,各個省市在解決各地區人口問題時要因地制宜,解決地區重點突出問題,完善地區人口政策,保障政策的有效實施。
3)建立完善以中央為主體的財政保障體質,推進西部人口和計劃生育公共服務均等化。加大中央對西部地區人口和計劃生育公共服務的投入,加大對西部欠發達地區的財政投入,幫助其建立屬于當地地區的經濟產業,促進經濟的迅速提高。只有人們的物質基礎得到保障及提升,和諧發展人口才有基礎。
4)制定人口長期發展戰略,優化生育政策。建立和完善計劃生育家庭老年人扶助制度,妥善解決計劃生育特殊困難家庭的生活照料、養老保障、大病治療、精神慰藉等問題,降低生育、養育、教育成本,促進人口長期均衡發展,提高人口素質。