沈思連,王春偉,崔建嶺
(1.河南科技大學 數學與統計學院,河南 洛陽 471003;2.63892部隊,河南 洛陽 471003)
近年來,人口作為一種基本信息已成為目前研究的熱點問題之一。人口的分布狀況在一定意義上反映了一個國家或地區自然條件的差異和經濟發展水平的高低,研究人口分布對于揭示其地域特點具有重要意義。我國是世界人口大國,而山東省又是人口大省。要想準確把握山東省人口與經濟可持續發展的關系,制定合理的人口政策,就有必要對全省人口的空間分布進行深入分析和廣泛研究。本文以山東省統計年鑒數據為基礎,研究了該省人口數量的空間變化模式,并對該分布模式下的影響因素進行了研究。首先利用Surfer軟件的可視化技術研究山東省人口數量的空間分布特征。其次基于近年來發展起來的局部線性地理加權回歸(Local Linear Geographically Weighted Regression,簡記為LLGWR)技術對該省人口分布的影響因素進行定量分析,并利用F-檢驗考查各因素在全省范圍內的空間非平穩性。
根據網上公布的第六次全國人口普查數據顯示,山東省全省常住人口為9579.31萬人,位居全國第二,僅次于廣東省。同第五次人口普查2000年11月1日0時的9079.31人相比,該省十年間共增加了500萬人,增長率為5.50%,平均每年的增長率約為0.54%。這一結果說明十年來雖然人口總量仍呈現上升的趨勢,但增長速度已得到控制,相對較慢,這可能是由于近些年來經濟社會的發展,人民生活水平的提高以及人們觀念的轉變所致。
一方面,人口的空間分布及其主要的影響因素通常具有空間非平穩性。另一方面,隨著時間的推移,該空間非平穩性也會發生變化。因此,有必要對人口分布的空間差異進行研究,揭示其空間變化規律,從而為制定合理的人口政策和實現人口的有序流動提供主要依據。
為揭示山東省人口數量的空間分布規律,我們選取該省132個市縣區(其空間分布如圖1),并利用Googleearth軟件搜集了相應地區的經緯度數據(單位:度)。另一方面,為了與該省第五次人口普查(即2000年11月1日0時)中的人口空間分布作比較,我們選取2000年11月1日0時和2010年11月1日0時的132個市縣區的人口數量數據(單位:萬人)。
從圖1可以看出,所選的空間站點幾乎均勻地分布在全省范圍內,這也是對數據進行有效分析和合理解釋的必要前提。另一方面,也可看到所有站點(用圓點表示)均在山東省的邊界線以內,這在一定意義下說明由Googleearth得到的各市縣區的經緯度數據具有較高的精度。

圖1 山東省132個市縣區的空間分布圖
為了更直觀地展示山東省132個市縣區2000年和2010年的人口空間分布特征,并揭示十年來人口數量的空間變化規律,我們利用Surfer軟件將搜集的人口數量數據進行可視化(經緯度數據的單位均為度,人口數量數據的單位均為萬人),相關結果如圖2所示。
從圖2可以看出,山東省的人口分布明顯不均衡,主要表現為以下幾個特征:①全省各地市之間人口總量差距顯著,呈現多個同心環,且人口自西南向東北遞減,人口主要集中在交通干線和城市地區。②十年來人口相對稀少的地區逐漸縮小,例如,人口總量在20~70萬之間的地區明顯縮小,這些地區主要集中在北部邊界及東北部地區。③人口相對稠密地區的人口總量值顯著增加,比如,菏澤-濟寧-臨沂-日照-青島-煙臺一帶,十年間人口總量由90~140萬人增加到100~170萬人左右。④2000年和2010年的人口分布呈現類似的空間分布模式,即全省范圍呈現多個同心環,人口大多集中在經濟發達、交通便利的市區。

圖2 山東省各市縣區2000年和2010年的人口數量的空間分布(左為2000年,右為2010年)
人口分布通常受自然因素和人文因素的影響,自然因素包括地形、地勢、地貌和氣候等,人文因素包括了社會歷史條件、經濟水平等。本節以山東省統計年鑒數據為基礎,搜集取得影響人口分布的可能因素指標:就業率、單位面積的糧食產量(噸/千公頃)、人均糧食產量(噸/萬人)、人均GDP(萬元)、單位面積的GDP(萬元/平方米)、農民的人均純收入(元)。由于以上衡量指標數據的單位不同,不便于直接進行數據分析。本文首先對以上數據進行標準化,基于標準化后的數據建立合適的空間變系數回歸模型,利用近年來發展起來的局部線性GWR方法擬合該模型。
空間變系數模型是探索與分析空間數據回歸關系空間非平穩性的重要工具之一,尤其是近年來發展起來的LLGWR擬合方法(見文獻[4])更是以其概念上的簡單性和操作上的易實現性以及在許多領域中的實用性受到人們的普遍重視。由于該估計方法是我們后面進行數據分析的基礎,故首先簡單介紹一下該方法。

空間變系數模型中系數函數的估計是人們探索和分析回歸關系空間非平穩性的主要依據。假定模型(1)中所有的系數函數關于地理位置坐標u和v均具有連續的一階偏導數。對于研究區域內任意給定的目標位置,令doi為目標位置與第i個觀測位置之間的歐氏距離,則根據二元函數的Taylor展開式,在的某鄰域內可近似為


為便于表示,引入矩陣符號。令


其中Ip和0p×2p分別表示 p階單位陣和 p×2p階零矩陣。

類似于其他的局部光滑技術,在利用LLGWR方法擬合模型(1)的過程中,需要預先確定核函數K(·)和光滑參數h。通常情況下,核函數K(t)取為Gauss函數

窗寬參數h可由某種數據驅動方法來確定。
由于本節的主要目的是為了揭示山東省人口總量與其可能影響因素之間的空間回歸關系,故我們基于第二節中該省132個市縣區(其空間分布見圖1)的人口相關數據進行分析,其中包括各市縣區的經緯度坐標(單位:度)、就業率、單位面積的糧食產量(噸/千公頃)、人均糧食產量(噸/萬人)、人均GDP(萬元)、單位面積的GDP(萬元/平方米)、農民的人均純收入(元)。
由于在后面的估計和檢驗過程中,各市縣區的地理位置坐標均為某平面直角坐標系下的平面坐標,為此在我國西安1980坐標系統下,利用高斯-呂克格投影方法(見文獻[6])將各觀測站點的經緯度坐標轉化為直角坐,其中以零度緯線(赤道)作為橫坐標軸,以該省淄博市沂源縣所在的經線作為縱坐標軸。
這里需要指出的是,在進行坐標變換的過程中,中央經線的選取比較復雜,一般是根據分帶(三度帶或六度帶)決定的,每個帶有自己的中央經線。在此選取該省淄博市沂源縣所在地的經線(即為中央經線,因其大致處于山東省的中央,可保證全省面積處于變形最小狀態。
另外,為了減小不同量綱對分析結果的影響,我們將原始數據進行了標準化,將人口數量作為因變量,記為Y,就業率、單位面積的糧食產量、人均糧食產量、人均GDP、單位面積的GDP、農民的人均純收入作為自變量,分別依次記為市縣區的地理位置坐標記為

利用LLGWR方法對模型(5)進行擬合,選取高斯核函數(如(4)式所示)和交叉確認方法(見文獻[5,6])求得系數函數在各個空間位置處的估計值。基于各系數函數的估計值檢驗其在所研究的空間區域內變化的顯著性,即等價于檢驗

基于觀測數據

首先利用局部線性地理加權回歸方法對模型(7)進行擬合。在式(4)中的Gauss核函數下,利用交叉確認方法選擇窗寬參數h=76km,相應系數顯著性檢驗的檢驗p-值分別為0.0435977,0.0494687和0.0457165。
對于給定的顯著性水平α=0.1,由于三個 p-值均相對較小,因此可斷言模型中的三個系數函數在所研究區域內均存在明顯的空間非平穩性,即顯著變化。此外,系數函數和在各空間位置處的估計值用等值線的形式展示在圖4和圖5中。

圖4 模型(7)中系數 估計值的等值線圖(左為 ,右為

圖5 模型(7)中系數估計值的等值線圖(左為,右為
從圖4(左側圖)中可以看出,系數 β1(u,v)(即截距項)的估計值在北部和東北部地區相對較小,西南部及東部地區相對較大,這也反映了山東省人口分布的基本特點。由圖4(右側圖)中可知,人均糧食產量對人口數量的影響強度自西南向東北方向依次有所增加。
圖5(左側圖)說明人均GDP對人口數量的影響強度,呈現出幾個明顯的空間格局。具體來說,系數β3(u,v)的估計值在西部地區沿著西南向東北方向,東部邊界地區沿東南向東北方向均依次有所增加。此外,北部地區,影響強度自南向北逐漸變大;南部地區,影響強度自北向南逐漸變大。
圖5(右側圖)展示了系數函數 β4(u,v)的估計值。從圖中可以看出,該值在全省范圍內存在空間差異性。具體來說,全省除了菏澤地區及聊城-濟寧-棗莊的西部邊界地區外,該估計值自西南向東北方向依次有所增加。在聊城-濟寧-棗莊的西部邊界地區,農民的純收入對人口數量的影響相對較弱,往菏澤方向則有所增強。
本文考查了山東省人口總量的空間分布規律,并對影響人口分布的主要因素進行了定量分析。具體來說,首先利用描述性統計分析方法與軟件的可視化技術揭示了人口數量的空間分布特征。其次,利用空間統計學中近年來發展起來的局部線性GWR模型探索與分析影響人口分布的主要因素,并考查其空間非平穩性問題。分析結果表明人均糧食產量、人均GDP和農民的人均純收入是影響該省人口分布的主要因素,這三個因素在全省范圍內均呈現出顯著的空間非一致性。
[1]馮守平.中國人口增長預測模型[J].安徽科技學院學報,2008,(6).
[2]陳文權,趙茲,李得勝.Leslie修正模型在人口預測中的應用[J].世界科技研究與發展,2008,(2).
[3]薛臻.我國人口增長預測數學模型[J].河南科技學院學報(自然科學版),2008,(1).
[4]張靜,王興華.利用神經網絡預測人口數量[J].襄樊學院學報,2001,(5).
[5]Hart J D.Nonparametric Smoothing and Lack-of-Fit Tests[M].New York:Springer,1997.
[6]沈永年,孔慶瑜.1980西安坐標系快速高斯投影計算公式[J].冶金測繪,1994,(3).
[7]Lee Y,Mei C L,Zhang W.X.Statistical Tests for Spatial Non-Stationarity Based on The Geographically Weighted Regression Model[J].Environment and Planning A,2000,(32).