向華麗,舒施妙
(中南財經政法大學 公共管理學院,武漢430000)
20世紀90年代中后期,婦女總和生育率已基本降到更替水平以下,到2010年第六次人口普查,我國總和生育率降至歷史最低水平1.181,隨后黨和國家政府相繼實施單獨二孩政策和全面二孩政策,這是新時期為適應經濟社會發展,對生育政策作出的重大調整,我國人口和計劃生育工作目標也向促進人口長期均衡發展轉變。然而,不同時期各省經濟社會條件差距較大,生育水平高低不一,導致生育政策執行效果各異,因此有必要對各省生育水平進行區域劃分,了解不同時期各省生育水平空間分布及其變動情況。
解決區劃問題,首先需要了解區域之間的聯系及其分布格局,對我國進行區域劃分。在此,本文參照陳衛(2005)和李建民等(2001)[1,2]對生育模式的劃分,結合譚遠發等(2014)[3]的劃分方法,將我國各省、市和自治區劃分為五個區,即東部特大城市、東部地區、中部地區、西部地區和西藏。以上區域地理位置鄰接,可以采用最大P區域問題的區劃方法進行重新區劃。此外,鑒于我國生育水平呈階段性特點,本文運用總和生育率的時間序列數據進行區劃時,必須分階段進行區劃。根據穆光宗(2001)[4]、韋艷(2007)[5]、李建民(2009)[6]、鄔滄萍(2011)[7]等對生育率階段性劃分,結合1950—2005年我國生育率下降數據的變動趨勢,本文在此將1975—2006年生育率分為兩大階段:第一階段為1975—1990年,生育率迅速下降時期;第二階段為1991—2006年,生育率穩定在更替水平以下。
因此,本文將利用最大P區域問題區劃方法,分兩個時間節點,依據各省總和生育率的時間序列數據,將我國重新劃分為五個區域,比較兩個時間節點的區劃結果,以便了解計劃生育政策以來區域生育水平時空差異。
最大P區域問題的區劃方法是將目標區域劃分為K類子區域,而每一類子區域最多可包含P個基本區域單元,且必須保證子區域之間的區域屬性相似。由此,Juan等[8]給出了最大P區域問題的解決方法:
假設目標區域I包含n個區域,基本區域單元為i,I={1,2,…,n};K為潛在的區域數量,k={1,2,…,n};c為區域鄰接順序,c={0,1,…q},其中q=n-1;采用二進制鄰接矩陣,使基本區域單元之間滿足鄰接約束條件,若區域i和區域j區域邊界相同,則 i,j∈I(i≠j),wij=1;否則,wij=0;若區域j與區域i相鄰且滿足條件 Ni=,則其為同一組區域;當 i,j∈I ,且i<j時,dij反映區域i和區域j之間的異質性;h為floor函數,對區域i和j,當 i,j∈I 時ll為區域i的空間屬性值,且i∈I。Threshold為區域規模下屬性值l的最小值。其中決策變量為:

則最小化函數Z表達式如下:

上式需滿足以下約束條件:

由于目標區域I在劃分子區域時的數量存在不確定性,所以用一個指數K來代表潛在區域數量。如果潛在區域K由源區域i產生,那么每一個區域K則僅含有一個源區域,其他區域按照其是否與源區域鄰接或者按照編號情況來劃分,若與源區域鄰接或編號較小則被分配到同一個源區域。
根據混合整合規劃模型求解目標函數最小化Z值,即可得到區劃結果。式(1)可以分解為兩項和第一項對源區域內的區域單元數量進行加總,以控制子區域的區域單元數量p,第二項將同屬一個子區域,且異質區域成對的區域單元數量相加,來控制子區域內部異質性H(pp)。最后在第一項前面乘以-1,得到目標函數最小化值。
然而需要采用特殊方法,使第一項與第二項相加得到一個單一值。對這兩項進行相加構成一種隱含的層次關系,其中子區域單元數量P的確定較早,而減少整體異質性的目標則相對較晚實現。第一項乘以換算系數,即可實現這種隱含的層次關系。若子區域包含的區域單元數量為P,則目標函數的初始值為-p*10h,鑒于子區域內部存在異質性,則該初始值將隨子區域異質性的增加而增加,但是如果h足夠大,則子區域異質性對目標函數的值影響不大,即目標函數的值將永遠小于-(p -1)*10h。這個表達式有三個含義:
第一,如果算出來的可行解P值較高,則目標函數總是足夠大,這種新的解決方案將是首選,并比其他任何一個P值較小的結果要好;第二,如果兩種解決方案得到的P值相同,則解決方案中異質性較低的比異質性較高的結果好;第三種含義來源于前兩個,僅對具有相同區域數量解決方案的總體異質性進行強制比較,對于比較不同區域數量的解決方案之間的異質性是不公平的。
從約束條件來看,約束條件(2)使子區域K至多屬于一個源區域。約束條件(3)使區域單元i按照鄰接順序c分配到子區域K。約束條件(4)在滿足約束條件(3)的基礎上,還要求當存在一個區域單元j與區域單元i相鄰時,則按照鄰接順序c-1分配到子區域k。約束條件(5)保證區劃后,子區域包含的區域單元數量大于事先設定的門限值TH。約束條件(6)運用成對的區域單元之間的差異性,來計算區域總體異質性。因此,當區域單元i和區域單元j被分配到同一個子區域K時,不考慮其被分配到子區域k的區域順序,二值變量tij=1,否則tij=0。約束條件(7)和約束條件(8)則保證了變量的完整性。
采用最大P區域問題的區劃方法,需滿足子區域內部區域單元鄰近的約束條件。因此,本文在保證區域空間位置鄰近的基礎上,采用最大P區域問題的區劃方法,利用各省總和生育率數據,對我國生育水平進行空間區劃。
首先利用Geoda軟件建立我國31個省、市、自治區的二進制鄰接空間權重矩陣,其次利用Python7.2軟件,采用最大P區域問題的區劃方法,對我國進行新的區域劃分,最后結合ARCGIS將區劃結果繪制成地圖。
最大P區域的劃分需要有區域單元的屬性變量。結合已有研究生育率空間效應的文獻,將各省的總和生育率作為屬性變量來反映區域生育水平。本文的數據來源:1975—2000年數據來自2007年國家統計局、美國東西方中心編制的《中國各省生育率估計:1975—2000》;2001—2006年數據來自辜子寅(2015)[9]《我國總和生育率重估計及其影響分析》。
參照Juan等(2012)[8]對區域單元的處理方法,本文用二進制鄰接矩陣建立區域單元之間的約束關系,二進制鄰接矩陣要求任何一個區域至少有一個鄰近區域,即至少與一個省有公共邊界??紤]到海南省與其他省份之間無公共邊界,因此建立鄰接矩陣時人為地把海南省與廣東省設為鄰近區域,保證31個區域單元至少有一個相鄰區域。
此外,雖然事先并不知道我國將被劃分成多少個子區域,但可以根據需要設定每個子區域最少應包含的區域單元個數,設定每個子區域的門限值TH。已有文獻對我國的區劃標準不一,根據陳衛和李建民[1,2]基于生育模式的區劃結果,本文將我國區劃設定為5個子區域。
根據五個子區域中包含的區域單元個數,其中西藏單列,說明每個區域最少包含1個子區域。另外,若將31個區域單元平均分為5個子區域,則每個區域最多可包含6個區域單元。因此,可將每個子區域應包含的區域單元數即門限數設為TH∈[1,6]。即每個子區域最少應包含1個區域單元,最多可包含6個區域單元。根據兩個時間段的區劃結果顯示,僅TH=5時,將31個區域單元劃分為5個子區域,因此本文僅列出TH=5的區劃結果,見下頁表1所示。
由表1可知,兩個時間段門限值TH=5的分區結果。從表1可知,兩個時間段相同TH值的分區結果的P值均為0.01,即在1%的顯著性水平上是顯著的,說明用最大P區域問題的區劃方法是可行的。

表1 我國不同時期生育水平區劃結果
從分區結果來看,本文的新區劃結果與根據生育模式劃分的五個區域的結果并不完全一致,且存在跨區現象,可能與區域單元數量和地理位置有關。從橫向來看,1975—1990年新區劃結果中,原屬于東部特大城市的北京、上海和天津均被劃入一類區域,且該區域還包括除黑龍江、福建外,按照生育劃分的其他東部地區省份;按照生育模式劃分的中部地區省份則重新被劃分為三個區域,即二類、三類和四類區域,其中原屬于東部地區的黑龍江被劃入二類區域;此外,原來的西部地區除寧夏被劃入四類區域外,青海、云南、貴州、新疆均被列入五類區域。1991—2006年新區劃結果中,北京、天津東部特大城市和東部地區的吉林、遼寧、黑龍江三個省被劃入一類區域;東部特大城市上海和中部地區內蒙古,與東部地區的浙江、江蘇、山東、河北均被劃入二類區域;除西部地區新疆、寧夏和青海外,原來的中部地區省份被分為三類、四類區域;五類區域除包含寧夏、青海、新疆外,還包括中部地區甘肅、陜西和山西。
從縱向來看,比較兩個時間段分區結果可知,不同時間段的區劃結果差別較大,隨著時間的推移,跨域現象仍然存在。1975—1990年五類區劃結果更接近按照生育模式劃分的西部地區,而1991—2006年二類區域區劃結果更接近按照生育模式劃分的東部地區;按照生育模式劃分的東部地區省份更加分散,1975—1990年主要劃入一類區域,1991—2006年劃入一類、二類區域,其中吉林和遼寧兩次均被劃入一類區域;而中部地區的新區劃結果逐漸集中,1975—1990年劃入二類、三類和四類區域,而1991—2006年則劃入三類、四類區域,以上結果造成兩個時間段的區劃結果差別較大。概而言之,兩次區劃結果的不同之處較多,但也存在相同之處,有些省份在兩個時間段均被劃入一個區域,表明這些省份的生育水平和地理位置,與其歸屬區域內的其他省份接近,且變化幅度一致;有些省份跨區,說明這些省份與新劃入區域內其他省份的生育水平相近。
基于兩個時間段各省的總和生育率,利用ARCGIS軟件制作的新區劃結果和按照生育模式劃分的區劃結果,可以看出,兩個時間段五個子區域數量有所差別,除第五類區域的區域單元數量相同外,其他區域的區域單元數量并不相同,說明隨計劃生育實行時間的推移和各省生育水平的變化,區劃結果也隨之發生變化,主要原因是不同區域單元之間的屬性值存在空間依賴,一個區域單元中的某種屬性值總是與其鄰近區域單元的相應屬性值相關。兩個時間段的區劃結果與按照生育模式的分區結果并不完全一致。如,吉林和遼寧屬于一類區域,廣西和西藏屬于五類區域,這些區域單元在生育模式的劃分結果中,分別對應屬于東部地區、中部地區、西藏。原因在于,本文采用的最大P區域問題區劃方法是根據區域的總和生育率進行分區,且考慮區域位置的空間鄰接性和生育水平存在的空間依賴性,這種空間依賴使得分區結果與僅按照生育模式進行分區的結果不完全一致。
結合最大P區域問題方法的約束條件可知,通過設定約束條件可以生成隨機區域,檢驗區劃結果的穩定性。鑒于僅TH=5時,區劃結果才滿足子區域為5的設定條件,因此僅用TH=5和Random=1萬、Random=100萬檢驗兩個時間段區劃結果的穩健性,結果見下頁表2所示。
由表2可知,Random=1萬、Random=100萬區劃結果仍在1%的顯著性水平上顯著。從橫向上看,1975—1990年區劃結果中,在Random=1萬的條件下,一類區域的區劃結果與Random=100萬的區劃結果相近,四川、陜西仍然在二類區域,內蒙古、山西和河南仍然屬于四類區域;而在Random=100萬的條件下,與Random=100萬、1萬的區劃結果差異明顯,一類區域包含的子區域數量明顯減少,除北京、天津兩個特大城市外,還包括原來屬于東部地區的河北、遼寧和吉林;剩余東部地區省份則被重新劃入二類區域;按照生育模式劃分的中部地區被列入四類區域。但是,在不同參數條件下,三類區域和五類的區劃結果與之前的區劃結果一致,說明隨著隨機參數的更改,區劃結果有所變化,但區劃結果趨于接近生育模式的區劃結果。從1991—2006年區劃結果來看,Random=1萬的條件下,一類、三類和五類區域的區劃結果與Random=100萬的區劃結果相近,二類和四類區域包含的區域單元的數量和分布有所差別;而在Random=100萬的條件下,一類區域包含北京、天津和上海東部特大城市,還包括大部分東部地區省份;按照生育模式劃分的中部地區被劃分為三類和四類區域,五類區域單元數量增多,該參數條件下的區劃結果與之前的區劃結果差異顯著。

表2 調整隨機數后我國不同時期分區結果
從縱向上看,對比兩個時期不同隨機參數下的區劃結果可知,在滿足空間鄰近的前提條件下,吉林、遼寧的生育水平與東部特大城市生育水平相近,西藏、廣西的生育水平更接近西部地區生育水平,福建、寧夏與中部地區生育水平相近。盡管不同基數條件下,所得到的區劃結果存在一定差異,由于按照生育模式劃分的區域單元數量分布差距明顯,利用最大P區域問題區劃方法的區劃結果包含的區域單元數量分布較為均勻,但是并未改變東部特大城市、東部地區、中部地區和西藏的劃分格局,新區劃結果在原來的基礎上將中部地區劃分更為細致,且隨著生育水平的持續下降,西藏逐漸接近青海、甘肅等相鄰省份的生育水平,不再單列作為一個地區。由此可見,基于各省總和生育率對我國進行區域再劃分的結果與按照生育模式進行的區劃結果并不一致,但采用最大P區域問題的區劃方法考慮空間依賴性和空間位置的鄰接性,保證區劃結果的可靠性,而根據調整隨機參數后的區劃結果,Random=1萬與Random=100萬的區劃結果基本一致,說明區劃結果在一定參數條件下具有穩健性。
已有研究生育水平時空差異的文獻中,大多以生育模式作為區劃標準,主要關注20世紀90年代以來我國生育率時空差異及演變趨勢,并較多使用普查時點數據進行研究,并不能準確地反映90年代前后不同年份各省生育水平的時空差異,且沒有考慮區域單元之間的空間依賴性。因此,本文依據1975—2006年各省的總和生育率時間序列數據,根據已有研究文獻,將該時期分為1975—1990年和1991—2006年兩個時間段,采用最大P區域問題的區劃方法,考察隨計劃生育政策實行時間的變化,不同時間段各省生育水平在空間區域上的變動情況,更加準確地反映各省的生育水平時空差異,并考慮區域之間的空間異質性和空間依賴性,使得區劃結果具有一定可靠性和穩健性。區劃結果顯示,兩個時間段的區劃結果有所差別,且與按照生育模型進行區劃的分區結果并不一致,且從調整隨機參數后的區劃結果來看,Random=1萬與Random=100的區劃結果基本一致,說明區劃結果在一定參數條件下具有穩健性。