高謝慶,秦 昆*,喻雪松,張 凱
(1.武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)
隨著科技與經(jīng)濟(jì)的發(fā)展,各個(gè)國家或地區(qū)之間的聯(lián)系和交往越來越密切,人口遷移已成為各個(gè)國家或地區(qū)之間頻繁發(fā)生的交互現(xiàn)象。數(shù)據(jù)處理技術(shù)的進(jìn)步為人口遷移數(shù)據(jù)提供了更好的獲取方式,提高了數(shù)據(jù)的真實(shí)性與可靠性。人口遷移作為世界發(fā)展的物質(zhì)流、信息流、資金流、技術(shù)流的重要載體,推動(dòng)著各個(gè)國家或地區(qū)的物質(zhì)、資金、信息等生產(chǎn)要素的加速流動(dòng)和優(yōu)化,全球人口遷移網(wǎng)絡(luò)化正逐步形成。
對(duì)于人口遷移的研究,目前大部分學(xué)者主要試圖解釋或模擬人口遷移趨勢(shì),或側(cè)重于應(yīng)用,如利用人口流動(dòng)網(wǎng)絡(luò)揭示社會(huì)結(jié)構(gòu)[1-2],將人口遷移與經(jīng)濟(jì)、社會(huì)事件等要素進(jìn)行聯(lián)系以研究其相關(guān)關(guān)系[3-4]。人口遷移研究主要關(guān)注城市[5]、國家[6]或全球[7-9]范圍內(nèi)的人口流動(dòng),多數(shù)學(xué)者以某個(gè)或幾個(gè)城市以及國家之間的人口遷移數(shù)據(jù)為基礎(chǔ)開展研究,只有少數(shù)學(xué)者針對(duì)全球人口遷移問題進(jìn)行研究。探索全球尺度的人口遷移,能深刻反映全球人口遷移的特征,更加充分認(rèn)識(shí)世界人口遷移的變化趨勢(shì)。目前,國內(nèi)外關(guān)于全球人口遷移的分析研究主要是通過統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)進(jìn)行全球人口遷移數(shù)據(jù)估算以及全球人口遷移趨勢(shì)預(yù)測(cè),部分利用到復(fù)雜網(wǎng)絡(luò)理論的研究也大多是同一時(shí)間內(nèi)的對(duì)比性研究或?yàn)槠渌麛?shù)據(jù)分析起輔助作用[10]。本文以全球人口遷移數(shù)據(jù)為基礎(chǔ),基于復(fù)雜網(wǎng)絡(luò)和社會(huì)網(wǎng)絡(luò)分析理論和方法[11-12],對(duì)全球人口遷移網(wǎng)絡(luò)的結(jié)構(gòu)特征和基本性質(zhì)進(jìn)行探索,并分析了其時(shí)空變化規(guī)律,擬為全球人口問題的研究提供基礎(chǔ)。
本文采用國家人力資源和社會(huì)保障部公開的國家編碼數(shù)據(jù)和全球人口遷移數(shù)據(jù)兩個(gè)數(shù)據(jù)集。其中,國家編碼數(shù)據(jù)用于提取各個(gè)國家的坐標(biāo)信息,如圖1a所示,包含國家編碼、國家名稱和國家經(jīng)緯度字段;全球人口遷移數(shù)據(jù)為1990—2010年20 a間196個(gè)國家每5 a的人口遷移量,該數(shù)據(jù)根據(jù)參考文獻(xiàn)[13]的方法估算得到,根據(jù)連續(xù)的人口存量表,利用統(tǒng)計(jì)缺失數(shù)據(jù)方法估算得到1990—2010年以5 a為一個(gè)時(shí)間段196個(gè)國家之間的單邊流量,每5 a約有3.8萬條單邊人口遷移數(shù)據(jù),數(shù)據(jù)下載網(wǎng)址為:https://download.gsb.bund.de/BIB/global_flow/,數(shù)據(jù)形式如圖1b所示,共包含16個(gè)字段。通過原文的數(shù)據(jù)質(zhì)量評(píng)估,該數(shù)據(jù)的具體國家或地區(qū)的凈移民流量與聯(lián)合國公布的凈移民估計(jì)數(shù)非常接近,且該數(shù)據(jù)包含196個(gè)國家或地區(qū),占國家人力資源和社會(huì)保障部公開信息中244個(gè)國家或地區(qū)的80%,說明其具有較高的準(zhǔn)確性和較好的覆蓋量,具有分析的可行性。本文采用數(shù)據(jù)涉及的字段包括country_orig_id(人口遷出國編碼)、country_dest_id(人口遷入國編碼)、countryflow_1990(1990—1995年人口遷移量)、countryflow_1995(1995—2000年人口遷移量)、countryflow_2000(2000—2005年人口遷移量)、countryflow_2005(2005—2010年人口遷移量)等。

圖1 研究源數(shù)據(jù)展示圖
本文的研究方法主要以復(fù)雜網(wǎng)絡(luò)理論為基礎(chǔ),對(duì)基于全球人口遷移數(shù)據(jù)構(gòu)建的復(fù)雜網(wǎng)絡(luò)進(jìn)行基礎(chǔ)測(cè)度統(tǒng)計(jì)分析、結(jié)構(gòu)探測(cè)和時(shí)空分析;從而對(duì)全球人口遷移網(wǎng)絡(luò)的無標(biāo)度和小世界特性以及基礎(chǔ)測(cè)度和社區(qū)結(jié)構(gòu)的特征展開研究,技術(shù)路線如圖2所示。

圖2 技術(shù)路線圖
作為對(duì)全球人口遷移的整體探索,本文主要考慮國家或地區(qū)之間的整體遷移關(guān)系,不考慮其中的遷入遷出,所構(gòu)建的網(wǎng)絡(luò)為無向網(wǎng)絡(luò),通過數(shù)據(jù)收集與處理對(duì)數(shù)據(jù)中的單邊流量進(jìn)行合并處理,獲得整體的人口遷移量。根據(jù)數(shù)據(jù)集的4個(gè)時(shí)間段,本文以國家或地區(qū)為節(jié)點(diǎn)分別建立了4個(gè)無權(quán)無向網(wǎng)絡(luò)與4個(gè)加權(quán)無向網(wǎng)絡(luò),無權(quán)網(wǎng)絡(luò)的邊主要體現(xiàn)各個(gè)國家或地區(qū)之間是否發(fā)生遷移關(guān)系,加權(quán)網(wǎng)絡(luò)的邊則表示國家或地區(qū)之間的人口遷移量。
在完成網(wǎng)絡(luò)的構(gòu)建后,對(duì)網(wǎng)絡(luò)的測(cè)度指標(biāo)進(jìn)行統(tǒng)計(jì),根據(jù)兩種網(wǎng)絡(luò)的不同含義,本文先對(duì)無權(quán)網(wǎng)絡(luò)的整體屬性進(jìn)行測(cè)度統(tǒng)計(jì),主要包括網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)N、連邊數(shù)M、平均度
在對(duì)網(wǎng)絡(luò)結(jié)構(gòu)有了一定認(rèn)識(shí)后,再通過對(duì)網(wǎng)絡(luò)測(cè)度的時(shí)序變化分析以及對(duì)社區(qū)檢測(cè)結(jié)果的時(shí)序和空間變化分析,完成對(duì)全球人口遷移網(wǎng)絡(luò)的時(shí)空分析,并得出相應(yīng)結(jié)論。
2.1.1 網(wǎng)絡(luò)基礎(chǔ)測(cè)度統(tǒng)計(jì)
網(wǎng)絡(luò)基礎(chǔ)測(cè)度是根據(jù)復(fù)雜網(wǎng)絡(luò)理論中對(duì)于不同測(cè)度的定義公式計(jì)算而來,測(cè)度統(tǒng)計(jì)結(jié)果如表1所示,N為該時(shí)段內(nèi)發(fā)生過人口遷移現(xiàn)象的國家數(shù)量,M為該時(shí)段內(nèi)發(fā)生過遷移關(guān)系的國家對(duì)數(shù)量,

表1 無權(quán)遷移網(wǎng)絡(luò)測(cè)度指標(biāo)統(tǒng)計(jì)結(jié)果
對(duì)于平均聚類系數(shù)和平均路徑長度的分析,需要與相似隨機(jī)網(wǎng)絡(luò)的測(cè)度進(jìn)行對(duì)比。因此,構(gòu)建了一個(gè)節(jié)點(diǎn)數(shù)為196,每個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)連接概率為50%的隨機(jī)網(wǎng)絡(luò),該網(wǎng)絡(luò)的測(cè)度指標(biāo)統(tǒng)計(jì)如表2所示。通過對(duì)比可以看出,該網(wǎng)絡(luò)具有較大的平均聚類系數(shù)與較小的平均路徑長度,這也反映了該網(wǎng)絡(luò)具有一定的小世界特性,說明各個(gè)國家之間人口遷移的連通程度較高。網(wǎng)絡(luò)的度同配系數(shù)為負(fù)值,說明該遷移網(wǎng)絡(luò)是異配的,具有遷移關(guān)系的國家數(shù)量相差過大的國家之間更傾向于發(fā)生遷移活動(dòng),而具有遷移關(guān)系的國家數(shù)量相近的國家則更少發(fā)生遷移活動(dòng)。

表2 隨機(jī)網(wǎng)絡(luò)的測(cè)度指標(biāo)統(tǒng)計(jì)結(jié)果
2.1.2 網(wǎng)絡(luò)測(cè)度的冪律分布分析
在真實(shí)世界的復(fù)雜網(wǎng)絡(luò)中,與隨機(jī)網(wǎng)絡(luò)或規(guī)則網(wǎng)絡(luò)不同的是大多數(shù)節(jié)點(diǎn)傾向于與少量核心節(jié)點(diǎn)進(jìn)行連接,這種機(jī)制使得復(fù)雜網(wǎng)絡(luò)具有無標(biāo)度性質(zhì)。本文探究了網(wǎng)絡(luò)中的資源分布規(guī)律,對(duì)加權(quán)網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度與邊強(qiáng)度進(jìn)行冪律分布分析。4個(gè)時(shí)段的加權(quán)網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度與邊強(qiáng)度分布如圖3所示,由節(jié)點(diǎn)強(qiáng)度分布圖可知,不論哪個(gè)時(shí)段內(nèi),一個(gè)國家與其他國家發(fā)生遷移的次數(shù)均存在非常大的差異,只有極少數(shù)國家發(fā)生了大量的遷移關(guān)系,而絕大多數(shù)國家發(fā)生的人口遷移次數(shù)都很少,非常符合冪律分布的基本原則;由邊強(qiáng)度分布圖可知,邊強(qiáng)度也滿足冪律分布規(guī)律,與節(jié)點(diǎn)強(qiáng)度分布不同的是,邊強(qiáng)度分布的差異更顯著,只有極端少數(shù)連邊的邊強(qiáng)度值較大,絕大多數(shù)連邊的邊強(qiáng)度值都較小。

圖3 加權(quán)網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度與邊強(qiáng)度分布
2.1.3 網(wǎng)絡(luò)測(cè)度時(shí)序變化分析
本文選擇了部分度中心性較高且具有一定代表性的國家節(jié)點(diǎn)進(jìn)行基于度中心性的測(cè)度時(shí)序變化分析,對(duì)全球人口遷移網(wǎng)絡(luò)的時(shí)空分析方法進(jìn)行深入探索,為全球人口遷移分析提供新思路、新視角。
部分國家節(jié)點(diǎn)度中心性時(shí)序變化如圖4所示,圖4a中表示了中國(CHN)、美國(USA)、俄羅斯(RUS)、印 度(IND)、墨 西 哥(MEX)、德 國(DEU)、巴基斯坦(PAK)和阿富汗(AFG)的節(jié)點(diǎn)度中心性變化,可以看出,美國的度中心性一直遙遙領(lǐng)先于其他各國,但在1995—2000年增加后,后期一直在減少;除美國外,其他各國的度中心性均在0~0.06左右變化。
為了更加明顯地分析除美國外其他國家的度中心性變化,不添加美國的其他國家節(jié)點(diǎn)的度中心性變化情況如圖4b所示,可以看出,處于中東地區(qū)的巴基斯坦與阿富汗的度中心性變化跨度較大,這與1990—2000年發(fā)生的中東戰(zhàn)爭相對(duì)應(yīng);處于亞洲的中國(大陸)與印度的度中心性整體上在增加;處于北歐地區(qū)的俄羅斯與德國的度中心性整體上在減少,這些變化正好對(duì)應(yīng)了1990—2010年中國(大陸)的經(jīng)濟(jì)發(fā)展、印度的人口增長以及蘇聯(lián)解體后俄羅斯的發(fā)展?fàn)顩r與兩德統(tǒng)一后德國的發(fā)展?fàn)顩r。

圖4 部分國家節(jié)點(diǎn)度中心性時(shí)序變化圖
本文利用基于模塊度的Louvain算法進(jìn)行社區(qū)探測(cè)。該算法能在聚類過程中遍歷所有節(jié)點(diǎn),相較于其他算法,對(duì)于本實(shí)驗(yàn)數(shù)據(jù)的聚類效果更加明顯,社區(qū)探測(cè)與劃分結(jié)果如圖5所示,圖中圓心代表網(wǎng)絡(luò)的國家節(jié)點(diǎn)的地理位置中心,圓形的顏色代表節(jié)點(diǎn)所屬社區(qū)。通過分析4個(gè)時(shí)段的網(wǎng)絡(luò)社區(qū)劃分圖可知,地理位置較近的國家節(jié)點(diǎn)更容易被劃分到同一社區(qū)中,具有相同鄰海的國家雖然地理位置不相近也有較多處于同一社區(qū)的現(xiàn)象,在一定程度上體現(xiàn)了地理位置對(duì)人口遷移的影響。

圖5 網(wǎng)絡(luò)社區(qū)劃分地理位置可視化展示
為了對(duì)社區(qū)結(jié)構(gòu)的時(shí)空變化進(jìn)行更具體的分析,本文選擇4個(gè)時(shí)段內(nèi)中國(大陸)所在的社區(qū)進(jìn)行變化探測(cè)。4個(gè)時(shí)段內(nèi)中國(大陸)所在社區(qū)的社區(qū)劃分如圖6所示,可以看出,變化較大的是1995—2000年中國(大陸)所在的社區(qū),1995—2000年中國(大陸)只與東南亞部分國家存在于同一社區(qū),且社區(qū)內(nèi)節(jié)點(diǎn)數(shù)量遠(yuǎn)小于另外3個(gè)時(shí)段,這與1995年中國援外工作的改革相對(duì)應(yīng),中國在1995年后加強(qiáng)了與東南亞部分國家的援助與合作工作,從而提高了人口遷移規(guī)模。

圖6 中國(大陸)所在社區(qū)可視化展示
除1995—2000年的社區(qū)變化較大以外,對(duì)比其他3個(gè)時(shí)段的社區(qū)劃分圖可知,有許多共同的國家和地區(qū)節(jié)點(diǎn),因此可通過提取社區(qū)劃分結(jié)果的共同節(jié)點(diǎn)進(jìn)行進(jìn)一步分析。通過統(tǒng)計(jì)發(fā)現(xiàn),只有中國香港與中國澳門在4次劃分中一直與中國(大陸)在同一個(gè)社區(qū),說明中國國內(nèi)3個(gè)地區(qū)的人口遷移關(guān)系一直都非常密切;除了中國香港與中國澳門,還有26個(gè)國家在3個(gè)時(shí)段內(nèi)均與中國(大陸)劃分在同一個(gè)社區(qū),如圖7所示,可以看出,這26個(gè)國家大多出現(xiàn)在東南亞地區(qū)和北美地區(qū),包括美國、加拿大、日本、韓國等。結(jié)合上文對(duì)邊強(qiáng)度變化的分析可知,1995—2000年中國與加拿大、日本、韓國等國家之間的人口遷移量減少,正好對(duì)應(yīng)了1995—2000年社區(qū)劃分的明顯變化;而中國與美國之間人口遷移量激增、美國與美洲其他國家人口遷移關(guān)系密切,也對(duì)應(yīng)了中國與一些美洲國家多次劃分在同一社區(qū)的現(xiàn)象。

圖7 社區(qū)劃分共同節(jié)點(diǎn)可視化展示
本文以全球人口遷移數(shù)據(jù)為基礎(chǔ),構(gòu)建了全球人口遷移網(wǎng)絡(luò),并運(yùn)用復(fù)雜網(wǎng)絡(luò)和社會(huì)網(wǎng)絡(luò)分析的理論與方法對(duì)人口遷移網(wǎng)絡(luò)的測(cè)度與結(jié)構(gòu)特征進(jìn)行挖掘,探索分析了人口遷移網(wǎng)絡(luò)的時(shí)空變化特征,為全球人口遷移和全球人口問題研究奠定了基礎(chǔ)。同時(shí),本文為全球人口遷移活動(dòng)研究提供了新思路,即從復(fù)雜網(wǎng)絡(luò)理論的基本原理出發(fā),結(jié)合時(shí)空分析等其他理論方法對(duì)全球人口遷移特征進(jìn)行深入探索與研究。
本文研究發(fā)現(xiàn)全球人口遷移網(wǎng)絡(luò)具有無標(biāo)度、小世界和異配等特性,即全球人口遷移在各個(gè)國家或地區(qū)之間發(fā)生得非常密集,但人口遷移總量較大的國家或地區(qū)與具有較大雙邊遷移量的國家對(duì)在整體中只有極小的占比,且人口遷移量差距較大的國家之間更傾向發(fā)生遷移關(guān)系。通過對(duì)社區(qū)結(jié)構(gòu)進(jìn)行探測(cè)與變化分析發(fā)現(xiàn),全球人口遷移變化與地理位置、國際關(guān)系、國際事件具有一定聯(lián)系,對(duì)于全球人口遷移的探測(cè)、分析與預(yù)測(cè)具有重要的指示意義。后續(xù)研究可考慮結(jié)合各國人口政策、國際關(guān)系以及全球航空交通等,進(jìn)行多因素的綜合分析,從而為全球人口問題研究提供更好的決策支持。本文對(duì)于全球人口遷移網(wǎng)絡(luò)的特性大多給出了定性的證明,而對(duì)于其特性的強(qiáng)弱并沒有一個(gè)定量的分析,還需在后續(xù)對(duì)于該網(wǎng)絡(luò)的學(xué)習(xí)和研究中進(jìn)行補(bǔ)充和完善。