王群勇 張乃丹
內容提要:本文利用2017年全國流動人口動態監測數據,采用社會網絡分析方法研究中國城市間人口流動的空間結構特征。從流向上來看,人口流入分布更為集中,人口流出的分布則相對“多極化”。其次,人口流動網絡具有明顯的地域分布特征和群體性特點,一方面,流動空間格局的經度分割效應明顯弱于緯度分割效應;另一方面,人口傾向于較短距離的省內流動,流動規模隨著省級行政區域之間距離的增加而降低。進一步分析人口流動網絡形成機制,研究發現,樣本城市間互惠關系普遍存在;城市經濟發展水平、第三產業占比、人口密度、城市公共服務水平以及空氣質量均會促進人口流動;地理空間網絡對人口流動的影響逐漸式微。因此,為了促使人口自由流動,實現資源的優化配置,政府既要順應市場經濟力量形成的人口空間分布和城市體系格局,也要通過優化產業結構、提供優質的城市公共服務等引導人口合理流動。
關鍵詞:人口流動;網絡;結構;指數隨機圖模型
中圖分類號:F126;C92文獻標識碼:A文章編號:1001-148X(2022)03-0142-11
收稿日期:2021-07-01
作者簡介:王群勇(1976-),男,天津人,南開大學經濟學院教授,博士生導師,經濟學博士,研究方向:理論與應用計量經濟學;張乃丹(1994-),本文通訊作者,女,四川眉山人,成都信息工程大學統計學院講師,經濟學博士,研究方向:應用計量經濟學、人口流動。
基金項目:貴州省哲學社會科學重大專項課題,項目編號:21GZZB14。
一、引言
20世紀80年代以來,勞動力在城鄉和區域之間進行著大規模流動,伴隨著中國經濟的發展,不同階段呈現出的特征也有所區別。1984年10月國務院發布《關于農民進入集鎮落戶問題的通知》后,國家放松了對農村人口進入中小城鎮就業生活的限制,人口流動規模隨著工業化、城鎮化快速發展而不斷擴大。20世紀90年代以來的20年內,流動人口規模持續增長,且增速迅猛,年均增長率約為12%。根據國家衛生健康委員會發布的《中國流動人口發展報告2018》顯示,2010年以來我國流動人口規模增長進入相對緩和階段,從2015年起人口流動規模開始逐漸步入調整期。另外,中國人口流動受到各區域經濟發展的影響,存在明顯的城鄉、區域間不平衡,從微觀個體理性經濟人角度來看,沿海經濟發達地區的就業機會和經濟機遇是吸引勞動力空間轉移的原動力,大規模的人口流動與聚集便是特征化事實的體現。同時,人口流動對于城市及區域經濟的影響舉足輕重,被視為是生產要素在空間上再配置的過程,在一定程度上推動了區域間物質、資本、信息、技術等要素的快速流動和優化,因此,人口流動和城市的發展壯大存在作用與反作用的雙向關系[1],人口流動在推動我國經濟高速發展的同時,改變了區域人口的結構分布,也引起了產業結構和勞動力市場的不斷變化。
近年來,國家也出臺了一些全國性的宏觀政策來引導流動人口。2014年中共中央、國務院印發《國家新型城鎮化規劃(2014-2020年)》,隨后國務院印發《關于進一步做好農民工服務工作的意見》和《關于進一步推進戶籍制度改革的意見》,以及黨的十九大報告特別要求“破除妨礙勞動力、人才社會性流動的體制機制弊端,使人人都有通過辛勤勞動實現自身發展的機會”。
隨著地域分割被打破,區域經濟一體化進程不斷發展,人口大范圍的流動時刻在上演。在人口流動的過程中,自然而然地將流動人口戶籍所在地與現居住地聯系起來,構建出一條條無形的“邊”,形成了一張張緊密的“網”。另外,流動人口與城市的經濟特征、傳統文化以及地方制度環境等獨特背景交織融合,致使傳統的線性分析框架無法分析人口城市流動網絡形成的內在機理。為研究這一復雜網絡,學界的主要思想是將人口流動空間格局的各個地區及地區間流動人口的關系轉化為網絡的節點和邊,通過網絡的形式描述真實空間格局中各地區間的關系。由此,可以推測復雜網絡分析方法在人口流動空間格局中占有重要的地位。基于上述現狀,對于人口流動網絡的形成來說,人口流動格局如何影響整個流動網絡?其他網絡如何引導人口流動網絡的發展?城市的社會和經濟特征如何作用網絡關系形成?這一系列問題直接影響到人口要素區域結構分布和勞動力供需問題。本文通過運用復雜網絡理論對人口流動的探索來解釋中國流動人口城市分布的特征,為制定更有效的人口流動政策提供參考依據。
二、文獻綜述
國內外學者對于人口流動進行了大量的研究,集中于人口流動的因素分析、空間分布特征、政策制定與研究等,而且多聚焦城鄉流動人口分布、省際流動人口分布。首先,人口流動的影響因素一直是人口學、經濟學、社會學的重點研究議題,其相關理論經歷了宏觀、微觀、宏-微觀結合的發展歷程。推拉理論作為人口學上最重要的研究人口流動的系統性宏觀研究,最早可以追溯到Ravenstein的“人口遷移法則”,最終由埃弗雷特·李使其完善,提出了系統的人口遷移理論——“推拉理論”,強調流動會受到流出地、流入地拉力和推力以及中間障礙因素等的影響,其中中間障礙因素主要包括距離遠近、物質障礙、語言文化的差異。經濟學領域對于人口流動的理論探索可以從結構主義研究方法中尋得,其典型代表包括劉易斯二元經濟理論、費景漢-拉尼斯模型以及喬根森模型,其基本觀點可概括為經濟發展的不均衡性導致人口在不同部門間流動。雖然這對于把握人口流動的宏觀動因和機理給予了經濟學闡釋和模型論證,但是這種結構主義方法對人口流動的研究只有從結構的角度入手才能做出正確的理解和評價。上述宏觀視角由于缺乏對現實情況的合理解釋,后來研究逐漸拓展到微觀分析,以托達羅模型、李的推拉理論、人力資本理論和新勞動遷移經濟理論為代表的新古典主義研究方法,彌補了早期模型沒有考察作為當事人的決策行為過程,包括對家庭式流動、異質性個體流動的研究。隨著行為主義研究方法的運用,流動人口主體性受到關注。
在進行理論研究的同時,關于人口流動動因的實證研究也受到廣泛關注,現有研究將人口流動空間分布的非均衡歸因于區域經濟的非均衡,其中受空間經濟結構變動影響已然成為共識。以推力——拉力理論為基礎,拓展引力模型,突出強調流入地和流出地的人口基數、工資和失業率等因素產生的拉力和推力。另外,除了傳統社會經濟因素的影響外,城市公共服務水平、空氣污染、城市房地產價格以及方言文化等也成為影響人口流動的重要方面[2-6]。王玨(2014)系統性地提出對于城市間形成的人口遷移流可從認知層、物理層和關系層三個層次來把握,其中物理層是一直公認的經濟勢能,包括信息和交通可達性等外部條件,認知層則關注個體的遷移偏好,強調人們傾向于有共同文化、歷史和認同感的區位,而基于關系層的人口流動淡化了對空間的依賴性,強調人口遷移流是在物理層基礎上基于親緣、地緣等人際關系和企業間生產關系形成的[7]。張耀軍(2014)研究發現產業發展、就業率、職工工資、社會公共資源以及城市化水平都能顯著影響人口流動[8]。童玉芬(2015)基于成本收益的切入點分析發現,可能正是出于超大城市高收入能抵消高生活成本的擠出效應,流入地的高凈收入能顯著提升流動人口選擇超大城市的可能[9]。
其次,關于人口流動的空間特征,學者們基于不同的尺度和采用不同的方法進行實證研究。早期研究人口流動多使用傳統研究理論和統計方法,近年來,隨著信息技術和數據平臺的推進和運用,空間模型以及逐漸發展起來的網絡分析方法為人口流動提供了新的途徑與視角,以社會網絡分析技術為重要研究方法被廣泛應用在人口學中,以關系數據的視角來分析人口流動的空間特征。有研究發現,我國的人口流動空間格局呈現出無標度特性、小世界現象以及群集結構的特征,揭示了人口流動網絡的整體性與層次性。沈詩杰(2020)研究中國省際人口流動的空間結構特征后指出,省際人口流動網絡存在整體密度不大、區域內流動為主、以及具有相對優勢省份等特征[10]。陳銳(2014)基于復雜網絡理論研究省際實際流動人口網絡,認為網絡的小世界特征明顯,具有較強的局部聚集性和整體連通性,進一步地建立流動人口測度模型后發現,較高經濟發展水平和較大人口總量更能吸引外來人口[11]。除了肯定我國省際人口遷移網絡中群集和部分中心樞紐的特征化事實,李毅(2017)通過鏈路預測發現人口流動在受到經濟因素影響的同時,也會受社會文化方面的影響[12]。省際人口流動特征和因素已經受到廣泛關注,隨著信息技術的發展和一體化進程的推動,各類要素資源在城市間實現流動,省級行政區劃的界限愈發模糊,以城市為節點的市際聯系得到促進和深化,因此,基于城市網絡研究人口流動成為新的方向。朱鵬程(2019)利用騰訊人口遷徙大數據,結合城市腹地的概念對長三角地區人口流動網絡進行分析,指出該地區人口流動具有顯著層級特征,并且利用兩種關聯測度方法發現各中心城市網絡腹地空間結構與人口流動網絡特征相對應,強調空間可達性和地理區位的重要性[13]。WeiliZhang(2020)利用ERGM模型考察證實了地理、人口、經濟、自然和語言因素的作用,同時也肯定了居住環境、公共服務水平和基礎服務設施等因素對人口流動網絡發揮著更為重要的作用[14]。
上述文獻主要基于靜態的視角分析了中國人口流動遷移結構特征和影響因素。但近年來,人口流動區域模式也在發生著局部變化。王桂新(2012)利用2000年和2010年的人口普查數據證實了經濟發達地區是中國省際人口遷移的主流,而且人口遷出分布與遷入分布差異明顯,以及人口遷移模式具有整體相對穩定、局部性變化等特征[15]。同樣,夏怡然(2015)發現東南沿海城市的流動人口吸納能力有所下降,而直轄市的人口流入快速上升,通過建立回歸模型發現,經濟發展水平對人口流入的作用雖仍重要但開始減弱,第三產業吸納人口流入的能力日漸加強,且城市規模存在收斂的趨勢[16]。
通過對文獻的梳理可以看到,利用復雜網絡分析方法研究人口流動的網絡特性逐漸成為趨勢,一方面,對流動人口的網絡拓撲結構進行統計分析能對網絡整體和局部特征有更為清楚的認識;另一方面,需要識別出城市間人口流動空間依賴關系形成的關鍵因素,而傳統回歸模型無法解釋人口流動網絡的形成機制和多種網絡的交互影響。因此,本文在研究主體方面,聚焦于城市主體作用機制的研究對象,利用大型微觀數據構建城市間人口流動網絡,分析網絡節點中心性、聚類分析等;在研究方法方面,以城市行政區和流動人口構建指數隨機圖模型(ExponentialRandomGraphModel,ERGM),厘清流動人口更傾向于流入的城市在經濟發展水平、人口密度、產業結構、地理空間和方言文化等方面具有哪些特征。對于以上問題的探索與回答,將有助于準確把握城市間人口流動的空間結構特征,豐富和拓展城市間人口流動的研究,將對我國社會經濟的穩定和持續發展有著極為重要的意義。
三、研究設計
(一)數據來源
本文的個體層面數據來自于2017年國家衛生和計劃生育委員會(以下簡稱“衛計委”)開展的全國流動人口動態監測數據(CMDS),該調查按照隨機原則在全國31個省(區、市)和新疆生產建設兵團流動人口較為集中的流入地抽取樣本點,采用分層、多階段、與規模成比例的PPS方法進行抽樣,調查對象為全國在調查前一個月前來本地居住、非本區(縣、市)戶口且在調查階段年齡在15周歲及以上的流入人口。該數據的一大優勢在于給出了流動人口戶籍地和居住地所在區縣的準確信息,樣本量大,覆蓋面廣,對于全國流動人口基本狀況具有較好的代表性。除了CMDS數據庫提供的個體特征信息,城市層面的經濟要素和人口等來自于《中國城市統計年鑒》,統計口徑為全市。另外,流入地和流出地之間的地理距離以高德地圖中兩地駕車的推薦路線距離衡量,以此更為準確地體現實際上的流動距離。方言情況統計來源于CSMAR數據庫,其中方言地域分布源于《中國語言地圖集(第二版)》(2012),各城市區縣人口數來源于《中國人口和就業統計年鑒》中的全國各地按戶籍統計。ERGM估計結果借助R語言的statnet包實現[17]。
(二)網絡結構特征分析
本文采用網絡結構分析方法出于以下考慮:一是網絡分析方法能夠從全局視角對人口流動網絡特征進行識別,以此彌補傳統計量方法的局限;二是網絡分析方法能夠有效揭示人口流動的空間網絡關聯特征。通過本節對網絡特征的分析,為下文采用ERGM研究網絡形成機制奠定基礎。
城際人口流動網絡指依托城際網絡并以各城市為節點、人口流向和流量連線構成節點間關系的網絡結構。本文用前述鄰接矩陣繪制圖對象G=(V,E)的方式對城市間人口流動網絡進行描述,其中,V(G)為所有城市的集合,包括288個城市;E(G)為所有城市之間連接的集合,即城市間的人口流出、流入關系,這些城市節點及其流動關系構成了城市間人口流動網絡G。具體的做法如下:首先,根據個體戶籍地與現居住地所在城市信息,做二維交叉表,生成以流出地為行,流入地為列的人口流動矩陣,其中,矩陣的單元格值對應流出地流向流入地的人數。在網絡研究時,通常根據數據分布設置二分閾值,本文使用不同城市流動人數高四分位數為閾值,當流動人數大于該數值時設為1,此時區域間存在大規模人口流動關系,低于該數值時設為0,即不存在大規模人口流動關系,至此將人口流動矩陣轉換為0-1鄰接矩陣。鑒于人口流動數據是根據抽樣數據得來,不同省份城市的抽樣數量存在差別,同時不同城市人口規模效應存在差異,如果僅設置一個固定值為閾值,會低估部分小規模城市間的流動關系。
為加深對網絡整體特征的認識,多數學者會利用社會網絡分析方法對網絡的拓撲結構特征進行分析,本文分別使用中心性分析和社團分析研究人口流動網絡的結構特征。
1.中心性分析
衡量網絡中節點的重要性,取決于其在社會網絡居于什么樣的中心位置,或者說其具有怎樣的權力,具體可以量化為點的中心性和圖的中心勢。其中,常用的表示點的中心性的指標包括程度中心度、中間中心度、特征向量中心度和接近中心度等,而度中心性能有效反映節點的發出和接收能力。因此本部分以城市為節點形成的城際人口流動網絡進行度中心性分析,以點入度和點出度體現該城市在所處網絡中的地位和功能。參考WeiliZhangalet(2020)的做法,對于規模越大的社會網絡而言,點度中心度的最大可能值也會越高,為消除網絡規模變化對點度中心度的影響[14],本文使用標準化中心性值來強調城市的相對價值,具體用CO,i、CI,i相對點中心度來表示點出度和點入度,分別體現了網絡中各節點“發出”和“接收”所形成的社會關系,即利用城市間流動構成的社會網絡反映各個城市吸引人口流入的能力。具體公式如下:
CO,i=∑Nj=1,j≠1popijN-1(1)
CI,i=∑Nj=1,j≠1popijN-1(2)
Insurplus=CI,i-CO,i(3)
Outsurplus=CO,i-CI,i(4)
其中,在計算CO,i時使用的popij表示從區域i流動至區域j的總人口數,而在計算CI,i時使用的popij是指從區域j流向區域i的總人數,N指所有節點個數,具體到本文就是所有城市總數。進一步地構建Insurplus相對凈流入和Outsurplus相對凈流出指標,反映城市吸收和流失人口的能力,當Insurplus為正數時,則說明該城市人口流入情況為凈流入,城市的人口規模是增加的,此時,其對應的Outsurplus指標就為負值。經過計算,得到各城市的凈流入、凈流出情況,除煙臺市凈流入為0以外,本文識別了84個人口凈流入市和203個凈流出市。由于涉及的城市較多,限于篇幅,不一一贅述每個城市節點入度、出度中心性和凈流入情況,僅展示凈流入位序前10個城市和位序后10個城市(見表1)。可以發現,北京、上海、廣州和深圳等一線城市的人口凈流入輻射效應明顯。其次,在全國人口流動網絡中占據前10的城市較為均勻地分布在我國三大經濟圈中。位于長三角地區的上海市位居所有城市第一,由于上海是我國經濟發展中心,也是資本密集的地區,能為流動人口帶來更高的就業機會和經濟收入,可見其不僅是長三角地區的人口流動核心,也是整個人口流動網絡的中心樞紐;另外,蘇州市、南京市、無錫市外來人口流入規模大,這些城市在長三角地區經濟水平靠前,企業眾多,能提供較多的就業崗位和更高的收入,同時受上海經濟的輻射,因此也能極大吸引外來人員流入。在凈流入前5名的城市中有兩個來自京津冀地區,分別是北京市、天津市,這兩座城市在華北地區乃至全國人口流動網絡中的地位是不容忽視的。另外廣州、深圳市作為珠江三角洲中心城市,也是一直以來都吸引著外來人員流入。
為了更為直觀地了解各城市吸引人口流動的能力,使用Arcgis軟件提供的自然斷點法(Jenks)將前述測算的288個城市凈流入情況進行5級分級,具體分別為主要流入、次要流入、相對均衡、次要流出以及主要流出,劃分等級結果如表2所示。可以看出,相對于凈流出城市,位于城市等級結構頂層的主要、次要流入城市數量較少,而次要流出和主要流出城市數量較多,說明人口流入的分布更為集中,人口流出的分布則相對“多極化”。其中,主要流入城市包括上海、北京、天津等35個城市,而次要流入城市包括海口、南昌、嘉興、哈爾濱等35個城市,上述兩個等級的城市所形成的一二線城市大都市圈及部分區域中心城市是人口聚集陣地,對于全國人口流動具有強吸引力;其次,追溯人口流動歷程,現如今的城市凈流入等級劃分在全國范圍內分布較為均勻,側面印證了人口流動從“孔雀東南飛”到“回流中西部”的轉折。位于結構中間層即流入流出規模相對均衡的城市數量較多,包括唐山、晉城、東晉、臨滄等81個城市。而次要流出的城市數量最多,處于這類等級的城市包括安順、牡丹江、池州、巴彥淖爾等104個城市;主要流出城市處于等級結構最下層,數量最少,包括泰安、宜春、宿州、臨沂等33個城市則為主要流出城市。這些流出城市大都是四、五線城市,經濟發展滯后,一直以來就是傳統的人口輸出地區。
2.社團分析
前述網絡節點度中心性分析加深了人口流動網絡的認識,但不能反映網絡的微觀結構。本文利用社區發現算法對復雜網絡進行聚類分析,研究網絡局部相互連接的特定模式,解析網絡的微觀結構,并利用社會網絡圖對象展示復雜網絡的直觀方式,有助于分析復雜網絡的功能,探索復雜網絡的隱藏規律以及預測其發展趨勢。社區劃分的算法較多,主要分為兩大類,一是拓撲分析,其遵循社區內部連邊密度高于社區間的準則,這種算法適用于無向無權網絡;二是流分析,即通過發現在網絡的某種流動中形成的社區結構,如物質、能量、信息等的流動,這種算法一般用于有向有權網絡。本文根據網絡數據描述的對象和想要獲得的信息,采用Pons和Latapy(2005)提出的隨機游走的劃分算法(Walktrapalgorithm)來發現人口流動空間各城市節點相似性,進而尋找子群[18]。其基本思想是使用兩點到第三點的距離之差來衡量兩點之間的相似性,進而來劃分社區。具體步驟如下:對網絡G對應的鄰接矩陣A按行歸一化,得到概率轉移矩陣P,不同狀態之間的轉移概率為:
Pij=Aij/di(P=D-1A)(5)
其中,A是鄰接矩陣,D是度矩陣,t步隨機游走從i到j的概率是Pij的t次冪。
對于節點i和節點j之間的距離公式如下:
rij=∑nk=1(Ptik-Ptjk)2dk(6)
在社區C中隨機均勻地選取頂點i,那么t步隨機游走從社區C到j的概率為PtCj,具體公式如下:
PtCj=|1C∑i∈CPtij|(7)
除了對人口流動網絡按上述算法劃分社團外,通過一定的布局讓節點和邊可以根據某種策略進行排布,而布局算法有多種,其中最有用且最常用的是力導向布局算法中的Fruchterman-Reingold布局,在這樣的力導向布局中,節點如同帶電粒子,而邊充當彈簧,當節點靠得過近時會相互排斥,同時共同連接的邊又會將節點吸引在一起。所以,節點會均勻分布,且連線邊上相互聯系越多的節點分布會越近。
綜上可以發現,我國城市間人口流動網絡的社團特征明顯,人口流動空間格局結構具有區域性特征。城市間人口流動網絡中各城市被劃分為不同的社團,社團內部的城市間人口流動緊密,而社團間的城市間人口遷移較為稀疏,即同一省份的跨市人口流動較為活躍,城市省際聯系較弱,說明了我國人口流動規模隨著省級行政區域之間距離的增加而降低,省內城市聯系更為緊密。另外,不考慮北京等個別城市在全國范圍內占據著中心樞紐位置,新疆、甘肅、內蒙古等西部省份的較多城市處于網絡布局的邊緣位置,而東部省份及一些中西部省會城市位于網絡核心位置,說明人口流動規模呈現出明顯的東西部差異,且省際聯系主要集中在東部地區,東部地區人口流動的頻繁程度更高,人口流動分布基本與“胡煥庸線”是相一致。但是同時,人口流動空間格局的經度分割效應明顯弱于緯度分隔效應,即南北分界明顯,可以看出南方和北方區域內部彼此更融為一體,這也說明了社會作用力大于自然地理的劃分[12]。另外,除了以北京、上海、廣州等一線大城市是所處省份、鄰近省份乃至全國人口流入的主要城市外,人口流動的流入地也呈現出多極化特征,比如北京周邊的石家莊和天津,廣州周邊的珠海、佛山以及川渝地區、武漢等地也成為了人口流入的重要城市,并且形成了長三角、京津冀、珠三角三大都市圈為主、中西部地區少數省會城市為輔的格局。
(三)ERGM分析方法
前文論述的網絡分析方法主要是描述性的,無法解釋人口流動網絡形成的內在機理。傳統的計量分析方法建立在研究對象相互獨立的假設上,然而這種假設明顯與現實不符,實際上人口流動呈現出空間聚集區域性特征,因此有必要將人口流動的空間關聯納入到實證分析中。指數隨機圖模型(ERGM)是研究網絡結構的統計模型,以關系為基礎,通過類似邏輯回歸的形式解釋影響因素對網絡的形成機制,并對模型進行統計檢驗。在這類模型的使用中,與社會網絡的一些基本理論假設是一致的:社會網絡是局部涌現的,網絡關系不僅是自組織的或是彼此依賴,同時它們也會受到行動者屬性和其他外生因素的影響[19]。
ERGM模型允許有各種變形和擴展,通過將多類可能影響節點間關系形成的因素納入模型中,根據前文所述,影響因素可分為以下三類,具體為:(1)網絡自組織的形成模式也稱為“純結構”效應,這種“內生”效應強調網絡模式的出現來源于網絡關系系統的內部過程,并且是通過基于度的效應而出現,比如,兩個節點之間新的關系的產生會受到共同連接邊的節點的影響。(2)行動者屬性會通過影響網絡中行動者的參與來發揮作用,從單個行動者層面,屬性可能會促進個體建立更多的關系(擴張性),或促使該行動者收到更多的關系(聚斂性);而從跨越兩個行動者層面來看,當節點的屬性匹配時,會產生促使節點傾向于與自己相似的其他節點聯系的趨同性過程。因此,也可以看出行動者屬性影響網絡關系存在著不同的過程,發揮著多重效應。(3)其他的外生情境因素對關系形成也需要重點考察,研究中常把這類因素看作二元關系協變量,基于不同網絡關系往往存在相互間共生的事實,將其他的外生網絡或更為一般的二元關系以附加統計量的方式加入到模型中,主要從多維鄰近性進行考慮,包括地理空間因素、共享隸屬關系、語言文化鄰近、制度鄰近等。
給定真實網絡隨機圖G=(V,E),J={(i,j):i∈V,i≠j}表示網絡中各節點之間所有可能存在關系。由于E為真實網絡中存在的邊,因此E是J的子集,也就是各個節點存在的某種可能集合關系。建立一個隨機變量Y表示J中元素,如果i,j∈E,那么yij=1,意味著行動者i和j之間存在網絡關系,否則不存在相應關系。在此基礎上形成鄰接矩陣Y,y=[yij]定義為Yij的觀測值。基于以上,ERGM的一般形式如下:
Pr(Y=y|θ)=1kexp{∑HθHgH(y)}(8)
其中,Pr(Y=y|θ)是指在條件θ下,y在矩陣Y中出現的概率。k為歸一化常數:k=k(θ)=∑yexp{∑HθHgH(y)}。對于ERGM模型而言,結構類型H不同表示不同的模型。θH為網絡統計參數,gH(y)為與結構類型H有關的統計量,可進一步拓展為由全局網絡結構統計量gα(y)、節點屬性變量gβ(y,x)、協變量網絡統計量gγ(y,g)組成。相應的表達式如下:
Pr(Y=y|θ)=1kexp{θαgα(y)+θβgβ(y,x)+θγgγ(y,g)}(9)
其中,θ為各統計量的系數,其他統計量同前文描述。
ERGM檢驗過程主要借助馬爾科夫蒙特卡洛極大似然估計法對模型進行估計檢驗,通過t統計量檢驗參數的顯著性,在模型中解釋變量按網絡結構變量、屬性變量和網絡協變量依次加入,借助AIC和BIC評價模型的優劣。最終選取能較好解釋人口流動網絡形成機制的模型。表3是本文ERGM模型中參考的主要統計量。
四、我國城市人口流動空間關聯的影響因素
(一)ERGM模型變量選擇
1.網絡自組織效應
ERGM模型通過加入多種網絡內生結構統計量拓展模型,如邊數、互惠性、聚斂性和擴張性、傳遞性、交互k三角、幾何加權項等。受模型自由度限制,全部288個城市節點的發出者效應和接收者效應不能加入模型中。另外,研究表明在聚集性較強的網絡中,三角形構局引入ERGM模型中可能導致模型的退化。由于三角形構局用于擬合數據是十分有限的,另外,實際上三角形關系往往聚集在多重三角形關系較密集的區域,因此采用更高階k-三角形能更好地建模。因此,為了彌補前述問題所導致的模型中內生結構變量的缺失,本文以幾何加權項衡量觀測網絡內存在的復雜依賴關系,出于本文研究對象是有向網絡,以及考慮到幾何加權項算法復雜性所導致的估計過程過長,本文借鑒劉華軍(2018)的做法,將幾何加權邊共享伙伴統計量納入ERGM模型中作為評價關系依賴性的工具,借此檢驗人口流動網絡中多個節點之間的流動關系是否存在傳遞性[20]。然而根據實證結果發現,幾何加權邊共享伙伴統計量納入模型中,估計結果不夠理想。因此,最終只考慮邊數和互惠性估計結果。
2.行動者屬性
行動者屬性即網絡中各城市節點的社會經濟屬性,按照網絡統計量分類,包括同配性和異配性、流入地屬性和流出地屬性。由于人口流動涉及流出地和流入地,因此不同城市的屬性異同在人口流動網絡的形成中起了作用,比如,相較于偏遠落后地區,經濟發達地區就業機會更多、勞動報酬更高,城市間經濟發展水平的差異會形成人口流動的“拉力”和“推力”,進而促進區域間流動關系的形成。因此,為衡量經濟發展不均衡的主效應和趨同效應,借鑒劉華軍(2018)的思路[20],將城市GDP分為高、中、低三類,其中288個城市中GDP排名前25%的設為GDPHigh,25%—75%定為GDPMid,后25%歸為GDPLow。除了考察經濟發展水平在人口流動網絡中發揮的作用外(主效應),還將檢驗處于不同或相同經濟發展水平的城市之間(趨同效應)是否更容易形成流動關系。
而在節點協變量方面,研究表明人類活動以及自然因素可能對人口空間流動網絡的形成發揮重要作用。一般而言,人口密度高的城市確實能吸引人口流入;同時,第二、三產業的發展對于勞動力、資源、信息等生產要素的需求也同樣會影響人口區域分布;另外,基于城市舒適度的遷移理論(amenity-ledmigrationtheory),強調城市“軟”“硬”件配備帶來的吸引力在一定程度上解釋了人口流動,比如交通基礎設施作為一項重要的反映城市生活便利狀況的重要標志,尤其是近年來,中國各大城市陸續開通高鐵后,在很大程度上縮短了城際間的地理距離,促使人口流動;又比如,城市所提供的公共服務、地區自然因素(地形、氣候、環境質量)也會影響個體的流動決策。基于此,主要將城市人口密度、第二、三產業占GDP比重、政府的人均教育和科技支出、該城市是否開通高鐵、平均坡度、平均降水量以及PM25濃度等引入ERGM模型,以厘清這些變量在人口流動網絡形成中發揮的作用。
3.外生網絡效應
根據前文描述可知,相較于傳統計量方法,ERGM模型可以將區域間人口流動以外的其他外生網絡聯系納入其中,以此來考察不同類型的二元關系的相互依賴。為了檢驗各相關網絡對人口流動空間關聯的影響,將地理空間因素、方言文化作為網絡協變量引入ERGM模型中,地理空間上的遠近直接影響人口流動成本,而方言作為文化載體,能產生認同感和歸屬感,進而影響流動。其中,地理空間因素通過高德地圖中兩地駕車的推薦路線距離而構建關聯網絡。而方言距離參照劉毓蕓(2015)[3],進一步將漢語方言細化到方言小片。具體如下,將漢語方言從上到下依次劃分為方言大區、方言區、方言片、方言小片,對相應區縣所屬方言進行編碼整理分類,由于近年來區縣行政區劃變遷,通過手動調整和百度檢索,匹配出各區縣行政單位的方言屬性,對方言距離人為賦值,具體如下,兩個區縣屬于同一方言小片時,方言距離為0;屬于同一方言片的不同方言小片時,方言距離為1;屬于同一方言區的不同方言片時,方言距離為2;屬于同一方言大區的不同方言區時,方言距離為3;屬于不同方言大區時,方言距離為4。通過將城市各區縣方言距離進行人口加權,得到兩兩城市之間的方言距離,相應計算公式如下:
di,j=∑Ii=1∑Jj=1SAi·SBj·dij(10)
其中,i∈CA,j∈CB,A≠B,SAi為城市A中任一區縣i的人口比例,SBj為城市B中任一區縣j的人口比例,dij為區縣i和區縣j之間的方言距離。
本文借助ERGM,研究人口流動網絡受到網絡結構、行動者屬性和外生網絡的綜合作用,表4是模型中使用的各變量。
(二)ERGM模型擬合結果
通常采用逐步添加變量方式,測度不同變量組合的ERGM最佳估計值。
首先考察只包含邊、互惠性等內生結構變量,證實了人口流動網絡存在自組織性。在網絡結構因素中,邊數在01%的水平上顯著為負,表明人口流動網絡密度較低。互惠性估計系數均正向顯著,各城市間人口流動網絡顯著的互惠性和雙向性,表明許多城市間人口流動互相影響。
其次,行動者—關系效應體現了城市社會、經濟和環境水平對人口流動網絡的重要影響,人口密度、第二產業占比、第三產業占比、政府科技教育支出以及高鐵開通都具有正向顯著影響,而以PM25濃度表征的空氣污染系數顯著為負。具體來看,經濟發展水平估計系數顯著為正,說明相較于低經濟水平的城市,經濟水平越高越容易與其他城市構建人口流動網絡。同時,Homophily(GDPHigh)和Homophily(GDPLow)分別在1%水平上負向顯著和1%水平上正向顯著,表明如果兩個城市的經濟發展均處于低水平,則形成人口流動網絡的概率會增加;而如果兩個城市均處于經濟發展高水平,這一概率會下降。由此,結合GDP的主效應與趨同效應可以看出,經濟發展水平高的城市是其他外來人口,尤其是來自于低經濟水平城市的首要流入地。人口密度系數顯著為正,表明外來人員傾向于流向人口密集的城市,人口更密集的城市通過聚集經濟可以帶來更高的工資和更多的就業機會。第三產業占比系數為正數且顯著,表明人口流動受到第三產業發展水平的影響,城市的第三產業占比越高,越能吸引人口流入,可能的原因在于第三產業需要更多的就業人口,能提供充足的就業環境與更多的發展機會,由此會吸引外來人員選擇三產業更發達的城市流入。地方政府科技教育支出水平越高,說明城市公共服務水平越高,人們為了享受當地提供的公共資源、服務而流向這些城市。另外,城市平均坡度的系數顯著為正,即平均坡度越高,構建城市間人口流動網絡聯系的概率就會增加,說明人口會傾向于主要集中在平原或地形平坦的地區活動。PM25濃度的系數顯著為負,表明城市空氣污染越嚴重對人口的流入產生阻力作用。
增加了地理空間網絡和方言文化網絡協變量,發現空間鄰近性和語言鄰近性都有助于人口流動網絡的形成和發展。城市嵌入的兩種控件變量對人口流動的影響,證實了人口流動存在鄰近性。根據列7估計結果可知,地理距離的系數均顯著為負,意味著人口流動網絡和地理空間網絡具有明顯空間重疊,即城市間地理位置越接近,更易于形成人口流動的空間關聯網絡。可能的原因在于:地理距離越近,流動風險降低,相應地減少了流動過程中的交通成本,但這種影響逐漸式微。而方言距離未通過顯著性檢驗,說明方言文化并非城市間人口流動網絡的主導因素,可能的原因在于,一方面,隨著普通話的普及,人們的交流溝通更為方便;另一方面,人口大量頻繁流動,地方文化交融,同時人們身處信息爆炸的時代,方言作為地區文化載體的表現力也會下降。
表5最后一欄列出了模型的AIC和BIC值,相較于考慮部分變量的模型,同時加入了網絡自組織結構、行動者屬性和外生情景因素的模型,其AIC和BIC值最低,表明模型7擬合度更好。
五、結論與啟示
(一)結論
本文將復雜的理論與社會網絡分析方法引入到城市間人口流動研究中,根據實際的人口流動建立復雜網絡,分析流動人口的網絡拓撲結構和空間分布特征。通過構建指數隨機圖模型(ERGM),研究網絡的自組織性、行動者屬性和外生網絡對人口流動網絡產生的重要影響,得出如下研究結論:
(1)從人口流動網絡的結構分析結果可以看出,整體上,人口流動規模與“胡煥庸線”一致,呈現出明顯的東西部差異,同時人口流向呈現出明顯的南北分割。并且,流動空間格局的經度分割效應明顯弱于緯度分割效應;從流向上來看,人口流入的分布更為集中,人口流出的分布則相對“多極化”。
(2)其次,通過對網絡中的子群劃分發現,人口流動網絡具有明顯的地域分布特征和群體性特點,受空間、人口、經濟等因素的影響,部分子群之間聯系頻繁,“南北”“東西”幫派性相對較為明顯。而且人口流動規模隨著省級行政區域之間距離的增加而降低,說明流動人口傾向于較短距離的省內流動。上海、北京、天津、廈門等區域的節點中心性排在前列,在人口流動網絡中占據重要地位,發揮著中心樞紐的作用。對于35個主要流入的一二線城市所形成的大都市圈及部分區域中心城市是人口聚集陣地,對于全國人口流動具有強吸引力。
(3)從ERGM模型實證分析結果可知,人口密度、經濟發展水平、產業結構、交通基礎設施水平、空氣質量等對外來人口流動有顯著影響。一般來說,經濟發展水平高、第三產業發達、城市公共服務水平高以及環境質量優良的城市更容易吸引人口流入。同時,在協變量網絡中,地理空間因素對人口流動網絡形成具有顯著影響,但相比之下這種影響趨弱。
(二)啟示
人口流動逐漸打破空間限制的同時當前中國國內經濟進入到轉型升級的發展階段,構建“雙循環”的新發展格局成為現實需要,而在促進國內大循環的進程中,仍存在各種顯性與隱性的要素流通障礙。人口在城市間流動構成了城際網絡格局,承擔著信息交流、資源交換和資本聚集與擴散等重要的載體作用。因此,各級政府仍需要制定相應的促進人口流動的有效政策,確保人口在城市間自由流動,實現資源的優化配置。政府在制定城市發展戰略時應該順應市場經濟力量形成的人口空間分布和城市體系格局。其次,優化產業結構是吸納人口就業的重要途徑,第三產業是吸引人口流動的重要因素,因此推動產業結構省際,培育現代服務業為主的產業體系,能促進人口與經濟結構相匹配。另外,提高城市公共服務的供給和改善環境質量也是提升城市吸納人口流入能力的重要途徑。
參考文獻:
[1]潘竟虎,賴建波.中國城市間人口流動空間格局的網絡分析——以國慶-中秋長假和騰訊遷徙數據為例[J].地理研究,2019,38(7):1678-1693.
[2]夏怡然,陸銘.城市間的“孟母三遷”——公共服務影響勞動力流向的經驗研究[J].管理世界,2015(10):78-90.
[3]劉毓蕓,徐現祥,肖澤凱.勞動力跨方言流動的倒U型模式[J].經濟研究,2015,50(10):134-146,162.
[4]劉降斌,劉秋明.房地產價格、人口流動以及城鎮化水平相互作用機制研究[J].哈爾濱商業大學學報(社會科學版),2021(3):3-17.
[5]孫偉增,張曉楠,鄭思齊.空氣污染與勞動力的空間流動——基于流動人口就業選址行為的研究[J].經濟研究,2019,54(11):102-117.
[6]毛豐付,鄭芳.人才引進政策如何影響了勞動力市場?[J].商業經濟與管理,2021(11):62-77.
[7]王玨,陳雯,袁豐.基于社會網絡分析的長三角地區人口遷移及演化[J].地理研究,2014,33(2):385-400.
[8]張耀軍,岑俏.中國人口空間流動格局與省際流動影響因素研究[J].人口研究,2014,38(5):54-71.
[9]童玉芬,王瑩瑩.中國流動人口的選擇:為何北上廣如此受青睞?——基于個體成本收益分析[J].人口研究,2015,39(4):49-56.
[10]沈詩杰,沈冠辰.中國省際人口流動的空間結構特征研究[J].人口學刊,2020,42(4):103-112.
[11]陳銳,王寧寧,趙宇,等.基于改進重力模型的省際流動人口的復雜網絡分析[J].中國人口·資源與環境,2014,24(10):104-113.
[12]李毅,劉雅楠,金勇進.基于復雜網絡視角下省際人口遷移空間格局及趨勢研究[J].統計研究,2017,34(9):56-64.
[13]朱鵬程,曹衛東,張宇,等.人口流動視角下長三角城市空間網絡測度及其腹地劃分[J].經濟地理,2019,39(11):41-48,133.
[14]WeiliZhang,ZhaohuiChong,XiaojianLi,etal.SpatialPatternsandDeterminantFactorsofPopulationFlowNetworksinChina:AnalysisonTencentLocationBigData[J].Cities,2020,99.
[15]王桂新,潘澤瀚,陸燕秋.中國省際人口遷移區域模式變化及其影響因素——基于2000和2010年人口普查資料的分析[J].中國人口科學,2012(5):2-13,111.
[16]夏怡然,蘇錦紅,黃偉.流動人口向哪里集聚?——流入地城市特征及其變動趨勢[J].人口與經濟,2015(3):13-22.
[17]EricD,Kolaczyk,GaborCsardi.StatisticalAnalysisofNetworkDatawithR[M].NewYork:Springer,2014.
[18]PonsP,LatapyM.ComputingCommunitiesinLargeNetworksUsingRandomwalk[M].Berlin:Springer,2005:284-293.
[19]DeanLusher,JohanKoskinen,GarryRobins.ExponentialRandomGraphModelsforSocialNetworks:Theory,MethodsandApplications[M].CambridgeUniversityPress,2013.
[20]劉華軍,杜廣杰.中國霧霾污染的空間關聯研究[J].統計研究,2018,35(4):3-15.
ResearchonPopulationMobilityNetworkAmongCitiesBasedonExponential
RandomGraphModels
WANGQun-yong1,ZHANGNai-dan2
(1.SchoolofEconomics,NankaiUniversity,TianJin300071,China;
2.SchoolofStatistics,ChengduUniversityofInformationTechnology,Chengdu610103,China)
Abstract:Thispaperusesthedynamicmonitoringdataofthenationalfloatingpopulation(2017)tostudythespatialstructurecharacteristicsofChina’sinter-cityflowsofpopulationbyusingtheanalysismethodofsocialnetwork.Intermsofdirectionofpopulationflows,thedistributionofpopulationinflowismoreconcentrated,whilethedistributionofpopulationoutflowisrelativelymulti-polar.Secondly,thepopulationflownetworkhasobviousgroupcharacteristicsandgeographicaldistribution,that’stosay,ontheonehand,thelongitudesegmentationeffectisobviouslyweakerthanthelatitudesegmentationeffectoftheflowspatialpattern;Ontheotherhand,migrantstendtomovewithinashortdistance,andthescaleofthemovementdecreaseswiththeincreaseofthedistanceamongprovincialadministrativeregions.Furthermore,theexponentialrandomgraphmodel(ERGM)isusedtoanalyzethefactorsaffectingthespatialrelationshipofpopulationmobilityanditsmechanism.Resultsshowthatthereciprocalrelationshipamongthesesamplecitiesiswidespread;theurbaneconomicdevelopment,proportionoftertiaryindustry,populationdensity,urbanpublicserviceandairqualitywillpromotepopulationmobility;andthegeographicalspatialnetworkgraduallyweakens.Therefore,inordertopromotepopulationflowandrealizetheoptimalallocationofresources,thegovernmentshouldnotonlyconformtothespatialdistributionofpopulationandthepatternofurbansystemformedbymarketeconomicforces,butalsoguidetherationalmigrationbyoptimizingindustrialstructureandprovidinghigh-qualityurbanpublicservices.
Keywords:populationflow;network;structure;ERGM
(責任編輯:趙春江)