——以京津冀地區為例"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?金耀,李士成,倪永,楊楠
(1.中國地質環境監測院,北京 100081;2.中國地質大學(武漢)公共管理學院,武漢 430074;3.中國環境監測總站 國家環境保護環境監測質量控制重點實驗室,北京 100012)
人口空間分布形態可以刻畫人類活動的強度和范圍,是研究人地關系的重要指標,其廣泛應用于區域規劃、資源配置、政府決策、災害評估及生態保護等各個領域。掌握和研究人口信息數據可以為區域協同發展研究、總體規劃等工作提供科學支撐。傳統的人口數據主要來源于人口普查和年度人口統計年鑒數據,通常以行政單元逐級匯總而來,存在分辨率低、更新周期長、空間粒度粗的問題。此外,在進行空間分析或與其他數據融合時,存在行政單元和自然單元邊界不一致、受行政界線變遷影響等問題[1-3]。人口數據格網化,是按照數學模型將基于行政區的人口數據分配到格網中,實現統計單元由行政單元向格網的轉換[4],能直觀、多尺度地表達人口的真實分布,是對統計數據的細化和補充,已經成為人口空間分布研究信息獲取的主要手段之一。
人口格網化的研究歷史較早,可以追溯到1936年Wright[5]使用地形圖估算各類型居民點人口密度,將分區密度制圖理念引入人口空間分布研究中,這成為后期人口數據格網化的主要理論依據。此后,國外學者利用遙感數據、土地分類數據建立人口分布模型來研究人口格網化[6-11]。目前,國際上一些科研機構已發布了全球人口空間化柵格數據,如英國南安普頓大學發布的WorldPop世界人口密度數據以及哥倫比亞大學發布的GPW(gridded population of the world)人口數據。
國內也有很多人口格網化方面的研究。早期的學者應用面積權重模型進行人口數據格網化,如呂安民等[12]提出的面積內插法和范一大等[13]提出的面積權重法,該類方法未考慮影響人口空間分布的環境因素。后來有些學者通過建立環境因子模型研究人口數據格網化,如文獻[14-15]基于地表覆蓋、河流及道路等環境因子進行人口格網化,該方法模型影響因子較多,不易確定各因子的權重系數。夜間燈光數據可以指示區域社會經濟發展及人類活動,文獻[16-17]采用夜間燈光進行人口模擬,該方法雖參數少,但是在人口高密度的城市地區及人口低密度的鄉村地區誤差較大。因此,文獻[18-19]把地表覆蓋類型和DMSP/OLS夜間燈光數據結合進行人口格網化研究。隨著新一代夜間燈光數據NPP/VIIRS的應用,很多學者開始采用NPP/VIIRS數據進行人口格網化研究[20-23],并取得了較好的模擬效果。胡云鋒等[24]對比了DMSP/OLS和NPP/VIIRS夜間燈光數據進行人口模擬,認為NPP/VIIRS夜間燈光數據更適用于人口數據空間化研究。
地形是影響人口分布的重要自然環境因素,當前基于地表覆蓋數據和夜間燈光的人口空間化研究,僅考慮了地表覆蓋和夜間燈光數據與人口數量的關系,而忽略了地形因素,這不利于研究范圍較大且地形復雜區域的人口空間化研究?;谝归g燈光和地表覆蓋的人口空間化模擬誤差容易出現在人口密度極低或極高區域,在人口密度差異較大的區域,影響人口分布的主導因子也存各異,使用統一的模型參數較難適配所有的地區。此外,在以往研究中,高分辨率的地表覆蓋數據會被重采樣為與低空間分辨率夜間燈光數據相同的空間分辨率,這會犧牲原始地表覆蓋數據的精度,因此,本文中嘗試在模擬過程中采用較高空間分辨率的輸入數據。鑒于此,本研究以地形復雜且人口空間分布異質性較高的京津冀地區為例,引入地形和人口密度因子進行分區建模的思路,采用2017年度NPP/VIIRS夜間燈光數據及高分辨率的土地覆蓋數據,與區縣級常住人口統計數據回歸建模,得到高精度的人口空間化數據。本文旨在完善在地形復雜且人口空間分布異質性較高地區的人口空間化的方法,建立京津冀地區2017年度的精細化格網人口數據。
京津冀位于中國華北,包括北京、天津兩個直轄市和河北省全境,界于36°05′N~42°40′N,113°27′E~119°50′E之間,面積21.8×104km2。區域東臨渤海,西為太行山,北為燕山,地勢西北高、東南低,由西北向東南傾斜(圖1),兼有高原、山地、丘陵、平原、草原和海濱地貌類型,豐富的地貌類型使得該地區具有代表性。研究其人口空間化,可為其他地形復雜地區的人口空間化研究提供參考。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
此外,京津冀地區是華北地區重要的人口聚集地和區域中心,2018年該地區常住人口達11 270.1萬人,占全國總人口的8.08%[25],區域平均人口密度達523人/km2。但是該區域人口分布不均衡,既有人口密集的國際化大都市,也有人口稀疏的海濱曬鹽場,這給人口格網化增加了難度。此外,人口分布的巨大差異對跨區域人口管理、資源協同配置及城市群產業布局提出了挑戰,研究精細化的人口空間分布特征可為京津冀協同發展戰略決策提供基礎數據和技術支持。吳健生等[26]基于DMSP/OLS夜間燈光、土地覆蓋和其他因子數據建模模擬京津冀地區2010年人口數據,模型涉及的參數因子較多,且確定各因子權重所采用的層次分析法與專家打分法比較復雜。王曉潔等[27]采用2000年DMSP/OLS夜間燈光結合2019年的手機定位趨勢來模擬京津冀地區2000年人口數據,方法較新穎,但數據的時間一致性還有待商榷。此外,這兩項研究模擬的人口數據的年度較早,難以滿足當前人口精細化管理對數據的高時效性。因此,本文采用新一代NPP/VIIRS夜間燈光和土地覆蓋數據,引入地形和人口密度因子分區,利用逐步回歸模型來模擬京津冀地區2017年高精度人口格網數據。
1)NPP/VIIRS夜間燈光數據。NPP/VIIRS是新一代夜間燈光數據,較DMSP/OLS夜間燈光數據具有更高的灰度級和空間分辨率。受到雜散光污染,數據在夏季像元值缺失嚴重,因此,本文采用了陳慕琳等[28]使用三次Hermite插值法校正的京津冀地區2017年NPP/VIIRS年平均夜間燈光數據。
2)地表覆蓋數據(land cover,LC)。本文使用的LC數據來自于清華大學發布的10 m分辨率全球地表覆蓋圖(FROM-GLC10)[29],時間為2017年,該數據集將地表覆蓋/覆被分為耕地、林地、草地、水域、不透水面等十個類別。
3)人口統計數據。本文使用的區縣和鄉鎮人口數據是常住人口統計數據,區縣人口統計數據來自京津冀各統計局公布的統計年鑒數據,鄉鎮人口數據來自《中國縣域統計年鑒(鄉鎮卷)-2018》[30]。
4)行政區邊界數據。本文所使用的行政邊界包括區縣和鄉鎮行政邊界,數據來源于國家地球系統科學數據中心[31-32](http://geodata.cn)。
5)地形數據。本文使用的地形數據是SRTM3(shuttle radar topography mission),空間分辨率為90 m,數據來源于中國科學院計算機網絡信息中心地理空間數據云平臺(http://www.gscloud.cn)。
6)WorldPop人口數據。本文使用的WorldPop人口數據是由英國南安普頓大學地理數據研究所發布的,時間為2017年,空間分辨率為3″(約100 m)和30″(約1 km)[33-34],數據來源于WorldPop網站(https://wopr.worldpop.org)。
本文采用的所有空間數據都轉化為Albers-equal-area投影,中央經線為105°E,標準緯線為25°N和47°N。采用雙線性插值法將15″空間分辨率的NPP/VIIRS夜間燈光數據重采樣為10 m和100 m空間分辨率。采用眾數法將10 m空間分辨率的地表覆蓋數據重采樣為100 m。使用SRTM3地形數據生成地形起伏度(relief degree of land surface,RDLS),計算每個區縣的平均地形起伏度和平均海拔(height)。
區縣和鄉鎮行政邊界數據分別為2015年和2012年,通過對比參考民政部網站公布的行政區劃變更信息,把行政邊界數據調整更新到2017年。將人口統計信息與行政邊界數據關聯,為每個行政區域賦值常住人口,并計算每個區縣的人口密度。

表1 數據來源及屬性
首先,分析研究區域縣級常住人口數量與各類地表覆蓋像元數、地表覆蓋夜間燈光指數總量及地形因子之間的相關性,為后期參數選擇及模型構建提供依據。然后,利用地形因子和人口密度,對研究區進行分區,再采用多源逐步回歸分析,建立各個分區區縣人口數量與地表覆蓋像元數量及夜間燈光指數總量的回歸模型。利用回歸模型估算格網人口數量,基于區縣人口統計數據對模擬結果進行校正。最后,對人口空間化模擬結果進行精度分析。詳細的人口空間化技術路線如圖2所示。

圖2 人口空間化技術路線
1)數據融合。土地覆蓋可定性地指示人口的空間分布范圍,如土地覆蓋中的不透水面主要為人造地表,是人類活動的主要場所,湖泊和河流等水域基本無人居住。夜間燈光數據是較綜合的指標,涵蓋了居民點、交通、社會經濟等信息,燈光的強度可以指示人口數量的情況?;谕恋馗采w和夜間燈光數據進行建模,模型參數相對較少,易于構建。但是在高人口密度地區燈光強度趨于飽和,且由于夜間燈光數據空間分辨率較大,無法識別出人口數量的差異。此外,土地覆蓋數據在分類的過程中會存在一定誤差,一些零散的人口聚集點可能無法識別。
因此,把高分辨率的土地覆蓋與夜間燈光數據進行融合,生成地表覆蓋夜間燈光指數,不僅可以識別散落在耕地、林地及草地上的人口集聚點,還可以細化燈光強度飽和區的人口空間分布情況。土地覆蓋數據中的不透水面(impervious surface)與人口分布關系比較密切,耕地(cropland)、林地(forest)和草地(grassland)上會存在零散的人口分布點。因此,從土地覆蓋中提取這四類土地類型,并將NPP/VIIRS夜間燈光數據與其進行融合,生成耕地夜間燈光指數、林地夜間燈光指數、草地夜間燈光指數及不透水面夜間燈光指數四個數據。其表達如式(1)所示。
(1)
式中:M為參與構建模型的土地類型個數,這里取值為4;LLCj為第j種地表覆蓋類型上的夜光燈指數;LCjk為第k個格網第j種地表覆蓋類型;Lightjk為第k個格網第j種地表覆蓋類型上的夜光燈指數。
2)基于地形和人口密度分區。在地形地貌復雜地區,地形是人口分布不可忽略的影響因子,研究表明人口分布密度與海拔呈負相關[35],且人口分布向地形起伏度低的地區集中[36]。因此在構建模型前,通過海拔和地形起伏度兩個地形因子把研究區劃分成了山地和平原區,可以兼顧地形因子對人口的影響。此外,基于夜間燈光和地表覆蓋的人口空間化模擬誤差容易出現在人口密度極低或極高區域,因此,按照人口密度把研究區再分區,可以確保分區構建的模型在不同人口密度區內達到最佳的擬合效果。
以區縣級常住人口數作為因變量,以區縣各地表覆蓋類型像元數(面積)和各地表覆蓋夜間燈光指數總量為自變量,建立逐步回歸分析模型,求解模擬參數。為了保證模型估算的人口數量為非負,在進行回歸分析時,剔除系數為負的變量,然后將剩余變量再次引入模型進行回歸,最終得到的模型所有自變量的回歸系數全為正。模型表達如式(2)所示。
(2)
式中:Pi為第i個縣級統計人口;M為參與構建模型的土地類型個數,這里取值為4;LCij、LLCij分別為第i個區縣第j種地表覆蓋類型上的像元總個數和夜間燈光指數總量;aj、bj為回歸系數。利用上述結果得到格網尺度人口,計算如式(3)所示。
(3)
式中:Pi k為第i個區縣內第k個格網的模擬人口數;LCijk、LLCijk分別為第i個區縣第k個格網第j種地表覆蓋類型上的像元數和夜光燈指數總量。
通過式(3)初步模擬各個格網的人口數量,采用區縣常住人口統計數據對初始模擬人口進行校正,確??h域尺度上匯總的模擬的人口數量與實際統計的人口數量保持一致。校正如式(4)所示。
(4)
式中:P′i k為第i個縣內第k個格網上的最終模擬人口數;Pi m為第i個縣內第m個格網上的初始模擬人口數;N為第i個區縣的格網個數。
對模擬的人口空間化結果采用鄉鎮級人口統計數據進行檢驗。本文選擇相關系數(R)、均方根誤差(root mean square error,RMSE)及平均相對誤差(mean relative error,MRE)三個指標來衡量模擬結果的精度。
通過相關性分析發現(表2),京津冀地區縣級常住人口數量與四類地表覆蓋類型的夜間燈光指數總量及不透水面像元數量五個因子顯著正相關,與地形起伏度和海拔因子負相關。

表2 各區縣人口統計值與各要素之間的相關系數
地表覆蓋中的不透水面主要為人造地表,是人類活動的主要場所,與人口數量的相關性大于0.58,通過與夜間燈光數據融合,其相關性提升到了0.81以上。而地表覆蓋中的耕地、林地及草地的像元數與人口相關性較低,通過與夜間燈光指數融合,這三種地表覆蓋類型與人口數量的相關性大幅提升。
把平均海拔大于1 km或平均地形起伏度大于50 m的區縣劃分為山地區,其他區縣劃為平原區,再以平原區166個區縣人口密度的平均值833人/km2為閾值,把平原地區劃分為高和低密度人口區。通過地形和人口密度分區,京津冀地區200個區縣劃分成了3個區,其中34個區縣屬于山地區(人口密度差距不大,未按人口密度再分區),111個區縣屬于平原低密度人口區,55個區縣屬于平原高密度人口區。分區結果如圖3所示。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
在進行人口格網化的過程中,為了探索分區建模及輸入數據的空間分辨率對人口模擬精度的影響。本文中采用了分區/不分區及輸入數據為10 m/100 m空間分辨率兩個因素,形成四組模擬方案進行人口格網化模擬對比。最終得到回歸方程參數如表3所示。

表3 模型回歸系數表
1)精度驗證及誤差分析。隨機選取京津冀地區140個鄉鎮街道作為驗證數據,計算鄉鎮街道2017年常住人口統計數據與格網化人口數據的誤差。表4是各組方案模擬結果的對比。由表4可以看出,在其他因子不變情況下,分區模擬的效果要好于不分區模擬;入參數據空間分辨率100 m要優于10 m。因此,最優的模擬方案為在模擬時地表覆蓋數據和夜間燈光數據采樣為100 m分辨率進行分區模擬,模擬的人口數與鄉鎮人口統計數的相關系數達到了0.88,平均相對誤差為32.71%。通過與已有的同類研究進行對比發現,文獻[24]基于NPP/VIIRS夜間燈光與LC數據的川渝地區人口空間化模擬結果的平均相對誤差為44.62%。這表明在模擬時,參考地形和人口密度因子分區可以提升基于LC和夜間燈光數據的人口空間化的模擬精度。

表4 各模擬方案人口空間化誤差統計表
對分區模擬的相對誤差做進一步的分級統計(圖4),可以看出人口空間化準確(MRE≤15%)的鄉鎮個數為42,占總鄉鎮數的30.00%;人口空間化較準確(15%

圖4 相對誤差分級統計表
2)與WorldPop數據對比。
(1)定量誤差。以200個區縣和140個鄉鎮的統計人口數據為檢驗標準,把模擬的最優人口數據結果JJJPop(500 m空間分辨率)與WorldPop(1 km及100 m空間分辨率)進行比較,結果如表4所示。通過分析發現:在整個區域和區縣層面,JJJPop精度遠優于WorldPop;在鄉鎮層面,除了WorldPop(100 m)的MRE稍小于JJJPop之外,JJJPop其他精度都優于WorldPop。這是由于本研究是基于區縣級別的人口統計數據進行的模擬,且在模擬過程中采用了區縣級人口校正,確保了模擬的人口結果在整個區域和區縣層面與統計人口基本一致,但在鄉鎮級別的人口模擬精度會衰減,而WorldPop(100 m)由于有較高的空間分辨率,在鄉鎮層面的人口統計稍有優勢。
(2)區域對比。選擇承德市及邯鄲市的JJJPop和WorldPop進行區域對比(圖5)。WorldPop數據在邯鄲市中心人口偏少,在承德市的雙灤區和鷹手營子礦區的人口分布偏少,這與實際情況不符,此外,WorldPop(100 m)在局部的人口空間化跳躍性較大。因此,JJJPop在承德市和邯鄲市的人口空間分布模擬更為合理。

圖5 JJJPop與WorldPop模擬對比

表5 兩種人口分布數據對比特征
圖6(a)是最終模擬的京津冀地區500 m格網人口數據。通過分析發現,京津冀地區人口分布大體上呈現西北山地區域人口密度低,東南平原人口密度高。將模擬的格網人口數據與京津冀分區圖疊加分析發現:區域10.25%的人口位于占區域總面積45.69%的山地區,人口主要分布于山間地勢平坦的谷地。區域43.59%的人口位于占區域總面積44.13%的平原低密度人口區,區域46.17%的人口聚集在占區域總面積10.18%的平原高密度人口區。平原區人口主要位于經濟發達的區域中心城市及縣城駐地附近,高密度人口區主要位于地級市市轄區及交通干道附近。通過分析圖6(b)也可以得到京津冀人口分布的大體趨勢,但其詳細程度遠低于空間化的人口數據,無法體現區縣內部精細的人口分布特征。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
本研究針對區域地貌復雜且人口空間分布異質性較高的京津冀地區,融合地表覆蓋和NPP/VIIRS夜間燈光數據,引入地形和人口密度因子分區建模來模擬人口格網化數據,該方法提高了地形復雜且人口空間分布異質性較高地區人口空間化的精度,獲得了京津冀地區2017年高精度的500 m格網人口數據。有以下結論。
1)分區模擬可以提升模擬結果的精度。在建立人口空間化回歸方程時,為了確保模擬人口不出現負值,方程的各項回歸系數都應該為正數。地形因子與人口數量呈負相關,在以往的人口格網化研究中,為了回歸方程系數的非負性,地形因子常被忽略。基于地形因子把研究區分為山地和平原區,可兼顧地形因素對人口分布的影響。此外,按照人口密度分區建模,可以有效區分不同人口密度區的模型特征,實現區域最優模擬,從而提高人口模擬精度。
2)NPP/VIIRS夜間燈光與地表覆蓋數據進行融合,可以有效提升地表覆蓋數據與人口分布之間的相關性。地表覆蓋分類數據在分類的過程中會存在一定誤差,一些零星的地表覆蓋類別可能無法識別。地表覆蓋分類數據與NPP/VIIRS夜間燈光數據融合后,可以識別出耕地、林地及草地上的人口集聚點,提升地表覆蓋數據與人口分布之間的相關性。
3)建模時將夜間燈光數據的空間分辨率重采樣為與地表覆蓋數據分辨率一樣的100 m,可以獲得較好的模擬效果。原始的10 m地表覆蓋數據雖然空間分辨率高,但由于原始地表覆蓋數據在生成過程中也存在一定誤差,與夜間燈光數據融合后會將這種誤差放大,從而影響最終的模擬精度。
4)本研究中模擬得到的京津冀500 m格網人口數據,精度優于WorldPop人口數據,其相對于基于區縣統計人口密度數據,可以展現更詳細的人口分布特征。京津冀地區人口分布大體上呈現西北山地區域人口密度低,東南平原人口密度高的特點。46.17%的人口聚集在占區域面積10.18%的地區,主要位于地級市市轄區及交通干道附近。