摘 要:人口空間化數據對城市建設、搶險救災、環境管理和社會發展各個方面具有重要作用。近年來隨著夜間燈光遙感技術的迅猛發展,基于夜間燈光遙感的人口空間化的研究日益增多,回歸模型、多因子加權平均模型、隨機森林模型等模型算法也日趨完善,方法新穎多樣,結果精度較高。該文系統總結夜間燈光遙感的發展以及基于燈光數據的人口空間化的研究方法,分析現今研究內容和研究方法的熱點難點問題,討論在研究過程中存在的問題以及未來研究發展的方向,希望能夠為相關研究人員提供借鑒。
關鍵詞:夜間燈光;人口;空間化;遙感;多元數據
中圖分類號:TP79 文獻標志碼:A 文章編號:2095-2945(2024)31-0084-04
Abstract: Population spatial data plays an important role in all aspects of urban construction, emergency rescue and disaster relief, environmental management, and social development. In recent years, with the rapid development of night light remote sensing technology, research on population spatialization based on night light remote sensing has increased day by day. Model algorithms such as regression models, multi-factor weighted average models, and random forest models have also become increasingly perfect. The methods are novel and diverse, and the results have high precision. This paper systematically summarizes the development of night light remote sensing and the research methods of population spatialization based on light data, analyzes the hot and difficult issues of current research content and research methods, discusses the problems existing in the research process and the direction of future research development, and hopes to provide reference for relevant researchers.
Keywords: night light; population; spatialization; remote sensing; multivariate data
隨著全球人口的不斷增長,人類對資源的需求不斷增加,對環境的影響日趨嚴重,城市建設、土地利用也越來越頻繁。掌握人口信息,對城市建設、搶險救災、環境管理和社會發展各個方面具有重要作用,也是資源配置和空間優化的重要依據[1]。傳統獲取人口733a2534b39b4e825b86cbe1798edd614368124788dd13586d7172d9fa6dc921數據的方法就是依靠人口普查來獲取,但此種方法獲取的數據不夠完整,而且不能展現出人口的空間分布[2-3]。人口數據空間化是將人口數據進行空間有效分析的重要方法手段,其原理是將人口數據按照一定的規則分布到一定尺度的格網上進行離散化處理,并進行模擬的過程[2,4],該過程可以通過空間分析、人口建模等多種方式實現。這種方法能夠表征某一時間人口在地理空間的分布情況,有效挖掘人口數據與空間數據的相關性,并可以模擬再現獲得其他地區的人口分布數據。
夜間燈光遙感利用遙感技術從空中獲取地球表面的夜間光線強度信息,可以快速地反映人類的活動和空間分布[5]。夜間燈光遙感數據與人口活動相關性較強,因此基于夜間燈光遙感進行人口空間化研究具有理論基礎和數據支撐。
基于夜間燈光遙感數據進行人口空間化研究的主要流程是建模-預測-制圖-精度分析[6]。研究的數據來源主要依靠多源夜間燈光數據結合土地利用數據[7]、統計人口數據、興趣點數據[8]、地表覆蓋數據等多元數據,選用回歸統計模型[9-10]、自相關分析[11-12]、異速增長模型、傳遞函數和隨機森林[6,13-14]等模型進行分析,對區域尺度的人口進行估算,對格網尺度的人口分布進行模擬,并根據已有數據進行精度評價。
基于人口空間化研究的不斷發展,全世界不同學者團隊已制作出覆蓋全球的大尺度人口數據集[14]。歐盟委員會聯合研究中心與美國國際地球科學信息網絡中心合作,采用線性回歸模型,生產了全球尺度的GHS-POP人口密度數據集,現在可提供1975—2030年間每5年間隔的全球數據,空間分辨率可達100 m。數據下載地址為Https://ghsl.jrc.ec.europa.eu。南安普頓大學生產的WorldPop人口密度數據集,現在可提供2000—2020年每年的全球人口數據,空間分辨率為100 m。數據下載地址為Https://hub.worldpop.org。
1 夜間燈光遙感數據類型
夜間燈光遙感的興起始于20世紀70年代的美國軍事氣象衛星計劃(Defense Meteorolgical Satellite Program,DMSP),其搭載的線性掃描業務系統(Operational Linescan System,OLS)傳感器能夠探測到無云情況下的城市燈光以及車流、漁船等發出的微弱燈光,各位學者開始將其應用于研究反映人類活動情況。現在NGDC(美國國家地球物理數據中心)網站上可獲取1992—2013年的DMSP/OLS數據。
進入新世紀以來,由于夜間燈光遙感對于人類活動在一定程度上具有較好的指示性,所以通過運用夜間燈光遙感的圖像來探究人口空間分布的研究越來越得到學者的青睞,基于國防氣象衛星項目的業務線掃描系統(DMSP/OLS)和Suomi國家極軌合作伙伴(Suomi National Polar-orbit Partnership, S-NPP)衛星上搭載的可見光紅外成像輻射儀(Visible Infrared Imaging Radiometer Suite,VIIRS)影像的人口空間化研究不斷發展。現在NOAA(美國國家海洋和大氣管理局)網站上可獲取2012年至今的NPP/VIIRS日、月、年數據。
2018年世界上第一顆兼具遙感和導航的低軌微納智能科學實驗衛星“珞珈一號”成功發射升空,其搭載的高靈敏度夜光相機大大提高了夜間燈光遙感的分辨率和圖像質量,吸引了廣大國內外學者的研究目光,基于“珞珈一號”的人口空間化研究也逐步發展起來。湖北省數據與應用中心高分辨率地球觀測系統可免費提供“珞珈一號”的數據,并提供輻射亮度轉換公式。
2 人口空間化研究熱點
2.1 遙感數據多樣化
自20世紀70年代以來,基于DMSP/OLS的夜間燈光數據的研究不斷興起,隨著技術發展,廣大學者利用其年度的燈光數據作為人口空間化研究的基礎數據進行研究,但由于其自身傳感器的分辨率較低,數據的亮度值存在像元飽和的問題,在不同的尺度和精度的要求下,數據的質量問題也越發突出。NPP/VIIRS數據具有更優的分辨率特性,較長、較連續的數據使其成為專家學者的研究重點,與DMSP/OLS數據的結合使用可以增加研究的時間跨度,成為研究人口空間化分布的重要方法。國產衛星“珞珈一號”提供的高分辨率夜間燈光影像,大大提高了數據的精度,給了廣大研究人員更多的可選擇性(表1)。
不同夜間燈光影像數據由于其傳感器、周期以及當時氣候等一系列原因具有不同的影像特征,所以在人口空間化研究中首要任務是根據燈光數據的優劣以及在研究區內的適宜程度來選取適宜研究的燈光影像。為了驗證研究結果的精度,學者們多選取不同類型的夜間燈光數據綜合使用,并進行對比分析。
2.2 多元數據精細化
社會、自然、經濟和文化的發展變化都對人口的分布具有一定的影響,并且夜間燈光數據由于自身分辨率原因難以滿足精細化研究的需求,所以基于多元數據的研究方法成為人口空間化研究的重要手段。隨著近年來遙感技術飛速發展和地理空間大數據的建設,衛星遙感數據、人口普查數據、土地利用數據、土地覆蓋數據、NDVI數據、經濟發展數據以及海量與人類活動相關的興趣點數據(如路網數據、交通站點數據、文化設施數據等)的分辨率、精細程度越來越高,將此類數據與夜間燈光數據綜合使用可以顯著提高人口空間分布研究的精度。
多元數據的使用方式多為利用單層數據作為變量,或者將不同數據進行融合,將融合結果作為一個單獨變量。對不同變量的相關性進行分析,相關性較強的變量舍棄,對最終選取的變量選取不同的分析方法構建其與人口數據之間的關系模型,并根據人口數據進行校正,對結果進行精度評價,最終進行人口空間化研究。
2.3 模型算法綜合化
在人口空間化的模型和算法上,回歸模型、多因子加權平均模型、隨機森林等模型算法在處理多源遙感數據和多元輔助數據的綜合分析時,可顯著提高研究的精細程度和準確性。
回歸模型旨在建立人口空間化數據與夜間燈光數據的回歸關系。通過已知區域的數據進行待定回歸系數測定,構建線性回歸、空間回歸、逐步回歸等計算模型,回歸結果與多元人口數據結果進行比較驗證模型的精度并進行結果修正。線性回歸模型的計算比較簡單,結果擬合性較好,但由于選擇的數據比較單一,所得的結果過于集中,其精度有提高的空間。考慮到不同地理位置、地貌單元等區域內的差異帶來的變換,GWR(地理加權回歸)模型在線性回歸的基礎上增加了地理信息,增加了線性回歸模型的精度和準確性。空間回歸模型主要包括一階空間回歸、空間滯后模型、空間誤差模型等,與線性回歸模型相比結果精度更高。利用多元數據的逐步回歸模型需要人為地選取自變量的種類,具有一定的主觀性,并且在數據處理過程中,需要剔除某些自相關的自變量或者與明顯與事實不符的自變量,以保證建立模型的可靠性與有效性。往往多元數據得到的數據精度較單一,數據要高,所以也是學者們提高研究精度經常選用的方法。
多因子加權平均模型是按照分析結果和經驗將各自變量分布賦予一定的權重,根據加權計算結果將人口數據進行分配從而得到人口分布。由于各因素權重的賦值帶有一定的經驗性和主觀性,所以采用此種方法需要具有長期的工作經驗。
隨機森林模型旨在建立人口數量與各變量之間的關系,通過隨機選擇變量生成決策樹,并度量各變量的重要程度。此種方法不需要進行過多的擬合即可獲得較高精度的預測值。但需要注意的是,自相關性較強的自變量需要剔除以減少自變量的相關性,多源數據的融合處理也有益于減少模型算法的運算量。隨機森林模型需要全面系統的訓練樣本作為基礎,所以只有在數據比較齊全的區域內或者具有相近特點區域范圍內其預測精度和準確性才能達到比較理想的狀態。此外,隨機森林模型能夠對選取的影響因子重要性進行排序,可以有效遴選出對地區內影響人口分布的主要因素[14]。
由于受夜間燈光數據類型和分辨率的限制,最早的人口空間化研究的主要在洲際、國家等大尺度的空間范圍內。隨著各種模型算法的興起以及各類高分辨率多元數據的使用,改善了數據精度,人口空間化研究已從國家、省市延伸到區縣、鄉鎮等更精細的尺度。此外,不同學者采用分區的方法進行模型構建,可以有效改善復雜地區精度較差的問題。
3 主要攻關方向
3.1 遙感數據
由于DMSP/OLS夜間遙感影像自身原因,在燈光強度較高的區域會出現圖像飽和的現象,像元溢出效應導致夜間燈光遙感的影像數據光照范圍過大,這種飽和現象會影響數據的可靠性與準確性[15]。不同學者針對該情況進行了不同程度的研究與改進,解決方法一是通過一定的技術手段改進該數據的質量,二是通過與其他夜間燈光數據進行比對結合使用選擇更好的影像數據。夜間燈光影像存在大量的背景噪聲和異常值,在影響數據的應用過程中需要進行圖像的去噪處理[16-17]。針對此問題,前人已采用了不同的技術方法對夜間燈光數據進行了去噪處理,效果較好。此外,夜間燈光遙感數據的分辨率普遍較低,DMSP/OLS數據分辨率2 700 m,NPP/VIIRS數據分辨率為700 m,“珞珈一號”分辨率為130 m。所以未來針對夜間遙感數據的研究需要結合較高分辨率的其他多元數據以提高數據的分辨率和精度。
遙感數據的類型可選擇性越來越多,在研究中可以結合高光譜數據弱化背景噪聲對影像質量的影響,還可以利用重采樣的方法提高原始影像的分辨率,從而改善原始數據分辨率不足、清晰度不夠的問題。
3.2 多元數據
隨著大數據時代的到來,越來越多的興趣點數據逐漸在研究中獲得應用,大大提高了研究的精度。但是在這些數據的使用中要注意數據來源的可靠性、數據的精度尺度等可能會對研究成果帶來一定的影響。多元數據的濫用是導致數據使用效能降低、模型構建結果精度差、模型普適性低的主要原因。此外,高質量多元數據的使用會大大提高模型的精度,但是其成本往往比較高且獲取較為復雜,計算強度也較大,所以難以擴展到大尺度的研究范圍[18]。
在使用研究比較深入、使用比較成熟的數據時,要注意數據的精度以及適宜的研究程度。在使用較為新穎的數據時,要確保研究的尺度合適、精度準確、數據可靠。在研究中應用多元數據時要分析不同數據之間的相關性,對數據進行取舍,避免數據類型相關性過大導致快速過擬合。
4 結論
夜間燈光遙感的發展時間較短,但是發展趨勢比較迅猛。由于其與人類活動的相關性較強,隨著國內外更多遙感衛星的發射升空,基于夜間燈光遙感數據的研究越發重要。基于夜間燈光遙感的人口空間化研究是夜間燈光遙感的一個主要發展方向和研究熱點,研究的尺度范圍大、可用數據源多、分析方法多樣、模型構建愈加復雜。未來研究方向主要是多元數據的融合和不同算法的使用,目標應用場景也向著更加精細化、復雜化的方向發展。針對夜間燈光遙感在人口空間化研究中存在的諸多問題,在后續的研究中需要重點關注夜間燈光遙感數據的穩定性和連續性、多元數據的相關性、模型構建的合理性、分析方法的精度等問題。
參考文獻:
[1] 高義,王輝,王培濤,等.基于人口普查與多源夜間燈光數據的海岸帶人口空間化分析[J].資源科學,2013,35(12):2517-2523.
[2] 肖東升,楊松.基于夜間燈光數據的人口空間分布研究綜述[J].國土資源遙感,2019,31(3):10-19.
[3] 婁格,陳秋曉.基于“珞珈一號”夜光遙感數據融合的鄉村人口空間化方法研究[J].建筑與文化,2021(1):74-75.
[4] 閆慶武,卞正富.基于GIS的社會統計數據空間化處理方法[J].云南地理環境研究,2007(2):92-97.
[5] 鄭淵茂,何原榮,王曉榮,等.夜光遙感數據應用述評與展望[J].遙感信息,2020,35(3):1-14.
[6] 高雪梅,楊續超,陳柏儒,等.基于隨機森林模型的環渤海地區人口空間化模擬[J].地球信息科學學報,2022,24(6):1150-1162.
[7] 王明明,王卷樂.基于夜間燈光與土地利用數據的山東省鄉鎮級人口數據空間化[J].地球信息科學學報,2019,21(5):699-709.
[8] 劉楊,李宏偉,楊斌程,等.基于遙感數據和POI數據的GDP空間化研究——以北京市為例[J].地域研究與開發,2021,40(2):27-32,39.
[9] 李翔,陳振杰,吳潔璇,等.基于夜間燈光數據和空間回歸模型的城市常住人口格網化方法研究[J].地球信息科學學報,2017,19(10):1298-1305.
[10] 王珂靖,蔡紅艷,楊小喚.多元統計回歸及地理加權回歸方法在多尺度人口空間化研究中的應用[J].地理科學進展,2016,35(12):1494-1505.
[11] 仇嘉豪,柳林,裴冬梅,等.兼顧空間自相關性和異質性的人口空間化模型[J].測繪科學,2022,47(7):216-226.
[12] 孫小芳.夜光遙感支持下的城市人口核密度空間化及自相關分析[J].地球信息科學學報,2020,22(11):2256-2266.
[13] 譚敏,劉凱,柳林,等.基于隨機森林模型的珠江三角洲30 m格網人口空間化[J].地理科學進展,2017,36(10):1304-1312.
[14] 劉藝,楊歆佳,劉勁松.基于隨機森林的人口密度模型優化試驗研究[J].全球變化數據學報(中英文),2020,4(4):402-416.
[15] 卓莉,張曉帆,鄭璟,等.基于EVI指數的DMSP/OLS夜間燈光數據去飽和方法[J].地理學報,2015,70(8):1339-1350.
[16] 王美玲,張和生.一種適用于珞珈一號夜間燈光影像的去噪方法[J].遙感信息,2021,36(2):114-119.
[17] SHI K, YU B, HUANG Y, et al. Evaluating the ability of NPP-VIIRS nighttime light data to estimate the gross domestic product and the electric power consumption of China at multiple scales: A comparison with DMSP-OLS data [J]. Remote Sensing, 2014,6(2):1705-1724.
[18] 高鵬.基于夜間燈光校正和多源地圖融合的高精度人口空間制圖研究[D].西安:長安大學,2022.