999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于珞珈一號和隨機森林的蘭州市GDP空間化

2022-08-18 08:53:06謝甫孫建國于明雪呂建康馬恒利
遙感信息 2022年2期
關鍵詞:模型

謝甫,孫建國,于明雪,呂建康,馬恒利

(1.蘭州交通大學 測繪與地理信息學院,蘭州 730030;2.地理國情監測技術應用國家地方聯合工程研究中心,蘭州 730030;3.甘肅省地理國情監測工程實驗室,蘭州 730030)

0 引言

國內生產總值(gross domestic product,GDP)是反映經濟發展和資源配置的重要指標[1]。傳統GDP數據一般以行政區劃為單元進行統計,無法反映行政單元內部的空間分布差異。為了解決這一問題,近年來眾多學者開展了GDP空間化研究,將行政單元GDP分配到特定大小(常用1 km×1 km)的格網上。空間化的GDP與其他地理數據結合,能夠更好地應用于一些地表現象的空間格局分析[2]。

GDP空間化方法的發展大致經歷了三個階段:空間插值法[3]、基于土地利用數據的回歸模型法[4]和結合多源數據的回歸模型法[5]。一般地,第三種方法精度更高,尤其是夜間燈光(night-time light,NTL)衛星遙感數據的使用極大地提高了模型性能。NTL數據在夜間收集,消除了大多數自然干擾,可以有效反映人類活動強度和社會經濟發展水平[6]。

目前,大多數研究采用的NTL是美國國防氣象衛星計劃(DMSP/OLS)和美國國家極地軌道衛星提供的可見光紅外成像輻射儀(NPP/VIIRS)數據[7-9]。但是,DMSP/OLS的過飽和現象會削弱與GDP的相關性,NPP/VIIRS因空間分辨率相對較低而應用受限。我國自主研發的全球首顆專業夜光衛星珞珈一號(LJ1-01)NTL的空間分辨率為130 m,光譜分辨率為32 bit,均遠高于DMSP/OLS和NPP/VIIRS,具備更豐富的細節特征,在社會經濟相關學科領域逐漸展現出廣泛的應用潛力[10]。從模型實現來看,以往研究大多使用傳統的多元線性回歸(multivariate linear regression,MLR)。近年來,機器學習方法由于其預測精度高且不需要數據假設而逐漸在社會經濟數據空間化研究中得到應用,將機器學習方法應用于社會經濟數據空間化可以極大地提高建模精度[11-14]。其中,隨機森林(random forest,RF)在防止過度擬合、處理缺失值和分類值建模等方面具有較大優勢,更多地被應用于GDP空間化研究中[15]。

以往,GDP空間化大多基于縣級及以上行政單元的統計數據而實現,格網和行政單元之間存在較大的尺度間隙,會導致預測的準確性偏低[16]。鄉、鎮和街道是我國的基本行政單元(以下簡稱“鄉鎮”),相對而言,其尺度與空間化目標格網尺度更為接近,以鄉鎮為統計單元進行GDP空間化建模可以有效降低尺度間隙導致的不確定性。本文基于118個鄉鎮單元的統計GDP,使用LJ1-01 NTL及輔助數據和MLR/RF方法進行蘭州市GDP的1 km×1 km格網空間化,分析其空間格局,旨在驗證鄉鎮行政規模上通過LJ1-01 NTL數據預測GDP的潛力,同時為蘭州市城市規劃和經濟發展決策提供數據支撐。

1 研究區概況與數據來源

1.1 研究區概況

蘭州市(圖1)位于甘肅省中部,102°36′E~104°34′E,35°34′N~37°07′N,屬黃土高原低山丘陵區,深居大陸腹地,現轄城關、七里河、安寧、西固、紅古5個區和永登、榆中、皋蘭3個縣,包括118個鄉、鎮和街道,東西長153 km,南北寬130 km,總面積13 086 km2。市區呈東西向,長約35 km,位于黃河谷地中,海拔約1 500 m。

圖1 蘭州市概況圖

蘭州市作為計劃經濟時期興起的以石化產業為主導的綜合性工業城市,目前正處于由工業化中期向工業化后期過渡的關鍵時期,其工業生產功能不斷弱化,服務功能逐漸強化,產業結構也逐漸由生產制造型向生產服務型轉變,現已成為我國西北內陸具有重要影響力的中心性城市。

1.2 數據來源

本研究中使用的數據主要包括LJ1-01 NTL、Landsat 8影像、數字高程模型(DEM)、路網、土地利用數據、歸一化植被指數(NDVI)和GDP統計數據。覆蓋蘭州市的LJ1-01 NTL影像共10幅,時間跨度從2018年7月—2019年2月。DEM為30 m空間分辨率的ASTER GDEM。Landsat 8數據為2018年8月的多幅影像,空間分辨率為30 m。土地利用數據來自清華大學地球系統科學系宮鵬教授團隊研發的世界首套“2017年10 m分辨率全球土地覆蓋產品(FROM-GLC10)”,包括10個地類。路網數據源自開源數據OSM,包括公路、城市道路、農村道路和鐵路。NDVI來源于美國國家航空航天局的MODIS植被指數產品MOD13Q1,時間分辨率為16 d,空間分辨率為1 km,采用最大值合成法計算出2018年NDVI均值。GDP數據由蘭州市各縣統計局發布數據整理而來。建立研究區1 km×1 km規則格網,并將所有數據統一轉換到Albers投影。

2 方法

2.1 自變量選擇與處理

根據前人研究成果,本研究考慮了6個自變量:NTL、地表溫度(land surface temperature,LST)、建筑用地占比(building coverage,BC)、平地占比(flat pixel coverage,FPC)、路網密度(road network density,RND)和NDVI。

LST受人造地表和人類活動的高度影響,可以在很大程度上表明經濟活動的強度,因此是一個重要的GDP預測因子。研究區LST由陸地衛星Landsat 8影像計算而來。NDVI可以反映植被覆蓋度和植被生長狀態,與農業、林業的產出有較強的相關性,以NDVI為預測因子有助于提高GDP預測的精度。土地利用直接反映了人類活動和環境之間的相互作用,地形和交通條件也對經濟分布有很大影響。因此,BC、FPC和RND也被列為候選預測因子,分別從土地利用數據、DEM和OSM中計算獲取。FPC計算中,坡度小于5°的像素被認為是平面像素。

由于大氣干擾和偶然誤差,LJ1-01 NTL數據的DN值存在偏差,需要進行年內穩定性校正和輻射校正[17]。年內穩定性校正公式如式(1)所示。

(1)

式中:DN(j,i)為j時期第i像元的DN值;n=10,分別代表10幅不同時期影像;DNi為校正后的第i像元的DN值。輻射校正參考高分辨率對地觀測系統湖北數據與應用中心提供的輻射亮度轉換公式進行轉換,如式(2)所示。

(2)

式中:L為校正后輻射亮度值,單位為w/(m2×sr×μm);DN為原始影像灰度值。

自變量之間可能高度相關,因此通過計算方差膨脹因子(variance inflation factor,VIF)確定6個自變量的共線性。表1是通過共線性檢驗給出的自變量VIF值。其中4個自變量(TNL、LST、FPC、NDVI)顯示相對較低的VIF值(VIF<5),2個自變量(BC、RND)VIF值較高(VIF>20),存在共線情況,因此需要選擇自變量進行建模。

表1 自變量共線性檢驗

2.2 建模方法

MLR算法是流行的統計算法之一,已廣泛用于GDP空間化。RF算法是Breiman[18]提出的一種集成學習算法,它通過自采樣的多次迭代生成多個樣本,并基于樣本建立相應的決策樹。RF回歸是通過組合這些多重決策樹開發的,最終的預測結果由所有決策樹預測結果的均值來確定。與MLR相比,RF回歸具有預測精度高、不需要假設先驗概率分布以及具有分析變量重要性能力等優點[19]。

蘭州市118個鄉鎮的6個自變量用于擬合和驗證模型。為了避免模型過度擬合,有必要控制模型的復雜度。篩選變量數據有效值,采用篩選后的數據建立MLR和RF模型,調整建模自變量數量使模型誤差最小,以選擇最優的輸入變量。同時對于RF模型,調整生成的決策樹數量和樹深,選擇最優的參數設置,使RF回歸模型誤差最小。

2.3 模型驗證

采用10-K交叉驗證方法對MLR和RF模型的性能進行驗證。把建模數據隨機平均分成10個折疊,其中9個折疊用于訓練模型,剩下的一個折疊用于驗證模型。然后,重復該過程,直到所有的折疊都被用作驗證數據一次。在本研究中,使用平均絕對誤差(MAE)和決定系數(R2)表示模型精度,計算如式(3)、式(4)所示。

(3)

(4)

2.4 變量重要性分析

為了研究RF模型中各變量的重要性,進行了變量重要性分析,通過計算平均下降精度(%IncMSE)以衡量變量的重要性。%IncMSE指的是隨機置換變量時均方誤差的增加,增量值越高,表明變量的隨機排列導致的誤差越大,因此變量的重要性越大,其計算如式(5)所示。

(5)

式中:MSE是基于原始輸入變量建立的模型的均方誤差;MSEpermuted是變量隨機排列后建立模型的均方誤差。

2.5 GDP空間化

將性能最優的RF回歸模型應用于蘭州市1 km×1 km格網,繪制蘭州市GDP 空間化分布圖。由于模型存在適用性誤差,預測的鄉鎮內格網GDP總和與鄉鎮統計GDP數據之間存在差異。為了確保預測的鄉鎮GDP和實際統計鄉鎮GDP之間的一致性,預測的GDP采用式(6)校正。

(6)

3 結果與分析

3.1 模型表現

圖2為 MLR和RF回歸模型10-K交叉驗證的MAE的均值隨自變量個數的變化。對于MLR模型,MAE隨自變量個數變化較小。對于RF模型,當自變量數量為3時,MAE達到最小,模型精度最高。圖3為RF回歸模型中6個自變量的%IncMSE增量百分比。NTL的增量值最高,為0.35,這表明NTL可以有效地描述經濟活動的強度。NTL反映了夜間照明的強度和密度,與社會經濟活動密切相關。僅次于TNL,BC也有較高的%IncMSE增量值,為0.33。BC反映了土地開發強度,蘭州市受限于地形,其工廠和商業地區較為集中,BC值越高,地區產值也就越高。FPC和LST的%IncMSE值分別為0.18和0.12,蘭州市平坦地區主要分布在黃河兩岸的建成區,而影響地表溫度的主要因素即人造地表和人類活動也主要分布在建成區,變量信息相互解釋,導致其重要性較為一般。RND和NDVI的%IncMSE值較低,說明這兩個變量對GDP估計精度的影響較低。道路交通分布是反映經濟分布的重要因素,但是在蘭州市“兩山夾一河”的地形條件下,道路交通密度與建成區和平坦地區高度重合。且蘭州市由于氣候、地形等原因,農、林產業不發達,在地區產值中的占比較低。這些可能是RND和NDVI在建模時重要性低的主要原因。因此,選取NTL、BC、FPC 3個自變量作為MLR和RF模型的輸入變量。

圖2 模型MAE隨自變量個數的變化

圖3 RF模型自變量重要性檢驗

在RF模型的擬和過程中,調節決策樹棵樹n以提高模型預測精度。圖4顯示了模型交叉驗證的MAE均值隨決策樹棵樹n的變化。MAE均值在n等于13時達到最小值,然后逐漸趨于平穩。因此,RF回歸模型最終確定的參數n為13。

圖4 RF模型MAE隨決策樹棵樹n的變化

圖5顯示了MLR和RF預測鄉鎮GDP和實際鄉鎮GDP的散點圖。MLR模型的R2為0.73,MAE為303.18百萬元,RF回歸模型的R2為0.85,平均絕對誤差為246.64百萬元。雖然RF回歸模型低估了幾個高價值樣本,但大多數樣本的真實和預測值分布都比MLR模型更接近1∶1,表明實際GDP和RF模型預測的GDP之間有較好的一致性。RF算法對變量多重共線性不敏感,并且在定義涉及多個變量的復雜非線性關系時具有魯棒性,因此可以表現出更好的性能[20]。結果表明,RF在GDP預測時表現出較大潛力。

圖5 統計GDP和預測GDP分布散點圖

3.2 蘭州市GDP空間化結果

將性能最優的RF回歸模型應用于格網自變量(NTL、BC和FPC),生成蘭州市1 km×1 km GDP空間分布圖,圖6為蘭州市GDP空間化結果,圖上a、b處分別為蘭州市主城區和西北區域典型鄉鎮、街道。與城鎮單元GDP統計數據相比,空間化后的GDP顯示了鄉鎮內部的GDP空間差異,揭示了更詳細的經濟活動信息。整體上看,蘭州市GDP高密度區集中在沿黃河干流兩岸的建成區,次密度區主要位于黃河支流和鐵路沿線的地形平緩區以及蘭州新區。由于 “兩山夾一河”的復雜地形,蘭州市城區建設沿黃河兩岸發展,因此蘭州市GDP在黃河干流兩岸形成了連續的積聚,并從城市中心向周圍密度逐漸降低。蘭州市西北、東南區域多為山地,受限于地形,經濟發展落后,其GDP密度主要集中在道路尤其是鐵路主干線周圍,且密度相對較低。蘭州新區作為自2012年開始建設的全國第五個、西北第一個國家級新區,受到政府扶持,經濟發展迅速,GDP密度相對較高。

圖6 蘭州市GDP空間化結果

本文是基于鄉、鎮和街道行政單元的GDP空間化。街道一般是城市區域的再劃分,其經濟發展水平普遍高于鄉和鎮。圖7為蘭州市主城區部分鄉鎮、街道的空間化GDP分布。高新區、雁北街道、嘉峪關街道、西站路街道等單元內部格網表現出較高的GDP密度,主要因為這些單元分布在城關區、西固區、七里河區沿黃河兩岸的城市中心,特點是商業經濟發達。十里店街道、安寧堡街道、沙井驛街道等隸屬于安寧區的街道,雖然較黃河兩岸城市中心地理位置較差,但因為安寧區優秀的教育資源促進了這些區域的經濟發展,其內部格網GDP密度也相對較高。而阿干鎮、魏嶺鄉、西果園鎮、河口鄉、達川鄉等和街道相鄰的鄉、鎮,內部格網GDP密度向遠離街道方向逐漸降低,形成連續的分級。

圖7 蘭州市主城區部分鄉鎮、街道GDP空間化詳圖

蘭州市西北、東南區域的一些鄉鎮受山地地形影響,經濟發展落后,GDP密度主要集中在鐵路主干線周圍平坦區域。圖8為蘭州市西北區域部分鄉鎮GDP空間化結果。由于蘭新鐵路修建在中堡鎮、城關鎮、柳樹鄉、紅城鎮等鄉鎮境內,這些鄉鎮內格網GDP分布表現出高度的不均衡,其GDP密度主要集中在鐵路沿線平坦區域,并由鐵路向外呈放射性降低。其他鄉鎮如武勝驛鎮、通遠鄉等多為山地地形的鄉鎮,其內部格網GDP密度普遍偏低,這些地區的經濟主要由農業和旅游業驅動,地形劣勢限制了其經濟發展。蘭州市東南區域和西北區域GDP分布情況類似,其內部格網GDP密度主要集中在寶蘭線沿線,并沿遠離鐵路線方向密度逐漸降低,其他山地地區內部格網GDP密度普遍偏低。

圖8 蘭州市西北部分鄉鎮GDP空間化詳圖

4 討論

鄉鎮是我國的基本行政單元,相對于縣級及以上行政單元,其內部環境、經濟差異較小,以鄉鎮為單元進行GDP空間化建模可以有效減少將行政級別模型應用于格網時的不確定性。過去的GDP空間化研究主要在縣級以上行政單元開展,建立預測回歸模型所得到的R2普遍在0.6~0.9范圍內,且大多數在0.7左右。本研究預測回歸模型的R2為0.85,高于多數研究中的模型精度,表明以鄉鎮、街道單元建模優于更高的行政單元,基于精細尺度建模可以提高GDP空間化的可靠性。

LJ1-01是全球首顆專業夜光遙感衛星,也是目前國際上第三顆具備夜間燈光數據拍攝能力的衛星,彌補了我國在夜間燈光數據獲取方面的不足,具有重要的歷史意義及研究價值。但是,LJ1-01 NTL數據由2018年6月發射的衛星提供,目前只能生產自2018年始少數年份的數據,不能為長時間序列的研究提供數據支持。

近年來,機器學習算法在遙感應用中得到了廣泛的使用。然而,目前將其應用在GDP空間化方面的研究還比較少。由于RF算法具有對多重共線性不敏感和分析變量重要性重要特質,在利用多源數據進行建模時具有優勢。多源數據可以從多個角度反應經濟活動的強度,從而提高模型的準確性。本研究將RF算法應用于蘭州市GDP空間化中,結果表明,利用RF建立回歸模型可以較好地描述社會經濟和NTL及輔助數據之間的復雜關系。

社會經濟活動極其復雜,不同地區和城市的自然環境、工業結構和發展水平的巨大差異使得以單一模型預測GDP空間結構非常困難。因此,有必要繼續開發普適性更高的GDP空間化模型。此外,不同于傳統農業和工業經濟活動受到區域條件的高度影響,互聯網經濟等新經濟形勢超越了區域和空間限制,給未來的GDP空間化研究帶來了巨大的挑戰。

5 結束語

本文基于蘭州市118個鄉鎮單元,采用LJ1-01 NTL數據和其他輔助數據(地表溫度、路網密度、平地占比和建筑用地占比),使用MLR和RF進行GDP的1 km×1 km格網空間化,有以下結論:鄉鎮街道尺度上GDP預測模型的決定系數可達0.85,高于大多文獻得到的基于更大行政單元的模型決定系數;RF模型(MAE=246.64 百萬元,R2=0.85)的精度明顯高于MLR模型(MAE=303.18 百萬元,R2=0.73);LJ1-01 NTL在GDP空間化中有很大的應用潛力;蘭州市GDP高密度區集中在沿黃河干流兩岸的建成區,次密度區主要位于黃河支流和鐵路沿線的地形平緩區以及蘭州新區。

本文研究結果可為制定蘭州市社會經濟發展戰略和政策提供重要參考,也為在其他區域進行精細尺度的社會經濟空間分布圖制作提供借鑒。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产制服丝袜91在线| 久久精品嫩草研究院| 久久精品日日躁夜夜躁欧美| 欧美视频在线播放观看免费福利资源| 91系列在线观看| 无码电影在线观看| 免费啪啪网址| 2021亚洲精品不卡a| 亚洲精品国产综合99久久夜夜嗨| 亚洲香蕉伊综合在人在线| 国产精品无码影视久久久久久久| 欧美日韩第二页| 理论片一区| 成人福利一区二区视频在线| 国产成人a毛片在线| 日韩无码白| 毛片久久网站小视频| 中文国产成人精品久久| 久久成人国产精品免费软件 | 99re66精品视频在线观看| 女同国产精品一区二区| 国产精品亚洲а∨天堂免下载| 国产黄色片在线看| 欧美中文字幕在线视频 | 久久美女精品| 精品国产91爱| 国产在线一区二区视频| 国产精品视频免费网站| 国产呦视频免费视频在线观看 | 久久无码av三级| 毛片三级在线观看| 午夜性刺激在线观看免费| 一区二区三区四区日韩| 亚洲高清在线天堂精品| 精品少妇人妻一区二区| 久久一本日韩精品中文字幕屁孩| 亚洲人妖在线| 蜜桃视频一区二区| 欧美无遮挡国产欧美另类| AV熟女乱| 一级一级特黄女人精品毛片| 免费毛片视频| 人妻21p大胆| 在线播放真实国产乱子伦| 99精品免费欧美成人小视频| 中文字幕在线观| 欧美天堂在线| 欧美一级片在线| 国产高清免费午夜在线视频| 久久99国产综合精品1| 亚洲侵犯无码网址在线观看| 国产丝袜91| 亚洲精品动漫| 国产在线观看成人91| 欧美在线中文字幕| 久久久受www免费人成| 亚洲综合色婷婷| 伊人成人在线| 91九色最新地址| 亚洲一区二区约美女探花| 88av在线| 欧美精品色视频| 中文天堂在线视频| 无码aⅴ精品一区二区三区| YW尤物AV无码国产在线观看| 欧美国产成人在线| 亚洲爱婷婷色69堂| 97一区二区在线播放| 国产自在自线午夜精品视频| 欧美一级专区免费大片| 日韩国产高清无码| 亚洲女同欧美在线| 亚洲日韩AV无码一区二区三区人| 99国产精品一区二区| 在线亚洲精品自拍| 99r在线精品视频在线播放| 亚洲欧洲日产国产无码AV| 欧美色亚洲| 国产精品手机在线观看你懂的| 91免费片| 亚洲三级视频在线观看| 久久天天躁狠狠躁夜夜2020一|