王 恒,江麗鈞
(1.麗水市建設技術管理中心,浙江 麗水 323000)
城市建成區是指城市行政區內實質已成片開發建設、市政公用設備和公共設備基本具備的地區[1],其范圍是衡量城市化發展水平的重要指標。我國城市建成區的提取和劃分主要依據政府統計年鑒和規劃文件,而城市建成區是動態變化的,研究城市擴張需要持續監測建成區的變化,但無法從《中國城市統計年鑒》中獲得城市建成區的準確時間序列[2]。雖然近年來衛星遙感、興趣點(POI)等社會大數據開放程度大大提高,但由于城市建成區的復雜性,準確獲取動態建成區仍是一項具有挑戰性的工作。
城市建成區提取方法主要包括兩種:①基于單一數據源的提取,如參考文獻[3]~[6]根據城市建成區燈光亮度值明顯高于其他地區這一特征,利用夜光遙感數據提取城市建成區范圍,但城市中心夜光遙感數據存在明顯的光飽和[3],導致提取區域大于實際范圍,且存在開花效應,影響提取精度,參考文獻[7]、[8]利用POI在城市與農村邊界處的密度突然變化這一特征提取城市建成區,但受限于本身數據質量和閾值選擇,城市建成區提取精度不高;②多源數據融合提取,如參考文獻[9]~[14]通過融合POI 與燈光數據,利用閾值法提取城市建成區,該方法能在一定程度上實現數據互補,但仍存在邊界溢出、閾值選取受人為主觀因素影響等問題,參考文獻[15]通過融合POI 與不透水面指數來提取建成區,在局部可獲得較好效果。上述方法在提取建成區方面都具有合理性,但也有自身缺陷,參考文獻[16]~[18]利用深度神經網絡來解決遙感數據提取道路、土地覆蓋分類等問題,結果優于傳統方法。目前尚無研究利用多源數據融合結合深度學習提取建成區,因此本文提出一種融合夜光、POI 數據并結合深度學習的城市建成區提取方法,以彌補傳統方法的不足,提高城市建成區提取的準確性。
夜光數據采用2018年7月珞珈一號影像,空間分辨率為130 m,幅寬為260 km。POI數據來源于2018年高德地圖數據,包括餐飲、購物、文化、生活、公園等。由于Sentinel-2 的B2、B4、B6、B11 和B12 波段對建筑用地提取有積極影響[19],因此本文采用這5 個波段數據的合成影像,空間分辨率為10 m。《2018 年城鄉建設統計年鑒》數據來源于住房和城鄉建設部。
1.2.1 夜光數據處理方法
為減少光飽和的影響,對珞珈夜光遙感數據進行輻射校正,采用數據分發網站提供的公式:
式中,L為絕對輻射較正后的輻射亮度值,單位為W/(m2?sr?μm);DN為圖像灰度值。
為消除珞珈數據的地理參考誤差,本文參照遙感影像進行幾何校正,通過閾值分割獲取目標數據。
1.2.2 POI數據處理方法
本文采用核密度估計分析POI 數據,通過閾值分割獲取目標數據。估算公式為:
式中,n為樣本數量;h為帶寬;K為核函數;x為計算函數的向量;Xj為樣本向量。
本文使用的核函數基于四次核函數,即
1.2.3 ResUNet深度學習方法
參考文獻[19]利用深度殘差ResUNet,基于遙感影像提取道路網,并取得了良好效果。本文利用ResUNet方法對哨兵2號衛星遙感影像進行深度學習提取建設用地數據。具體訓練步驟為:①首先下載目標區域哨兵2號遙感影像,利用ENVI軟件合成目標波段,裁剪興趣區域,形成訓練影像數據,再通過ArcGIS軟件提取Esri Land Cover 2020 10 m土地覆蓋數據中的建設用地作為訓練標簽數據;②由于深度學習框架不能直接使用現有的樣本數據,因此采用滑動窗口方法將樣本數據制作成256×256 大小的圖片,步長為128 像素,對圖像進行90°、180°、270°旋轉增強處理,對切片數據在0~1 范圍內進行歸一化處理;③隨機選取90%樣本數據作為訓練集,10%樣本數據作為驗證集;④采用Keras框架進行ResUNet學習模型的數據訓練,網絡迭代次數為50,以二分類交叉熵作為損失函數來評估訓練性能,采用Adam 優化器調整學習率,初始學習率為0.000 1,訓練損失值連續5個迭代次數不降低時,學習率衰減一半,保存基于驗證損失的最優模型;⑤對目標區域遙感影像進行預測。
1.2.4 數據歸一化處理方法
由于各因子核密度的數量級不同,因此本文對夜光遙感數據、POI 數據、深度學習提取數據進行歸一化處理。根據數據標準化原理,本文采用最小—最大值歸一化方法進行標準化,消除因子大小差異對精度的影響。
式中,xi為第i個因子的值;minxi、maxxi分別為xi的最小、最大值。
1.2.5 數據融合方法
幾何平均可在圖像融合中有效消除圖像極值的影響,保留圖像的原始信息,因此得到了廣泛應用[20],融合后的數據可消除密度分析值過大造成的數量級差異,且在一定程度上消除了夜光圖像的背景噪聲,減少了光線溢出的影響。本文采用幾何平均數融合ResUnet學習數據、夜光數據和POI數據,計算公式為:
式中,IUrban 為綜合指數;Pi為POI 核密度灰度值;Ri為ResUNet 學習數據灰度值;Ni為夜光數據灰度值。
1.2.6 精確度評估
本文以實際建成區為參考進行精確度評估,通過統計分類評價指標[21]精確率(precision)、召回率(recall)、F1分數進行定量評估。
式中,TP為模型提取結果為建成區,實際也是建成區的面積;FP為模型提取結果為建成區,實際不是建成區的面積;FN為模型提取結果不是建成區,實際是建成區的面積。
數據處理流程包括夜光數據提取建成區、POI數據提取建成區、遙感影像提取建成區和多源數據融合提取建成區等內容,具體工作流程見圖1。

圖1 數據處理流程圖
本文選取浙江省杭州市和麗水市數據進行城市建成區提取研究,分別利用夜光數據、POI 數據以及本文提出的多源數據融合方法提取建成區,并對3 種方法的提取結果進行比較分析。
杭州市采用2018 年高德POI 數據(23 大類,約84 萬個點)進行核密度分析,采用閾值分割法提取建成區邊界;麗水市采用2018 年天地圖POI 數據(10大類,約18萬個點)進行核密度分析,采用閾值分割法提取建成區邊界;對公園POI數據進行單獨處理,提取范圍后再融合到最后的成果中,提取結果見圖2,可以看出,POI 數據提取城市建成區邊界較平滑,周圍小圖斑較少,采用合適的閾值可有效去除周邊的村莊、集鎮,但POI數據進行核密度分析后邊界數據溢出問題較突出(圖中紅色框部分)。

圖2 POI數據提取建成區結果
利用夜光數據對杭州市和麗水市進行了建成區提取,并對提取結果進行圖斑綜合,結果見圖3,可以看出,夜光遙感影像提取建成區范圍能反映城市的輪廓、邊界清晰,但周邊存在很多分散的小區域,且建成區范圍線內存在不少面積較大的空洞,圖中標記1、2、3、5位于學校附近,由于影像獲取時間正是學校暑假時間,因此夜光暗淡,使城市建成區提取產生較大偏差;標記6、7 為建成區內公園,公園夜光較暗,容易因閾值選取而被剔除;標記8 為河面,部分區域夜光明亮,存在光溢現象。

圖3 夜光遙感影像建成區提取
本文選取2020 年12 月南京市區及其周邊范圍的哨兵2 號影像以及Esri Land Cover 2020 10 m 土地覆蓋中的建設用地(Built Area)數據作為訓練的輸入數據,按照數據處理流程進行深度學習,訓練曲線見圖4,曲線網絡的訓練損失(TrainLoss)和驗證損失(ValLoss)隨訓練次數的增加而減小并收斂;訓練精度(TrainAccuracy)和驗證精度(ValAccuracy)隨訓練次數的增加而提高并收斂。模型選取驗證損失最小值時的模型用于后續數據的預測。

圖4 ResUNet網絡訓練
利用訓練好的模型對目標遙感影像進行預測提取,并對圖斑進行綜合處理獲取建設用地范圍,提取數據為地面上有建筑物的地塊,結果見圖5,可以看出,提取范圍中包括很多分散的小區塊,主要為城市周邊的村莊、小鎮,其中麗水城區遙感影像部分區域存在云層(圖中a、b區域),影響建設用地提取。

圖5 深度學習建設用地提取
本文按照數據處理流程和方法進行數據融合,提取杭州市和麗水市的建成區,并對圖斑數據進行綜合,結果見圖6,可以看出,標記1、3 為學校區域,在采用夜光數據提取時被剔除;利用POI或夜光數據提取城市建成區時存在數據溢出現象(標記2、4),導致邊界范圍不準確,但采用數據融合后能有效彌補單一數據源的不足。

圖6 杭州、麗水市區融合后建成區成果
以麗水市為例,本文分別比較了3 種方法的提取精度,計算結果見表1,可以看出,多源數據融合方法的整體精度最優。以2018年杭州市地理國情公報數據和麗水市住房和城鄉建設廳2018 年城鄉建設統計年鑒為檢查數據,與融合后的數據進行比較,結果見表2,其中杭州市統計數據不包含臨安區、富陽區數據,可以看出,基于多源數據融合提取建成區與實際數值基本一致。

表1 多源數據融合提取建成區精度評定

表2 提取建成區面積與實際建成區面積比較
從3 種提取方法結果來看,多源數據融合方法能更準確地反映城市建成區的實際范圍,充分實現多源數據的互補,集中表現在:①城鄉分界明顯,采用POI 和夜光數據提取的建成區范圍,在城市和非城市區域界限非常明顯,該方法充分利用這一優勢,消除了城市周邊的噪聲,減少了人工判讀工作量,提高了提取效率;②融合互補,多源數據融方法能實現數據互補,圖6的實際提取結果說明了這一點。
本文分別采用POI 數據、夜光數據、多源數據融合提取建成區,并與已知的建成區數據進行比較,以評價各方法的提取精度。結果表明,多源數據融合方法的提取精度最高,能克服單一數據提取方法建成區內部數據空洞、溢出效應問題,所用遙感影像獲取周期短、POI 數據獲取便捷、方法操作相對簡單,可保證城市建成區提取的時效性。在未來研究中將繼續朝多源數據融合方向發展,充分利用深度學習工具進一步簡化提取流程,提高自動化提取程度。