閆 智,李利偉,程 鋼
(1. 河南理工大學測繪與國土信息工程學院, 河南 焦作 454003; 2. 中國科學院遙感與數字地球研究所中國科學院數字地球重點實驗室,北京 100094)
及時準確地獲取不同類型建筑區空間分布信息,對城鎮化科學發展決策、環境保護等方面有重要意義。2016年開始全球免費分發的10 m空間分辨率Sentinel-2多光譜數據,具有幅寬大、成像時間短和觀測幾何比較穩定的特點,相對于高分辨率影像,更有利于大場景具有一定面積的結構性地物的動態監測。因此,研究利用Sentinel-2數據進行不同類型建筑區提取具有很強的現實意義。
當前應用遙感技術進行建筑區提取已有較多研究[1-5]。如文獻[1]利用譜間特征和歸一化指數實現了城市建筑用地的提取;文獻[2]運用譜間特征和閾值相結合的方式對QuickBird高分辨率影像進行了建筑區提取;文獻[3]應用SAR影像進行了建筑區提取;文獻[4]研究了典型民居類建筑區的遙感影像提取方法;文獻[5]提出了一種紋理特征與視覺注意機制相結合的方法進行光學影像建筑區提取。這些研究將建筑區作為一個整體進行提取,并沒有進一步細分類型。
實際應用中,不同類型建筑區的空間分布信息對于規劃管理和環境保護等有著不同的意義,如現代高層小區與傳統低矮村落在人口經濟承載、資源能源利用及環境風險評估中有著不同的權重。當前,國內外對于多類型建筑區分類提取方面研究較少。文獻[6]利用Landsat7數據和基于紋理的方法提取了北京市城區內高低層建筑區。
近年來深度網絡技術在自然圖像特征表達和分類識別上取得了巨大成功[7-10]。文獻[10]通過結合深度分層表達框架和編解碼思路提出了應用于像素級語義分割的全卷積網絡。應用深度網絡技術進行遙感智能解譯已成為遙感信息提取領域的一個研究熱點[11-14]。
本文充分利用全卷積網絡(fully convolutional networks,FCN)在影像結構特征表達和提取方面的優勢,面向Sentinel-2多光譜數據,構建了一種基于全卷積網絡模型的高低層建筑區快速提取技術,并結合雄安新區及其周邊Sentinel-2數據進行精度驗證和結果分析。
本研究選取Sentinel-2衛星數據。該衛星成像幅寬達290 km,同時,通過雙星協同觀測實現中緯度地區約5 d重訪,包含4個10 m空間分辨率的可見光-近紅外通道,對于建筑區等地表結構化地物動態監測具有很強的應用價值。
試驗數據為2017年3月9日獲取的4幅Sentinel-2數據(對應景號為50SLH、50SLJ、50SMH和50SMJ),該數據以雄安新區為中心,覆蓋北京南部、天津東部和河北大部區域,共4.4×104km2(有效區域約4.03×104km2),4幅影像拼接后如圖1所示。
建筑區劃分兼顧遙感影像結構特征與實際功能類型。依據百度地圖和谷歌地球中高分影像判讀,結合重點區域實地調查量測,對試驗區典型建筑高度及其功能屬性進行統計分析,以平均高度30 m(約10層)為界限,將研究區內建筑區分為高層建筑區(建筑高度大于30 m、有明顯建筑陰影、建筑密度低,主要對應高層現代化住宅區、高端寫字樓等,簡稱高層建筑區)和低層建筑區(建筑高度小于30 m、沒有明顯建筑陰影,主要對應鄉村村落、舊式住宅小區、別墅區、工業廠房和倉儲等,簡稱低層建筑區)。
結合雄安新區周邊地貌特征,選擇任丘市和高碑店市作為訓練樣區。在人工判讀高分影像和Sentinel-2試驗數據的基礎上,對重點區域進行實地考察,獲取樣區內高層和底層建筑區的二值標記柵格樣本。同時,根據待提取地物尺寸對訓練區域數據和類別標記數據進行裁剪,得到128×128像素大小的真彩色圖像和對應二值標記圖像,分別包括360組切片數據。為了降低模型復雜度和提高訓練效率,高層和底層建筑區分別進行提取。
為了驗證算法提取結果,在訓練樣區之外,考慮空間分布和地物代表性,選擇8個區域作為驗證樣區,依據高分影像判讀獲取驗證區建筑區類型,對于結構復雜不容易區分的區域,進一步結合實地調查獲取驗證真值。
研究采用文獻[10]提出的經典全卷積網絡模型結構,通過與實際遙感數據特征相結合,構建用于建筑區提取的全卷積網絡模型,如圖2所示。全卷積網絡計算過程主要包括編碼階段和解碼階段兩部分,編碼階段實現數據的壓縮采樣和特征抽取,解碼階段實現全空間分辨率類別信息的提取。
在編碼階段,主要采用了去除全連接層的VGG-16模型[9]。針對輸入圖像(形狀為3×128×128),經過兩次空間卷積和線性整流函數(Relu)激活,圖像尺寸變為64×128×128(卷積層使用補0填充,不改變圖像形狀);然后經過一次池化得到pool1(形狀為64×64×64);對pool1進行兩次空間卷積、Relu激活和池化,得到pool2(形狀為128×32×32);進一步對pool2進行三次空間卷積、Relu激活和池化,得到pool3(形狀為256×16×16);對pool3進行三次空間卷積、Relu激活和一次池化,得到pool4(形狀為512×8×8);最后對pool4進行三次空間卷積、Relu激活和池化,得到pool5(形狀為512×4×4)。至此編碼階段結束。
在解碼階段,首先將pool5進行一次卷積,改變通道大小(圖像形狀變為2×4×4),之后進行一次圖像2倍上采樣得到upsample1(圖像大小變為2×8×8);將pool4進行卷積,改變通道大小(大小變2×8×8),然后與upsample1相加并將結果進行2倍上采樣得到upsample2(形狀為2×16×16);將pool3進行卷積,改變通道大小(形狀為2×16×16),然后與upsample2相加并將結果進行8倍上采樣得到upsample3(形狀為2×128×128);最后對upsample3進行softmax分類,以某點類別概率最大作為該點類別,得到最終結果。
由于建筑區判識主要依賴影像紋理結構特征,同時,為了利用機器視覺領域大樣本自然圖像進行遷移學習,研究選擇Sentinel-2中RGB波段進行試驗,并將原始波段數據進行線性拉伸(單景影像全局直方圖上下截斷0.05%),得到0—255區間的真彩色圖像,作為全卷積網絡輸入數據。
試驗硬件環境為:Intel Core i7-5930 CPU、128 GB內存、Nvidia GeForce GTX 1080顯卡。軟件環境為Ubuntu14.4系統Tensorflow1.2平臺和Envi 5.3。
利用高層建筑區和低層建筑區樣本分別對本文提出的FCN模型進行訓練,VGG-16在ImageNet圖像數據庫上的預訓練模型參數,優化函數為Adam函數,學習率為1E-5,迭代次數12 000次,將訓練后FCN模型對4景試驗數據進行處理。結合全球30 m DEM數據,將坡度大于15°區域作為建設不適宜區,從提取結果中進行排除,如圖3所示,局部結果見表1。

類型Test_1Test_2Test_3Test_4Test_5Test_6Test_7Test_8驗證區Sentinel-2影像驗證區高分影像圖高層建筑區高值圖FCN高層提取結果GL-ED高層提取結果低層建筑區真值圖FCN低層提取結果GL-ED低層提取結果
利用相同樣本并參照文獻[6]中經驗參數對紋理結構方法(GL-ED法)進行試驗。將RGB波段均值作為輸入,分別計算Mean、Variance、Homogeneity、Contrast、Dissimilarity、Entropy、Second Moment、Correlation 8個灰度共生矩陣特征(窗口大小5×5,方向為默認135°)。將紋理特征進行主成分分析,選取前5個主成分與邊緣密度特征相結合進行最大似然分類,提取試驗區內高層與低層建筑區,并排除不適宜建設區域(局部見表1)。
本文采用定性和定量兩種方法對提取結果進行精度評定。首先將FCN法和GL-ED法提取的高層建筑區和低層建筑區結果,按照驗證樣區進行裁剪,得到各驗證樣區提取結果,見表1。
結合表1中驗證真值進行定性判讀分析可知,高層建筑區整體較少,分布較為稀疏,FCN法提取高層結果較為接近真值;而GL-ED法提取結果不符合驗證區高層建筑真實分布,尤其是對于驗證區8(Test_8),該區域為典型村落式人口聚居區,不存在任何高層建筑,但GL-ED仍提取出較多高層建筑,結果誤差較大。對于低層建筑區,FCN提取結果同樣符合驗證區域真實建筑分布,提取結果輪廓和位置都比較準確;而GL-ED提取結果較為散碎,提取結果在位置上比較準確,但內部細節失真很大。
利用驗證真值數據,以基于像元個數統計的精度為指標,對8個驗證樣區提取結果進行精度定量評價,計算公式如下
精度=正確像元個數/整體像元個數
結果表明,整體建筑區提取平均精度為95.30%。其中FCN法提取的高層建筑區的最小精度為98.75%,平均精度達到99.22%;FCN法提取的低層建筑區的精度最低為88.57%,平均達到91.38%。而GL-ED法提取結果精度整體明顯低于FCN法提取結果,平均相差20%左右。同時,在8個驗證樣區上,GL-ED法提取結果波動較大,表明FCN法應用于高低層建筑區提取具有較高準確性和穩定性。
對FCN法提取結果進行統計,研究區內高層建筑區約占地94 km2,低層建筑區約占地7351 km2。高層建筑區整體較少,重點集中于保定市城區、廊坊市城區、固安縣北部與北京大興交接處、武清區、定州市城區等地。低層建筑區除了研究區西北部易縣、淶水縣、淶源縣等地處山區分布相對較少外,其他區域分布十分密集,主要體現出兩個特點:一是與鄉村居民點分布高度相關,二是在城鎮區域分布較為集中,如保定市區、廊坊市區。雄安新區中心安新、雄縣和容城三縣內高層建筑區約1.25 km2,低層建筑區約312.24 km2。其中高層建筑區主要分布在縣城城區,低層建筑區主要分布在安新、雄縣和容城縣城城區,以及在人口聚居較多的鄉鎮。
本文面向Sentinel-2數據,提出了一種基于全卷積深度網絡的高低層建筑區提取方法,并結合雄安新區及其周邊4幅Sentinel-2數據進行了試驗分析,對比了經典的紋理結構算法。結果表明,基于全卷積網絡的方法具有提取效率高、準確度高等優點,在Sentinel-2遙感影像高低層建筑區提取中有很好的表現,相對于紋理算法結構更適合大范圍中高分辨率遙感影像建筑區提取。
本文方法可以結合Sentinel-2數據大幅寬和高頻次的觀測特點,以及更多類型建筑區樣本,實現大范圍地表多類型建筑區的動態高效監測。