陳 超,丁 婷,楊 錦
(1.江蘇省基礎地理信息中心,江蘇 南京 210013)
基礎測繪是為經濟建設、國防建設和社會發展提供地理信息的基礎性公益性事業,是經濟社會可持續發展的重要支撐。《全國基礎測繪中長期規劃綱要(2015-2030年)》提出要構建新型基礎測繪,并明確其應具備“全球覆蓋、海陸兼顧、聯動更新、按需服務、開放共享”等特征,各地都已進行了一定的探索。開展重要基礎地理信息快速、及時更新,既是常規更新工作的重要補充,也是新型基礎測繪的擴展。
我國通過高分專項工程已初步構建了高分衛星遙感系統,基本形成涵蓋不同空間分辨率、不同覆蓋寬度、不同譜段、不同重訪周期的高分數據體系,這些遙感影像在土地利用、城市規劃、農業管理、軍事偵察等方面已發揮了重要作用[1-4]。傳統方法是通過人為設計的紋理特征、HOG[5]、LBP[6]、SIFT[7]、Bag-Of-Words[8]等各類特征對影像進行目標檢測。近年來,深度學習在遙感影像應用方面已有出色表現,尤其是卷積神經網絡(CNN)[9]成為最熱門的深度學習模型算法之一。它無需設計目標特征,能根據海量樣本數據自行提取有效特征[10-11],且具有良好的泛化能力,在復雜情況下依然能夠保持良好的穩健性[3,12]。余東行[13]等利用小尺度淺層神經網絡實現了快速目標搜索,利用深層CNN在候選目標中進行了精確定位;任媛媛[14]等對Fast R-CNN網絡進行了改進,通過共享卷積層參數來降低參數規模,并利用改進方法實現了農村建筑物的目標檢測;徐啟恒[15]等結合主成分分析、超像素分割與CNN對國產高分辨率遙感影像開展了云檢測。
本文基于高分辨率遙感影像,利用CNN完成了電線塔的識別,并進行增量入庫。首先基于基礎測繪本底矢量數據構造樣本影像塊;再利用CNN對電線塔進行識別,實現高精度提取;然后將提取結果與本底矢量數據對比分析,形成增量要素;最后直接更新基礎測繪數據庫。
CNN是受生物神經學啟發而產生的。一個典型的CNN由輸入層、卷積層、池化層、全連接層和輸出層組成,其中輸入層為遙感影像;卷積層為上一層的局部卷積結果,用以提取特征,越深的CNN提取的特征越具體;池化層主要用于特征降維,壓縮數據和參數的數量,包括最大池化和平均池化,卷積層和池化層也稱隱藏層;全連接層用于對已取得的特征信息作加權和,在網絡中扮演“分類器”的角色;輸出層為分類結果。帶有兩個隱藏層的CNN如圖1所示。

圖1 帶有兩個隱藏層的CNN
CNN的工作流程為:首先對輸入影像進行卷積運算,再通過池化層對卷積特征圖進行降采樣,然后重復進行卷積與池化操作,最后通過全連接層對最終的特征進行分類,并輸出結果。卷積運算的計算公式為:

式中,l為卷積層數;xlj為第l層的第j個輸出特征圖;為第l層的卷積核;f(·)為激活函數;*為卷積運算符為第l層的偏置;Mj為第l-1層的特征圖數量。
池化運算的計算公式為:

式中,down(·)、β分別為下采樣函數和系數。
本文選取的實驗影像為無人機影像,影像分辨率為0.9 m,3個波段分別為藍、綠、紅,影像覆蓋面積約為74.55 km2。圖2中紅線所示范圍為校正區域,紅線范圍外影像為訓練區域,用于獲取樣本影像塊參與訓練。

圖2 實驗影像與區域劃分
本文實驗基于eCognition軟件中的CNN工作流完成。eCognition中的CNN方法基于Google的TensorFlow API開發,形成了完整的工作流,包括3個步驟:①采集目標與非目標樣本;②利用樣本訓練網絡,即通過校正各權重來優化樣本分類精度;③利用訓練好的網絡對未參與訓練的校正區域進行分類,創建目標類別熱力圖。
2.2.1 創建樣本
本文選擇電線塔作為待更新要素。電線塔是呈梯形或三角形的塔狀建筑物,高度通常為25~40 m,鋼架結構,多建設在野外,特征較明顯。在1∶10 000基礎測繪數據中,電線塔均表示為定位點。結合本底矢量數據與訓練區域創建的樣本影像塊可知,訓練區域內包括187個電線塔的定位點,非目標樣本矢量包括植被2 512個、房屋1 800個、道路1 236個、水域452 個。為了增加目標影像塊的數量以及提高網絡的魯棒性,對每個樣本點作3×3的緩沖處理,這樣每個樣本點就成了9個點,最終獲取3 500個目標樣本影像塊和30 000個非目標樣本影像塊,影像塊尺寸均為30像素×30像素。目標與非目標樣本影像塊的示例如圖3所示。

圖3 訓練樣本影像塊
2.2.2 訓練網絡
訓練網絡時,采用深度為1的隱藏層,隱藏層內卷積核尺寸為11×11,創建了40個特征地圖;采用最大池化,學習率為0.001 5,訓練步數為5 000,每步訓練用到的樣本數量為50。訓練中,學習率參數用于調整統計梯度下降算法,并可改變每次迭代運算中網絡權重參數的更新幅度;若學習率設置過小,學習過程不僅很慢,而且可能以局部最優設置結束;若學習率設置過大,則將加快訓練速度,但可能會錯過最優值或導致模型無效。本文以軟件推薦的經驗值0.001 5為基礎,以0.000 1為步長分別嘗試了不同的參數,最終選擇了運行效率與學習效果最佳的參數。網絡訓練共耗時2~3 min,將訓練后的網絡應用于校正區域,即可得到分類結果的熱力圖。其值接近于1表示與目標有較高的相似性,接近于0則表示與目標的相似性較低。
2.2.3 實驗結果與分析
圖4 a為校正區域的熱力圖,為了降低噪聲影響,已經過平滑處理,越紅的區域表示相似性越大;圖4b為最終的識別結果;圖4c為熱力圖的局部放大圖;圖4d為圖4c熱力圖得到的識別結果,已正確識別出4個電線塔;圖4e、4f為另外兩個放大區域的識別結果,圖4e正確識別出3個電線塔,其中一個電線塔的識別位置與樣本點位置稍有差異,漏識別2個、誤識別1個,圖4f正確識別出4個電線塔、誤識別2個。

圖4 實驗結果
本文分別從檢測率(DR)、誤檢率(FPR)兩個方面對最終結果進行評價。

式中,TP為正確檢測出的數量;MP為漏檢測數量;FP為誤檢測數量。
本文將識別位置與樣本數據略有差異、但指向同一個電線塔的識別結果作為正確檢測。整個校正區域正確識別出電線塔25個、漏識別8個、誤識別15個,DR為0.758,FPR為0.375。通過分析發現,由于道路、硬化地表等部分地物的光譜表現與電線塔近似,因此誤識別的電線塔數量較多,后續研究將通過加入其他特征進行后處理,從而進一步降低FPR。
2.3.1 增量定義
將利用CNN獲取的電線塔點作為新數據,與本底矢量數據進行疊置分析,并將新數據標記為“增加/修改/未變化”,本底數據標記為“刪除”要素。
本文對各標記的定義為:①不存在于本底數據,僅存在于新數據的定義為“增加”;②本底數據圖層中的幾何要素整體消失定義為“刪除”;③圖形空間位置變化、屬性變化的定義為“修改”。
2.3.2 增量入庫
1)對于“增加”的電線塔,直接更新入庫;結合網絡爬蟲、外業調繪等手段獲取電線塔對應的電力線名稱,并在本底庫中更新電力線和屬性。
2)對于本底數據中標記為“刪除”的電線塔,不做處理,僅為邏輯刪除。
3)對于“修改”的電線塔,刪除并替換本底數據庫中對應位置的電線塔,同時在本底庫中更新電力線位置。
4)對于“未變化”要素,不做任何處理。
在校正區域正確檢測出的25個電線塔中,標記為“增加/修改/未變化”的要素分別有2個、0個、23個,本底數據中標記為“刪除”的電線塔為0個。
本文利用CNN方法對遙感影像中的電線塔要素進行提取,通過疊置分析完成了本底數據的增量入庫,并通過實驗證明了該方法的可行性。后續研究將加入其他特征對識別結果進行后處理,以降低FPR;同時對形成的規則集開展移植性實驗,包括對不同來源、不同分辨率的影像開展提取實驗,探索規則集需調整的內容,以提高規則集的通用性,為基礎地理信息的快速更新提供有效手段。