葉遠斌



摘要:開展常態化地理國情監測是廣東省基礎測繪“十三五”規劃重要內容,本文綜合利用多時相影像、專題資料及已有矢量成果數據,研究基于神經網絡深度學習的地理國情地表覆蓋變化檢測。實驗表明:國情地表覆蓋信息提取總體精度優于86.22%,KAPPA系數達到83.04%;與傳統人工目視判別方法比較,誤檢率小于7.05%,漏檢率小于10.52%,在人力投入、作業效率、成果質量等有明顯優勢。
關鍵字:地理國情監測;深度學習;特征提取;變化發現
引言
地理國情是指與地理相關的自然和人文要素的國情,是從地理的角度采用空間化的方法,對國情進行持續觀測并對觀測結果進行描述、分析、預測和可視化的過程。按照國務院對地理國情監測工作總體部署和測繪地理信息事業轉型發展需要,從2016年起地理國情信息獲取進入常態化監測階段,在地理國情普查的基礎上,進行地理國情監測業務化運行建設,構建功能完備的地理國情動態監測與綜合信息分析發布系統,形成常態化地理國情監測機制,提供地理國情信息業務化、常態化服務。
傳統基礎性地理國情監測方法主要通過對遙感衛星影像及相關專題資料整合預處理后,將上年度成果數據疊加到監測影像上,人工逐格網進行檢查識別,對于局部或個別的地物、地類變化,可在變化區域識別的同時完成變化信息提取;對于范圍較大,內部變化比較復雜的變化區域,可先勾畫出變化區域的整體范圍,然后由專門的信息采集人員完成變化信息提取,存在人工投入大、作業效率較低、自動化智能化不足、對漏判錯判等圖斑難以發現等突出問題,監測成果能較好滿足《基礎性地理國情監測數據技術規定GQJC 01-2017》要求。本文探索采用神經網絡深度學習方法對地理國情地表覆蓋變化信息進行提取研究,并綜合已有樣本成果,與傳統人工目視判讀成果進行比較,結果表明該方法具有較高的準確度,變化信息提取效率明顯提高。
1.深度神經網絡學習
2006年,Hinton首次提出了“深度信念網絡”的概念。與傳統的訓練方式不同,“深度信念網絡”有一個“預訓練”(pre-training)的過程,這可以方便的讓神經網絡中的權值找到一個接近最優解的值,之后再使用“微調”(fine-tuning)技術來對整個網絡進行優化訓練。這兩個技術的運用大幅度減少了訓練多層神經網絡的時間,并將多層神經網絡相關的學習方法賦予了一個新名詞即“深度學習”。
在淺層神經網絡的輸出層繼續添加層次,原來的輸出層變成中間層,新加的層次成為新的輸出層.依照這樣的方式不斷添加,可以得到更多層的多層神經網絡。使用矩陣運算的話就僅僅是加一個公式而已。在已知輸入a(1),參數W(1)、W(2)、W(3)的情況下,輸出z的推導公式如式1所示。隨著層數的增加,整個網絡的參數就越多。而神經網絡其實本質就是模擬特征與目標之間的真實關系函數的方法,更多的參數意味著其模擬的函數可以更加的復雜,可以有更多的容量(eapeity)去擬合真正的關系。
在單層神經網絡時,使用的激活函數是sgn函數。兩層神經網絡時,使用的最多的是sigmoid函數。而到了多層神經網絡時,ReLU函數在訓練多層神經網絡時,更容易收斂,并且預測性能更好。因此,本文采用非線性函數是ReLU函數。ReLU函數不是傳統的非線性函數,而是分段線性函數。其表達式y=max(x,0)。在x大于0,輸出就是輸入,而在x小于0時,輸出就保持為0。這種函數的設計啟發來自于生物神經元對于激勵的線性響應,以及當低于某個閾值后就不再響應的模擬。
2.神經網絡深度學習提取國情地表變化
針對基于人工判讀地理國情監測方法在人力物力強度等方面的劣勢,探索地理國情監測自動化、智能化變化檢測技術成為迫切需求。人工智能、模式識別等新理論新技術特別是機器學習密切結合面向對象遙感技術應運而生,是當前遙感學界、計算機學界研究熱點之一。
傳統機器學習傾向于使用符號表示知識而不是數值表示,使用啟發式方法而不是算法,使用歸納而不是演繹,前一傾向使它有別于人工智能的模式識別,后一傾向使它有別于定理證明、經典邏輯等分支。其中,基于神經網絡深度學習是一類基于生物學對人腦進一步認識,將神經-中樞-大腦的工作原理設計成一個不斷迭代、不斷抽象的過程,以便得到最優數據特征表示的機器學習算法。該算法從原始信號開始,先做低級抽象,然后逐漸向高級抽象迭代,由此組成深度學習算法的基本框架。多隱含層的人工神經網絡具有優異的特征學習能力,學習特征對數據有更本質的刻畫,有利于可視化或分類。同時,深度神經網絡在訓練上的難度,可以通過逐層初始化來克服。
2.1學習樣本庫及訓練
地理國情成果樣本庫是提高機器自動分類精度重要數據支撐,利用機器學習方法,通過實驗測試,原則上每類地物樣本量不低于1萬,以提高學習成果的準確性。建立地理國情監測不同地物類型的樣本庫,其中國情要素樣本庫內容劃分為鐵路與道路、構筑物、人工堆掘地、水域、地理單元5大類。利用深度網絡學習模型進行訓練的實質就是通過構建具有多隱層機器學習模型和海量樣本訓練數據,學習記憶優化特征參數(即連接權值),從而提升分類精度。本次設計模型結構具有6層隱層節點,通過逐層特征變換,將樣本在原空間的特征表示變換到一個新的特征空間。圖2為某建筑物所建立的樣本庫,圖3為訓練樣本分布。
2.2特征信息提取
深度神經網絡用于變化識別是一種基于特征的方法,這些特征主要包括:光譜特征、指數特征、形狀特征、紋理特征、鄰接關系、層次關系等,涵蓋了高分辨率影像上可以利用的圖像信息。監督/非監督分類等基于傳統統計分析的分類方法難以充分采用上述特征信息,同時,區別于傳統的人工特征提取和針對特征的高性能分類器設計,經過多層非線性映射,使網絡可以從未經特殊處理的訓練樣本中,自動學習形成適應該識別任務的特征提取器和分類器,該方法降低了對訓練樣本的要求,而且網絡的層數越多,學習到的特征更具有全局性。
通過該方法對某研究區域地表覆蓋進行圖像分類,如圖4。結果表明:該方法分類總體精度優于86%,Kappa系數達到83%,具有較好的分類精度。
2.3變化發現與精度比較
自動化智能化變化發現是開展常態化地理國情監測關鍵技術之一,本文通過在前時相矢量和后時相分類結果中進行分析,并與CC碼比較,得到研究區域變化圖斑,如圖5所示。
對變化圖斑按照面積大小進行排序,從面積大的開始,人工確認是否發生變化。變化發現圖斑與人工變化檢測圖斑進行比較,如圖6、7所示。
假定基于人工判讀變化檢測結果為標準成果,采用誤檢率、漏檢率兩項指標進行統計評價,并結合作業生產效率指標進行比較,如表1所示。
可見基于神經網絡學習的地理國情地表覆蓋變化與基于人工判讀方法相比,能夠較準確的提取出變化點及范圍,有更快的效率。但也存在一定問題,對識別出的范圍或區域分類錯誤還較高,尚需要人工進行圖面檢查。
3.結束語
本文在結合地理國情監測某實驗區域實踐基礎上,在基于主動學習的樣本庫構建技術、面向對象分類技術、人機交互的變化圖斑確認與編輯等核心技術基礎上,利用多時相影像、專題資料及前期矢量成果數據,研究探索利用基于神經網絡深度學習的地理國情地表覆蓋變化檢測算法,包括樣本庫構建、樣本選擇與訓練、影像分割、特征提取、變化檢測、精度評價等主要環節。試驗表明該方法能夠較快識別變化區域的位置,但提取變化區域范圍、識別變化類型等方面表現不佳,需要進一步研究完善。