崔珂瑋 張亞豪 劉彤 黃猛


摘? 要:隨著互聯網的高速發展,大數據時代已經到來,時效性強的數據不斷涌現,數據在各行業中的重要性愈發凸顯。傳統的人工數字化方法存在耗時長、效率低、需要大量人力的問題。采用ENVI衛星影像深度學習處理技術對西部地區房屋建筑進行數字化,該算法將遙感影像中ROI感興趣區作為目標檢測對象,通過參數優化、類激活柵格輸出、密度分割等過程,得到此衛星影像的SHP圖。此方法提高了數字化的效率,提供了有力的數據支持。
關鍵詞:ENVI;數據數字化;衛星影像處理
中圖分類號:TP183;TP751? ? ?文獻標識碼:A 文章編號:2096-4706(2020)01-0057-03
Abstract:With the rapid development of the internet,the era of big data has come,and data with strong timeliness is emerging,and the crucial importance of data in various industries is becoming increasingly prominent. The traditional manual digital method has the problems of time-consuming,low efficiency and large amount of manpower. ENVI satellite image deep learning processing technology is used to digitize the buildings in the western region. This algorithm takes ROI region of interest in the remote sensing image as the object of detection,through parameter optimization,class activation grid output,density segmentation and other processes,and then the SHP image of the satellite image can be obtained. This method improves the efficiency of digitization and provides powerful data support.
Keywords:ENVI;data digitization;satellite image processing
0? 引? 言
采用人工的方法需要6個月完成一個省份的數字化,按照此效率一年僅能完成2個省份,照此速度,完成全國數字化至少需要10年?,F在我國處在快速發展階段,許多城市每年都會發生巨大變化,雖然10年后可以完成數字化,但是數據已失去意義。因此,需要利用當前的最新的技術去實現全國的數字化。IT行業當前最火的技術為AI-深度學習,本文采用ESRI公司提供的ENVI深度學習模型進行了探索和實踐。
ENVI是由ESRI公司研發的一個完整的遙感圖像處理平臺,它提供了專業可靠的波譜分析工具和高光譜分析工具,應用中匯集的軟件處理技術覆蓋了圖像分類、圖像數據的輸入/輸出、圖像定標、圖像增強、糾正、正射校正、數據融合以及各種變換、信息提取、基于知識的決策樹分類、DEM及地形信息提取、與GIS的整合、雷達數據處理、三維立體顯示分析,還可以利用IDL為ENVI編寫擴展功能。本文主要涉及該應用的圖像分類技術。
1? 方法研究
1.1? 生成標簽圖像
標簽圖像是模型訓練中的樣本數據,創建標簽圖像前,需要輸入ROI(感興趣區)以及所對應的柵格圖像。ROI在圖像處理領域是將圖像中所關注的區域圈出,并且作為目標檢測的對象。使用ENVI中Vector to ROI工具項便可以將已準確數字化的矢量文件轉化為ROI,如圖1所示。再使用Deep Learning模塊中的Build Lable Raster from ROI工具項,便可以生成標簽圖像。這個過程中,轉換成ROI的矢量數據的準確度以及合適的數量尤為重要,準確度低會導致訓練出的模型無法識別出建筑房屋區域,數量過多過少都無法訓練出識別建筑房屋的模型。
1.2? 訓練模型
得到標簽圖像后,訓練模型便有了數據基礎。模型可以簡單地理解成函數,訓練模型就是用已有的數據,通過某種方法確定函數的參數,參數確定后的函數就是訓練的結果。ENVI中使用Deep Learning模塊下的Train TensorFlow Mask Model工具項,對得到的標簽圖像進行訓練,如圖2所示。在此過程中,需要調整Patch Size(切片大?。?、Number of Epochs(迭代數)、Number of Patches per Epoch(每次迭代訓練的切片數)、Patch Sampling Rate(切片采樣比率)參數來創建合適的模型。
在開始訓練之前,必須設置或初始化TensorFlow模型,此過程定義了模型的結構,包括架構、patch尺寸和將用于訓練的波段數,在ENVI深度學習中使用的框架為ENVINet5,它是一種基于掩碼的編碼器-解碼器架構,可對圖像中的每個像素進行分類。而patch是用于訓練模型的圖像塊。可以在Initialize ENVINet5 TensorFlow Model對話框中指定模型的patch尺寸和波段數。
初始化新模型后,需要對標簽圖像進行訓練,訓練涉及反復將標簽圖像傳遞給模型。一段時間后,模型將學習標簽柵格中的光譜和空間信息轉換為類激活柵格,突出訓練期間明顯的特征。在第一次訓練過程中,模型嘗試初始預測并生成隨機類激活柵格,將該柵格與標簽柵格的掩膜波段進行比較。通過擬合優度函數(也稱為損失函數),模型可以了解隨機預測誤差的位置。調整模型的內部參數或權重以優化準確率,并將標簽圖像再次傳遞給模型。
訓練模型的過程中,ENVI使用專有技術訓練深度學習模型,該模型基于有偏置的patch選擇。引入有偏置的選擇以便模型能夠更頻繁地看到具有更高密度的特征像素的patch。該方法基于逆變換抽樣的統計技術,其中向模型顯示的實例與它們的概率密度函數的貢獻成正比。這種偏差是使用Train TensorFlow Mask模型工具中的類權重參數來控制的,可以為類權重設置最小值和最大值。當訓練開始時,最大值用于偏置patch選擇,此值在訓練結束時降至最小值。在大多數情況下,最小值應為0,以便模型完成上一個Epoch,同時查看特征與背景像素的實際比率。除此之外,還可以設置Patch Sampling Rate參數以指示應發生的采樣密度,這是每個像素在訓練和驗證標簽圖像中所屬的平均patch數。當特征不明顯時,增加此值可能會有所幫助,因為選擇包含特征足夠的patch的可能性更大。
1.3? 圖像識別
訓練出模型后,使用Deep Learning模塊下的TensorFLow Mask Classification工具項對其他柵格影像進行識別。輸入即將識別的柵格圖像和訓練完成的模型,選擇輸出路徑即可完成識別。此過程生成一個類激活柵格,它是一個灰度圖像,其像素大致表示屬于給定特征的概率,明亮像素表示與要素的高匹配。最后通過密度分割,選定0.8~1.0的范圍創建高像素值的分類圖像。導出SHP圖層即完成此柵格的數字化工作。
2? 問題分析
訓練模型過程中,參數的選擇對創建的模型有著重要的影響,因此尋找合適的參數是非常重要的。起初訓練模型時,同時改變多個參數進行訓練,即使最后產生較好的效果也無法確定是通過改變哪個參數產生的影像。因此,采用控制變量的方法,在四個參數中改變一個參數,其他參數使用默認值,改變的參數從最大值開始調整。每個參數都采用相同的方式進行測試,經過一段時間的測試總結發現,每一個參數使用控制變量的方法從大到小進行調整生成模型時,識別的效果都會呈先上升后下降的效果。因此最后確定出每個參數的數值是Patch Size:380;Number of Epochs:16;Number of Patches per Epoch:300;Patch Sampling Rate:6。此參數下的模型可以將衛星影像柵格圖中的建筑區圈出,代替人力完成數字化工作。
但經過比對后,人工數字化的效果最好,目前使用ENVI的方法能完成75%左右自動工作,由于識別是按照像素塊為單位進行識別,許多相似的非建筑區域同樣被圈出,因此經過ENVI數字化過后,還需要人工審核。
同時,在使用ENVI識別各省的過程中發現,不同的居民地分布使用的模型各不相同。在識別的過程中需要區分城市與農村兩種類型,需要使用特定的模型識別特定的居民地,否則會產生圖3的效果。
3? 結? 論
通過使用ENVI對中國部分省份數字化后可以得出,使用ENVI深度學習模型的方法可以節省75%左右的工作量,僅需要人工對ENVI數字化結果進行審查。而人工作業的數字化質量和工作時間成負相關,和工作人員的疲勞度成正相關,工作時間越長,疲勞度也高,導致數字化質量降低,使用ENVI可以節省80%以上的人力。此方法在很大程度上節約了時間和人力,提高了數據的精確性,滿足軟件研發人員在軟件開發中對數據完整性的要求,說明了該方法在數字化房屋建筑應用中的有效性,同時也為以后的矢量地理數據采集提供了參考和借鑒。
參考文獻:
[1] 程許龍,黨光普,李致博.地籍信息化管理中老舊鐵路用地圖數字化方法研究 [J].北京測繪,2018,32(8):923-927.
[2] 李賢江,陳佑啟,鄒金秋,等.卷積神經網絡在高分辨率影像分類中的應用 [J].農業大數據學報,2019,1(1):67-77.
[3] 王增林,朱大明.基于遙感影像的最大似然分類算法的探討 [J].河南科學,2010,28(11):458-461.
[4] 趙元元.數字化城市數字地圖及空間數據庫建設 [J].居業,2019(5):14-15+18.
[5] 金杰,朱海巖,李子瀟,等.ENVI遙感圖像處理中幾種監督分類方法的比較 [J].水利科技與經濟,2014,20(1):146-148+160.
[6] 李穎玥,劉朝暉.中國數字化城市管理發展綜述 [J].智能建筑與智慧城市,2017(2):28-32.
[7] 鄧書斌,陳秋錦,杜會建,等.ENVI遙感圖像處理方法:第2版 [M].北京:高等教育出版社,2014.
[8] 李穎玥,劉朝暉.中國數字化城市管理發展綜述 [J].智能建筑與智慧城市,2017(2):28-32.
作者簡介:崔珂瑋(2000.03-),男,漢族,山東臨沂人,本科,計算機科學與技術專業,學士學位,研究方向:人工智能和軟件開發應用。