趙俊祥
(城鄉院(廣州)有限公司,廣東 廣州 510000)
在近年來的科技發展中,由于遙感技術的進步,數據采集方法的優化,基于遙感技術的應用需求持續增加,遙感數據技術的應用領域變得更加廣泛。采用遙感技術可以獲取到多樣化的地表信息數據,還可以分析預測到地表的動態變換趨勢,能收集多樣化的微觀層面數據變換,在土地資源勘測工作中可以節省大量的人力、物力并提升效率。借助遙感技術可以對特定區域的土地資源分布、覆蓋范圍加以監測和分類,這也是土地資源分類中最為迅速也是更可靠、理想的方法之一。本文結合Ensemble-ELM 分類器的特點[1],分析了應用多通道分割算法的測試SAR 數據表達方法[2],與單個ELM、SVM 分類器[3-4]、隨機分類器[5]、KNN 分類器加以對比分析,研究后評估采用集成ELM 分類算法的優勢與不足。
以廣州市增城區某區域為例,研究范圍分為水域、植被、城市和鄉村。在比較實驗中,地面區域參考圖中已對地表類的樣本點加以標注,累計有8 038 個,包括訓練樣本803 個、測試樣本7 235 個,不同地物類別的待測樣本與測試樣本數量如表1 所示。

表1 增城某地區待測訓練樣本點、測試樣本點數目
對于采用多通道分割算法[2]分析某地區SAR 圖像加以分類,方法分別為集成ELM、單個ELM、SVM、隨機森林、KNN 分類。其中ELM 中文名為極限學習機,它作為人工神經網絡學習中一個最新出現的用于訓練數據的模型,被充分地應用于人類多樣化情感識別、人體行為方式識別以及系統故障檢查測試等諸多方面,被很多領域的專家學者所關注。而集成ELM 則是在此方法基礎上的擴展與集成,相對更有優勢。依據分類圖中的數據,與地面的實際參考圖加以對比,借助實驗確定的訓練方法與樣本、地表中確定的標記數據分類后加以評估。此方法可以用于判定使用的分類是否合理,驗證采用的分類方法是否準確,為分析提供準確的數據支持。在精度評估比較中,不用借助圖片中相關圖像數據,只利用所確定的訓練樣本即可實現。
本文借助四個精度指標加以評估分析:生產方精確度(Producer’s Accuracy,PA)、用戶精確度(User’s Accuracy,UA)、總體精確度(Overall Accuracy,OA)、Kappa 系數(Kappa Coefficient,KC)。指標的詳細說明如下。
生產方的精確度(PA):此種分類中,對于任何一個待測資源,此類別確定訓練樣本,可以正確表達此種類別的發生概率。
用戶精確度(UA):這種分類中,對于任一類待測樣本而言,分類在此類別中的各類訓練樣本,可以分析類別的發生概率。
總體精確度(OA):表明準確分類后的訓練樣本累計數量(面向各類地物類型)占整個累計訓練樣本數的比例,相除得到結果,可以反映分類結果的正確度。
Kappa 系數(KC)[6]:這種方法由 Cohen 在 1960 年首次創立,采用隨機分類的方法體現指標,可以應用于校驗一致性,也能應用于分類精度的分析。由于其有著非常好的適用性,而被醫學、人口普查與統計、遙感等行業廣泛地使用。通常來說,Kappa 系數變動處于0~1 范圍內,Kappa 數值大表明更高精度的分類:0.0~0.2 表明極低條件下存在一致性(slight),0.21~0.4 表明存在一般條件近似性(fair),0.41~0.60 表明存在中等一致性(moderate),0.61~0.80 表明存在高度一致性(substantial),0.81~1 表明幾乎完全一致(almost perfect)。Kappa 綜合體現了不同圖像分類的錯誤分類、未被分類、正確分類的結果,可以全面、有效、準確地表達算法的優勢與分類精度。
對廣東某地區土地資源的分類精度加以研究,采用Ensemble-ELM 分類器、單個ELM、SVM 分類器、RF 分類器、KNN 分類器的數據結果的精確度分別對應為92.52%、90.46%、85.58%、75.30%和74.35%。Kappa 系數分別為0.898、0.870、0.825 8、0.664 5 和 0.653 9。不同單個ELM 算法的應用,本次研究采用Ensemble-ELM 分類器可以使分類后的整體精度提高約2.1%,Kappa 系數可以提高約0.028。水域和植被兩種地物采用單個ELM 與Ensemble-ELM 分類器,這兩種分類器的精度都可以保證。但是從待測類別的分類結果來分析,采用Ensemble-ELM 分類器具有優勢,這種方法可以提升各類待測地物的生產方精度和使用方精度,對比結果表明集成策略的應用和ELM 加以結合,可以提升ELM 性能,應用于遙感圖像的數據分類具有可靠的結果,采用Ensemble-ELM 分類器可以滿足SAR 圖像分類相關標準。另外,結合廣州市增城區某區域識別出的地物特點與類別,可以看出Ensemble-ELM 分類器可以提高生產者精確度,還可以保證用戶精確度。從各方面數據做對比也可以看出RF 分類器和KNN 分類器精度相對較差,均只有75%左右。
對比幾種方法的分類效率,上述對比實驗均在同一系統上執行。Ensemble-ELM 全過程用時消耗約為30 s,采用單個ELM 的時間消耗約為28 s,SVM 的時間消耗280 s,RF訓練時間約為120 s,KNN 的時間消耗約為370 s。Bagging集成處理是對各類弱分類器采用串行方式加以組合完成訓練,訓練Ensemble-ELM 需要的時間會增加,另外單個ELM訓練的時間也會增加,集成模型的應用增加了計算過程的時間消耗,但是可以提升分類的穩定性。不同于RF、KNN 與SVM,這種算法應用于SAR 圖像分類任務有速度上的優勢,可以滿足土地資源分類的實際需求。
對采用多通道模式下的分割算法得到的SAR 圖像加以地物方面的分類,可以驗證集成ELM 分類器具有的普適性。另外,此類方法具有預測作用,計算效率與單個ELM、SVM、隨機森林、KNN 加以對比,結果表明,Ensemble-ELM 應用于資源分類可以提高預測的準確性,雖然Ensemble-ELM 應用于模型分析與預測樣本消耗的時間高于單個ELM,但綜合來看,這是一種特別有效的方法,也充分說明該方法可以應用于本研究區域之中。另外展望未來,也將會把該方法應用于自然資源監測中,從而提高相應工作的效率。