韓 磊,何 超,黃 潔,楊顯華,田 立
?
基于GF-2衛星數據的礦山開發信息自動提取
韓 磊1,2,何 超1,2,黃 潔1,2,楊顯華1,2,田 立1,2
(1. 稀有稀土戰略資源評價與利用四川省重點實驗室,成都 610081;2. 四川省地質調查院,成都 610081)
我國高分系列衛星數據因具有重訪周期短、價格低廉、精度較高的特點,在礦山開發監測工作中得到了廣泛的應用。本文在深入了解高分二號衛星數據特征的基礎上,以甘肅永登縣為例,利用機器學習模型中支持向量機算法(Support Vector Machine,SVM)自動提取礦山開發信息,在處理的遙感影像上進行樣本采集,借Matlab平臺對樣本及影像數據進行歸一化、降維處理(PCA)。利用SVM模型進行信息自動提取過程中,選取徑向基核函數(RBF),運用量子粒子群算法進行參數尋優,最終對提取結果進行野外調查。查證結果表明利用SVM模型進行礦山開發信息自動提取是可行的。該研究為國產數據在礦山監測應用中提供了新的思路。
遙感影像;礦山開發信息;自動提取;支持向量機
進入21世紀,隨著我國航空衛星的迅猛發展,國產衛星數據逐漸覆蓋全國。高分二號衛星的成功發射,標志著我國民用衛星進入亞米級時代,為礦山監測工作提供了可靠的數據源。目前,在礦山活動監測工作中,獲取礦山開發信息的主要方式為實地勘測及人機交互解譯。實地勘測雖能獲得較高的精度和置信度,但具有費用高、工作量大、低效率的缺點;同樣人機交互解譯也存在因解譯人員的水平不同,其質量難以保證。因此,借助遙感技術以及近年來發展較快的人工智能技術,自動提取礦山開發信息,是一項重要的研究趨勢。

表1 高分二號衛星有效載荷技術指標
注:資料來源中國資源衛星應用中心網
研究以GF-2衛星數據作為數據源,對其進行系統的預處理。以甘肅省永登縣為研究區,通過已有礦山開發資料,進行樣本采集,并對影像數據及樣本進行歸一化、降維處理(PCA)。在SVM模型中,至關重要一點就是選擇核函數和參數,通過反復試驗,選擇徑向基核函數及量子粒子群算法進行參數尋優。通過該模型,最終自動提取出礦山開發信息,為礦山開發信息自動提取提出了一種新的技術方法。
永登縣地處甘肅中部,蘭州市西北部郊區,西南接青海,北通寧夏、內蒙古,是古絲綢之路的門戶,亞歐大陸之要沖。該縣地形特征可概括為"兩河夾三山"形成黃土丘陵區和秦王川盆地。地貌上表現為石質山地與黃土丘陵交錯分布。地勢位于青藏高原東北部與黃土高原西部過渡地帶,也是祁連山支脈東延與隴西沉降盆地間交錯的過渡地區。境內山巒重疊,丘陵起伏,河水縱貫[1]。
高分二號衛星作為我國第一顆亞米級光學遙感衛星,具有高定位精度和快速姿態機動能力等特點[2]。其有效載荷技術指標見下表1。
研究區礦山主要為露天開采,開采面所暴露的基巖具有獨特的光譜特征,與周圍土層及植被覆蓋產生強烈的反差。利用這一特點,為礦山開發信息自動提取提供了基礎。工作具體流程如下:
1)影像預處理:在自動提取過程中使用的為高分二號Level 1A所獲得的各項原始數據,因此要求開展配套的預處理工作,其中主要有大氣校正以及幾何精校正等多個方面的圖像處理,才能作為后續自動提取的數據源。因為礦山開發信息自動提取中重點使用影像光譜信息,因此預處理重點為相關的輻射定標,同時包括波譜響應函數、FLAASH大氣校正、幾何精矯正及影像融合[3]。
2)ROI采樣:查閱前人成果,利用礦山占地為樣本,對礦山開發信息的特征進行歸納總結。其中選取SVM樣本5703件(包括1140個測試樣本),其中感興趣區樣本2114個,非感興趣區樣本3598個。
3)歸一化處理:利用圖像歸一化、圖像的不變矩陣來尋找一組參數,從而消除其他變換函數對圖像變換的影響。在MATLAB中,圖像數據本身是0~255單位數據,因此需要歸一化并轉換成0-1。同時,為了加快機器學習的速度,對訓練樣本進行歸一化處理,使所有樣本的輸入信息的平均值接近或小于其平均方差,避免一些過大、過小的參數對預測結果產生較大影響[4]。
4)降維處理(PCA):主成分分析法是圖像處理中常用的降維方法,其目的是利用降維思想將多個指標轉化為幾個綜合指標[5]。在研究中,降維處理時,設參數間相關性為97%,根據運算結果,模型中采用前兩個主成分(F1、F2)進行分類。
5)支持向量機模型訓練:支持向量機(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,該算法在小樣本、非線性及高維模式識別具有其獨特的優勢,與工作區中礦山開發樣本特征相符。

圖1 量子粒子群參數尋優步驟圖

圖2 量子粒子群算法尋優結果圖
在SVM模型中,至關重要的一點就是選擇核函數和參數。對于任意對稱函數K(x,y)可在特殊空間表示為內積形式:K(x,y)=充要條件是K(x,y)是半正定的,即òò,為Mercer定理。滿足上述定理的函數是可行的SVM核函數。

表2 SVM模型分類結果展示(黑色區域為礦產開發信息)
徑向基核函數因為自己具備的相應特征,如區域性等,因此其一般出現在樣本數目多的分類問題中,參數要求較低,具有較寬的收斂域,是較為理想的分類函數,故本次研究選取徑向基核函數(RBF)[6]。
RBF核函數包含兩個參數:懲罰因子和核參數γ,其參數決定了高維映射的形態,直接影響分類精度。懲罰因子能夠改變相關算法模型的復雜狀況,進而實現樣本占比跟復雜狀況之間的匹配和調整。值得注意的是,SVM模型的學習訓練過程耗時相對較長,提高參數區域內的尋找概率是完成優化的重點思路。對于相關函數參數選定的問題,通常能夠借助窮舉法、網格法等多樣化手段進行,當下廣泛運用的一類智能式方法能夠對全部參數完成查找,其滿足相應的優勢性特征,比如量子粒子群算法(PSO)等,因此本文在建立SVM分類模型時,選用量子粒子群算法進行為參數尋優[7]。其具體流程圖如下(圖1):
將處理后的樣本數據進入SVM分類器(在matlab實現),應用量子粒子群算法尋找最大值(最佳適應度)的結果如圖2所示,可以發現:在迭代次數達到10左右即選出最佳適應度,說明算法耗時較短,尋優結果良好。
2.5.3模型應用(分類)
將選取5703個樣本(包括1140個測試樣本),進入SVM分類器(在matlab中實現)。根據運算結果可知,數據分類精度為95.43%,效果客觀。將分類結果輸出,對比處理后影像,實現礦山開采信息自動提取可視化,結果如表2:
依據上述實驗結果來看,基于機器學習模型中支持向量機算法(SVM)進行礦山開發信息自動提取的方法基本達到了預期效果,能夠完整地將礦山開發信息提取并展示出來。
為了更好地計算該方法提取的準確性,本次研究對提取的數據進行野外查證。在自動提取結果的基礎上,剔除細小圖斑的干擾,依據處理后的提取結果采取點、線、面相結合的方法,利用GPS定位,對典型礦山的分布位置進行野外查證。具體情況如下表3。

表3 自動提取結果與野外查證后對比分析表
野外查證表面,基于支持向量機所提取的礦山開發信息邊界清晰,位置較為精確,可靠程度高,具有一定的應用價值。根據野外查證分析,自動提取結果中出現錯誤提取、缺失提取及邊界不準的問題主要原因為:①部分區域影像質量一般,礦山開發信息與周圍地物反差不夠明顯;②部分礦山已經廢棄,開采面出現風化以及植被覆蓋現象,干擾了自動提取的結果。
1)隨著我國航空衛星的迅猛發展,國產衛星數據應用越來越廣泛。特別是國產高分系列數據,具有較高的空間分辨率,能夠將地物的光譜差異精確地展示出來。基于研究區內高分二號衛星數據中,礦山開發信息與周圍地物存在較大的光譜差異這一特點,選取合適的信息提取模型,為自動提取所需信息提供了可能,也是對國產衛星數據在礦山監測應用中一次探索。
2)目前礦山遙感監測主要依據人工目視解譯,該方法耗時耗力、效率較低,且依賴解譯人員的經驗。隨著人工智能的快速發展,機器學習模型在各個領域開始廣泛地應用,將機器學習模型引入到礦山開發信息提取中,能夠實現信息的快速自動提取,可節約大部分的人力、物力,具有極高的應用價值。
3)研究基于機器學習模型中支持向量機算法(SVM)進行礦山開發信息自動提取。選取研究區內典型樣本,針對樣本及影像數據進行歸一化、降維處理(PCA),模型選取量子粒子群算法進行參數尋優,應用SVM分類器進行信息提取,最終得到礦山開發信息的自動提取結果。對提取結果剔除細小的干擾圖斑,并進行野外調查查明精度。查證結果表明利用SVM模型進行礦山開發信息自動提取是可行的,為國產數據在礦山監測應用中提供了新的思路。
[1] 魯得方, 董輝. 層次分析法在永登縣地質災害易發性評價中的應用[J]. 甘肅科技縱橫, 2013, 42(12): 10-13.
[2] 潘騰, 關暉, 賀瑋.“高分二號”衛星遙感技術[J]. 航天返回與遙感, 2015, 36(04): 16-24.
[3] 肖瑤. 高分系列衛星在煤礦區地質災害監測方面的應用[D]. 合肥工業大學, 2017.
[4] 湯榮志. 數據歸一化方法對提升SVM訓練效率的研究[D]. 山東師范大學, 2017.
[5] 李瑞光, 臧國輕. 基于主成分分析-支持向量機的土石壩滲流監測數據預測模型[J]. 計算機時代, 2018(06): 5-8.
[6] 劉路民根. 支持向量機徑向基核參數優化研究[J] .科學技術創新, 2018(26): 48-49.
[7] 周頔. 基于改進量子粒子群算法的支持向量機參數優化方法[J]. 計算機與現代化, 2018(09): 27-31.
Automatic Extraction of Mine Development Information Based on Gf-2 Satellite Data
HAN Lei1,2HE Chao1,2HUANG Jie1,2YANG Xian-hua1,2TIAN Li1,2
(1-Evaluation and Utilization of Strategic Rare Metals and Rare Earth Resource Key Laboratory of Sichuan Province,Chengdu,Sichuan 610081;2-Geological Survey of Sichuan Province, Chengdu 610081)
Gf series satellite data of China is characterized by short revisiting cycle, low cost and high accuracy, therefore widely applied to mine development monitoring. This study carries out automatic extraction of mine development information of Yongdeng County, Gansu Province with Matlab platform by means of Support Vector Machine based on GF-2 satellite data. The field investigation indicates that the extracted information is reliable.
remote sensing image; mine development information; automatic extraction; Support Vector Machine
2018-10-10
中國地質調查局地質調查項目“全國礦產資源開發環境遙感監測”(121201203000160009);
“全國2017年新增的礦山恢復治理狀況監測”(121201003000172718)
韓磊(1983-),男,四川成都人,工程師,主要從事資源環境遙感研究工作
何超(1993-),男,四川成都人,助理工程師,主要從事遙感地質工作
P627
A
1006-0995(2018)04-0689-05
10.3969/j.issn.1006-0995.2018.04.034