于浩,何浩,常玲,孫衛東
(1.新疆維吾爾自治區地質礦產勘查開發局信息中心,烏魯木齊 830000;2.新疆大學 建筑工程學院,烏魯木齊 830047)
遙感蝕變信息是指從遙感數據中提取的、可能與成礦圍巖蝕變礦物有關的一種量化微弱信息,在區域地質制圖和找礦中應用成效顯著,尤其是在一些地質工作程度較低的偏遠地區,能大大地減少野外工作量。比值法與主成分分析法是目前遙感礦化蝕變信息提取的常用方法[1-3]。但這些方法主要著眼于增強處理,以求目視效果,在背景與噪聲的干擾下,蝕變信息的增強效果并不理想[4]。
近年來出現的一些方法如:小波分析、神經網絡、分數維幾何(分形或分幾)等,由于受樣本數目和維數的限制,得到的結果常常不能令人滿意。支持向量機(SVM)是一種基于統計學理論的機器學算法,在解決有限樣本、非線性及高維模式識別問題中表現出許多特有的性能,并且具有強大的泛化能力[5-6]。但支持向量機算法本身是一種有監督學習方法,需要一定數量的訓練樣本,對遙感蝕變信息而言,訓練樣本選取的方法主要通過野外實地調查,然后在遙感影像上,利用準確的界線建立感興趣區,選取訓練樣本。光譜能級匹配是通過同時度量兩個光譜之間的大小和形狀來判定光譜相似性的,而傳統的光譜相似性度量方法(如:歐氏距離、相關系數、光譜角等)只計算兩個光譜之間的大小(亮度)或形狀。因此本文提出了一種基于光譜能級匹配(SEM)的支持向量機(SVM)遙感礦化蝕變信息提取算法,并在新疆西昆侖庫斯拉甫一帶將該方法與傳統方法進行應用對比,探索一種適合研究區的遙感蝕變信息提取和識別方法。
研究區位于西昆侖山脈北坡山前地帶,屬高山區,總體地勢西高東低,其大地構造單元包括塔里木地塊和西昆侖構造帶,該地區山勢雄偉,地形切割劇烈,平均海拔在3500m以上。葉爾羌河自西向東穿越研究區,植被稀疏,主要分布于河道兩側。研究區出露主要地層有泥盆系、石炭系、二疊系,侏羅系、白堊系,古近系,新近系和第四系,處于西昆侖塔木—卡蘭古鉛鋅銅成礦構造帶,目前發現的礦產主要賦存在一套陸棚海相碎屑巖和碳酸鹽巖層中,分別是中泥盆統克孜勒陶組(D2k)、上泥盆統奇自拉夫組(D3q)、下石炭統卡拉巴西塔克組(C1k1)、下石炭統和什拉甫組(C1h)及克里塔格組(Clk)。其中下石炭統卡拉巴西塔克組(C1k1)與和什拉甫組(Clh)是鉛—鋅礦帶主要賦礦層,其下部為碎屑巖,與白云巖、灰巖和生物屑灰巖共生,上部為灰巖[7-8]。區內深大斷裂極為發育,走向以北西向和南北向為主,主要的區域性深大斷裂有西昆侖山前斷裂、康西瓦斷裂。

圖1 研究區區域地質圖(根據1∶25萬地質圖修編)
光譜能級匹配法(Spectral Energy level Matching,SEM)是譜帶強度與波形特征相結合的產物,主要包括平均譜帶強度相似度和光譜波形特征相似度兩部分,可以減少異物同譜的現象[9]。
(1)平均譜帶強度相似度
平均譜帶強度相似度是參考光譜與像元光譜的平均譜帶強度的相對誤差與1的差,反映了參考光譜與像元光譜間的總體相似性。表達式為:

其中,ipavg表示像元光譜的平均值,rpavg表示參考光譜的平均值,表達式分別為:

其中,I ij表示像元光譜中第j個波段的譜帶強度,I dj表示參考光譜中第j波段的譜帶強度,m是波段個數。
(2)光譜波形特征相似度
光譜波形特征反映了參考光譜與像元光譜間的局部波形相似性。通過快速排序法分別對參考光譜與像元光譜按譜帶強度從小到大進行排序,將排序后相應譜帶強度的波段位置分別記錄在rarr和iarr數組中。假設循環向量長度為m,判斷數組rarr和iarr中同一位置的波段位置是否相等,并記錄相等的數量n,n與m的比值表示光譜波形特征相似度(wSim),表達式為:

(3)總相似度
總相似度(Sim)是譜帶強度相似度與波形特征相似度的乘積,表達式為:

支持向量機(SVM)是在統計學習理論的基礎上發展起來的一種新型機器學習算法,它利用核函數將樣本非線性映射到高維空間里,在這個空間里建立一個最大間隔超平面。在分開數據的超平面的兩邊建有兩個互相平行的超平面,建立方向合適的分隔超平面使兩個與之平行的超平面間的距離最大化。如圖2所示,圖中實心點和空心點代表兩類樣本,H為分類超平面,H1、H2為與分類超平面平行的分隔超平面,他們之間的距離叫做分類間隔(Margin),分隔超平面間的距離或差距越大,分類器的總誤差越小。

圖2 支持向量機的基本思想
支持向量機采用核函數巧妙地解決了由低維空間向高維特征空間映射的問題。對于滿足Mercer條件的核函數K(xi,xj),最優分類函數是:

常用的核函數主要有:多項式核函數、RBF徑向基函數、Sigmoid核函數等。核函數的選擇決定了特征空間的結構,選擇的好壞直接影響到算法的實現與效果。在實際應用中常常對每一種核函數采用網格搜索的方法,做交叉驗證,求得該核函數對應的最佳參數。
研究區ASTER數據獲取時相為2004年9月12日,級別為L1B,圖像云量少,質量佳。對其進行大氣糾正,對干擾數據進行掩模處理,將預處理的影像進行成員提取及歸一化處理,分析成員光譜,結合研究區礦化信息提取蝕變礦物光譜,并作為參考光譜。隨后的算法描述如下:
(1)計算影像中每個像元光譜與每類參考光譜之間的光譜能級值,并設定一個初始閾值,既要保證采集到足夠的訓練樣本,又要保證訓練樣本與提取目標的最大相似性;
(2)如果某類的訓練樣本數未達到所需的樣本數,則重新調整閾值,執行(1);
(3)利用提取的訓練樣本集應用 Crossvalidation算法確定最優SVM模型參數;
(4)根據最優SVM模型參數訓練SVM分類器模型;
(5)采用訓練好的SVM模型對整個遙感影像進行蝕變信息提取。
具體算法流程見圖3。

選取PCA主成分分析法和本文方法分別提取鐵化、泥化和碳酸鹽化,對提取的結果進行疊合,二者進行對比并相互佐證,使得結果更加可靠。
(1)用常規的 PCA(ASTER1,2,3,4)、PCA(ASTER 4,6,7,9)和 PCA(ASTER 1,3,4,8)提取“鐵化”、“泥化”和“碳酸鹽化”信息,其結果如圖4(a)所示。
(2)在選取的成員光譜處采集樣本光譜,用本文方法提取上述蝕變信息,總相似度值設為0.86(該閥值最大設置為l,為盡可能減少假異常,本文設置的閥值相對較高),其結果如圖4(b)所示。

圖4 遙感蝕變信息提取結果對比
由于PCA方法是對ASTER圖像原始波段的線性組合分析,各主分量中所包含的方差很小的面狀異常信息,許多是由噪聲引起的;加之受波譜分辨率和密度分割閾值的影響,PCA結果中常包含干擾異常。對比圖4可以看出,用PCA方法提取的遙感蝕變信息中干擾異常較多,且3類蝕變在空間上存在重疊現象。“鐵化”信息受高亮度巖體影響較大,而“泥化”信息受第四系沖積物影響較大,“碳酸鹽化”二者提取的分布情況較為相似。
綜合分析各類異常信息的疊加結果,可以發現遙感蝕變信息與地層的走向吻合性好。“碳酸鹽化”蝕變在下石炭統和什拉甫組(C1h)灰巖地層較為普遍,影像上為青白色調,呈南北向帶狀分布,與卡蘭古鉛鋅礦所處的碳酸巖礦化蝕變帶基本一致。該區的幾個重要礦床,如卡蘭古、阿巴列克、托庫孜阿特等鉛、鋅、銅礦均產自碎屑巖與灰巖過渡層,因此,這套灰巖對于該區鉛鋅礦的成礦具有重要的指示意義,可作為鉛鋅礦化的找礦標志之一。野外調查顯示(圖5(a)),該地層巖性為碎屑灰巖,生物化石限定其時代為早石炭世,劃分為下石炭統和什拉甫組(C1h),與西側上泥盆統奇自拉夫組(D3q)石英砂巖呈假整合接觸,具有不同程度的角礫巖化特征,進一步印證了該區由碎屑巖向灰巖過渡的礦化富集過程。“鐵化”蝕變信息主要位于研究區葉兒羌群(J1-2y),呈黃色調,界限清晰,近南北向分布。野外調查顯示(圖5(b)),該地層巖石為色調上以灰色為主,含礫砂巖夾細砂巖,巖石固結程度較低,表面風化破碎較強,局部具有褐鐵礦化特征。“泥化”蝕變信息在研究區廣泛分布,呈帶狀以細脈或團塊的形式分布,在影像上表現為以深灰-灰綠色為基本色調。圖5(c)顯示庫斯拉甫斷層以東的褶皺處綠泥石化和高嶺土化的特征,與之平行呈近南北向展布;同時,賦存于塔哈奇組(C2t)的火山碎屑巖和砂巖中廣泛存在泥化現象(圖5(d)),說明在該區中低溫熱液活動廣泛,這與該多金屬礦體的形成有重要聯系。

圖5 野外調查照片
(1)本文提出的基于光譜能級匹配的支持向量機遙感礦化信息提取方法,克服了傳統方法應用中受樣本數目以及維數的限制,光譜能級匹配能夠同時度量譜帶強度和光譜波形特征,因此可以減少異物同譜的現象,更有利于從背景信息中分離目標信息。
(2)通過與常規方法提取的蝕變信息的對比,本文提取的蝕變信息與地層的走向吻合性好,有效地克服了干擾異常的影響。
(3)結合地質資料及野外查證,“碳酸鹽化”的提取能夠較好的描繪該區灰巖的分布特征,這套灰巖對該區鉛鋅礦的成礦具有重要的指示意義,可作為鉛鋅礦化的找礦標志之一。
(4)研究區地層互層現象較為普遍,受ASTER數據空間分辨率所限,一些礦化蝕變信息無法識別在所難免。此外,光譜能級匹配中閾值的設定需要結合經驗和實地調查,才能設計出與實際情況更相適合的提取方法。
[1]張玉君,曾朝銘,陳薇.ETM+(TM)蝕變遙感異常提取方法研究與應用:方法選擇和技術流程[J].國土資源遙感,2003,(2):44-49.
[2]王亞紅,王永,王輝,等.利用ETM數據進行礦化蝕變信息提取的方法研究:以柴北緣地區為例[J].遙感信息,2009(6):68-72.
[3]荊鳳,陳建平.礦化蝕變信息的遙感提取方法綜述[J].遙感信息,2005(2):1-4.
[4]傅文杰,洪金益,朱谷昌.基于SVM 遙感礦化蝕變信息提取研究[J].地質與勘探,2006,46(2):69-73.
[5]VAPNIK V N.The Nature of Statistical Learning theory[M].New York:Springer Verlag,1995.
[6]VAPNIK V N.Statistical Learning theory[M].New York:Wiley,1998.
[7]辛存林,都衛東,魏明,等.新疆西昆侖地區塔卡提鉛鋅礦地質特征與成礦遠景[J].蘭州大學學報(自然科學版),2012,48(1):20-34.
[8]胡慶雯,朱紅英,周圣華.新疆塔木一卡蘭古鉛一鋅(銅)礦帶區域控礦條件[J].礦產與地質,2007,21(5):551-554.
[9]王欽軍,藺啟忠,黎明曉.一種突出目標的多光譜遙感信息提取方法[J].光譜學與光譜分析,2009,29(4):1018-1022.