占燕婷,吳柯,徐宏根,劉慧澤
(1.中國地質大學(武漢) 地球物理與空間信息學院,武漢 430074;2.中國地質調查局武漢地質調查中心,武漢 430205)
高光譜遙感是在成像光譜學的基礎上發展起來的,具有光譜分辨率高、圖譜合一的獨特優勢,在軍事偵察、大氣探測、環境監測、地質勘察、海洋、林業和農業遙感等領域有著廣泛和重要的應用[1-2]。與傳統遙感相比,高光譜遙感的每個成像像元都有幾十上百個成像波段,每個波段寬度一般小于10 nm,并且在傳感器的成像光譜區間內是連續分布的,因此,高光譜遙感影像中的每一個像元光譜都是一條連續、平滑、完整的曲線,為基于光譜對影像地物類型的識別提供了更多的信息和方法。
光譜匹配技術是高光譜影像分類的關鍵技術之一,它是由已知地物類型的反射波譜,通過波形或特征匹配來達到識別地物類型的目的[3]。分類的主要依據是“同物同譜”理論,即:同種地物具有相似的光譜特征,在影像上呈現出高度的相似性?;诠庾V相似性測度對影像進行分類的原理是對每一參考類別確定其參考光譜,然后對每一待定像元進行光譜測試,計算其與參考光譜的相似性,待定像元類別則屬于相似性最高的一類[4]。常見的光譜相似性測度有歐氏距離、光譜信息散度、光譜交叉相關系數測度和光譜角度測度等[5]。其中,光譜角匹配法(spectral angle mapping,SAM)是一種比較波譜整體形狀相似度的分類方法,由于具有明確的物理意義以及較好的分類效果,因此,它在高光譜匹配分類中一直擁有廣泛的應用。近年來,眾多研究者以SAM為基礎,提出了一系列改進的光譜匹配分類算法,取得了良好的效果。比如:何中海等[6]通過在相似波譜曲線差異較大的特征區間設置權重,提出權重光譜角的方法,增大相似性礦物波譜與參考波譜的差異;Liu等[7]通過在SAM分類方法中加入基于像素間的“光譜向量長度差異”因子,提高了高光譜遙感影像的分類精度。
此外,突出光譜信息的局部特征(主要是波譜吸收谷特征)生成不同的特征參數,也能夠進行地物類型有效的區分。尤其是對“同譜異物”的現象而言,光譜特征參數的引入能夠顯著提高相似地物類型的識別精度。例如:車永飛等[8]通過對光譜特征較穩定的主、次吸收谷特征參數賦以不同的權重系數,提取礦物的蝕變信息;韋晶等[9]綜合利用多種光譜特征參數,進行統計分析,得到Cuprite礦區的礦物識別模型,最終實現了礦物信息的高精度識別。但是,僅僅基于光譜特征參數的絕對大小對典型地物類型進行識別,具有一定的局限性。由于只考慮了局部光譜特征的相似性,無法對整體光譜特征進行有效的表達,在常規的光譜匹配分類中,往往會造成分類精度低下。因此,研究者一般會在光譜特征參數的基礎上,結合其他分類方法,構建完整的分類模型。例如:劉煥軍等[10]提取土壤的反射光譜特征參數后,利用K均值聚類和決策樹分別進行聚類分析和分類模型構建,實現的土壤的快速分類;王翔[11]以光譜特征參數為輸入量構建決策樹模型,對土壤進行分類,得到了比其他方法更高的分類精度。
基于以上分析,本文在SAM匹配分類模型的基礎上,提出一種聯合光譜角與組合特征參數(spectral angle mapping-combination characteristic parameter,SAM-CCP)的新型高光譜遙感影像分類方法。該方法能夠有效區分不同地物類型的整體波譜曲線,同時兼顧對光譜局部特征信息的約束和識別,使得相似地物類型的光譜曲線也能夠得到有效的區分。本文通過兩組實驗證明:SAM-CCP匹配法能夠動態地調整特征參數,選擇最優的組合方式,有效地降低了匹配分類的誤差。
光譜角匹配法是指將兩條光譜曲線各個波段的反射率值組成二維空間向量,通過計算其廣義夾角來表征兩條光譜的相似程度:夾角越小,光譜越相似。計算得到兩條光譜曲線的夾角余弦值為cos,余弦值越接近于1,兩條光譜曲線越相似[12]。光譜角匹配法雖然能從光譜曲線的形狀上比較光譜的相似程度,但是對于光譜局部特征上的差異性較難區分[13]。
光譜特征參數匹配法(spectral characteristic parameter,SCP)是指將從光譜曲線提取出的吸收谷光譜特征參數組合成二維特征向量,然后計算像元光譜與參考光譜的特征向量之間的距離來表征兩條光譜的相似程度,距離值越小,則證明光譜特征參數越接近,吸收谷越相似。計算其歐氏距離值如式(1)所示。
(1)
式中:xi和yi分別表示參考光譜和像元光譜的第i個特征參數;n為參數總個數;Euclidean為歐式距離值。
根據光譜的吸收谷特征,本文主要提取了吸收谷的八個特征參數進行分類,分別如下所示。
(1)吸收波谷位置P是光譜吸收谷反射率最低處對應的波長。
(2)吸收反射率Ep是吸收波谷位置處的反射率值。
(3)吸收寬度W是吸收谷兩側肩部的波譜帶寬。
(4)吸收對稱度S是過波谷位置垂線的左右兩部分的對稱程度,等于左右肩部距離谷底的波長寬度與吸收寬度之比。
(5)吸收深度H是吸收反射率Ep與吸收谷兩側肩部對應的較小反射率值的差值。
(6)吸收面積A是吸收帶曲線與兩側肩部連線所圍成的面積。
(7)吸收斜率K是原始光譜曲線中,吸收波谷兩肩部連線的斜率。
(8)光譜吸收指數SAI是非吸收基線和吸收谷底垂線交點的反射率值與吸收谷底反射率值的比值。
1) SAM-CCP。SAM-CCP匹配法是指將光譜角匹配法得到的夾角余弦值cos與組合特征參數匹配得到的歐式距離值Euclidean相結合,匹配距離值如式(2)所示。
Distance=(1-cos)·Euclideanμ
(2)
式中:μ為歐式距離開方系數,通過在0~1之間調節μ的大小,可以不同步地改變像元光譜與不同參考光譜之間的Euclidean值,使距離大的值更大、距離小的值更小,增大光譜之間的差異性;Distance值為聯合后的匹配距離,值越小,兩條光譜越相似。光譜角表征的是光譜曲線的整體形狀特征,而光譜特征參數表征的是光譜曲線的局部吸收谷特征,所以將二者相結合充分利用了地物的反射率光譜信息,有利于提高地物類型的識別精度。
2) 最優光譜特征參數組合選取。在實際應用中,選擇更多的光譜特征參數對地物進行分類未必取得最好的結果,所以,從眾多的光譜特征參數中,選擇最佳的組合,從而更準確地識別地物類型,是該方法的重點。最優光譜特征參數組合選取步驟如下。
步驟1:利用包絡線去除的方法對光譜曲線進行歸一化處理,放大吸收谷的特征,然后根據地物光譜曲線的吸收谷特性,確定吸收谷的個數,從短波到長波方向,依次為v1、v2…vn。
步驟2:提取每個谷的光譜特征參數,共8n個。比如:v1的光譜特征參數分別為P1、Ep1、W1、S1、H1、A1、K1、SAI1,其他谷同理。
步驟3:選擇一個光譜特征參數進行光譜匹配,共8n種分類結果,對其進行精度評價,得到最大分類精度的匹配參數f1。
步驟4:選擇f1與其他8n-1個參數組合,對影像進行分類,對比所有結果的總體分類精度,得到最大分類精度的參數組合為[f1,f2]。
步驟5:重復步驟4,直到最大分類精度不再提高,此時的參數組合即為最優光譜特征參數組合。
為驗證本文提出的聯合光譜角與組合特征參數的光譜匹配算法的有效性,分別選用Indian Pines地區和Cuprite礦區的兩組高光譜影像數據進行實驗,并將分類結果與傳統的最小距離法(minimum distance discriminant method,MD)、光譜信息散度匹配法(spectral information divergence,SID)和光譜角匹配法SAM的分類結果進行比較,精度評價選擇總體分類精度(overall accuracy,OA)、Kappa系數、生產者精度(producer’s accuracy,PA)和使用者精度(user’s accuracy,UA)。
Indian Pines數據獲取于1992年,由AVIRIS傳感器收集,覆蓋區域為美國加利福利亞的一處農業實驗區,如圖1所示。數據由224個反射率光譜波段組成,波長范圍為0.4~2.5 μm,大小為145像素×145像素,空間分辨率為20 m。去除覆蓋在吸水區域的條帶后,波段數量減少到200個。研究區地物類型以農作物為主,已知地物像元個數為10 249,共16類,分別是苜蓿、玉米Ⅰ、玉米Ⅱ、玉米Ⅲ、草Ⅰ、草Ⅱ、草Ⅲ、干草料堆、燕麥、大豆Ⅰ、大豆Ⅱ、大豆Ⅲ、小麥、森林、建筑和石頭鋼塔。該影像的反射率光譜曲線一般有五個明顯的吸收谷特征,圖2為經包絡線去除后的大豆Ⅱ的參考光譜曲線,參考光譜是通過對比參考分類圖,在原始影像中畫感興趣區域,獲取其平均光譜,影像中其他地物類型的參考光譜總體形狀與圖2相似。從圖中可以看出,光譜在前40個波段和波段90和120附近,噪聲明顯,據此采用窗口大小為5的均值濾波對其進行平滑處理,減小光譜特征參數提取的誤差。經包絡線去除后的光譜,可提取出五個吸收谷特征,從左往右依次為v1、v2、v3、v4、v5,吸收波谷位置P分別為band 32、58、78、104、145。

圖1 Indian Pines原始影像

圖2 經包絡線去除的大豆Ⅱ參考光譜
實驗首先調節μ值大小,調節范圍為0~1,間隔為0.1,對比各個結果分類精度,再縮小范圍到0.2~0.3,以0.01為間隔調節μ值大小,最終表明,當μ為0.25時,分類精度最高。然后對該數據提取出五個吸收谷的光譜特征參數,共40個;利用單個光譜特征參數對影像進行分類,分類精度最高的參數即為最優光譜特征參數組合中的第一個量,即A5;最后將A5與其他特征參數進行組合,依次獲取最優組合中的其他參數,當分類精度不再提高時,該組合即為最優光譜特征參數組合。圖3為選擇不同個數的光譜特征參數進行組合時,對應的最高總體分類精度。由圖可知,前期總體分類精度隨著組合中參數個數的增加而增加,直到參數個數為6時達到峰值,隨后總體分類精度不再增加,到第10個參數有降低的趨勢。所以,由六個光譜特征參數組成的組合[A5,SAI2,Ep2,H3,S4,H4]即為該影像分類的最優光譜特征參數組合,此時,總體分類精度為77.66%。

圖3 Indian Pines數據參數個數對分類精度的影響
基于四種方法的Indian Pines數據集分類結果如圖4所示。從圖中可以看出,所有算法對于苜蓿、干草料堆、小麥和石頭鋼塔等地物類型,表現出較好的分類結果,其原因可能與占地面積少且光譜曲線特征明顯有關;而對于草Ⅰ、大豆Ⅲ和建筑,由于許多相似地物類型的存在,不同的地物類型具有極其相似的光譜形狀和吸收谷特征,又加上影像中存在著大量的混合像元,對分類結果造成了較大的影響,精度仍然低下。SAM-CCP分類法對于區域中占地面積較大且位于中部位置的大豆Ⅰ和大豆Ⅱ,分類結果較其他三種方法更好,區域中錯分的像素點更少。Indian Pines數據集的分類精度定量結果如表1所示。SAM-CCP分類法的總體分類精度最高,為77.66%,分別比MD、SID和SAM提高了7.07%、1.36%和2.65%。

圖4 Indian Pines數據集分類結果

表1 Indian Pines數據集分類精度 %
Cuprite礦區位于美國西南部的內華達州,該地區基巖裸露程度高,礦物類型豐富,是遙感地質研究的典型實驗區。Cuprite礦區的AVIRIS高光譜數據,獲取時間為2006年9月20日,光譜范圍為0.4~2.5 μm,光譜分辨率為10 nm,空間分辨率為20 m,數據大小為477像素×533像素,共224個波段,刪除數據異常的108波段后,共223個波段用于實驗,如圖5所示。參照Clark等[14]1995年的Cuprite礦區填圖結果,選取礦區中九種典型的礦物類型進行分類實驗,分別為明礬石、高嶺石、蒙脫石、白云母、方解石、玉髓、多水高嶺土、高嶺石和白云母的混合物,以及明礬石、高嶺石和白云母的混合物。圖6為九種礦物的參考光譜曲線,通過對比參考分類影像,獲取原始影像中每一類型對應區域的平均光譜,即為該礦物的參考光譜。從圖中可以看出,九種礦物類型的光譜曲線在整體上較為相似,但局部特征具有一定的差異性。在波段110和160附近曲線噪聲較大,所以選取窗口大小為3的均值濾波對曲線進行平滑后再提取吸收谷的光譜特征參數,將減小因噪聲引起的分類誤差。經包絡線去除后,該影像的光譜曲線可提取出七個明顯的吸收谷特征,吸收谷位置分別在band 13、35、59、114、147、163、189附近。

圖5 Cuprite原始影像
與Indian實驗相同,首先調節μ值大小,找到最佳指數μ為0.08。然后組合光譜特征參數,對Cuprite礦區高光譜數據進行分類。圖7為該實驗中參數個數對分類精度的影響,當參數個數為4時,總體分類精度達到最高值87.89%,隨后不再增加,此時光譜特征參數組合為[K7,W7,W2,P7],即為最優光譜特征參數組合,由此可見,谷7對分類精度的提高貢獻率最大。

圖6 Cuprite影像參考光譜曲線
圖8為分類參考圖和MD、SID、SAM以及本文方法分類結果的對比,總體來說SAM-CCP分類法的效果更好,各個類別的劃分與地表真實類別更接近;其中,白云母的分類效果相比于其他三種方法更好,區域中錯分的像素點更少,誤差最大的是最小距離分類結果,將左邊區域的部分白云母錯分為方解石;四種方法都將研究區右邊部分的明礬石、高嶺石和白云母的混合物錯分為明礬石,從圖6中可以看出,這兩種地物類型的光譜比較接近,因此造成了誤分。Cuprite礦區數據集的分類精度如表2所示。基于SAM-CCP方法的分類結果總體分類精度和Kappa系數最高,分別為87.89%和0.779 1,其總體分類精度分別比MD、SID、SAM分類結果高9.24%、8.21%和3.59%。

圖7 Cuprite數據參數個數對分類精度的影響

圖8 Cpurite數據集分類結果

表2 Cuprite數據集分類精度 %
從兩組數據的分類結果可知,本文提出的SAM-CCP匹配法對于農作物和巖礦類型的識別都較SAM等傳統的分類方法精度有所提升,尤其是對于光譜曲線整體相似性大而局部差異性大的地物類型,其識別精度得到了明顯的改善,證明了該方法的優勢。
由Indian Pines數據集分類結果可知,改善效果最明顯的前三類分別為大豆Ⅲ、大豆Ⅰ以及玉米Ⅰ(表1中標粗顯示)。其中,大豆Ⅲ的生產者精度和使用者精度比其他方法中精度最高的SID匹配法分別高出22.26%和13.68%;大豆Ⅰ的生產者精度比其他方法中精度最高的SAM高8.02%,使用者精度比其他方法中精度最高的SID高8.98%;玉米Ⅰ的生產者精度和使用者精度分別較SAM提高了9.24%和10.63%。而對于Cuprite礦區分類結果,白云母因具有獨特的光譜特征區別于其他礦物類型,分類精度最高,其生產者精度達85.37%,使用者精度達93.98%,分別高出其他方法最高精度11.19%和4.41%。分類精度提高最為明顯的三種類型分別是:高嶺石和白云母的混合物、高嶺石以及玉髓(表2中標粗顯示)。高嶺石和白云母的混合物生產者精度比精度最高的SAM高出12.54%,使用者精度比精度最高的SID高出10.58%;高嶺石的生產者精度比MD高8.85%,使用者精度比SAM高7.08%;玉髓的生產者精度雖然只比其他方法中精度最高的SAM高2.01%,但其使用者精度提高了28.97%。
由于Indian Pines數據為精細農作物的分類,其每一類別的參考光譜都很相似,而Cuprite數據為巖礦類型的識別,各巖礦參考光譜之間的吸收谷差異較大,特征顯著,所以添加了光譜特征參數后的光譜角匹配法,對于巖礦類型的識別較農作物,其精度提高更為明顯。
本文提出了一種聯合光譜角和組合特征參數的SAM-CCP匹配法,該方法基于遙感影像的光譜特征對地物進行識別分類,有效地解決了圖像匹配中突出光譜曲線整體特征,而忽略光譜的局部特征信息的問題。將該方法應用于Indian Pines地區和Cuprite礦區高光譜影像數據,并與MD、SID和SAM分類結果進行對比分析。結果表明:
1)綜合考慮了光譜曲線的整體和局部特征的SAM-CCP匹配法,能夠改善多數光譜相似地物的識別精度,提高高光譜遙感影像分類的總體精度。
2)該方法對于農作物和巖礦地物類型的區分都具有一定的適用性,相比于農作物分類,該方法對于具有獨特吸收谷特征的礦物類型的區分,精度提高更明顯。
在以后的研究工作中,將考慮結合卷積神經網絡等深度學習技術,進一步改善分類方法,提高地物識別精度。