李俊明,邢艷秋,楊 超
(東北林業大學森林作業環境研究中心,黑龍江哈爾濱 150040)
高光譜遙感是指具有高光譜分辨率的遙感科學和技術[1-2],因其具有較高的光譜分辨率而被廣泛應用于各個領域。但由于高光譜遙感的數據量大,波段間的冗余度高,在處理高光譜數據時會出現Hughes現象——維數禍根[3],因此對高光譜數據應進行降維處理,目前降維的法有基于特征提取和基于特征選擇兩種方法,而基于特征選擇方法能較好地保持圖像原有特性[4]。波段選擇應以波段間的相關性小且所包含的信息量大為原則,并且波段組合對地物的光譜差異要大。荊耀棟等[5]通過波段間相關性以及最佳指數分析,獲取沙地信息的最佳波段組合;劉建平等[6]提出了基于遙感圖像上不同地物可分性大小的最佳波段組合的選擇方法;汪繼偉[7]等通過用最佳指數對環境減災小衛星的數據的波段進行組合。
目前,波段組合的研究多數是從波段的信息量以及波段間的相關性角度出發,很少有從地物的光譜特征角度出發對波段進行選擇;而在對HJ/1A(環境與災害監測預報小衛星星座A)高光譜影像的植被類型的分析上更是鮮有相關文獻報道。因此,本文先從HJ/1A遙感影像的不同森林類型的光譜特征出發,選擇波譜特征差異大、波段間相關性小且信息量大的波段進行組合,確定出可用于森林類型識別的最佳波段組合。
本論文以吉林省汪清林業局經營區為研究對象,該區位于吉林省汪清縣的東南部,處于長白山系的中低山區(E129°56′~ E131°04′,N43°05′~N43°40′),是吉林省較典型的天然次生林,總面積30.4萬hm2,林地面積為18.7萬 hm2。該區林業資源豐富,深山區森林類型以針闊混交林為主,呈帶狀分布。針葉樹主要有紅松(Pinus koraiensis)、云杉(Picea)、臭松(Symplocarpus Salisb)和落葉松(Larix kaempferi),闊葉樹多為水曲柳(Fraxinus mandschurica)、胡桃楸(Juglans mandshurica)、蒙古櫟(Quercus monglica)、椴樹(Tilia)、色木(Acermono)、榆樹 (Ulmuspumila)、白樺 (Betula platyphylla)、楊樹(Populus)和楓樺(Betula davuric)等。
1.2.1 高光譜數據
環境減災小衛星星座A/B星(HJ-1A/B)于2008年9月6日在太原衛星發射中心成功發射。HJ-1A星上搭載的超光譜成像儀(Hyperspectral Imaging Radiometer,HSI)是世界上第一個基于空間調制干涉成像原理設計的民用高光譜成像儀[8]。HJ-1A共有115個波段,藍色波段(1~6),青色波段(7~19),綠色波段(20~40),黃色波段(41~49),橙色波段(50~58),紅色波段(59~88),近紅外波段(89~115)。光譜范圍為 0.45~0.9 um,平均光譜分辨率為4.32 nm,空間分辨率為100 m,幅寬為50 km,且具備±30°側視能力,重訪周期為96 h,可實現對研究區快速重復觀測,特別適用于植被生理參數提取研究[9]。本次處理的高光譜數據的獲取地址時間為2010年6月5日,獲取地址為為:http://www.cresda.com/n16/index.html。
1.2.2 野外調查數據
本研究分別在2006年9月、2007年9月和2010年9月進行了野外地面調查,按照森林類型、坡度等情況隨機布設79個水平投影面積為500 m2的圓形樣地,對樣地內立木進行每木測量,測量參數包括胸徑、樹高、樹種和郁閉度。
本研究將野外調查樣地的類型分為闊葉林、混交林和針葉林3個類型組。闊葉林(broad-leaved forest)指闊葉樹蓄積占65%以上的森林;針葉林(coniferous forest)是指針葉樹蓄積占65%以上的森林;混交林(mixed forest)指針葉樹或闊葉樹蓄積均占65%以下的森林[10]。本次野外調查的闊葉林、針葉林、混交林的樣地數分別為53、11和15個。
1.3.1 HJ/1A 遙感影像處理
獲取的HSI影像為2級產品,通常獲取的影像上的像素值一般為灰度級,而實際的電磁波輻射強度則為輻亮度。因此,在實際應用中,需要將灰度級轉換為輻亮度值,之后才能對其進行分析應用[11]。在ENVI軟件中運用波段運算,除以擴大因子100,得到輻射亮度值的遙感影像,并把輸出的數據轉換為BIL格式的數據[12]。
將得到的輻射亮度圖像進行大氣校正,以消除大氣和光照等因素對地物反射的影響,包括消除大氣中的水蒸氣、氧氣、二氧化碳等對地物反射的影響,以及大氣分子和氣溶膠散射的影響[13]。在本次處理中,選用大氣校正模塊中的FLAASH(Fast Line-of-sight Atmospheric Analysis of Spectral Hypercubes)模塊進行大氣校正。
再利用地面控制點對遙感圖像進行幾何精校正,幾何校正選用Image to Map方法,用雙線性內插法進行重采樣。
1.3.2 植被光譜特征提取及分析
對應地面采集數據,提取不同類型植被的光譜曲線,并結合不同森林類型進行光譜特征分析,如圖1所示。
從圖1中可以看出,闊葉林和混交林在可見光波段的反射率值區分不是很明顯,而在近紅外波段具有很好的可分性。HJ/1A遙感影像的115個波段中前20個波段為壞波段,因此在波段選擇中剔除這20個波段。闊葉林、混交林、針葉林的明顯區分波段范圍為:21~24波段,28~31波段,39~47波段,55~60波段,62~77波段,85~112波段,共67個波段。因此從這67個波段中選出最佳波段組合。

圖1 植被平均光譜圖Fig.1 The average spectrum of vegetation
從67個波段中選出3個波段進行組合計算最佳指數,共有47905個計算結果,數據量是很龐大的,而臨近波段的相關性很高,不利于波段信息的表達。因此,為了避免臨近波段的組合,減少數據處理規模,本論文利用相關系數矩陣將波段進行分組,組內的波段不進行波段組合,組間的波段進行組合。
本研究分別用最佳指數法(Optimum Index Factor,OIF)、波段指數法和協方差特征值3種方法提取波段組合,并用光譜混合距離確定出最佳波段組合。
1.4.1 最佳指數法 (OIF)
最佳指數法是由美國查維茨提出的,圖像數據的標準差越大,所包含的信息量就越多,而波段間的相關系數越小,波段的圖像數據獨立性就越高,信息的冗余度就越小[14]。其數學表達公式為:

式中:Si為第i個波段的標準差,Rij為i、j兩個波段的相關系數。
1.4.2 波段指數法
波段指數的定義為波段的標準差同該波段在組內的平均相關系數和該波段與組外波段相關系數絕對值之和的比值[15]。波段指數Pi為:

式中:Si為第i波段的標準差,Rw為第i波段與所在組內其他波段相關系數的絕對值之和的平均值,i≠j,Ra為第i波段與所在組外其他波段相關系數絕對值之和的平均值。
1.4.3 協方差矩陣特征值法
根據Charelles Sheffield[13]提出的用計算 N維數據熵值原理進行優選最佳波段組合的方法,選出包含信息量最豐富的波段組合。計算公式為:

式中:H為圖像熵,即圖像信息量;N為波段維數;|Ms|為所選三個波段的行列式。
波段組合,除了要保證圖像的信息量大,波段冗余度小,還要確保地物類別的可分性。不同的地物具有不同的光譜特征,因此可根據光譜混合距離來確定能更好地區分地物的波段組合。混合距離越大,兩類的可分性越大[16]。光譜混合距離公式如下:

式中:xik、xjk分別為第i類和第j類在波段k上的光譜值。
通過ENVI軟件的波段統計可以得到波段相關系數矩陣,其可視化結果如圖2所示,其中橫縱坐標均為波段號。

圖2 相關系數矩陣圖Fig.2 Correlation matrix
在相關系數矩陣圖中,顏色越亮的部分相關系數越大。從該圖中,根據波段間的相關系數大小可以把選出的67個波段分成3組,波段1~波段5為第一組,波段6~波段39為第二組,波段40~波段67為第三組。
從三個組中分別選出一個波段進行組合,并計算OIF值,該計算結果有4760個,取OIF值排在前15位的波段組合,見表1。

表1 分組后OIF指數Tab.1 OIF index after grouping
從表1可以看出,有些波段組合很相近,如排在前2位的波段組合分別為(1,39,65)、(2,39,65),波段1和波段2為相鄰波段,相關系數大、差別不大,因此可以從這2個組合中選出一個組合作為最佳波段組合。最佳指數法未考慮不同地物在不同波段的可分性,OIF值越大的地物可分性未必越好,因此從OIF值中選出較大的波段組合,再從中選出地物可分性最好的波段組合。根據分組OIF指數,最佳波段組合為(1,39,65),(2,39,62),(2,6,65)。
根據公式 (2)計算的波段指數,取排在前5位的計算結果,見表2。

表2 波段指數表Tab.2 Bands index
從該表可以看出,在第一組里波段1的波段指數最高,其次是波段2、波段5;第二組中波段39的波段指數最高,其次是波段7、波段38;第三組排在波段指數排在前三位的分別是波段65、波段66、波段67。最佳波段組合為(1,39,65),(2,39,62),(1,7,65)。
分組后依據公式 (3)計算波段組合的協方差特征值,取排在前10位的計算結果,見表3。

表3 協方差特征值Tab.3 Covariance feature value
從該表可以看出,排在前十位的波段組合非常相近,如排在第一位的和第二位的波段組合分別為(1,6,65)、(1,7,65),而波段6和波段7為相鄰波段,相關性高,因此可以從這兩個組合中選出一個波段組合進行分析即可。用行列式特征值法選出的波段組合為(1,6,65),(2,6,66)。
本文中,主要地物為闊葉林、針葉林和混交林,將前面所選的波段組合,根據闊葉林、針葉林和混交林在不同波段上的光譜值計算混合光譜距離,如圖3所示。

圖3 光譜混合距離Fig.3 Spectral distance
從光譜混合距離圖可以看出,對針葉林和闊葉林區分較好的波段組合按光譜混合距離大小排在前三的分別為:(1,7,65)、(1,6,65)、(1,39,65);對針葉林和混交林區分較好的波段組合為:(1,7,65)、(1,6,65)、(2,6,65);對闊葉林和混交林區分較好的波段組合為:(2,39,62)、(2,6,66)、(2,6,65)。因此,從總體來看,(1,7,65)波段組合為區分針葉林的最佳組合波段;(2,39,62)波段組合為區分闊葉林和混交林的最佳波段組合。
波段1的中心波長為505.89 nm,是綠色波段;波段2的中心波長為508.42 nm,是綠色波段;波段7的中心波長為529.64 nm,為綠色波段;波段39的中心波長為696.85 nm,為近紅外波段;波段62的中心波長為885.18 nm,為近紅外波段;;波段65的中心波長為908.95 nm,為近紅外波段。植物在綠色波段吸收少,本研究中綠色波段存在反射峰,但不十分明顯,可能與大氣校正的方法有關;同時發現針葉林與闊葉林的可分性強,而闊葉林與混交林的可分性較差,可能與混交林中的闊葉樹所占的比例較多有關。不同森林類型在綠色波段的反射程度不同;而研究表明不同類型的植被在近紅外波段的可分性程度大,因此這兩個范圍內的波段組合對地物的區分會有較好的效果。
本論文利用不同地物的光譜特征不同,從HJ/1A遙感影像的115個波段中挑選出能較好地區分闊葉林、針葉林和混交林的67個波段。為避免相關性強的波段進行波段組合,根據波段相關系數矩陣進行分組,將67個波段分成3組,再進行最佳指數、波段指數、協方差矩陣特征值計算最佳波段組合,發現最佳指數法和波段指數的計算結果相差不大。
用光譜混合距離確認能區分闊葉林、針葉林和混交林的最佳波段組合,并確定 508.42 nm、696.85 nm、885.18 nm的組合為區分闊葉林和混交林的最佳波段組合;505.89 nm、529.64 和908.95 nm的組合為能明顯區分針葉林的波段組合。
建議在進一步的研究工作中,增加調查樣本,針對不同樹種識別進行光譜選擇研究,并研究不同大氣校正方法對光譜選擇的影響。
】
[1]童慶禧,張 兵,鄭芬蘭.高光譜遙感——原理、技術與應用[M].北京:高等教育出版社,2006.
[2]楊曦光,范文義,于 穎.森林葉綠素含量的高光 遙感估算模型的建立[J].森林工程,2010,26(2):8 -11.
[3]HugHes G.On the mean accuracy of statistical pattern recognizers[J].IEEE Transactions on Information Theory,1968,14(1):55-63.
[4]尹繼豪,王義松.高光譜遙感影像中最佳譜段的快速選擇方法[J].理論研究,2010(3):3 -7.
[5]周淑琴,荊耀棟,吳發啟,等.LANDSAT數據在沙地動態監測中提取沙地信息的最佳波段組合研究[J].山西水土保持科技,2011,2:9 -12.
[6]劉建平,趙英時.高光譜遙感數據解譯的最佳波段選擇方法研究[J].中國科學院研究生院學報,1999,16(2):153 -161.
[7]汪繼偉,劉 剛,馬海濤,等.在宏觀監測中的最佳波段組合研究[J].中國科技信息,2011(16):40 -41.
[8]Hao X,Lu J,Gong A,et al.Operational spectrum reconstruction of data from the fourier transform hyperspectral imager onboard HJ/1A satellite[J].Chinese Science Bulletin,2010,55(17):1808-1812.
[9]Meng J,Wu B,Niu L,et al.Validation of HJ/1 HSI red edge parameters based on spectral reflectance of hyperion[J].Spectroscopy and Spectral Analysis,2010(8):2205-2210.
[10]亢新剛.森林資源經營管理[M].北京:中國林業出版社,2001.
[11]韋玉春,湯國安,楊 昕.遙感數字圖像處理教程[M].北京:科學出版社,2007.
[12]韓瑞梅.環境星HSI影像處理關鍵技術的研究[D].長沙:中南大學,2010.
[13]鄧書斌.ENVI遙感圖像處理方法[M].北京:科學出版社,2010.
[14]Sheffiel C.Selecting band combination from multispectral data[J].Photogrammetric Engineering and Remote Sensing,1985,51(6):681-687.
[15]Jiang X,Wang C,Wang C.Optimum band selection of hyperspectral remote sensing data[J].Arid Land Geography,2000,23(3):214-220.
[16]劉建平.高光譜遙感數據處理分析軟件系統設計與實現[D].合肥:中國科學技術大學,2008.