郝悅竹,張加龍
(西南林業(yè)大學 林學院,云南 昆明 650224)
長期以來林業(yè)調(diào)查主要依靠實地調(diào)查,但準確性低。20世紀90年代, 高光譜遙感的出現(xiàn)為林業(yè)遙感的研究提供了新的技術手段。高光譜遙感技術因具有納米級光譜分辨率、可大面積,可重復性觀測、方便快捷等特點可探測不同地物間精細的光譜差異,彌補了傳統(tǒng)林業(yè)調(diào)查的缺陷,廣泛應用于林業(yè)研究,推動了林業(yè)發(fā)展。主要體現(xiàn)在森林健康評價[1]、森林各項參數(shù)提取[2]、森林樹種識別[3]、森林病蟲害監(jiān)測[4]等幾個方面。
高光譜遙感發(fā)展速度與落后的數(shù)據(jù)處理技術不相匹配,處理精度難以保障,制約了其在林業(yè)領域的應用。高光譜遙感技術數(shù)據(jù)量大、維數(shù)高必然導致信息冗余,因此數(shù)據(jù)降維是必然的選擇。眾多學者提出了降維方法提高研究精度,但現(xiàn)有算法泛化能力較弱,只能針對特定問題提出解決方案,缺乏系統(tǒng)性模型和研究。因此,本文系統(tǒng)總結了高光譜遙感在林業(yè)應用中的主要技術手段和林業(yè)應用現(xiàn)狀,包括預處理和后處理技術,重點分析了各數(shù)據(jù)降維技術優(yōu)缺點,為未來的研究提供參考。
隨著遙感技術越來越廣泛應用于地球研究,迫切需要一種同時滿足高光譜分辨率與高空間分辨率的遙感探測儀器。高光譜遙感(Hyperspectral Remote Sensing)就是在這樣的背景下發(fā)展起來的,是對傳統(tǒng)光譜成像技術的繼承和發(fā)展。高光譜遙感利用納米級光譜成像儀,從電磁波譜的紫外、可見光、近紅外和中紅外區(qū)域得到許多窄且連續(xù)的圖像數(shù)據(jù),由幾十至幾百個波段組成三維圖像。國際上,高光譜遙感自1983年第一個航空成像光譜儀AIS-1問世以來[5]已初具雛形。國內(nèi)高光譜遙感技術自20世紀80年代開始發(fā)展,同步研究技術問題,在實驗應用中不斷完善[6]。
高光譜圖像有以下特點:①具有納米級光譜分辨率;②波段范圍窄且連續(xù),可反映幾乎連續(xù)的地物光譜曲線;③波段間相關性高,會造成信息冗余;④可同時對地物的空間和光譜信息成像,有圖譜合一的優(yōu)勢;⑤數(shù)據(jù)量大,特征維數(shù)高,具有三維結構。
高光譜遙感因包含精細的光譜信息和空間特征廣泛應用于地質(zhì)勘探、海洋遙感、植被分析等領域;在林業(yè)上,其豐富的光譜信息更是提高了植被分類精度,還可以測定植物內(nèi)部的生化組分參數(shù)。高光譜遙感的出現(xiàn)為遙感從定性分析轉(zhuǎn)向定量或半定量分析提供了可靠的手段[7],推動了林業(yè)技術的發(fā)展。
高光譜遙感技術雖是對多光譜遙感技術的發(fā)展和繼承[8]。同時其特征維數(shù)高、數(shù)據(jù)量大、圖譜合一的特點為傳統(tǒng)遙感處理技術帶來了新的挑戰(zhàn)。在林業(yè)應用上,結合高光譜圖像特點和林業(yè)生產(chǎn)需求產(chǎn)生了一些特定的數(shù)據(jù)處理技術。
遙感影像定量反演的基礎是利用地物的電磁波反射率。在高光譜遙感與傳統(tǒng)遙感一樣,在傳感器成像過程中,受自身設備性能和大氣分子、氣溶膠對電磁波輻射的散射吸收影響,傳感器端接受的值往往包含有較多誤差,無法真實的反應地物的電磁波反射率,需要進行輻射定標和大氣校正。輻射定標可以將傳感器端的測量值轉(zhuǎn)換成絕對輻亮度[9],公式如下:
L'i=Gi×Li×Bi
(1)
式(1)中Gi是波段i增益系數(shù),Bi是波段i偏置系數(shù),Li是波段i傳感器輸出亮度值,Li是波段i定標后絕對輻亮度。
大氣校正可以消除大氣中氣溶膠散射和太陽反射等引起的像素值失真現(xiàn)象[10],將輻射定標后的絕對輻亮度反演為地物的真實反射率。亓雪勇等[11]將大氣校正方法分為四類:基于圖像特征、基于地面線性回歸模型、基于大氣輻射傳輸模型和復合模型。
在林業(yè)調(diào)查中,研究區(qū)通常地形復雜,海拔較高區(qū)域云層覆蓋嚴重,現(xiàn)有的大氣校正不足以消除云層對地物電磁波反射率的遮擋,可通過結合其他特征彌補云陰影的影響:李軍玲等[12]用ACTOR4軟件獲得大氣校正參數(shù)并基于MODTRAN5模型完成大氣校正;用大氣校正后圖像計算植被指數(shù)及紋理信息,用于圖像重組;并對大氣校正后圖像(原圖像)和重組圖像分別利用SVM分類器進行分類,結果表明:重組后圖像云陰影區(qū)分類精度高于原圖像。
此外,還可通過太陽輻射校正和地形校正減弱太陽高度角變化和地形起伏對HSI(Hyperspectral Image,高光譜圖像)造成的像元值畸變。
高光譜遙感數(shù)據(jù)包含精細的光譜信息,在林業(yè)上常被用于樹種識別分類。然而HSI信噪比低,部分波段被噪聲嚴重影響,導致地物光譜特征無法被有效利用,去除噪聲十分必要。
HSI是三維結構,其噪聲分布在光譜維和空間維,兩種維度噪聲分布結構不同且相互影響,導致兼顧兩種維度的降噪算法有較大難度;另外,HSI中噪聲來源非常復雜,這些特性使HSI降噪技術有別于傳統(tǒng)遙感圖像,增加了數(shù)據(jù)處理的難度。與數(shù)據(jù)降維不同的是,降噪是為了在剔除無用的噪聲的同時,不造成數(shù)據(jù)信息量和維度的減少,并從眾多特征空間中找出最有效的特征[13, 14],可分為基于空間域和基于變換消除噪聲兩種方法。
黃蕾等[15]基于最小噪聲分數(shù)變換法對HSI特征降維,結果表明在采用自適應匹配濾波器(AMF)和自適應余弦探測器(ACE)探測器對高信噪比數(shù)據(jù)立方進行探測時,兩種目標探測器的探測效果均大幅提高。
通常遙感影像在分類時,要求樣本數(shù)為波段數(shù)10倍左右;而HSI波段數(shù)量多,導致數(shù)據(jù)冗余度高和Hughes現(xiàn)象的產(chǎn)生,耗費不必要的計算時間,數(shù)據(jù)降維可有效地解決這一現(xiàn)象。“降維”即盡可能對波段進行壓縮[16]。數(shù)據(jù)降維是HSI處理技術中的重點難點,可以分為特征提取(Feature Selection)和波段選擇(Band Extraction)兩大類[17]。
3.3.1 特征提取
特征提取是通過投影變換將HSI從高維空間投影到低維空間,對所包含信息進行快速提取,其結果不再反映地物線性特征。諸多特征提取技術被用于高光譜數(shù)據(jù),線性方法包括主成分分析法(principal components analysis,PCA)、線性判別分析法(linear discriminant analysis,LDA)等。在數(shù)據(jù)降維中,一般假設HSI的光譜特征為高斯分布,事實上在某些情況下可能是復雜的多模態(tài)結構[18],基于局部信息保留方法,如局部線性嵌入(Locally Linear Embedding,LLE)[19]可以應運而生。本文通過查閱文獻列舉了常用的特征提取方法,并分析了各方法的優(yōu)缺點和適用性(表1)[20~26]。
表1 基于特征提取的數(shù)據(jù)降維方法優(yōu)缺點及適用方面
3.3.2 波段選擇
波段選擇實質(zhì)是在HSI所有波段中按照搜索方法尋找使準則函數(shù)最優(yōu)的波段子集,相較于特征提取而言能夠保留原始數(shù)據(jù)物理信息。波段選擇受搜索策略影響,無論何種方法,損失大量信息都是它們共同的缺點。本文從類間可分性和信息量兩種分類原則出發(fā),選取部分常用方法分析了它們的優(yōu)缺點及適用性分析[27~30],如表2所示。
除了表2中的降維方法,近年來隨著機器學習的不斷深入,逐漸產(chǎn)生了一些智能算法,如遺傳算法。遺傳算法效仿達爾文物種進化論中物種選擇原則,通過對問題空間選擇優(yōu)化,提高全局檢索能力[31]:胡冬翠等[32]考慮樣本點的空間信息和少量有標簽樣本點的類信息,結合遺傳算法和譜方法進行數(shù)據(jù)降維后分類,具有較高精度。
表2 基于波段選擇的數(shù)據(jù)降維各方法優(yōu)缺點及適用性
數(shù)據(jù)降維雖然可以解決“維數(shù)災難”,但在降維過程中會出現(xiàn)信息損失:吳昊等[33]提出了基于全局線性降維的非監(jiān)督分類方法,對降維后的數(shù)據(jù)加權編碼,結果發(fā)現(xiàn)降維的過程中丟失了很多信息。
3.4.1 端元提取
高光譜遙感的出現(xiàn),推動了人們對地物光譜信息的認識。“端元”作為HSI中可以詳盡表示地物光譜屬性的純像素,端元向量的獲取可為光譜解混獲得先驗知識,因此端元選取應可靠并具有代表性。隨著端元提取技術研究的深入,多種提取算法被提出:內(nèi)部最大體積法(N-FINDR算法)、像素純度提取法、迭代誤差分析法等。龍翔等[34]通過對棉花高光譜影像進行端元提取,發(fā)現(xiàn)最大單形體體積算法能更好地提取小樣本端元。
3.4.2 光譜解混
高光譜數(shù)據(jù)波段窄且連續(xù),在林業(yè)應用中較為容易找到對森林郁閉度敏感的波段。但高光譜數(shù)據(jù)受設備和復雜地形影響空間分辨率較低,易產(chǎn)生混合像元,即一個像元含有多種不同地物信息,籠統(tǒng)歸為一類會造成較大誤差。因此,混合像元的解混是高光譜遙感定量反演中的關鍵一步,最終目標是為完成HSI在亞像元級的目標探測識別[35]。浦瑞良等[27]在CASI(小型機載成像光譜儀)高光譜影像中提取端元光譜對AVIRIS影像進行光譜混合像元分解,得到的郁閉度分量圖提取值比紅外航片判讀結果高2%~3%,且具有更合理的空間分布(圖1)。
圖1 高光譜影像混合像元分解法流程
高光譜遙感采樣間隔小,數(shù)據(jù)量遠遠大于傳統(tǒng)遙感數(shù)據(jù)。如機載AVIRIS獲取的數(shù)據(jù)在0.4~2.5 μm光譜范圍有244個波段,每個波段圖像有512×614個像素,單個為2B,總數(shù)據(jù)量可達到100 MB以上[36]。現(xiàn)有寬帶傳輸數(shù)據(jù)速率慢,數(shù)據(jù)獲取與傳輸之間的矛盾將隨著高光譜遙感技術的發(fā)展不斷加深。因此,如何有效對高光譜數(shù)據(jù)進行壓縮是目前亟需解決的難題。
HSI壓縮需要同時去除譜間和空間冗余,根據(jù)壓縮方式不同可基本分為3類:基于預測的方法、基于變換的方法和基于矢量量化的方法(表3)。
表3 壓縮方法對比
高光譜遙感可以探測不同樹種間的細微差異,為樹種精細識別提供了基礎,使森林資源精確監(jiān)測成為可能。HSI精細的光譜信息雖然提高了樹種識別的精度,但HSI的高光譜分辨率制約著其空間分辨率的提高,圖像融合是一種有效手段。
目前,基于高光譜數(shù)據(jù)的樹種識別研究多集中在地形平坦開闊區(qū)域,生態(tài)系統(tǒng)復雜、植被茂密的熱帶生態(tài)系統(tǒng)研究尚不多見[37]。此外,高光譜數(shù)據(jù)的樹種識別依賴于樣本數(shù)量的多少,精度難以保證。
為改善HSI空間分辨率,獲取更豐富的信息,面向空間、空譜等方面的融合方法越來越受到關注。在林業(yè)應用中,激光雷達可穿透林層,獲取森林垂直結構參數(shù),但缺少光譜信息。將激光雷達與高光譜數(shù)據(jù)結合可以提高分類精度:皋廈等[38]使用機載LiDAR與高光譜數(shù)據(jù),選取分割單木的特征變量對城市樹木進行了分類,總體精度可達91.3%。
4.1.1 樹種識別
常規(guī)的人工調(diào)查效率低,而基于一般遙感數(shù)據(jù)的樹種分類只能將植被大致分為針葉和闊葉兩類,精度較低[39]。HSI的高光譜分辨率可進行樹種精細識別分類,可彌補傳統(tǒng)方法的缺陷。然而,HSI波段數(shù)量多、數(shù)據(jù)量大、波段間相關性高,會造成數(shù)據(jù)冗余。在分類中伴隨有Hughes現(xiàn)象,即波段數(shù)的增多會導致分類精度先增后降[40]。數(shù)據(jù)降維是有效的手段:溫小樂等[41]采用多種特征相結合的面向?qū)ο蠓椒ê碗S機森林基于Worldview-2數(shù)據(jù)進行特征選擇,研究表明特征選擇可以有效減少Hughes現(xiàn)象的產(chǎn)生。
隨著HSI空間分辨率的提高,“同物異譜”和“異物同譜”現(xiàn)象開始顯現(xiàn),基于光譜信息、像素級的分類方法會產(chǎn)生大量噪聲,面向?qū)ο蠹夹g可以解決這一問題[42]。光譜信息還可以與其他特征相結合。苗宇宏等[43]結合了降維后的光譜數(shù)據(jù)、紋理特征以及植被指數(shù)對植被分類,總體精度可達99.6%。
盡管高光譜數(shù)據(jù)的光譜分辨率可達納米級,仍無法準確區(qū)分光譜反射曲線相似植被,在一些森林覆蓋度高的區(qū)域,使用光譜信息存在分類困難[44]。如何將高光譜數(shù)據(jù)與其他遙感數(shù)據(jù)(如LiDAR)結合,取長補短,將大幅度提高分類識別精度。
4.1.2 參數(shù)反演
高光譜遙感在林業(yè)上反演各項理化參數(shù)是根據(jù)植物體內(nèi)各種生化組分對不同波長電磁波的選擇性吸收特征[42]。主要包括葉面積LAI(Leaf Area Index)等物理參數(shù)和葉綠素Chls(Chlorophylls)、類胡蘿卜素Cars(Carotenoids)、氮素N(Nitrogen)等生化組分參數(shù)[45]。
由于葉面積指數(shù)與生物量密切相關,在林業(yè)上遙感估算葉面積指數(shù)研究較為成熟[37]。高光譜遙感波段窄且連續(xù),可選取對LAI敏感的波段或植被指數(shù)與實測LAI構建模型。姜海玲等[46]利用光譜特征波段和其計算的用于LAI計算的植被指數(shù)構建揚花期冬小麥LAI反演模型,研究發(fā)現(xiàn)基于EVI(Enhanced Vegetation Index,增強型植被指數(shù))的反演模型精度最高。
葉綠素既可以表征植被生長狀態(tài),也能表征其生產(chǎn)力[47]。高光譜數(shù)據(jù)可以快速、大面積監(jiān)測生化組分參數(shù)。現(xiàn)有的基于高光譜數(shù)據(jù)反演模型大多適用于作物研究,在林業(yè)上由于森林情況復雜等原因,參數(shù)反演模型研究還停留在樹木冠層層面。宮兆寧等[48]通過FieldSpec3光譜儀加載手持葉夾式葉片光譜探測器,測定野鴨湖濕地典型植物的葉片高光譜反射率,結合室內(nèi)測定相應葉片的葉綠素含量,建立關系模型。
4.1.3 生物量碳儲量估算
生物量指個體、種群或群落物質(zhì)數(shù)量的多少,可以反映群落或生態(tài)系統(tǒng)功能強弱,更是與碳儲量關系密切。森林作為陸地生態(tài)系統(tǒng)中最大碳庫的地位,對全球碳循環(huán)有重要影響[49]。高光譜數(shù)據(jù)較高的光譜分辨率可以提取特征信息構建模型進行參數(shù)估算,提取精度大幅提高。李明詩等[50]利用光譜特征變換后的SPOT-5 HRG數(shù)據(jù)和基于灰度共生矩陣提取的紋理特征,對不同森林類型構建了生物量模型。劉維[51]通基于實測的林分喬木層主要建群種各組分的含碳率,構建生物量遙感估測模型,估算碳儲量。
4.2.1 火災監(jiān)測
森林火災具有突發(fā)性且蔓延迅速,嚴重危害森林健康。利用遙感技術范圍大、可重復觀測的特點可以進行森林火災的監(jiān)測。早在20世紀80年代,探測森林火災發(fā)生位置以及火勢蔓延方向常使用NOAA衛(wèi)星上搭載的AVHRR傳感器中紅外波段[39]。但NOAA屬氣象衛(wèi)星,觀測范圍大,時效性卻沒有保障;軌道高度較高導致空間分辨率低,火災發(fā)生位置定位不準。同時AVHRR對溫度探測范圍有限[8],不能及時準確判斷災情。將傳統(tǒng)遙感與高光譜遙感結合還可以測定與燃燒有關的地表生物量、燃燒后果、地表組成及更新情況等[52]。
4.2.2 病蟲害監(jiān)測
森林病蟲害具有隱蔽性和傳染性,依靠肉眼不能準確識別和確定傳染范圍。受病蟲害影響,植物內(nèi)部某些化學成分會發(fā)生顯著變化,例如葉綠素濃度降低。而遙感圖像中的光譜信息來源于植物內(nèi)部的化學成分,化學成分變化可導致光譜曲線出現(xiàn)異常。高光譜遙感精細的光譜信息意味著可以精確捕捉到光譜反射曲線的異常,為遙感監(jiān)測病蟲害提供可能。除此之外,高光譜遙感動態(tài)、快速、周期短的特點可以盡早發(fā)現(xiàn)病蟲害,有利于預警預報和制定防范措施。潘潔[4]等基于森林病蟲害高光譜預測模型,結合GIS開發(fā)技術開發(fā)出森林病蟲害檢測系統(tǒng),具有較強普適性和可操作性,可實現(xiàn)不同條件下森林病蟲害發(fā)生發(fā)展動態(tài)高光譜模擬預測,進行遠程診斷,生成管理方案。
4.2.3 森林資源變化監(jiān)測
森林資源作為一種動態(tài)變化資源,需要實時更新。森林資源監(jiān)測可為如何更高效利用開發(fā)森林提供可靠信息和依據(jù)。
森林有調(diào)節(jié)氣候,涵養(yǎng)水源,固碳釋氧等各種功能[53]。新時期的森林健康評價是實現(xiàn)森林可持續(xù)經(jīng)營的重要途徑[54],更是生態(tài)文明戰(zhàn)略的重要組成部分。高光譜遙感可重復、大范圍觀測并含有精細光譜信息,被廣泛應用于森林健康評價。主要通過測定生化組分參數(shù),如葉綠素等,為森林資源管理與更新演替提供參考[55]。那日蘇[1]從植被覆蓋度、光合作用、植被光譜特征3個方面考慮,在高光譜數(shù)據(jù)中提取植被指數(shù),在此基礎上構建了阿爾山市杜拉爾林場森林健康評價指標體系,并與傳統(tǒng)樣地調(diào)查結果相比較。結果表明:基于高光譜數(shù)據(jù)的森林健康指數(shù)小于傳統(tǒng)調(diào)查,但趨勢一致。然而高光譜遙感在林業(yè)中觀測條件較嚴格、數(shù)據(jù)量大、分析難度大等制約了其發(fā)展。
高光譜遙感以其高光譜分辨率、信息豐富、可重復觀測等優(yōu)勢,極大地推動了林業(yè)研究從表層結構深入到內(nèi)部反應,在林業(yè)中廣泛應用。同時高光譜遙感波段數(shù)量多,信息冗余對現(xiàn)有的圖像處理技術帶來了挑戰(zhàn)。依靠目前的圖像處理水平,難以滿足研究需要,分類精度難以保證,如何提高高光譜圖像處理效果和分類精度將是未來的研究熱點。