閆曉勇 王振錫 岳俊



摘 要:本研究通過對南疆盆地主栽5種果樹(蘋果、香梨、核桃、紅棗、杏)的冠層光譜數據進行特征參量的選取,旨在提高林果樹種的樹種分類精度并篩選出用于這5種樹種的冠層光譜樹種識別的有效特征參量,從而為完善高光譜果樹樹種識別研究中大量數據處理的方法提供參考依據。試驗采用美國PP Systems公司生產的UniSpec-SC(單通道)便攜式光譜分析儀對不同樹種的冠層進行光譜測量,利用逐步判別分析法對高光譜數據進行樹種識別與有效特征參量的選擇。結果表明,采用特征參量進行樹種識別的總分類精度可達到86.67%,明顯高于全波段參與下的72.00%。逐步判別分析法入選的有效特征參量為藍邊面積、藍邊斜率、黃邊面積、近紅外平臺、紅邊面積、藍邊位置、黃邊位置、紅邊位置。
關鍵詞:高光譜;冠層光譜反射率;逐步判別分析;特征參量選取
中圖分類號: S127 文獻標識碼:A DOI 編碼:10.3969/j.issn.1006-6500.2014.09.007
Abstract: The canopy spectral data characteristic parameters of 5 fruit tree species (apple, pear trees, walnut, red dates, apricots) planted in the southern Xinjiang basin were selected, the object was to improve the classification accuracy of fruit tree species and screened for canopy species identification of the 5 species of the characteristic parameters, so as to provide reference for the high spectrum fruit tree identification data processing methods. The UniSpec-SC (Dan Tongdao) canopy portable spectrum analyzer produced by USA PP Systems were used for different species of spectral measurement, using stepwise discriminate analysis method for species identification and effective characteristic parameters on hyper spectral data selection after the discovery. The results showed that the characteristic parameters of total classification accuracy of species recognition was 86.67%, and significantly higher than that 72% of the total band. The effective characteristic parameters selected for stepwise discriminate analysis method were the blue edge area, blue edge slope, yellow edge area, near infrared platform, red edge area, blue edge position, yellow edge position, red edge position.
Key words: high spectrum; canopy spectral reflectance; stepwise discriminant analysis; feature band selection
高光譜遙感在為樹種的精細識別帶來可能性的同時,也帶來了數據冗余的問題。如何有效地利用高光譜數據的最大信息,同時又能較快地處理高光譜數據成為高光譜遙感研究的熱點和未來的發展方向[1-3]。在新疆林果產業化的進程中,特色林果產業的信息化建設明顯滯后,傳統調查方式以多光譜遙感和地面輔助調查為主,這不僅費時、耗力,且周期較長,而快速、準確掌握特色林果資源布局、規模等基本信息已經成為新疆特色林果產業快速健康發展的迫切需求,林果樹種的遙感識別就是這一工作的核心內容。因此,林果樹種的遙感識別在特色林果產業的可持續經營中具有重要的現實意義[4-6]。
綠色植被的光譜曲線雖然在整體趨勢上具有相似性,但是不同植被類型甚至不同個體間的光譜都會存在一些細微差異,這些差異性往往集中表現在植被光譜曲線的一些特征位置點和特征參量上。在可見光范圍內,常用的特征位置點主要包括“藍邊”、“黃邊”、“紅邊”、“綠峰”、“紅谷”和 “近紅外平臺”等[7-10],根據這些特征位置點還能夠延伸出藍邊斜率、黃邊斜率、紅邊斜率、包絡線斜率、藍邊面積、黃邊面積、紅邊面積和紅谷凈深度等特征參量[11]。不同植被在這些特征波段范圍的光譜反射率差異較大,它們不僅能反映出植被健康狀況的變化特征[12],同時還能作為植被識別的主要特征波段[13]。有研究表明,在雪松、樟樹、側柏等主要城市綠化樹種的識別過程中,采用特征參數的選擇,經距離判別分析后樹種的識別精度均可以達到95.00%以上[14]。而在樟樹、馬尾松、荷花玉蘭的識別中,采用特征參數的選擇,神經網絡判別樹種識別總精度也可達到93.33%[13]。
可見,在樹種識別過程中,有效特征位置點的選擇能夠在很大程度上提高樹種識別精度。然而關于林果樹種的遙感識別的文獻并不常見,本研究以5種果樹不同的特征位置參量為數據源,利用逐步判別分析進行樹種分類識別并選擇最敏感的樹種識別特征參量。
1 材料和方法
1.1 材 料
試驗于2012年7月在新疆阿克蘇市紅旗坡農場新疆農業大學教學科研實習基地(地理坐標N41°17′56.42″~N41°18′56.16″、E80°20′23″~E80°20′56.16″,海拔1 215 m)進行。試驗對象為南疆塔里木盆地5種主栽果樹樹種:紅富士蘋果(Malus pumila Mill)、庫爾勒香梨(Pyru-bretschneideri Rehd)、核桃(Juglans regia Linn)、紅棗(Ziziphus zizyphus Mill)和杏(Armeniaca vulgaris Lam)。試驗區果樹為東西行向栽植。
1.2 樣株選擇
樣本選擇均為結構良好的冠型,蘋果、核桃、杏為中冠型,香梨、紅棗為小冠型。選擇的樣本均掛果較多,蘋果、核桃處于著色期、香梨處于彭大期、紅棗處于開花坐果期、杏處于成熟期。共選擇總樣本209株。基本生長狀況如表1所示。
1.3 光譜數據采集
試驗時間選擇在南疆果樹生長最為旺盛的7月,在晴朗無風的天氣條件下,選擇正午太陽高度角變化不大的時間段(北京時間12:00—16:00)進行5種果樹冠層光譜反射率數據測量。光譜測定儀器為美國PP Systems公司生產的UniSpec-SC(單通道)便攜式光譜分析儀,該型號光譜儀可以在可見光\近紅外310~1 130 nm波長范圍內進行連續測量,光譜分辨率為1 nm,最大視場角為20°。測量時,光譜儀探頭垂直向下,與冠幅距離約1.5 m左右并且根據所選樣本冠幅大小調整探頭與冠幅的距離,對冠層行測量。每個樣株重復測量5次。為保證數據的準確性,每測一個單個樣本進行一次參考板矯正。在去除異常光譜曲線后每個樹種均保留30個樣本供研究。
1.4 特征參量定義
光譜曲線由于植被色素以及自身原因的會產生一定的峰谷值。由于植被的色素、微量元素的含量以及葉面結構的不同都會導致不同的植被出現走勢類似,但依然有差別的光譜曲線,而這些光譜曲線都較明顯地出現在這些峰谷值上,這些具有代表性的波段處就形成了一些常用的特征位置點。因此,本研究擬采用這些特征位置點做樹種識別。在所選波段范圍內,常用的特征位置點分別為“藍邊”、“黃邊”、“紅邊”、“綠峰”、“紅谷”、“近紅外平臺”等6個特征位置點(表2)。
2 結果與分析
2.1 果樹冠層光譜原始全波段數據光譜特征及精度分析
2.1.1 原始全段數據的光譜曲線特征 在去除光譜數據中受首尾噪聲影響的波段后,繪制南疆5種果樹冠層光譜曲線圖(圖1)。從圖1可以看出,5種果樹冠層光譜走勢整體上非常相似,但是在525~575 nm、675~720 nm以及750~850 nm這3個波段范圍內曲線分離度較大,表現出了明顯的差異性。特別是在550 nm、680 nm這2個波段處5種果樹反射率差異極顯著(P<0.01),而在800 nm處5種果樹反射率差異顯著(P<0.05),從而說明本研究的5種果樹是可識別的。
2.1.2 原始全段數據的樹種分類結果 采用逐步判別分析法進行5種果樹樹種的高光譜識別研究,從冠層光譜反射率數據的樹種識別結果(表3)中可以看出,樹種的總識別精度為72.00%,可分性較好的樹種為香梨,分類精度可達93.33%,其他4種果樹的分類效果相對較差,特別是蘋果識別精度僅有60.00%,大部分錯分為了杏和紅棗。
2.2 特征位置點選取與樹種識別精度評價
2.2.1 特征位置點選取結果 分別對5種果樹樹種(蘋果、香梨、核桃、紅棗和杏)的30個樣本分別取均值,得到相應樹種的均值光譜曲線,分別計算出5種果樹樹種的冠層光譜的藍邊位置、黃邊位置、紅邊位置、綠峰位置、紅谷和近紅外平臺6個特征位置點(表4和圖2)。同時,根據已選特征位置點計算8個特征參量:藍邊斜率(DA)、黃邊斜率(DE)、紅邊斜率(FE)、包絡線斜率(DF)、藍邊面積(SA)、黃邊面積(SB)、紅邊面積(SC)和紅谷凈深度(HE)。
在450~900 nm波長范圍內選擇的6個特征位置點“藍邊”、“黃邊”、“紅邊”、“綠峰”、“紅谷”、“近紅外平臺”分別用A、B、C、D、E、F字母表示。本研究的5種果樹冠層均值光譜曲線上的6個特征位置點分布非常集中,其“藍邊”、“黃邊”、“紅邊”、“綠峰”、“紅谷”和“近紅外平臺”6個特征位置點分別集中在524,598,724,553,676 ,753 nm附近。特征參量中藍邊斜率(DA)、黃邊斜率(DE)、紅邊斜率(FE)和包絡線斜率(DF)反映了524~553 nm、553~676 nm、676~753 nm和553~753 nm這4個波段范圍的光譜曲線特征。而藍邊面積(SA)、黃邊面積(SB)、紅邊面積(SC)和紅谷凈深度(HE)4個特征參數反映了490~530 nm、560~640 nm、680~760 nm以及553~753 nm這4個波段范圍內的光譜曲線特征。由此可見,選擇的6個特征位置點和8個特征位置參量在光譜序列上的特定位置基本能夠表征出可見光至近紅外波段的植被光譜特征(表4和圖2)。
2.2.2 基于不同特征參數的果樹冠層光譜分類及精度分析 為檢驗上述6個特征位置點和8個特征參量的樹種識別效果,經逐步判別分析后分類結果如下(表5)。
從樹種識別結果來看,與全波段數據的分類結果相比,經過特征位置點和特征參量的提取后,樹種的總分類精度由全波段數據的72.00%提高到了86.67%。核桃的分類精度最高為96.00%,較原始數據有了明顯的提高,錯分幾率僅為3.33%,30個核桃樣本中僅有3.33%錯分為蘋果;香梨和紅棗的識別精度也相對較高,均為90.00%,錯分幾率為10.00%,香梨較原始波段的識別精度均有一定的下降,但是紅棗卻較原始數據的分類精度提高了16.67%;蘋果的分類精度有了大幅度的提高由原來的60.00%提高到了86.67%,錯分幾率為13.33%,與杏和紅棗發生了很大程度的混淆;杏的分類精度最低為70.00%,錯分幾率最大,為30.00%,大部分錯分為蘋果,并且與香梨發生了一定程度的混淆現象。由此說明,采用基于果樹冠層光譜特征位置點和特征參量進行果樹樹種識別時,5種果樹中核桃、香梨、紅棗和蘋果識別精度相對較高,而杏的識別精度相對較低。
2.2.3 樹種識別的有效特征位置點及特征參量提取 參與樹種識別的14特征參量經逐步判別分析后僅保留了8個,包括4個特征位置點和4個特征參量。從他們所處的光譜波段來看,藍邊位置、黃邊位置、紅邊位置和近紅外平臺分別位于524,598,724,753 nm波段;而藍邊面積、藍邊斜率、黃邊面積和紅邊面積分別位于490~530 nm、524~553 nm、560~640 nm和680~760 nm波段范圍內,這些特征位置點和特征參量的波段分布范圍基本涵蓋了整個可見光和近紅外波段,且依樹種不同表現出較大差異,而這些差異可能是由于各樹種葉片色素含量、葉片形狀、大小、冠型等特征的差異所致。因此,可以認為這4個特征位置點和4個特征參量是進行5種果樹樹種分類的重要敏感波段區間(表6)。
3 討 論
根據光譜特征選擇的特征位置點具有穩定性,或者是在一定范圍之內的[11]。本研究根據光譜特征選取了6個特征位置點,分別為藍邊位置、黃邊位置、紅邊位置、綠峰位置、紅谷位置以及近紅外平臺。有研究曾提出一種針對植被光譜維特征的提取模型,主要提取了8個特征位置點,認為這8個特征位置點十分恒定,分別為藍紫波段吸收峰、藍邊位置、綠峰位置、黃邊位置、紅谷位置、近紅外平臺和近紅外反射率最大點,對應波段分別為404,525,556,573,671,723,758,900 nm。本研究選取的6個特征位置點均位于這些特征位置點的附近[11]。
在特征位置點和特征參量參與下能夠在很大程度上提高樹種識別的精度,本研究選取了14個特征位置點與特征參量,篩選出對果樹樹種識別敏感的8個參量(藍邊位置、黃邊位置、紅邊位置、近紅外平臺、藍邊面積、藍邊斜率、黃邊面積和紅邊面積),樹種識別總精度為86.67%,明顯高與全波段參與的樹種分類的總精度72.00%。李永亮等運用神經網絡分類法對樟樹、馬尾松、荷花玉蘭3種樹種進行了識別研究,在波段選擇時選用了“紅邊”、“紅谷”和“紅谷位置”3個特征位置點以及黃邊面積、紅谷面積、紅邊面積和紅邊寬度4個特征參量。結果表明,運用這些特征位置點和特征參量可以識別出了全部的馬尾松成熟林與樟樹幼樹,總識別精度可達93.33%[13]。何詩靜等[14-15] 在做城市樹種識別時,選取了藍紫波段吸收峰、藍邊位置、綠峰位置、黃邊位置、紅谷位置、近紅外平臺這7個特征位置點,作為樹種識別的主要波段,取得了95.00%以上的分類精度。這說明特征位置點與特征參量組合可以在很大程度上提高樹種識別的精度。但由于植被類型差異,所選的特征位置點和特征參量類型及數量也會有所不同。
4 結 論
(1)特征參數的選取能夠在很大程度上提高樹種識別的精度,本研究選取了14個特征位置點與特征參量,篩選出對果樹樹種識別敏感的8個參量(藍邊位置、黃邊位置、紅邊位置、近紅外平臺、藍邊面積、藍邊斜率、黃邊面積和紅邊面積),樹種識別總精度為86.67%,明顯高與全波段參與的樹種分類的總精度72.00%。
(2)在基于特征參數光譜數據的南疆盆地主栽5種果樹樹種識別研究中,藍邊位置、黃邊位置、紅邊位置和近紅外平臺4個特征位置點以及藍邊面積、藍邊斜率、黃邊面積、紅邊面積4個特征參量是樹種分類的重要敏感波段區間。從他們所處的光譜波段來看,藍邊位置、黃邊位置、紅邊位置和近紅外平臺分別位于524,598,724,753 nm波段;而藍邊面積、藍邊斜率、黃邊面積和紅邊面積分別位于490~530 nm、524~553 nm、560~640 nm和680~760 nm波段范圍內。
參考文獻:
[1] 陳述澎,童慶喜,郭華東,等.遙感信息機理研究[M].北京:科學出版社,1998:139.
[2] 王志輝.高光譜遙感在森林樹種識別中的應用[D].杭州:浙江農林大學,2011.
[3] 褚希鵬.基于葉片非成像高光譜數據樹種分類[D].浙江:浙江農林大學,2012.
[4] 陳國芳,尼和邁提·霍嘉.新疆林果業產業化發展的對策建議[J] .新疆農業科學,2005,42(S1):211-212.
[5] 李金葉, 袁強, 蔣慧.基于區域適應性的特色林果業發展探討[J] .新疆農業科學,2010,47(4):741-749.
[6] 孫蘭鳳.可持續視角下的新疆特色林果業發展研究[D].烏魯木齊:新疆農業大學,2009.
[7] 尹小君.新疆加工番茄主要病蟲害遙感監測方法與應用[M].北京:中國農業大學出版社,2013.
[8] Curran P J,Windham W R,Gholz H L.Exploring the relationship between reflectance red edge and chlorophyll content in slash pine leaves[J].Tree Physiology,1995,15(2):203-206.
[9] Gitelson A A,Merzlyak M N. Spectral reflectance changes associate with autumn senescence of Aesculus hippocastanum L. and Acer plantanoides L. leaves. Spectral features and relation to chlorophyll estimation[J].Journal of Plant Physiology,1994,143:286-292.
[10] Bach H,Mauser W. Improvement of plant parameter estimations with hyperspectral data compared to multispectral data[J].SPIE,1997,2959:59-67.
[11] 譚倩,趙永超,童慶禧,等.植物光譜維特征提取模型[J].遙感信息,2001(1):14-18.
[12] 胡珍珠.輪臺白杏葉片營養元素濃度光譜估算模型[D].烏魯木齊:新疆農業大學,2013.
[13] 李永亮,林輝,孫華,等.基于BP神經網絡的森林樹種分類研究[J].中南林業大學學報,2010,30(11):43-46.
[14] 何詩靜.基于葉片何冠層級別的高光譜城市樹種識別[D].武漢:華中農業大學,2011.
[15] 何詩靜.高光譜遙感在樹木識別方面的應用與研究概述[J].北京農業,2013(6):55-56.