董 哲,楊武德,朱洪芬,郭 琪,王子軒,白建偉
(山西農業大學旱作農業工程研究所,山西 太谷 030801)
葉綠素含量是作物最重要的生長指標之一,它能夠直接決定植物的光合作用潛力和初級生產力。另外,由于植物葉片中的氮素大部分集中在葉綠素中,所以葉綠素含量能夠間接評價植物營養狀態[1]。因此,監測葉綠素含量的變化可以反映作物的長勢及營養狀況,為作物的田間管理提供理論依據。傳統的化學分析方法測量葉綠素含量,不僅會破壞植物葉片組織,并且會耗費大量時間及藥品。便攜式葉綠素儀(SPAD-502)在測量葉綠素含量時,需要接觸葉片,反復測量,且僅能測量某個點或某個小區域的葉綠素含量,不利于大范圍的葉綠素含量監測[2]。葉片光學特性的變化與波長相關,葉片尺度高光譜測量數據對于由葉綠素含量變化導致的光譜細微變化非常敏感。從葉片光譜特征中準確估算葉片葉綠素含量是從遙感影像獲得冠層葉綠素含量重要的一步[3]。利用高光譜遙感技術監測葉綠素含量具有簡潔性、敏感性以及高效率的特點,并且能夠在大范圍內應用[4]。
高光譜數據一般擁有上千個光譜波段,數千個特征可由這些波段計算得到。因此,高光譜影像的特征空間可能擁有成千上萬個特征,進行特征選擇和特征提取,是實現高光譜遙感反演的前提和基礎。常見的特征選擇和提取方法主要有篩選特征波長、構建植被指數及提取光譜特征變量。其中,植被指數和葉綠素含量之間的經驗模型已經被廣泛應用于葉綠素含量估算研究中[5-7]。很多學者也將“三邊”參數用于葉綠素含量的估算,并且已經取得了較好的效果[8-10]。但是通過敏感波段之間的組合構建植被指數,從光譜數據中提取特征變量均需要進行大量的篩選及計算,而植被指數及光譜特征變量僅利用了光譜數據的部分敏感波段,忽略了葉片連續光譜數據中其他敏感波段對葉綠素含量的貢獻。因此,如何充分利用葉片光譜中與葉綠素相關的波段區域,來提高葉綠素含量的反演精度,同時簡化特征波長的篩選過程與建模方法是當前研究的熱點。
連續投影算法(Successive projections algorithm,SPA)是一種新興的特征波段選擇算法,能夠從全波段光譜信息中篩選出具有最低信息冗余度的變量組,保證所選擇的特征波段共線性最小,降低模型建立過程中的復雜程度。由于其簡便快捷,在高光譜反演中的應用越來越廣泛[11-13]。
BP 神經網絡是一種具有輸入層、隱含層和輸出層的典型多層前向型神經網絡,可以實現輸入和輸出間的任意非線性映射,具有較好的非線性映射逼近能力和預測能力[14]。很多學者將BP 神經網絡應用于高光譜遙感上,CHEN 等[15]分別用多元線性回歸和BP 神經網絡對水稻色素含量進行了估算,結果顯示,BP 神經網絡模型要優于多元線性回歸模型。李媛媛等[9]構建了基于“三邊”參數估算灌漿期玉米葉片SPAD 值的傳統回歸模型和BP 神經網絡模型,并對各模型的反演精度進行比較,結果顯示,BP 神經網絡模型的預測效果較好。但將連續投影算法與BP 神經網絡相結合,用于反演葉片葉綠素含量的研究目前尚未見報道。
本研究以玉米葉片為研究對象,采用連續投影算法(SPA)篩選玉米關鍵生育時期葉片光譜對SPAD 值的敏感波段,并且結合BP 神經網絡進行葉片SPAD 值的估算,旨在探索簡便、快捷的玉米葉片反演模型,提高反演精度,為利用遙感技術監測玉米的長勢情況提供一定的理論依據和技術支持。
試驗于2018年6—9月在山西省晉中市太谷縣胡村鎮現代農業示范區(37°12′N,112°28′E)進行,該區域位于汾河平原東北部,地勢平坦,海拔770 m 左右,年平均氣溫介于7~10 ℃,年平均降水量約450 mm,屬暖溫帶大陸性氣候。該示范區主要種植夏玉米和冬小麥2 種糧食作物,且種植面積較大,夏玉米品種以晉單86、強盛388 和登海679 等品種為主,多采用一次性施足底肥,自然方式生長,生育期為5月初至9月中旬,行距和株距為50 cm×35 cm。
試驗分別在 7月1日(大喇叭口期)、7月19日(灌漿初期)和8月18日(臘熟期)進行樣品采集,在試驗區選取能夠代表該區域生產特性、間隔500~1 000 m 的20 個樣點,每個樣點采集9 片葉子,盡量取玉米植株的不同葉位,每個時期各有180 個樣本。
1.3.1 葉片光譜的測定 葉片光譜測定采用美國ASD Field-Spec 3.0 便攜式高光譜儀,波段范圍為350~2 500 nm,利用自帶光源型手持葉片光譜探測器直接測定葉片光譜,光源為內置鹵鎢燈,每次測量前都需要用白板進行校正,每片葉子在不同部位共采集10 條光譜,取其平均值作為玉米葉片的光譜值。
1.3.2 葉綠素含量的測定 使用便攜式葉綠素儀(SPAD-502)測定葉綠素相對含量(SPAD 值)。與光譜測定同步,測量時要避開葉脈,在每片葉子的不同位置均勻地測取10 個SPAD 值,取其平均值作為該片葉的SPAD 值,實現與葉片光譜數據的一一對應。
1.4.1 模型的構建與評價 將每個采樣日期的180 個樣本按 2∶1 隨機分為 2 個部分,即 120 份數據作為建模集,60 份數據作為驗證集。
基于Matlab 2010b 的BP 神經網絡的建模過程包括:分別對建模集和驗證集數據進行讀取;對輸入層和輸出層的神經元進行歸一化處理;設置最大學習迭代數、學習精度等參數;建立網絡模型。然后,采用最佳隱含層神經元數對模型進行訓練,基于sim 函數對訓練好的BP 神經網絡進行仿真預測。最后將得出的數據反歸一化并進行誤差計算。
模型的評價選取決定系數R2、均方根誤差RMSE、殘留預測偏差RPD 進行綜合評定。其中,R2越接近于1,模型的預測精度越高;RMSE 越小,模型的穩定性越好;RPD 表征模型的預測能力,RPD<1.0 表示模型預測能力極差;1.0≤RPD<1.4表示模型預測能力較差;1.4≤RPD<1.8 表示模型預測可用;1.8≤RPD<2.0 表示模型預測能力較好;2.0≤RPD<2.5 表示模型預測能力很好;RPD≥2.5表示模型預測能力極好[16]。
1.4.2 數據處理 利用ViewSpec Pro 進行原始高光譜數據預處理;利用Matlab 2010b 進行連續投影算法及BP 神經網絡訓練;利用Origin 8 進行制圖。
大量研究表明,對葉綠素敏感的波段主要為可見光和近紅外波段[17-19]。因此,本研究中葉片光譜范圍選擇為400~1 300 nm,利用連續投影算法對葉片光譜數據進行SPAD 值的敏感特征波段篩選。為降低模型的復雜程度,設置特征波段篩選的數目范圍為1~10,在RMSE 達到最小值時優選出7月1日、7月19日和 8月18日及 3 個日期綜合的葉片光譜對SPAD 值敏感的特征波長,所選的特征波長如表1所示。

表1 玉米葉片SPAD 值特征波長選擇
從表1可以看出,SPA 選出各日期的特征波長主要集中在400~1 000 nm 波段,以670~760 nm 范圍內的紅邊波段最多,波長點數較少,且每次運行SPA 算法都得到相同的結果,這有利于降低模型的復雜程度、提高穩定度。
選取各個時期的入選特征波段作為輸入層,以玉米葉片的SPAD 值作為輸出層,本研究通過多次試驗得出,增加隱含層數目對模型擬合精度影響較小,為提高模型的運算效率,選取隱含層數目為1。由于隱含層的神經元數目會影響到模型的擬合精度,本試驗根據經驗公式(1)[20]給定的范圍,對不同采樣日期進行多次訓練得出7月1日、7月19日和8月18日的分段監測模型以及這3 個日期的統一監測模型的最佳神經元數目分別為7,7,4 和6。設定最大學習迭代次數為10 000,學習精度為0.01。利用Matlab 2010b 編程進行BP 神經網絡模型訓練,得到SPAD 的預測值,各模型的擬合情況如表2所示。

式中,k 為輸入層單元數;m 為輸出層單元數;a為[1,10]之間的常數。

表2 基于BP 神經網絡的玉米葉片SPAD值估算模型構建
從表2可以看出,7月1日和7月19日的分段監測模型建模效果較好,同時具有較高的擬合精度(R2=0.885,0.900)和較小的均方根誤差(RMSE=2.156,2.103),表明對SPAD 值的擬合效果較好。但8月18日的分段監測模型建模效果較差,R2僅為0.675,RMSE 為 3.236,模型精度較低。因此,導致3 個日期的統一監測模型建模效果較7月1日和7月19日的監測模型效果略差(R2=0.827,RMSE=2.651)。
使用驗證數據集分別對7月1日、7月19日和8月18日的分段監測模型及這3 個日期的統一監測模型進行驗證,將各模型計算出的預測值與實測值進行線性擬合分析,結果如表2和圖1所示。從表2和圖1可以看出,同樣以7月1日和7月19日的分段監測模型預測效果為最好(R2=0.811,0.840,RMSE=2.700,2.796,RPD=2.250,2.396),預測能力均達到很好的水平;而8月18日的分段監測模型預測效果較差(R2=0.632,RMSE=3.108,RPD=1.641),預測能力僅達到可用的水平。3 個日期的統一監測模型預測效果(R2=0.771,RMSE=2.957,RPD=2.082) 較 7月1日和 7月19日的分段監測模型效果略差,但預測能力也達到了很好的水平。

基于連續投影算法優選出的特征波段相較于全波段光譜來說,剔除了大量與葉綠素不相關的波段,在很大程度上降低了模型的復雜程度,提高了模型的預測精度和穩定度,達到了簡化模型的目的;相較于植被指數與光譜特征變量來說,更充分地利用了與葉綠素相關的光譜波段,保證了優選出的特征波段對玉米葉片SPAD 值的貢獻性,從而提高了模型的預測精度。本研究建立的模型精度優于陳志強等[21]以多種植被指數構建的玉米葉片SPAD預測模型,優于宮兆寧等[8]基于“三邊”參數和ND模型指數構建的植物葉片葉綠素含量的估算模型。另外,白麗敏等[22]在估測冬小麥葉片氮含量時得出,利用SPA-PLS 所構建的葉片氮含量估算模型要優于基于常用植被指數的估算模型。說明連續投影算法同樣適用于其他作物生理生態參數的反演。
BP 神經網絡在一定程度上可以模擬人大腦神經系統的活動過程,具有自學習、自組織、自適應能力及高度非線性表達能力,這是其他傳統多元校正方法所不具備的[23]。大量研究表明,植物葉片SPAD值一般與光譜變量呈非線性關系[24-25],因此,將連續投影算法與BP 神經網絡相結合可以更進一步提高預測模型的精度。在本研究中,7月1日和7月19日的葉片SPAD 值分段監測模型預測能力均達到了很好的水平,說明SPA-BP 神經網絡模型對玉米的大喇叭口期及灌漿初期葉片SPAD 值預測效果較好。但8月18日的分段監測模型預測能力僅達到可用水平,可能由于玉米在該日期已經處于臘熟期,葉片葉綠素分解逐漸減少,葉片停止生長逐漸衰老,導致光譜反射率與葉片SPAD 值的相關性降低,分段監測模型的精度也降低。3 個日期的統一監測模型雖然也達到了預測能力很好的水平,但是由于玉米葉片SPAD 值在這3 個日期變化幅度較大,且其包含臘熟期數據,導致模型的精度與7月1日和7月19日的分段監測模型相比略差。
本研究采集了3 個日期的玉米葉片數據,所選研究區域范圍較大,水肥條件不均,玉米品種多樣,長勢有差異,數據獲取的背景條件不盡相同,避免了單一條件因素的影響,因此增強了估算模型的普適性。但還存在一些不足,連續投影算法針對不同的樣本所篩選的特征波段也不同,因此,每次對不同樣本進行監測前都需要重新篩選波段。此外,BP神經網絡的訓練效果與設置的訓練參數有關,最佳隱含層神經元數需要通過多次訓練試錯,根據最好的訓練結果來確定。因此,如何設置更合理的訓練參數,更精準地確定最佳隱含層神經元數還有待進一步研究。本研究僅探討了黃土高原地區半干旱氣候區的玉米葉片尺度的葉綠素含量相對值監測模型,該模型能否運用于其他區域或其他處理的玉米葉片葉綠素含量監測,能否用于冠層或者其他類型作物的葉綠素含量監測還需進一步探索。
本研究利用連續投影算法對與玉米葉片SPAD值敏感的特征波段進行篩選,以篩選出的特征波段作為輸入層,采用BP 神經網絡分別構建3 個采樣日期的分段監測模型及統一監測模型,結果表明,7月1日,7月19日和8月18日的分段監測模型及統一監測模型的 R2分別為 0.885,0.900,0.675,0.827;RMSE 分別為 2.156,2.103,3.236,2.651。7月1日(大喇叭口期)、7月19日(灌漿初期)模型和統一監測模型的精度均較高,同時檢驗模型的RPD 均大于2,具有很好的預測能力;而8月18日(臘熟期)的監測模型表現較差(RPD=1.641),但也達到可用水平。本研究結果表明,利用連續投影算法與BP 神經網絡進行玉米葉片SPAD 值高光譜估算是可行的。