李天馳,馮海寬,田坤云,楊福芹,楊佳琪
(1.天津科技大學海洋與環境學院,天津 300457;2.河南工程學院土木工程學院,河南鄭州 451191;3.國家農業信息化工程技術研究中心,北京 100097;4.河南工程學院資源與安全工程學院,河南鄭州 451191)
近年來,全球生態環境發生了較大變化,溫室效應、極端干旱等氣候現象的出現對農作物生長發育造成不可忽略的影響,因此需要對農作物生長狀況進行及時監測[1]。葉片是作物結構中重要組成部分,其面積變化會直接影響到作物光合作用、呼吸作用等生理代謝過程[2]。葉面積指數(leaf area index,LAI)常被用來對作物健康狀況、冠層分布密度、作物產量等方面進行評價[3]。因此,在農業現代化發展的背景下,研究LAI在不同生育時期下的變化對農作物估產和田間管理具有重要意義。
目前,無人機遙感技術已廣泛應用于農田小范圍尺度的作物監測,有效解決了航空航天遙感技術分辨率低、重訪時間較長的問題[4]。最初受限于無人機平臺的載荷能力,數碼相機多被用于獲取數據,由于其能直觀地獲取作物生長狀況及生長環境的變化情況,且數據處理較為簡便,因而成為重要農田監測工具[5]。利用無人機獲取的數碼影像數據,結合不同波段中所含信息,可實現研究區域內植被信息的提取[6-7]。但通過數碼相機獲取的數據僅包含紅綠藍三個波段,缺乏除可見光外對植被敏感的其他波段,限制了其在作物監測中應用的進一步發展。隨著無人機機載平臺的改進,其為更多遙感設備如高光譜傳感器、熱紅外傳感器、激光雷達等同步搭載提供了可能[8]。高光譜成像儀所獲取的數據光譜范圍廣、光譜分辨率高,能更準確地顯示作物的光譜特征,進而精確地獲取作物生物物理與生化組分參數[9]。如陳曉凱等[10]獲取了冬小麥拔節期高光譜數據,從不同光譜指數中篩選最優窄波段光譜指數,分別構建了單光譜指數和多光譜指數的葉面積估算模型,驗證結果顯示,基于隨機森林算法的多光譜指數估算模型精度最高;Ali等[11]提取無人機高光譜反射率數據中紅邊位置波段,使用普通最小二乘回歸算法構建柑桔LAI和葉綠素含量反演模型,結果表明,在紅邊位置,植株LAI和葉綠素含量高于其他波段,而且基于多項式擬合的模型反演精度較好。
除了使用遙感技術對作物參數進行間接測量外,一些學者提出從作物內部結構入手,構建輻射傳輸模型,進而反演所需的作物參數。植被輻射傳輸模型是研究輻射與植被冠層相互作用的重要方法,常用的模型包括LIBERTY、SAIL、PROSPECT、Suits等[12]。由于各模型存在一定局限性,通常將不同模型進行耦合得到更具普適性的模型。如曾毓燕等[13]利用PROSPECT和DART耦合模型,評價了不同尺度下植被指數對桉樹葉片葉綠素含量和冠層葉綠素含量的反演能力;Roosjen等[14]將無人機采集的多角度數據作為PROSAIL模型的輸入參數,反演的LAI和葉綠素含量精度高于單一角度數據。研究表明,作物輻射傳輸模型在冠層尺度下,從輻射傳輸理論建立冠層光譜與作物生化組分參數之間的定量關系,具有較強的普適性與穩定性,為模擬作物在不同生長條件下的光譜特征與反演作物參數提供了理論依據[15-16]。
現有基于無人機遙感技術開展的LAI研究,多是以多光譜或高光譜數據為基礎,通過構建植被指數來反演LAI,忽略了光譜原始數據中所包含的信息。對于PROSAIL模型模擬的冠層光譜反射率,其能否準確表示作物光譜特征的分析也較少。本研究選擇冬小麥挑旗期和開花期為研究時間節點,同步獲取地面實測數據和無人機遙感數據,基于查找表建立PROSAIL模型模擬光譜數據,并對無人機采集數據與PROSAIL模擬數據進行可靠性評價,隨后結合連續投影算法和植被指數相關性分析,篩選用于構建LAI反演模型的特征波段和植被指數,探究不同反演模型的可行性與預測效果,以期為監測冬小麥長勢和改善冬小麥生長環境提供參考。
試驗于國家精準農業研究示范基地開展,基地地處北京市昌平區小湯山鎮(北緯40°10′48″-40°10′54″,東經116°26′10″-116°27′05″),屬北溫帶大陸半濕潤大陸季風氣候,年平均氣溫約 12 ℃,年平均降水量約580 mm。研究區共分為48個試驗小區,小區面積48 m2。試驗以冬小麥為研究對象,品種包括京9843(J9843)和中麥175(ZM175)。為體現不同小區冬小麥生長狀況的差異,各小區采用不同營養和水分水平進行管理,包括4個氮素水平(N1:未施氮肥;N2:施尿素195 kg·hm-2,1/2正常水平;N3:施尿素390 kg·hm-2,為正常施氮水平;N4:施尿素585 kg·hm-2,為3/2正常施氮水平)和3個水分水平(W1:雨養、W2:正常水養、W3:2倍正常水養)。將48個試驗小區以16個為1組進行劃分,并對每組進行重復處理,其中重復試驗1與重復試驗2數據用于后期冬小麥LAI反演模型建立,重復試驗3數據用于模型驗證。具體研究試驗設計方案如圖1所示。

圖1 試驗設計
本研究分別于2015年4月26日和5月13日兩個關鍵生育時期(挑旗期和開花期)進行冬小麥試驗數據采集,包括冬小麥地面實測光譜數據、LAI數據和無人機高光譜數據。為保證地面實測數據與無人機采集數據的一致性與準確性,在午間12時左右、天氣晴朗無云時進行數據采集。
冬小麥高光譜地面實測數據采用ASD FieldSpecFRPro 2500光譜輻射儀獲取。該輻射儀采樣的光譜范圍為350~2 500 nm,其采樣間隔在350~1 000 nm范圍內為1.4 nm,1 000~ 2 500 nm范圍內為2 nm。數據采集期間,輻射儀探頭保持垂直向下,并與冬小麥冠層間隔1 m,在每個實現小區內隨機進行10次采樣,取平均值作為該小區內冬小麥冠層光譜反射率。無人機高光譜數據由八旋翼無人機平臺所搭載的CubertUHD-185成像儀獲取,該成像儀所獲取的光譜范圍為450~950 nm,光譜采樣間隔為4 nm。對于冬小麥LAI數據,在各試驗小區內選取冬小麥長勢良好區域進行采樣,并對樣本進行預處理,使用CI-203型激光葉面積儀測定葉片面積,乘以單位面積莖數即可得到冬小麥LAI。
1.3.1 PROSAIL模型
本研究使用由PROSPECT-5模型與4SAIL模型耦合而成的PROSAIL模型。其中,PROSPECT-5模型用于模擬400~2 500 nm范圍內葉片組分光譜參數即葉片反射率與透射率。該模型需要6個輸入參數:葉片葉綠素a、b含量Cab;葉片類胡蘿卜素含量Car;葉片等效水厚度Cw;葉片干物質含量Cm;葉黃素含量Cbrown和葉片結構參數N。4SAIL模型用于模擬植被冠層反射率,其輸入參數包括結構參數與組分光譜參數。當PROSPECT模型模擬的葉片反射率與透射率作為SAIL模型的輸入組分光譜參數時,便得到PROSAIL輻射傳輸模型,如式(1)所示[17-18]:
ρ(λ)=PROSAIL(Cab,Cw,Car,Cbrown,N,LAI,LAD,Hotspot,VIS,ρsoil,φs,φv,θs,θv)
(1)
式中,ρ(λ)為波長的冠層反射率;LAD為葉片傾角分布;Hotspot為熱點尺寸;VIS為大氣水平能見度;ρsoil為土壤亮度參數;φs、θs、φv、θv分別表示太陽方位角、太陽天頂角、觀測方位角和觀測天頂角。
結合試驗中冬小麥相關生化參數實測值與現有文獻參數設定,PROSAIL模型的輸入參數查找表范圍如表1所示。為保證參數之間的獨立性,各參數均按照正態分布進行取值,參數輸入組合約3 000組。

表1 PROSAIL模型輸入參數的查找表范圍Table 1 Range of look-up tables for PROSAIL model input parameters
1.3.2 特征波長與植被指數選取
連續投影算法(successive projections algorithm,SPA)對建模集光譜數據進行向量投影循環分析,選擇最大投影值的向量,并在循環過程中建立已選擇向量的回歸模型,以均方根誤差(root mean square error,RMSE)作為模型精度評價指標,最終選取RMSE最小值所對應的波長組作為特征波長[19]。
通過連續投影算法對高光譜數據進行處理,可以有效消除數據中存在的冗余,減少參與模型建立的波長數,降低模型復雜程度。為了消除獲取的光譜中所含的噪聲等干擾因素,本研究對原始光譜進行Savitzky-Golay(S-G)平滑處理,并對處理后的數據計算一階導數(Savitzky-Golay first derivative,SGFD)。SPA算法提取波長數的最大值為15,并使用Kennard-Stone選擇算法對48個樣本進行劃分,其中32個樣本作為建模集,16個樣本作為驗證集。
根據現有高光譜數據反演LAI研究,選取10個與LAI相關的植被指數,具體見表2。
1.3.3 LAI反演方法
對建立的10個植被指數進行相關性分析,篩選出與LAI相關性最好的前5個植被指數,分別建立指數、線性、多項式等單變量預測模型(univariable prediction model,UPM)。同時以偏最小二乘回歸法(partial least squares regression,PLSR)構建多變量預測模型(multivariable prediction model,MPM)。其中,將植被指數(vegetation index,VI)作為輸入變量的模型記為MPM-VI;由原始光譜(origin spectrum,OR)中選取的特征波長作為輸入變量的模型記為MPM-OR;經S-G平滑和一階導數預處理光譜中選取的特征波長作為輸入變量的模型分別記為MPM-SG和MPM-SGFD;將基于查找表的PROSAIL反演模型記為MPM-PROSAIL。
1.3.4 反演結果精度評價
為了對反演冬小麥LAI的精度進行評價,本研究采用決定系數(coefficient of determination,r2)、均方根誤差和平均絕對百分誤差(mean absolute percentage error,MAPE)作為評價指標。

(2)

(3)

(4)


表2 研究選取的植被指數Table 2 Vegetation indices selected for the study
由于無人機搭載的UHD-185傳感器采集的光譜數據范圍為450~950 nm,且光譜采樣間隔為4 nm,因此將ASD實測數據和PROSAIL模擬數據進行重采樣,并計算冬小麥不同生育時期ASD、PROSAIL和UHD-185的平均光譜反射率。為研究重采樣后PROSAIL模擬冬小麥冠層光譜數據與UHD-185采集數據的可靠性,本研究以重采樣ASD地面高光譜數據為標準對二者進行對比分析。由圖2可知,PROSAIL模擬光譜曲線、UHD-185采集光譜曲線與ASD實測光譜曲線在450~900 nm范圍內的變化趨勢大體一致,三者均在550 nm附近出現峰值,在690 nm附近出現谷值。PROSAIL模擬光譜曲線與ASD實測光譜曲線較為吻合,而UHD-185光譜曲線與ASD實測光譜曲線在750 nm后出現明顯差異,且840 nm后出現下降趨勢。究其原因包括但不限于以下兩方面:首先,UHD-185傳感器與ASD傳感器的光譜響應函數之間的差異,因二者響應函數并未公開,故不作過多討論;其次,在光譜數據采集時傳感器的觀測角度(太陽-傳感器-目標構成的觀測天頂角、觀測方位角等)不同會造成二向性反射分布函數(BRDF)的差異。有學者認為,BRDF會對光譜反射率產生影響,特別是紅邊波段范圍(698~750 nm)以后,波長越長,反射率變化越明顯[30]。對重采樣PROSAIL、UHD-185數據與ASD實測數據進行相關性分析,分析結果(圖3)顯示,冬小麥各生育時期PROSAIL、UHD-185與ASD之間呈現高度正相關,決定系數r2均達到0.989以上。綜合以上兩種分析,PROSAIL模擬光譜與無人機UHD-185采集光譜在450~900 nm范圍內能與地面實測光譜數據保持較高的一致性,可以用于后期冬小麥LAI反演建模。
對挑旗期和開花期的冬小麥高光譜原始數據、S-G平滑光譜數據和一階導數光譜數據進行SPA篩選,提取特征波長(表3)。盡管不同生育時期、不同光譜處理方法所選擇的波段分布與數量并不相同,但特征波長主要集中在500~800 nm范圍內,而且經過預處理的光譜中,波段選擇范圍要比原始光譜更廣泛。挑旗期原始光譜所選擇的特征波段數僅為8個,主要分布于700~870 nm范圍;經過S-G平滑后的光譜所選擇的特征波段最多,有15個,主要分布于500~880 nm范圍。而開花期三種光譜所篩選特征波段數為13個左右,均分布于530~880 nm范圍。

圖2 冬小麥不同生育時期高光譜數據對比

圖3 冬小麥不同生育時期的UHD-185、經重采樣的PROSAIL和ASD光譜反射率的相關性

表3 冬小麥不同生育時期提取的特征波長Table 3 Characteristic wavelengths selected at different winter wheat growth stages
經相關性分析,挑旗期和開花期的植被指數與LAI之間均極顯著相關(P<0.01),其中開花期的相關性高于挑旗期(圖4)。植被指數中在挑旗期和開花期,相關系數絕對值最高的均為NVI,其值分別為 0.831、0.854;相關系數絕對值最低的指數為RVSI,其值分別為0.579、0.726。根據相關性,篩選出相關性較強的前5個植被指數建立冬小麥LAI反演模型,其中挑旗期選定NVI、MSR、REP1、NDVI和DPI,開花期選定NVI、MSR、REP1、DPI和RDVI。

圖4 冬小麥植被指數與LAI的相關性
用選定的5個植被指數分別構建不同生育時期單變量預測模型。整體上看,各植被指數所建立的LAI反演模型精度均較高,大部分模型的r2大于0.6,RMSE在0.6~1.0范圍內,MAPE分布在17%左右(表4)。在挑旗期,建模精度最高的模型是基于指數關系的UPM-NDVI模型,其r2為0.717,RMSE和MAPE達到該生育時期所有模型最低值,分別為0.890和15.86%;建模效果最差的模型是基于指數的UPM-MSR模型,其r2、RMSE和MAPE分別為0.598、1.061和 16.86%。在開花期,基于多項式關系的UPM-NVI模型反演精度最高,其r2、RMSE和MAPE分別為0.716、0.649和16.79%;基于線性關系的UPM-RDVI模型反演精度最低,其r2、RMSE和MAPE分別為0.643、0.728和18.66%。對于不同生育時期,同一植被指數所構建的模型反演效果有所差異,開花期構建的模型反演精度整體要高于挑旗期構建的模型。對于不同的回歸模型,同一植被指數的三種模型反演效果較為接近,其r2、RMSE和MAPE并無明顯差異,但基于多項式關系的模型反演精度較高,其r2基本分布于0.7附近,指數和線性模型次之。
將SPA算法所篩選的特征波段和已選擇的5個植被指數作為PLSR回歸模型的輸入變量,構建不同生育時期多變量LAI反演模型,并與基于查找表的PROSAIL模型反演結果進行對比。結果(表5)表明,除挑旗期的MPM-PROSAIL模型外,其他模型的r2均分布于0.7附近。其中,挑旗期多變量模型r2均大于0.72,RMSE和MAPE相差不大,分別在0.8和16%附近。開花期多變量模型r2為0.676~0.733,MPM-PROSAIL模型的RMSE和MAPE分別為0.986和20.58%,高于其他模型。因此,在由特征波段、植被指數和PROSAIL構建的三類反演模型中,MPM-PROSAIL模型反演效果較差。MPM-VI模型在不同生育時期表現較穩定,反演效果最好,挑旗期和開花期模型的r2分別為0.755和 0.733,RMSE和MAPE達到所有模型中最低值,分別為0.823、15.51%和0.629、15.56%。在基于特征變量構建的PLS回歸模型中,MPM-SG模型反演精度較高,MPM-SGFD次之,基于原始光譜的MPM-OR模型反演效果較差,表明經過S-G平滑處理后的光譜數據更有利于模型建立。

表4 基于單一植被指數的LAI反演模型建立Table 4 LAI retrieval models established by single vegetation index

表5 基于多變量的LAI反演模型建立Table 5 LAI retrieval models established by multivariable
根據LAI反演建模精度評價結果,選取基于植被指數構建的MPM-VI多變量回歸模型為冬小麥LAI反演最佳模型,并對該模型進行精度驗證,結果(圖5)表明,模型的RMSE和MAPE在開花期分別為0.405和12.90%,在挑旗期分別為1.101和26.68%。在挑旗期,大部分LAI的預測值分布于1∶1趨勢線上方(圖5A),表明挑旗期的LAI預測值被高估。在開花期,LAI的實測值與預測值較為均勻地分布在1∶1趨勢線附近(圖5B),表明開花期的MPM-VI模型能較準確地反演LAI。

圖5 不同生育期MPM-VI模型驗證結果
將各時期MPM-VI反演模型應用于無人機高光譜影像,得到LAI預測值空間分布圖(圖6)。結合圖1分析,在挑旗期,重復試驗1和重復試驗3部分小區LAI值較低,重復試驗2小區的LAI值較高。在開花期,除重復試驗3部分小區,其他試驗小區的LAI值較高,重復試驗2小區的LAI值達到5.0以上。各時期LAI分布與模型預測結果較一致,挑旗期小區LAI分布有明顯差異,開花期小區LAI分布較均勻。可視化分析結果顯示,冬小麥在開花期的長勢比挑旗期穩定,同時利用植被指數構建的冬小麥LAI反演模型應用于不同生育時期無人機高光譜影像上,可更為直觀地反映冬小麥在不同試驗小區的長勢情況,為農田有效管理提供依據。

圖6 不同生育時期冬小麥LAI預測值
本研究獲取冬小麥兩個關鍵生育時期的高光譜數據和LAI實測數據,并利用PROSAIL模型模擬了冬小麥冠層光譜反射率,結合植被指數和由SPA算法篩選的特征波段,分別構建冬小麥LAI單變量和多變量反演模型,得到了較高的反演精度,有效監測了不同生育時期冬小麥LAI的變化情況。
在高光譜數據獲取與處理方面,本研究選擇了關鍵生育時期地面實測光譜數據、無人機采集光譜數據和PROSAIL模型模擬冠層光譜數據,并對PROSAIL模擬光譜與無人機采集光譜進行數據質量評價,證明了二者在450~900 nm范圍內數據的可靠性,同時也表明PROSAIL模型在作物冠層光譜反射率模擬方面的有效性。隨著近年來對作物結構的深入研究,改進的PROSAIL模型則考慮加入更多的作物生理參數以提高冠層光譜反射率的模擬精度,如PROSAIL-D模型中加入了花青素[31],PROSAIL-DyN模型中加入了蛋白質含量,并用纖維素和木質素總含量代替了干物質含量[32]。本研究中PROSAIL模型輸入的生理參數大多是根據經驗數據或其他文獻內的試驗結果進行設定,因此如何有效準確獲取作物的更多生理參數數據,提高PROSAIL模型模擬精度,可作為后續研究重點。
在篩選用于構建冬小麥LAI反演模型的變量方面,本研究使用SPA算法對光譜數據進行降維處理,同時建立了與LAI相關性較高的植被指數。目前光譜分析中的變量篩選方法較多,如遺傳算法、灰色關聯分析法和相關性分析法等[33],而SPA算法在農作物高光譜波段篩選方面研究較少。在本研究中將SPA算法應用于原始光譜數據和預處理后的光譜數據,均篩選出了數量較少的特征波段,為后續建立反演模型的輸入變量減少了冗余,簡化了模型結構。盡管在建立反演模型時,基于植被指數的多變量反演模型精度更高,但由SPA算法所選定的特征波段構建的多變量反演模型精度也較高,尤其在挑旗期,MPM-SG模型的r2為0.742,比MPM-VI模型低了 0.013,其RMSE和MAPE也比MPM-VI模型僅高了0.022和0.32%,表明SPA算法在冬小麥特征波段篩選中亦是有效的。
在冬小麥LAI反演模型建立方面,本研究所構建的MPM-VI模型反演效果最好,并將該模型應用于無人機高光譜影像上進行LAI空間分布可視化分析,分析結果直觀地顯示了各試驗小區LAI的分布情況。但從建模結果亦可看出,部分基于單植被指數構建的模型反演效果與多變量模型相差不大,甚至反演精度優于多變量模型,比如開花期中UPM-MSR模型的r2、RMSE和MAPE分別為0.706、0.664和17.02%,而該生育時期的MPM-OR模型r2、RMSE和MAPE分別為0.676、0.692和17.71%。考慮到在分析植被指數與LAI相關性的時候,各植被指數均顯示出了與LAI的高相關性,而且在構建模型時挑選了敏感程度較高的前5個植被指數,因此構建的單植被指數模型反演精度會高一點。而多變量模型綜合了不同波段之間的有效信息,特別是MPM-VI模型保留了高相關性植被指數之間的信息,提高了該模型的穩定性,所以MPM-VI模型的反演精度達到最高。
基于試驗實測、PROSAIL模型模擬和無人機影像等多源數據,利用數學統計方法構建了冬小麥LAI反演模型。構建的單變量和多變量模型反演精度均較高,大部分模型決定系數r2可達到0.7以上,均方根誤差RMSE在0.649~1.207范圍內,平均絕對百分誤差MAPE基本在17%附近波動。從模型驗證結果來看,基于植被指數構建的多變量模型反演效果最好,其各精度指標均達到最優,而且將該模型應用于冬小麥LAI空間分布進行可視化分析,結果能較好地反映研究區內冬小麥長勢情況。