楊婧, 廖桂平, 劉凡, 官春云
(湖南農業大學農學院,長沙 410128)
油菜是重要的油料作物,其種植面積和總產量在油料作物中占有相當大的比例[1]。葉綠素含量是影響植物生長的重要因素[2],傳統的測定方法主要有紫外分光光度法、熒光分析法、活體葉綠素儀法、光聲光譜法和高效液相色譜法等[3]。這些方法需實地調查或取樣進行實驗室測定,難以做到實時檢測,分光光度法、熒光分析法、光聲光譜法和液相色譜法在測定過程中還要進行破壞性取樣[4],葉綠素儀法雖不用進行破壞性取樣,操作簡單,但測取效率不高,費時費力。快速準確預測葉綠素含量才能夠及時監測作物生長發育過程中葉綠素的變化并及時做出相應調整,將大大降低栽培和生產成本,提高最終產量。預測葉綠素最初依靠人工經驗,雖然在一定程度上滿足了實時快速的要求,但是對人的能力、經驗要求較高,而且準確率也得不到保證。生化實驗測出的結果準確,但是存在高成本、不及時、操作復雜等缺點。高光譜技術實現了對作物信息的快速、實時、準確、無損監測。通過建立高光譜與葉綠素之間的聯系[5-6],再利用回歸分析等方法預測葉綠素含量是遙感技術在農業方面應用的重要內容。
精細農業技術是田間作物管理的重要手段,高光譜遙感分辨率高、圖譜合一,其所獲取的信息在信息量、波段數、波段相關性、處理方法、應用模型等[7]方面都要優于傳統的全色、多光譜遙感。隨著科技的發展,高光譜遙感的分辨率越來越高,應用的范圍也越來越廣,特別是在作物生長監測上發揮了很大的作用[8-9]。高光譜技術監測作物生長過程主要體現在改善栽培[10]、優化作物分類收獲、監控作物品質[11]、預測理化指標[12]等方面,是精細農業遙感監測的主要的信息來源。
高光譜信息冗長、數據量大,不方便處理和應用,影響模型精度。因此,對高光譜信息進行特征波段篩選、提取等是很有必要的。而利用敏感波段構建的光譜指數可以進一步強化特征,提高模型精度,已有研究表明光譜指數能很好的估算綠色植物的葉綠素含量[13-14]。BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,因其很強的非線性映射能力和很好預測能力在高光譜反演中應用廣泛[15]。
近年來,隨著油菜栽培技術的快速發展,出現了許多栽培措施,而這些新措施的大面積推廣亟需通過遙感技術來進行無損監測其長勢。為此,本研究利用SPAD儀和高光譜成像儀研究油菜葉綠素含量與光譜間的定量關系,找出其原始光譜反射率、一階導數對葉綠素的敏感波段并計算光譜指數,利用光譜指數和SPAD值分別構建線性回歸以及BP神經網絡模型,以便找出最佳反演模型,為今后通過高光譜遙感監測油菜田間生長提供參考依據。
試驗于2018—2019年度在湖南農業大學耘園基地進行。試驗地位于28°10′E、113°4′N,四季分明,年均氣溫17 ℃,是典型的亞熱帶季風性氣候。試驗田為土壤黑色壤土,土壤的理化性質如表1,種植制度為稻油輪做。2018年9月27日播種,試驗品種為高油酸油菜品種708、710,由湖南農業大學油料所提供。

表1 土壤基本理化性質Table 1 Basic physical and chemical properties of soil
試驗按種植密度、施肥量兩因子隨機區組設計,每個小區三個重復。于2018年10月1日在油菜幼幼苗期時對油菜施加氮磷鉀復合肥(N+P2O5+K2O),施肥量設為三個水平,分別為低(300 kg·hm-2)、中(600 kg·hm-2)、高(900 kg·hm-2);種植密度設三個水平,分別為低(15萬株·hm-2)、中(22.5萬株·hm-2)、高(30萬株·hm-2),每個處理3次重復,加上空白對照組共60個小區,小區面積為16 m2,按大田管理方式進行管理。
分別于幼苗期(11月中旬)和蕾薹期(1月中旬)測定油菜葉綠素和光譜曲線。幼苗期選擇已伸展開的嫩葉、蕾薹期選擇從上往下第3 片功能葉。采用日本美能達公司SPAD-502測定葉綠素,每小區共隨機采集5次重復,取其平均值。經SPAD測定的葉片,采摘下來先用自來水洗凈后,再用超純水清洗,然后用吸濕紙吸去植株表面水分,使用美國SOC公司SOC710便攜式高光譜成像儀(波長范圍400~1 000 nm,分辨率4.687 5 nm)測定光譜曲線。每片葉在油菜葉片敏感區域為距葉尖1/5處[12]選取5個區域,用這5個區域的平均反射率作為該葉片的反射率(圖1)。
1.4.1光譜數據預處理 采用五點加權平滑法對原始光譜數據進行預處理[16-17],逐步回歸分析挑選敏感波段,利用敏感波段構建光譜指數,本文主要用到下列光譜指標。
光譜反射率:ρ=ρn
(1)
一階導數:R’=Rn+1-Rn-1/2Δλ
(2)
比值植被指數[18]:RSI=Rn/Rm
實驗組總體健康、生理功能、社會功能、活力、生理職能、情感職能、軀體疼痛和精神健康方面和對照組實驗數據間均存在著明顯的差異,且P<0.05,具備統計學分析意義。見表1。
(3)
差值植被指數[19]:DSI=Rn-Rm
(4)
歸一化植被指數[20]:NDSI=Rn-Rm/Rn+Rm
(5)
改進型葉綠素比值指數[21]:MCARI=[(R700-R670)-0.2×(R700-R550)]×(R700/R670)
(6)
式中,ρn為n處的反射率值, Δλ是相鄰兩個光譜波段之間的波長距離。
1.4.2預測模型建立及精度驗證 采用一元線性回歸和BP神經網絡兩種方法研究油菜葉片光譜數據和葉片葉綠素之間的關系。先將與油菜葉片SPAD值相關性較高的光譜指數作為自變量,SPAD值為因變量,逐一引入一元回歸方程,構建一元回歸模型。對60組油菜樣本,其中50個樣本為訓練集,10個樣本為測試集,構建由一個輸入,兩個輸出層(包含一個隱含層),五個隱含神經元,一個輸出所構成的BP神經網絡進行訓練。設置迭代次數為1 000,學習精度為0.01,訓練目標為均方根誤差小于0.001。訓練完成后以葉綠素預測值為橫軸,以葉綠素實測值為縱軸建立神經網絡模型并進行驗證,擬合值R越接近1說明模型擬合地越好。通過均方根誤差(RMSE)評價模型精度[22],RMSE值越小則結果越精確。
一元回歸分析方程:y=kx+b
(7)
(8)
式中,y代表葉綠素含量,x為特征變量,b為回歸常數,yi和y′i分別代表葉片葉綠素含量的實測值和預測值,n為總樣本數。
比較兩個生育期的油菜葉片SPAD的平均值(表2)可以看出,兩個生育期的SPAD值標準差、偏度絕對值比較接近;蕾薹期的平均值、最大值、最小值均高于幼苗期,整體差異顯著。

表2 不同生育期油菜葉片樣本SPAD值統計分析Table 2 Statistical analysis of SPAD value of rapeseed leaf samples at different growth stages
對兩個生育期的光譜反射率和一階導數的平均值進行分析(圖2),兩個生育期的光譜反射率及其一階導曲線基本一致,均符合綠色植物葉片的“兩峰三谷”特征[23]。由幼苗期到蕾薹期,油菜葉片光譜反射率呈上升趨勢。從光譜反射率的一階導數圖可以看出,曲線走勢和光譜反射率曲線相對應。
兩個生育期的光譜反射率及一階導與對應的葉片SPAD值相關性如圖3所示,可以看出,在幼苗期光譜反射率和SPAD值呈正相關,而蕾薹期呈負相關;兩個生育期曲線的走向基本一致,波峰、波谷的出現也具有一定的規律性,幼苗期有兩個相關性谷分別出現在波段520~580 nm和波段680~730 nm處,相關性峰出現在在波段640~700 nm處,并在綠光561 nm附近達到極值;而蕾薹期在520~580 nm和680~730 nm兩個波段對應的是相關性峰,在波段640~700 nm處對應的是相關性谷,極值出現在綠光554 nm附近。反射率的一階導數與SPAD值的相關性和反射率的情況基本一致,幼苗期的相關性峰和相關性谷對應的是蕾薹期的相關性谷和相關性峰,但兩個生育期極值位置有所不同,幼苗期極值出現在紅光738 nm附近,蕾薹期極值出現在綠光506 nm附近。根據油菜葉片光譜反射率及其一階導與SPAD值的相關分析再結合逐步回歸的結果(表3),最后得出油菜葉片光譜對于SPAD值的敏感波長(表4)。

表3 油菜葉片光譜逐步回歸結果Table 3 Stepwise regression results of leaf spectra of rapeseed

表4 油菜葉片對SPAD值的敏感波長Table 4 Sensitive wavelength of rapeseed leaves to SPAD value
將確定好的敏感波長兩兩組合,利用其所對應的光譜值分別計算RSI、DSI、NDSI和MCARI,并將結果與油菜葉片SPAD值進行相關性分析(表5僅列出相關系數在0.5以上的光譜指數)。由表5可知,兩個生育期所計算出的光譜指數絕大部分與SPAD值都具有極顯著相關關系,而且蕾薹期光譜指數與SPAD值相關性普遍比幼苗期要高。在不同波長和RSI、DSI、NDSI和MCARI組合中,RSI和NDSI這兩種光譜指數的與葉片SPAD值相關性明顯好于DSI和MCARI的組合。

表5 與油菜葉片SPAD值具有顯著相關性的光譜指數Table 5 Spectral parameter significantly correlated with SPAD values of rapeseed leaves
2.4.1一元回歸模型的建立 以油菜葉片SPAD值相關性最高的兩個光譜指數為自變量與SPAD值建立一元線性回歸模型(表6)。由表6可知,幼苗期以波段組合514和738 nm的一階導比值植被指數RSI決定系數最高(R2=0.524 3),均方根誤差最小(RMSE=1.644 3);蕾薹期以波段組合555和646 nm的反射率比值植被指數RSI決定系數最高(R2=0.646 9),均方根誤差最小(RMSE=1.645 7)。綜合兩個生育期,蕾薹期的估算模型精度要高于幼苗期,擬合效果也更好。

表6 基于高光譜指數的葉片SPAD值估算模型Table 6 Estimation model of leaf SPAD value based on hyperspectral index
2.4.2神經網絡分析 針對60組油菜葉片樣本,利用神經網絡建立葉綠素估算模型。每個樣本由敏感波段及其兩兩組合的光譜指數組成,共計23個光譜指數為特征輸入,SPAD值為輸出,用其中50個樣本作為訓練集,10個樣本為測試集,采用Trainlm訓練方法[24]進行回歸分析。從回歸結果(圖4~7)來看,幼苗期和蕾薹期一階導數模型的擬合比較好,R分別為0.779 8和0.839 8。
訓練完成后再對隨機產生的測試集樣本進行仿真測試得到預測值,將預測值歸一化之后和真實值比較(圖8、9),利用決定系數(R2),均方根誤差(RMSE)對模型性能進行評價(表7)。

表7 油菜葉片光譜指數與SPAD值神經網絡模型檢驗結果Table 7 Testing results of spectral index and SPAD value of rapeseed leaves by neural network model
從評價結果可以得出,神經網絡模型創建的模型精度高于一元線性回歸模型,決定系數都在0.7以上,均方根誤差在1.2~1.7之間,相對最優一元線性回歸模型精度也有大幅度的提升,其中幼苗期反射率光譜指數構建的模型精度最高(R2=0.807 0,RMSE=1.131 5),蕾薹期一階導數光譜指數構建的模型精度最高(R2=0.873 2,RMSE=1.322 3)。不同的是在訓練結果顯示擬合比較好的幼苗期一階導數模型,在最后的模型檢驗效果卻是一個偏低的水平,可能跟模型對測試集樣本的劃分有關。蕾薹期和幼苗期的BP神經網絡模型比傳統的回歸模型更適合預測油菜的葉綠素含量。
使用光譜特征波段估測葉片葉綠素含量具有較高的精度和效率,方慧等[25]研究油菜葉片葉綠素含量和不同氮肥水平之間相關性,發現位于可見光-紅邊波段的綠峰、紅邊波段能夠良好地預測葉片葉綠素含量。張永賀等[26]對葉片葉綠素含量和三邊參數的關系進行了計算,其中,SDr、SDb、SDr/SDb、(SDr-SDb)/(SDr+SDb)等參數相關系數均大于0.6,能較精確地估測葉片葉綠素含量,為高光譜遙感大面積監測油菜營養生長期生長狀況提供了理論依據,也減少了高光譜數據處理的工作量。
本研究利用油菜幼苗期和蕾薹期的葉片光譜數據分別建立與兩個生育期的葉片SPAD值的葉綠素估算模型,認為對SPAD值敏感的光譜波段范圍均在可見光范圍內;由敏感波段兩兩組合計算出的光譜指數中,RSI和NDSI這兩種光譜指數與SPAD值的相關系數明顯要高于DSI和MCARI,并且蕾薹期所計算出的光譜指數的相關系數要高于幼苗期;本研究還利用神經網絡構建的葉綠素估算模型,精度評價結果均顯示比較高的水平,幼苗期反射率光譜指數構建的模型精度最高,決定系數R2為0.807,蕾薹期一階導數光譜指數構建的模型精度最高,決定系數R2為0.873,蕾薹期的葉綠素估算模型整體效果要優于幼苗期的模型,其原因可能是幼苗期葉片較小,油菜生長較慢,主要通過根從地下獲取營養生長,此時葉綠素還不是主要的影響因素,不同樣本葉綠素差異較小導致整體相關性下降。另外,本研究分別建立幼苗期和蕾薹期光譜指數與油菜葉片SPAD值的估算模型,一元線性回歸模型采用相關系數最高的兩個光譜指數建模,其模型精度還遠低于基于本文所計算的全部光譜指數所構建神經網絡模型。BP神經網絡模型是預測葉綠素含量較為理想的模型。
本研究以光譜指數為基礎,結合一元線性回歸和神經網絡建立葉綠素的估算模型,在今后研究中可以探索更多種類的光譜指數,以及更加精確穩定的模型預測葉綠素含量,并且應用到大田環境中做實時快速無損監測。