劉勇昌,耿 麗,高 強,宋曉欣,王新偉*,任廣偉
1.中國農業科學院煙草研究所,山東省青島市嶗山區科苑經四路11號 266101 2.山東臨沂煙草有限公司沂水分公司,山東省沂水縣長安中路86號 276400 3.河南省農業科學院植物保護研究所,鄭州市農業路與經五路交叉口 450002
病害嚴重影響作物的產量和品質,對病害的發生種類和嚴重度進行準確監測是開展有效防控的前提。目前植物病害的監測方法可分為直接和間接方法,其中直接方法主要包括血清學和分子生物學等方法,間接方法主要包括基于生物標志物的監測方法和基于植物的光譜監測方法等[1]。高光譜遙感是一種基于植物的光譜監測方法,借助相關儀器設備,能夠探測到某些特定波段上的詳細信息,該方法具有快速、精準和無損等優點,已在多種農作物病蟲害的監測預警中進行了相關研究[2-4]。作物病蟲害的光譜特征波段主要分布在可見光波段、近紅外波段和熒光波段,并且隨著作物種類、病害類型和病害嚴重度等的不同而有所差異,這是高光譜遙感監測煙草病蟲害的基礎[5-6]。目前關于植物病害的高光譜遙感數據源主要是借助光譜儀獲取室內和大田作物的病害光譜數據[7]。基于田間獲得的病害光譜數據,國內外學者利用多種算法建立了作物病害嚴重度的預測模型。Yuan等[8]采用Fisher線性判別分析法和偏最小二乘回歸方法分別建立了條銹病、白粉病和蚜蟲為害小麥葉片的光譜反射率判別模型和等級估計模型;朱耀輝等[9]分別運用支持向量機和光譜指數方法進行了冬小麥全蝕病的等級劃分,證明了基于徑向基核函數支持向量機方法是小麥全蝕病危害程度監測的有效手段;張慶等[4]以白粉病侵染的小麥葉片高光譜數據為研究對象,通過概率神經網絡方法建立了病害嚴重度等級的分類識別模型,總體識別精度可達到88%。
在基于光譜數據的煙草病蟲害監測預警方面已有相關研究報道,主要是針對煙草花葉病毒建立了多種病害嚴重度的預測模型,例如一階導數光譜回歸模型[10]、最小二乘-支持向量機模型、偏最小二乘判別分析模型[11]和偏最小二乘法回歸模型[12]。馬鈴薯Y病毒(Potato virus Y,PVY)是一種重要的植物病毒,可侵染煙草、馬鈴薯等多種農作物,嚴重影響作物的產量和品質[13],該病害在我國各煙區均有發生且防治較為困難。對于煙田發生的馬鈴薯Y病毒病害,Krezhova等[14]通過對PVY侵染煙草的光譜數據的導數分析,初步表明利用光譜分析方法監測煙草上馬鈴薯Y病毒病的可行性,但是尚未見有關預測模型的報道。本研究中借助高光譜儀器獲得了煙草感染PVY后不同嚴重度葉片的光譜數據,篩選出光譜反射率與病害嚴重度顯著相關的敏感波長,并采用逐步線性回歸分析方法建立煙草感染PVY后不同嚴重度的預測模型,可為馬鈴薯Y病毒病的無損監測預警以及科學防控提供依據。
試驗地點為中國農業科學院煙草研究所即墨試驗基地。馬鈴薯Y病毒壞死株系PVYN和K326種子均由中國農業科學院煙草研究所植物保護研究中心提供,PVY毒源保存于溫室培養的普通煙草(Nicotiana tabacum)品種K326上。在人工氣候室內定期培養K326煙苗,培養至7~8片葉期用于人工接種PVY,病毒接種方法參考陳茜等[15]的方法。培養條件為光周期為14L∶10D、溫度(25±1)℃、相對濕度65%±5%。
采用ASD Field Spec4便攜式地物光譜儀(美國ASD公司)的手持式葉片夾測量各處理的煙草葉片光譜數據,葉片夾內有石英鹵化燈光源和反射光接收探頭。煙草接種PVY 7 d后開始測量,選擇長勢一致的煙株,每株煙株視為一個樣本,分別選擇煙株上、中、下葉位各1片葉,每個葉片按照葉基、葉中和葉尖部位(避開葉脈)均勻測量光譜反射率6次,取其平均值作為整株(1個樣本)的光譜曲線。測量前,參考GB/T 23222—2008煙草病蟲害分級調查方法[16]確定煙草馬鈴薯Y病毒病嚴重度,即0、1、3、5、7和9級,每隔2 d觀察煙株病情發展,選擇滿足嚴重度等級要求的煙株進行測量,共獲得煙草馬鈴薯Y病毒病不同嚴重度的葉片光譜數據樣本588個(表1)。

表1 感染PVY的煙草葉片光譜數據樣本統計Tab.1 Sample statistics for spectral data of PVY-infected tobacco leaves
1.3.1 數據預處理
通過ASD Field Spec4自帶的View Spec Pro軟件,經過波譜降維和剔除異常值等數據預處理,獲得了相關光譜數據。在此基礎上,繪制感染PVY后不同嚴重度煙草的光譜反射率曲線。
1.3.2 不同病害嚴重度煙草的敏感光譜波長篩選和預測模型構建
將馬鈴薯Y病毒病不同嚴重度等級(0~9)與其對應的每個波段下的光譜反射率值進行一元線性回歸分析,獲得決定系數(R2)和P值,R2越大且越接近1時,表明回歸直線對觀測值的擬合程度越好,自變量和因變量之間的相關性高;P<0.01則可以否定無效假設,表明兩者具有顯著差異意義,從而根據決定系數和P值篩選出相關性顯著的敏感波長。
輸入自變量時,本研究中采用兩種方法:一是基于一元線性回歸篩選出的敏感波長作為自變量,采用前向逐步回歸法建立病害嚴重度等級的預測模型。二是以波段范圍(350~2 500 nm)內合計2 151個波長作為自變量,由于自變量越多,模型參數估計就越不精確,導致模型的魯棒性越差,影響模型應用的效果,本研究中設置了進入模型的數量分別為1、2、3、4和5,即篩選出最優模型所含的自變量分別為1、2、3、4和5個,采用前向逐步回歸法建立病害嚴重度等級的預測模型。在建模和預測分析中對樣本數據采用隨機分層法,根據病害嚴重度等級進行分層分割,各層的80%樣本用作訓練數據集,各層的20%樣本作為預測數據集(表1)。所有的數據分析均在R語言(3.6.2)內完成。
計算模型準確度時,將煙草馬鈴薯Y病毒病嚴重度劃分為輕度(0、1級)、中度(3、5級)、重度(7、9級)3個等級。預測結果y<3屬于輕度,3≤y<7屬于中度,y≥7屬于重度,符合樣本占預測樣本數量的百分比即為模型的預測準確度。
煙草感染馬鈴薯Y病毒病后,病害嚴重度不同,不同波段范圍內的光譜反射率也有明顯差異,其變化趨勢如圖1所示。在可見光波段(400~700 nm)內,隨著病害嚴重度增加,葉片光譜反射率呈現逐漸升高的趨勢。在近紅外波段(700~1 300 nm)內,隨著病害嚴重度增加,葉片光譜反射率呈現逐漸降低的趨勢。表明在不同波段范圍內,存在不同病害嚴重度的差異明顯波段。
通過一元線性回歸分析獲得馬鈴薯Y病毒病嚴重度與各波段光譜反射率的一元回歸決定系數和P值(圖2),其中病害嚴重度與可見光波段(400~700 nm)和近紅外波段(700~1 300 nm)的光譜反射率具有顯著相關性(P<0.01),所構建的回歸方程對觀測值的擬合程度較好(決定系數接近1),在此基礎上根據決定系數和P值進一步篩選出與病害嚴重度等級顯著相關的敏感波長453、518、540、572、708、715、775、780和1 000 nm。
基于上述篩選出來的敏感波長組合(453、518、540、572、708、715、775、780和1 000 nm),利用逐步回歸方法構建了6個煙草馬鈴薯Y病毒病嚴重度等級診斷模型(表2),并進行了結果驗證(表3)。不同模型的精度和預測準確度有一定差異,其中基于波長組合(453、518、572、708和775 nm)所建立的逐步回歸診斷模型為y=92.40x708-47.91x775+322.72x572-4 161.84x518+3 774.54x453+27.81,該模型的驗證決定系數(R2)為0.67,均方根誤差(RMSE)為1.97,對輕度、中度和重度病害的預測準確度分別為86.67%、91.67%和77.78%,總體準確度為83.84%,建模和驗證精度以及模型的準確度均為最佳,優于其他敏感波長組合所構建的模型。

表2 基于煙草光譜反射率構建的馬鈴薯Y病毒病嚴重度診斷模型①Tab.2 Diagnostic model for PVY severity based on tobacco spectral reflectance

表3 不同診斷模型的預測準確度Tab.3 Prediction accuracy of different diagnostic models(%)
本研究中借助高光譜儀器獲取了PVY侵染煙草后不同病害嚴重度煙草的光譜數據,經過一系列的數據處理,篩選出了與病害嚴重度相關性顯著的波長。其中在可見光波段(400~700 nm)內,光譜反射率與嚴重度達到了顯著相關(P<0.01),并且隨著病害嚴重度增加,葉片光譜反射率呈現逐漸升高的趨勢,差異顯著,這與多數研究結論是一致的[10-12,17-18]。據文獻報道,光譜反射率曲線的可見光波段主要反映了葉片表面的結構特點,煙草受到病毒病的侵染后,煙草中部分光學系統對光吸收的色素減少,無法正常吸收輻射,從而不能形成標準的吸收谷,在可見光波段內呈現較高的反射率[19]。在近紅外波段(700~1 300 nm)內,光譜反射率與病害嚴重度達到了顯著相關(P<0.01),并且隨著病害嚴重度增加,葉片光譜反射率呈現逐漸降低的趨勢,差異顯著,這與其他煙草病害的相關研究結論一致[20]。其中的原因是光譜反射率曲線的近紅外波段主要反映了整個葉片內部的生化組分含量。煙草受到病毒病的侵染后,葉片對近紅外輻射的反射能力減弱,導致在可見光區域呈現較低的反射率。說明煙草感染PVY后,不同病害嚴重度的煙草在不同波段范圍內具有顯著差異的波段,可以利用光譜方法來診斷該病害的嚴重度。
本研究中在篩選出具有顯著差異的敏感波長基礎上,利用逐步線性回歸分析方法建立了馬鈴薯Y病毒病嚴重度診斷模型,經過模型檢驗,篩選出總體準確度最佳為83.84%的模型。該模型的預測準確度還有待提高,下一步可以考慮加大取樣數量并優化提取光譜參量算法,從而建立具有更高準確度的反演模型。另外,本研究是在室內人工接種條件下,借助高光譜非成像光譜儀在葉片尺度上實現了煙草馬鈴薯Y病毒病嚴重度的診斷。為了提高所建模型的可靠性和實用性,下一步可以考慮在更為復雜的大田環境下,利用高光譜成像光譜儀在煙草冠層尺度上,進行馬鈴薯Y病毒病嚴重度診斷,同時應加大取樣數量以提高預測準確度。
PVY侵染煙草后,不同嚴重度的煙草在特定波段內的光譜反射率具有顯著差異。隨著嚴重度增加,葉片光譜反射率在可見光波段(400~700 nm)內呈現逐漸升高的趨勢,在近紅外波段(700~1 300 nm)呈現逐漸降低的趨勢。利用逐步回歸法建立預測模型,可基于光譜分析方法實現對煙草馬鈴薯Y病毒病嚴重度的診斷。