祝 榛,李天勝,崔 靜,陳建華,史曉艷,姜孟豪,王海江
(石河子大學農學院/新疆生產建設兵團綠洲生態農業重點實驗室,新疆石河子 832003)
【研究意義】水分含量的高低直接影響小麥的產量與品質[1, 2],傳統獲取作物水分狀況通常采用“烘干法”,該方法耗時費力,且對作物具有破壞性。實時、快速獲取作物水分狀況,對監測作物水分盈虧和制定合理灌溉制度具有重要意義。【前人研究進展】無損監測手段中的高光譜成像技術高分辨率、多波段,可以避免“同譜異物”和“同物異譜”等問題,具有“圖譜合一”的優勢,是較為高效的一種監測手段[3, 4]。利用高光譜成像技術可監測農田土壤和作物水分狀況、營養狀況、生物量等農藝參數,但是由于外界環境因素和作物自身的影響,利用作物的原始光譜反射率構建的估測模型往往預測精度較低,通常需要對作物的原始光譜反射率進行預處理[5-8]。Qi等[9]對近地高光譜成像原始數據進行66種數據變換,對比分析了估測土壤N、P、K含量的準確度。曹曉蘭等[10]對苧麻葉片高光譜數據采用SG平滑、一階導數、歸一化、正交信號校正OSC等多種光譜預處理方法,結果表明,OSC變換構建的模型具有最佳預測效果。不同的建模方法因其算法和目標的應用上存在差異,會導致模型的估測精度有一定的差異。許英超等[7]構建主成分回歸(PCR)、支持向量機回歸(SVMR)和偏最小二乘回歸(PLSR)高光譜估測模型快速檢測馬鈴薯中干物質,發現PLSR模型的預測效果最優,預測集決定系數為0.849。王凌等[11]利用高光譜數據構建蘋果盛果期冠層組分特征的定量估測模型,發現BP人工神經網絡回歸(BPANN)和支持向量機回歸(SVMR)等非線性模型預測精度整體上要優于線性模型,尤以支持向量機回歸模型預測效果最佳。Eekinbaev等[12]運用近地高光譜成像技術對小麥硬度進行預測,發現人工神經網絡(ANN)模型的預測效果比PLSR模型較好。劉燕德等[13]利用高光譜成像技術,結合自適應重加權算法(CARS)和連續投影算法(SPA)篩選特征光譜變量,構建臍橙葉片葉綠素含量的PLS回歸模型,結果表明CARS-PLS和SPA-PLS模型的估測精度要優于變量篩選前的PLS模型。【本研究切入點】利用高光譜成像技術對農田作物進行監測是可行的,但由于作物的水分狀況與其生育時期有著密不可分的關系,作物冠層的光譜反射率會隨著生育期的推進存在一定的差異,導致在不同生育時期構建的高光譜估測模型的精度存在差異。亟需研究實時、快速估測冬小麥不同生育時期水分狀況,并構建水分含量估測模型。【擬解決的關鍵問題】比較12種光譜數據變換,采用3種線性模型(SLR、PCR、PLSR)估測小麥植株水分含量精度,利用連續投影算法(SPA)優化特征波段,構建冬小麥植株水分最優估測模型,以及精準普適的冬小麥不同生育時期植株水分含量的最優高光譜估測模型,為農田作物水分狀況的實時監測、精準診斷和定量管理提供理論依據。
試驗于2017年9月至2019年6月在石河子大學農學院試驗站(45°19' N,86°03' E,海拔440 m)進行。供試品種為新冬22號和新冬43號,其中新冬43號為新疆農墾科學院選育品種,為水分敏感品種。
1.2.1 試驗設計
試驗共15個小區,每個小區面積為40 m2(5 m×8 m),播種密度為525×103粒/hm2,播種采用人工條播,行距15 cm,播種日期分別為2017年9月23日和2018年9月30日。共設置5個水分處理,全生育期灌溉量分別為150 mm(W1)、300 mm(W2)、450 mm(W3)、600 mm(W4)和750 mm(W5),每個處理設置3次重復。播種后各處理均滴出苗水60 mm,冬前均灌越冬水90 mm,各處理從返青后開始進行水分處理,W1處理不灌水,其他水分處理在返青至成熟共灌水8次,每10 d灌1次,每次灌水量通過水表控制。采用滴灌帶間距為60 cm,毛管配置為1管4行,各處理間均埋有1 m深防滲膜隔開。全生育期基施尿素150 kg/hm2、磷酸二銨375 kg/hm2,追施尿素300 kg/hm2,分別在越冬期、拔節期、孕穗期、抽穗期、灌漿期按照10%-30%-20%-30%-10%的比例隨水滴施。追施磷酸二氫鉀60 kg/hm2,分別于拔節期和抽穗期均勻滴施。表1

表1 不同灌溉處理灌水量
1.2.2 指標測定
1.2.2.1 冠層光譜
利用SOC710VP可見近紅外成像光譜儀(Surface Optics Corporation, USA)和SOC710SWIR短波紅外成像光譜儀(Surface Optics Corporation, USA),采集拔節期至灌漿期冬小麥冠層的高光譜圖像,共采集5次。SOC710VP可見近紅外成像光譜儀的光譜分辨率為1.3 nm,圖像分辨率為1 392×1 040,光譜范圍376~1 044 nm,包含128個波段;SOC710SWIR短波紅外成像光譜儀光譜分辨率為2.75 nm,圖像分辨率為640×568,光譜范圍916~1 699 nm,包含288個波段。圖像采集選擇晴朗、無風和無云時進行,測定時間為12:00~16:00。
測定時高光譜成像儀放置在高度可調、角度可變的便攜式多功能野外觀測架上,通過自帶的水平儀調平,鏡頭垂直向下,距離冠層垂直高度1.5 m,每個處理測量3次,取平均值作為該處理光譜測量值,測量時用參考板標定(冠層和參考板要在相同的光照條件和環境狀態下測定)。
1.2.2.2 植株水分
與光譜測量同步,在每個處理的小區內隨機采集可表征平均長勢的3株單莖,快速分樣后立即裝入己稱重的自封袋(可密封)并放入冰盒,帶回室內用萬分之一精度電子天平稱取各部分鮮重后,在105℃下殺青30 min后于80℃烘干至恒重稱其干重。計算植株水分含量(Plant Water Content,PWC)。
(1)
式中PFW(Plant Fresh Weight)為植株鮮重(g),PDW(Plant Dry Weight)為植株干重(g)。
1.2.2.3 光譜數據變換

1.2.3 模型構建與檢驗
1.2.3.1 建模集與預測集劃分
共采集2019年冬小麥拔節期、抽穗期、揚花期、灌漿前期和灌漿中期植株樣本各30個,測定其水分含量。按照濃度梯度法[10, 14],將每組的30個樣本分為2部分,其中22個樣本作為建模集,8個樣本作為預測集,并用2018年的樣本作為獨立樣本對構建的模型進行普適性檢驗。表2

表2 冬小麥不同生育時期植株水分含量變化
1.2.3.2 模型構建
利用全波段和特征波段分別構建偏最小二乘回歸(Partial least squares regression,PLSR)模型、主成分回歸(Principal components regression,PCR)模型和一元線性回歸(Simple linear regression,SLR)模型,以光譜反射率作為輸入量,構建冬小麥植株水分含量估測模型。
1.2.3.3 特征波段提取
采用連續投影算法(Successive projection algorithm,SPA)對經過預處理后得到的多種變換光譜進行特征波段選取。設置SPA算法選取特征波段數的范圍為5~30,提取的特征波段作為建立估測模型的輸入參數[15],采用交叉驗證以避免過度擬合問題[16]。
1.2.3.4 模型檢驗
模型預測精度評價參數主要有決定系數(Determination coefficients,R2)、均方根誤差(Root mean squared error,RMSE)以及殘差預測偏差(Residual prediction deviation,RPD),其計算公式分別為式(2)~(4),其中決定系數越大,標準誤差越小,模型估測精度越高。當RPD<1.0時,模型估測能力極差;當1.0
(2)

(3)
(4)


SDp——預測集的標準偏差,
RMSEp——預測集的均方根誤差。
光譜圖像采集以線掃描方式進行,用HypeersScanner2.0軟件(Surface Optics Corporation, USA)進行采集,計算機控制曝光時間和圖像校正。一階微分和二階微分變換采用Origin 2018(OriginLab Corp., Northampton, MA, USA)軟件計算,其他數據變換采用Microsoft Excel 2013(Microsoft Corp., Redmond, WA, USA)軟件計算,利用SigmaPlot 12.5(Systat Software, Inc., USA)軟件制圖。建模采用The Unscrambler 9.7軟件(CAMO Software AS, OSLO, Norway)。相關計算用Matlab R2016a軟件實現。
研究表明,所有樣本的光譜反射率變化趨勢基本一致,在451~672 nm呈現先升后降的趨勢,在451~553 nm呈現升高的趨勢,在553 nm處有一反射峰,反射率極大值為0.075 9,在553~672 nm反射率持續下降,至672 nm形成一處吸收谷,反射率極小值為0.011 9;在672~777 nm光譜反射率呈現急劇升高的趨勢,而后至896 nm光譜反射率波段幅度不大。在967~1 660 nm范圍內光譜反射率較高,在1 125和1 273 nm處形成反射峰,反射率極大值分別為0.374 9和0.273 9,在1 469 nm處形成一個強吸收谷,反射率極小值為0.032 5。冬小麥冠層光譜反射率與植株水分含量的高低并不呈規律性變化,水分含量高的樣本冠層光譜反射率并不一定低。T1、T2、T3和T4變換與植株水分含量之間的相關性無明顯提高;T5、T6、T7、T8、T9、T10、T11、T12變換與植株水分含量的相關性明顯增強,最大相關系數分別出現在波長558、492、486、492、558、589、558和584 nm處,最大相關系數分別為-0.811 0、-0.641 4、-0.823 4、-0.656 1、0.815 7、-0.739 9、-0.893 0、0.841 6。圖1,圖2

圖1 不同水分條件下冬小麥冠層光譜反射率變化特征

圖2 植株含水量與不同變換光譜的相關性


表3 冬小麥植株水分含量估測模型的構建


表4 基于SPA的冬小麥植株水分含量不同生育時期的PLSR估測模型


圖3 不同生育時期植株水分含量估測模型的驗證Fig.3 Estimation model checking of plant moisture content in different growth stages
研究利用高光譜成像技術獲取冬小麥冠層光譜特征,發現在553、1 125和1 273 nm附近有反射峰的形成,在672、1 469 nm附近形成吸收谷,與前人的研究結果基本一致[18, 19],主要是因為550 nm附近是葉綠素的反射峰區,在730~1 300 nm植物的透射率較高,而吸收率較低,650~700 nm是葉綠素的強吸收帶,1 360~1 470 nm是水和二氧化碳的強吸收帶[20]。而冬小麥冠層原始光譜反射率與植株水分含量并未呈現較高的相關性,或許是由于地物目標和外界環境的共同作用,掩蓋了植株水分含量呈現的光譜特征,使原始光譜反射率與水分含量不呈規律性變化[21, 22]。對原始光譜反射率進行不同形式的數據變換可以消除背景干擾,提高光譜反射率與目標屬性的相關關系[6],研究對冬小麥冠層原始光譜進行平滑、開方、對數、倒數、微分等12種數據變換,結果表明,T5、T6、T7、T8、T9、T10、T11、T12變換與植株水分含量的相關系數均有不同程度的提高,但其最大相關性出現的波段位置并不一致。或許是因為T5、T6、T7、T8、T9、T10、T11、T12處理均對原始光譜特征進行了微分變換,而微分變換可以提取出目標屬性隱藏的光譜信息,提高不同吸收特征的對比度[23, 24],經微分變換以后的光譜特征與目標屬性的相關性有明顯的提高。
不同的建模方法因其算法、模型結構的不同會導致構建的模型預測精度差異較大。張筱蕾等[25]利用偏最小二乘(PLS)和最小二乘支持向量機(LS-SVM)構建高光譜估測模型估測油菜葉片氮含量,發現LS-SVM模型的預測精度要優于PLS,其預測相關系數為0.836。李丹等[26]建立PLSR和PCR模型對靈武長棗糖度和水分含量進行預測,結果表明,PLSR模型的效果較好,均優于PCR模型。研究利用SLR、PCR、PLSR 3種建模方法構建冬小麥植株水分含量高光譜估測模型,3種建模方法中,SLR的建模效果相對較差,PCR和PLSR的建模效果要優于SLR,PLSR的建模效果最佳,要整體優于PCR和SLR,其中,T3-PLSR模型的估測精度最高,模型RPD值為2.934 3,此時模型對植株水分含量具有很好的估測能力。可能是因為SLR是單變量模型,其建模的光譜信息較少,模型不夠穩定,容易受到較大的外界因素影響;PCR和PLSR均為多變量回歸模型,其建模的光譜信息較多,模型足夠穩定,受外界因素影響較小,而PLSR則包含了PCR等線性回歸模型的優勢,還可以克服過度擬合、多重共線性等問題[26, 27],研究構建的PLSR模型的預測效果要優于PCR和SLR模型。但多變量模型波段數量較多,不利于對目標屬性進行快速、高效的估測,研究利用SPA對T3-PLSR進行特征波段的篩選。
賀佳等[28]利用植被指數對不同生育時期的冬小麥葉面積指數(LAI)進行監測,同一植被指數在不同生育時期與LAI的擬合效果有明顯的差異。馬驛等[29]以冬油菜為研究對象,利用12個光譜特征參數和11個植被指數建立不同生育時期LAI的定量反演模型,結果表明,難以用統一的植被指數和光譜特征參數估測油菜全生育期的LAI,不同生育時期需選擇合適的植被指數和光譜參數來進行估測。哈布熱等[18]對冬小麥不同生育時期的冠層含水率進行高光譜估測研究,同樣認為不同生育時期的估測模型精度有明顯的差異。研究對不同生育時期的冬小麥植株水分含量構建PLSR估測模型,不同生育時期的PLSR模型估測精度有較為明顯的差異,生育前期的估測模型精度較低,生育后期的估測模型精度相對較高,其中灌漿中期的估測模型精度最高,其模型RPD值為3.454 7,大于3.0,模型可以對植株含水量進行極好的估測。這可能是因為生育前期的小麥植株矮小,葉面積指數較小,采集的高光譜圖像受土壤、陰影等外界環境因素的影響;而生育后期,冬小麥植株較大,植株覆蓋度有較為明顯的提高,采集的高光譜圖像受外界影響較小,且植株水分含量較低時,對各波長的光譜信息吸收較弱,能更好的表達植株水分光譜特征信息,所以生育后期的估測模型精度相對較高[30-32]。研究對不同生育時期冬小麥植株水分含量的PLSR估測模型進行普適性檢驗,不同生育時期的檢驗模型R2隨生育進程的推進呈現上升的趨勢,但均低于全生育期的檢驗模型R2,這或許是受樣本量的影響,各個生育時期的檢驗樣本均為25個,全生育期的檢驗樣本為125個,而檢驗模型是預測值與實測值構建的單因素線性模型,受樣本量影響較大,樣本量較少時,模型不夠穩定[33, 34]。
4.1冬小麥冠層原始光譜反射率與植株水分含量的高低不呈規律性變化,且相關性較低,原始光譜反射率經過數據變換后,可以顯著提高其與冬小麥植株水分含量的相關性,倒數一階微分變換與冬小麥植株水分含量的相關系數最大,為-0.893 0。

