李 寶,王孟和,汪光勝,胡 陽,李偉濤,劉玉嬋,徐建輝
(1.安徽省基礎測繪信息中心,安徽 合肥 230000;2南京市測繪勘察研究院股份有限公司,江蘇 南京 210019;3. 滁州學院 安徽地理信息集成應用協同創新中心,安徽 滁州 239000)
葉綠素是植物體所特有的一類與光合作用有密切關系的最重要的色素,植物葉綠素的含量及其變化能夠較好地反映植物的光合能力、養分狀況和生長健康狀況[1-2]。在農作物長勢監測、病蟲害監測、作物產量估算和作物成熟期預測等方面具有重要意義[3]。傳統的葉綠素測量方法多采用化學測定法,對葉片破壞性大,耗時長[4]。 隨著高光譜技術的發展,特別是便攜式高光譜測量儀器的出現,部分學者開始探討葉片葉綠素與高光譜之間的關系[4-5]并將其應用到農產品研究中[6-8],取得較好的成果,驗證高光譜監測葉片葉綠素的可能性且具有較高的精度。鮮桃生產是滁州市果樹類農業生產的重要一部分,特別是山區經濟發展的重要途徑,但是在實際生產中,鮮桃生產管理的技術較為落后,還無法達到精準農業的要求,快速、低耗、無損地測定鮮桃葉片葉綠素含量對鮮桃長勢監測,施肥控制,產量估測等具有重要意義。因此,基于高光譜技術,利用ASD公司的FieldSpec3光譜儀采集40棵鮮桃樹的4個生長時期的葉片高光譜數據及對應的葉綠素含量數據,分別建立鮮桃葉片葉綠素的主成分分析-支持向量 (principle component analysis-support vector regression,PCA-SVR) 回歸預測模型和小波去噪-偏最小二乘法(wavelet denoising-partial least square regression,WD-PLSR)回歸預測模型,旨在實現鮮桃葉片葉綠素含量快速、無損檢測,為鮮桃生產管理提供科學參考。
實驗樣本來源于安徽省滁州市來安縣桃園,桃樹品種為“秋蜜紅”,桃齡約為10年,處于盛果期,樹形為主干分層型,每年修剪一次枝葉,施肥以氮肥為主。樣本采集時間分別為2015-05-12,06-20,07-22,09-06,對應鮮桃生長的萌芽期、穩果期、壯果期和采果期。選取40棵桃樹,從每棵桃樹分別均勻地采集8片大小勻稱的健康葉片,使用清水清洗,并用棉布擦干后裝入保鮮袋中封存編號,最后平整置于保溫箱中。
在暗箱實驗室環境中使用ASD公司的FieldSpec3光譜儀采集鮮桃葉片高光譜數據,光譜值范圍為350~2 500 nm,光譜自然間隔為1 nm。光纖探頭加裝視場角為10°的鏡頭,探測距離為6 cm,使用ASD公司提供的標準白板進行光譜校正。分別在葉片尖部、中部和根部采集光譜反射率取其平均值作為此葉片的光譜反射率。取同一時期同棵鮮桃樹上8片葉子的平均光譜反射率作為一個樣本單元,提取4個時期40棵鮮桃樹的160個鮮桃葉片光譜反射率樣本。鮮桃葉片在4個生長期的平均光譜反射率如圖1所示。

圖1 不同生長時期鮮桃葉片樣本平均反射率
由圖1可以看出,四個時期葉片光譜差異較為明顯,總體而言,萌芽期葉片光譜反射率略高于其他時期,采果期葉片光譜反射率較低,主要的光譜區分區間為500~560 nm的綠光波段,760~1 300的近紅外、中紅外和遠紅外波段,以及1 500~1 850 nm和2 000~2 400 nm波段,可區分性較好,在可見光波段向近紅外過渡時,除萌芽期外,其他時期的光譜發射率的相對順序都發生了轉置,主要原因是這兩個波段區間影響光譜反射率因素的影響狀況差異明顯。
為獲取鮮桃葉片實際葉綠素含量,通過分光光度法測定每個葉片葉綠素含量,具體測定過程及葉綠素總質量濃度和葉綠素質量分數計算參見文獻[9]。通過葉綠素測定實驗,得到4個不同生長期160份鮮桃葉片樣本葉綠素含量數據,統計結果如表1所示。

表1 不同生長時期鮮桃葉片葉綠素含量
測得的高光譜數據波段多達2 150個,存在多重共線性,數據冗余量較大,不利于數據處理和分析,也會降低數據建模結果的精度,因此對原始數據的降維處理是必要的。主成分分析能夠確定原始波段最優線性組合,實現高光譜圖像數據降維[10]。小波去噪是使用小波分解含噪光譜,將其與噪聲部分分離,能夠提高光譜數據信息的精度[11]。分別采用主成分分析法對原始光譜數據進行降維處理和使用小波去噪進行數據處理,經過多次試驗,確定最優參數的組合,并對結果進行比較選優。
支持向量回歸是由支持向量機應用在非線性回歸問題上發展而來的,在保證逼近訓練精度的同時降低學習機器的復雜度[9]。在高光譜分析中有很多應用[12-13]。利用SVR算法構建模型時,核函數參數γ和懲罰系數C對模型結果具有重大影響,本文選用徑向基(Radial Basis Function,RBF)核函數并采用格點搜索法進行正交驗證確定核函數參數γ和懲罰系數C。利用決定系數R2和均方根誤差RMSE估測回歸模型精度,最終選定PCA較優能量比和較優光譜形式。偏最小二回歸具有主成分分析、普通多元線性回歸及典型相關分析的綜合優點,在解決高光譜多波段之間的多重共線性及復雜計算問題時,具有獨特的優勢[14]。因此,采用支持向量機回歸和偏最小二回歸以及傳統建模方法進行鮮桃葉片葉綠素檢測模型的構建,對構建模型的結果進行分析比較。
使用特征值能量占比的方法確定主成分數,分別從單個生長期和全生長期角度隨機選取25和100個樣本作為校正集,便于建模,共選取15和60個樣本作為驗證集,對模型性能進行評估(其他試驗數據集的劃分標準相同)。
根據小波參數中對去噪效果的影響程度,選取小波基函數、分解層數、閾值方案和閾值調整方案。為篩選最佳小波參數組合,引入正交試驗。選擇結果較優的3個小波基函數,通過實驗尋找最優組合。選取1,3,5作為分解層數,正交試驗因素水平如表2所示。使用留一交叉驗證法對PLSR模型的最優主成分數進行確定,評估指標選擇校正集模型決定系數(C-R2)、校正集均方根誤差(C-RMSE)、驗證集模型決定系數(V-R2)、驗證集均方根誤差(V-RMSE)。根據表2中3個水平和4個因素構造一個L9(34)正交表進行實驗。模型構建過程詳見圖2。

圖2 模型構建流程

表2 正交試驗因素水平表
3.1.1 不同主成分數建模
通過實驗,得到各生長時期及全生長期的不同能量比下校正集及驗證集的模型性能指標實驗結果(見表3)。
由表3可知,利用樣本數據構建校正集時,各個時期隨著能量比和主成分數的增加,模型的決定系數R2隨之增大,均方根誤差RMSE隨之減小;但在相同能量比和主成分數構建相應時期的驗證集時,R2并未呈現遞增的趨勢,而是在超過一定能量比后,R2大幅度降低,出現“過擬合”現象,所以以此能量比作為最優能量比。結果顯示,在萌芽期和穩果期,能量比為96%,主成分數為3時,建模性能最優,校正集R2分別為0.843 6和0.838 3,驗證集R2分別為0.822 4和0.830 2;在壯果期,采果期,全生長期,能量比為99%,主成分數為5時,建模性能最優,矯正集R2分別為0.851 4,0.843 6和0.830 5,驗證集R2分別為0.838 3,0.825 1和0.813 7。因此,本試驗選擇能量比為96%作為萌芽期和穩果期建模的最優能量比以確定對應時期PCA主成分數目,選擇能量比為99%作為壯果期、采果期、全生長期建模的最優能量比以確定對應時期PCA主成分數目,進而預測鮮桃葉片的葉綠素含量。

表3 不同能量比下主成分數及模型性能評估
注:R2為模型決定系數;RMSE為均方根誤差,下同
3.1.2 不同光譜形式建模
不同的光譜形式含有其特有性質,可以從不同角度構建光譜與葉綠素之間的關系,采用原始光譜r,一階導數光譜r′,二階導數光譜r″,倒數光譜1/r,對數光譜log(r)經PCA預處理,并保持PCA不同時期最優能量比以構建模型,各時期SVR模型核函數參數γ和懲罰系數C通過格點搜索法和正交驗證取得最優值,得到不同光譜形式下的建模結果(見表4)。

表4 不同光譜形式下建模結果
注:r為原始光譜;r′為一階導數光譜;r″為二階導數光譜;1/r為倒數光譜;log(r)為對數光譜,下同
由表4分析得出,不同光譜變換,不同時期下,一階導數光譜r′建模精度最高;萌芽期、穩果期、壯果期、采果期、全生長期校正集R2分別為0.841 3,0.833 2,0.854 3,0.853 0,0.842 7,驗證集R2為0.829 3,0.834 8,0.843 2,0.841 8,0.829 2;原始光譜r構建的模型精度僅次于一階導數光譜r′,二階導數光譜r″構建的模型精度最低。
3.2.1 小波去噪正交實驗結果
采用極差分析法對小波去噪參數進行的正交實驗進行分析,結果如表5所示。

表5 小波去噪正交實驗結果
注:K1,K2,K3為某一水平的評價指標均值;R為極差
由表5可知,小波基函數位于K3、分解層數位于K3、閾值方案位于K1、閾值調整方案位于K2時校正集模型精度和驗證集模型精度均能達到較高值,即小波基函數為sym2、分解層數為5、閾值方案為Rigrsure、閾值調整方案為sln。因此本試驗最終選定A3B3C1D2水平組合對光譜進行小波去噪。
3.2.2 不同光譜形式的建模分析
使用最優A3B3C1D2水平組合的小波去噪處理不同變換形式的光譜,構建偏最小二乘回歸模型,并使用留一交叉驗證法確定模型的最優主成分數,得到建模分析結果(見表6)。

表6 不同光譜形式下建模結果
由表6可知,不同光譜變換,不同時期下,一階導數光譜建模精度最高;萌芽期、穩果期、壯果期、采果期、全生長期校正集R2分別為0.891 3,0.883 2,0.8943,0.893 0,0.872 7,驗證集R2為0.869 3,0.874 8,0.873 2,0.869 8,0.871 4;原始光譜r構建的模型精度僅次于一階導數光譜r′,二階導數光譜r″構建的模型精度最低。
將建模效果最好的小波去噪-偏最小二乘模型與3種傳統模型結果進行對比。選取全生長期光譜數據的一階導數光譜r′經小波去噪變換后導入4個模型中,得到各模型的驗證集結果(見圖3)。其中BP神經網絡模型在輸入數據之前進行了主成分降維處理,避免輸入節點數過大的問題。
由圖3可以看出,小波去噪-偏最小二乘建模擬合度最高,驗證集模型R2為0.871 4,RMSE為0.154 4,其次是主成分回歸模型,驗證集模型R2為0.825 9,RMSE為0.174 0,逐步回歸模型和BP神經網絡模型結果相對較差。各模型驗證集中均存在預測誤差較大的點,主要在于提取出來的數據不能完全反映原始數據,只是對原始數據的最優分析,一定程度上會增加部分數據的誤差,導致誤差較大的點的出現。
基于主成分分析-支持向量回歸和小波去噪-偏最小二乘回歸兩種方法,對鮮桃生長的4個時期的鮮桃葉片葉綠素含量進行建模。
1)采用PCA-VCR模型時,萌芽期和穩果期能量比為96%,壯果期、采果期、全生長期能量比為99%的模型預測性能較優。驗證集的R2分別為0.822 4、0.830 2、0.838 3、0.825 1和0.813 7。
2)在不同光譜變換形式下,一階導數光譜總體上優于其他光譜形式,作為輸入矢量應用于PCR-SVR和WD-PLSR模型,全生長期數據驗證集模型R2分別為0.829 2和0.871 4,RMSE分別為0.177 9和0.154 4估測精度最高,PCR-SVR模型略優于WD-PLSR模型。
3)三種傳統模型中,建模效果最優的是主成分分析模型,全生長期驗證集模型R2為0.825 9,RMSE為0.174 0。由此可見, PCA-VCR和WD-PLCR建模效果均優于傳統的建模方法的建模效果,可以較好的應用于鮮桃樹葉綠素含量監測研究中。

圖3 不同建模方法下葉綠素質量分數真實值和預測值的比較(n=60)