王曉珂, 趙春江, 董大明
(1.首都師范大學,北京 100097; 2.北京市農林科學院北京農業智能裝備技術研究中心,北京 100097)
肥料是農業生產的基礎物質之一,它可以為植物提供必需的營養元素,并且能夠改善土壤的性質、提高土壤的肥力水平[1]。在肥料生產時,通過檢測氮、磷、鉀等微量元素的含量可以較好地控制肥料質量[2],從而確保農作物的產量并避免環境污染[3]。目前國內公認的肥料檢測方法大都是先采樣后分析,通過化學檢測的方式測量肥料中各種元素的含量[4]。這樣做不僅費時費力,不能對肥料成分進行實時評價,并且檢測用的試劑可能會對環境造成二次污染[5]。近年來,一些學者嘗試應用光學方法對肥料進行檢測,這些方法有望實現快速測量[6]。但在肥料生產中,肥料處于高速移動狀態,生產線移動過程帶來測量的很多難題,目前的研究成果尚不能支持這種高通量檢測。
近紅外光譜是一種快速且無損的光譜學方法,被廣泛應用于多種農產品和食品測量[7-9],如Wang等應用近紅外光譜測量水果中各種營養元素的含量[10-11]。也有一些學者利用近紅外光譜測量土壤養分,如Knadel等應用近紅外光譜測量土壤中有機碳、有機氮、全碳、全氮等的含量[8,12-13];Li等應用近紅外光譜對土壤進行分類[14-15]。因此,利用近紅外光譜對未出廠的肥料進行快速無損的檢測有著一定的可行性。
利用近紅外光譜對生產線上的肥料養分進行測量是一個新挑戰,由于移動中的光譜獲取受到多種因素影響,不同種類肥料的模型傳遞性較差,更為重要的是,全波段光譜的運算量過大,難以實現實時性。因此本研究的主要目標為:(1)研究針對移動中肥料近紅外光譜的預處理方法,從而能夠最大限度地降低由于樣本移動而產生的噪聲;(2)建立先分類、再定量的算法模型,從而能夠應用于不同種類和不同廠家的肥料。
試驗中使用的肥料樣品均來自中國常用的肥料廠商,分別為芭田、新洋豐、嘉施利、史丹利(表1)。所有肥料樣本均取自生產線,并由北京市土肥站根據國標方法進行氮、磷、鉀的測試分析,給出實測值。在研究中,樣本隨機分為校正集和預測集。

表1 不同廠家肥料樣本養分含量分布
本試驗利用美國Thermo Antaris傅立葉變換近紅外光譜儀(4 000~10 000 cm)采集肥料樣品的近紅外光譜,儀器的最高分辨率為8 cm。光譜儀內置了積分球。此外,光譜儀的出光口經光纖擴充改造,可以在積分球和對外光路之間自動切換。為了模擬生產線上肥料的快速移動狀態,筆者設計了1個自動勻速旋轉的樣本臺,角速度為12°/s。在光譜儀的入光口附近增加了1個鹵素燈,在樣品光譜采集時,控制鹵素燈輻照樣品,實現漫反射測量。在樣本臺上方設置2個反射鏡,分別反射光源和樣本的光線。
樣本光譜測量前首先關閉近紅外光源,直接測量光譜并作為參黑光譜。再控制光路切換到積分球,測量獲得參白光譜。測量過程中,旋轉臺的轉速為12°/s,每個樣本測量時間為30 s。為了快速完成測量,儀器的分辨率設置為8 cm。1 h更換1次存黑存白的背景光譜。研究中所采用的光譜預處理算法和建模算法在Unscrambler 9.7平臺下完成。
本次試驗于2016年9—10月在北京市農林科學院展開,共采集了412組近紅外光譜,肥料的近紅外吸收特征光譜分布在4 000~10 000 cm-1(1 000~2 500 nm)(圖1)。

從圖1可以看出,由于不同廠家的肥料樣品中所含的化學成分可能不同,導致不同廠家肥料的光譜特征有著較為明顯的差異。同時也可看出,同一廠家肥料的光譜特性較為集中,很難通過肉眼觀察到光譜特征隨成分的變化規律。由于近紅外光譜特征復雜,沒有明顯的吸收峰,很難用單一或少數變量實現氮、磷、鉀元素含量的回歸分析。所以,采用PLS方法對數據降維回歸[16],將所有光譜數據基于全波段直接進行PLS建模的結果如表2所示。

表2 基于所有廠家的全波段光譜數據直接建模的校正集相關參數值
注:r2表示確定系數;RMSE表示均方根預測誤差。
由表2可知,所有光譜數據直接建模的模型中r2較低,且RMSE較高,這說明了不同廠家光譜差異較明顯,模型不具有通用特性。因此,基于全波段建模時采用1個PLS模型針對1個特定廠家的方式,表3為不同廠家直接建立PLS模型的參數值。

表3 不同廠家基于全波段分別建模的校正集相關參數值
從表3可以看出,針對不同廠家單獨建模的方式對于模型的性能有一定提高,但部分廠家和部分元素仍然不能滿足定量化分析的要求,比如芭田肥料鉀元素的校正集確定系數僅有0.65。通過比較分析固定狀態和移動狀態下的模型預測能力發現,這可能是由于移動過程中帶來的噪聲的影響。由于移動過程中會產生光的散射等干擾問題,這會在很大程度上影響光譜質量。
為了達到更好的模型性能指標,采用Norris求導作為預處理方法來對原始光譜進行去噪處理,從而試圖降低移動中的影響[16-18]。圖2為芭田肥料的原始光譜及其經過預處理方法后的光譜特征,從圖2中可以清楚地看到,經過Norris求導預處理后的光譜數據較好地去除了各類噪聲的影響。

表4中的數據顯示,Norris求導預處理方法可提高P和K的預測能力,較好地消除了移動等噪聲的影響。

表4 芭田肥料樣品原始光譜與Norris求導光譜分別PLS建模的性能指標
合適的預處理方法提高了光譜質量,從而降低了移動過程對定量化分析的影響。但如表2所示,不同廠家的肥料由于成分差異較大,很難用統一的模型實現定量。因此,通過先定性分類-再定量計量的模式實現模型的高效傳遞。
從圖3可以看出,通過對全部廠家的肥料原始光譜數據進行主成分分析(PCA),可以很好地將數據進行分類[16,19],圖的分類結果證明先分類、再采用不同的模型計算肥料成分的想法是可行的。整體算法的設計思路如圖4所示,即先用PCA分類器對不同廠家肥料進行分類,再針對不同廠家,采用預先建立的對應的PLS模型進行定量化計算。研究結果表明,這一算法適用于研究中采用的全部4種肥料,對肥料中微量元素的預測能力如表5所示。
本研究通過一系列試驗,證明了對移動中的肥料近紅外光譜數據進行PLS建模并實時預測氮、磷、鉀元素的含量是可行的。適當的預處理方式能夠降低由于樣本移動而產生的噪聲,進而提高系統的確定系數的同時降低系統的均方根誤差,本系統預測的準確率在88%以上;通過實現先PCA分類,再進行定量的算法模型,為開發能夠應用于不同肥料廠家的設備提供了理論支撐。



表5 PCA分類器分類后建模的結果