蔣 霞, 張 曉, 白鐵成, 陳 杰, 張楠楠
(塔里木大學信息工程學院/中國農業科學院農業信息研究所新疆南疆農業信息化研究中心,新疆阿拉爾 843300)
冬棗是新疆南疆地區的重要經濟作物,它以味道鮮美,糖分含量高,富含19種人體所需氨基酸和維生素、多種微量元素和較多的藥用成分,被公認為品質最好的鮮食棗品種之一[1],具有很高的食療和多種保健功效,被譽為“活維生素丸”[2]。由于大面積種植以及氣候等環境因素的影響,冬棗樹病蟲害越來越嚴重,嚴重影響了果農的利益,果農不得不使用農藥,但不合理的濫用容易造成冬棗表面農藥殘留超標。隨著人們生活水平的提高和健康環保意識的增強,消費者越來越關注果蔬的質量安全問題,其中果蔬表面的農藥殘留問題尤其備受關注[3]。由于冬棗在采摘前最后1次噴灑農藥的時間與上市期的間隔時間較短,導致上市鮮冬棗會出現不同量的農藥殘留現象,而且很多消費者食用前不清洗,或者即使清洗也清洗不徹底,因此,導致很多人受害于農藥殘留而并不自知。及時對市場上銷售的鮮冬棗進行農藥殘留限量檢測顯得極為重要。
近年來,國內外研究學者采用液相色譜法[4]、氣相色譜法[5]、氣相色譜-串聯質譜法[6-7]、酶抑制法[8]、超臨界流體萃取法(SFE)[9]、生物傳感器法[10]等技術對果蔬類農藥殘留進行了研究,并取得了相關進展。然而,這些檢測方法尤其是化學方法雖然檢測精度高,但普遍存在耗時長、費用昂貴、對樣品損壞嚴重、樣品和試劑浪費嚴重等現象,且對檢測產品均有一定的破壞性,無法實現經濟成本低廉的快速無損檢測[11]。因此,迫切需要一種實時、無損、在線農藥殘留快速篩查技術,以適應特色林果業的健康快速發展需求。
近紅外光譜技術可利用近紅外光譜區域的全譜或部分波段光譜對被測物進行快速定量或定性分析[12-13]。該技術已用于農產品品質檢測、種類鑒別、農藥殘留分析等研究[14-17]。但近紅外光譜通常包含數以千計的波長變量,利用全波段數據建模時,并非每個波長都能提供有用信息,大量冗余數據會增加建模工作量。開展波長變量優選,不僅可以剔除無關變量,還能提高模型的預測精度以及穩健性。同時,優選的特征波長可用于構建在線光譜快速測量系統,從而降低生產成本[18]。連續投影算法(SPA)利用向量的投影分析,尋找含有最少冗余信息的變量組合,使變量間的共線性小,該方法在光譜特征波長優選中應用廣泛[19-20]。偏最小二乘法(PLS)是一種常見的多元統計數據分析方法,被廣泛應用于近紅外、高光譜、拉曼、核磁和質譜等波譜定量模型的建立,幾乎成為光譜分析中建立定量校正模型的通用方法。
基于以上考慮,本研究以南疆鮮冬棗為對象,通過近紅外光譜技術得到冬棗樣品表面吸光度信息,以毒死蜱農藥為例,建立噴灑不同濃度農藥的鮮冬棗樣品的全波段偏最小二乘法(PLS)模型,同時應用SPA提取特征波長,作為PLS的輸入變量,建立了SPA-PLS模型,比較2種模型的預測精度,以期為鮮冬棗農藥殘留的快速檢測提供一種新的思路和方法,并對其他果蔬類農藥殘留光譜檢測提供借鑒意義。
選取新疆南疆某農場購買的鮮冬棗為研究對象,隨機選取180個成熟度良好、顏色均勻的冬棗樣本,所用的農藥為毒死蜱,購買于國家物質中心,劑型為乳油,質量百分含量為40%。把農藥配置成1 ∶10、1 ∶50、1 ∶100、1 ∶1 000不同濃度梯度的溶液和空白對照溶液(只含蒸餾水)。
首先對180個冬棗樣本進行清洗并自然風干,然后立即按照試驗要求,隨機分為5組,每組36個,將配好的4種濃度的農藥溶液及空白對照組分別噴灑1組冬棗,其中每種濃度隨機抽取30個冬棗作為建模集,剩余的6個冬棗作為預測集。利用噴霧器噴灑,保證噴灑均勻。
將噴灑過藥液的冬棗放在通風處12 h后,進行近紅外光譜圖像的采集。整個過程均在實驗室進行,實驗室環境條件為溫度20~25 ℃,相對濕度為30%~40%。
實驗設備為Antaris II傅立葉變換近紅外(FT-NIR)光譜儀(Thermo Scientific,USA),無需另外提供采樣背景,以儀器內部空氣為背景,測量波長范圍4 000~10 000 cm-1,分辨率為4 cm-1,共1 557個采樣點數,每張光譜掃描32次。測樣方式:開機預熱30 min后,用近紅外光譜儀對紅棗的可區別3個部位分別掃描32次,求其平均值作為原始光譜。應用OMNIC軟件和與之配套的標準白板采集歸一化后的光譜數據并轉換格式,利用MATLAB2010b(美國Mathworks)軟件進行數據分析和處理。本次采用的近紅外光譜采集設備系統見圖1。

連續投影算法(successive projections algorithm,SPA)[18]在光譜分析建模中可以提取光譜數據的特征波長,減少數據維度的同時能夠有效避免信息重疊,最大限度提取解釋信息,從而提高預測精度和速度,使模型能夠更有效地達到實際利用目的。
設X(n×p)為鮮冬棗表面不同濃度農藥殘留的吸光度矩陣,其中n為樣本容量,p為全譜波的個數。設xk為初始迭代量,M為提取波長變量數的范圍,SPA的具體算法為:
預測集的光譜矩陣X(n×m)給出需要選擇的波長數n,SPA算法如下:
(1)在開始迭代前(m=1)把校正集光譜矩陣的任意第k列(k=1…p,p為波長總數)賦值給xk;
(2)把沒有被選中的其他波長點位置集合記為S:
S={k,1≤k≤p,k?{var(0),…,var(m-1)}};
(3)計算xk對剩余列向量Xvar(m-1)的正交投影:

(4)記
var(m)=arg[max(‖Pxj‖],k∈S;
(5)記
xk=Pxk,k∈S;
(6)m=m+1,如果m (7)最后提取波長位置{var(m)=0,…,M-1}; 對應于每一對var(m)和M,循環1次后進行多元線性回歸分析(MLR),得到驗證集的標準偏差(RMSEP),最小RMSEP值對應的var(m)和M則為最優值。 偏最小二乘法(partial least square regression,PLS)是通過建立光譜數據與農藥濃度分類值之間的多元統計回歸模型進行分析。除了線性回歸分析,PLS在建模過程中集合了包括主成分分析、典型相關分析等方法的功能特點,因此在分析結果中,不僅可以建立更優化的回歸模型,而且在光譜分析中得到廣泛應用[19]。 將噴灑毒死蜱農藥濃度為1 ∶10的樣本賦值為1,噴灑毒死蜱農藥濃度為1 ∶50的樣本賦值為2,噴灑毒死蜱農藥濃度為1 ∶100的樣本賦值為3,噴灑毒死蜱農藥濃度為 1 ∶1 000 的樣本賦值為4,噴灑蒸餾水的樣本賦值為5。PLS數值間的間距為1。判別依據是以各數值為基準,上下0.5個單位之內的為該數值代表的農藥濃度,結果見表1。 表1 PLS模型判別標準 為有效評價模型精度,本研究選取相關系數(R)、建模集中交互驗證預測均方差(SECV)、驗證集中預測標準差(SEP)、準確率(precision)進行模型分析檢驗,其計算公式見表2。其中,R越接近1,回歸(或預測)結果越好;SECV越小,說明該模型的預測能力越高;SEP值越小,則表示模型對外部樣品的預測能力越高;同一批次樣本,SECV和SEP值越小,說明模型的精度越高,二者值越接近說明模型穩定性越好;Precision用來驗證模型的正確程度,用來反應模型的正確性。 為采集噴灑4種不同濃度毒死蜱農藥的樣品組與對照組的原始光譜,從圖2可以看出,噴灑不同濃度農藥樣本及對照組樣本的近紅外光譜在4 000~10 000 cm-1曲線趨勢基本相似,并沒有太明顯的差異,但6 800、5 200 cm-1附近有明顯的吸收峰存在,噴灑不同濃度農藥的樣品在此2波峰處的吸光強度不同。在所測范圍4 000~10 000 cm-1內,其吸光強度與毒死蜱農藥的濃度呈負相關關系,毒死蜱濃度越高,在該范圍內,其峰值越低,本結果與前人研究結論一致。 分別采用一階導數(savitzky golay first derivative,SGFD)、二階導數(savitzky golay second derivative,SGSD)、多元散射校正(multiplicative scatter correction,MSC)等3種方法對光譜進行預處理,光譜預處理結果見圖3。然后結合PLS對不同濃度農藥進行建模。采用3種光譜預處理方法和原光譜所建立的PLS模型對冬棗中農藥殘留量分類的建模精度和預測能力見表3。通過比較,采用原始光譜所建立的模型最優(圖4),故后面的連續投影算法以原始光譜為基礎進行。 表2 偏最小二乘法模型的檢驗指標 采用連續投影算法在全譜范圍內對原始光譜使用SPXY(Sample set partitioning based on joint x-y distance)進行校正集樣品劃分處理,最后使用SPA算法進行光譜變量壓縮。指定提取波長變量數M的范圍為2~20,采用均方根誤差(RMSE)確定選定的最終變量數目。從圖4可以看出,當最小均方根誤差的最小值為0.689 34時,從原始光譜中共選出5個特征波長,分別為3 999.64、4 578.18、5 179.861、5 283.999、7 162.325 cm-1,其重要性依次減弱。從所選變量的波長可以看出,冬棗表面毒死蜱農藥在4 000~5 300 cm-1波段存在相關性較高的光譜特征,可用于冬棗表面毒死蜱農藥殘留量的快速檢測,其中5 179.861、5 283.999 cm-1波段貢獻值較大,本結果與已有研究中5 200 cm-1附近是農藥濃度分類敏感波段結論相吻合。 表3 不同預處理方法PLS建模結果 對從原始光譜做SPA后選出的5個特征波長,仍采用相同的3種光譜預處理方法和原始光譜建立SPA-PLS模型,該模型對冬棗中農藥殘留量分類的建模精度和預測能力見表4。與PLS模型的建模精度和預測能力比較可知,原始光譜的SEP由0.653 683增加至0.691 782,RMSECV由 0.573 286 增加至0.782 928,R由0.886 780降低至 0.872 192,Precision由0.737 027提高至0.795 669;一階求導的SEP從 0.739 075 提高至0.771 944,RMSECV從 0.005 520 增加至0.365 338,R從0.852 575降低至 0.837 885,Precision從 0.694 676 增加至0.761 169;二階求導的SEP從 1.232 677 降低至0.708 189,RMSECV從 0.689 179 降低至0.033 439,R從0.490 157提高至 0.865 583,Precision從0.478 865提高至0.668 338;MSC的SEP由1.117 406降低至0.916 856,RMSECV由1.609 444降低至1.000 208,R由0.612 946提高至0.761 372,Precision由0.485 502提高至0.558 819。 試驗結果表明,SPA-PLS只用了5個特征波長來建模,所用變量數僅占全波段的0.32%,建立的冬棗表面農藥殘留模型的準確度和精度優于在全譜區所建立的PLS模型。因為近紅外光譜的譜峰重疊嚴重,冗余信息多,同時在全譜區還包含大量與毒死蜱成分無關的信息,將全光譜的所有信息參與建模,在一定程度上降低了模型的性能[20]。而經SPA變量從全光譜中優選出有效特征變量建立的模型,最大程度地保留了有用光譜信息,剔除了大量無用和冗余信息,提高了模型精度和穩定性。 表4 SPA-PLS建模結果 采用連續投影算法(SPA)分別對測定的180組光譜數據進行變量選擇,從原始光譜中篩選了3 999.64、4 578.18、5 179.861、5 283.999、7 162.325 cm-1共5個波長,降低了PLS模型的計算量,且連續投影算法高度概括了絕大多數樣品光譜的信息,避免了信息重疊,同時去除了冗余信息,簡化了模型,提高了模型精度和穩定性。同時,將得到的特征波長用于開發便攜式農藥殘留檢測儀,可以大大降低對硬件的要求,為研制水果表面農藥殘留便攜式光譜儀提供依據和理論基礎。 研究結果表明,可見近紅外光譜技術聯合PLS和SPA是一種有效區分冬棗表面不同濃度農藥殘留量的方法。在今后的研究中,將引入多種農藥種類,增加農藥梯度設置,進一步驗證該方法的有效性。但所建模型的精度和準確度相對較低,提高模型精度和準確度的方法還需進一步開展研究。 [1]王亞萍,王貴禧,李艷菊. 冬棗貯藏保鮮技術研究進展[J]. 中國農學通報,2006,22(3):82-87. [2]曲澤洲,王永蕙. 中國果樹志·棗卷[M]. 北京:中國林業出版社,1993:229-230. [3]薛 龍,黎 靜,劉木華. 基于高光譜圖像技術的水果表面農藥殘留檢測試驗研究[J]. 光學學報,2008,28(12):2277-2280. [4]Yu C S,Fan S F,Li Y J,et al. Representative commodity for five brassica vegetables based on the determination and dissipation of six pesticide residues[J]. International Journal of Environmental Analytical Chemistry,2015,95(5):419-433. [5]吳海燕,陳建軍. 蔬菜中多種有機磷農藥殘留氣相色譜分析法[J]. 食品與機械,2010,26(4):76-77,83. [6]Lozano A,Rajski L,Belmonte-Valles N,et al. Pesticide analysis in teas and chamomile by liquid chromatography and gas chromatography tandem mass spectrometry using a modified QuEChERS method:validation and pilot survey in real samples[J]. Journal of Chromatography A,2012,1268:109-122. [7]蘇建峰,鐘茂生,陳 晶,等. 氣相色譜-質譜法與氣相色譜法測定茶葉及茶葉加工品中295種農藥多殘留[J]. 分析測試學報,2015,34(6):625-638. [8]劉永杰,張金振,曹明章,等. 酶抑制法快速檢測農產品農藥殘留的研究與應用[J]. 現代農藥,2004,3(2):25-27,42. [9]Rissato S R,Galhiane M S,Knoll F R,et al. Supercritical fluid extraction for pesticide multiresidue analysis in honey:determination by gas chromatography with electron-capture and mass spectrometry detection[J]. Journal of Chromatography A,2004,1048(2):153-159. [10]Cesarino I,Moraes F C,Lanza M R,et al. Electrochemical detection of carbamate pesticides in fruit and vegetables with a biosensor based on acetylcholinesterase immobilised on a composite of polyaniline-carbon nanotubes[J]. Food Chemistry,2012,135(3):873-879. [11]岳賢田,高桂枝. 蔬菜中農藥殘留檢測方法研究進展[J]. 現代農業科技,2008(12):111-113,115. [12]Wu X H,Sun J,Wu B,et al. Qualitative nnalysis model of near infrared spectra of pork based on synergy interval partial least squares discriminant analysis[J]. Laser & Optoelectronics Progress,2015,52(4):242-247. [13]Gong Z Y,Li Y F,Liu Y D,et al. Study on influence of irradiation angle on detection of sugar content of apple by near infrared spectroscopy[J]. Laser & Optoelectronics Progress,2016,53(2):235-240. [14]鐘艷萍,鐘振聲,陳蘭珍,等. 近紅外光譜技術定性鑒別蜂蜜品種及真偽的研究[J]. 現代食品科技,2010,26(11):1280-1282,1233. [15]Gao J F,Li X L,Zhu F L,et al. Application of hyperspectral imaging technology to discriminate different geographical origins ofJatrophacurcasL. seeds[J]. Computers and Electronics in Agriculture,2013,99(6):186-193. [16]溫珍才,孫 通,耿 響,等. 可見/近紅外聯合UVE-PLS-LDA鑒別壓榨和浸出山茶油[J]. 光譜學與光譜分析,2013,33(9):2354-2358. [17]湯丹明,孫 斌,劉輝軍. 近紅外漫反射光譜鑒別雞蛋種類[J]. 光譜實驗室,2012,29(5):2699-2702. [18]周 竹,尹建新,周素茵,等. 基于近紅外光譜與連續投影算法的針葉材表面節子缺陷識別[J]. 激光與光電子學進展,2017,54(2):305-313. [19]劉 飛,馮 雷,柴榮耀,等. 基于直接正交信號校正的水稻冠層葉瘟光譜診斷[J]. 光學學報,2010,30(2):585-589. [20]羅 霞,洪添勝,羅 闊,等. 高光譜技術在無損檢測火龍果可溶性固形物中的應用[J]. 激光與光電子學進展,2015,52(8):309-317.1.4 建模方法和模型驗證指標

2 結果與分析
2.1 原始光譜曲線與特征分析
2.2 預處理結果



2.3 SPA選擇特定波長


2.4 基于SPA特征波長的PLS模型


3 結論