張 萌 賈世杰
(1.吉林鐵道職業技術學院電氣工程分院,吉林 吉林 132200;2.大連交通大學電子信息工程學院,遼寧 大連 116028)
農藥為世界農業的發展和糧食可持續供應提供了極大幫助[1]。中國作為一個農業大國,每年農藥使用量超過50萬t,居世界第一,是世界平均水平的2.5倍。進入21世紀以來,食品安全逐漸成為社會關注的焦點[2]。由于農藥的廣泛使用會直接或間接進入人體,危害人體健康,因此農藥殘留檢測已成為重中之重。
目前,常見的食品農藥殘留檢測方法主要為氣相色譜法、液相色譜法、氣質聯用法、液質聯用法等,而基于高光譜成像技術的水果表面農藥殘留無損檢測技術研究較少。楊昌標等[3]采用液相色譜—串聯質譜分析法快速檢測出西紅柿中的18種殘留農藥,該方法具有良好的線性關系,且在批量樣品的檢測中既快速又穩定。薄璐等[4]在視覺成像技術的基礎上,提出了一種番茄表面農殘無損檢測方法,該方法具有良好的無損檢測性能,提高了番茄表面農殘的檢測能力。姚云恒等[5]提出了一種使用氣相色譜—質譜分析技術快速測定蘋果梨中19種殘留農藥的方法,該檢測方法簡便、準確,適用于蘋果梨中19種殘留農藥的篩選和測定。張晶等[6]建立了一種氣相色譜—質譜分析方法,用于檢測蔬菜中的8種氨基甲酸酯農殘,該檢測方法靈敏度高、操作簡便、定性和定量分析準確可靠,在植物氨基甲酸酯的檢測中準確率較高且穩定。徐潔等[7]提出了一種哈密瓜表面農殘判別分析方法,并驗證了該檢測方法的準確性。李增芳等[8]提出了一種用高光譜成像技術對贛南臍橙樣品農藥殘留進行無損檢測,并驗證了該檢測方法的準確性。趙曼彤等[9]提出了一種利用高光譜成像技術對香梨表面低農殘進行檢測,通過多元線性回歸法建立農殘檢測模型,并驗證了該檢測方法的準確性。以上檢測技術不僅操作復雜、耗時長等,甚至還會破壞樣品,因此需要尋找更加快速、精確、高效的農殘無損檢測技術。
試驗擬基于高光譜成像技術,提出細菌群體趨藥性(BCC)算法和最小二乘支持向量機(LS-SVM)算法相結合建立水果表面農殘檢測模型,通過對采集數據進行預處理和特征提取,建立農藥殘留濃度檢測模型,并與改進前進行試驗對比,驗證該方法的優越性和準確性,旨在為水果表面農殘的無損檢測提供依據。
高光譜成像技術是計算機技術和光學技術的結合。由于其豐富的圖像信息和光譜數據,近年來已被應用于醫學和農業領域。原始圖像所包含的光譜信息不僅僅是特定像素,還有特定波長的圖像信息。高光譜成像平臺主要由高光譜相機(CCD相機、光譜儀、鏡頭)、光源(紫外線燈、鹵素燈)、電動平臺和控制計算機等組成(見圖1),采用推掃成像原理,高光譜相機使用分束器將寬波混合反射光散射為各種頻率的單波長光。
使用標準正態變換(SNV)結合去趨勢算法完成數據預處理,用SNV校正由粒子散射導致的誤差[10],其原理是每個光譜中不同波長的吸收是不同的,因此有必要校正每個原始光譜,并按式(1)進行計算。
(1)
式中:

XiSNV——第i條光譜經SNV處理后的數據。
去趨勢主要解決SNV校正光譜數據中基線漂移問題[11],即使用多項式擬合光譜的吸收率和波長以獲得趨勢線,用SNV校正光譜數據減去趨勢線。

1.CCD 相機 2.光譜儀 3.鏡頭 4.紫外燈 5.鹵素燈 6.試驗樣本 7.電動平移臺 8.光源控制箱 9.電動平移臺控制箱 10.計算機圖1 高光譜成像采集系統Figure 1 Hyperspectral imaging acquisition system
高光譜圖像含有大量光譜數據,由數百個波段構成,并且每個波段都高度相關[12]。對整個頻帶進行分析和建模不僅會影響試驗的準確性,而且計算量大大增加,降低了建模的速度[13]。故采用主成分分析(PCA)和連續投影算法(SPA)提取光譜數據的特征波長進行比較分析。
2.2.1 PCA特征提取 PCA具有降維和降噪的效果。降維后得到一組新的自變量,這些自變量將原始變量的所有信息最大化。處理后的圖像如式(2)所示[14]。
(2)
式中:
Pcm——第m個主成分圖像;
Ii——第i波段對應的圖像;
αi——第i波段圖像權重系數;
n——圖像的數量。
第一個主成分包含最原始的信息,貢獻最大。通常前10個主成分圖像的累積貢獻為原始圖像的99%。因此,只要選擇適當的主成分圖像,就可以獲得高光譜數據的特征波長。
2.2.2 SPA特征提取 SPA可以從光譜信息中充分找到冗余信息最低的變量組,減少信息重疊。同時,減少建模中使用的變量數量,從而提高建模的速度和效率[15]。SPA算法的主要原理是:設置Xn×m為光譜矩陣,其中n為樣本數,m為光譜波長數,N為需選擇的變量數。
(1) 首先選取j列光譜矩陣xj,初始迭代向量為xk(0)。
(2) 將剩余的光譜數據放入集合S中,S={j,1≤j≤J,j?[k(0),…,k(n-1)]}。
(3) 計算xj在剩余列向量上的投影,如式(3)所示[16]。
(3)
(4) 記k(n)=arg[max(‖pxj‖)],j∈s,同時令xj=pxj,j∈s。
(5) 令n=n+1 ,若n 對于每個k(0)和N,在一個周期后進行多元線性分析,獲得的最小預測標準偏差為k(0)和N對應的最優值。 2.3.1 LS-SVM算法 LS-SVM解決了SVM算法在處理大量數據時訓練速度較慢的問題,大大節省了收斂時間[17]。LS-SVM是處理小樣本集的最合適算法之一,該算法可以從有限數量的樣本中提取信息并預測未知數據[18]。 LS-SVM使用非線性映射函數φ(x)來建立方程,并使用拉格朗日算子求解最優化問題。根據Mercer條件,映射函數φ(x)和核函數K(xi,xj)的對數函數如式(4)所示[19]。 φ(xk)Tφ(x1)=K(xk,x1), (4) 式中: xk——第k個輸入樣本。 文中采用RBF核函數: (5) LS-SVM算法的函數方程如式(6)所示[20]。 (6) 式中: αk——Lagrange乘子; b——偏差參數。 2.3.2 BCC-LS-SVM算法 LS-SVM算法通常使用RBF內核函數。采用兩步網格搜索和留一法確定RBF內核參數,對RBF函數的正則化參數γ和核參數σ2進行優化[21]。γ和σ2反映了算法的學習能力和泛化能力。 BCC算法是一種群體智能算法。細菌不僅依靠自身行為產生的信息,而且優化周圍細菌運動產生的信息。BCC算法具有全局搜索功能、收斂速度快、精度高等優點。該方法提高了支持向量機參數選擇的效率,避免了人工參數設置的不足,大大縮短了優化時間。 文中提出了基于BCC改進的LS-SVM算法,通過BCC找到最優的γ和σ2。BCC-LS-SVM算法的基本步驟: (1) 初始化。初始細菌種群、位置、優化參數的限制、初始迭代次數和最大迭代次數等。 (2) 計算參數T0、b1、tc,如式(7)所示[22]。 (7) 式中: T0——與計算精度ε有關的時間參數; tc——與細菌在運動方向上的旋轉角度有關的細菌移動時間; b1——與維度無關的參數。 (3) 根據細菌的位置對LS-SVM模型進行訓練,對初始目標函數值進行評估,記錄最大目標函數及其對應的正則化參數γ和核參數σ2[23]。 (4) 通過BCC算法找到最佳的γ和σ2,為每種細菌計算新位置,并對細菌種群進行更新。 (5) 確定最佳細菌并求得最佳函數值。 (6) 如果前后函數值的差的絕對值小于給定精度或達到最大迭代次數,則執行下一步,否則跳到步驟2.3.2(3)。 (7) 使用最佳細菌位置(γ和σ2)作為LS-SVM模型中的參數。 BCC-LS-SVM算法流程圖如圖2所示。 圖2 BCC-LS-SVM算法流程Figure 2 BCC-LS-SVM algorithm flow CCD相機:ORCA-R2型,日本濱松公司; 光譜儀:V10E-QE型,芬蘭SPECIM公司; 超亮紫外線燈:ML3500型,美國SP公司; 光纖鹵素燈:DCR III型,150 W,德國肖特公司。 以噠螨靈農藥為試驗對象,對80份水果樣品進行洗滌,置于通風處干燥[24]。隨機分為4組,每組20份。從每組中隨機選擇8個樣本作為訓練數據,共選擇32個樣本,其余48個樣本作為測試集。提取全光譜數據的特征波長后,PCA提取的特征波長分別為500,580,680,850,930,980 nm;SPA提取的特征波長分別為461,549,600,680,740,830,900,960 nm。建立LS-SVM和BCC-LS-SVM檢測模型,輸出數據在樣本類別中。水果表面上噠螨靈殘留濃度(V噠螨靈∶V水)可分為4類[25]:1∶400,1∶800,1∶1 500以及無噠螨靈殘留。 3.2.1 LS-SVM模型試驗分析 使用PCA、SPA提取的特征波長作為輸入數據,建立LS-SVM模型判別水果表面農藥殘留濃度。基于PCA特征波長的LS-SVM判別水果表面農藥殘留濃度如圖3所示。由圖3可知,基于PCA特征波長的LS-SVM模型成功預測了43個樣本,準確率為89.58%。 圖4為基于SPA特征波長的LS-SVM判別水果表面上的殘留農藥濃度,其成功預測了44個樣本,每種類型吡噠螨均存在誤判,準確率為91.67%。 比較圖3、4可知,基于PCA和SPA的LS-SVM模型檢測水果表面農藥殘留濃度準確度分別為89.58%,91.67%,采用SPA的模型優于PCA的。這是因為采用SPA算法挑選出的有效波長能充分代表原始光譜的有效信息,預測效果較好。因此,將LS-SVM模型應用于水果表面殘留農藥檢測的連續投影更為有效。 3.2.2 BCC-LS-SVM模型試驗分析 使用PCA和SPA提取的特征波長作為輸入數據,建立BCC-LS-SVM模型,用于水果表面農藥殘留濃度的判別,基于PCA特征波長結合改進的最小二乘支持向量機模型(BCC-LS-SVM)檢測水果表面農藥殘留如圖5所示。由圖5可知,基于PCA的特征波長的BCC-LS-SVM成功預測了45個樣本,準確率為93.75%。 圖6為基于SPA的特征波長信息的BCC-LS-SVM模型檢測水果表面上的殘留農藥濃度。由圖6可知,該模型成功預測了47個樣本,準確率為97.92%。 比較圖5、6可知,基于PCA和SPA這兩種特征波長提取方法建立的改進的最小二乘支持向量機模型(BCC-LS-SVM)可以檢測水果表面上殘留的農藥濃度,準確率分別為93.75%,97.92%,SPA選擇特征波長的模型精度高于PCA的。因此,BCC-LS-SVM模型可用于檢測水果表面殘留的農藥濃度,其中連續投影更為有效。 圖3 基于PCA的LS-SVM模型判別圖Figure 3 PCA based LS-SVM model discriminant graph 圖4 基于SPA的LS-SVM模型判別圖Figure 4 SPA based LS-SVM model discriminant graph 圖5 基于PCA的BCC-LS-SVM模型判別圖Figure 5 PCA based BCC-LS-SVM model discriminant graph 圖6 基于SPA的BCC-LS-SVM模型判別圖Figure 6 SPA based BCC-LS-SVM model discriminant graph 3.2.3 不同模型對比分析 特征波長提取方法分別選擇PCA和SPA,并分別使用LS-SVM和BCC-LS-SVM進行建模,預測模型的結果見表1。由表1可知,基于連續投影法(SPA)的特征波長的檢測模型整體精度高于基于主成分分析(PCA)的特征波長的檢測模型,說明連續投影法的特征提取效果極好。在SPA特征波長下,BCC-LS-SVM模型的準確度為97.92%,優于LS-SVM模型,是因為BCC算法找到最優的正則化參數和核參數,使BCC-LS-SVM模型更加精準。 試驗表明,在高光譜成像中,連續投影結合BCC-LS-SVM模型可以有效地檢測水果表面上殘留的噠螨靈濃度,且優于LS-SVM模型,通過BCC算法找到最優的LS-SVM模型參數,將檢測準確率從93.75%提高至97.92%。該檢測方法仍處于起步階段,后續將不斷改進檢測模型的性能,完善基于高光譜成像技術的水果表面殘留農藥的無損檢測方法。 表1 不同建模結果對比Table 1 Comparison of different modeling results2.3 數學模型

3 結果與分析
3.1 試驗設備
3.2 試驗分析




4 結論
