摘要:以湖北地區(qū)番茄樣品為研究對象,對獲取的光譜特征信息進行分析。確定了矢量歸一化法為最優(yōu)光譜預(yù)處理方法:對各個信息的主成分因子進行了優(yōu)化,通過主成分分析提取主成分得分向量構(gòu)成模式識別的輸入,利用BP神經(jīng)網(wǎng)絡(luò)方法建立番茄有機磷農(nóng)藥殘留的無損檢測模型。結(jié)果表明,當(dāng)光譜信息主成分因子數(shù)為3時,建立的模型最優(yōu),預(yù)測的識別率達到0.96,訓(xùn)練誤差為0.015,相關(guān)系數(shù)達到0.971。
關(guān)鍵詞:番茄;近紅外光譜;農(nóng)藥殘留;神經(jīng)網(wǎng)絡(luò)
中圖分類號:0657.33;TS207.5+3 文獻標識碼:A 文章編號:0439-8114(2010)04-0961-03
番茄是茄科中最重要的經(jīng)濟作物,以多汁漿果為產(chǎn)品。它甜酸可口,味道鮮美,是人們較喜愛的果蔬之一。番茄等鮮食農(nóng)產(chǎn)品,在生長過程中易發(fā)生病蟲害,使農(nóng)藥施用量加大。所使用的農(nóng)藥并不能全部被植物吸收,大部分仍殘留在果實表面,加之采摘后立即食用,其殘留的農(nóng)藥對人們身體健康的影響和危害更直接和嚴重。因此,研究農(nóng)藥殘留的快速檢測技術(shù),在水果蔬菜上市之前對農(nóng)藥殘留進行大量的快速抽檢,確保人市產(chǎn)品安全無害具有重要意義。
目前,對果蔬等農(nóng)產(chǎn)品農(nóng)藥殘留的檢測主要采用化學(xué)方法,一般是破壞性檢測,它具有耗用有機試劑、制樣繁瑣且檢測成本高等不利特點。而近紅外光譜技術(shù)是近年來快速發(fā)展的一種新型光譜分析技術(shù),具有快速、準確、無污染及非破壞性等優(yōu)點。
周小芳等用激光波長為1 064 nm的近紅外傅立葉變換拉曼光譜儀對常見水果和常用農(nóng)藥進行拉曼測試并獲得了農(nóng)藥的特征拉曼譜,周向陽等首次采用傅立葉變換近紅外光譜法(FT-NIR)對十字花科、旋藥科、菊科、傘形花科、莧科等二十余種葉菜類中有機磷農(nóng)藥殘留的鑒別進行了研究。但在基于近紅外光譜的農(nóng)藥殘留快速無損檢測方面還存在很大研究空間。
該文通過對番茄整果樣品的光譜分析,確定最優(yōu)的光譜預(yù)處理方法,采用BP神經(jīng)網(wǎng)絡(luò)建立番茄整果有機磷農(nóng)藥殘留的無損定性分析模型,并對該模型進行驗證,為果蔬的無損檢測提供依據(jù)。
1 材料及光譜圖像的獲取
1.1材料與試劑
番茄樣品:以湖北省的主要品種且無農(nóng)藥污染的番茄為研究對象,收集105個番茄樣品,80個作為建模集樣品,25個作為預(yù)測集樣品。


農(nóng)藥試劑:果蔬常用有機磷農(nóng)藥樂果,市購,用水稀釋成濃度為1%的樂果溶液,樂果含量為0.4%。
1.2樣品的制備
對番茄整果樣品進行徹底清洗、晾干、編號和登記等操作,然后均勻完全的噴施樂果農(nóng)藥,放置陰涼處3 d晾干,建立有農(nóng)藥番茄的樣品集。
1.3光譜采集 采用OceanOptics NIR256光譜儀,先后對未噴施和噴施農(nóng)藥的番茄樣品進行光譜采集,得到番茄樣品的原始光譜圖(圖1)。圖1表明,原始光譜集中在波長900-2 500 nm,光譜噪音較大,重疊嚴重并且無農(nóng)藥污染和噴施農(nóng)藥的番茄的光譜圖沒有區(qū)分開來,需通過光譜預(yù)處理來消噪。提高模型的分析精確度。
2 光譜分析
2.1 農(nóng)藥樂果殘留的NIR分析
含磷基團在NIR光區(qū)的表征是樂果得以快速檢測的基礎(chǔ)。近紅外光譜屬于振動光譜,是基頻分子振動的倍頻與組合頻,主要反映含P-H基團的特征信息。為此,本文采用NIR光譜法,探討鑒別有機磷農(nóng)藥殘留的可能性。
2.2光譜預(yù)處理
分別采用常用的光譜預(yù)處理方法:一階導(dǎo)、二階導(dǎo)、矢量歸一化和最大最小歸一化進行消噪,并選擇最佳的光譜預(yù)處理方法。通過不同預(yù)處理方法,建立BP網(wǎng)絡(luò)判別模型,以模型的相關(guān)系數(shù)、訓(xùn)練誤差、識別準確率為指標。選擇最佳的預(yù)處理方法。
由表1可知,矢量歸一化預(yù)處理模型為最優(yōu),訓(xùn)練誤差、相關(guān)系數(shù)、識別準確率分別達到0.028、0.947、0.942。
2.3特征向量的提取
在模型建立過程中,應(yīng)選取合適的主成分因子數(shù)。主成分因子數(shù)過大,會造成模型的魯棒性,同時引入過多的冗余信息,使數(shù)據(jù)處理的時間加長。主成分因子數(shù)過少,信息損失過大,將會造成模型的識別率降低。
對不同預(yù)處理方法,通過主成分分析,提取不同數(shù)目的主成分因子作為特征變量,建立BP人工神經(jīng)網(wǎng)絡(luò)判別模型。以預(yù)測集中的識別率來衡量模型的優(yōu)劣。主成分因子數(shù)對模型識別率的影響如圖2所示,在不同預(yù)處理方法中選擇最高點的因子數(shù)作為最佳主成分因子數(shù)。
由圖2可得出不同預(yù)處理方法的最佳主成分因子數(shù)。通過PCA分析得到各預(yù)處理方法在最佳主成分因子數(shù)下的累積貢獻率,如表2所示。
3 模型的建立
該研究采用基于BP人工神經(jīng)網(wǎng)絡(luò)的方法建立番茄有機磷農(nóng)藥殘留的定性判別模型,BP神經(jīng)網(wǎng)絡(luò)是一個向前多層網(wǎng)絡(luò),利用誤差反向傳播算法對網(wǎng)絡(luò)進行訓(xùn)練。其主要考慮網(wǎng)絡(luò)輸入層、輸出層、傳遞函數(shù)和隱含層等網(wǎng)絡(luò)特征參數(shù)。
1)網(wǎng)絡(luò)輸入層、輸出層的設(shè)計。由于采用單一參數(shù)評價農(nóng)藥殘留,因此輸入神經(jīng)元n=1,輸出神經(jīng)元m=1。
2)隱含層的設(shè)計。隱含層個數(shù)q=√n+m+C,式中:a——隱含層個數(shù);n——輸入層神經(jīng)元數(shù)目;m——輸出層神經(jīng)元數(shù)目;C——1-10之間數(shù)。實際使用則根據(jù)上述公式確定隱含層神經(jīng)元3-11,找出預(yù)測誤差和訓(xùn)練誤差最小的隱含層神經(jīng)元作為最優(yōu)個數(shù)。
3)傳遞函數(shù)的確定。根據(jù)輸入和輸出的特點,隱含層的傳遞函數(shù)用雙正切S型傳遞函數(shù)tansig,輸出層采用logsig函數(shù)。
4)網(wǎng)絡(luò)的訓(xùn)練樣本及測試樣本。將先后獲取的無農(nóng)藥污染和噴施農(nóng)藥的光譜數(shù)據(jù)各80個作為訓(xùn)練樣本集,余下的無農(nóng)藥污染和噴施農(nóng)藥各25個作為測試樣本集。
5)網(wǎng)絡(luò)模型的建立。在MATLAB中,通過矢量歸一化預(yù)處理對不同隱含層神經(jīng)元個數(shù)的網(wǎng)絡(luò)模型進行訓(xùn)練和測試。訓(xùn)練及測試結(jié)果如表3所示。由表3可知隱含層為3、7、9、11的模型識別率較高,相關(guān)系數(shù)分別為0.971、0.966、0.961、0.947,訓(xùn)練誤差分別為0.015、0.017、0.021、0.028,所以當(dāng)經(jīng)過矢量歸一化處理,神經(jīng)元隱含層數(shù)為3時模型為最優(yōu)。
4 小結(jié)
采用近紅外光譜技術(shù),進行光譜數(shù)據(jù)的提取和分析,選擇了最優(yōu)預(yù)處理方法、最佳主成分因子數(shù)和最優(yōu)參數(shù),當(dāng)神經(jīng)元隱含層數(shù)為3,通過矢量歸一化預(yù)處理。累積貢獻率可達到0.966,建立的判別番茄中樂果殘留的BP人工神經(jīng)網(wǎng)絡(luò)模型為最優(yōu)。樣品的預(yù)測值和實際值之間的相關(guān)性達到0.971,訓(xùn)練誤差為0.015和模型識別準確率達到0.96。表明近紅外光譜技術(shù)可以無損檢測有機磷農(nóng)藥的殘留,為今后應(yīng)用近紅外光譜技術(shù)無損檢測果蔬的農(nóng)藥殘留提供了一種有效、快速、可靠的檢測手段和方法。