殷 勇 戴松松 于慧春
(河南科技大學食品與生物工程學院,河南 洛陽 471023)
玉米(Zea mays Linn.)是我國重要的農作物之一,其營養價值豐富,可作為主食、飼料、工業加工重要原料,是養殖業的重要能量來源,但玉米在運輸和貯藏過程中極易發生霉變,霉變后會產生分布廣泛、致癌力較強的黃曲霉毒素B1,如果對黃曲霉毒素B1處理不當,則極易引起人、畜、禽中毒。 因此,及時檢出霉變玉米及霉變等級尤為重要[1]。
黃曲霉毒素B1的檢測方法主要包括感官評定[2]、高效液相色譜法(high performance liquid chromatography, HPLC)[3]、 聚 合 酶 鏈 式 反 應(polymerase chain reaction,PCR)[4]、氣質聯用法(gas chromatography mass spectrometer,GC-MS)[5]及DNA 探針法[6]、酶聯免疫(enzyme-linked immuno sorbent assay,ELISA)法[7-8]等,但上述方法存在主觀性強、結果可靠性差,或破壞物料、操作復雜等缺點。 而高光譜技術具有高效、無損、低成本和可重復等優勢[9],已被廣泛應用于肉類[10-12]、杏仁[13]、水果[14-18]、雞蛋[19]、茶葉[20]、谷類[21]和油料作物[22-23]等農副產品檢測,并取得了較好的分析結果。 近年來,高光譜技術在玉米霉變檢測中也有報道,褚璇等[24]對獲取400 ~1 000 nm 波段范圍內的霉變玉米高光譜圖像,引入基于Fisher 判別最小誤判率的方法選擇最優波長,并以所選最優波長作為判別模型的輸入,其驗證集的判別正確率為80. 9%。 袁瑩等[25]利用高光譜技術對霉變玉米進行上述檢測,采用支持向量機分類模型得出的訓練集和預測集的預測準確率分別為93. 3% 和91. 7%。 研究表明,高光譜有能力對霉變玉米進行鑒別,但對霉變玉米的檢測正確率不高,且多是定性鑒別,缺乏定量分析。 因此,本研究擬利用高光譜技術對霉變玉米中黃曲霉毒素B1進行定量預測分析,以期為霉變玉米中黃曲霉毒素B1定量檢測提供一種新手段,為實現霉變玉米中黃曲霉毒素B1的高光譜無損檢測奠定基礎。
玉米品種為中單909,購自洛陽市中原農貿城。將新鮮玉米放入相對濕度為90%、溫度為30℃的LHS-HC-100 恒溫恒濕培養箱(上海資一儀器設備有限公司)中培育。 采用不同培育天數的玉米來表征不同的霉變程度。 試驗選用培育第0、第2、第4、第6、第8 天來標記5 個等級的霉變玉米。 每個等級的樣品各取50 個樣本(35 個訓練集,15 個測試集),每個樣本量為60±0.5 g。
高光譜圖像采集系統由IST50—3810 成像光譜儀(德 國Inno-spec 公 司)、 計 算 機、4 個500 W 的RK90000420108 光纖鹵素燈(德國ESYLUX 公司)和傳送裝置等組成。 可采集到的反射光譜范圍為371.05~1 023.82 nm,光譜分辨率為2.8 nm,共得到1 288 個不同的波段。 高光譜掃描設定范圍為Width 760、Heigh 550,得到的高光譜圖像分辨率為760×550。因此,最終得到的每個樣本大小為760×550×1 288 的高光譜圖像。
采集樣本高光譜數據時,將樣本均勻地平鋪在規格為8 cm×8 cm 的正方體盒子中,然后將盛有樣品的盒子放在搭建的傳送帶上,由SICap-STVR V1.0.x 軟件平臺驅動控制成像儀,并記錄和存儲高光譜數據。采集樣本在371.05~1 023.82 nm 的反射光譜,然后對采集的高光譜圖像信息進行黑白校正,校正方法詳見文獻[26]。 針對所采集的高光譜圖像,用ENVI 4.8提取每個樣本的所有像素點在各波長下的平均反射值,以此得到250 個樣本的平均反射光譜數據,最后通過Matlab 2014a 軟件對光譜數據進行處理。
為降低儀器噪音和暗電流等的干擾,本試驗采用多元散射校正法(multiplicative scatter correction,MSC)對黑白校正后的高光譜數據進行預處理。 MSC 可以增強與成分含量相關的光譜吸收信息,消除光譜數據中散射帶來的影響。 但采用該方法的前提是要先建立一個樣品的“理想光譜”,即樣品中待測成分的含量與光譜變化滿足直接線性關系,以該光譜為標準對其他樣品光譜通過基線平移和偏移校正進行修正。 首先計算樣品高光譜的平均值,然后以平均值作為標準光譜,將樣品光譜于標準光譜進行一元線性回歸運算,最后進行多元散射校正[27],相關計算公式如下:
平均光譜:

一元線性回歸:

多元散射校正:

式中,A 表示光譜數據矩陣;n 為樣品數;A-表示所有樣品的原始高光譜在各個波長點處求平均值所得到的平均光譜矢量;mi和bi分別表示各樣品高光譜Ai與平均光譜A-進行一元線性回歸后得到的相對偏移系數和平移量。
參照GB 5009.22-2016[28]的測定方法對不同霉變等級玉米中的黃曲霉毒素B1進行測定。
采集到的高光譜信息是高達1 288 個波段的數據,加上光譜數據中相鄰光譜值存在極高的相關性,故含有大量的冗余信息,使得特征吸收峰不明顯,因此,特征波長的提取對減少計算量、提高檢測精度至關重要。 本試驗擬通過偏最小二乘回歸(partial least squares regression,PLSR)法對1 288 個波段上樣本的平均光譜反射值進行回歸分析,借助于回歸系數的大小來提取特征波長。
基于偏最小二乘回歸系數來選擇特征波長的基本方法:通過PLSR 系數構建黃曲霉毒素B1對各波長光譜反射值的回歸模型,回歸表達式中每個波段的回歸系數表征了各波段的貢獻比重,系數絕對值越大,對回歸模型的影響越大。 因此,通過比較回歸系數可選出光譜的特征波長。
霉變等級判別分析是不同霉變等級黃曲霉毒素B1定量檢測的前提。 首先采用Fisher 判別分析(fisher discriminant analysis,FDA)全波長和特征波長下不同等級霉變玉米的有效性,然后采用農產品食品智能無損檢測實驗室自行編寫的FDA 分析程序,以全波長和特征波長為變量進行5 組訓練集及其對應的測試集的FDA 分析,比較全波長和特征波長下的FDA判別結果。
本研究以偏最小二乘回歸和BP 神經網絡來建立全波長和特征波長下的預測模型,并比較模型的預測精度。
1.8.1 偏最小二乘回歸 PLSR 分析在建模過程中集中了主成分分析、典型相關分析和線性回歸分析的特點,預測能力強且模型簡單[29]。 PLSR 模型性能評價指標采用訓練集相關系數(Rc)、測試集相關系數(Rp)、訓練集均方根誤差(RMSEC)、測試集均方根誤差(RMSEP) 來綜合評定。 Rc、Rp 越高,RMSEC、RMSEP 越小,則模型預測性能越好。
1.8.2 BP 神經網絡 在BP 神經網絡預測模型的構造中,采用輸入層、中間層(隱層)和輸出層3 層網絡結構,全波長下輸入層神經元個數為1 288 個(代表1 288 個波長下的光譜值),特征波長下輸入層神經元個數為7 個(代表7 個波長下的光譜值),輸出層神經元個數都為1(代表黃曲霉毒素B1)。 tansig 函數為隱層神經元傳遞函數、traincgf 函數為訓練函數、logsig 函數為輸出層神經元傳遞函數時,用訓練集數據來訓練神經網絡,并用試湊法來確定隱層神經元個數(6)。 此時的網絡訓練誤差為0.000 47,訓練步數為100,學習速率為0.1。 BP 神經網絡的具體用法參見文獻[30]。
以隨機抽取每個等級中的5 個平行樣本的平均值作為該等級的測試結果(表1)。 本結果由河南省商丘市質量技術監督檢驗測試中心測試并提供。

表1 霉變玉米中黃曲霉毒素B1 含量Table 1 The test results of aflatoxin B1 corresponding to different moldy grades of maize
由圖1 可知,原始光譜曲線存在較為嚴重的基線漂移現象,經MSC 預處理后的光譜曲線(圖2)的基線漂移現象被消除了。 由獲取的光譜曲線可知,不同等級霉變玉米的光譜曲線總體變化規律具有相似性:在410 ~490 nm 波段,平均光譜反射值逐漸降低;不同霉變等級的玉米光譜反射值在490 nm附近出現吸收波谷,這是由玉米中黃曲霉毒素B1的吸收作用引起的;在490 ~800 nm 波段平均光譜值逐漸增加,在820 nm 附近出現了最大的光譜反射值,之后逐漸平穩。
由圖3 可知,經PLSR 分析選出了7 個特征波長,這些特征波長較好地體現了原光譜中大部分黃曲霉毒素B1信息。 其中,544.6、623.5、757.1、921.6 nm 4 個特征波長的平均光譜反射值與霉變玉米中黃曲霉毒素B1含量呈正相關;584.1、697.1、841.7 nm 處的光譜反射值與霉變玉米中黃曲霉毒素B1的含量呈負相關。

圖1 原始光譜曲線Fig.1 The original spectrum curve
由圖4 可知,全波長下的不同程度霉變玉米大部分能夠區分開來,但第2、第4 天和第6、第8 天仍有小部分重疊,FDA 測試結果比較分散。 特征波長下的不同程度霉變玉米基本上能夠較好的區分開來,且分布較聚集(圖5)。 由表2 可知,全波長下的FDA 鑒別正確率在85%~88%之間,特征波長下的FDA 鑒別正確率均在98%以上。 因此,在鑒別分析中運用特征波長能較好地判別不同霉變等級的玉米樣本。

圖2 經MSC 預處理后的光譜曲線Fig.2 The spectrum curves after MSC pretreatment

圖3 黃曲霉毒素B1 模型權重系數圖Fig.3 The weight coefficient curves of aflatoxin B1 PLSR model

圖4 基于全波長下的FDA 結果Fig.4 FDA results based on the full wavelengths

圖5 基于特征波長下的FDA 結果Fig.5 FDA results based on the characteristic wavelengths

表2 全波長和特征波長下對應測試集的FDA 鑒別正確率Table 2 FDA accuracy of test set based on the full wavelength and the Characteristic wavelength /%

圖6 全波長和特征波長下對應測試集的PLSR 預測結果Fig.6 PLSR prediction results of test set based on the full wavelength and characteristic wavelengths
2.5.1 偏最小二乘回歸模型的分析 不同霉變等級玉米能得到有效鑒別是構建黃曲霉毒素B1定量預測模型的基礎。 由圖6 可知,基于特征波長下預測模型的Rp(0.9570)略低于全波長下的Rp(0.991 1),但RMSEP ( 2.779 2) 略高于全波長的 RMSEP(1.261 2)。特征波長下的預測模型性能參數劣于全波長的預測模型,但兩者精度相差不大,且特征波長預測模型的變量降到7 個,遠低于全波長的1 288 個變量,說明特征波長的提取及所構建的預測模型是有效的。
2.5.2 BP 神經網絡模型的分析 由表3 可知,在75個測試集中,全波長下預測相關系數Rp=0.994 4,RMSEP=0.339 1;特征波長下預測模型的相關系數Rp=0.999 9,RMSEP=0.180 9,說明特征波長下的預測效果優于全波長,特征波長光譜信息能代表全波長信息。
2.5.3 PLSR 與BP 神經網絡模型的比較分析 由表4 可知,在2 種預測模型中,預測準確度均在95%以上。 在全波長下,BP 神經網絡模型和PLSR 模型的預測相關系數相近,均在99%以上,但BP 神經網絡模型預測集的均方根誤差RMSEP=0.339 1,小于PLSR 模型預測集的均方根誤差RMSEP=1.261 2,其預測精度高于PLSR 模型。 在特征波長下,BP 神經網絡模型的Rp=0.999 9,高于PLSR 模型的Rp=0.957 0,且其均方根誤差RMSEP = 0.180 9 遠低于PLSR 模型的RMSEP=2.779 2,說明BP 神經網絡模型在特征波長下的預測效果優于PLSR 模型。 而全波長下,BP 神經網絡模型中的模型預測相關系數Rp=0.994 4,略低于特征波長下的Rp = 0.999 9, 預測精度RMSEP(0.339 1)高于特征波長下的RMSEP(0.180 9),這與玉米霉變等級鑒別分析中,特征波長下的FDA 鑒別正確率在98%以上相吻合。 綜上,特征波長下的BP 神經網絡預測模型具有較高的穩定性與可靠性。
玉米中毒素的產生主要是由于其自身帶有孢子和芽孢,芽孢是細菌的休眠體,孢子由霉菌產生,它們在適宜的生長環境下可使玉米產生霉變[2],而有關玉米霉變的分析,前人主要是通過理化試驗對其進行鑒定。本研究對霉變玉米進行了黃曲霉毒素B1含量的高光譜預測,達到了無損快速檢測霉變玉米中黃曲霉毒素B1的目的,為實現玉米霉變的在線、快速、精確檢測提供了借鑒。

表3 測試集中黃曲霉毒素B1 期望值與BP 神經網絡預測值Table 3 Prediction vales of aflatoxin B1 based on BP neural network and their desired values for test set /(μg·kg-1)

表4 2 種預測模型中測試集對比評價指標Table 4 Comparison of two test models in the test set evaluation index
本試驗中,影響高光譜預測霉變玉米中黃曲霉毒素B1結果的因素主要包括特征波長的選取和模型的構建。 本試驗結果表明,特征波長的FDA 鑒別正確率高于全波長,說明特征波長的提取是有效的,將特征波長作為不同霉變等級黃曲霉毒素B1定量檢測的模型輸入時,發現預測精度明顯提高,這與孫靜濤等[31]采用高光譜技術并結合特征波長的提取預測哈密瓜可溶性固形物和硬度的結論一致。 本研究中,特征波長下的PLSR 預測模型精度略低于全波長,而BP 神經網絡的預測模型中,特征波長下的預測精度又明顯比全波長高,說明構建的模型不同,其特征波長下的預測精度并不是都比全波長下的高,這可能與本研究只用了偏最小二乘權重回歸系數這一種方法提取特征波長有關,因為提取的這7 個特征波長雖然去除了冗余信息,提高了模型精度,但是特征波長的選擇方法可能并不是最佳的,所以針對高光譜特征波長的選擇仍需進一步研究。
高光譜成像技術在霉變玉米無損檢測中仍然存在一定的局限性,還需要進一步完善,同時本研究的樣本的數量及種類可能還不夠多,地域、品種覆蓋范圍還不夠廣,霉變天數的選擇也可能不是預測霉變玉米中黃曲霉毒素B1的最佳等級,以及霉變玉米的鑒別方法比較單一,構建的預測模型泛化能力有待進一步提高,因此,后續工作仍有待深入研究。
針對霉變玉米中黃曲霉毒素B1的高光譜檢測方法,在提取霉變玉米高光譜特征波長的基礎上,分別研究了全波長和特征波長下的FDA 判別效果。 結果表明,特征波長能較好地判別不同等級的霉變玉米;特征波長下的BP 神經網絡預測模型,具有較高的穩定性與可靠性。 因此,特征波長光譜信息能代表全波長信息,而且進行特征波長的提取也是必要的,可減少計算量、提高檢測精度及減少信息的冗余現象。