陳明明,符麗雪,李殿威,左 鋒,2,錢麗麗,2,3
(黑龍江八一農墾大學食品學院1,大慶 163319 ) (國家雜糧工程技術研究中心2,大慶 163319) (黑龍江省農產品加工與質量安全重點實驗室3,大慶 163319)
黑龍江土質肥沃,土壤類型豐富,盛產優質水稻。水稻自身不能合成礦物元素,其礦物元素含量和組成主要受產地環境和人類活動兩方面的影響[1,2],不同的土壤類型礦物元素種類和含量不同,影響著水稻礦物元素含量和種類[3]。近年來國內外外學者通過探究已形成礦物元素分析技術用于產地判別是可行的統一共識。目前礦物元素分析技術已普遍運用于西洋參[4]、大豆[5,6]、蜂蜜[7,8]、葡萄酒[9-11]、茶[12,13]、枸杞[14]、松茸[15]等的產地判別。礦物元素分析技術因具有靈敏度高、線性范圍寬、穩定性強等優點被認為是產地判別有效的方法[16-19],在植源性食品的產地判別中廣泛應用[20],但驗證篩選到的礦物元素指標的有效性是利用該技術進行產地判別成功的關鍵??蒲泄ぷ髡弑M可能以多年連續采集多個樣本數量為對象構建大米產地判別模型,并比較不同模型的適用性,進而驗證篩選礦物元素判別指標的有效性。Butikofer等[21]利用判別分析和人工神經網絡預測模型對歐洲地區奶酪進行了分類,2種方法分別正確區分了95%和91%的樣本。Francisco等[22]基于線性判別分析和人工神經網絡對西班牙礦泉水進行地理分類,神經網絡預測模型判別能力達到94%。黎永樂等[23]利用Ca、Cu、Fe、K、Mg、Mn、Zn、Ni、As、Sr、Cd、Ba、Mo和Se對五常和非五常大米進行Fisher線性判別和人工神經網絡判別,結果表明通過人工神經網絡法建立的判別模型具有更優的判別能力,判別準確率為96.4%。夏立婭等[24]運用近紅外光譜技術結合BP-人工神經網絡對響水和非響水大米進行網絡訓練,建立了理想的網絡誤差收斂曲線,分類正確率可達100%。因此,利用線性判別分析和人工神經網絡進行產地判別是可行的。產地溯源模型所采用的分析方法不同,建立產地判別模型的判別效果也不同。目前基于線性判別分析和人工神經網絡的產地溯源建立過程所用到的僅為單一樣本年份,以連續采集多年份的大米樣本產地溯源判別研究具有重要的意義。
本實驗以前期篩選得到的與產地和母質土壤直接相關的23 種特征礦物元素為依據,并以連續3 年的隨機采集的查哈陽、五常和建三江274 份樣本作建模對象,分別建立Fisher模型和人工神經網絡預測模型進行產地判別,驗證產地鑒別效果并比較2種建模方法的適用性。
選擇2016—2018 年水稻隨機采集樣本。樣品來自于黑龍江省建三江地理標志大米保護區、五常大米地理標志保護區和查哈陽大米地理標志大米保護區。所用樣本具體信息如表1所示。

表1 2016—2018年樣本信息表
7700a電感耦合等離子體光質譜儀,FC2K礱谷機,VP-32碾米機,Mara 240/50微波消解儀,DV4000精確控溫電熱消解儀,Milli-Q超純水機,LM-3100旋風磨,DHG-9123A型電熱恒溫鼓風干燥箱,X68 GPS。
濃硝酸(65%)、過氧化氫:優級純;多元素標準溶液5183-4688、多元素標準溶液、8500-6944多元素標準溶液、8500-6948內標(Bi、Ge、In)、粳米加工精度標準樣品(二級):ZW001;生物成分分析標準物質-大米:GBW10010(GSB-1);無水乙醇溶液;蘇丹-Ⅲ:分析純。
1.3.1 樣品采集
在水稻成熟期,依據代表性采樣原則,采用棋盤式采樣法,每塊地隨機設置5 個重復點,每個采集點沿植株中部割取稻穗1 m2左右,每個區收集1~2 kg稻穗,并記錄樣品信息。
1.3.2 樣品預處理
將采集回來稻谷樣品在通風處晾曬至含水量14%以下,要求晾曬場地無揚塵、整潔、透光。對稻穗進行脫粒、礱谷、碾米獲得二級精米,二級精米參照GB/T 5502—2018染色法判定大米加工精度。并對精米旋風磨粉碎處理,重復過100 目尼龍篩,得到米粉樣本。所有樣本采用統一處理方式。
1.3.3 樣品元素測定
參考GB 5009.94—2012《植物性食品中稀土元素的測定》和GB 5009.268—2016《食品中多元素的測定》[25,26]和相關文獻[27-30]采用電感耦合等離子質譜儀對大米樣品和標準物質中元素測定,準確稱取0.25 g的大米粉樣品,置于消化管中加入6 mL濃硝酸(70%,BV3級)和2 mL雙氧水(30%,BV3級),放入MARS微波消解儀中進行消解。微波設置程序為8 min內從0 W增到1 600 W,溫度升到120 ℃,保持2 min;在5 min內從溫度120 ℃升到了160 ℃,保持5 min;在5 min內再從160 ℃升到180 ℃,并在此溫度下消解15 min;然后冷卻20 min,將微波消化管取出,于通風櫥內打開塞子將微波消化管置于精確控溫電熱消解器中進行趕酸。超純水(>18.2 MΩ·cm)洗滌樣品,定容至100 mL,采用同樣方法進行空白樣品和大米標準物樣品消解。
ICP-MS工作參數為射頻功率1 280 W,霧化室溫度2 ℃,冷卻水流量1.47 L/min,載氣流量1.0L/min,補償氣體流量1.0 L/min,儀器測定3 年樣品和大米標準物中Mg、Ca、Cr、Mn、Zn、As、Rb、Sr、Ag、Cd、Sb、Te、Ba、La、Nd、Sm、Gd、Dy、Ho、Er、Yb、Pb、U 23 種元素。實驗過程中每個樣品重復測定3 次,選用Ge、In和Bi作為內標元素,保證儀器的穩定性。當內標元素的RSD>5%重新測定樣品。
元素的檢出限和定量限見表2。

表2 ICP-MS儀器測定多種礦物元素的檢出限和定量限
采用SPSS26.0軟件對數據進行方差分析、相關性分析和判別分析(Fisher判別分析)。采用MATLAB神經網絡工具箱進行建模仿真。
1.4.1 基于前饋神經網絡的產地判別分類結構
利用3年隨機采集樣本,分別建立4層神經網絡并進行組合模型,考慮到影響大米礦物元素含量因素較多,屬于難以解決的精確數學建模問題,利用神經網絡的歸納推理機制和自適應學習能力,能夠以任意精度逼近一個非線性函數的優勢,將其作為一種解決大米礦物元素產地判別分類模型,實現采集樣本產地分類識別。建立4層前饋神經網絡結構,如圖1所示。
從拓撲結構上可以看出,前饋神經網絡是典型的分層網絡結構。包括輸入層、隱含層和輸出層,層與層之間為互連方式,同層單元之間不存在相互連接,網絡各層分別有nI,nh和no節點數。

圖1 網絡結構示意圖
本研究建立了一種前饋神經網絡,利用其自適應性和穩定快速收斂特性,作為礦物元素大米產地分類的智能識別模型。在實際應用中,可以通過改變各層連接方式和激勵函數,獲得新的網絡結構,實現不同的非線性映射關系。基于篩選的大米產地特征元素,應用到3 年隨機采集樣本數據中進行大米產地分類驗證依據。
1.4.2 基于前饋神經網絡的產地判別分類學習方法
設共有M樣本,第p個樣本,對應的期望實際輸出為dp,計算網絡輸出為yp,網絡各個輸出總誤差為
若記wjk數,即連接權值和閾值(θ和φ),則學習規則為:
式中:η為學習速度;α為慣性系數;t為學習次數。
為了驗證篩選的產地特征礦物元素的判別效果,將與產地直接相關的元素Mg、Ca、Cr、Mn、Zn、As、Rb、Sr、Ag、Cd、Sb、Ba、La、Sm、Dy、Ho、Er、Pb、U和與母質土壤直接相關的元素Mg、Sr、Te、Nd、Gd、Yb、U(見表3)結合一起引入模型,建立Fisher判別模型。274 份樣品分成訓練集和測試集,選擇2/3的樣本用于作為訓練集建立模型,選擇1/3的樣本作為測試集建立模型,得到判別結果見表4。
利用此判別模型對訓練集內部判別結果表明,建三江、五常和查哈陽大米樣品得正確判別率分別為62%、97%和86%,整體正確判別率為82%,交叉判別率79%。對測試集建三江、五常和查哈陽大米樣品得正確判別率分別為83%、100%和80%,總體正確判別率為86%。

表3 2016—2018年不同產地大米樣本中礦物元素含量

表4 不同產地Fisher判別函數分類結果
利用判別函數得分進行作圖,由圖2可以看出,五常大米分布區域比較清晰,查哈陽和建三江大米產地分布區域較為接近,有交叉現象。可能是由于SPSS判別分析屬于有監督模式的線性分類算法,不能夠準確有效的反映本研究檢測的元素與大米產地之間存在的非線性映射關系,同時影響大米中元素含量因素多且復雜,與產地相關的因素還包括降水、氣溫、光照等因素。因此,僅從產地與元素之間的線性關系判別不能很好的體現因果關系和信息間的相互影響,為了更有效處理這些特征元素,采用更為具有非線性映射能力的人工神經網絡建立預測模型進行產地判別。
本研究選取實驗得到的3類大米產地,其中1~93為建三江大米樣本,94~177為五常大米樣本,178~274為查哈陽大米樣本,共計274 組實驗樣本,如表5所示。其中274用于該方法的訓練,274 組用于測試。

表5 樣本信號(歸一化)
2.2.1 確定網絡結構和參數
對3類大米產地樣本中礦物元素數據采集,由于提取了23 個有效特征空間的維數,即網絡輸入層節點數為23;輸出層的節點數由分類類型空間的維數決定,研究中將類型分類的編碼為100、010和001,分別表示查哈陽大米、五常大米和建三江大米,因此,輸出節點數為3;根據Kolmogorov定理和大量實際訓練經驗,確定第一隱含層神經元節點為36 個,第二隱含層神經元節點為28 個;所以基于神經網絡的大米產地識別分類的神經網絡的拓撲結構為23-36-28-3 型。
2.2.2 網絡訓練學習過程
利用梯度下降算法求解最優解,選定274 組樣本,定義訓練目標迭代精度為0.01,學習速度0.8,慣性系數0.5,最大學習次數4 000 000,收斂情況如圖3所示。

圖3 大米產地分類網絡收斂曲線
從訓練效果上看,前饋神經網絡迭代次數為201 412次,滿足精度誤差為0.01。在網絡學習過程中,學習算法都是使網絡達到設定精度,網絡收斂比較穩定,并且符合誤差限制要求。
2.2.3 仿真實例與結果分析
利用訓練好的神經網絡的大米產地自動分類方法,將274 組待測數據的篩選23 種礦物元素含量輸入網絡,并進行大米產地識別結果如表6所示。
從表6識別結果上看,274組數據的相對誤差平均值為17.14%,網絡的計算輸出值和期望輸出值的誤差較小;3個產地的整體識別準確率為100%。實驗表明:網絡相對檢測誤差分散性較小,具有較好的泛化性和穩定性,是一種有效的大米產地識別方法。

表6 大米產地識別結果
研究通過連續3 年隨機采集的五常、查哈陽和建三江地理保護區274 份樣本,基于前期實驗篩選到的與產地和母質土壤直接相關的23 種特征礦物元素分別建立了Fisher線性判別模型和前饋神經網絡模型。
利用Fisher判別模型對訓練集檢驗正確判別率為82%,交叉檢驗正確判別率為79%,測試集總體正確判別率為88%。前饋神經網絡模型具有自適應性和穩定快速收斂特性。通過四層網絡訓練,得到拓撲結構為23-36-28-3 型前饋神經網絡模型。該前饋神經網絡對3個產地大米樣本識別效果較好,解決了小距離相似自然環境產地樣本難以識別的問題。
通過對比2種模型的判別效果得出,以篩選的23 種元素為依據,前饋神經網絡模型較Fisher判別模型更具有適用性,可作為大米產地的智能識別模型。在下一步的研究中,將通過增加每一年的數據信息,修正模型參數,獲得新的模型,驗證大米不同產地的識別應用穩定性。