賴翰卿 習佳林 何偉忠 王朝輝 毛雪飛





摘?要:目的:尋找中國北方相似地域大豆產地的溯源特性指標,以提高礦物元素指紋分析技術在大豆產地溯源方面應用的準確性和穩定性。方法:利用電感耦合等離子體質譜法測定來自中國東北和西北地區5個主要大豆主產省區的159份大豆樣品中12種礦物元素(Mg、Al、P、K、Ca、Mn、Fe、Ni、Cu、Zn、Rb、Sr)的含量。結果:利用主成分分析對大豆產地進行初步分類,但除黑龍江外,其他產地并不能進行良好地區分,進一步利用多層感知器建立產地分類模型。訓練子集、測試子集和保持子集的正確預測率分別為100.0%、92.3%和94.4%,可有效地對中國北方地區5個產地進行分類。結論:本研究可為我國大豆產地溯源體系的建立提供科學依據。
關鍵詞:大豆;礦物元素;指紋分析;產地溯源;多層感知器
原產地溯源主要是通過分析不同地區產品的化學組成,找出能夠表征原產地信息的特異性指紋[1-2]。因此,相關特征物質的定性定量分析非常重要,目前主要涉及礦物元素指紋分析[3]、穩定同位素比分析[4]、近紅外光譜[5] 和特征有機成分分析[6]等手段,或使用上述方法進行綜合分析。礦物元素指紋分析技術在食品溯源研究中最為常用,特別是電感耦合等離子體質譜法(ICP-MS)、電感耦合等離子體發射光譜法(ICP-OES)、X射線熒光光譜法(XRF)等多元素分析手段,已在大米[7-9]、茶葉[10-12]、豇豆[13]、可可豆[14]、枸杞[15-16]、蜂蜜[17]、葡萄酒[18-20]、初榨橄欖油[21-22]等產品的溯源研究中得到廣泛的應用。目前,國內外關于大豆產地溯源的研究相對較少。萬婕等[23]利用ICP-OES測定了國內4個省份(安徽、江西、吉林、黑龍江)大豆樣品中的K、P、Mg、Ca、Fe、Al、Zn、Mn、Na元素的含量,結果表明,不同產地大豆中Al、Ca、Fe、Na、Mn、Zn元素的含量具有顯著性差異(P<0.05),利用礦物元素指紋分析技術可以很好地區分4個省份的大豆。鹿保鑫等[24]利用ICP-MS分析黑龍江省北安市9個農場及黑河市嫩江縣6個農場共42份大豆樣品中30種礦物元素的含量,結合方差分析、主成分分析(PCA)和判別分析,篩選出Na、K、Mn、Rb、Ba、Au 6種元素作為黑龍江省兩個大豆主產區的溯源指標,實現了對省內兩大主產區大豆產地溯源的準確判別,正確率達到100%。Otaka等[25]利用配備了三維偏振光學系統的能量色散型XRF測定了日本46種國產和進口大豆中的微量元素,通過PCA和線性判別分析,確定了8種元素(Mg、P、Cl、K、Mn、Cu、Br、Ba)作為區分日本國內與國外大豆產地的溯源指標,最終正確判別率達到91.3%。數據分析方面,除了上述所用到的方法以外,人工神經網絡(ANN)這類可以解決非線性多分類問題的數據分析手段也常被用于農產品的分類中,Chen等[26]利用近紅外光譜分析了5種不同種類的蜂蜜樣品,并使用馬氏距離判別分析(MD-DA)以及反向傳播人工神經網絡(BP-ANN)分別建立分類模型,結果表明,MD-DA的訓練集和驗證集的分類準確率分別為87.4%和85.3%,而BP-ANN的訓練集和驗證集的分類準確率分別為90.9%和89.3%,BP-ANN的性能要優于MD-DA。Carlos等[27]利用熒光光譜法分析了巴西當地的4種不同種類的食用油,通過建立三層的ANN模型,可以使其利用少量的光譜數據就能快速對4種食用油進行分類,正確率為72%。
對于中國北方地區,特別是東北三省,由于成土母質、地理環境、區域氣候的接近,一般較難區分,而多層感知器(MLP)作為一類常用的ANN模型,在一些復雜的非線性多分類問題上擁有良好的能力,但在大豆產地溯源的應用中鮮有報道,本研究將礦物元素指紋分析技術與MLP結合,利用ICP-MS分析了來自我國東北和西北地區5個省區(黑龍江、吉林、遼寧、內蒙古、新疆)大豆樣品中礦物元素的含量,通過PCA、MLP等數據分析手段,建立了產地分類模型,為大豆溯源體系的建立提供了科學依據。
1?材料與方法
1.1?試劑
濃硝酸(65%,電子純BV-Ⅲ),德國Merck公司;雙氧水(30%,優級純),北京化學試劑研究所;單元素國家標準溶液(1 000 mg/L),中國計量科學研究院。
1.2?儀器
TOPEX微波消解儀,上海屹堯儀器科技發展有限公司;Millipore-Q超純水系統,美國Millipore公司;EXPEC-7000 電感耦合等離子體質譜儀,杭州聚光科技股份有限公司;JXFM 110 型錘式旋風磨,杭州匯爾儀器設備有限公司。
1.3?樣品的采集與制備
2017年從黑龍江、吉林、遼寧、內蒙古、新疆采集159份大豆樣品,采集好的大豆放入干凈的紙袋中,并使其自然風干,風干后的大豆使用錘式旋風磨粉碎,然后使用100目尼龍篩進行篩分,最后裝袋密封保存備用。
1.4?樣品前處理
樣品前處理方法根據GB 5009.268—2016進行修改:將0.25 g粉末狀樣品稱入聚四氟乙烯消解罐中,向其加入3 mL HNO3和2 mL H2O2;消解罐封閉后裝入微波消解儀。微波消解升溫程序:(1)在5 min內升至80℃;(2)在5 min內從80℃升至120℃;(3)在5 min內從120℃升溫至190℃,并再保持20 min;(4)冷卻至室溫。然后,將消化后的溶液在140℃加熱趕酸,直到殘留物少于1 mL,然后使用2%HNO3(V∶V)將其定容至25 mL,待測。
1.5?樣品分析
采用ICP-MS法對樣品進行定量分析,儀器詳細參數見表1。
1.6?數據分析
利用PCA和MLP對數據進行分析以及模型構建。這里,MLP是一類“前饋神經網絡”,它是深度學習中最常用的模型[28-29],其主體由1個輸入層、若干個隱藏層和1個輸出層組成。與只能解決線性關系的PCA不同,前饋神經網絡可以解決變量間的非線性關系。輸入層的輸入變量是12種礦物元素含量,輸出層的輸出變量是5個省區(新疆、內蒙古、黑龍江、吉林、遼寧)。 對于隱藏層中的5個神經元,選擇雙曲正切函數作為激活函數,并選擇Softmax函數作為輸出層的激活函數。
2?結果與分析
2.1?大豆樣品中礦物元素含量分析
如表2所示,Mg的含量在5個產地之間相對穩定,P、Mn、Fe、Ni、Cu、Zn、Rb、Sr的含量在各產地之間差異較為明顯。Al的含量在黑龍江、內蒙古、新疆3個產地差異較小,遼寧地區的樣品Al含量最低,而吉林地區的樣品Al含量最高且波動較大。新疆地區和吉林地區的樣品K含量接近,但其他三地的K含量差異較為明顯。內蒙古地區與吉林地區的樣品Ca含量接近,但與其他三地的Ca含量差異明顯。經過方差分析后,這些元素含量在不同大豆產區之間存在極顯著差異(P<0.01)。 為了進一步分析這些數據并實現產地溯源,使用PCA對大豆樣品進行初步分類。
2.2?主成分分析
5個產區大豆樣品中礦物元素含量的PCA結果見表 3。選取特征值大于1的成分作為主成分,從中提取了4個主成分。其中,第一主成分貢獻率為 28.766%,第二主成分貢獻率為 20.437%,第三主成分貢獻率為 15.039%,第四主成分貢獻率為12.343%。4個主成分的總貢獻率達到了76.585%,可充分達到反映原始數據信息的目的。利用第一、第二主成分繪制載荷圖(圖1),大豆中Mg、P、K、Mn的濃度對主成分1的貢獻大,Fe、Zn的濃度對主成分2的貢獻大。再進一步繪制基于第一、第二主成分的各產地大豆樣品散點圖(圖2),黑龍江、吉林的大部分樣品都能與其他產地樣品分離,而遼寧與新疆的樣品大部分重合。內蒙古樣品與新疆樣品可以良好的分離,但跟遼寧的樣品有部分重合。通過PCA并不能很好地解決5個產地的分類問題,所以,接下來利用MLP對5個產地的樣品進一步的分類。
2.3?建立多層感知器模型
從PCA結果來看,在地理區域較大的省份中,由于各種土壤、氣候和生產要素而導致的元素含量變化范圍大,可能導致無法區分來源。在這種情況下,本研究決定使用ANN來進一步挖掘和分析數據。MLP作為一類最常用的ANN,其結構賦予了它如大腦般相同的聯想能力和容錯性。此外,它具有自我學習和自適應能力,可以很好地解決多分類問題。將數據按照3∶1∶1隨機分配給訓練子集(60%)、測試子集(20%)和保持子集(20%)。其中,訓練子集用于訓練神經網絡和構建該模型;測試子集用于跟蹤訓練中的錯誤,以防止訓練過度;保持子集不參與模型的構建,而是用于評估最終的神經網絡和評估模型“真實”的預測能力。表4顯示,訓練子集中的所有97個樣本正確分類為各自產地內,正確率為100%。在測試子集的26個樣本中,2個新疆樣本被錯誤分類為遼寧樣品,因此,在測試子集中,新疆的正確預測率為71.4%,而總的正確預測率為92.3%。在保持子集的36個樣品中,1個黑龍江樣品以及1個新疆樣品錯誤分類為遼寧樣品,黑龍江的正確預測率為94.1%,新疆的正確預測率為87.5%,保持子集總的正確預測率為94.4%。結果表明,利用MLP對4個產地大豆進行產地分類是可行的。
3?結論
中國東北、西北地區是大豆的主要產地,特別是東北地區大豆產量高、品質好、市場認可度高,因此對黑龍江、吉林、遼寧、內蒙、新疆等地區的大豆產品進行產地溯源研究具有一定的實際意義。從本研究的結果來看,5個主要大豆產地中Mg、Al、P、K、Ca、Mn、Fe、Ni、Cu、Zn、Rb、Sr的濃度在不同產地呈差異極顯著關系(P<0.01),并且可以作為北方地區大豆產地溯源的有效指標。但是,由于產地內的區域氣候、地理條件以及生產要素會影響大豆中元素含量的范圍,導致單純解決線性問題的數據分析手段難以應對。因此,引入如ANN這類具有學習能力的數據分析方法勢在必行,可以有效地解決這種多分類的非線性問題。礦物元素指紋分析技術結合MLP,用于中國北方5個地區大豆產地分類的訓練子集、測試子集和保持子集正確預測率分別達到100.0%、92.3%和94.4%,可以為中國北方大豆的產地溯源提供科學依據。◇
參考文獻
[1]國家發展和改革委員會.促進大豆加工業健康發展的指導意見[J].糧油加工,2008(10):18、20-23.
[2]魏益民,郭波莉,魏帥,等.食品產地溯源及確證技術研究和應用方法探析[J].中國農業科學,2012,45(24):5073-5081.
[3]A Gonzálvez,et al.Geographical traceability of “Arròs de Valencia” rice grain based on mineral element composition[J]. Food Chemistry,2011,126 (3):1254-1260.
[4]童成英,何守陽,丁虎.茶葉產地與品質的元素、同位素鑒別技術研究進展[J].生態學雜志,2018,37(5):1574-1583.
[5]Veronika Uríková,Jana Sádecká.Determination of geograp-hical origin of alcoholic beverages using ultraviolet,visible and infrared spectroscopy:a review[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2015(148):131-137.
[6]Alonso-Salces R M,Serra F,Reniero F,et al.Botanical and geographical characterization of green coffee (coffea arabica and coffea canephora):chemometric evaluation of phenolic and methylxanthine contents[J]. Journal of Agricultural and Food Chemistry,2009,57(10):4224-4235.
[7]張玥,等.基于主成分分析和判別分析的大米產地溯源[J].中國糧油學報,2016,31(4):1-5.
[8]Camila Maione,et al.Classification of geographic origin of rice by data mining and inductively coupled plasma mass spectrometry[J]. Computers and Electronics in Agriculture,2016(121):101-107.
[9]Chung I M,Kim J K,Lee K J,et al.Geographic authentication of Asian rice (Oryza sativa L.)using multi-elemental and stable isotopic data combined with multivariate analysis[J]. Food Chemistry,2018(240):840-849.
[10]Moreda-PinEiro A,Fisher A,Hill S J .The classification of tea according to region of origin using pattern recognition techniques and trace metal data[J]. Journal of Food Composition and Analysis,2003,16(2):195-211.
[11]Zhao H,et al.Relationship between multi-element composition in tea leaves and in provenance soils for geographical traceability[J]. Food Control,2017(76):82-87.
[12]Li L,Wen B,Zhang X,et al.Geographical origin traceability of tea based on multi-element spatial distribution and the relationship with soil in district scale[J]. Food Control,2018(90):18-28.
[13]Pérez-Rodríguez,et al.Classification of cowpea beans using multielemental fingerprinting combined with supervised learning[J]. Food Control,2019(95):232-241.
[14]Daniela Bertoldi,et al.Multielemental fingerprinting and geographic traceability of Theobroma cacao beans and cocoa products[J]. Food Control,2016(65):46-53.
[15]Zhang S,Wei Y,Wei S,et al.Authentication of Zhongning wolfberry with geographical indication by mineral profile[J]. International Journal of Food Science & Technology,2017,52(2):457-463.
[16]Bertoldi Daniela,Cossignani Lina,Blasi Francesca,et al.Characterisation and geographical traceability of Italian goji berries[J]. Food Chemistry,2019(275):585-593.
[17]Batista B L,Silva L R S D,B A Rocha,et al.Multi-element determination in Brazilian honey samples by inductively coupled plasma mass spectrometry and estimation of geographic origin with data mining techniques[J]. Food Research International,2012,49(1):209-215.
[18]Mária Koreňovská,Suhaj M .Identification of some Slovakian and European wines origin by the use of factor analysis of elemental data[J]. European Food Research and Technology,2005,221(3-4):550-558.
[19]Coetzee P P,et al.Multi-element analysis of South African wines by ICP-MS and their classification according to geographical origin[J]. Journal of Agricultural and Food Chemistry,2005,53(13):5060-5066.
[20]Mirabal-Gallardo,Yaneris,et al.Multi-element analysis and differentiation of chilean wines using mineral composition and multivariate statistics[J]. Ciencia e Investigación Agraria,2018,45(2):181-191.
[21]Cabrera-Vique C,et al.Determination of trace elements in extra virgin olive oils:a pilot study on the geographical characterisation[J]. Food Chemistry,2012,134(1):434-439.
[22]María Beltrán,Ramón Aparicio,et al.Geographical traceability of virgin olive oils from south-western Spain by their multi-elemental composition[J]. Food Chemistry,2015(169):350-357.
[23]萬婕,劉成梅,劉偉,等.電感耦合等離子體原子發射光譜法分析不同產地大豆中的礦物元素含量[J].光譜學與光譜分析,2010,30(2):543-545.
[24]鹿保鑫,馬楠,王霞,等.基于電感耦合等離子體質譜儀分析礦物元素含量的大豆產地溯源[J].食品科學,2018,39(8):288-294.
[25]Otaka A,Hokura A,Nakai I .Determination of trace elements in soybean by X-ray fluorescence analysis and its application to identification of their production areas[J]. Food Chemistry,2014(147):318-326.
[26]Chen L,Wang J,Ye Z,et al.Classification of Chinese honeys according to their floral origin by near infrared spectroscopy[J]. Food Chemistry,2012,135(2):338-342.
[27]Carlos Eduardo,Tanajura Da Silva,et al.Classification of food vegetable oils by fluorimetry and artificial neural networks[J]. Food Control,2015(47):86-91.
[28]Bishop C M .Pattern recognition and machine learning (information science and statistics)[M]. Springer-Verlag New York,Inc.2006.
[29]Zhang GP .Neural networks for classification:a survey[J]. IEEE Transactions on Systems,Man and Cybernetics,Part C (Applications and Reviews),2000,30(4):451-462.