999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ICP-MS和機器學習的速食面識別研究

2021-07-20 05:53:44呂銣麟何洪源賈鎮王書樾何偉文
應用化工 2021年6期
關鍵詞:可視化分類模型

呂銣麟,何洪源,賈鎮,王書樾,何偉文

(中國人民公安大學 偵查學院,北京 100083)

速食面是一種烹制方便、省時的深加工食品,由于其原材料、加工方式和生產設備的不同,微量元素的含量常常具有顯著差異[1]。根據速食面中微量元素指紋快速識別品牌,可以對速食品質量監管帶來很大的便利。

常見的食品微量元素檢測方法有原子吸收光譜法、原子熒光光譜法、X射線熒光光譜法和電感耦合等離子體質譜法(ICP-MS)[2-5]。其中ICP-MS檢測限低,是目前食品微量元素分析中最常用的檢測方法[6-7]。本研究使用ICP-MS檢測16種品牌速食面中的5種微量元素,使用3種降維方法對結果進行可視化分析,對比了5種機器學習算法的分類識別準確率,為速食面品牌識別提供了可行性方法。

1 實驗部分

1.1 試劑與儀器

濃硝酸(68%)、雙氧水(30%)均為UPS級;高純氦He(≥99.999%);高純氬Ar(≥99.999%); ICP-MS混合內標儲備液、ICP-MS多元素混合標準品均為安捷倫科技有限公司。

7800型電感耦合等離子體質譜儀(ICP-MS);DKQ-1800 智能控溫電加熱器;Synergy超純水系統。

1.2 速食面樣品采集和前處理

購買市面上常見品牌的速食面16種,品牌和對應編號見表1。

表1 速食面品牌信息Table 1 Instant noodle brand information

主要原料為小麥。準確稱取每種品牌的速食面0.2 g,碾碎后置于50 mL離心管中,加入4 mL 68%硝酸和1 mL 30%過氧化氫[8],置于電加熱器中80 ℃恒溫消解2 h,后冷卻至室溫。每種品牌的檢材采集7份,其中6份用于可視化分析和訓練集樣本,1份用作測試集樣本。每份樣品平行測定3次。

1.3 標準溶液配制

使用超純水將10 μg/mL Cr、Mn、As、Cd、Pb多元素混合標準品逐級稀釋至0,0.1,0.5,2,5,10,50,100 ng/mL的標準使用液。使用超純水將100 μg/mL 混合內標稀釋至10 μg/mL的內標使用液。

1.4 ICP-MS儀器工作參數

射頻功率1 500 W,冷卻氣流量15.0 L/min,載氣流量1.0 L/min,輔助氣流量1.0 L/min,采樣深度8.5 mm,分析模式為碰撞反應池,重復采樣3次,數據采集模式為跳峰采集,內標元素選擇72Ge、103Rh和209Bi。

1.5 數據分析和分類模型建立

數據降維和特征提取能夠對冗雜的數據進行精簡和可視化分析[9-10]。有監督的機器學習分類識別方法在農作物品種鑒定、產地溯源等方面應用廣泛[11-12]。本研究中可視化分析和化學計量學建模使用Matlab 2019b軟件實現。使用該軟件對實驗數據進行主成分分析降維、非負矩陣分解和t-SNE降維,并將降維結果可視化。樸素貝葉斯模型[13]的預測參數分布選擇高斯分布;K-最近鄰模型[14]距離度量方式選擇歐氏距離,臨近點個數為1;支持向量機[15]核函數選擇二次多項式,多類分類方法為一對一;集成學習的集成方法為子空間判別(ESM),學習器數量為30,子空間維度為3;決策樹判別模型[16]最大分類數設定為100,分裂準則為基尼系數。所有模型訓練集交叉驗證折數為7折。

2 結果與討論

2.1 速食面中5種元素測定結果

使用0,0.1,0.5,2,5,10,50,100 ng/mL 8個濃度梯度的Cr、Mn、As、Cd、Pb混合標準使用液依次進樣,以濃度為橫坐標,響應強度為縱坐標建立回歸曲線,結果見表2。

表2 5種元素的線性方程及相關系數Table 2 Linear equation and correlation coefficient of five elements

由表2可知,線性擬合效果良好,相關系數均達到0.999 9。

使用ICP-MS檢測16種品牌速食面中的5種元素,每個品牌采集7份樣品,其中6份用于可視化分析和訓練集樣本,1份用作測試集樣本,其中每份樣品測定3次,所得數據的相對標準偏差均小于15%,檢測結果具有準確性。將每個品牌速食面的6份分析樣品求平均,結果見表3。

表3 各品牌速食面5種元素平均濃度Table 3 Average concentrations of five elements in instant noodles of different brands

2.2 數據降維及可視化分析

為了更加直觀的觀察16種品牌的速食面之間5種元素濃度的差異,使用了3種數據降維方法并將結果可視化表示。

使用MATLAB 2019b軟件對數據進行主成分分析降維,各主成分的貢獻率及累計貢獻率見表4。

表4 各主成分的貢獻率和累計貢獻率Table 4 The contribution rate and cumulative contribution rate of each principal component

由表4可知,選取前3個主成分后,能夠保留80.230 2%的數據信息,如果選取4個主成分,累計貢獻率能達到93.956 1%。5種元素的主成分載荷見表5。

表5 5種元素的主成分載荷Table 5 Principal component loads of five elements

由表4和表5可知,第一主成分主要反映了Mn和Pb元素濃度的差異信息,與Mn、Pb濃度均呈正相關,方差貢獻率為39.398 0%;第二主成分主要反映了As和Cd的數據信息,與As濃度呈負相關、與Cd濃度呈正相關,方差貢獻率為25.093 6%;主成分3主要反應了Cr元素的元素濃度信息,方差貢獻率為15.738 6%。取前3組主成分,繪制三維分布圖,可以直觀看出16種品牌大多存在明顯差異,見圖1。

圖1 PCA降維結果可視化Fig.1 PCA dimensionality reduction visualization classification result

再嘗試使用以各種距離度量為標準的t-SNE降維方法對元素數據進行處理,以獲得更好的分離效果。4種距離度量標準分別為:歐幾里得距離(Euclidean Distance)、切比雪夫距離(Chebyshev Distance)、余弦距離(Cosine Distance)和馬氏距離(Mahalanobis Distance)。對于同類數據維度差異較大的數據集,常使用馬氏距離和余弦距離度量標準進行t-SNE降維。4種度量標準下的t-SNE降維結果見圖2。

圖2 4種度量標準下的t-SNE降維結果Fig.2 t-SNE dimension reduction results under four metrics

由圖2可知,馬氏距離與余弦距離度量標準能獲得更好的分離效果。

最后使用非負矩陣分解法進行數據降維[17],其主要理論依據是每一個矩陣V(F×N)都可以表示為兩個較小矩陣的乘積,如公式:

V(F×N)≈W(F×K)×H(K×N)

F、N、K是這些矩陣的維度。兩個較小矩陣分別包括特征和權重,也就是說,原始矩陣被分解為特征矩陣及其對應的權重矩陣。保留特征矩陣結果作為數據降維結果,見圖3。

圖3 NMF降維結果可視化Fig.3 Dimension reduction results of NMF

由圖3可知,非負矩陣分解法可以對16種品牌的速食面進行很好的區分,可視化分類結果比主成分分析法和t-SNE法更佳。

2.3 不同分類模型分析

使用樸素貝葉斯判別模型、K-最近鄰模型、支持向量機模型、子空間判別模型和決策樹模型對速食面品牌進行分類,ACC(train)、ACC(CV)和ACC(test)分別代表訓練集準確率、交叉驗證準確率和測試集準確率,結果見表6。

表6 5種分類模型識別準確率Table 6 Recognition accuray of five classification models

由表6可知,5種判別模型的ACC(train)都達到了100%,貝葉斯判別模型、子空間判別模型的ACC(CV)達到了100%。使用外部測試集進行預測時,除K-最近鄰模型外,4種分類模型均達到了100%預測準確率,說明5種分類模型均能達到較好的分類識別效果,其中貝葉斯判別模型和子空間判別模型分類識別能力最佳,K-最近鄰模型和決策樹模型分類識別能力稍弱。

KNN模型和DT模型交叉驗證的分類情況見圖4、圖5。

圖4 KNN模型交叉驗證結果錯配情況Fig.4 Cross validation mismatch results of KNN model

圖5 DT模型交叉驗證結果錯配情況Fig.5 Cross validation mismatch results of DT model

由圖4、圖5可知,KNN模型中,96個訓練集樣本在交叉驗證過程中有5個發生了錯配;DT模型中,有12個樣本在交叉驗證過程中發生了錯配。這兩種分類模型在該實驗中識別準確率較低。

將3種降維結果結合5種分類模型進行速食面品牌識別,交叉驗證準確率見表7。

表7 3種降維方法結合5種分類模型的交叉驗證準確率Table 7 Cross validation accuracy of three dimensionality reduction methods combined with five classification models

由表7可知,非負矩陣分解法降維對比其他兩種降維方法有顯著的分類識別優勢。與原始模型相比,非負矩陣分解后的數據與KNN模型結合提高了識別準確率。

下一步應擴大樣本容量,嘗試對更多的食品進行溯源研究。

3 結論

測定16種市售速食面中5種微量元素的分布,結合多元統計學降維方法,進行了可視化分析和基于機器學習的分類識別。可視化結果顯示,非負矩陣分解法降維效果最好,t-SNE降維與主成分分析降維方法次之。分類識別結果表明,K-最近鄰模型、決策樹模型識別能力較差,ACC(CV)分別為了93.8%和87.5%;貝葉斯判別模型和自空間判別效果最好,ACC(train)、ACC(CV)和ACC(test)均達到了100%,可以實現對市售速食面品牌的準確識別。對使用3種降維方法后的數據進行分類識別,結果表明使用非負矩陣分解法降維后,仍能保持較高的分類識別準確率,其中非負矩陣分解降維與K-最近鄰模型結合,交叉驗證識別率達到100%。說明使用ICP-MS測定速食面中微量元素分布,結合機器學習分類識別方法,可以準確、有效的識別市售速食面品牌,為食品安全監測過程中未知來源的速食面溯源提供了思路和方法。

猜你喜歡
可視化分類模型
一半模型
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
分類算一算
重要模型『一線三等角』
基于CGAL和OpenGL的海底地形三維可視化
重尾非線性自回歸模型自加權M-估計的漸近分布
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
分類討論求坐標
數據分析中的分類討論
主站蜘蛛池模板: 欧美日韩精品在线播放| 99re在线免费视频| 亚洲香蕉伊综合在人在线| 午夜福利网址| 国产在线拍偷自揄观看视频网站| 久久青青草原亚洲av无码| 国产欧美又粗又猛又爽老| 国产精欧美一区二区三区| 精品剧情v国产在线观看| 99精品福利视频| 青青青视频免费一区二区| 午夜综合网| 亚洲区第一页| 亚洲有无码中文网| 久久国产成人精品国产成人亚洲| 日韩麻豆小视频| jizz在线免费播放| 成人在线亚洲| 国产一区二区影院| 中文字幕伦视频| 天天干伊人| 亚洲二区视频| 久久久久久久久亚洲精品| 97成人在线观看| 亚洲精品欧美日本中文字幕| 欧美日韩国产成人高清视频| 亚洲av无码成人专区| 69免费在线视频| 国产成人区在线观看视频| 亚亚洲乱码一二三四区| 欧美色视频日本| 无码有码中文字幕| 国产99欧美精品久久精品久久| 国产最爽的乱婬视频国语对白| 婷婷开心中文字幕| 国产成人精品18| 国产综合另类小说色区色噜噜| 亚洲日韩欧美在线观看| 99ri国产在线| 中文字幕有乳无码| 成年午夜精品久久精品| 无码'专区第一页| 午夜国产理论| 中文字幕 91| 国产人人射| 亚洲一级毛片免费观看| 中文字幕在线免费看| 亚洲AⅤ综合在线欧美一区| 久久精品视频亚洲| 免费一级毛片不卡在线播放 | 久久综合伊人 六十路| 亚洲无码精彩视频在线观看| 国产香蕉在线视频| 国产又色又爽又黄| 国产真实乱人视频| 91麻豆精品国产91久久久久| 人妻无码一区二区视频| 国内精品久久久久久久久久影视 | 69av免费视频| 精品国产成人高清在线| 久久综合一个色综合网| 亚洲无码高清视频在线观看| 亚洲一区二区三区麻豆| 精品福利一区二区免费视频| 日韩黄色精品| 高潮爽到爆的喷水女主播视频| 嫩草在线视频| 伊人久久婷婷五月综合97色| 91免费观看视频| 久久6免费视频| 无码内射中文字幕岛国片| 国产成人三级| 日本日韩欧美| aaa国产一级毛片| 欧美特黄一级大黄录像| 国产精彩视频在线观看| 欧美成人免费午夜全| 自偷自拍三级全三级视频| 在线播放国产99re| 免费国产高清视频| 国产精品视频第一专区| 亚洲第一天堂无码专区|