999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

FT-IR結合SIMCA法識別糯米產地

2012-10-28 08:16:22張文海姬中偉艾斯卡爾艾拉提
食品科學 2012年8期
關鍵詞:方法模型

張文海,姬中偉,艾斯卡爾·艾拉提,毛 健,*

(1.江南大學食品學院,江蘇 無錫 214122;2.江南大學 食品科學與技術國家重點實驗室,江蘇 無錫 214122)

FT-IR結合SIMCA法識別糯米產地

張文海1,2,姬中偉1,艾斯卡爾·艾拉提1,毛 健1,*

(1.江南大學食品學院,江蘇 無錫 214122;2.江南大學 食品科學與技術國家重點實驗室,江蘇 無錫 214122)

利用傅里葉變換紅外光譜法結合軟獨立模式分類法,在3000~2800cm-1和1760~1700cm-1波長范圍內,經Savitzky-Golay平滑、基線校正和標準矢量歸一化預處理,利用留一交互驗證法建立主成分分析模型,以識別率和拒絕率為指標對7個產地的糯米進行識別。結果顯示,在α=0.05顯著水平下,陜西省漢中市糯米的識別率為80%,湖北省武穴市和浙江省杭州市糯米的拒絕率分別為83%和97%,其余產地糯米的識別率和拒絕率均為100%,表明傅里葉變換紅外光譜法結合軟獨立模式分類法可成為快速識別糯米產地的有效方法。

糯米;傅里葉變換紅外光譜法;軟獨立模式分類法;產地識別

近年來,黃酒行業發展迅速,使得對釀造黃酒用主原料——糯米的需求增加。然而,在黃酒傳統產區,糯米產量相對不足,故需從其他產區購進糯米以滿足生產。不同產區的糯米在化學組成、物理特性以及微生物種群等方面存在差異,而且對應著不同的釀造工藝,所釀黃酒的品質也不盡相同[1-2],因此有必要對各產區的糯米進行快速、準確的識別,以確定最佳的黃酒釀造工藝。

傅里葉變換紅外光譜法(fourier transform infrared spectroscopy,FT-IR)是一種主要研究物質分子中代表性官能團振動及轉動光譜能夠在分子水平上表征研究對象特點并進行分析的方法[3-4]。由于FT-IR法具有制樣簡單、檢測快速且重復性好、對樣品沒有損壞、信息量大等優點,所以倍受研究人員青睞,在蔬菜農藥殘留快速檢測[5],小麥和紅豆的儲存年份鑒別[6]等食品領域已得到了廣泛的應用。然而要充分利用FT-IR法的信息,克服傳統光譜分析方法的局限性、復雜性和主觀性,還需要結合化學計量學方法,對光譜進行全面、深入的分析以獲得更有效的信息。目前,利用光譜法結合化學計量學對中藥材品質、農產品產地等的研究取得了良好效果[7-10]。本研究利用FT-IR光譜法對不同產地糯米的模式識別方法進行研究,以期為快速鑒別糯米產地提供一種有效方法。

1 材料與方法

1.1 材料

實驗用糯米來自湖北省孝感市、湖北省武穴市、浙江省杭州市、安徽省蕪湖市、安徽省蚌埠市、陜西省漢中市、泰國頂上7個不同地區共210個樣品,樣品按產地編號為HX、HW、ZH、AW、AB、SH、TD。所有樣品經食品粉碎機粉碎并過200目篩,再按四分法隨機稱取10g粉末,于60℃烘干,待水分平衡后用于紅外采集。

1.2 儀器與參數設置

Nicolet Nexus 470傅里葉變換紅外光譜儀 美國Thermo Electron公司。

主要儀器參數:最小分辨率:0.5cm-1;光源:EverG10TMMid-Infrared Source;附件:Smart Diffuse Reflection;檢測器:氘代硫酸三苷肽/KBr檢測器。采樣參數:環境濕度:40%;掃描范圍:4000~400cm-1;掃描次數:32次;分辨率:4cm-1。

1.3 漫反射紅外光譜法樣品制備

準確稱量糯米粉末與KBr粉末(過200目篩),按照1:9的質量比混勻,裝于樣品池,以同樣粉碎度的KBr粉末為背景進行紅外光譜采集,共計210張光譜,隨機選取175張光譜作為訓練集,其余光譜組成預測集。1.4 分析方法

模式識別,又稱作模式分類,是對表征事物或現象各種形式的(數值的、文字的和邏輯關系的)信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是一種將樣本進行聚類的過程,是數學、信息科學和計算機科學的綜合利用[11]。目前所采用的方法主要有因子分析、判別分析(如線性學習機)、K最近鄰法、支持向量機、軟獨立模式分類法(soft independent modeling of class analogy,SIMCA)、神經網絡、聚類分析及最小生成樹等[12],本研究選用SIMCA進行分析。

SIMCA是一種有監督的模式識別方法,其識別思想是對訓練集中每一類已知樣本分別進行主成分分析(principal component analysis,PCA)并建立數學模型,然后將未知樣品與已建立的模型進行擬合,確定未知樣品屬于哪一類或不屬于任何一類。SIMCA包括兩個主要步驟:建立每一類樣本的PCA回歸模型;利用模型對未知樣本進行擬合,確定其分類[12]。

PCA是SIMCA分析的核心,PCA能夠把多維空間數據復雜的相互關系向低維空間進行投影得到簡化,通過降維將有用的信息整理到幾個主成分之中并剔除噪音、誤差等無用信息,另外,主成分之間相互正交,能夠克服原變量多重相關性造成的信息重疊,有助于最大限度地提取有用的信息,建立優秀的數學模型[11,13]。

在數據分析時,PCA將光譜矩陣Am×p分解成式子(1)中的Tm×f和Pf×p兩個較小矩陣的外積與殘差矩陣E的和[3]:

式中:Am×p為光譜矩陣;Tm×f為得分矩陣;Pf×p為載荷矩陣;E為“殘差”,維數與Am×p相同;m為樣品數目,p為光譜變量數目,f為主成分數目。PCA分析中得分即是主成分矩陣(新變量),載荷則是主成分與光譜矩陣的相關系數矩陣,二矩陣的外積正好得到與光譜矩陣相同的維數,再加上殘差矩陣E 就能還原光譜矩陣。PCA 分析時采用的是非線性迭代偏最小二乘算法(nonlinear iterative partial least squares,NIPALS)。

在PCA分析基礎上建立SIMCA模型后,對未知樣品進行預測,利用識別率和拒絕率考察糯米不同產地的預測效果,其中識別率即是指被考察未知樣品落在正確類模型區域內的比率,見式(2),而拒絕率是指被考察類模型對其他不屬于該類的未知樣品的拒絕程度,即不屬于該類的樣品落在該類模型區域外的幾率,見式(3)[14]。本研究的所有數據分析均基于Unscrambler 9.7的軟件平臺。

2 結果與分析

175個樣品用于訓練,建立數學模型,35個樣品用于預測。不同研究對象的數據具有不同特點,為得到良好的判別模型和預測效果需要對原始的光譜數據進行一系列必要的處理,如特征波長的選擇、數據預處理等。

2.1 特征波長的選擇分析

通過對光譜的初步分析,去除低波數不穩定信息峰和水峰后,得到3000~500cm-1的紅外光譜圖,如圖1所示。

圖1 不同產地糯米的紅外光譜Fig.1 FT-IR spectra of glutinous rice from different origins

從圖1可知,研究對象主要含淀粉、蛋白質和脂肪類物質,特征吸收集中在3000~2800cm-1和1800~1000cm-1兩段波長范圍,吸光度集中在0.3~0.7之間,在光譜學的線性分析范圍內,說明樣品粉末與KBr稀釋比例適中。對特征吸收范圍的數據進行矩陣分析見圖2。

圖2 糯米的吸光度矩陣分布Fig.2 Matrix plot for the absorbance of glutinous rice

吸光度矩陣分布圖顯示了不同產地糯米在特征吸收波段內的吸光度分布,表明不同產地的糯米在特征吸收波段內存在一定差異,結合圖1、2,分別選取3000~2800、1760~1700、1670~1150cm-1三個范圍的數據進行PCA分析,結果表明3000~2800cm-1+1760~1700cm-1的效果較好,因此選用3000~2800cm-1+1760~1700cm-1區間的數據進行建模。

2.2 數據的預處理

利用漫反射紅外光譜法采集到的原始數據不僅包括樣品的信息,還包括各種噪音,如儀器高頻噪音、基線漂移和樣品粒度不均勻導致光散射等干擾。為了盡量消除干擾信息的影響,在分析之前都要對光譜數據進行預處理,主要方法有平滑、基線校正、標準矢量歸一化(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correct,MSC)[15]和求導等手段。

本研究采用窗口移動平均法、窗口移動多項式最小二乘擬合法(Savitzky-Golay多項式法)、中位數法和高斯濾波器平滑法分別對光譜數據進行平滑處理,比較發現Savitzky-Golay多項式法的9點平滑效果最好;利用Baseline offset方法對光譜數據進行基線校正。

表1 不同數據處理方法PCA的模型間距Table 1 PCA model distance based on different spectral pre-treatments

經平滑和基線校正后的數據分別進行SNV、MSC、一階求導和二階求導處理,建立模型,以浙江省杭州市的糯米(ZH)為參照,得到如表1的模型間距。

從表1可看出,經過不同的處理后ZH與其他6個產地糯米的模型間距有較大差異,在SIMCA分析中不同類的模型間相對差值要大于3,兩類模型才具備顯著的差異性,具備良好的預測能力。表1中四種處理方法效果最好的是SNV法,不僅ZH與其他產地糯米的模型間距大于3,而且任意不同的模型間距都大于3,而其他3中處理方法的模型間距都存在小于3的情況,故本研究最終采用SNV方法處理數據。

2.3 主成分數的確定和回歸模型的建立

不同產地糯米的光譜數據經特征波長選取和預處理后,利用NIPLAS算法和留一交互驗證方法進行PCA分析[16],得到見圖3,主成分數(PCs)與校正集均方根誤差(root mean square error of calibration,RMSEC)和交互驗證均方根誤差(root mean square error of cross validation,RMSECV)之間的關系。

圖3 PCA模型的均方根誤差Fig.3 Root mean square error of PCA model

從圖3可看出,當主成分數為3時均方根誤差已經很低,且自PC3以后均方根誤差值降低放緩,直至PC10,表明PC3以后的數據信息基本是誤差,因此可得最佳主成分數為3;另外圖中RMSECV與RMSEC差異很小,表明利用留一交互驗證方法對PCA進行驗證能得到穩定的模型。

圖4 全部糯米的PCA模型得分圖Fig.4 PCA model scores of all glutinous rice samples

不同產地糯米PC3的得分圖見圖4,可以明顯看出不同產地糯米在三維空間中分別具有相對獨立的分布空間,其中泰國頂上香糯米與其他6種糯米距離最遠,這與泰國糯米的產地密切相關,而其他6種產自國內的糯米距離較近;國內糯米中湖北孝感市、武穴市和安徽蚌埠市、蕪湖市分別處于同一省區,在得分圖上分布在相同“象限”,而陜西漢中市由于地處西北部,相對其他5個省市較遠,在圖中主要分布于得分圖的頂端,總的來說,不同產地糯米能良好區分,同時分布位置與地緣遠近呈一定正相關性趨勢。確定主成分后,對不同產地的7種糯米分別建立PCA模型,得到RMSEC和RMSECV見表2。

表2 PCA模型的RMSEC和RMSECVTable 2 RMSEC and RMSECV of PCA models

表2給出了建立不同產地糯米PCA模型的主成分數、RMSEC以及RMSECV。表4中所有糯米的PC3,均方根誤差值都小于2.0×10-5,可以看作是誤差,不計入主成分計算,同時每個主成分下的RMSECV比RMSEC的值略大,但差異都很小,充分說明PCA模型是優秀的模型,故選擇PC3為不同產地糯米建立SIMCA模型。

2.4 未知樣品的預測

表3 未知糯米樣品的識別率和拒絕率Table 3 Recognition rates and rejection rates of unknown glutinous rice samples

利用建立的SIMCA模型預測未知樣品,利用式2和式3計算得到α=0.05時的預測結果見表3。表中顯示除SH糯米的識別率為80%外,其余6產地糯米的識別率都達到100%;除HW和ZH的拒絕率分別為83%和97%外,其余5個產地糯米的拒絕率均達到100%。效果良好。

3 結 論

本研究利用FT-IR對7種糯米進行了產地識別,借助特征波長的有效選擇、Savitzky-Golay多項式平滑法、基線校正及SNV等方法對原始光譜進行了預處理,結合基于PCA分析的SIMCA模式識別方法對7種糯米分別建模,能有效識別所考察的糯米,僅SH一種糯米識別率為80%,HW、ZH兩種糯米的拒絕率分別為83%和97%,其余的識別率和拒絕率均達到100%,充分表明FT-IR結合SIMCA法識別糯米產地是可行的。與僅憑人工感官識別方法或化學組成分析方法進行判斷相比,本文提出的識別方法具有安全、穩定性好、準確率高、適用范圍廣和易實現自動化等優點,為快速識別糯米產地的方法研究提供了新的思路。

[1] 凌志勇. 重視原料研究和基地建設確保紹興黃酒品質[J]. 釀酒科技, 2009(6): 107-108.

[2] 汪建國. 試論我國黃酒風味的成因與發展[J]. 中國釀造, 2008(22): 7-12.

[3] 李慶波, 楊麗敏, 凌曉峰, 等. SIMCA法在中紅外癌癥檢測技術中的應用[J]. 光譜學與光譜分析, 2004, 24(4): 414-417.

[4] 陳玲, 黃嫣然, 李曉璽, 等. 紅外光譜在研究改性淀粉結晶結構中的應用[J]. 中國農業科學, 2007, 40(12): 2821-2826.

[5] 李文秀, 徐可欣, 汪臙, 等. 蔬菜農藥殘留檢測的紅外光譜法研究[J].光譜學與光譜分析, 2004, 24(10): 1202-1204..

[6] 劉飛, 李挺, 劉剛. 不同儲藏年份小麥和紅豆的紅外光譜研究[J]. 光散射學報, 2010, 22(2): 186-189.

[7] 劉沭華, 張學工, 周群, 等. 模式識別和紅外光譜法相結合鑒定中藥材產地[J]. 光譜學與光譜分析, 2005, 25(6): 878-881.

[8] 鄔文錦, 王紅武, 陳紹江, 等. 基于近紅外光譜的商品玉米品種快速鑒別方法[J]. 光譜學與光譜分析, 2010, 30(5): 1248-1251.

[9] De LUCA M, TEROUZI W, IOELE G, et al. Derivative FTIR spectroscopy for cluster analysis and classification of morocco olive oils[J]. Food Chemistry, 2011, 124: 1113-1118.

[10] 蘇謙, 鄔文錦, 王紅武, 等. 基于近紅外光譜和仿生模式識別玉米品種快速鑒別方法[J]. 光譜學與光譜分析, 2009, 29(9): 2413-2416.

[11] 杜一平, 潘鐵英, 張玉蘭. 化學計量學應用[M]. 北京: 化學工業出版社, 2008.

[12] 劉樹深, 易忠勝. 基礎化學計量學[M]. 北京: 科學出版社, 1999.

[13] 邵學廣, 蔡文生. 化學計量學[M]. 徐筱杰, 譯. 北京: 科學出版社, 2003.

[14] 張寧, 張德權, 李淑榮, 等. 近紅外光譜結合SIMCA法溯源羊肉產地的初步研究[J]. 農業工程學報, 2008, 24(12): 309-312.

[15] WOLD S. Data analysis for chemists, applications to QSAR and chemical product design david livingstone[J]. Chemometrics and Intelligent Laboratory Systems, 1997, 38(1): 101-102.

[16] DUDA R O. Pattern classifcation[M]. 2nd. NY USA: John Wiley and Sons, 2000.

Identification of Geographical Origin of Glutinous Rice by FT-IR Spectroscopy Combined with SIMCA Method

ZHANG Wen-hai1,2,JI Zhong-wei1,AISIKAER Ai-lati1,MAO Jian1,*

(1. School of Food Science and Technology, Jiangnan University, Wuxi 214122, China;
2. State Key Laboratory of Food Science and Technology, Jiangnan University, Wuxi 214122, China)

Fourier transform infrared spectroscopy (FT-IR) combined with soft independent modeling of class analogy (SIMCA) method was applied for tracing the geographical origin of glutinous rice. PCA (principal component analysis) models were built by the method of cross-validation based on such pre-treatments as nine-point Savitzky-Golay smoothing, baseline correction and Standard Normal Variate (SNV) normalization in the region of 3000-2800 cm-1and 1760-1700 cm-1. Identification of glutinous rice from seven origins was performed by identification rate and rejection rate. Under the significance level of α=0.05, the identification rates of predicted samples were 100% except for the glutinous rice (80%) from Hanzhong, Shaanxi province; the rejection rates were 100% except for glutinous rice from Wuxue, Hubei province (83%) and Hangzhou, Zhejiang province (97%). Thus, the combination of FT-IR and SIMCA is an effective and efficient strategy for identifying the geographic original of glutinous rice.

glutinous rice;FT-IR;SIMCA;geographical origin identification

TS207.3

A

1002-6630(2012)08-0225-04

2011-10-28

張文海(1987—),男,碩士研究生,研究方向為食品工程。E-mail:zwh860802@126.com

*通信作者:毛健(1970—),男,教授,博士,研究方向為食品生物技術。E-mali:biomao@263.com

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产精品久久久免费视频| 国产大片黄在线观看| 日本爱爱精品一区二区| 99久久亚洲精品影院| 午夜啪啪网| 亚洲成人精品| 国产精品欧美激情| 国产高清在线观看91精品| 国产理论最新国产精品视频| 2021国产精品自产拍在线| 97视频免费在线观看| 日本人妻一区二区三区不卡影院| 国禁国产you女视频网站| 国内精品视频区在线2021| 亚洲av片在线免费观看| 欧美一级高清视频在线播放| 亚洲免费福利视频| 91精品aⅴ无码中文字字幕蜜桃 | 欧洲成人在线观看| 国产91丝袜在线播放动漫| 在线观看免费黄色网址| 一级福利视频| 国产欧美综合在线观看第七页| 国产福利微拍精品一区二区| 亚洲狼网站狼狼鲁亚洲下载| 久久亚洲黄色视频| 制服丝袜一区| 凹凸精品免费精品视频| 尤物特级无码毛片免费| 亚洲AⅤ波多系列中文字幕| 亚洲综合婷婷激情| 中文字幕在线日本| 欧美日韩另类在线| 精品久久高清| 国产色伊人| 国产手机在线ΑⅤ片无码观看| 国产亚洲第一页| 国产人免费人成免费视频| 国产综合无码一区二区色蜜蜜| 国产欧美日韩免费| 99在线观看精品视频| 99精品欧美一区| 亚洲h视频在线| 高清免费毛片| 精品视频第一页| 久久一级电影| 国产黄色片在线看| 国产精品女人呻吟在线观看| 亚洲国产一成久久精品国产成人综合| 国产午夜福利在线小视频| 国产精品无码AⅤ在线观看播放| 波多野结衣在线se| 91精品国产一区| 婷婷综合色| 九九九精品成人免费视频7| 18禁黄无遮挡免费动漫网站| 日韩色图区| 成人午夜视频免费看欧美| 六月婷婷精品视频在线观看| 久久黄色一级片| 熟妇丰满人妻av无码区| 国产在线一二三区| 一区二区三区在线不卡免费| 精品午夜国产福利观看| 超碰91免费人妻| 亚洲成肉网| 国产日韩欧美在线视频免费观看| 国产产在线精品亚洲aavv| 在线a网站| 精品国产一区二区三区在线观看 | 美女一区二区在线观看| 国产精品自拍露脸视频| 成人在线观看不卡| 99无码中文字幕视频| 国产激情无码一区二区免费| 综合亚洲网| 亚洲无码精品在线播放| 韩日无码在线不卡| 成人福利视频网| 久久久久无码精品国产免费| 谁有在线观看日韩亚洲最新视频| 亚洲黄色片免费看|