錢麗麗,冷候喜,張愛武,宋雪健,曹冬梅,湯華成,張東杰*
1 (黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,黑龍江 大慶,163319)2(杜爾伯特伊利乳業(yè)有限責(zé)任公司,黑龍江 大慶,166200)3(杜爾伯特金山乳品有限責(zé)任公司,黑龍江 大慶,166200 )
基于Fisher判別法對(duì)黑龍江大米產(chǎn)地溯源
錢麗麗1,冷候喜2,3,張愛武1,宋雪健1,曹冬梅1,湯華成1,張東杰1*
1 (黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,黑龍江 大慶,163319)2(杜爾伯特伊利乳業(yè)有限責(zé)任公司,黑龍江 大慶,166200)3(杜爾伯特金山乳品有限責(zé)任公司,黑龍江 大慶,166200 )
為了探索大米產(chǎn)地鑒別可行性,維護(hù)市場(chǎng)秩序和消費(fèi)者的合法權(quán)益,該研究采用Fisher判別法(Fisher discriminant method,費(fèi)希爾判別法)進(jìn)行建模并結(jié)合近紅外光譜技術(shù),對(duì)2015年黑龍江5 個(gè)水稻主產(chǎn)區(qū)(五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江)的118份大米粉末樣品進(jìn)行近紅外光譜的掃描,光譜預(yù)處理方法為9點(diǎn)二階求導(dǎo)結(jié)合5點(diǎn)平滑,建模波長(zhǎng)為全波長(zhǎng)。對(duì)模型采用留一交叉驗(yàn)證和預(yù)測(cè)樣本集進(jìn)行驗(yàn)證,5 個(gè)地域的驗(yàn)證結(jié)果分別為94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。預(yù)測(cè)結(jié)果達(dá)到80%以上,初步認(rèn)定近紅外光譜指紋分析技術(shù)可用于黑龍江大米產(chǎn)地溯源。
大米;產(chǎn)地溯源;近紅外光譜;Fisher判別法
黑龍江省自然條件優(yōu)越,種植的水稻米粒通透,口感良好,受到廣大消費(fèi)者和廠商的青睞,尤以黑龍江地理標(biāo)志大米品質(zhì)更佳,市場(chǎng)需求量大且價(jià)格較普通大米高出3倍以上。正因?yàn)檫@一利益的驅(qū)使,不法商販將普通大米冒充地理標(biāo)志大米,破壞了企業(yè)和消費(fèi)者的利益,擾亂市場(chǎng)秩序。目前礦物元素指紋分析技術(shù)[1]、有機(jī)成分指紋分析技術(shù)[2]、近紅外光譜技術(shù)[3]等已被用于農(nóng)產(chǎn)品產(chǎn)地溯源的研究,但仍處于初級(jí)階段,前兩者具有判別結(jié)果準(zhǔn)確度高等優(yōu)點(diǎn),但存在著檢測(cè)周期長(zhǎng),成本高等缺點(diǎn),相比較而言近紅外技術(shù)在產(chǎn)地溯源的研究中有著快速、高效、無損等優(yōu)點(diǎn),近紅外光譜分析主要用于有機(jī)物質(zhì)定性和定量的一種分析技術(shù),易受到加工方式、貯藏時(shí)間和條件等影響,故在產(chǎn)地溯源研究中存在一定的局限性。Fisher判別法是先對(duì)樣本進(jìn)行方差分析,將樣本的種類區(qū)分出,然后依據(jù)方差分析的結(jié)果進(jìn)行線性判別分析,區(qū)分不同個(gè)體。Fisher線性識(shí)別作為一種分類方法已經(jīng)被成功的廣泛使用在食品、農(nóng)業(yè)等各個(gè)領(lǐng)域[4~7],同時(shí)將Fisher判別法與近紅外光譜結(jié)合在茶葉、葡萄酒的品種和產(chǎn)地的鑒別中已見報(bào)道。周健等[8]將不同品種的茶葉樣本作為試驗(yàn)樣本,對(duì)試驗(yàn)樣本進(jìn)行了近紅外光譜的采集,運(yùn)用主成分分析(PCA)篩選出8個(gè)主成分,結(jié)合Fisher判別法建立的品種判別模型對(duì)茶葉樣本進(jìn)行識(shí)別,識(shí)別準(zhǔn)確率為96.8%。劉巍等[9]以我國(guó)不同地域產(chǎn)的3 種葡萄酒為試驗(yàn)樣本,對(duì)試驗(yàn)樣本進(jìn)行近紅外光譜的掃描,采用Fisher判別法對(duì)試驗(yàn)樣本進(jìn)行產(chǎn)地溯源的鑒別,結(jié)果達(dá)到定性分析的要求。但應(yīng)用近紅外光譜結(jié)合Fisher判別法在大米產(chǎn)地溯源中的應(yīng)用還鮮有報(bào)道,本研究采用近紅外光譜技術(shù)結(jié)合Fisher判別方法建立黑龍江大米產(chǎn)地溯源模型,為近紅外光譜分析技術(shù)在黑龍江大米產(chǎn)地溯源的研究提供理論依據(jù)。
1.1 試驗(yàn)材料
為確保試驗(yàn)樣品真實(shí)性與代表性,試驗(yàn)樣品的采集選擇在水稻田中直接代表性取樣,采樣時(shí)間選擇在水稻成熟期后、農(nóng)戶收割水稻前完成,每個(gè)采樣點(diǎn)的每個(gè)品種采集2 kg,記錄采樣地點(diǎn)、品種等信息。地點(diǎn)選擇2015年黑龍江5 個(gè)水稻主產(chǎn)區(qū)包括五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江,分別選擇其主產(chǎn)縣、主產(chǎn)鄉(xiāng)(鎮(zhèn)或農(nóng)場(chǎng))、主產(chǎn)村(屯)的大面積種植地塊,采樣品種選擇5 個(gè)主產(chǎn)區(qū)的主栽品種。所有試驗(yàn)品種均為粳米,共118 份試驗(yàn)樣品,如表1所示。將水稻樣品經(jīng)過晾曬、挑選、礱谷和碾米等統(tǒng)一加工過程,超微粉碎成米粉,過100目篩,待測(cè)。

表1 樣品信息來源表
1.2 試驗(yàn)儀器
FC2K礱谷機(jī),日本大竹制作所;VP-32實(shí)驗(yàn)?zāi)朊讬C(jī),日本山本公司;FW100高速萬能粉碎機(jī), 天津泰斯特儀器有限公司;DA7200型固定光柵連續(xù)光譜近紅外分析儀,瑞典波通儀器公司
1.3 材料的選取
試驗(yàn)材料的選擇參照表1。隨機(jī)選擇全部樣本量的2/3作為建模樣本用于建立模型,1/3作為預(yù)測(cè)樣本集用于驗(yàn)證模型。各地用于建模和預(yù)測(cè)的樣本數(shù)見表2。

表2 建模與預(yù)測(cè)樣品表
1.4 實(shí)驗(yàn)方法
采用Unscrambler 9.7光譜分析軟件對(duì)進(jìn)行光譜掃描,得到近紅外原始光譜見圖1。

圖1 大米樣品近紅外原始光譜圖Fig.1 Near infrared original spectra of rice samples
將原始光譜轉(zhuǎn)化為TCAMP-DX格式,采用Unscrambler 9.7光譜分析軟件選擇原始光譜的預(yù)處理方法與建模波長(zhǎng)范圍;然后將樣本光譜除去水分峰,采用主成分分析給數(shù)據(jù)降維,篩選Fisher自變量;用SPSS 18.0軟件分析數(shù)據(jù),建立Fisher判別模型;用建模樣本集建立Fisher判別模型,用預(yù)測(cè)樣本集對(duì)模型進(jìn)行驗(yàn)證,計(jì)算模型的產(chǎn)地判別正確率。
2.1 光譜預(yù)處理方法的選擇對(duì)建模效果的影響
試驗(yàn)選擇MSC、SNV、平滑、求導(dǎo)4 種常用的光譜預(yù)處理方法,分別對(duì)全部樣本的近紅外原始光譜進(jìn)行預(yù)處理后,將樣本近紅外光譜圖中的水分峰扣除,消除水分對(duì)建模結(jié)果的影響。對(duì)表2中的建模樣本集在全波長(zhǎng)范圍采用Fisher判別法建立判別模型,用預(yù)測(cè)樣本集對(duì)模型的正確度進(jìn)行驗(yàn)證,選擇高預(yù)測(cè)正確率對(duì)應(yīng)的預(yù)處理方式為本試驗(yàn)的近紅外原始光譜預(yù)處理方式。對(duì)于平滑和求導(dǎo)預(yù)處理來說,選擇的點(diǎn)數(shù)過少對(duì)光譜預(yù)處理的效果并不明顯,過多會(huì)造成光譜的失真。故試驗(yàn)選擇范圍為5點(diǎn)、7點(diǎn)、9點(diǎn)、11點(diǎn),即對(duì)5點(diǎn)、7點(diǎn)、9點(diǎn)、11點(diǎn)進(jìn)行平滑處理、一階求導(dǎo)處理和二階求導(dǎo)處理。
不同預(yù)處理建模的效果見表3。將預(yù)處理后建模預(yù)測(cè)的結(jié)果與原始光譜建模預(yù)測(cè)的結(jié)果對(duì)比,發(fā)現(xiàn)原始光譜與經(jīng)過不同預(yù)處理后的近紅外光譜建立的Fisher判別模型對(duì)預(yù)測(cè)樣本集的識(shí)別率均為100%,但是預(yù)測(cè)正確率大不相同。經(jīng)過一階和二階求導(dǎo)預(yù)處理建模的預(yù)測(cè)正確率比經(jīng)過原始光譜、MSC、SNV、平滑預(yù)處理建模的預(yù)測(cè)正確率高。說明近紅外原始光譜經(jīng)過預(yù)處理后,是可以提高模型對(duì)預(yù)測(cè)集的正確率。經(jīng)過9點(diǎn)二階求導(dǎo)預(yù)處理后建立模型的預(yù)測(cè)正確率最高,5 個(gè)地域的預(yù)測(cè)正確率分別為75%、75%、75%、87.5%、75%。與蘇學(xué)素等[10]在對(duì)臍橙產(chǎn)地溯源研究中選出的最優(yōu)對(duì)光譜預(yù)處理的方法基本一致。
試驗(yàn)選擇在9點(diǎn)二階求導(dǎo)的基礎(chǔ)上,分別結(jié)合MSC、SNV、5點(diǎn)平滑、7點(diǎn)平滑、9點(diǎn)平滑、11點(diǎn)平滑對(duì)樣本的近紅外原始光譜進(jìn)行預(yù)處理后,用表2中的建模樣本集在全波長(zhǎng)范圍采用Fisher判別法建立判別模型,用預(yù)測(cè)樣本集對(duì)模型的正確度進(jìn)行驗(yàn)證,并選擇高預(yù)測(cè)正確率對(duì)應(yīng)的預(yù)處理方式為本試驗(yàn)的近紅外原始光譜預(yù)處理方式,驗(yàn)證結(jié)果見表4,可以看出2種預(yù)處理后的近紅外光譜建立的Fisher判別模型對(duì)預(yù)測(cè)樣本集的識(shí)別率均為100%,但是預(yù)測(cè)正確率大不相同,但總體上比表3中的預(yù)測(cè)正確率高。說明本試驗(yàn)中將2 種預(yù)處理方法結(jié)合可以提高模型的正確度比一種的效果好。由表4可以看出經(jīng)過9點(diǎn)二階求導(dǎo)和5點(diǎn)平滑預(yù)處理后建立模型的預(yù)測(cè)正確率最高,所以本研究最終選擇9點(diǎn)二階求導(dǎo)和5點(diǎn)平滑對(duì)近紅外原始光譜進(jìn)行預(yù)處理,預(yù)處理后的近紅外光譜圖如圖2。與王亞鴿[11]在對(duì)枸杞產(chǎn)地鑒別及品質(zhì)快速檢測(cè)研究中采用對(duì)全光譜進(jìn)行SNV+S-G D(2st,3th,5)預(yù)處理的方法基本一致。

表3 預(yù)處理對(duì)建模效果的影響
以上樣品識(shí)別率均為100%。

表4 預(yù)處理對(duì)建模效果的影響
以上樣品模型識(shí)別率均為100%

圖2 預(yù)處理后的大米近紅外光譜圖Fig.2 Rice near infrared spectra after pretreatment
2.2 波長(zhǎng)范圍的選擇對(duì)建模效果的影響
譜區(qū)范圍的選擇是建模過程中一個(gè)重要環(huán)節(jié),近些年來,對(duì)建模波長(zhǎng)范圍的選擇并無統(tǒng)一標(biāo)準(zhǔn),學(xué)者的研究還處在規(guī)律的發(fā)現(xiàn)階段,試驗(yàn)根據(jù)一些學(xué)者[12~17]的研究方式進(jìn)行波長(zhǎng)范圍的選擇對(duì)建模效果進(jìn)行研究。對(duì)所有樣本進(jìn)行9點(diǎn)二階求導(dǎo)結(jié)合5點(diǎn)平滑預(yù)處理后,對(duì)全光譜范圍進(jìn)行分段。對(duì)建模樣本集采用Fisher判別法在全波長(zhǎng)范圍和分段光譜范圍分別建立Fisher判別模型,用預(yù)測(cè)樣本集對(duì)Fisher判別模型的正確度進(jìn)行驗(yàn)證,選擇高預(yù)測(cè)正確率對(duì)應(yīng)的波長(zhǎng)范圍為本試驗(yàn)建立的Fisher判別模型選擇的波長(zhǎng)范圍,不同波長(zhǎng)范圍建立Fisher判別模型的識(shí)別率和預(yù)測(cè)正確率見表5。比較各個(gè)波段的樣本建模的結(jié)果,發(fā)現(xiàn)不同波段建立Fisher判別模型的識(shí)別率均為100%,但是預(yù)測(cè)正確率各不相同,但均為50%以上,其中分段波長(zhǎng)建立模型的預(yù)測(cè)正確率最高的為1 150~1 250 nm波長(zhǎng)。全波長(zhǎng)建立模型的預(yù)測(cè)正確率總體比1 150~1 250 nm波段建立模型的預(yù)測(cè)正確率高,所以本試驗(yàn)選擇全波長(zhǎng)范圍950~1 650 nm進(jìn)行Fisher判別模型的建立。試驗(yàn)與NIU等[12]采用近紅外光譜技術(shù)在800~2 500 nm的全波長(zhǎng)范圍內(nèi)對(duì)來自不同酒廠的紹興黃酒進(jìn)行判別和周子立等[13]在全波長(zhǎng)為325~1 075 nm處利用近紅外光譜技術(shù)進(jìn)行大米品種鑒別在波長(zhǎng)范圍的選取上存在一定的交集;NILSEN等[14]應(yīng)用近紅外反射儀器對(duì)傳送帶上的絞細(xì)牛肉成分進(jìn)行在線檢測(cè)所選取的全波長(zhǎng)為950~1 700 nm試驗(yàn)效果較好;與趙海燕等[15]利用近紅外光譜技術(shù)在全波長(zhǎng)為950~1 650 nm處對(duì)不同地域來源的小麥進(jìn)行地理標(biāo)志性識(shí)別效果好與分段掃描,且試驗(yàn)結(jié)果與本試驗(yàn)相一致。選擇全波長(zhǎng)要優(yōu)于分段波長(zhǎng)的原因可能是由于全波長(zhǎng)涵蓋的指紋信息更充分能較為全面的表征樣品特征,所以全波長(zhǎng)范圍的判別率要高于分段波長(zhǎng)。

表5 不同波長(zhǎng)范圍對(duì)建模效果的影響
注:以上樣品模型識(shí)別率均為100%。
2.3 模型的驗(yàn)證
為了全面的檢測(cè)模型的預(yù)測(cè)能力,本研究選擇了留一交叉驗(yàn)證法對(duì)建立的模型進(jìn)行驗(yàn)證,即從78 個(gè)樣本中隨機(jī)抽取1 個(gè)進(jìn)行判別,用剩下的77 個(gè)樣本建模型后對(duì)其產(chǎn)地進(jìn)行鑒別,鑒別結(jié)果見表6。結(jié)果表明,5 個(gè)地域的留一交叉驗(yàn)證和預(yù)測(cè)集校驗(yàn)對(duì)全光譜建立模型的檢測(cè)結(jié)果分別為94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。預(yù)測(cè)結(jié)果均為80%以上,均達(dá)到了定性判別的要求,初步說明Fisher判別可以用于黑龍江不同產(chǎn)地大米溯源。

表6 Fisher判別函數(shù)鑒別5個(gè)地域大米樣品的結(jié)果
本試驗(yàn)選擇五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江的118 份大米粉末樣品進(jìn)行近紅外光譜的掃描,得到原始近紅外光譜圖。確定近紅外原始光譜圖的預(yù)處理方法為9點(diǎn)二階求導(dǎo)結(jié)合5點(diǎn)平滑,最佳波長(zhǎng)范圍為全波長(zhǎng)。在建立模型前對(duì)預(yù)處理后的近紅外光譜進(jìn)行主成分分析證明本試驗(yàn)可以采用Fisher判別法進(jìn)行產(chǎn)地溯源判別模型。對(duì)模型的Fisher自變量進(jìn)行選擇,對(duì)建模樣本集采用Fisher判別法進(jìn)行產(chǎn)地溯源判別模型后,采用建模樣本集采用留一交叉驗(yàn)證和預(yù)測(cè)樣本集的驗(yàn)證,模型識(shí)別率為100%,5個(gè)地域的驗(yàn)證結(jié)果正確率均在80%以上,達(dá)到定性分析的要求,說明近紅外光譜分析技術(shù)可用于黑龍江大米產(chǎn)地判別,為地理標(biāo)志大米的產(chǎn)地保護(hù)具有重要的理論價(jià)值。為研究不同產(chǎn)地及品種之間的差異性對(duì)建模效果的影響,已在部分地區(qū)建立了試驗(yàn)田,對(duì)影響模型穩(wěn)定性的相關(guān)因素展開系統(tǒng)研究是下一步的研究主要方向。
[1] GONZALVEZ A, LLORENS A, CERVERA M L, et al. Elemental fingerprint of wines from the protected designation of origin valencia[J]. Food Chemistry, 2009, 112(1): 26-34.
[2] HERBERGER K, CSOMOS E, SIMON-SARKADI L. Principal component and linear discriminant analyses of free amino acids and biogenic amines in hungarian wines[J]. Journal of Agricultural and Food Chemistry, 2003, 51(27): 8 055-8 060.
[3] 馬冬紅,王錫昌,劉利平,等. 近紅外光譜技術(shù)在食品產(chǎn)地溯源中的研究進(jìn)展[J]. 光譜學(xué)與光譜分析,2011,131(14):877-881.
[4] QU Y, ADAM B L, THORNQUIST M, et al. Data reduction using a discrete wavelet transform in discriminant analysis of very high dimensionality data[J]. Biometrics, 2003, 59(1):143-51.
[5] BILLINGS S A, LEE K L. Nonlinear fisherdiscriminant analysis using a minimum squared error cost function and the orthogonal least squares algorithm.[J]. Neural Networks the Official Journal of the International Neural Network Society, 2002, 15(2):263-270.
[6] Cawley G C, Talbot N L C. Efficient leave-one-out cross-validation of kernel fisher discriminant classifiers[J]. Pattern Recognition, 2003, 36(11):2 585-2 592.
[7] GESTEL T, SUYKENS J, LANCKRIET G, et al. Bayesian framework for least-squares support vector machine classifiers, gaussian processes, and kernel fisher discriminant analysis[J]. Neural Computation, 2002, 14(5):1 115-1 147.
[8] 周健,成浩,葉陽,等. 基于近紅外的Fisher分類法識(shí)別茶葉原料品種的研究[J]. 光學(xué)學(xué)報(bào),2009,29(1):1 117-1 121.
[9] 劉巍,李德美,劉國(guó)杰,等. 利用近紅外光譜技術(shù)對(duì)葡萄酒原產(chǎn)地進(jìn)行Fisher判別[J]. 釀酒科技,2010(7):65-69.
[10] 蘇學(xué)素, 張曉焱, 焦必寧,等. 基于近紅外光譜的臍橙產(chǎn)地溯源研究[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012(15):240-245.
[11] 王亞鴿. 基于近紅外光譜技術(shù)的枸杞產(chǎn)地鑒別及品質(zhì)快速檢測(cè)研究[D].楊凌:西北農(nóng)林科技大學(xué), 2015.
[12] NIU X Y, YU H Y, YING Y B. YTransactions of the ASABE, 2008, 51(4): 1 371.
[13] 周子立, 張瑜, 何勇,等. 基于近紅外光譜技術(shù)的大米品種快速鑒別方法[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2009, 25(8):131-135.
[14] HILDRUM K I, NILSEN B N, WESTAD F, et al. In-line analysis of ground beef using a diode arrag near infrared instrument on a conveyor belt[J].Journal of Near Infrared Spectroscopy, 2004,12:367.
[15] 趙海燕, 郭波莉, 魏益民,等. 近紅外光譜對(duì)小麥產(chǎn)地來源的判別分析[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2011, 44(7):1 451-1 456.
[16] 段焰青, 陶鷹, 者為,等. 近紅外光譜分析技術(shù)在煙葉產(chǎn)地鑒別中的應(yīng)用[J]. 云南大學(xué)學(xué)報(bào):自然科學(xué)版, 2011, 33(1):77-82.
[17] 陳全勝, 趙杰文, 張海東,等. SIMCA模式識(shí)別方法在近紅外光譜識(shí)別茶葉中的應(yīng)用[J]. 食品科學(xué), 2006, 27(4):186-189.
Study on the origins of Heilongjiang rice based on Fisher discriminate method
QIAN Li-li1,LENG Hou-xi2,3,ZHANG Ai-wu1,SONG Xue-jian1,CAO Dong-mei1,TANG Hua-cheng1,ZHANG Dong-jie1*
1(Heilongjiang Bayi Agricultural University, College of Food Science,Daqing 163319,China)2(Duerbote Yili Dairy Limited Liability Company,Daqing 166200, China)3(Durbate Jinshan Dairy Limited Liability Company,Daqing 166200, China)
In order to explore the feasibility of identification of the origins of Heiloingjiang rice to protect consumer’s rights, food safety issue and legitimate issues, the study used Fisher discrimination method combined with near infrared spectroscopy to build a model. There were 118 rice powder samples from different varieties in five areas (Wuchang、Jiamusi、Qiqihaer、 Shuangyashan) were scanned by near infrared spectroscopy in 2015. Pretreatment method of spectroscopy data is based on “9-point derivative combined with 5-point smoothing”. The wavelength is the whole spectrum. The cross validation and the predicting samples were used to verified the accuracy of the model. The verification results of five areas were 94.4%, 94.4%, 91.7%, 91.7%, 94.4% and 87.5%, 87.5%, 87.5%, 100%, 100%. Predicting accuracy was more than 80%, and Fisher discrimination method was primarily assigned to use in heilongjiang rice origin trace identification.
rice; roots; near infrared spectrum; Fisher discriminant method
10.13995/j.cnki.11-1802/ts.201705033
博士,副教授(張東杰教授為通訊作者,E-mail:byndzdj@126.com)。
黑龍江省教育廳科學(xué)技術(shù)研究項(xiàng)目(12541576);黑龍江省墾區(qū)科研項(xiàng)目(HKN125B-13-02);黑龍江省高等學(xué)??萍紕?chuàng)新團(tuán)隊(duì)建設(shè)計(jì)劃項(xiàng)目(2014TD006);黑龍江省應(yīng)用技術(shù)研究與開發(fā)計(jì)劃項(xiàng)目(GA14B104)
2016-07-07,改回日期:2016-08-29