李跑,吳紅艷,李尚科,楊清華,蔣立文,劉霞,杜國榮
(1.湖南農業大學食品科技學院,湖南長沙410128;2.食品科學與生物技術湖南省重點實驗室,湖南長沙410128;3.上海煙草集團有限責任公司技術中心北京工作站,北京101121)
大米是世界上大部分人口的主食,不同地方生產不同品種的大米,且同一品種不同品牌大米之間也存在差異性,因此不同產地以及不同品牌大米的售價也不相同。此外,人們日常食用的大米是稻谷經篩選、精選、礱谷、碾米等工序后加工制成的精米。大米的主要成分是淀粉,同時含有豐富的蛋白質,氨基酸,還含有少量的粗纖維、脂肪、鈣、磷、維生素等營養成分[1-2]。目前常用的大米檢測及鑒別方法為感官分析法和化學分析法。這些方法除了考察大米的形狀、氣味、色澤等外部特征,還對大米的直鏈淀粉含量、脂肪的含量、蛋白質的含量等內部品質進行分析。比如淀粉的測定方法主要有酸水解法、酶水解法、旋光法等;蛋白質的測定方法多采用蛋白質分析儀器或者化學法。但是這些方法存在耗時久、破壞樣品等問題,無法實現對大米的快速無損檢測。因此開發適合于快速無損檢測大米的方法,可以有效解決大米溯源以及摻偽摻假問題。
近紅外光譜技術是介于可見光譜區和中紅外光譜區之間的電磁波的技術。近紅外光譜主要是對樣品中的含氫基團(C-H、O-H、N-H等)振動的倍頻、合頻以及差頻的疊加吸收,包含了樣品組成狀態、分子結構等信息。由于近紅外光譜存在譜帶較寬,信噪比低,吸收峰重疊嚴重等弱點,分析時若直接采用原始數據會導致后期建立的模型穩定性差、準確度低,從而影響分析結果,因此需要結合化學計量學方法以提高結果的準確性[3-6]。近紅外光譜技術具有成本低、速度快、效率高、檢測方便、測試重現性好等優點,近年來快速發展成為了一種新興的分析與研究手段,并在食品、農業、醫藥等領域得到了廣泛的應用。國內外有許多學者利用近紅外光譜技術實現對不同品牌食品的鑒別,如制動液品牌[7]、瓜類品種[8]、玉米品種[9]、咖啡品種[10]、小麥品種[11]等。近紅外光譜技術在稻米品質檢測中也得到了廣泛應用,如稻米蛋白質含量的測定[12]、脂肪測定[13]、氨基酸含量測定[14]以及淀粉測定[15]。
然而,現階段大多數研究集中在比較不同大米中蛋白質或淀粉含量的差異以實現大米品種或產地的鑒別,對于近紅外光譜技術結合化學計量學方法用于大米品種及產地方面鑒別研究相對較少。夏立婭等[16]利用近紅外光譜和模式識別技術建立了大米產地的快速鑒別方法,結果表明通過篩選得到特征波段,聚類和判別分析都可實現響水大米和非響水大米的鑒別。周子立等[17]組合小波變換、主成分分析(principal component analysis,PCA)以及反向傳播(back propagation,BP)神經網絡的模式鑒別方法,建立了一種基于可見-近紅外光譜技術快速、無損鑒別大米品種的新方法。然而這些方法大多需要采用較為繁瑣的化學計量方法,導致近紅外光譜技術在實際分析時得不到廣泛應用。因此,本試驗基于近紅外光譜技術和化學計量學方法,提出了一種簡單的可以實現不同產地以及不同品牌大米快速無損鑒別的方法。利用連續小波變換技術(continuous wavelet transform,CWT)對大米的原始光譜進行預處理,消除背景干擾和基線漂移,提高信噪比,加強光譜的有效信息,并結合主成分分析對大米品種及產地進行鑒別。
收集了來自五家不同超市的不同種類大米。如表1所示,A-K為不同品牌的樣品,分別為東北糙米、湖南糙米、東北米、秈米、芙蓉米、泰香米、晚米、貢米、京生緣香米、柬埔寨香米和軟香米,a-e為不同超市名稱。其中01~05分別為5個平行樣品,命名見表1。

表1 樣品命名表Table 1 Sample name list
QuasIR4000近紅外光譜儀:美國GalaxyScientific。
1.3.1 光譜的采集
采用積分球漫反射模式采集全部茶葉光譜,本次試驗在室溫下操作,由于大米為固體,所以將大米用直徑65 nm、高度為14 nm的圓形透明容器盛放,裝滿1個容器作為1個試驗樣本,光譜儀經20 min預熱并進行白板校準后開始測試。波數范圍為12 000 cm-1~4 000 cm-1,最小間隔為4 cm-1,共采集2 098個數據點,一共分析了11種大米,共計115個樣品。
1.3.2 光譜預處理與聚類分析
光譜預處理與聚類分析由MATLAB R2010a(The MathWorks,Natick,USA)軟件實現。由于儀器和環境的干擾會出現噪聲、基線漂移,為提高信噪比,篩選出有效數據的范圍。利用CWT技術消除背景噪聲的干擾,提高結果的穩定性與準確性。PCA可以將數據從高維向低維投射,并在低維空間最大程度上保持原始數據的信息。因此,利用PCA方法對11種大米樣品進行聚類分析。
2.1.1 東北大米的光譜特征
CWT技術處理前后東北大米的光譜見圖1。

圖1 CWT技術處理前后東北大米和秈米的光譜圖Fig.1 Spectra of northeastern and glutinous rice before and after CWT treatment
圖1(a)為東北糙米和不同超市東北大米的近紅外原始光譜圖,從圖中可以看出譜線的大致趨勢一致,大部分的譜線在相似波段具有明顯的吸收峰,這說明4個樣品的主要成分相近。但在6 900 cm-1和5 100 cm-1波數處的波峰存在差異,可明顯觀察到樣品被分為兩組。
由于信號中存在基線漂移和背景的干擾,因此需通過有效的預處理,消除基線干擾,提高信噪比,加強光譜的有效信息。圖1(b)為東北糙米和不同超市東北大米信號經過CWT預處理后的光譜圖,從圖中可以看出背景干擾被有效扣除,基線校正,有明顯的特征譜峰,表明CWT技術是消除背景干擾和基線漂移的良好工具。在8 550 cm-1波數處光譜存在明顯差異,此波數對應的振動方式是C-H二級倍頻伸縮振動基頻;在7 450 cm-1波數處的差異對應于C-H一級倍頻伸縮振動基頻與C-H變形振動基頻組合頻;在7 150cm-1波數處東北糙米的吸光度值明顯大于其他三種大米,該波數屬于C-H一級倍頻伸縮振動基頻和C-H變形振動基頻。同時我們日常食用的精米是糙米經過拋光去除米粒表面的糠粉,使米粒表面的淀粉膠質化,呈現一定的光亮,糙米比精米富含更多的米胚蛋白和米糠多糖,多糖中含有較多的羥基,羥基吸收峰的存在也會導致7 150 cm-1處波峰存在明顯差異;6 190 cm-1波峰處光譜的差異對應于C-H一級倍頻伸縮振動基頻,對應的結構是=CH2;而在波段5 530 cm-1~5 470 cm-1之間光譜的差異對應于O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻;在4 325 cm-1波數處和4 255 cm-1波數處,只有東北糙米存在波峰,分別屬于C-H伸縮振動基頻與C-H變形振動基頻組合頻和C-H二級倍頻伸縮振動基頻,可能原因是東北糙米含較多的淀粉和纖維素。
2.1.2 秈米的光譜特征
CWT技術處理前后秈米的光譜圖見圖2。
圖2(a)為不同超市秈米的原始光譜圖,從圖中可明顯觀察到在7 000 cm-1波數處4類樣品被明顯的分為兩組,屬于O-H一級倍頻伸縮振動基頻,這說明這兩組的CONH2的含量較高,而在波段5 500 cm-1~5 200 cm-1間,振動方式為C=O二級倍頻伸縮振動基頻、O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻、C=O一級倍頻伸縮振動基頻;在4 600 cm-1波數屬于酰胺Ⅰ一級倍頻和酰胺Ⅱ的組合頻。


圖2 CWT技術處理前后東北大米和秈米的光譜圖Fig.2 Spectra of northeastern and glutinous rice before and after CWT treatment
經過CWT技術消除背景干擾,得到圖2(b)。可以發現在10 900 cm-1和7 300 cm-1波數處光譜存在明顯差異,對應于C-H三級倍頻伸縮振動基頻和C-H一級倍頻伸縮振動基頻與C-H變形振動基頻的組合頻,對應的結構為CH3;而在7 150 cm-1波數處光譜的差異對應于C-H一級倍頻伸縮振動基頻與C-H變形振動基頻組合頻,對應的結構是CH2;在5 500 cm-1波數處光譜的差異對應于O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻;在5 320 cm-1波數處光譜的差異對應于O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻、C=O二級倍頻伸縮振動基頻;在5 050 cm-1和4 850 cm-1波數處的差異對應于N-H不對稱伸縮振動基頻與酰胺Ⅱ組合頻、N-H對稱伸縮振動基頻和酰胺Ⅱ組合頻,可能原因是大米蛋白質含量的不同;在波段4 400 cm-1~4 500 cm-1之間存在較大波峰,振動方式為O-H伸縮振動基頻與O-H變形振動基頻組合頻、N-H伸縮振動基頻與NH3變形振動基頻組合頻;在4 150 cm-1波數處光譜的差異屬于C-H伸縮振動基頻與C-C伸縮振動基頻組合頻。
2.1.3 香米的光譜特征
同樣為了對不同種類和不同產地的香米進行鑒別,做了近紅外光譜圖。樣品包括國外香米和國內香米,分別為泰香米、柬埔寨香米、京升緣香米和軟香米。CWT技術預處理前后的香米光譜見圖3。

圖3 CWT技術處理前后香米和湖南本地米的光譜圖Fig.3 Spectra of fragrant and Hunan local rice before and after CWT treatment
圖3(a)為香米的原始光譜圖,在7 100 cm-1波數處開始分為兩組,振動方式為O-H一級倍頻伸縮振動基頻;同時在5 975 cm-1波數處和波段5 500 cm-1~5 350 cm-1之間光譜存在明顯差異,對應于C-H一級倍頻伸縮振動基頻、O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻和C=O二級倍頻伸縮振動基頻。
圖3(b)是CWT后的光譜圖,在7 150 cm-1波數處光譜的差異對應于C-H一級倍頻伸縮振動基頻與C-H變形振動基頻組合頻,對應的結構是CH2;在5 350 cm-1波數處光譜的差異對應于O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻;在5 050 cm-1和4 900 cm-1波數處光譜的差異對應于N-H不對稱伸縮振動頻與酰胺Ⅱ組合頻和C=O二級倍頻伸縮振動基頻;在 4100、4440cm-1波數處和 4 850 cm-1~4 900 cm-1波段之間光譜的差異與C-H伸縮振動與C-C伸縮振動組合頻、O-H伸縮振動與C-C伸縮振動組合頻、NH不對稱伸縮振動與酰胺Ⅱ組合頻和N-H對稱伸縮振動與酰胺Ⅱ組合頻有關,這些差異可能是源自于直鏈淀粉含量和蛋白質含量不同。而在5 468 cm-1波數處光譜的差異對應于O-H伸縮振動基頻與C-O一級倍頻伸縮振動基頻組合頻。
2.1.4 湖南本地米的光譜特征
CWT技術預處理前后的湖南本地米光譜見圖4。

圖4 CWT技術處理前后香米和湖南本地米的光譜圖Fig.4 Spectra of fragrant and Hunan local rice before and after CWT treatment
圖4(a)為湖南本地米的原始光譜圖,從圖中可以明顯的觀察到,湖南糙米與其他種類的大米自開始就被明顯的分隔開,表明湖南糙米與其他種類的米的差異較大;而在7 050 cm-1波數處光譜被分為兩組,屬于C-H一級倍頻伸縮振動基頻與C-H變形振動基頻組合頻,對應的結構是苯環;在4 500 cm-1波數處光譜的差異對應于N-H伸縮振動基頻與NH3變形振動基頻組合頻,對應的結構是氨基酸。
圖4(b)是 CWT后的光譜圖,在 8 550 cm-1波數處,湖南糙米存在一個小的波峰,其他大米則不存在,此波數的振動方式是C-H二級倍頻伸縮振動基頻,對應的結構是乙烯基(HC=CH);在7 150 cm-1波數處光譜的差異對應于C-H一級倍頻伸縮振動基頻與C-H變形振動基頻組合頻,對應的結構是CH2;在5 850 cm-1波數處,湖南糙米沒有明顯波峰,而其他大米則存在明顯波峰,屬于C-H一級倍頻伸縮振動基頻;在5770cm-1波數處光譜的差異對應于C-H一級倍頻有關。湖南糙米,蛋白質含量比較多,主要是米精蛋白,氨基酸組成也比較完全,有利于人體消化吸收,但是賴氨酸含量較少,可能導致出現其與其它大米光譜的差異。在5 650 cm-1波數處光譜的差異對應于C-H一級倍頻伸縮振動基頻,對應的結構是CH2;而在5 300 cm-1波數處,湖南糙米的波峰高于其他種類大米的波峰,主要與C=O基頻有關。在4 880 cm-1和4 440 cm-1波數處光譜的差異對應于N-H不對稱伸縮振動與酰胺Ⅱ組合頻、N-H對稱伸縮振動與酰胺Ⅱ組合頻和O-H伸縮振動與O-H變形振動組合頻。
2.2.1 東北大米的聚類分析
CWT預處理前后東北大米原始光譜的PCA結果見圖5。

圖5 CWT技術處理前后東北大米和秈米的PCA圖Fig.5 PCA results of northeastern and glutinous rice before and after CWT treatment
由于前兩個主成(PC1和PC2)的方差貢獻率之和在80%以上,因此選取PC1和PC2進行PCA分析。為了區分東北大米,采用PCA方法對原始光譜進行聚類分析。圖5(a)為未經過CWT的PCA圖,從圖中可以看出,東北糙米與d超市的東北大米不能得到良好的區分,可能原因是d超市東北大米的加工工序不合理,導致稻米有部分外殼殘留;而a、b兩家超市的東北大米可以被有效的分辨,可能原因是這兩家超市的加工方式不同或者大米產地不同,導致大米的某些成分存在差異。為了進一步提高東北大米的聚類效果,采用CWT預處理的方法消除背景干擾。圖5(b)是CWT預處理之后的PCA圖,由圖可知,預處理之后的聚類效果明顯優于圖5(a),可明顯觀察到未能分開的兩種大米被有效的分辨開,這就更好的證明了CWT可以有效的消除背景干擾,進一步提高了聚類分析的效果。
2.2.2 秈米的聚類分析
CWT預處理前后秈米原始光譜的PCA結果見圖6。

圖6 CWT技術處理前后東北大米和秈米的PCA圖Fig.6 PCA results of northeastern and glutinous rice before and after CWT treatment
為了明顯地看出秈米之間的差別,對秈米的原始光譜做了聚類分析。圖6(a)為秈米原始PCA圖,由圖可知,a超市和d超市的秈米幾乎完全重合在一起,可能是因為這兩家超市的大米產地一樣;而c超市和e超市的秈米呈良好的聚類分析效果,可能原因是這兩家超市的大米產地不同或是加工方式不同導致大米成分存在差異。為了進一步提高秈米的聚類分析效果,采用CWT預處理消除背景干擾。圖6(b)為CWT預處理后的秈米PCA圖。由圖可知,a、d兩家超市的大米仍然沒有被效的分辨開,且a超市包含于d超市,這表明,兩家超市的秈米無明顯差異,相似度較大,應該來自于同一廠家;而b、c兩家超市的秈米分辨率較高,差別較大,可能原因是產地不同或者不同廠家的加工方式、生產工藝上的差別,導致大米的淀粉、蛋白質等含量存在差異,所以可以被有效的分辨開。
2.2.3 香米的聚類分析
為了直觀地看出香米之間的差別,采用PCA方法對香米的原始光譜進行聚類分析。CWT預處理前后香米原始光譜的PCA結果見圖7。

圖7 CWT技術處理前后香米和湖南本地米的PCA圖Fig.7 PCA results of fragrant and Hunan local rice before and after CWT treatment
圖7(a)為香米的原始PCA圖,從圖中可以看到4組樣品都有一定程度的交叉,柬埔寨香米與其他3種大米交叉程度最小,但是相關度較差,京升緣香米、軟香米和泰香米3組大米存在嚴重的重疊,其中京升緣香米、軟香米兩組大米幾乎重合。為了進一步提高香米的聚類分析效果,采用CWT預處理方法消除背景干擾。圖7(b)為預處理后的PCA圖,由圖可知,京升緣香米、軟香米兩組還是很接近,但是柬埔寨香米和泰香米已經被有效的分辨開來,且京升緣香米的相關性提高,結果顯示兩組國外香米與兩組國內香米在經過CWT之后被有效的分辨開來,說明國內外大米在成分上存在一定的差異。
2.2.4 湖南本地米的聚類分析
為了能夠明顯地觀察到湖南本地米之間的差別,做了原始光譜的聚類分析。CWT預處理前后湖南本地米原始光譜的PCA結果見圖8。

圖8 CWT技術處理前后香米和湖南本地米的PCA圖Fig.8 PCA results of fragrant and Hunan local rice before and after CWT treatment
圖8(a)是湖南本地米的原始PCA圖,由圖可知,湖南糙米和e超市的秈米被有效的分辨開來,其他種類的大米則不同程度的重疊在一起,就不同種類大米的鑒別而言,湖南糙米、e超市的秈米、晚米和貢米呈良好的聚類分析效果。就不同超市大米的鑒別而言,c、e兩家超市被有效的分辨開來,而其他兩家超市則呈現較大的重疊效果。為了進一步提高湖南本地米的聚類效果,采用CWT預處理方法消除背景干擾。圖8(b)為預處理后的湖南本地米的PCA圖,由圖可知,雖然沒有將所有大米有效的分辨開來,但是可明顯的觀察到聚類效果已經明顯提高。其中a和d兩家超市的秈米較大程度的重疊在一起,其他兩家超市的秈米則可以正確分辨開來,貢米和c超市的秈米成分上很接近,與其他種類的湖南米相比被明顯的分辨開來,其中晚米、芙蓉米和a和d兩家超市的秈米重疊在一起。以上結果表明:相同產地不同的加工方式也會導致大米之間較大的差別。
通過本次試驗可知,近紅外光譜技術結合化學計量學方法用于大米的快速無損分析是有效的,可以實現對不同產地和不同種類的大米的鑒別分析。根據不同的產地及種類將樣品分為4組,對原始光譜進行CWT預處理后,提高了信噪比,有效的消除了背景干擾和基線漂移,并在此基礎上進行PCA分析,得到滿意的聚類分析效果。綜上所述,近紅外光譜技術結合化學計量學方法快速無損分析大米是一種環保、高效的試驗方法,并且可以在食品的其他領域得到很好的推廣利用。