程文宇 管 驍 劉 靜
(1.上海理工大學醫療器械與食品學院,上海 200093;2.上海海事大學信息工程學院,上海 200135)
乳制品中非法添加三聚氰胺,長期或反復大量攝入會對腎與膀胱產生影響,導致腎結石。三鹿毒奶粉事件的直接原因即是奶粉中含有超量三聚氰胺[1]。為了維護乳制品安全,不同國家對其中的三聚氰胺限量有不同要求。中國政府2008年明確規定,乳制品中(包括原料乳)三聚氰胺含量不得超過2.5mg/kg[2];國際食品法典委員會2012年7月規定每公斤液態牛奶中三聚氰胺含量不得超過0.15mg[3]。
三聚氰胺的常用檢測方法主要有高效液相色譜法和氣質聯用法,但這些方法主要在實驗室進行,且需要專業操作人員,不利于原料乳品質的在線監控[4]。在計算機技術的飛速發展、光學技術和化學計量學方法的不斷進步下,近紅外光譜分析技術在多個領域顯示了其獨特的優勢,其中無損、高效、快速、成本低、無污染的優點,使其明顯優于傳統的分析檢測技術,而且樣品無需預處理,更加便于實現在線分析[5]。
有機物在近紅外光譜區主要表現為含氫官能團X—H(X═C、N、O、S)基頻振動的不同倍頻與合頻吸收峰,由于合頻和倍頻躍遷幾率低,譜帶強度弱并重疊嚴重,因此提取的有用信息為弱信息和多元信息,對微量物質的定量效果往往不佳。劉景旺等[6]利用近紅外光譜對牛奶中的三聚氰胺進行了檢測,但存在準確性不高等問題。近年來隨著化學計量學的發展,近紅外技術結合適當的化學計量學處理方法,可以對食品組成成分以及外源添加物進行定性判別[6-8],并有效提高檢測限度。
小波變換被譽為數學上的顯微鏡,是一種理想的信號處理方法,它能將重疊的混合信號轉變為不同頻率的基元信號,具有多分辨率、方向選擇性等特點,可對信號進行局部化分析[9]。在近紅外光譜分析中,小波變換可以有效地消除光譜噪音,提高局部特征信號[10],是近紅外光譜預處理常用的方法之一。本研究擬通過近紅外光譜小波變換結合主成分分析以及廣義回歸神經網絡(WT—PCA—GRNN)對添加三聚氰胺的液態奶進行定量分析,并結合支持向量機(WT—PCA—SVM)對其進行定性判別,目的是探討近紅外光譜技術結合化學計量學方法對液態奶中三聚氰胺快速檢測的可行性,為快速檢測液態奶中的三聚氰胺提供理論依據。
傅里葉近紅外光譜儀:MPA型,德國Bruker公司。光譜采集模式為漫反射(光纖),譜區范圍4 000~12 501cm-1,分辨率8cm-1,掃描次數64次;
電子天平:AB104-N型,上海第二天平儀器廠;
均質機:APV1000型,上海順儀實驗設備有限公司。
將取自上海金山奶牛場的新鮮原料乳,通過蒸餾水稀釋配制成蛋白質濃度為1.5%的基底乳,備用。將不等量的三聚氰胺分別摻入基底乳中模擬摻假試樣,三聚氰胺摻入量控制在0.001%~1.000%(質量分數),在均勻分布濃度梯度下,共制備54組樣本。在建模時從54組樣本中隨機選取15組作為定量模型的測試集,剩余39組樣為訓練集。另外取18組未添加三聚氰胺的原料乳樣本,分別用蒸餾水稀釋至蛋白質含量為1.5%~3.2%(質量分數),濃度梯度0.1%。表1為訓練集和測試集劃分結果。
將樣品在恒溫水浴鍋中保持25℃、環境相對濕度為45%,使機器開機預熱10min。采集光譜前,將不同樣本用轉速2 000r/min均質機攪拌60s。樣本的漫反射近紅外光譜利用光纖探頭采集,每組樣本測量10次,取平均值作為該樣本典型光譜,每組樣本光譜由2 203個數據點構成。數據采集軟件為OPUS 6.5,數據處理分析軟件為 Matlab R2009b。
本試驗采用Daubechies(db2)小波對原始光譜信號進行4層小波分解[6]。處理效果見圖1。
表1 測試集的選擇結果Table 1 Results ofdivision of test set

表1 測試集的選擇結果Table 1 Results ofdivision of test set
*用于測試集。
序號 三聚氰胺質量分數/% 序號 三聚氰胺質量分數/% 序號 三聚氰胺質量分數/%1 2 3 4 5 6 7 8 9 1 0 11 12 13 14 15 16 17 18 0.001*0.002 0.003 0.004*0.005 0.006 0.007 0.008 0.009 0.010*0.012 0.014 0.016 0.018 0.020*0.022 0.024*0.028*0.030 0.032 0.034 0.036 0.038*0.040 0.045*0.050 0.055*0.060 0.065 0.070*0.075 0.080 0.085 0.090*0.100 0.150 0.200 0.250 0.300*0.350 0.400 0.450 0.500 0.550 0.600*0.650*0.700 0.750 0.800 0.850*0.900 0.026 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 360.095 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 541.000

圖1 小波變換圖譜Figure 1 Transformed spectrums by WT
據報道[11],三聚氰胺中NH2的波動處于近紅外區域,在6 644~6 812cm-1間有明顯的吸收峰,而根據朗伯—貝耳定律,紅外線通過水分時是被選擇性吸收,其吸收量大小遵循近紅外輻射經過物質后的光強,與物質的濃度(水分含量)之間存在一定關系,即吸收能量隨著被測物濃度的增加而增加[12]。
為驗證三聚氰胺在波數為6 644~6 812cm-1區域內的吸收峰,將小波變換后的圖譜進行一階導數分析,先將6 644~6 812cm-1內43個光譜數值擬合成多元函數,處理后發現最大導數值處為6 792cm-1,因此選取6 792cm-1處進行分析,將所有樣品的光譜在該處導數進行比較分析,結果見圖2。

圖2 不同三聚氰胺濃度下6 972cm-1導數值Figure 2 Derivative value at 6 972cm-1 at different concentrations
由圖2可知,三聚氰胺濃度與6 792cm-1處導數值基本成正比例關系,這與三聚氰胺在6 644~6 812cm-1內存在吸收峰的推斷吻合。但由圖2也不難發現,當三聚氰胺在濃度低于0.05%時,濃度與峰值導數比例關系并不明顯,并且有幾組樣品在6 792cm-1處導數為負值,這是由于樣品背景及其它組分等干擾,以及設備等系統誤差所共同導致的光譜峰漂移[13,14]。
由于低濃度變化規律不明顯以及光譜漂移等問題,本試驗采用主成分分析(PCA)對光譜進一步處理。主成分分析是通過線性變換重新組合原來具有一定相關性的眾多指標,選出較少個數重要且互不相關的變量,從而使進一步研究變得簡單的一種多元統計分析方法[15]。本試驗目的是將6 644~6 812cm-1內已被小波變換放大的特征信號進行進一步提取,獲得更具代表性的特征值進行后續分析。表2為主成分分析結果。

表2 主成分分析結果Table 2 Result of PCA
由表2可知,通過主成分分析,可以將6 644~6 812cm-1內43個數據點轉換成少量的代表性變量,本試驗取前4個主成分因子作為建模自變量,累積貢獻率達到99.405%。
GRNN是由輸入層、隱含層和一個線性輸出層組成的,是徑向基函數(radial basis function,RBF)網絡的一種。GRNN的拓撲結構如圖3所示。GRNN多用于函數局部逼近,并具有非線性映射能力強、訓練速度快的優點,適用于樣本數量較少的建模。此外,GRNN只有一個光滑因子需要調整,因而合適的預測網絡能夠很快地被找到,具有一定的運算優勢。因此,本試驗采用GRNN對液態奶中三聚氰胺含量進行建模[16]。

圖3 GRNN拓撲結構Figure 3 Topology of GRNN
利用Matlab軟件建立GRNN模型,取通過主成分分析得到的4個因子作為模型自變量,三聚氰胺含量作為模型因變量,將表1中所選取的39組數據用于建立模型,15組測試集用于評價模型效果,采用模型相關系數R2評價模型效果。經過軟件尋優,平滑因子取值為0.1,此時三聚氰胺含量訓練集模型R2為0.694 3,測試集模型R2為0.654。結果顯示如圖4、5所示,雖然模型對三聚氰胺含量預測與實際值總體趨勢相同,但預測準確度不高,R2值偏低,作為定量分析仍有待進一步完善。

圖4 訓練集預測結果Figure 4 Predicted results of train set

圖5 測試集預測結果Figure 5 Predicted results of test set
由上述分析可以看出,盡管無法對液態奶中的三聚氰胺含量進行準確定量,但對三聚氰胺含量的預測規律與實際值相同。因此,本試驗進一步利用支持向量機方法對摻入三聚氰胺的液態奶樣本進行定性判別。
支持向量機是在結構風險最小原理和統計學習理論基礎上建立的,在模型的復雜性和學習能力之間根據有限的樣本信息尋求最優,從而能夠推廣應用到函數擬合等其他機器學習問題中。在近紅外光譜分析中,樣本數量得到的通常不多,而SVM作為一種專門研究小樣本情況下預測問題和統計估計的方法,能夠較好地解決小樣本、非線性、高維數和局部極值等諸多實際問題[17,18]。圖6為支持向量機拓撲結構圖。

圖6 SVM拓撲結構Figure 6 Topology of SVM
由于新加入的18組未添加三聚氰胺的液態乳樣本未進行有效主成分提取,所以需要將這些樣本與上述54組加入不同比例三聚氰胺的液態奶樣本合并,共得到72組樣本,對其原始光譜重復上述小波變換預處理。隨后將72組樣本隨機劃分,其中54組為訓練集,18組為測試集。對訓練集進行主成分分析,通過計算提取得5個主成分因子,累積貢獻率為99.11%。再利用支持向量機建立模型,其中5項主成分因子為模型自變量,是否摻入三聚氰胺作為因變量,摻入為1,未摻入為0,分別采用不同核函數建立SVM模型。隨后將18組測試集帶入主成分分析模型,將得到的主成分因子帶入支持向量機模型檢驗,模型效果見表3。

表3 不同核函數的預測結果Table 3 Predicted results by using different kernel function
由表3可知,采用RBF作為核函數時,本試驗預測效果最佳,訓練集與預測集預測準確率均為94.44%,結果令人滿意。這表明利用近紅外光譜技術對液態奶中摻入三聚氰胺的定性判別是完全可行的。
通過近紅外光譜技術,對液態奶中三聚氰胺進行研究,首先采用小波變換放大三聚氰胺特征信號,再利用主成分分析獲得有效的特征因子,分別對液態奶中三聚氰胺進行了定量及定性的研究,結果表明:① 當液態奶中三聚氰胺質量比低于0.05%時,模型預測能力較差,這是由于近紅外光譜技術本身的特點所致;② 利用支持向量機對液態奶中三聚氰胺進行定性分析可獲得較好的判別結果,并且近紅外光譜技術具有前處理簡單、無污染、無破壞性等優勢。進一步擴充模型光譜數量,提高模型精度,將有利于推廣近紅外光譜分析技術在實際液態奶質量監控工作中的應用。
1 李高杰.現代近紅外光譜技術在食品分析中的應用[J].經營管理者,2010(19):403.
2 中華人民共和國衛生部,中華人民共和國工業和信息化部,中華人民共和國農業部,國家工商行政管理總局.國家質量監督檢驗檢疫總局公告2008年第25號[J].中國食品衛生雜志,2008,20(6):564.
3 新華.牛奶中三聚氰胺含量設定新標準[J].北京農業,2012(22):9.
4 張鑫,顧欣,陳美蓮,等.近紅外光譜技術在乳品行業的研究現狀及應用前景[J].上海畜牧獸醫通訊,2010(6):12~13.
5 李慧,曾銘,要磊,等.近紅外光譜技術在食品檢測中的應用研究進展[J].食品工業,2011(12):85~88.
6 劉景旺,張博洋,李樹峰,等.近紅外吸收光譜技術快速檢測奶制品中添加三聚氰胺[J].光散射學報,2010,22(3):291~297.
7 金長江,鄭先哲.應用近紅外光譜技術快速檢測黑加侖漿果的主要營養成分[J].東北農業大學學報,2011,42(5):41~47,147.
8 Poji'cM,Jasna Mastilovi'c,Dragan Pali'c,et al.The development of near-infrared spectroscopy(NIRS)calibration for prediction of ash content in legumes on the basis of two different reference methods[J].Food Chemistry,2010,123(3):800~805.
9 田高友,袁洪福,劉慧穎,等.小波變換用于近紅外光譜性質分析[J].分析化學,2004,32(09):1 125~1 130.
10 郝勇,陳斌,朱銳.近紅外光譜預處理中幾種小波消噪方法的分析[J].光譜學與光譜分析,2006,26(10)1 838~1 841.
11 Haughey S A,Graham S F,Cancout E,et al.The application of near-infrared reflectance spectroscopy(NIRS)to detect melamine adulteration of soya bean meal[J].Food Chemistry,2013,136(3~4):1 557~1 561.
12 Decruyenaere V,Froidmont E,Bartiaux-Thill N,et al.Faecal near-infrared reflectance spectroscopy (NIRS)compared with other techniques for estimating the in vivo digestibility and dry matter intake of lactating grazing dairy cows[J].Animal Feed Science and Technology,2012,173(3~4):220~234.
13 Dalle Zotte A,Berzaghi P,Janssonb LM,et al.The use of near-infrared reflectance spectroscopy(NIRS)in the prediction of chemical composition of freeze-dried egg yolk and discrimination between different n-3PUFA feeding sources[J].Animal Feed Science and Technology,2006,128(1~2):108~121.
14 張華秀,李曉寧,范偉,等.近紅外光譜結合Boosting-PLS快速檢測奶粉中蛋白質含量[J].計算機與應用化學,2010,27(9):1 197~1 200.
15 Aoyama S,Toshima T,Saito Y,et al.Maternal breast milk odour induces frontal lobe activation in neonates:A NIRS study[J].Early Human Development,2010,86(9):541~545.
16 Brunet D,Woignier T,Lesueur-Jannoyer M,et al.Determination of soil content in chlordecone(organochlorine pesticide)using near infrared reflectance spectroscopy(NIRS)[J].Environmental Pollution,2009,157(11):3 120~3 125.
17 Bruno-Soares AM,Murrayb I,Patersonb RM,et al.Use of near infrared reflectance spectroscopy(NIRS)for the prediction of the chemical composition and nutritional attributes of green crop cereals[J].Animal Feed Science and Technology,1998,75(1):15~25.
18 張仲源,劉靜,管驍,等.近紅外光譜分析技術在食品檢測中的應用研究進展[J].食品與發酵工業,2011,37(11):159~165.