常瑞紅,邵高超,李 娜,蔡 闖,畢研芳
(江蘇洋河酒廠股份有限公司,江蘇宿遷 223800)
近紅外光譜(near infrared spectroscopy,NIS)分析技術是一種光譜學與化學計量學相結合的一種現代化分析技術,是通過對物質的透射或者反射光譜來分析其分子結構特點及其化學組成[1]。從近紅外光譜圖中可以得到樣品物質的結構、組成、濃度等化學信息,可實現對樣品便捷、快速、無損、高效、定性/定量分析,現已廣泛應用于食品[2-3]、農業[4-5]、化工[6]等行業。
由于近紅外光譜譜區的吸收強度較弱,信噪比低,同時受樣品均勻度、儀器等噪聲干擾,光譜易發生重疊和基線的漂移現象。因此,在建立模型時,采用適當的光譜預處理方法可有效消除背景噪音,提高譜圖與化學成分之間的相關性,大大提高模型預測能力[7]。對于液體樣品,常用的光譜預處理方法有平滑處理、求導、標準正態變量校正等,平滑處理是消除噪聲的常用方法;標準正態變量校正(SNV)用于校正樣品散射引起的光譜誤差;求導處理可有效消除背景干擾,其中一階導數處理可去除部分線性或接近線性的背景、噪聲光譜對目標光譜的影響[8]。但由于導數處理可能使信噪比降低,因此在對光譜做導數預處理時先對其進行平滑預處理。
偏最小二乘法(PLS)和主成分回歸法(PCR)是兩種不同的建模方法,都能實現對光譜數據降維的目的,是近紅外光譜建模分析中常用的化學計量學方法[9]。目前近紅外光譜分析中定量模型構建比較單一,采用不同的化學計量學方法構建模型的研究相對較少。本實驗運用近紅外光譜技術檢測葡萄酒中的酒精度,采用不同光譜預處理,并運用PLS和PCR兩種化學計量學算法建立模型,對比分析兩種方法建模的差異,并根據決定系數(R2)、校正均方根誤差(RMSEC)和預測均方根誤差(RMSEP)3個指標來評價模型的預測能力,旨在明確兩種化學計量學在建模中的差異,為今后模型構建提供理論支持。
酒樣:116個葡萄酒樣品,江蘇東帝星徽國際貿易有限公司提供。
儀器設備:NIRMaster傅里葉變換近紅外光譜儀(配有高性能樣品杯和透反射蓋),瑞士BUCHI公司;溫度計和酒精計,冀州市耀華器械儀表廠;500~800 W電爐,弗恩森(北京)電爐有限公司。
葡萄酒酒精度的測定按照GB/T 15038—2006葡萄酒、果酒通用分析方法。
將葡萄酒樣品搖勻后,先用待測樣清洗高性能樣品杯3次,隨后緩緩倒入約20 mL待測樣于樣品杯中,再小心將透反射蓋蓋上(防止樣品杯底部有液泡產生)。使用NIRWare Opreator軟件進行光譜采集;NIRCal軟件進行建模;測量池選擇NIRFlex Liquid液體測量池;近紅外光譜測量波長范圍10000~4000 cm-1;以空氣為內參比;光譜掃描32次,儀器分辨率8 cm-1;每個樣品重復采集3次,取平均光譜為最終分析光譜。
在建模時,為了去除噪聲、提高譜圖中的有效信息,選擇合適的光譜預處理非常必要。常用的光譜預處理方法為平滑處理、求導、標準正態變量校正等。本研究通過多次試驗,選取幾種較好的預處理方式,并且基于PLS和PCR計算方法,在不同光譜預處理方法下建立葡萄酒酒精度模型,通過比較模型結果及預測盲樣的效果對兩種算法下的模型進行評價。
近紅外光譜圖不僅包含了樣品的吸收信息,也包含了一些與樣品性質無關的噪聲信息,如光散射、儀器影響、樣品不均勻等引起的干擾信息,導致近紅外光譜基線傾斜、漂移等現象。圖1為采集到的116個葡萄酒樣品的原始光譜圖,由圖1可知,在10000~4000 cm-1光譜范圍內葡萄酒樣品有獨特的吸收特性,且樣品近紅外譜圖都較相似,但在整個光譜波段區域吸收峰存在一定重疊、平移等現象,不能有效反映樣品相關性信息。因此,在定量建模時,為了消除來自高頻隨機噪聲、樣本不均勻、基線漂移、光散射等的影響[10]。采用合理的光譜預處理方法,構建穩健性和預測能力都較強的模型,可有效提高樣品分析的準確度和精確度[11]。

圖1 葡萄酒樣品的原始近紅外光譜圖
葡萄酒為質地均勻的液體樣品,本實驗采用不同光譜預處理方式進行多次嘗試,選取相對較好的光譜預處理方法應用PLS和PCR算法建模,結果見表1。

表1 不同光譜處理方法應用PLS和PCR算法建模結果
由表1可知,基于PLS和PCR算法下,采用不同光譜預處理均可得到評價模型較好的參數,表明所建模型均具有一定的準確性和穩定性。在PLS算法下,經過光譜預處理建模的結果優于未經過預處理的,且3種光譜預處理方法建立的模型結果接近,相比較而言,平滑處理和求導的效果最好,其F1為5,R2最接近1,RMSEC和RMSEP最小且最相近;而在PCR算法下,平滑處理和求導處理后建立的模型效果是最差的,而經過SNV處理后建立的模型是較好的,F1為7,比PLS模型下的大,說明采用PCR模型運算量較大,且模型相對復雜[12]。R2最接近1,RMSEC和RMSEP最小。綜合比較,采用光譜預處理建立的模型不一定優于未經過光譜預處理的,需多次試驗,尋求最合適的預處理方法,以建立穩健性較好的模型。
經過試驗選取,得到的最優預處理光譜圖見圖2,由圖2可知,經過預處理后的近紅外光譜,可有效消除原始光譜中的漂移,強化了譜帶特征,為獲得穩健模型奠定了基礎。
從上述不同預處理方法建立的葡萄酒酒精度的模型中,選取最優回歸模型,結果見圖3。

圖2 預處理后的光譜

圖3 酒精度的回歸模型
由圖3可知,橫坐標表示葡萄酒酒精度的真值,縱坐標表示葡萄酒酒精度的預測值,兩種算法下的擬合曲線都較好,其中PLS模型的R2為0.9657,RMSEC 為 0.0862,RMSEP 為 0.0892,PCR模型的R2為0.9594,RMSEC為0.0935,RMSEP為0.0999,通過比較模型評價指標可知,兩種算法下建立的模型效果均較好,但PLS構建模型的R2、RMSEC、RMSEP均優于PCR構建模型,且RM-SEC、RMSEP越小預測結果越準確。所以,PLS模型預測精度高于PCR模型。

表2 預測集樣本的預測值
利用建立的葡萄酒酒精度定量模型預測11個盲樣,結果見圖4和表2,由圖4可知,兩種模型的預測值與化學測量值相關性都可接受,但PLS算法下建立的模型R2值(0.9757)高于PCR算法下R2值(0.9037);由表2可知,比較兩個模型的相對誤差,PLS的較集中,模型穩定性好,PCR相對離散,PLS的相對誤差整體上小于PCR的,說明PLS預測準確度高于PCR的,表2中PLS模型的RMSEP為0.2691,PCR模型的RMSEP為0.3485,說明PLS建立的模型預測效果優于PCR。將預測值和化學實測值進一步做t檢驗,在0.05顯著性水平下,兩個模型預測值與化學測定值均無顯著性差異,說明兩種模型均具有可接受的預測能力,滿足常規分析精度的要求。綜合比較兩種模型,PLS模型的預測精度較高,所以,采用PLS算法構建的葡萄酒酒精度模型預測效果較好。

圖4 預測值與化學值相關圖
本研究采用傅里葉變換近紅外光譜結合兩種化學計量學方法(PLS和PCR)分別建立葡萄酒酒精度的定量模型。結果表明,同一光譜預處理方法對兩種模型的影響不同,建模時需多次實驗以便選擇合適預處理方法;兩種算法構建模型結果均較好,采用PLS構建的模型R2為0.9657,RMSEC為0.0862,RMSEP為0.0892,采用PCR構建的模型R2為0.9594,RMSEC為0.0935,RMSEP為0.0999;兩種模型預測效果均可接受,其R2均大于0.9,且與化學測量方法無顯著性差異(0.05水平下),但PLS模型的精度和穩定性稍優于PCR。由以上可知,近紅外光譜結合PLS和PCR算法構建的模型都可預測得到葡萄酒酒精度的理想結果,但采用PLS算法建立的模型預測效果更好,模型具有較高的可靠性和精密性,能實現葡萄酒生產中對酒精度的快速檢測需求。
[1]YAN L,ZHAO L L,ZHANG L D.Application of near infrared spectroscopy[M].Beijing:China Light Industry Press,2005.
[2]彭幫柱,岳田利,袁亞宏,等.蘋果酒發酵過程中糖度近紅外光譜檢測模型的建立[J].光譜學與光譜分析,2009,29(3):652-655.
[3]DAMBERGS R G,KAMBOURIS A,FRANCIS I L,et al.Rapid analysis of methanol in grape-derived distillation products using near-infrared transmission spectroscopy[J].Agric food chem,2002,50(11):3079-3084.
[4]李毅念,姜丹,劉瓔瑛,等.基于近紅外光譜的雜交水稻種子發芽率測試研究[J].光譜學與光譜分析,2014,34(6):1528-1532.
[5]吳軍,白琪林,蘇勝寶,等.近紅外反射光譜法分析玉米秸稈纖維素含量的研究[J].分析化學,2005,33(10):1421-1423.
[6]JOHNSO T J,MASIELLOT,SHARPE S W.The quantitative infrared and NIR spectrum of CH2I2 vapor:vibrational assignments and potential for atmospheric monitoring[J].Atmospheric chemistry and physics,2006,9(6):2581-2591.
[7]尼珍,胡昌勤,馮芳.近紅外光譜分析中光譜預處理方法的作用及其發展[J].藥物分析雜志,2008,28(5):824-829.
[8]浦瑞良,宮鵬.高光譜遙感及其應用[M].北京:高等教育出版社,2000.
[9]褚小麗.化學計量學方法與分子光譜分析技術[M].北京:化學工業出版社,2011.
[10]田海清,應義斌,徐惠榮,等.西瓜可溶性固形物含量近紅外透射檢測技術[J].農業機械學報,2007,38(5):111-113.
[11]黃莊榮,沙莎,榮正勤,等.基于近紅外技術快速無損分析整粒棉籽中的脂肪酸含量[J].分析化學,2013,41(6):922.
[12]楊春梅,李寧,趙學玒,等.用于果蔬內部品質無損檢測的NIRS技術新進展[J].激光與紅外,2009,39(11):1137-1141.