蘇鵬飛,張武崗
(陜西西鳳酒股份有限公司,陜西寶雞 721400)
近年來,隨著釀酒企業的快速發展和不斷擴產,對釀酒原糧高粱的需求量日益增多,同時對其品質和分析效率有了更高的要求。高粱品質的控制對釀造白酒質量至關重要,而淀粉含量是釀酒企業監控高粱品質的重要質量指標,淀粉作為主要的糖化底物,經糊化、水解產生大量發酵糖類,再通過酵母菌等微生物的分解,最終產生白酒,其質量與白酒工業的經濟效益直接相關[1]。實驗室測定高粱淀粉含量的常規方法是酸解法,但這種方法比較復雜,費時費力,而且需要使用多種有毒有害化學試劑,不滿足企業對綠色、環保的追求和對樣品快速分析發展的需要。因此,亟待開發一種快速、高效以及環保的分析技術。近紅外光譜技術(NIR)是近幾年發展較為迅速的一種快檢技術,所受關注度也越來越高,這種技術具有高效穩定、操作簡便以及無污染等優點,是一種能夠滿足快速分析的綠色技術,已普遍應用于食品行業[2-8]。近紅外光譜區的波長范圍為780~2526 nm,由分子振動從基態向高能態躍遷時所產生,主要是一些含氫基團分子X-H(X:C、N、O 等)內部振動的倍頻與合頻吸收帶[9-11]。高粱淀粉指標在近紅外區可得到有效響應,將高粱樣品近紅外光譜圖與常規方法分析的一手數據結合起來,通過相關建模軟件和方法最終建立其近紅外快檢模型,以期實現高粱淀粉含量的快速分析,為企業提質增效提供技術支持。
實驗樣品:西鳳酒廠釀酒用高粱,共220 個建模樣品,樣品具有代表性。
儀器設備:FW-200AD 粉碎機,天津鑫博得儀器有限公司;ME204/02 電子天平,瑞士METTLER TOLEDO 公司;HH-S6A 電熱恒溫水浴鍋,北京科偉永興儀器有限公司;H22-X3電爐,杭州九陽生活電器有限公司;Antaris II 傅里葉變換近紅外光譜儀、RESULT 操作軟件以及TQAnalyst 光譜分析軟件等,美國Thermo Fisher公司。
1.2.1 高粱樣品淀粉含量的測定
高粱樣品的淀粉含量參考GB 5009.9—2016 酸水解法進行測定。重復2次,取平均值。
1.2.2 近紅外光譜采集條件
在采集樣品光譜前,首先檢查儀器的狀態,確保儀器正常且穩定時,再將提前粉碎好的高粱樣品裝于5 cm 的樣品旋轉杯中,并用壓樣器壓緊,避免出現縫隙,然后將樣品杯放置于測量池上進行測量,最后通過RESULT 光譜采集及分析軟件對高粱樣品進行光譜采集。光譜掃描范圍為4000~10000 cm-1,掃描次數為64次,儀器分辨率為8 cm-1,以內置背景作為參比,重復2次,取平均光譜。
樣品光譜圖掃描完成后,及時利用常規分析方法對其淀粉含量進行檢測,并使樣品的光譜圖和一手數據相對應,即能夠對樣品的光譜信息進行賦值。同時,結合偏最小二乘法(PLS)、固定光程(Constant)、多元信號修正(MSC)、標準正則變換(SNV)、導數處理、Norris 平滑處理以及內部交叉驗證法(Cross-Validation)等近紅外光譜預處理方法進行建模研究。運用近紅外光譜預處理方法選擇最優光譜波段和建模參數,最終建立高粱淀粉含量的近紅外快速分析模型。
在對模型進行評價時,通常需從內、外部兩方面共同進行評價。內部評價是通過模型的相關系數(R2)、均方差(RMSEC)、交叉驗證均方差(RMSECV)以及預測均方差(RMSEP)等參數來判斷模型的質量。其中,R2越大以及RMSEC、RMSECV和RMSEP 值越小且相近,說明所建模型的質量越好[12-15]。外部評價是利用所建模型和常規方法分別對未參與建模的盲樣進行分析,并通過分析結果的比較來評價模型的預測能力。
采用Microsoft Office Excel 2010軟件對數據進行相關計算,采用SPSS 17.0 軟件對相關數據進行差異顯著性分析(p<0.05)。
在采集高粱樣品光譜前,首先要確定光譜儀的分辨率、掃描次數以及樣品增益值等采集參數,確保樣品光譜采集的一致性和準確性,然后按照光譜采集的最優條件和參數對高粱樣品進行譜圖掃描。本研究是在近紅外全光譜4000~10000 cm-1范圍內對高粱樣品進行光譜掃描,掃描的高粱樣品原始光譜如圖1所示。

圖1 高粱樣品原始掃描光譜圖
由圖1 可以看出,在波數9000~10000 cm-1范圍內,高粱樣品吸光度較低且噪音干擾較大,不利于樣品有效信息的提取,不宜選擇此波段建立模型。另外,對樣品原始光譜進行導數和Norris 平滑處理后(如圖2 所示),光譜圖變得更加精細,這樣處理可以凈化譜圖,消除基線漂移,也可以起到一定放大和分離重疊信息的作用,利于提高樣品光譜的信噪比,也利于建模過程中對光譜信息的進一步選擇。

圖2 二階導數和Norris平滑處理效果圖
將收集到的220 個高粱樣品,按照淀粉含量由低到高進行排序,然后均勻地抽取20 個樣品進行RMSEP分析,剩余的200個樣品作為校正集進行建模。建立模型時要確保樣品的光譜圖和化驗值相對應,然后運用光譜預處理方法對樣品光譜信息進行處理,選擇最佳建模波段和方法,并通過優化檢驗等過程,最終建立高粱淀粉含量的近紅外快檢模型。
表1 和圖3 分別為高粱淀粉含量建模的最優參數和模型圖。由表1 和圖3 可知,高粱淀粉含量的最優建模波段為8992.52~5703.68,最佳預處理方法為偏最小二乘法(PLS)、固定光程(Constant)、二階導數以及Norris 平滑處理,在此條件下所建立的高粱淀粉含量模型相關系數最大,標準偏差最小。其中,建模集的相關系數R2為0.9752,交叉驗證集的相關系數R2為0.9018,預測驗證集的相關系數R2為0.9714,說明模型的線性關系較好;同時,模型的RMSEC、RMSECV和RMSEP值分別為0.207、0.389和0.211,模型內部參數值較小且相近,說明模型的質量較好。

表1 高粱淀粉含量模型參數

圖3 高粱淀粉含量模型
利用模型自身參數RMSEC、RMSECV 和RMSEP 來評價一個模型的質量為內部驗證法,除此之外,還應對所建模型進行外部驗證,通過內、外部驗證共同評價模型的質量。
另取45 個高粱樣品作為盲樣進行外部驗證,利用所建模型和常規方法分別進行分析,得出高粱淀粉含量的預測值和真實值。通過比較預測值和真實值,得到模型預測的準確度和可靠性。
根據模型外部驗證結果,如表2 所示,高粱淀粉含量模型預測的相對誤差均在2%以內,平均相對誤差為0.7 %,說明所建模型具有較好的預測能力。此外,為了對比兩種方法分析結果的差異性,采用SPSS 軟件對這45 個樣品的兩種方法檢測結果進行差異顯著性分析,結果見表3。由表3 可知,兩種方法分別對樣品進行分析檢測時,兩組檢測值之間的差異顯著性分析結果P 值為0.415(P>0.05),說明兩組檢測值之間不存在顯著性差異。因此,在實際生產中,該模型可用于高粱淀粉含量的快速檢測。

表2 高粱淀粉含量模型外部驗證結果

表3 兩組數據差異顯著性分析
利用近紅外光譜技術研究建立了高粱淀粉含量的快檢模型,模型的線性關系較好,并且模型內部各參數值較小且相近,說明模型的質量較好。同時,利用所建模型和實驗室常規方法分別對外部驗證樣品進行了分析比較,結果表明模型預測的準確度和可靠性良好,在實際生產過程中,可用于高粱淀粉含量的檢測。此外,所建模型作為一個基礎模型,后期還需根據實際情況不斷對其進行維護和優化,確保模型預測的穩定性和準確性,以滿足日常生產檢測的需求。