饒芳秋,何翠容,盧 斌,李萬群,蘭小琴,袁松林,耿東晛
(1.宜賓金喜來大觀園酒業有限責任公司,四川宜賓 644000;2.四川省酒類科研所,四川成都 610017;3.四川省分析測試服務中心,四川成都 610023)
固態法白酒窖內發酵是固-液-氣三相協同作用的復雜過程,糟醅在發酵過程中充當著物質循環、能量流動和信息傳遞“三流運轉”的載體,其相關參數特別是酸度、水分、淀粉是指導白酒生產及改進工藝的關鍵。白酒行業采用經典的化學分析法對糟醅酸度、水分、淀粉的檢測費時(檢測一個樣品需4~5 h)、費力、操作繁鎖、復雜,所得分析結果時間滯后,無法指導調整酒醅的配方,不能及時指導生產。近紅外光譜是近20 年來發展較為迅速的高新分析技術之一,結合化學計量學方法,可以實現對樣品快速、無損的定性與定量分析,已廣泛應用于農業、化工、醫藥和食品等多個領域。近年來,近紅外光譜分析技術在白酒行業廣泛應用,實現了快速、準確測定,實時指導生產。李良等基于偏最小二乘法建立了白酒酒醅近紅外分析模型,實現了對酒醅中水分和酸度值的快速檢測;沈小梅等采用近紅外光譜技術與偏最小二乘法相結合的手段,建立了酒醅酸度、水分、淀粉的定標模型;余松柏等采用協同區間偏最小二乘法對光譜波段進行優化選擇,用偏最小二乘法進行建模預測;盧中明等采用偏最小二乘法建立了酒醅浸取液定量模型,有效擴大了酒醅中還原糖、酸度和酒精度的含量分析范圍。
在已有的近紅外光譜技術定量分析酒醅關鍵指標的報道中,所用近紅外光譜儀大多為進口精密儀器,如美國賽默飛的Antaris II、福斯的InfraXact和布魯克的MPA 等。這些近紅外儀器大多基于傅里葉近紅外測量原理,為通用近紅外儀器,雖然波長覆蓋范圍廣(900~2600 nm),分辨率高達1 nm,但存在體積大、價格昂貴、掃描速度慢、使用條件苛刻等不足,無法走出實驗室應用于現場檢測,限制了其在白酒企業特別是中小型企業的廣泛應用。
為解決近紅外光譜技術用于酒醅分析的儀器成本高、便攜性差及普適性難等問題,行業科研單位與國產儀器公司共同研制基于微機電系統(MEMS)的近紅外光譜儀SIMC-3120。前期研究基礎表明,酒醅在900~1800 nm光譜范圍內測量準確度比通用近紅外光譜儀全光譜(900~2600 nm)范圍的檢測效果更好。因此SIMC-3120 根據酒醅樣品特點和酒醅吸收光譜特點,作了以下幾點針對性優化:(1)采用德州儀器的DMD 數字MEMS芯片技術大大簡化了機電系統和光路結構;(2)壓縮了測量光譜范圍至950~1650 nm 有效光譜范圍,從硬件端進一步降低了系統復雜度;(3)采用微機電控制大大提高了光譜掃描速率,通過提高單位時間內掃描次數取平均光譜的方法提高檢測精度;(4)基于掃描速率的提高和MEMS 結構,將參比掃描內嵌,從而實現每一次光譜掃描前參比掃描;(5)針對酒醅反射特點的基線噪聲處理和樣品盤優化,提高了酒醅的測量信噪比。SIMC-3120 便攜式近紅外光譜儀通過硬件和軟件的針對性優化,大幅縮減了儀器體積重量和生產成本的同時,在酒醅測量上實現了與進口儀器同等水平的定量分析精度。
本試驗基于近紅外光譜技術采用多元散射校正(MSC)和偏最小二乘法(PLS)建立酒醅水分、酸度和淀粉的定量分析模型,驗證了SIMC-3120 在酒醅現場檢測中的準確性和實用性,實驗結果中水分誤差<1.2 %、酸度誤差<0.3 mmol/10 g、淀粉誤差<0.9%,在保證性能的前提下,便攜式與低成本的優點為白酒生產車間異常發酵酒醅的快速篩查和品質實時監測提供理想手段。
酒醅:取自釀酒車間現場,樣品覆蓋不同生產季節,其中入池酒醅樣品336 個,出池酒醅樣品296個。
儀器設備:SIMC-3120 便攜式近紅外光譜儀,波長范圍為950~1650 nm,儀器分辨率為12 nm,波長準確性為±0.2 nm,光斑直徑為30 mm。外形尺寸為L35 cm×W25 cm×H30 cm,重量輕,整機重量(不含電池)<5.5 kg。儀器結構及外觀見圖1。

圖1 SIMC-3120便攜式近紅外光譜儀
1.2.1 化學法
水分、酸度、淀粉檢測采用經典的化學分析方法得到理化值,水分檢測參考國標GB 5009.3—2016 直接干燥法,酸度檢測參考國標GB 5009.239—2016,淀粉檢測參考國標GB 5009.9—2016 酸水解法。選取具有代表性的酒醅樣品,由企業有經驗的化驗員分析,所得數據進行建模及驗證。
1.2.2 近紅外光譜法
1.2.2.1 光譜采集
SIMC-3120 近紅外光譜儀開機預熱30 min,將酒醅混合均勻后裝至樣品池3/4 處,確保樣品壓實、鋪平、不漏光,樣品池底部擦凈后放至儀器測量位置。采用漫反射方法采集酒醅的近紅外光譜,掃描光譜范圍為950~1650 nm,光譜分辨率為12 nm,光斑直徑20 mm,掃描次數為64 次。先掃描背景,再掃描樣品,每個樣品均采用兩次掃描的平均光譜建模。
1.2.2.2 模型的建立與驗證
實驗采集632 個酒醅樣品的光譜圖,隨機分配譜圖建模集和驗證集,建模集數據474 個樣本,驗證集數據158 個樣本。采用多元散射校正法(MSC)對光譜進行預處理,每一條光譜分別與對應樣品的化驗值進行匹配形成數據集后,通過PLS 建立酒醅酸度、水分、淀粉定量分析模型并通過近紅外光譜建模集自身基本參數決定系數(R)和預測標準偏差(RMSEC)對模型本身進行評價,以確保定量模型的準確性和穩定性。用驗證集預測結果的決定系數(R)和預測標準偏差(RMSEP)對預測結果的效果進行評價,以確定儀器及模型算法的整體檢測效果。
利用SIMC-3120 便攜式近紅外光譜儀對酒醅樣品進行光譜掃描,光譜二維和三維掃描結果如圖2 所示。酒醅樣品在950~1650 nm 波段范圍內有較強的特征吸收峰,且具有明顯的規律性,表明選擇此波段范圍進行模型建立比較適宜。建模采用入窖模型和出窖模型分別對分類后的樣本進行預測,以提高預測精度。

圖2 酒醅樣品近紅外光譜圖
2.2.1 模型建立與定性分析
建模集樣本474個,包含223個出窖樣本和251個入窖樣本,其水分、酸度和淀粉的理化值分布如圖3(a)所示。可以看出,入窖和出窖的樣本明顯聚為兩類,且入窖樣本相比出窖樣本水分和酸度較低,淀粉值較高,這是由于出窖樣本中的淀粉被消耗,生成了乙醇、水和有機酸等成分。
驗證集樣本158 個,包含73 個出窖樣本和85個入窖樣本。實驗采用多元散射(MSC)方法對數據進行預處理,偏最小二乘法(PLS)進行建模,用該模型對驗證集158 個樣本進行預測,圖3(b)所示為158 個樣本的預測值分布。從圖3 可以看出,預測結果也明顯區分為入窖和出窖兩類,說明模型預測結果定性基本準確。

圖3 酒醅樣品建模集理化值與驗證預測值分布圖
2.2.2 模型定量評價
為了驗證模型本身是否可靠,將建模集474 個樣本建模后的模型內預測值與理化值之間的決定系數(R)和預測標準偏差(RMSEC)作為定量模型的評價指標進行分析。R越接近1 表示模型內自檢平均準確度越高,線性度越好;RMSEC 越小說明模型自檢的誤差離散度程度越小,表示模型本身性能越強。將驗證集158 個樣本采用模型預測后的預測值與理化值之間的決定系數(R)和預測標準偏差(RMSEP)作為模型預測能力的評價指標進行分析。同理,R越接近1 表示數據預測平均準確度越高,線性度越好;RMSEP 越小說明該模型預測絕對誤差離散度程度越小,預測精度越高。各項定性指標計算公式如下:

式中:m——建模集樣本數;
n——驗證集樣本數;
X——建模集理化值;
Y——驗證集理化值;
X——建模集預測值;
Y——驗證集預測值;


經過計算,出入窖酒醅建模集與驗證集的R與RMSE如表1所示,酒醅中水分、酸度和淀粉近紅外模型自身預測值與化學法理化值散點分布如圖4—圖6 所示。從表1 和圖4—圖6 可知,建模集和驗證集的R均接近于1,模型預測平均值基本準確,對酒醅酸度、水分、淀粉指標具有較好的預測能力。同時,表1 顯示建模集的R與RMSE 均略優于驗證集,這是由于建模集對自身結果進行預測輕度過擬合導致。

圖4 水分預測值與理化值散點分布圖

圖5 酸度預測值與理化值散點分布圖

圖6 淀粉預測值與理化值散點分布圖

表1 出入窖建模酒醅近紅外光譜模型參數
對RMSE 指標進行分析,表1 顯示建模集水分在0.6~0.7 之間,酸度在0.17 附近,淀粉值在0.5 附近。誤差結果顯示,酸度預測的相對誤差較大,這是由于RMSE 在計算時與計算數值的絕對大小相關,數值越小,RMSE 計算結果越小。在本實驗樣本中,酸度數值在1~5 之間,水分數值在45~70 之間,淀粉數值在8~26 之間,因此結果顯示水分RMSE較大。RMSE可以作為同一數值范圍模型的性能比較參數,但不能作為評判誤差大小的絕對評價參數,若測量值數值普遍偏小則RMSE 相對較小。因此需要從誤差分布進一步評估預測結果好壞。
2.2.3 驗證集樣品預測
為進一步分析驗證集樣本預測結果的性能好壞,對驗證集158個樣本中前73個出窖樣本和后85個入窖樣本進行結果對比、絕對誤差分析和相對誤差分析。
水分指標驗證集樣品預測結果如圖7 所示,可以看出,總體入窖水分較低,出窖水分較高,預測結果與理化結果基本吻合。

圖7 驗證集樣品水分預測結果與理化值對比圖
對結果誤差進行統計分析見圖8,水分指標90%以上樣本絕對誤差<1.2%,相對誤差<0.02,且出窖結果總體略優于入窖結果。

圖8 驗證集樣品水分絕對誤差與相對誤差
酸度指標驗證集樣品預測結果如圖9 所示,可以看出,總體上入窖酸度較低,出窖酸度較高,有個別樣本出窖酸度偏低。預測結果與理化結果吻合度較高,有個別樣本誤差相對較大。

圖9 驗證集樣品酸度預測結果與理化值對比圖
對結果誤差進行統計分析,酸度指標90 %以上樣本絕對誤差<0.3 mmol/10 g,相對誤差<0.15,且相對誤差結果出窖優于入窖,但絕對誤差結果入窖略優于出窖,這是由于入窖樣本酸度值總體偏低,絕對誤差相對較小的原因。

圖10 驗證集樣品酸度絕對誤差與相對誤差
淀粉指標驗證集樣品預測結果如圖11 所示,可以看出,入窖淀粉較高,出窖淀粉較低,這是發酵過程中將淀粉轉換為了酸和水,預測結果與理化結果基本相符。

圖11 驗證集樣品淀粉預測結果與理化值對比圖
對結果誤差進行統計分析,淀粉指標90 %以上樣本絕對誤差<0.9 %,相對誤差<0.08,絕對誤差大小出入窖基本相同,但由于入窖數值較高,相對誤差結果入窖較好。
按照90%樣本計算,水分、酸度和淀粉的絕對誤差可分別控制在1.2%,0.3 mmol/10 g 和0.9%以內,相對誤差可分別控制在0.02、0.15 和0.08 以內,均符合生產中對酒醅重要成分檢測的精度要求。綜合來看水分預測的相對誤差最小,酸度預測的相對誤差較大,與近紅外方法對含量較高的成分預測相對準確,對含量較低的成分預測受噪聲影響誤差相對偏高相一致。這與模型RMSE 指標所表現出來的結果截然相反,因此用RMSE 指標對不同參數或不同數值范圍的結果進行評價不能反映結果的總體誤差水平。

圖12 驗證集樣品淀粉絕對誤差與相對誤差
綜上所述,本文基于SIMC-3120 便攜式近紅外光譜儀,在針對酒醅特點進行硬件和軟件優化的基礎上,采用多源散射校正(MSC)對光譜進行預處理,結合偏最小二乘法(PLS),以低成本方案建立了酒醅水分、酸度和淀粉的定性、定量分析模型,并對樣本進行了預測和模型分析。實驗結果顯示,對水分、酸度和淀粉的絕對誤差可以完全控制在1.2 %、0.3 mmol/10 g 和0.9 %以內,誤差分布結果與余松柏等相近,水分和淀粉指標略優于其結果,且建模所需樣本數大大低于其樣本數。若按平均絕對誤差值計算,水分、酸度和淀粉分別為0.53 %、0.14 mmol/10 g、0.45 %,與沈小梅等提出的固態酒醅平均絕對差值結果接近。本文采用的便攜式酒醅近紅外光譜檢測儀形小體輕、價格便宜、使用方便,檢測結果精度與進口儀器檢測結果相當,符合生產中對酒醅重要成分檢測的精度要求,能滿足酒醅參數準確檢測和快速配料的生產實際,可廣泛應用于各大、中、小型白酒企業。并且根據企業生產實際,隨著設備應用時間的增加,檢測數據量大,數據模型不斷校正,與人工檢測的相對誤差將越來越小。