胡 涌, 彭海根, 劉 偉, 曹 君, 夏 凡, 付正義, 劉 洋,魯 平, 肖景元, 姚源黔, 杜鴻武, 黃 沙
(1. 貴州煙葉復烤有限責任公司,貴州 貴陽 550005; 2. 四川威斯派克科技有限公司,四川 成都 610041)
煙葉水分檢測貫穿于煙葉初烤、復烤、卷煙加工以及貯藏等煙草生產加工全部環節,是一項關鍵質量指標。YCT146——2010《煙葉 打葉復烤 工藝規范》[1]規定復烤成品煙葉制品的含水率為11%~13%,含水率的高低對后續煙葉加工、運輸和貯存有直接影響。打葉復烤企業常規煙葉水分檢測方式主要分為實驗室檢測和在線檢測,其中實驗室檢測主要使用標準烘箱或布拉本德快速烘箱干燥法,雖然兩種檢測方法穩定性好且精度高,但是檢測周期都較長,不能滿足煙葉復烤生產快速檢測的需求。微波水分儀在煙葉復烤過程中可以實時檢測煙葉水分,但方法穩定性和準確性難以滿足煙葉生產需求,主要用于生產過程中煙葉水分預判和指導。
近紅外光譜分析技術作為一種方便、快捷、客觀準確的檢測技術[2],已經廣泛應用于煙葉中主要成分(如總糖、還原糖、煙堿、總氮等物質含量)的檢測[3-8],且應用近紅外檢測時,1~2 min便可以給出檢測結果,非常適合打葉復烤快速檢測的要求。應用近紅外光譜分析技術時,主要難點為校正模型的建立、優化和后期模型維護。本文將貴州煙葉復烤有限責任公司下屬6個復烤廠相關數據進行有效整合和提取,建立具有良好穩健性和準確性且滿足煙葉復烤生產需求的近紅外校正模型,實現快速、準確檢測成品煙葉水分,縮短檢測時間,實現生產過程中的煙葉復烤過程水分檢測實時監控,提高產品質量,滿足煙葉生產和客戶個性化需求。
Antaris II傅里葉變換近紅外光譜儀(美國Thermo Fisher公司);Mettler AT-200電子天平(美國Mettler-Teledo公司);101-2A型電熱鼓風干燥箱(北京中興偉業儀器公司)。
煙葉樣品由貴州復烤集團下屬6個復烤廠按照統一要求進行收集并提供,樣品涵蓋各復烤廠生產周期的全部等級、產地范圍。使用煙葉粉碎機進行粉碎,要求粒度≤3 mm,隨后放入密封袋備用,共收集樣品2 661個。
各復烤廠都擁有相同型號Antaris II傅里葉變換近紅外光譜儀,且都按照統一要求和儀器參數掃描樣品光譜。儀器參數設置:1)光譜掃描范圍為:10 000 ~4 000 cm–1;2)分辨率:8 cm–1;3)光譜掃描次數:64次;4)光譜采集方式:積分球漫反射采集,參比采用儀器內置背景。測量過程中,溫度、濕度等環境條件盡量保持一致。樣品光譜圖如圖1所示。

圖1 樣品近紅外光譜圖
樣品收集,制備并采集光譜之后,各復烤廠按統一要求測定樣品水分值,且距光譜采集時間不超過48 h。樣品水分按標準烘箱干燥法進行測定,每個樣品平行測定兩次,以兩次平行測定的平均值作為測定結果,精確至0.01%,兩次平行測定結果絕對值之差大于0.10%的樣品進行剔除并按要求重新測定,烘箱水分參考值統計結果和分布直方圖分別見表1和圖2。

表1 水分參考值統計結果
表1和圖2顯示,樣品烘箱水分值分布范圍為9%~13%,但主要集中在11%~12%之間,且樣品水分值呈高斯分布。若這些樣品不加選擇直接參加校正模型的建立,預測時極有可能產生回歸預測結果趨向中心值現象[9],且樣品光譜庫數據過于龐大,不利于今后模型的更新和維護。本文采用K-S方法挑選模型驗證集和校正集:1)首先剔除異常光譜樣品,針對全部水分值范圍,應用K-S方法挑選模型驗證集,數量為100個;2)針對11%~12%水分值分布范圍,應用K-S方法挑選一定數量樣品作為校正集;3)其他范圍的樣品全部作為校正集參與建模;4)模型校正集數量共為900個。

圖2 樣品頻數分布直方圖
K-S方法[10]基于變量之間的歐氏距離,在特征空間中均勻選取樣本,把所有的樣本都看作校正集和驗證集候選樣本,并從中依次挑選樣本進入校正集和驗證集,本文中是將光譜作為特征變量。
采用K-S方法挑選后,校正集和驗證集的烘箱水分值統計結果和分布直方圖分別如表2和圖3所示。
圖3顯示,K-S方法挑選后校正集水分值分布情況得到改善,且實驗發現,經過K-S方法挑選后的校正集和驗證集同樣覆蓋了貴州復烤集團下屬復烤廠實際生產中復烤成品煙葉水分分布、產地和等級分布范圍,即方法不僅能有效改善樣品分布情況,且能保持建模樣品代表性,起到有效壓縮光譜數據庫的作用。
分別結合K-S方法挑選前后的校正集,建立不同廠家的成品煙葉近紅外水分模型。結合成品煙葉光譜數據的特點,應用化學計量學方法,采用PLS建模方法,結合不同光譜預處理方法,如矢量歸一化、導數、多元散射校正等,同時優選不同的近紅外譜區來建立水分模型,結合相關的模型評價參數,采用驗證集驗證方式,建立混合成品煙葉近紅外水分模型。詳細的建模參數見表3。

表2 K-S挑選后校正集和驗證集水分值統計結果

圖3 K-S方法挑選后樣品頻數分布直方圖
圖4和圖5分別是采用K-S方法挑選前模型校正集和驗證集烘箱水分參考值與預測值散點圖。
圖6是采用K-S方法挑選樣品前,模型交叉驗證過程中主因子與RMSECV的變化趨勢圖。
圖7和圖8分別是樣品經過K-S方法挑選后模型校正集和驗證集烘箱水分參考值與預測值散點圖。
圖9是采用K-S方法挑選建模后,模型交叉驗證過程中主成分數與RMSECV的變化趨勢圖。

表3 成品煙葉水分模型參數

圖4 K-S方法挑選前模型校正集參考值與預測值散點圖

圖5 K-S方法挑選前模型驗證集參考值與預測值散點圖

圖6 K-S方法挑選前模型交互驗證主因子數與RMSECV變化趨勢圖
上述結果顯示,應用K-S方法挑選校正集后建立的混合成品煙葉近紅外水分模型,預測偏差RMSEP由原來的0.36變為0.34,交叉驗證時R2由原來的0.73變為0.84,即模型相關性得到改善。
通常評價一種分析方法的誤差采用重復性和再現性指標。在應用近紅外光譜分析技術檢測成品煙葉水分時,雖然近紅外分析方法與常規分析方法不屬于同種方法,在定義上,再現性并不適用這兩種方法之間的比較,但根據RMSECV和RMSEP與常規分析方法再現性誤差的比較,可以基本判斷所建立的近紅外光譜分析模型是否可行或滿足實際工作的需要。在煙葉復烤中采用標準烘箱法測定煙葉水分值,方法只規定2次測量之間所允許的誤差為0.1%,即重復性要求,而沒有規定方法再現性誤差要求,通常再現性誤差是重復性誤差的3~6倍[11],表3顯示近紅外方法RMSECV和RMSEP均與常規方法的再現性相當,進一步說明近紅外方法模型預測結果與實際值一致。

圖7 K-S方法挑選后模型校正集參考值與預測值散點圖

圖8 K-S方法挑選后模型驗證集參考值與預測值散點圖

圖9 K-S方法挑選后模型交互驗證主因子數與RMSECV變化趨勢圖
為了進一步驗證模型的準確度和穩定性,分別從貴州復烤集團下屬6個復烤廠各隨機挑選5個樣品,共30個樣品,驗證得到平均絕對偏差為0.24%,RMSEP為0.27。
通過本文的研究得出如下結論:
1)在應用近紅外分析方法建模過程中,當樣品分布比較集中,呈高斯分布時,可以應用K-S方法挑選集中樣品,方法能有效改善樣品分布情況,且能保持建模樣品仍然具有代表性,同時方法還能達到壓縮建模光譜數據庫的作用。
2)對比應用K-S方法挑選前后的校正集建立統一成品煙葉近紅外水分模型,模型絕對系數R2由原來的0.73變為0.84,模型相關性得到改善。應用K-S方法挑選后校正集建立的成品煙葉近紅外水分模型RMSECV、RMSEP分別為0.33、0.34,均與常規方法的再現性相當,方法準確度和檢測效率滿足煙葉復烤生產需求。
3)針對煙葉復烤企業集團化的形式,應用近紅外分析技術時,可以結合K-S方法進行樣品挑選后再建立統一近紅外模型,模型建模數據得到有效壓縮,有助于企業后期近紅外模型管理和維護,具有明顯作用,方法可以推廣到其他集團化企業的近紅外檢測過程。
4)模型在實際應用過程中,預測各復烤廠隨機挑選的樣品,近紅外模型預測值和參考值平均絕對偏差為0.24%,RMSEP=0.27,總體來看近紅外模型預測和標準烘箱測量差異較小,即所建立校正模型具有實用價值,可以預測復烤煙葉水分值含量。