徐 俊,李 強,馬盛力,黃 慧,陳 偉,詹 映
(1.上海煙草集團有限責任公司上海煙草儲運公司,上海 200439;2.上海創和億電子科技發展有限公司,上海 200092)
原煙經過打葉復烤加工后,將200 kg 的成品片煙打包成箱,箱裝片煙的水分應控制在11%~13%。為了在投料生產前讓煙葉原料的外觀質量、內在品質、感官品質等各方面得到顯著改善,需要讓煙葉在適宜的倉儲養護環境下經過1~3 年的自然醇化[1-4]。但煙葉在庫貯存的過程中伴隨著客觀貯存環境、貯存地區氣候變化等因素,尤其是寒冷、高溫、潮濕等易導致倉儲環境的溫濕度大幅變化,會導致煙葉含水率發生變化[5-9]。含水率變化不僅影響煙葉醇化過程中的品質變化,煙葉損耗更會造成經濟損失,因此關注在庫貯存的煙葉的水分變化就顯得尤為重要[10-12]。
在煙葉醇化過程中,因受客觀倉儲條件限制,倉管人員的常規做法是根據作業標準和工作經驗預防煙葉霉變[13-15],盡管在庫普查和日常檢查時可以發現部分霉變情況,但是在不翻垛的情況下僅能檢查頂層煙箱。而底樓倉間貨垛的底層煙箱尤其容易產生濕底霉變等現象,但在不翻垛的前提下卻難以對底層煙箱進行有效檢查。因此,大部分發生霉變的煙葉是在出庫檢查環節,通過開箱查驗來判定的,此時已經造成煙葉損耗不可逆轉的結果,不僅導致了煙葉原料的浪費,更是干擾了卷煙配方生產的正常供應[16-19]。
因此,及時掌握煙葉原料水分變化情況,從而及時采取有針對性的養護措施,是煙葉原料防霉變的必然要求。目前,在煙葉原料倉儲環節,水分檢測主要是通過手感法和烘箱法進行。手感法個人主觀性強,個體檢測準確性差異較大,需要檢測人員具備較高的技能和經驗。烘箱法準確性高,但這是一種離線檢測方法,環節多、耗時長,無法滿足大面積檢測庫存煙葉水分的需要。此外,這兩種方法都存在一個問題,當需要檢查底層煙箱內煙葉的含水率時,需要搬運煙箱,這將耗費大量的人力、物力,因此需要一種不需要開箱即可準確探測煙箱內部煙葉含水率的技術[20-28]。
微波是一種電磁波,頻譜范圍為300 MHz~300 GHz,具有較強的穿透性,微波分析儀具有操作簡單、檢測速度快、樣本制作簡單、樣本浪費少的特點。微波水分儀是利用微波穿透法實現水分檢測的[29-36],當微波通過含水物料和干燥物料時,微波在傳播方向上的傳播速度和強度會發生不同的變化,含水物料會使微波的傳播速度變慢,強度減弱,通過檢測穿過物料后微波的兩種物理性質變化來計算物料中的水分含量。微波水分儀是基于ARM 平臺的全自動在線檢測系統,其能夠實現實時精確監測水分,可以作為工業流程自動化控制中的紐帶,持續提供可靠的水分數據。
材料:試驗選取2020 年貴州中部煙112 個樣品,上部煙100 個樣品,下部煙100 個樣品;黑龍江中部煙100 個樣品,總共412 個煙葉樣品。
儀器:德國哈爾卡森公司的微波水分儀,德國MMM Venticell 111 烘箱,賽多利斯電子天平CPA324S(精度0.1 mg)。
1.2.1 微波頻譜的測定
采用德國哈爾卡森公司的微波水分儀測量煙箱的頻譜,用微波水分儀分別測量煙箱其中一個角的上、中、下三點,得到三條頻譜后求平均頻譜,代表這個煙箱樣品的微波水分儀頻譜值。
1.2.2 含水率的測定
采用實驗室烘箱測量樣品標準數據,將測量完頻譜三個點的樣品各取一小把,大約20 g 左右,磨粉后,用天平稱取10 g 左右,放入烘箱中,溫度設置100 ℃,2 h 后取出樣品,用天平稱重后,進行含水率的換算,并將結果作為對應樣品含水率的標準數據。含水率(%)=(樣品稱重前質量-樣品稱重后質量)/樣品稱重前質量*100%。
1.2.3 微波頻譜預處理方法
在使用微波水分儀檢測煙葉時,采集的信息中除含有樣品的原始的化學信息外,還包含其他外在的干擾信息和噪聲,二階導數計算可以減少基線偏移、漂移和背景干擾造成的數據偏差。
二階導數計算公式如下:
式中,g為導數窗口的寬度;i是某個樣品數;x是導數前的頻譜頻率值;X是導數后的頻譜頻率值。
1.2.4 蒙特卡洛偏最小二乘交叉檢驗法
異常樣本在微波水分儀整個模型的構建過程中會對模型存在很大的影響,這些奇異值會給模型的參數估計帶來偏離,降低模型的精度與穩健性。蒙特卡洛偏最小二乘交叉檢驗法充分利用統計學的性質,能夠檢測頻譜的奇異點。
算法具體步驟:1)用偏最小二乘法(PLS)確定最佳主成分數;2)用蒙特卡洛隨機取樣法取80%的樣本作為校正集,建立PLS 回歸模型,剩余部分作為預測集;3)循環2 000 次,得到各樣本的一組預測殘差;4)求各樣本預測殘差的均值與方差;5)若樣本偏離主體,則從校正集中剔除。
1.2.5 偏最小二乘法(PLS)建模
1)設M為所有微波水分儀測得的頻譜矩陣,S為對應的含水率。首先對M、S數據集進行標準化,記作V0、H0。
2)記t1是V0的第一個成分,t1=V0ω1,ω1是V0的第一個軸,為一個單位向量,即有||ω1||=1。
記u1是H0的第一個成分,u1=H0c1,c1是H0的第一個軸,為一個單位向量,即||c1||=1。
3)實施V0和H0在t1上的回歸:
式(3)中,是V0在t1上的回歸系數矩陣,V1是回歸殘差矩陣。式(4)中,是H0在t1上的回歸系數矩陣,H1是回歸殘差矩陣。
然后,依據最小二乘回歸求得:
同理可得r1:
4)回歸殘差矩陣分別記作V1和H1,提取含水率數據殘差成分ω2:
然后,求第二個軸ω2和c2以及第二個成分t2和u2:
同理,實施V1和H1在t2上的回歸:
5)求成分th=Vh-1ωh,ωh是矩陣最大特征值所對應的特征向量。如果根據交叉有效性,確定共抽取h個主成分t1,…,th可以得到一個滿意的預測模型。則求H0在t1,…,th上的普通最小二乘回歸方程為:
分別用馬氏距離法、半數重采樣法、蒙特卡洛偏最小二乘交叉檢驗法三種異常樣本剔除方法對采集的頻譜和含水率進行異常樣本剔除對比分析,選擇不同的異常樣本剔除法建立偏最小二乘法(PLS)模型的結果,如表1 所示。結果表明,采用蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本建立的偏最小二乘法(PLS)模型不僅校正標準偏差(RMSEP)最小,而且相關系數最大。因此,使用蒙特卡洛偏最小二乘交叉檢驗法不僅提高了模型的預測精度,而且還大大降低了異常樣本帶來的模型復雜性,使模型得到簡化、穩定性好,能有效地反映煙葉水分信息。

表1 不同異常樣本剔除方法所建立的模型結果對比
取貴州中部煙112 個樣品的頻譜與對應的含水率,含水率分布如圖1 所示。用二階導數預處理方法剔除基線偏移、漂移和背景干擾,然后用蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本,剔除6 個異常樣本后,如圖2 所示。剔除異常樣本后總樣品數量為106個。隨機選取總樣品的85%即90 個樣品建模,總樣品的15%即16 個樣品進行驗證,如圖3 所示。然后用偏最小二乘法(PLS)建模,主成分選擇5 個,建立的模型情況如圖4 所示。

圖1 貴州中部煙含水率分布

圖2 貴州中部煙蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本

圖3 貴州中部煙校正和驗證樣本分布

圖4 貴州中部煙模型
從圖2 中剔除大部分異常樣本后,由圖3 可以看出驗證集樣本分布在建模集之內,圖4 顯示建模后校正集平均絕對誤差為0.24,校正集平均相對誤差為1.99%;驗證集平均絕對誤差為0.28,驗證集平均相對誤差為2.33%。
分別取貴州上、中、下部煙100、112、100 個樣品的頻譜與對應的含水率,含水率分布如圖5 所示。用二階導數預處理方法剔除基線偏移、漂移和背景干擾,然后用蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本,剔除3 個異常樣本,如圖6 所示。剔除異常樣本后總樣品數量為309 個。隨機選取總樣品的85%即263 個樣品建模,總樣品的15%即46 個樣品進行驗證,如圖7 所示。然后用偏最小二乘法(PLS)建模,主成分選擇5個,建立的模型情況如圖8所示。

圖5 貴州上中下部煙含水率分布

圖6 貴州上中下部煙蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本

圖7 貴州上中下部煙校正和驗證樣本分布

圖8 貴州上中下部煙模型
從圖6 中剔除大部分異常樣本后,由圖7 可以看出驗證集樣本分布在建模集之內,圖8 顯示建模后校正集平均絕對誤差為0.30,校正集平均相對誤差為2.44%,驗證集平均絕對誤差為0.29,驗證集平均相對誤差為2.40%。
分別取貴州上、中、下部煙100、112、100 個樣品以及黑龍江中部煙100 個樣品的頻譜與對應的含水率,含水率分布如圖9 所示。用二階導數預處理方法剔除基線偏移、漂移和背景干擾,然后用蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本,剔除2 個異常樣本,如圖10 所示。剔除異常樣本后總樣品數量為410個。隨機選取總樣品的85%即349 個樣品建模,總樣品的15%即61 個樣品進行驗證,如圖11 所示。然后用偏最小二乘法(PLS)建模,主成分選擇5 個,建立的模型情況如圖12所示。

圖9 貴州與黑龍江兩個產地煙含水率分布

圖10 貴州與黑龍江兩個產地煙蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本

圖11 貴州與黑龍江兩個產地煙校正和驗證樣本分布

圖12 貴州與黑龍江兩個產地煙模型
從圖10 剔除大部分異常樣本后,由圖11 可以看出驗證集樣本分布在建模集之內,圖12 顯示建模后校正集平均絕對誤差為0.27,校正集平均相對誤差為2.24%,驗證集平均絕對誤差為0.26,驗證集平均相對誤差為2.19%。
三個模型的建模情況及驗證情況如表2、表3所示。

表2 三個模型的校正情況

表3 三個模型的驗證情況
由表2、表3 可知,建立的三個模型相關性都在0.79 以上,相對誤差都在3%以下,對所建立的模型進行驗證,驗證相對誤差都在3%以下,而且數據量越多,驗證的相關性越高。上述結果表明,無論是基于貴州單部位煙葉建立的水分預測模型,還是基于貴州多部位煙葉建立的水分預測模型,抑或是基于貴州和黑龍江兩個產地煙葉建立的水分預測模型,模型的精度和穩定性都能滿足實際應用的需求。
1)在建立水分定量模型前,應首先剔除異常樣本,這些異常樣本可能含有信號值異常值或者異常水分組分,與其他樣本存在顯著差異。如果這些異常值參與建模,必然會降低含水率檢測分析結果的準確性和可靠性,因此需要將這些異常樣本剔除。采用蒙特卡洛偏最小二乘交叉檢驗法剔除異常樣本較采用其他方法效果更佳。
2)該試驗選擇了偏最小二乘法來建立三個煙葉水分校正模型,并對模型進行了驗證。結果表明,無論是用單產地單部位煙葉還是用單產地多個部位煙葉,或者是用多個產地的煙葉進行建模,所建立的模型的精度和穩定性都能夠滿足實際應用的需求。利用微波水分儀對儲存中的煙葉水分進行無損檢測分析,可減少人工測定所引起的誤差,大大縮短檢測時間,說明此方法可靠且準確,可有效地在不改變垛型、不移動煙箱、不破壞煙箱的情況下,實現煙垛棱邊煙箱內煙葉含水率的快速在線檢測,及時掌握煙葉水分變化情況,從而及時采取具有針對性的煙葉養護措施。