王樂軍,王林枝,牛燕麗
(湖北中煙工業有限責任公司武漢卷煙廠,湖北 武漢 430000)
烘絲工藝為卷煙制絲工藝的主要工序,一般通過烘絲筒實現[1]。烘絲筒將煙草葉絲通過加熱、干燥等流程,使煙草葉絲含水率符合工藝標準,從而增加煙草葉絲的彈性與填充功能、提升煙草葉絲成品質量[2]。但由于烘絲筒內影響煙草葉絲含水率的因素較多,如烘絲之前煙草來料水分不確定、烘絲筒受外界環境作用以及筒內環境變化大等,可能造成葉絲含水率結果不準確[3]。因此,對烘絲筒出口煙草葉絲含水率的精準預測十分重要[4]。
眾多學者對此展開研究。卓鳴等[5]將葉絲含水率作為衡量煙草質量的指標,先通過反向傳播(back propagation,BP)神經網絡構建煙草質量預測模型,再利用平均影響值挑選煙草制絲工藝參數,最后經BP神經網絡實現煙絲成品質量預測。該方法預測誤差為5.33%,預測精度較高。但該方法僅研究單一品牌煙絲質量預測,具有一定限制性。李文偉等[6]通過雙層指數加權移動方法構建煙草葉絲含水率預測模型,經自適應方法優化該預測模型,以提升葉絲含水率預測效果。但該預測模型只研究了溫濕度對葉絲含水率的影響,而未考慮煙草水分等其他烘絲工藝參數對葉絲含水率的影響。因此,該預測模型未全面考慮影響含水率預測的因素。
機器學習屬于人工智能科學,可在經驗學習中提升學習效率,并且完成人類無法完成的工作。機器學習可精準識別某些數據潛在趨勢,完成大規模數據的預測和估計。因此,本文構建基于極限學習機(extreme learning machine,ELM)的烘絲筒出口葉絲含水率預測模型。該模型在輸入烘絲工藝參數后,采用差分進化(differential evolution,DE)算法尋找單隱含層前饋神經網絡的隱含層最優神經元數量;在最小二乘法求解作用度平均值后,二次改進隱含層到輸出層的輸出權重;通過精準的葉絲含水率預測,保障葉絲烘干結果符合生產標準。
烘絲前工藝處理如圖1所示。

圖1 烘絲前工藝處理圖
烘絲前工藝處理流程如下。
①挑選含水率預測所需烘絲筒出口葉絲有效數據。烘絲筒出口葉絲含水率結果不僅與當前烘絲工藝有關,還受烘絲前各工藝參數影響[7]。因此,可將當前烘絲工藝參數與烘絲前松散回潮、預混柜、潤葉加料、貯葉柜、切絲過程中溫濕度、加水比例等工藝參數作為烘絲筒出口葉絲含水率預測的有效數據[8-9]。
②無量綱化處理。為保障烘絲筒的溫濕度和加水比例等工藝參數的單位一致性,對各項工藝參數實施無量綱化處理[10-11]。烘絲筒工藝參數無量綱化的過程如下:含水率除以28%;環境溫度除以35 ℃;環境濕度除以75%;加水比例除以6.5 L/100 kg。本文將以上4個變量經除法計算后的數值作為烘絲筒工藝參數無量綱化處理結果。
經無量綱化處理后,用于烘絲筒出口葉絲含水率預測的工藝參數分別為:松散回潮流程中的加水比例x1、出口葉絲含水率x2、環境溫度x3和濕度x4;預混柜中的存儲時間x5、環境溫度x6與濕度x7;潤葉加料過程中的入口和出口葉絲含水率x8和x9、環境溫度x10和濕度x11;貯葉柜的存儲時間x12、環境溫度x13和濕度x14;烘絲過程中的環境溫度x15和濕度x16。由上述16個工藝參數構建的初始烘絲筒烘絲工藝參數為x={x1,x2,…,x16}。
本文利用隨機森林模型進行烘絲筒內烘絲工藝參數評估,以篩選工藝參數。鑒于烘絲筒烘絲工藝參數之間具有耦合關聯性,采用基本的皮爾遜相關系數難以表達各工藝參數之間的關聯。因此,本文利用隨機森林模型對上述16種烘絲工藝參數重新排序后,選擇作用較大的烘絲工藝參數來提升烘絲筒出口葉絲含水率預測精準性以及泛化能力。
隨機森林模型通過平均精準度值的大小對各烘絲工藝參數進行排序,將各工藝參數進行隨機打亂處理。處理結果表明,打亂后的烘絲工藝參數的預訓練精確性越低,則該烘絲工藝參數對葉絲含水率的作用越大。平均精準性降低的烘絲工藝參數排序具體流程如下。
①將烘絲工藝參數數據分成測試集與訓練集。測試集與訓練集比例分別為25%、75%。
②將隨機森林模型通過訓練集數據進行訓練。根據測試集求解預訓練精準度,并設此時預訓練精準度是初始精準度,即擬合優度。設精準度真實值z的預訓練數值為z′、z與z′的擬合優度為R2(z,z′)。R2(z,z′)可作為預訓練模型,對測試集求解預訓練精準度。擬合優度數值越優,則預訓練模型越優。
③轉變此刻烘絲工藝參數的順序,并保持其他變量順序不變。求解此刻烘絲工藝參數打亂后的預訓練精準度,并將該工藝參數對葉絲含水率的作用度進行評分。評分結果Kscore為:
(1)

式(1)評分結果描述烘絲工藝參數的重要性。烘絲工藝參數重要性越高,則打亂后的烘絲工藝參數擬合優度越小,得出的評分結果也越高。
④將以上3個步驟不斷重復迭代,直到偶然誤差變為最小。通過式(1)求解16個烘絲工藝參數作用度,并計算各工藝參數作用度的平均值。隨機森林模型依據工藝參數作用度的平均值大小重新排序。作用度平均值未超過0.1的工藝參數可在后續葉絲含水率預測過程中忽略不計。
隨機森林選取烘絲工藝參數的平均作用度評分結果如表1所示。

表1 平均作用度評分結果
表1中:貯葉柜內環境溫度對烘絲筒整個烘絲工作流程作用效果最大;潤葉放料內入口葉絲含水率對烘絲筒內整個烘絲工作流程作用效果最小。為了防止過擬合,本文去除作用度未超過0.1的5種烘絲工藝參數,將剩余的11種工藝參數作為最終有效數據。本文設最終有效的烘絲工藝參數為c={c1,c2,…,c11},以提升出口葉絲含水率預測模型的泛化能力。
1.3.1 葉絲含水率預測
ELM屬于前向單隱層的機器學習方法。ELM內部由全連接層構成。內部隨機產生輸入權值和隱含層神經元偏置,經簡單矩陣求解可得出隱含層到輸出層的輸出權重。網絡輸入層內輸入數據為c={c1,c2,…,c11}。網絡輸出層輸出葉絲含水率。網絡輸入層神經元數量為a。隱含層神經元數量為l。輸出層神經元數量為m。
輸入和隱含兩層相關的連接權重ω為:
ω=[ω1,ω2,…,ωl]
(2)
式中:ωl為輸入層各神經元與隱含層第l個神經元的連接權重。
隱含和輸出兩層之間的連接權重β為:
β=[β1,β2,…,βl]
(3)
式中:βl為隱含層第l個神經元與輸出層各神經元的連接權重。
隱含層閾值b為:
b=[b1,b2,…,bl]
(4)
式中:bl為隱含層第l個神經元的閾值。
本文求解烘絲筒工藝參數c的網絡輸出結果,則烘絲筒出口葉絲含水率S為:
S=Hβ
(5)
式中:H為隱含層內輸出矩陣。
H的表達式為:
(6)

β=H+T
(7)
式中:H+為H的Moore-Penrose廣義逆,H+數值可利用正交投影以及奇異值分解等方式進行求解。當隱含層神經元數量與烘絲筒內烘絲工藝參數樣本數值相同時,式(5)中的S唯一解通過ELM運算得出,從而保障預測誤差以最小誤差接近求解結果。當烘絲筒內烘絲工藝參數樣本數量過大時,隱含層神經元個數需小于烘絲筒內烘絲工藝參數樣本數值,以便通過ELM求解烘絲筒出口葉絲含水率的最優解。
1.3.2 基于DE算法的ELM優化
烘絲筒出口葉絲含水率預測屬于實值預測情況。為保障葉絲含水率預測模型內預測數據與真實數據誤差最小化,本文將平均絕對百分比誤差(mean absolute percentage error,MAPE)和預測平均精準度(average precision,AP)作為葉絲含水率預測效果的評價指標。MAPE為預測數據向量減掉真實數據向量后的絕對值求解平均值。AP為誤差絕對值在0.3%的正確比率。在實際烘絲筒出口葉絲含水率預測過程中,葉絲含水率預測誤差應控制在0.5%以內。本文將0.3%的葉絲含水率預測誤差作為實際烘絲筒出口葉絲含水率預測過程中需滿足預測精確度的衡量標準。
MAPE和AP的運算結果如下[12]。
(8)
式中:DMAPE為MAPE運算結果;f(xe)、te分別為烘絲筒出口葉絲含水率預測數據與真實數據;n為測試數據容量,個。
(9)
式中:DAP為AP運算結果;N為烘絲筒出口葉絲含水率預測數據與真實數據誤差小于0.3%的概率函數。
為進一步提升ELM的葉絲含水率預測精度,本文采用DE算法尋找ELM的單隱含層前饋神經網絡的隱含層最優神經元數量,并以DMAPE最小作為適應度函數,優化ELM隱含層神經元數量,從而完成烘絲筒出口葉絲含水率的精準預測?;贒E優化的ELM過程如下。
(1)設置ELM結構參數中的ω、β和b等,以及DE內粒子變量維數I。
(2)初始化參數。設DE種群迭代次數最大值為emax,在描述DE種群大小之后,確定種群的縮放、交叉因子與鄰代維度交叉概率。
(3)在迭代次數o為1(即迭代開始)時,將ELM隱含層神經元數量作為DE內原始種群粒子,通過式(8)求解種群粒子適應度值。該求解過程即為用DE算法優化ELM隱含層神經元數量的過程。通過該過程可以實現最優ELM參數獲取,并提升烘絲筒出口葉絲含水率預測效果。
(4)按照設置的emax數值開始進行迭代。
①進行DE種群差分方差計算。若種群方差E大于設置閾值E0,則進入步驟②;若E小于E0,則進入步驟③。
②通過標準差分算法內突變、交叉和選擇,求解DE種群粒子的子代種群并將其儲存在矩陣WDE內。依據式(8)求解矩陣ΩΔE內各粒子適應度,將該粒子適應度與其相對父代種群G內相應的粒子進行比較,得出具有最佳粒子適應值的粒子(記作最優粒子Gbest)。隨機選取一對粒子維數R,將R與最優粒子變異概率PA比較。若R>PA,則通過DE算法對Gbest進行尋優和更新;反之,則進入步驟(5)。
③隨機配對DE種群粒子的所有維數(共0.5D對),并任意抽取1對維數。當R()
(5)若o 為驗證基于ELM的烘絲筒出口葉絲含水率預測模型結果的精準性和有效性,本文以某品牌煙草為試驗對象、采用SH626型號烘絲筒進行烘絲操作。試驗選取該品牌煙草6個月內生產樣本746批;設置采集樣本時間間隔為15 min、每次采集煙草葉絲質量為1 kg;設置烘絲筒內烘絲過程的生產條件中,烘絲筒內蒸汽流量為600 kg/h、防潮負壓為-1.5×10-8MPa。試驗隨機選取該品牌煙草葉絲樣本,并依據本文方法進行烘絲筒出口葉絲含水率預測。 烘絲筒烘絲工藝參數如表2所示。 表2 烘絲筒烘絲工藝參數 表2內烘絲筒工藝參數經無量綱化處理后輸入ELM內進行預測訓練,可以得出樣本1~樣本3的烘絲筒出口葉絲含水率分別為12.3%、13.8%、11.9%。由表2可知,本文模型利用隨機森林模型有效篩選出了用于烘絲筒出口葉絲含水率預測的工藝參數,并結合機器學習模型獲取了各樣本在烘絲筒出口的含水率預測結果。 為驗證本文模型的預測精度、避免隨機性及偶然性影響,本文選取某品牌煙草生產樣本35個,并將0.3%的葉絲含水率預測MAPE作為試驗中烘絲筒出口葉絲含水率預測過程中需滿足預測精確度的衡量標準。試驗將本文模型葉絲含水率預測值與實際值進行對比。 烘絲筒出口葉絲含水率預測數據如圖2所示。 圖2 烘絲筒出口葉絲含水率預測數據 由圖2可知,本文模型葉絲含水率預測值與實際值之間的MAPE始終處于0.3%范圍內。試驗結果表明:本文模型的烘絲筒出口葉絲含水率預測誤差滿足葉絲含水率預測精確度衡量標準。本文模型具備較高的泛化能力。其精準的含水率預測有助于在烘干過程中進行工藝參數控制,提升葉絲烘干效果。 本文隨機抽取3個通過本文模型進行烘絲筒出口葉絲含水率預測后的煙草葉絲樣本進行感官質量評價。感官質量評價分值超過85表示煙草樣本為合格品、低于85表示煙草樣本不合格。 煙草葉絲樣本感官質量評價結果如表3所示。由表3可知,3個煙草樣本葉絲質量感官評價總分分別為89.61、89.96、89.84。通過本文模型預測后的煙草樣本均滿足感官質量評價標準,煙草樣本均為合格品。試驗結果表明:本文模型精準的烘絲筒出口葉絲含水率預測結果,可有效輔助相關烘絲操作人員及時調整烘絲過程中的各項工藝參數,提升煙草葉絲生產質量。 表3 煙草葉絲樣本感官質量評價結果 本文構建機器學習的烘絲筒出口葉絲含水率預測模型,為提高煙草葉絲生產質量提供數據支撐。該模型通過選取合適的烘絲筒烘絲工藝參數,結合機器學習實現烘絲筒出口葉絲含水率預測。試驗結果表明:本文模型可有效應用于葉絲含水率預測,并保障預測誤差控制在標準范圍內,助力提升煙草生產品質、增加工廠經濟效益。該模型應用的機器學習在線上更新方面略顯不足。后續研究將優化機器學習的線上更新能力,并進一步完善烘絲筒出口葉絲含水率預測模型,以提升預測精度。2 試驗分析



3 結論