










摘要 為了實現對復烤下機煙葉含水率的準確預測,提出了基于主成分分析法和BP神經網絡的煙葉含水率預測模型。首先,采用主成分分析法提取最具表征意義的復烤煙葉含水率特征因子,獲得特征矩陣。然后將特征矩陣輸入BP神經網絡,構建包括特征矩陣與復烤下機煙葉含水率的預測模型。仿真結果表明,提出的模型在復烤煙葉含水率預測方面呈現出顯著的預測能力,決定系數達0.92。文中方法可輔助優化煙葉復烤控制參數,提升復烤煙葉品質。
關鍵詞 煙葉;含水率;主成分分析;神經網絡;預測模型
中圖分類號 TP183;TS44+3 文獻標識碼 A 文章編號 0517-6611(2024)14-0219-04
doi:10.3969/j.issn.0517-6611.2024.14.045
Research on the Prediction of Tobacco Water Content Based on PCA-BP Neural Network
WU Hong1,KONG Ze-dong2,WANG Ruo-fang1 et al
(1.Huahuan International Tobacco Co., Ltd., Chuzhou, Anhui 239000;2. School of Smart City and Transportation, Southwest Jiaotong University, Chengdu, Sichuan 611730)
Abstract In order to realize the accurate prediction of the water content of the tobacco under the re-roasting machine, a tobacco water content prediction model based on principal component analysis and BP neural network was proposed. First, principal component analysis was used to extract the most characteristic factors of water content of re-roasted tobacco, and the feature matrix was obtained. Then, the feature matrix was input into BP neural network to construct a prediction model including the feature matrix and the water content of tobacco under re-roasting. The simulation results showed that the proposed model presented significant prediction ability in the prediction of water content of re-baking tobacco, and the coefficient of determination reached 0.92. By using this method, we could assist in the optimization of the control parameters of tobacco re-baking and the improvement of the quality of re-baking tobacco.
Key words Tobacco leaves;Moisture content;Principal component analysis;Neural network;Prediction model
作者簡介 吳宏(1980—),男,安徽無為人,工程師,從事煙草信息化研究。
收稿日期 2023-08-23;修回日期 2023-10-19
在打葉復烤生產過程中,煙葉含水率是重要的質量指標之一,復烤工序則是決定煙葉含水率的主要環節[1-3]。煙葉復烤過程具有大時滯、強耦合等特點,且面臨連續生產的實時性要求,因此在實際操作中需要依賴人工經驗設置控制參數,這使得煙葉含水率存在達不到生產要求的風險。煙葉含水率過高會導致煙葉無法滿足倉儲要求,煙葉含水率過低則會劣化煙葉品質,因此精準預測煙葉含水率對復烤工序控制參數的科學制定具有指導意義。
過去幾年,多篇文獻探索了BP神經網絡在煙葉含水率預測方面的作用。郭奇等[4]在研究中提出了一種基于多層感知器的煙絲含水率預測方法,通過隨機森林算法提取輸入特征,提高了預測模型的泛化能力。劉大衛等[5]在研究中對多個基于大數據算法的煙絲含水率預測模型性能進行了對比試驗。結果表明,BP網絡在煙絲含水率預測方面具有顯著的優勢。高立秀等[6]利用改進的BP神經網絡模型,通過反向傳播算法進行訓練,取得了較好的預測效果。此外,王龍柱等[7]在煙絲含水率預測中使用了RBF神經網絡,探討了特征選擇和模型參數調整對預測性能的影響。上述研究成果為理解神經網絡在含水率預測中的作用提供了有益信息,表明通過BP神經網絡預測模型可以實現煙葉含水率準確預測。盡管上述研究在煙葉含水率預測方面取得了顯著成果,但是這些研究成果大多集中在烘烤煙絲含水率模型的建立與應用領域,并未在復烤煙葉的含水率預測方面進行針對性探索,且上述研究仍然存在一些挑戰和不足之處,如沒有針對數據特征提取及模型泛化性能進行深入研究。鑒于此,筆者運用主成分分析方法(principal components analysis, PCA),基于復烤過程中采集的傳感數據進行特征提取,然后將提取特征輸入BP神經網絡模型,實現對復烤后煙葉含水率的準確預測。
1 BP神經網絡
BP神經網絡通過誤差反向傳播,實現對網絡中大量互相聯結神經元之間聯結權值的優化,具有優異的非線性擬合性能[8-9]。BP神經網絡拓撲見圖1。
2 PCA-BP神經網絡
BP神經網絡的輸入樣本涉及多維數據,存在多重共線性和冗余性,這將導致模型的訓練時間增加、工作效率降低以及預測精度下降[10-11]。為了有效應對這些問題,采用PCA進行特征提取。
特征提取的目標是從眾多數據中提取與問題最相關的信息,以創建1個僅包含最少自由參數的特征矩陣[12-13]。這些參數與關鍵特征相關聯,能夠生成具有良好泛化能力的模型。特征提取通常通過降維來實現,這是處理高維特征數據的預處理方法。降維的目標是保留主要特征,同時消除噪聲和不重要的特征,以提高數據處理速度。
基于PCA的特征提取基本做法是通過線性變換將由n個初始變量組成的n維隨機向量轉化為d(d<n)個新變量,即變換生成d個最終主成分因子,實現初始特征矩陣的降維。
PCA-BP神經網絡拓撲如圖2所示。
3 主成分分析
3.1 構建輸入樣本集
以安徽某復烤廠為研究對象,梳理該廠工藝流程,發現整個煙葉復烤工段分為9個工藝區域,即5個干燥區、1個冷卻區和3個回潮區。
每個干燥區設置獨立控制回路,維持區域內的熱風溫度。溫度傳感器測量通過加熱器后的熱風溫度,將測量信號傳輸至電控系統。電控系統比較測量值和設定值后,輸出4~20 mA的電信號至氣動薄膜調節閥的電氣轉換器,后者通過電信號和氣壓信號的轉換實現對氣動薄膜閥開度的實時調整,從而精確控制加熱器蒸汽進量,進而維持熱風溫度。
冷卻區的循環風溫度是通過控制冷熱風的混合比例實現的。溫度變送器監測循環風的溫度,并向電控系統發送信號。電控系統比較測量值與設定值后,通過調整伺服氣缸來實時調節風門開度,實現對冷熱風混合比例的控制。
操作人員主要通過手動或自動方式來控制混合噴嘴霧化水的流量來實現每個回潮區溫濕度的調整,并最終影響復烤下機煙葉含水率。
由上述復烤工藝流程可知,每個區域的溫濕度是影響烤后煙葉含水率的主要因素,同時環境溫濕度、烤前煙葉含水率、煙葉流量等也是不可忽視的因素,因此該研究選取與之相關的15個參數作為輸入樣本參數。
輸入樣本取自該廠MES系統實時采集數據,一共30條數據,其中部分樣本數據如表1所示。
輸入樣本共有14類數據,數據大小和量綱各不相同,在進行PCA之前,要進行歸一化處理。歸一化計算公式為:
xi=xi-xminxmax-xmin(1)
式中:xi是任意樣本;xmin是該類樣本中的最小值;xmax是該類樣本中的最大值。
3.2 PAC分析 在MATLAB平臺中對17個原始輸入樣本進行PCA分析,結果如表2所示。
由表2可知,前4個因子的累計方差值已經達到95.21%,因此取前4個因子作為BP神經網絡的輸入樣本。PCA處理中輸入樣本從原始的7個特征變量降到優化后的4個,這使BP神經網絡模型得到簡化,有助于提升模型預測精度。
主成分與原始特征的相關系數矩陣如表3所示。
由表3可知,主成分因子PC1主要與干燥區濕度、烤前水分、冷區水分和環境濕度相關,其相關系數大于0.90;主成分因子PC2主要與干燥區溫度相關,其相關系數均大于0.80,主成分因子PC3和PC4主要與環境溫度相關,相關系數分別為0.84和0.32。
使用表3系數對原始樣本進行計算,得到PCA變換后樣本。變換后的部分樣本如表4所示。
4 構建BP神經網絡
BP神經網絡由輸入層、隱含層和輸出層組成。輸入層
有4個神經元,對應4個主成分因子,隱含層神經元數為10,輸出層神經元數為1,對應烤后煙葉含水率。BP神經網絡結構如圖3所示。
在訓練前將30個輸入樣本數據分為3類: 訓練樣本20個、驗證樣本數據5個、測試樣本數據5個。 BP神經網絡的訓練過程如圖4所示。由圖4可知,神經網絡在經過10次迭代后, 訓練樣本數據的均方誤差(MSE)接近于0, 網絡完成收斂,最佳驗證樣本數據的均方誤差(MSE)為0.000 2。
BP神經網絡的回歸分析結果如圖5所示,4 個回歸分析的窗口分別代表訓練樣本、測試樣本、 驗證樣本與所有樣本。由圖5可知,表征全部樣本數據回歸分析的相關性R值等于0.917 28,說明BP神經網絡輸出的煙葉含水率數值與實測值具有極高的相關性。
統計BP神經網絡輸出含水率數值與實測值之間的誤差,繪制誤差柱狀圖如圖6所示。由圖6可知,大于90%的預測誤差值在零誤差線附近,這表明BP神經網絡模型的預測性能良好。
5 結語
針對復烤后煙葉含水率預測問題,該研究提出了PCA-BP神經網絡模型。該模型利用PCA對輸入數據進行變換,得到表征性最強的4個主成分因子,使用3層BP 神經網絡進行預測建模,模型決定系數R達到了92%。通過該模型能準確預測復烤后煙葉的含水率,可為復烤控制參數的科學制定提供了一種創新的數據驅動方法。
參考文獻
[1] 王懷宇,王立華,蔣維,等.煙葉復烤回潮有限元分析及工藝參數優化[J].科學技術與工程,2023,23(16):6993-7001.
[2] 包秀萍,王超,劉煜宇,等.打葉復烤不同工藝強度對煙葉自然醇化品質的影響[J].西南農業學報,2022,35(3):647-654.
[3] 李善蓮,陳良元,李華杰,等.復烤方式對煙片加工質量的影響[J].煙草科技,2012,45(10):5-8.
[4] 郭奇,鄧為權.基于RF-MLP的烘絲出口含水率預測[J].信息技術,2023(5):115-120.
[5] 劉大衛,夏永明,章立,等.建立基于大數據分析的葉絲切絲含水率預測模型[J].輕工科技,2022,38(4):1-4.
[6] 高立秀,陳得麗,萬興淼,等.基于機器學習的切絲后含水率預測及控制方法[J].食品與機械,2021,37(4):189-194,211.
[7] 王龍柱,馬洪晶,孫欽蘭,等.基于RBF神經網絡的葉絲生絲含水率預測[J].自動化與信息工程,2017,38(2):34-36,42.
[8] 卓鳴,汪鵬,望開奎.基于MIV-BP神經網絡的成品煙絲質量預測模型構建[J].食品與機械,2021,37(12):161-166,214.
[9] 李崢,王建峰,程小強,等.基于BP神經網絡的烤煙外觀質量預測模型[J].西南農業學報,2019,32(3):653-658.
[10] 許永,李超,楊乾栩,等.基于BP神經網絡建立初烤煙葉主流煙氣中氫氰酸釋放量的預測模型[J].云南農業大學學報(自然科學),2018,33(1):72-78.
[11] 陸玉浩,王彬彬,萬云飛,等.基于神經網絡的煙絲填充值預測模型研究[J].中國煙草科學,2016,37(5):82-86.
[12] 梁海玲,白森,李堅.基于魯棒稀疏PCA的工業異常檢測[J].科學技術與工程,2022,22(15):6164-6171.
[13] 姚學練,賀福強,平安,等.基于PCA-GA-SVM的煙葉分級方法[J].煙草科技,2018,51(12):98-105.