謝威煒,曹曦,蔣勉*,陳勇,黃瑋
基于BPNN-XGBoost組合模型的瓦楞紙板線濕部生產(chǎn)速度預(yù)測方法
謝威煒1,2,曹曦2,蔣勉2*,陳勇2,黃瑋3
(1.廣東東方精工科技股份有限公司,廣東 佛山 528520;2.佛山科學(xué)技術(shù)學(xué)院 機(jī)電工程與自動(dòng)化學(xué)院,廣東 佛山 528525;3.廣東佛斯伯智能設(shè)備有限公司,廣東 佛山 528520)
滿足瓦楞紙板行業(yè)日益?zhèn)€性化的定制需求,減小復(fù)雜多變的生產(chǎn)條件對瓦楞紙生產(chǎn)速度的影響,幫助企業(yè)合理安排生產(chǎn),提高生產(chǎn)線管控水平。首先對瓦楞紙板生產(chǎn)速度進(jìn)行重采樣,統(tǒng)一訂單參數(shù)和各傳感器參數(shù)采樣間隔,采用ButterWorth濾波器進(jìn)行高通濾波,并采用四分位距統(tǒng)計(jì)量方法篩選穩(wěn)定的濕部生產(chǎn)速度區(qū)間,提取B瓦和BC瓦的數(shù)據(jù),然后根據(jù)提取的數(shù)據(jù)使用BP神經(jīng)網(wǎng)絡(luò)和XGBoost預(yù)測濕部生產(chǎn)速度,并采用貝葉斯優(yōu)化和網(wǎng)格搜索分別尋優(yōu)2種模型的超參數(shù),最后使用粒子群算法組合2種模型的預(yù)測結(jié)果。實(shí)驗(yàn)結(jié)果表明,2個(gè)模型都具有一定的預(yù)測能力,其中XGBoost的預(yù)測效果更好,組合模型的預(yù)測效果最好。基于BPNN-XGBoost組合模型的方法能有效預(yù)測瓦楞紙板濕部生產(chǎn)速度,可指導(dǎo)實(shí)際生產(chǎn)。
瓦楞紙板;生產(chǎn)速度;預(yù)測模型;數(shù)據(jù)驅(qū)動(dòng);超參數(shù)尋優(yōu)
隨著我國經(jīng)濟(jì)社會(huì)的快速發(fā)展,瓦楞紙箱包裝在電商物流、日化等領(lǐng)域得到廣泛應(yīng)用,展現(xiàn)出巨大的發(fā)展前景[1]。同時(shí),基于市場中規(guī)格多樣化、高端化、個(gè)性化趨勢的逐步增強(qiáng),生產(chǎn)瓦楞紙板出現(xiàn)小批量、多批次的特點(diǎn),進(jìn)一步加大了生產(chǎn)過程的管控難度,亟需提高瓦楞紙板生產(chǎn)線的管控水平,以適應(yīng)當(dāng)前發(fā)展趨勢。瓦楞紙板生產(chǎn)線的生產(chǎn)參數(shù)較多,其中,濕部生產(chǎn)速度是體現(xiàn)效率和產(chǎn)量的重要指標(biāo),同時(shí)也會(huì)反映生產(chǎn)線的狀態(tài)。生產(chǎn)速度與定量、層數(shù)、瓦型、溫度、壓力等生產(chǎn)參數(shù)相互影響,需要進(jìn)行配合,以完成多樣化訂單的生產(chǎn)。建立瓦楞紙板各參數(shù)與生產(chǎn)速度的對應(yīng)關(guān)系模型,準(zhǔn)確預(yù)測瓦楞紙板的生產(chǎn)速度,不僅有助于提高生產(chǎn)效率,更好地應(yīng)對訂單結(jié)構(gòu)的變化,同時(shí)也能合理安排生產(chǎn)、減少調(diào)試時(shí)間、提高生產(chǎn)線管控水平,對于瓦楞紙板的高效綠色生產(chǎn)具有重要意義。
由于瓦楞紙板的生產(chǎn)線結(jié)構(gòu)和生產(chǎn)過程非常復(fù)雜,因此建立基于物理、化學(xué)的生產(chǎn)速度預(yù)測數(shù)學(xué)模型非常困難。根據(jù)生產(chǎn)線上各類傳感器采集的多維數(shù)據(jù)建立數(shù)據(jù)驅(qū)動(dòng)的預(yù)測模型是可行的,通過對比各項(xiàng)指標(biāo),選擇合適的預(yù)測模型可以精確預(yù)測濕部生產(chǎn)速度。目前,基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測模型在工業(yè)上得到廣泛研究和應(yīng)用。Dogan等[2]將制造業(yè)中運(yùn)用的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法進(jìn)行了總結(jié),針對制造過程的不同環(huán)節(jié)細(xì)致地進(jìn)行劃分,通過將數(shù)據(jù)和來源進(jìn)行分類,以解釋制造過程中數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD)的各個(gè)步驟。Cui等[3]詳細(xì)闡述了數(shù)據(jù)驅(qū)動(dòng)和大數(shù)據(jù)技術(shù)對制造業(yè)發(fā)展的巨大作用。Xu等[4]通過對比傳統(tǒng)模型和數(shù)據(jù)化模型,詳細(xì)闡述了數(shù)據(jù)驅(qū)動(dòng)模型框架,同時(shí)指出,為了支持?jǐn)?shù)據(jù)模型的建立,需要高度集中數(shù)據(jù),以此提升信息密度,更好地對數(shù)據(jù)進(jìn)行分類,這對于數(shù)據(jù)分析和建模至關(guān)重要。Ge[5]利用流程分解對不同流程進(jìn)行建模,以提高監(jiān)控系統(tǒng)的容錯(cuò)率和靈活性。Ghosh等[6]將動(dòng)態(tài)偏最小二乘法(DPLS)和偏最小二乘法(PLS)應(yīng)用于工業(yè)煉油加氫裝置,證明前者在輸入低頻參數(shù)時(shí)具有較高的準(zhǔn)確性。Hofmann等[7]針對敏感熱能存儲(chǔ)設(shè)備,分別建立了物理模型和數(shù)據(jù)驅(qū)動(dòng)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN),對比二者發(fā)現(xiàn),它們均能夠很好地預(yù)測設(shè)備的運(yùn)行情況,但在數(shù)據(jù)足夠的前提下,數(shù)據(jù)驅(qū)動(dòng)模型具有更好的適應(yīng)性和靈活性,節(jié)省了大量時(shí)間。Tsay等[8]根據(jù)歷史數(shù)據(jù),對低溫空分設(shè)備進(jìn)行動(dòng)態(tài)建模,大幅減少了電費(fèi)。Alsina等[9]使用神經(jīng)網(wǎng)絡(luò)(NN)、支持向量機(jī)(SVM)、隨機(jī)森林(RF)等方法,利用傳統(tǒng)可靠性估計(jì)函數(shù)預(yù)測了工業(yè)生產(chǎn)中元件的可靠性。結(jié)果表明,機(jī)器學(xué)習(xí)方法(特別是RF)的預(yù)測能力很強(qiáng),且具有較高的精度,在增大數(shù)據(jù)集的情況下機(jī)器學(xué)習(xí)方法具有更大的優(yōu)越性。林利紅等[10]建立了電阻爐理論能耗預(yù)測模型,利用粒子群優(yōu)化算法(PSO)對支持向量回歸的超參數(shù)進(jìn)行尋優(yōu),建立了基于支持向量回歸的多參數(shù)能耗預(yù)測模型,并對比了支持向量回歸、高斯過程回歸等模型。結(jié)果表明,在粒子群優(yōu)化下支持向量回歸多參數(shù)能耗預(yù)測方法具有良好的效果。
雖然數(shù)據(jù)驅(qū)動(dòng)模型已大范圍應(yīng)用于工業(yè)領(lǐng)域,但是在瓦楞紙板制造領(lǐng)域(尤其是生產(chǎn)線濕部)的速度預(yù)測方面未見報(bào)道。由此,文中提出一種基于BP神經(jīng)網(wǎng)絡(luò)(BPNN)和XGBoost的組合模型預(yù)測方法,采用粒子群算法優(yōu)化BPNN和XGBoost模型的組合系數(shù),實(shí)現(xiàn)瓦楞紙板生產(chǎn)線濕部生產(chǎn)速度的預(yù)測。原始數(shù)據(jù)采用某瓦楞紙板制造企業(yè)的某型瓦楞紙板4~11月濕部生產(chǎn)線采集數(shù)據(jù)進(jìn)行數(shù)據(jù)驅(qū)動(dòng)建模,并測試其預(yù)測精度。
可將傳統(tǒng)的瓦楞紙板生產(chǎn)線分為濕部和干部,濕部主要由單面機(jī)、雙面機(jī)、接紙機(jī)、原紙架組成,主要負(fù)責(zé)瓦楞紙板的熱壓成型、里紙/瓦紙粘合等;干部主要由輪切機(jī)、縱切機(jī)、橫切機(jī)、堆疊機(jī)等組成,主要負(fù)責(zé)瓦楞紙板的裁切、堆疊、烘干等。瓦楞紙板的生產(chǎn)過程:原紙分別通過接紙機(jī)和原紙架進(jìn)入單面機(jī),通過熱壓形成瓦楞,再經(jīng)過單面機(jī)內(nèi)的上膠系統(tǒng)將瓦紙與里紙粘合,形成一層瓦楞和里紙,再經(jīng)過雙面機(jī)粘合一層里紙,進(jìn)入裁切、堆疊系統(tǒng),從而加工成瓦楞紙板。瓦楞紙板生產(chǎn)線的濕部結(jié)構(gòu)如圖1所示。

圖1 瓦楞紙板生產(chǎn)線濕部結(jié)構(gòu)
BPNN指誤差反向傳播神經(jīng)網(wǎng)絡(luò),包含3層結(jié)構(gòu):輸入層(1層)、隱含層(1層或多層)、輸出層(1層),其結(jié)構(gòu)如圖2所示。其基本思想包含2個(gè)過程:由輸入層信號(hào)正向傳播,實(shí)際輸出與期望輸出的誤差反向傳播。在正向傳播時(shí),信號(hào)通過相鄰兩層神經(jīng)元間的權(quán)重和偏置產(chǎn)生線性組合,再經(jīng)過非線性激活函數(shù)產(chǎn)生下一層神經(jīng)元的輸入,最終到達(dá)輸出層。在反向傳播時(shí),通過計(jì)算輸出層損失函數(shù),調(diào)整各層權(quán)重和偏置,再經(jīng)過正向傳播減小實(shí)際輸出與期望輸出的誤差。通常將誤差收斂程度或模型迭代次數(shù)作為終止訓(xùn)練的條件。

圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
Fig.2 BP neural network structure
XGBoost是一種典型的boosting集成學(xué)習(xí)算法,被廣泛應(yīng)用于各類分類回歸任務(wù)中。該方法根據(jù)訓(xùn)練樣本特征情況,不斷分裂出子樹,擬合上次訓(xùn)練殘差,直到達(dá)到最大迭代次數(shù)或殘差不再減小[11]。詳細(xì)推導(dǎo)如下。
設(shè)訓(xùn)練集中有個(gè)訓(xùn)練樣本,樣本特征均為個(gè)。在第棵樹時(shí),第個(gè)樣本最終預(yù)測值的計(jì)算見式(1)。

式中:f(x)為樣本x在第棵樹的預(yù)測值。
由式(1)可將損失函數(shù)定義為式(2)。

為了提高泛化能力,加入正則項(xiàng),可得XGBoost的目標(biāo)函數(shù),見式(3)。

式中:為葉子節(jié)點(diǎn)數(shù)量;為葉子結(jié)點(diǎn)值;、為系數(shù)。
為了使式(4)得到最小值,用泰勒二階對式(2)展開近似計(jì)算,其中g、h的計(jì)算分別見式(5)~(6)。






確定最優(yōu)葉子節(jié)點(diǎn)值后,采用貪心算法確定節(jié)點(diǎn)最優(yōu)劃分方法。對每個(gè)葉子節(jié)點(diǎn)枚舉所有特征和單特征的分裂點(diǎn)進(jìn)行分裂,計(jì)算分裂收益。根據(jù)收益確定最優(yōu)分裂特征和最優(yōu)分裂點(diǎn),優(yōu)先選擇具有更大收益的分裂特征和分裂點(diǎn)。收益的計(jì)算見式(9)。


這里研究的瓦楞紙板濕部生產(chǎn)線主要由2臺(tái)單面機(jī)、1臺(tái)雙面機(jī)、原紙架、接紙機(jī)、預(yù)熱缸和上膠機(jī)組成,可以生產(chǎn)3層和5層瓦楞紙板,瓦型分別為B型和BC型,標(biāo)準(zhǔn)生產(chǎn)速度分別為300、250 m/min。分別對B型和BC型瓦楞紙板的生產(chǎn)速度進(jìn)行建模,選擇雙面機(jī)、預(yù)熱缸和上膠機(jī)采集的數(shù)據(jù)及生產(chǎn)材質(zhì),共12個(gè)特征。其中,BC瓦的輸入特征有11個(gè),即生產(chǎn)材質(zhì)、雙面機(jī)上膠單元上層上膠間隙、雙面機(jī)上膠單元下層上膠間隙、雙面機(jī)1段熱板蒸汽壓力、雙面機(jī)1段壓板壓力、雙面機(jī)2段熱板蒸汽壓力、雙面機(jī)2段壓板壓力、雙面機(jī)3段熱板蒸汽壓力、雙面機(jī)3段壓板壓力、雙面機(jī)4段壓板壓力、雙面機(jī)冷段壓板壓力;B瓦的輸入特征有10個(gè),無雙面機(jī)上膠單元上層上膠間隙這個(gè)特征。2種類型的輸出特征均為濕部生產(chǎn)速度。
在生產(chǎn)線數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)主要有生產(chǎn)過程數(shù)據(jù)、訂單號(hào)、生產(chǎn)材質(zhì)等信息。由于各傳感器的采樣方式和采樣時(shí)間不同,無法直接作為特征數(shù)據(jù)使用,因此需要預(yù)處理[12]。原始數(shù)據(jù)主要存在如下問題。
1)各傳感器的采集方式和采樣間隔時(shí)間不同,因此無統(tǒng)一尺度的綜合數(shù)據(jù)。
2)針對小批量、多樣性的生產(chǎn)訂單,需要頻繁減速、加速和停機(jī),提高了預(yù)測模型建模難度。
3)B型和BC型混合生產(chǎn)時(shí)不便于分類預(yù)測。
針對以上問題采用如下解決方案。
1)根據(jù)實(shí)際采樣情況,以1 s為間隔時(shí)間對濕部生產(chǎn)速度進(jìn)行重采樣,建立統(tǒng)一時(shí)間尺度,其余參數(shù)對照生產(chǎn)速度的時(shí)間采樣點(diǎn)進(jìn)行匹配,采用向下填充法擴(kuò)充數(shù)據(jù),得到時(shí)序生產(chǎn)數(shù)據(jù)。
2)采用Butterworth濾波器[13]對時(shí)序生產(chǎn)速度進(jìn)行高通濾波,再采用四分位距統(tǒng)計(jì)量方法篩選并刪除不穩(wěn)定區(qū)間,得到穩(wěn)定的生產(chǎn)速度區(qū)間,同時(shí)刪除對應(yīng)不穩(wěn)定區(qū)間的其他參數(shù)。
3)把處理后的數(shù)據(jù)基于B瓦和BC瓦分別建模。
在解決方案中,Butterworth濾波器的高通濾波傳遞函數(shù)見式(10)。

式中:為階數(shù),這里選擇二階Butterworth濾波,即=2;0為頻域原點(diǎn)到截止頻率的距離;()為點(diǎn)(,)到頻域原點(diǎn)的距離。
針對濾波后的數(shù)據(jù),采用四分位距統(tǒng)計(jì)量方法篩選不穩(wěn)定區(qū)間。計(jì)算得到濾波后的數(shù)據(jù),1=?0.000 074,3=0.000 064,=0.000 138。其中,1表示第1分位數(shù),3表示第3分位數(shù),表示四分位距。數(shù)據(jù)正常區(qū)間端點(diǎn)值:1?3×=?0.000 488,3?3×=0.000 478,正常區(qū)間為(?0.000 488, 0.000 478)。
如圖3a所示,上部分曲線為實(shí)測生產(chǎn)速度曲線,下部分曲線為經(jīng)過二階Butterworth濾波后得到的生產(chǎn)速度數(shù)據(jù)。顯然,經(jīng)濾波后保留了數(shù)據(jù)中的波動(dòng)部分。將濾波后的曲線與計(jì)算得到的數(shù)據(jù)正常區(qū)間進(jìn)行匹配,如曲線幅值落在區(qū)間外,則判定為不穩(wěn)定區(qū)間,并記錄不穩(wěn)定數(shù)值索引,其余則判定為數(shù)據(jù)穩(wěn)定區(qū)間。經(jīng)篩選后,局部結(jié)果如圖3b中不穩(wěn)定區(qū)間點(diǎn)所示。進(jìn)一步把篩選出的不穩(wěn)定數(shù)值索引與原時(shí)序生產(chǎn)數(shù)據(jù)對應(yīng),并刪除相應(yīng)索引,保留剩余的穩(wěn)定區(qū)間數(shù)據(jù)。部分穩(wěn)定濕部生產(chǎn)速度結(jié)果如圖3b中穩(wěn)定區(qū)間點(diǎn)所示,處理后部分?jǐn)?shù)據(jù)見表1。
再次清洗上述方法處理后的數(shù)據(jù),去除異常值和重復(fù)值。生產(chǎn)材質(zhì)采用One-Hot編碼,同時(shí)對所有數(shù)據(jù)進(jìn)行歸一化處理。經(jīng)處理后,B瓦的總數(shù)據(jù)集為70 600,劃分為訓(xùn)練集(63 540,90%)、測試集(7 060,10%);BC瓦的總數(shù)據(jù)集為179 490,劃分為訓(xùn)練集(161 541,90%)、測試集(17 949,10%)。
與基于人工經(jīng)驗(yàn)的傳統(tǒng)超參數(shù)調(diào)優(yōu)方法不同,這里采用網(wǎng)格搜索和貝葉斯優(yōu)化分別調(diào)優(yōu)XGBoost和BP神經(jīng)網(wǎng)絡(luò)超參數(shù)。網(wǎng)格搜索是一種窮舉搜索調(diào)優(yōu)方法,通過列舉所有設(shè)定超參數(shù)組合,結(jié)合交叉驗(yàn)證,得到最好的超參數(shù)組合。貝葉斯優(yōu)化[14]利用任意采樣點(diǎn)函數(shù)值,通過高斯過程等概率代理模型逐步構(gòu)建采集函數(shù),在此過程中會(huì)評估下一步應(yīng)該探索的點(diǎn),最終找到全局最優(yōu)值;能夠通過較少的搜索次數(shù)尋找到目標(biāo)函數(shù)的最優(yōu)值,針對復(fù)雜函數(shù)可以求得近似解,甚至最優(yōu)解。

圖3 平穩(wěn)濕部生產(chǎn)速度的篩選
表1 濕部生產(chǎn)速度預(yù)測特征及部分?jǐn)?shù)據(jù)

Tab.1 Prediction characteristics and partial data of wet end production speed
為了有效評估模型預(yù)測誤差,這里的預(yù)測指標(biāo)選用平均絕對誤差MAE、均方根誤差RMSE、平均絕對百分比誤差MAPE,計(jì)算見式(11)~(13)。



根據(jù)調(diào)優(yōu)方法和評價(jià)指標(biāo),調(diào)優(yōu)評價(jià)指標(biāo)均選用RMSE。通過網(wǎng)格搜索和交叉驗(yàn)證XGBoost的超參數(shù),調(diào)優(yōu)結(jié)果如表2所示。
BP神經(jīng)網(wǎng)絡(luò)采用一層隱含層和兩層隱含層,正則化項(xiàng)選用L2。通過貝葉斯優(yōu)化超參數(shù),調(diào)優(yōu)結(jié)果如表3所示。
表2 XGBoost的超參數(shù)最優(yōu)結(jié)果

Tab.2 Optimal results for hyperparameters of XGBoost
表3 BP神經(jīng)網(wǎng)絡(luò)貝葉斯優(yōu)化超參數(shù)的調(diào)優(yōu)結(jié)果

Tab.3 Tuning results of Bayesian optimization for hyperparameters of BP neural network
為了降低預(yù)測誤差,提高預(yù)測精度和穩(wěn)定性,這里采用基于粒子群優(yōu)化算法(PSO)[15]的并行加權(quán)組合預(yù)測模型[16-17]。具體步驟:統(tǒng)一所有傳感器數(shù)據(jù)、訂單數(shù)據(jù)的采樣間隔時(shí)間均設(shè)置為1 s,得到所有參數(shù)對應(yīng)的時(shí)序生產(chǎn)數(shù)據(jù);采用ButterWorth高通濾波法和箱線圖,刪除生產(chǎn)速度不穩(wěn)定生產(chǎn)區(qū)間,歸一化數(shù)據(jù),統(tǒng)一量綱,字符數(shù)據(jù)采用One-hot編碼,去除重復(fù)值;選擇生產(chǎn)材質(zhì)等11個(gè)數(shù)據(jù)作為輸入?yún)?shù),根據(jù)層數(shù)和種類將數(shù)據(jù)分為B瓦和BC瓦,最后分別將90%的數(shù)據(jù)作為訓(xùn)練集,將10%的數(shù)據(jù)作為測試集;選擇BP神網(wǎng)絡(luò)和XGBoost為預(yù)測模型,其中BP神經(jīng)網(wǎng)絡(luò)選擇3層和4層模型;針對2種BP神經(jīng)網(wǎng)絡(luò),采用貝葉斯優(yōu)化尋優(yōu)其超參數(shù),使用網(wǎng)格搜索和交叉驗(yàn)證選擇XGBoost超參數(shù);將2種模型的預(yù)測結(jié)果進(jìn)行組合,選擇粒子群算法尋優(yōu)組合模型權(quán)值。
采用粒子群算法對組合模型系數(shù)進(jìn)行尋優(yōu)的適應(yīng)度函數(shù)見式(14)。


基于BPNN-XGBoost組合模型建模的流程如圖4所示。
根據(jù)調(diào)優(yōu)后的超參數(shù),分別使用BP神經(jīng)網(wǎng)絡(luò)和XGBoost對B瓦和BC瓦測試集數(shù)據(jù)進(jìn)行預(yù)測。取2種模型5次預(yù)測的平均值,選擇最優(yōu)預(yù)測結(jié)果加權(quán)相加,再采用PSO尋優(yōu)最佳權(quán)值,結(jié)果如表4所示。
由表4可知,采用XGBoost和BP神經(jīng)網(wǎng)絡(luò)均可預(yù)測B瓦和BC瓦的濕部生產(chǎn)速度,相對而言,XGBoost相較于BP神經(jīng)網(wǎng)絡(luò),其預(yù)測精度更高。采用PSO對XGBoost和BP神經(jīng)網(wǎng)絡(luò)組合模型系數(shù)進(jìn)行優(yōu)化后,其預(yù)測精度更優(yōu),對比B瓦和BC瓦的預(yù)測結(jié)果和測試數(shù)據(jù),得到最小的RMSE、MAE、MAPE。其中,部分B瓦和BC瓦生產(chǎn)速度的預(yù)測結(jié)果如圖5~6所示。采用PSO優(yōu)化系數(shù)后,組合模型具有最小的預(yù)測誤差,因此基于組合模型進(jìn)行預(yù)測得到的生產(chǎn)速度曲線更接近生產(chǎn)速度的測量值,證明文中提出的基于BPNN-XGBoost組合模型的瓦楞紙板線濕部生產(chǎn)速度預(yù)測方法有效。

圖4 瓦楞紙板濕部生產(chǎn)速度預(yù)測流程
表4 預(yù)測結(jié)果

Tab.4 Prediction results

圖5 部分B瓦的預(yù)測結(jié)果

圖6 部分BC瓦的預(yù)測結(jié)果
文中提出了一種基于BPNN-XGBoost組合模型的瓦楞紙板線濕部生產(chǎn)速度預(yù)測方法。根據(jù)瓦楞紙板濕部數(shù)據(jù)采集特點(diǎn),建立了統(tǒng)一的采樣間隔時(shí)間,同時(shí)提出了一種基于ButterWorth高通濾波和IQR方法的穩(wěn)定濕部生產(chǎn)速度篩選方法,比較了BP神經(jīng)網(wǎng)絡(luò)和XGBoost對B、BC瓦楞紙板濕部生產(chǎn)速度的預(yù)測結(jié)果,最后基于粒子群算法優(yōu)化2種預(yù)測值權(quán)重,得到最優(yōu)預(yù)測精度。文中方法可有效預(yù)測不同生產(chǎn)條件下瓦楞紙板的生產(chǎn)速度,為提高生產(chǎn)線管控水平、合理安排生產(chǎn)、減少人工調(diào)試時(shí)間提供了重要參考。
[1] 宋慧慧. 箱板瓦楞紙行業(yè)現(xiàn)狀及趨勢[J]. 印刷技術(shù), 2020(7): 4-5.
SONG H H. Current Situation and Trend of Box Corrugated Paper Industry[J]. Printing Technology, 2020(7): 4-5.
[2] DOGAN A, BIRANT D. Machine Learning and Data Mining in Manufacturing[J]. Expert Systems with Applications, 2021, 166: 114060.
[3] CUI Y, KARA S, CHAN K C. Manufacturing Big Data Ecosystem: A Systematic Literature Review[J]. Robotics and Computer-Integrated Manufacturing, 2020, 62: 101861.
[4] XU K, LI Y G, LIU C Q, et al. Advanced Data Collection and Analysis in Data-Driven Manufacturing Process[J]. Chinese Journal of Mechanical Engineering, 2020, 33(1): 43.
[5] GE Z Q. Review on Data-Driven Modeling and Monitoring for Plant-Wide Industrial Processes[J]. Chemometrics and Intelligent Laboratory Systems, 2017, 171: 16-25.
[6] GHOSH D, MOREIRA J, MHASKAR P. Application of Data-Driven Modeling Approaches to Industrial Hydroprocessing Units[J]. Chemical Engineering Research and Design, 2022, 177: 123-135.
[7] HOFMANN R, HALMSCHLAGER V, KOLLER M, et al. Comparison of a Physical and a Data-Driven Model of a Packed Bed Regenerator for Industrial Applications[J]. Journal of Energy Storage, 2019, 23: 558-578.
[8] TSAY C, KUMAR A, FLORES-CERRILLO J, et al. Optimal Demand Response Scheduling of an Industrial Air Separation Unit Using Data-Driven Dynamic Models[J]. Computers and Chemical Engineering, 2019, 126: 22-34.
[9] ALSINA E F, CHICA M, TRAWI?SKI K, et al. On the Use of Machine Learning Methods to Predict Component Reliability from Data-Driven Industrial Case Studies[J]. The International Journal of Advanced Manufacturing Technology, 2018, 94(5): 2419-2433.
[10] 林利紅, 李雨龍, 李聰波, 等. 工業(yè)電阻爐多參數(shù)能耗建模與預(yù)測[J]. 重慶大學(xué)學(xué)報(bào), 2021, 44(2): 107-119.
LIN L H, LI Y L, LI C B, et al. Multi-Parameter Energy Consumption Modeling and Prediction of an Industrial Resistance Furnace[J]. Journal of Chongqing University, 2021, 44(2): 107-119.
[11] 吳強(qiáng), 張偉, 岳秀清. 自動(dòng)化包裝生產(chǎn)線電機(jī)無傳感器驅(qū)動(dòng)故障診斷[J]. 包裝工程, 2021, 42(11): 182-190.
WU Q, ZHANG W, YUE X Q. Fault Diagnosis of Sensor Less Motor Drive in Automatic Packaging Production Line[J]. Packaging Engineering, 2021, 42(11): 182-190.
[12] CHENG H J, FENG D Y, SHI X B, et al. Data Quality Analysis and Cleaning Strategy for Wireless Sensor Networks[J]. EURASIP Journal on Wireless Communications and Networking, 2018, 2018(1): 61.
[13] DAVID K, TODD F, JAROSLAV K, et al. Evaluation of (1+α) Fractional-Order Approximated Butterworth High-Pass and Band-Pass Filter Transfer Functions[J]. Elektronika Ir Elektrotechnika, 2018, 24(2): 37-41.
[14] SNOEK J, LAROCHELLE H, ADAMS R P. Practical Bayesian Optimization of Machine Learning Algorithms[C]// Proceedings of the 25th International Conference on Neural Information Processing Systems. ACM, 2012: 2951–2959.
[15] SHI Y. A Modified Particle Swarm Optimizer[C]// IEEE World Congress on Computation Intelligence, Indianapolis, 1998: 69-73.
[16] 凌立文, 張大斌. 組合預(yù)測模型構(gòu)建方法及其應(yīng)用研究綜述[J]. 統(tǒng)計(jì)與決策, 2019, 35(1): 18-23.
LING L W, ZHANG D B. A Review of Construction and Application of Combination Forecast Model[J]. Statistics & Decision, 2019, 35(1): 18-23.
[17] 陳根. 基于模型篩選的中長期徑流組合預(yù)測模型研究[D]. 武漢: 華中科技大學(xué), 2021: 22-27.
CHEN Gen. A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering[D]. Wu Han: Huazhong University of Science and Technology, 2021: 22-27.
Prediction Method for Wet End Production Speed of Corrugated Board Line Based on BPNN-XGBoost Combined Model
XIE Weiwei1,2,CAO Xi2, JIANG Mian2*,CHEN Yong2,HUANG Wei3
(1. Guangdong Dongfang Precision Science & Technology Co., Ltd., Guangdong Foshan 528520, China; 2. School of Mechatronics Engineering and Automation, Foshan University, Guangdong Foshan 528525, China; 3. Guangdong Fosber Intelligent Equipment Co., Ltd., Guangdong Foshan 528520, China)
The work aims to meet the increasingly personalized customization needs of the corrugated board industry, reduce the impact of complex and variable production conditions on the production speed, help enterprises to arrange production reasonably, and improve the level of production line control. Firstly, the production speed of corrugated board was resampled to unify the sampling interval of order parameters and sensor parameters, and high pass filtering by ButterWorth filter. Quartile statistics were used to screen the stable wet end production speed interval and extract the data of types B and BC. Then, BP neural network and XGBoost were used to predict the wet end production speed based on the extracted data, and Bayesian optimization and grid search were used to optimize the hyperparameter of two models, respectively. Finally, PSO algorithm was used to combine the two models to predict the production speed. The experimental results showed that both models had certain prediction ability, among which XGBoost had better prediction performance and the combined model had the best prediction performance. The method based on BPNN-XGBoost combined model can effectively predict the wet end production speed of corrugated board and guide the actual production.
corrugated board; production speed; prediction model; data driven; hyperparameter optimization
TB484.1
A
1001-3563(2024)09-0210-08
10.19554/j.cnki.1001-3563.2024.09.027
2023-06-07
廣東省普通高校新一代信息技術(shù)重點(diǎn)領(lǐng)域?qū)m?xiàng)(2021ZDZX1057); 佛山市南海區(qū)重點(diǎn)領(lǐng)域科技攻關(guān)項(xiàng)目(2230032004654)