陸應康 盛步云 張志瀚 張燕強
1(武漢理工大學機電工程學院 湖北 武漢 430070)2(東風設計研究院有限公司智慧技術研究院 湖北 武漢 430056)
隨著制造業發展突飛猛進,制造業對能源的消耗也越來越大,據統計2000年-2016年中國工業能源消耗總量年均增長率為6.69%, 同期制造業能源消耗量占中國工業部門能源消耗量的比例平均達到82.8%[1]。在裝備制造業中,涂裝車間是制造企業中工藝最復雜,也是高能耗和高排放的車間之一[2]。在涂裝車間內,最主要的能耗集中在空調和照明等系統,其能耗比例達到涂裝車間總能耗的60%~70%[3],具有很大的節能潛力,因此,對涂裝車間的能耗進行分析,從而挖掘節能潛力對整個汽車制造業的節能減排具有重要意義。Azadeh等[4]利用遺傳算法對人工神經網絡模型的參數進行了優化,從而得到對某企業電能耗的預測模型,并與時間序列法的預測結果進行了對比分析,表明優化后的神經網絡預測能力更優。張宗華等[5]提出一種基于遺傳算法的反向傳播神經網絡模型,在對電力負載的預測中有較高的預測精度。李曼潔等[6]基于XGBoost的用能預測模型對某汽車制造企業油漆車間的日能耗進行預測,達到了良好預測效果。文獻[7]利用優化BP神經網絡的模擬退火粒子群混合算法對鋼鐵企業的生產能耗進行預測,實現較高的精度預測。趙超等[8]提出了自適應加權最小二乘支持向量機(AWLS-SVM)回歸方法的短期電力負荷預測模型,計算結果表明,AWLS-SVM模型在預測精度和泛化能力方面均有所提高。廖文強等[9]基于長短期記憶神經網絡(LSTM)對暖通空調未來短期能耗進行預測,實驗表明,LSTM預測比傳統方法效果更好。以上預測模型都是利用人工智能算法建立模型,但是這些人工智能算法對于數據的依賴性太強,模型訓練需要大量的數據,難以解決數量較少的車間能耗預測的問題。
綜上,針對神經網絡模型對數據依賴性強以及能耗數據的動態性和不確定性的問題,本文提出基于時序分解與CNN的預測模型,最后利用某汽車制造企業涂裝車間能耗數據進行實驗,驗證模型的有效性。
本文的模型結構如圖1所示,其中包括車間能耗數據的時序分解、貝葉斯參數估計[10]、卷積神經網絡數據挖掘部分。

圖1 車間能耗預測模型結構
首先通過具有周期特征的傅里葉變換基函數和分段函數分別對動態的能耗數據的周期成分和趨勢成分進行擬合,建立時序分解模型。然后基于貝葉斯理論,將車間能耗的歷史數據作為先驗信息,并利用馬爾可夫鏈蒙特卡洛(MCMC)模擬方法[11]對周期成分模型和趨勢成分模型進行參數估計。最后將得到的周期和趨勢特征數據以及環境變量等隨機因素作為卷積神經網絡的輸入,進行卷積運算,最終得到車間能耗預測值。
對于能耗數據的周期性,主要是季節以及節假日等因素造成的,本文考慮工作日與周末車間能耗的差異導致能耗數據呈現周期性的問題,選取擬合數據周期性應用最廣泛的傅里葉變換分析方法[12]。傅里葉變換一般在信號處理上應用比較廣泛,根據不同周期的數據的頻譜篩選出振幅最大的頻率,高效地擬合數據。如果將能耗數據也看作一種信號的話,經過傅里葉變換可以得到能耗數據的頻譜,一般的傅里葉變換基函數為:
(1)
本文對于車間能耗數據,在傅里葉變換基函數中加入參數T,通過調整T的值來擬合能耗數據,最大限度地減小數據方差,最終獲得能耗數據的周期成分。其表達式如下:
(2)
設α=[a0,b0,a1,b1,…,an,bn]T為傅里葉系數,車間能耗數據的周期成分可以表示為:
S(t)=W(t)α
(3)

考慮到車間能耗數據受到車間生產任務等因素影響,呈現出不同趨勢,能耗的增長率不斷變化。采用單一的趨勢擬合,將淹沒這些特征,本文采取分段函數[13]來擬合車間能耗數據的趨勢成分,以此顯現不同時段能耗的特征信息,提高趨勢擬合精度,將能耗數據分為N段的線性模型表示:
X={(X1L,X1R),…,(XiL,XiR),…,(XNL,XNR)}
(4)
式中:(XiL,XiR)表示為第i段的線性模型,XiL、XiR是第i段線段的起始值和終止值;N表示為整個能耗數據劃分的線段數目。
本文設置N-1個趨勢轉折點SN,當時間t大于趨勢分段點SK時,修正趨勢函數,其表達式為:
T(ti)=(XiL,XiR)=(k+a(t)kδi)t+(b-ka(t)θi)
(5)
式中:k為斜率;a(t)為本文設置的指示函數,當時間ti大于趨勢分段點Si時,a(t)取1,否則取0;δi表示第i段線段斜率的變化率系數;θi為偏移量系數,θi=Siδi;b為偏移參數。
車間能耗受人的行為、環境等諸多外部因素的影響,能耗數據呈現出動態性、隨機性、不確定性等特征。貝葉斯狀態估計方法能準確度量時序數列的不確定性,并能根據更新的觀測數據對參數進行更新,借助貝葉斯方法,根據先驗信息對時序模型進行求解,估計模型參數,提高擬合的準確性。
分別對周期和趨勢函數參數估計,如果將周期函數的未知參數ω={α,T}看作隨機變量,根據能耗的先驗信息,可以確定未知參數的先驗分布為π(ω),概率密度函數也可以看作是隨機樣本序列,則能耗數據集序列D和參數ω的聯合分布為:
h(D,ω)=P(D|ω)π(ω)
(6)
式中:P(D|ω)為在參數ω的條件下,能耗數據集的概率,本文的能耗數據集已知,則P(D|ω)為參數ω的似然函數。因此,式(6)也可以寫為:
h(D,ω)=L(D|ω)π(ω)
(7)
我們的任務是得到周期模型的參數,確定準確模型,即確定參數ω在能耗數據集的條件下的分布:
cL(D|ω)π(ω)
(8)
式中:m(x)為能耗數據的邊緣密度,一般為常數c。則式(8)中未知參數ω的后驗分布,它其中包括了能耗數據和有關參數ω的先驗信息,本文取參數ω的估計由后驗均值給出,即:
(9)
在實際應用中,式(9)的后驗分布很難通過求解得到,一般采用抽樣的方法來估計參數值,馬爾可夫鏈蒙特卡洛(MCMC)的方法是計算貝葉斯后驗分布的有效的方法。通過MCMC算法對模型參數進行后驗模擬,取后驗均值作為模型參數的估計值。
Gibbs抽樣[14]是一種重要的MCMC抽樣算法, 計算方法可以表示如下:

2) Gibbs抽樣的i次迭代過程:
?
?

卷積神經網絡(CNN)是一種用于處理視覺圖像的深度神經網絡[15],CNN由輸入層、輸出層和多個隱藏層組成,其中隱藏層由多個卷積層、池化層和全連接層組成。本文將CNN用于能耗預測,因CNN具有極強的局部特征捕捉能力,可以處理能耗數據多維度的耦合關系,同一層神經元之間共享權值,不僅可以降低網絡的復雜度、提高預測效率,而且具有較好的擬合度。因此通過對能耗數據時間序列分解得到多維度因素,再利用CNN對能耗數據進行預測,相比傳統的將時序分解的多維度因素疊加(TSD)的預測方法[16],是一種更有效的預測方法。
本文所采用的卷積神經網絡模型參考Alex Net模型[15],由兩層卷積層和兩層池化層組成,本文在每個卷積層加入ReLU激活函數,為了防止梯度消失或梯度爆炸,并加入Dropout層消弱過擬合。網絡結構如圖2所示,其中p和q為池化層的尺寸。

圖2 卷積神經網絡模型
在卷積層中,從能耗數據序列中提取出局部的節點組合信息。通過每一個卷積核在所有數據上的重復滑動得到多組輸出數據,當輸入信號為xi=(x1,x2,…,xn)時,卷積層的計算公式為:
(10)

池化層主要用于保留主要特征,降低維度,減小過擬合。本文采用平均池化方式,對能耗數據的特征進行下采樣處理。則池化層計算公式為:
(11)
式中:h(·)表示求平均值函數;kp為池化層權值;bj為偏置矩陣。
經過池化層后得到一系列特征,全連接層通過全連接方式將每一個神經元與池化層的所有輸入出連接,將所有的特征集合起來,最終輸出能耗預測值。
本文以某企業的車間能耗數據作為研究對象,用于驗證基于貝葉斯估計的時序分解與卷積神經網絡組合預測方法的預測效果,數據的步長為1天,共有317個樣本。圖3顯示了車間在一年內的能耗值變化,其中節假日等因素對于能耗值的影響很顯著。

圖3 車間日能耗數據
由于電表等讀取誤差以及停電等突發狀況,原始數據中有很多異常值和缺失值,為了降低異常值和缺失值對模型訓練造成的誤差,本文采用臨近值求平均值來填補缺失值和替換異常值。
對車間能耗數據的317個樣本通過貝葉斯參數估計方法進行時序分解,在Gibbs抽樣中,設置迭代次數為5 000次,并將前1 000次不平穩的數據刪除,模擬實驗的主要參數結果如表1所示,通過所得參數繪制數據的周期成分和趨勢成分。時序分解結果如圖4-圖5所示。

表1 模型參數的估計結果

圖4 周期成分

圖5 趨勢成分
分析可知:能耗數據的周期規律很強,有利于對神經網絡的分析和預測,能耗的趨勢成分的波動較大,需要通過分析環境因素等數據與其關系,進行預測。
1) 對比設置。為驗證本文方法的有效性, 本文選取了自回歸移動平均模型(ARIMA)、長短期記憶神經網絡(LSTM)、支持向量機(SVM),以及時序分解算法作為對比。
2) 模型評估。本次研究采用R2與RMSE評估模型預測效果。
(12)
(13)

本文通過反復實驗得知,選取步長為50,卷積核大小為3×3,數量分別為2和4,池化層尺度為2×1時,預測效果較好,具體結構如圖6所示。

圖6 能耗卷積神經網絡模型結構圖
在訓練CNN時, 本文選取Euclidean Loss作為CNN的損失函數, 即:
(14)


圖7 CNN模型訓練過程的損失函數
本文分別使用SVM、ARIMA、LSTM、時序分解,以及本文方法對2019年1月10日至2019年1月25日的15天車間能耗數據進行預測,對比實驗中各類的預測方法能耗預測結果如表2、表3和圖8所示。

表2 其他模型和TSDCNN模型的預測結果對比

表3 其他模型和TSDCNN模型的評價對比

圖8 能耗預測結果
可以看出,對于正常日期的車間能耗數據,五種方法的預測效果都很相近,但是對于節假日這樣的突發情況,SVM的預測效果最差,因為SVM無法擬合到節假日這種與正常數據懸殊的數據。相比SVM的預測效果,ARIMA和LSTM對突發事件能夠有一定程度的預測。TSD和本文方法對突發事件的預測效果最好。通過表3可以看出,本文的組合方法在預測值與實際能耗值的吻合度(R2)最高,比TSD的吻合度提高了0.09, RMSE降低了523.7。所以本文方法的預測效果明顯優于SVM、ARIMA、LSTM、TSD算法。
綜上所述,本文方法在五種方法中表現最好,不管在正常日還是特殊日期都能完成較高精度的預測,可以很好地預測車間能耗情況。
涂裝車間能耗預測對于降低車間的能源消耗以及節能減排具有重要意義。本文通過基于貝葉斯的時序分解與卷積神經網絡組合模型對能耗進行預測,通過時序分解將歷史能耗數據分解為周期因素和趨勢因素,為CNN模型提供基礎,采用貝葉斯估計方法,可以很好地描述實際問題的內在規律。CNN模型可以對于局部的特征進行提取,提高模型的預測精度。本文研究為涂裝車間能耗節能決策以及能耗異常診斷提供一定的參考。