呂逸夫 王美林



摘要:有效的能耗預測方法對智能制造有著重要的意義。傳統的能耗預測主要基于單臺設備各種指標和機器學習算法來進行能耗狀態的判斷,雖然預測效果在不斷地提高,但是對需要多個模塊協同作用的大型生產設備的能耗的預測效果時有不佳。提出了一種基于Pearson相關性分析、RNN算法的多模塊的大型生產設備的能耗預測方法,該方法首先計算不同模塊能耗的Pearson相關系數,對不同模塊進行分組,再為各個分組收集多種異常狀態下的數據,使用LSTM、GRU等RNN算法進行預測。實驗表明,提出的方法有較高準確度、召回率、F1-score,對多模塊的大型生產設備的能耗預測具有顯著優勢。
關鍵詞: 多模塊生產設備;能耗分析;Pearson相關系數;RNN算法
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)28-0004-04
開放科學(資源服務)標識碼(OSID):
Energy Consumption Analysis of Multi-Module Large-Scale Production Equipment Based on RNN
Lv Yi-fu,WANG Mei-ling
(School of Information Engineering, Guangdong University of Technology, Guangzhou 510000,China)
Abstract:Effective energy consumption prediction methods are of great significance to intelligent manufacturing. Traditional energy consumption forecasting is mainly based on various indicators of a single device and machine learning algorithms to judge the energy consumption status. Although the forecasting effect is constantly improving, the energy consumption of large-scale production equipment that requires the synergy of multiple modules is predicted The effect is sometimes poor. Proposes a multi-module energy consumption prediction method for large-scale production equipment based on Pearson correlation analysis and RNN algorithm. The method first calculates the Pearson correlation coefficient of the energy consumption of different modules, groups the different modules, and then collects for each group Data under a variety of abnormal conditions are predicted using RNN algorithms such as LSTM and GRU. Experiments show that the proposed method has high accuracy, recall rate, F1-score, and has significant advantages in energy consumption prediction for large-scale multi-module production equipment.
Key words:multi-module production equipment; energy consumption analysis; pearson correlation coefficient; RNN algorithm
1 引言
在智能生產中,能耗運行狀態是大型生產設備的重要的監控指標。能耗高于正常指標會導致能源浪費或設備過載,進而直接或間接地給企業帶來損失;能耗過低又會帶來產能不足,產品質量不高等問題。在智能制造飛速發展的背景下,已有一些傳統企業針對大型設備進行智能化改造實現能耗數據的采集,用于實現造智能化能耗監控。針對采集的能耗數據,人們開始嘗試使用大數據分析技術對設備電機能耗的狀態預測。
針對PVC大型壓延生產設備進行智能化設備改造,實時采集電流、轉速等能耗數據進行相關分析。PVC壓延設備主要用于生產PVC壓延薄膜和裝飾材料,其生產設備的主要包括有攪拌機、開煉機、過濾機等模塊。在生產工作中,不僅需要單個模塊的正常工作,還需要生產設備的各個模塊的協調工作。因此,各設備模塊的能耗狀態的關聯性分析,是多模塊大型設備能耗分析的一個難點。
目前已有許多機器學習技術被應用于能耗分析,并取得了不錯的成果。程亞豪等人使用隨機森林、梯度提升機來進行住宅能耗的預測,并在相應數據集中有最小的均方根誤差RMSE(9.99)和RMSE(77.07)[1]。陳俊等使用LSTM、SVM、MLP、K近鄰等算法進行虛擬機的能耗預測[2],劉建財等采用集成建模的思想把LR和SVR做集成經樣本訓練后得到 SLS 模型,進行嵌入式設備能耗的預測[3]。近幾年,機器學習技術在能耗預測方面取得了長足的發展。這些研究多以一臺設備的數據進行能耗分析實驗,沒有對需要多模塊協同工作的大型生產進行深入研究。
總結現有的研究成果的同時,實驗團隊針對PVC大型壓延生產設備,通過計算不同模塊能耗的Pearson相關系數,對不同模塊進行分組,再使用LSTM、GRU等RNN深度學習算法對各個分組中的所有模塊的能耗進行綜合分析,并使用BP神經網絡、隨機森林、LightGBM等傳統機器學習算法進行試驗與對比,討論RNN算法的多模塊的大型生產設備的能耗預測性能。
2.1 原始數據概況及數據來源
實驗團隊所使用的實驗數據來源于工廠所使用的五輥PVC壓延機生產線,該生產線包含多個模塊:軋輪機模塊(包含軋輪機A、軋輪機B)、過濾機模塊、輥輪模塊(包含五個滾輪,分別記為1#輪至5#輪)、引取設備模塊(包含三個引取輪分別記為1號引取設備至3號引取設備)、壓花機模塊、冷卻輪模塊(包含五個冷卻輪,分別記為1#冷卻輪至5號冷卻輪)、帶料輪模塊、卷取輪模塊。
通過設備改造,PVC壓延設備使用內置或外接的傳感器,實時采集各節點的運行狀態數據,包括各模塊多個采集節點的所采集的開關量、溫度、電流、轉速、壓力。原始數據樣式包含數據采集點、數據類型、數據值,數據采集頻率為1ms采集一次數據,其樣式大致如下:
2.2 數據預處理
針對大型設備的能耗關聯系分析,實驗團隊篩選出所有模塊采集節點電流變量進行分析和處理。由于傳感器采集數據的頻率為1ms一次,導致數據量異常龐大,所以首先以1min為時間窗口進行數據的聚合,統計每分鐘內變量的平均值,通過與額定電壓相乘來獲取各模塊功率值。然后將聚合后數據組成全局狀態向量:SG<時間,軋A功率,軋B功率,過濾機功率...>。
該PVC壓延生產線共包含19個模塊,所以該實驗數據包含20列,第一列是時間變量、剩下19列為每個設備的在該時刻的功率變量。其部分數據如下:
2.3 基于相關性分析進行分組
獲得SG以后,計算各模塊功率間的相關系數,并利用相關系數對變量進行分組。該實驗使用Pearson相關系數確定不同變量間的相關性,Pearson通過考察變量X、Y的線性關聯程度來分析變量的相關性[4],其公式為:
Cov(X,Y)表示變量X、Y的協方差:
計算得到各模塊的相關系數后,基于此分析結果對設備進行分組,并獲得各分組狀態向量:Sn<時間變量,Sn節點1功率,Sn節點2功率,Sn節點3功率...>,其中Sn表示第n組的分組狀態。
實驗中,相關性分析的結果如下圖所示:
由該結果可知各模塊功率相關性如下:
① 由軋輪機A、壓花機、帶料輪、卷曲輪、冷卻1#~5#輪等模塊的功率相關程度高,可以組成一個分組;
② 1#~5#輪及取引1#~3#輪等模塊的功率相關程度高,組成一個分組;
③ 由于軋輪機B功率和別的模塊的功率相關性較低,可以單獨分析其能耗狀態;
④ 由相關性分析結果得出,過濾機功率與其他模塊的功率相關性較低;然而可以看出過濾機的功率雖然起伏較大,但其狀態與軋輪機A所處的第一組設備功率走勢高度相似,所以仍然將過濾機放在軋輪機A所在組。
2.4 對數據進行標注
在進行實驗之前,還需要為數據做標注工作與特征工程。首先是標注工作:根據每個數據所代表的生產健康狀況,為數據標上相關標注,形成新的狀態向量。
2.4.1 標注數據來源
PVC壓延機中,卷取輪是整個生產過程的最后一個模塊,用于卷曲壓延膜成品,其狀態可反映出該時刻整個設備的產出的健康狀態[5];日常生產期間,卷曲輪主機開關在約95%的時間處于持續開啟狀態,1.5%的時間處于持續關閉狀態,另1.5%的時間處于間斷性開啟,開啟呈現周期性。在卷曲輪主機開關處于相應狀態時,其轉速、電流有以下規律:
借助上面三種情況作為數據的健康程度初步判斷依據。將處于上表三種情況的數據標注為健康狀態,與之有明顯差異的數據標注為非健康狀態;收集大量健康的數據與部分非健康的數據,簡單構建機器學習算法并訓練。使用該算法預測未標注的實驗數據,可得到各數據是健康的狀態的置信度,代表該數據為正常狀態的可能性[6],置信度低的數據可能有異常;分別獲得置信度高與置信度低的數據,對比各時間分區內的所有模塊電流平均值、方差并加以分析,以某次測試結果為例,進行數據標注的詳細講解。
測試以第一組的軋輪機A為例,從本次對比可以看出,置信度高的數據中,約有80%的時間內軋輪機A電流在120~150之間,平均值約為126,其方差約為15.0,表示大部分時間軋輪機在平穩工作,有較小的波動;而與之對比,置信度低的數據中,約有80%的時間內軋輪機A電流在175~250之間,平均值約為189.3,其方差約為309.5,平均值和方差都偏高,可看出此數據波動異常巨大,且電流整體偏高,其他時間區間的對比也有類似的情況。以高置信度數據為標準,通過對比低置信度數據各模塊功率的平均值,判斷該模塊的異常類型是功率偏高亦或是偏低。
2.4.2 對數據進行標注
基于上一步的分析,為每個數據標上相應的健康狀態向量,其中健康狀態向量如下,其中每個狀態可取值-1、0、1,分別代表電流過高、正常、過低:
Sn健康狀態向量
最后使用一個月的數據進行初步檢測,選取所有低置信度的數據進行,經分析得到所有錯誤類型。以第1組為例,部分異常狀態標注如下:
3 使用算法進行訓練與測試
使用RNN算法對數據進行實驗,RNN是循環神經網路(Recurrent Neural Network),它以序列數據為輸入,并且在演進方向進行遞歸的遞歸神經網絡[7],可以記憶前面的數據信息,并應用于當前時刻輸出的計算中,從而產生了一個序列當前的輸出與前面的輸出也有關的效果,所以RNN特別適合應用于時間序列數據的預測。LSTM和GRU是目前最流行應用最廣泛的RNN算法[8]。
實驗涉及3個分組,選取了生產過程中三組都處于正常生產狀態的2020年7月10日和11日此2天的數據做為正樣本,選取若干處于異常狀態的生產數據作為負樣本,由此得到訓練集。并將同樣處于正常生產狀態的2020年7月12日此1天的數據,按照1/50的比率抽取數據作為測試集中的正樣本,再選取若干數據作為測試集負樣本數據。
4 實驗結果
該實驗所解決的問題屬于分類問題,可使用Precision、Recall、F1-score這三個指標來評估實驗的好壞[9],其公式如下:
其中TP:預測答案正確的次數,FP:錯將負類預測為正類的次數,FN:錯將正類預測為負類的次數[10];precision是準確度,指被分類器判定正例中的正樣本的比重,recall是召回率,表示正類被預測出來的概率,F1-score用于平衡兩者的關系。
而在該實驗中,由于需要預測出異常狀態,所以將所有異常匯總,并以其作為正例,而將處于正常狀態的樣本設為負例。獲得如下結果:
由上表可以看出,在三組中LSTM、GRU都有較高的準確度和召回率和F1-score,表示這兩種RNN算法不僅能較為準確地分類,且能保證異常情況能夠較好地被判斷出來;BP神經網也有較高的準確度和召回率,但對比RNN算法稍有遜色;另外隨機森林和LigthGBM等傳統機器學習算法的成績比起上面三種算法更低,且召回率并不高,表示這兩種算法可能會漏掉不少異常情況,導致沒法對生產線發出正確的預警。通過對比可以看出,RNN在本次實驗中取得了相對較好的成績。
5 結束語
此次實驗結合了PVC壓延機等多模塊大型生產設備中,不同模塊需要協同工作的特點,提出了使用相關性分析為模塊進行分組的分析手段。并且結合設備能耗等指標的時序性,采用了RNN算法來進行相關實驗。并借助了大數據技術獲得了大量的實驗數據,從而得以匯總出大量不同的能耗異常情況,進而獲得更好的實驗成果。可以看出此次實驗所提供的思路具有一定的科學性。
參考文獻:
[1] 程亞豪,陳煥新,王江宇.基于機器學習的住宅能耗預測[J].制冷與空調,2019,19(5):35-40.
[2] 陳俊,張芥,田紅珍,等.一種LSTM循環神經網絡建立虛擬機能耗模型的方法[J].傳感器與微系統,2020,39(9):16-19,23.
[3] 章蓬偉,賈鈺峰,劉強,等.基于數據挖掘技術的文本情感分析技術研究[J].信息通信,2020,33(1):77-78.
[4] 蔡靜,張明輝,朱宇婷,等.基于Pearson相關系數的貨運車輛能耗模型研究[J].交通運輸系統工程與信息,2018,18(5):241-246.
[5] 李國利.斜交輪胎三輥壓延生產線自動卷取設備改造[J].輪胎工業,2019,39(5):306-307.
[6] 郭劍,林俊延,董樹龍,等.基于置信度得分模型的深度學習手勢肌電信號識別方法:CN110598676A[P].2019-12-20.
[7] Greff K,Srivastava R K,Koutník J,et al.LSTM:a search space odyssey[J].IEEE Transactions on Neural Networks and Learning Systems,2017,28(10):2222-2232.
[8] Fu R,Zhang Z,Li L.Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC).November 11-13,2016,Wuhan,China.IEEE,2016:324-328.
[9] Wang W X,Fu Y T,Dong F,et al.Semantic segmentation of remote sensing ship image via a convolutional neural networks model[J].IET Image Processing,2019,13(6):1016-1022.
[10] Chiarugi F,Sakkalis V,Emmanouilidou D,et al.Adaptive threshold QRS detector with best channel selection based on a noise rating system[C]//2007 Computers in Cardiology.September 30 - October 3,2007,Durham,NC,USA.IEEE,2007:157-160.
【通聯編輯:唐一東】