韋偉 胡亮 王偉偉 張玉
摘 ?要:在自動化技術愈發成熟的背景下,卷煙工業設備功能復雜、精確度提高、設備之間的關聯性增強,目前對設備的風險健康狀態評估僅停留在計劃性維修,難以保證設備的可靠性水平。文章結合煙廠設備的實際情況,從設備運行積累的大量數據進行挖掘,利用Apriori算法找出與工藝指標存在關聯關系的參數,利用熵權法確定權重。建立設備綜合健康狀態評價模型,計算出綜合健康指數來判斷設備的健康情況。最后通過案例分析驗證了此方法的可用性,為設備維修保養的決策方案提供依據。
關鍵詞:卷煙工業;健康狀態評價;Apriori算法;健康指數
中圖分類號:TP271 ? ?文獻標志碼:B
DOI:10.13714/j.cnki.1002-3100.2023.09.012
Abstract: In the context of increasingly mature automation technology, the function of cigarette industry equipment is complex, the accuracy is improved, and the correlation between equipment is also enhanced. At present, the risk health status assessment of equipment only stays in the planned maintenance, which is difficult to ensure the reliability level of equipment. In this paper, combined with the actual situation of tobacco factory equipment, a large amount of data accumulated from the operation of equipment is mined, and the Apriori algorithm is used to find out the parameters associated with process indicators, and the entropy weight method is used to determine the weight. The comprehensive health status evaluation model of equipment is established, and the comprehensive health index is calculated to judge the health status of equipment. Finally, the feasibility of this method is verified by case analysis, which provides a basis for the decision-making scheme of equipment maintenance.
Key words: cigarette industry; assessment of health status; Apriori algorithm; health index
0 ?引 ?言
隨著自動化技術在卷煙工業企業的廣泛應用,卷煙工廠在設備運行及產品生產過程中,積累了大量歷史數據,在看似雜亂無章的數據中,卻記錄了設備真實的運行狀態。在此背景下,通過對相關數據進行深度研究和挖掘,開展設備健康風險的評價,以確保設備的安全高效運行。
設備健康度普遍用0到1的范圍來描述設備的健康狀態,其中1代表設備十分健康,0表示設備處于故障狀態。目前有很多學者對設備的健康風險進行研究。韋偉等[1]通過卷煙廠設備管理的實際需求,構建TOPSIS模型作為核心算法,引入熵權法確定權重來進行健康狀態的評價。楊帆等[2]提出一種基于最優等級數的多位特征量開關柜健康狀態評價方法,解決了評價等級數的主觀設定問題。劉博元等[3]以系統運行的實時大數據為基礎,通過信息熵原理利用大數據分析的方法,對系統的健康度做出實時評估。袁偉中等[4]也有通過BP神經網絡對設備參數進行回歸估計,獲得歷史數據和訓練數據,構建殘差與參數分數的映射關系,計算嚴重等級和工況運行等級。趙麗琴等[5]提出利用指數函數對各參數的權重動態變化進行研究,來更精確地評價設備的健康度。李鑫等[6]采用基于模糊無量綱處理和改進的層次分析法(AHP),結合綜合變權綜合原理對設備的健康狀態進行評估。
如今煙廠設備的健康評價指標與對應參數的關系是人工預設好固定的,沒有對新的數據采集系統中實時采集的1 000多個參數(大數據環境)進行一次挖掘,發現參數之間的關聯關系。通過TOPSIS法計算機平臺綜合評價得分的方法,僅靠最后得分來判斷設備健康狀態不夠嚴謹。本文通過研究每個關鍵參數與設備運行過程中設備的各種狀態的關聯性,通過Apriori算法挖掘參數之間的關聯關系,進而確定評價的參數指標。利用熵權法客觀地對參數權重進行確定。建立設備綜合健康狀態評價模型,對各指標數據進行綜合健康指數統計,得出設備的健康狀態,為設備的保養、維修的決策方案提供建議。
1 ?基本理論
1.1 ?基于Apriori算法的關聯規則挖掘
Apriori算法步驟的核心是使用一種稱為逐層搜索的迭代方法,其中K項集用于探索項K+1項集[7]。關聯規則的挖掘是一個兩步的過程,即先找出所有的頻繁項集,再由頻繁項集產生強關聯規則。具體步驟如下:
第一步:通過掃描數據庫,收集滿足最小支持度的項,找出頻繁1項集的集合,該集合記為L。最小支持度的計算公式如下:
SupportA= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
其中:A表示項集,D表示事務數據庫。
第二步:用L找出頻繁2項集的集合L,使用L找出L,如此下去,直到不能再找到頻繁K項集。每找出一個L需要一次數據庫的完整掃描。
第三步:由找出的頻繁項集產生強關聯規則。根據設定的置信度來判斷是否具有關聯規則,最小置信度的計算公式如下:
confidenceA∪B= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
第四步:根據最小置信度篩選出具有相關性的參數,算法結束。
Apriori算法使用頻繁項集的先驗性質來壓縮搜索空間,在大規模數據中尋找變量之間的有趣性關系,具體操程如圖1所示。
1.2 ?基于熵權法確定權重
熵權法的原理是從各項指標所提供信息量的大小不同而確定其目標權重的一種方法。這是一種客觀賦權法,其步驟主要如下:
(1)計算各二級指標對一級指標所占的比重,即第i個一級評價指標第j項指標占所有評價第j項指標之和的比重。
p= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
(2)計算第j項指標的熵值E:
E=-plnp ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中:E>0, 若p=0時,則E=0。
(3)計算第j項指標的熵權W:
W= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (5)
但在實際處理中,第j項指標差異越大,對評價的結果影響就越大,熵值則越小。因此,這里做進一步處理。得到的熵值之間確定其權重,計算公式為:
W=, 0≤W≤1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(6)
W=1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)
通過構建上述模型可以得到各個指標的熵權W=w,w,…,w。
1.3 ?設備綜合健康狀態評價模型
健康指數是一種將設備健康程度進行量化的指標,通過全面分析設備運行中各指標數據的狀態信息和實際運作工況情況所得到的介于0和1之間的單一數值,其值越大表示設備的健康程度越高,1代表最優狀態,0代表處于完全失效[8]。健康指數的具體計算過程如下:
h= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (8)
其中:h為設備特征參數x的健康指數;x為實際測量值,x和x是該參數的最小和最大值;是指該參數的最優值。
基于卷接機組多設備綜合健康指數HI的表達式如下:
HI=wρh ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(9)
其中:HI為基于設備狀態的系統綜合健康指數,HI∈0,1;w是熵權法獲得各參數的權重;ρ是各指標的權值,n是參數的個數,m是指標數目。
根據卷煙工業的實際生產經驗,建立設備系統健康指數與運行狀況評價等級之間的映射關系,對設備健康狀態劃分為4個等級,如表1所示。
2 ?模型計算應用實例
以某卷煙廠設備機組為例,機組中存在大量運行數據,設備健康狀態的預估始終只能根據事后數據顯示,無法利用運行數據提前預知對設備的維護保養。且對設備的輪保無法做到合理化安排,使設備維護保養更加科學化和明細化。本文提出對設備即時的評價模型步驟主要有以下幾步:
首先從各系統中獲取大量的設備實時數據,將它們存入格式化的表格中,再將這些大數據進行清洗和數據預處理,獲得篩選數據。利用這些數據進行Apriori算法來尋找哪些參數的變動對設定的指標之間存在同步的關系,從而確定評價指標;第二步是利用這些參數的標準值和閾值來對實時收集的參數進行健康度的計算;第三步是利用熵權法計算出評價指標的權重;最后利用健康度和權重對設備綜合健康狀態進行評估。具體流程如圖2所示:
2.1 ?評級指標的挖掘
設備系統中每2秒采集一次數據,且設置有1 000多個傳感器,且數據量巨大,根據卷接機組設備采集的數據形式,無法直接使用Apriori算法進行運行,必須做一次數據處理。具體做法如下:
步驟1:去除重復值,得到數據表。
步驟2:將數據表轉化為稀疏矩陣。即每一個參數與本身上一個狀態相比,若改變了記為1,若沒有變動就記為0。
步驟3:對狀態性固定指標數據進行去除,即稀疏矩陣中全為0的列的參數。
步驟4:對累計變化量數據進行去除,即稀疏矩陣中全為1的列的參數。
固定其第一列,因數據巨大,僅展示部分數據預處理的結果,如表2所示。
利用Python語言編程對Apriori算法實現,使用了Pycharm開發調試工具,在Windows10操作系統下進行運行。設置的置信度為80%,支持度為20%,根據控制變量法,每次只改變第一列數據,觀察數據變化。以煙支空頭平均剔除率為例,如表3所示。
2.2 ?卷接機組設備評價計算結果
根據選擇出來的參數,依據式(3)至式(7)計算出各參數的權值,再根據式(8)對其參數的健康指數進行計算,具體的計算結果如表4所示。
由公式(9)計算得到卷接設備綜合健康指數值HI為0.660,可知該卷包設備運行狀態處于建議輪保狀態。
3 ?結 ?論
通過對設備參數大數據的關聯關系挖掘,更好地發現參數之間的關系,不預先確定參數進行設備健康的評價,更具有一定的客觀性。建立了多特征參數健康狀態評價模型,將參數的波動情況集中到整體設備的健康狀態評價,并進行量化,進而判斷設備的健康情況。從而更接近做到事前維修保養。對設備的維護保養更加精細,更有利于提高生產效率。
參考文獻:
[1] 韋偉,戴文靜. 基于改進TOPSIS法的健康評價模型研究[J]. 設備管理與維修,2021(13):17-19.
[2] 楊帆,鄧一帆,李東東,等. 基于最優等級數的多維特征量開關柜健康狀態評價方法[J]. 高電壓技術,2020,46(11):3934-3942.
[3] 劉博元,王煥鋼,范文慧,等. 基于大數據的復雜生產線系統健康度實時評估方法[J]. 清華大學學報(自然科學版),2014,54(10):1377-1383.
[4] 袁偉中,沈利,鄭必君,等. 基于多維參數動態偏差的電廠設備健康評價方法[J]. 信息技術與信息化,2021(11):48-51.
[5] 趙麗琴,劉昶,易發勝. 基于動態權重的設備健康狀態評估方法[J]. 計算機系統應用,2020,29(9):198-204.
[6] 李鑫,劉瑩瑩,李贛華,等. 基于模糊變權原理的衛星健康評估方法[J]. 系統工程與電子技術,2014,36(3):476-480.
[7] 劉文雅,徐永能. 基于改進Apriori算法的地鐵故障關聯規則挖掘[J]. 兵器裝備工程學報,2021,42(12):210-215.
[8] 張彥如,耿夢曉. 基于健康指數的設備運行狀態評價與預測[J]. 合肥工業大學學報(自然科學版),2015,38(10):1318-1323.