張 晨 李 嘉 王海寧 李思悅
1.中石化上海賽科石油化工有限責任公司,上海,201507 2.華東理工大學商學院,上海,200237 3.埃森哲(中國)有限公司,上海,200050
如何科學預測設備健康狀況和相關備件消耗需求,在盡量降低維修成本和庫存資金占用的情況下,保障生產的安全運行,是一個有重要現實意義的研究問題[1-2]。
設備健康預測方法分為基于模型的方法和數據驅動的方法。基于模型的方法需要根據設備特性,搭建精確的物理模型對設備健康狀況進行預測,對于復雜的生產系統或設備機理而言,很難建立與其對應的物理模型[3-4]。數據驅動的方法能繞開建立精確模型這一難點,從海量的歷史數據中挖掘相關規律,無需分析復雜的設備機理。廖雯竹等[5]采用統計模式識別方法對設備進行性能評估,運用自回歸滑動平均模型對設備健康狀況進行預測。趙玉剛等[6]采用LIB-SVM(library for support vector machines)對小樣本、非線性條件下的數據進行擬合,實現對電子設備故障的預測。上述方法大多基于傳統機器學習的方法構建模型。深度學習作為機器學習的一個分支,通過組合低層特征形成更加抽象的高層特征表示,可更好地表示數據的分布式特征。HEIMES[7]運用遞歸神經網絡方法來估計系統的剩余使用壽命。王洪斌等[8]提出了一種基于深度信念網絡的風電機組主軸承狀態監測方法。吳魁等[9]利用長短期記憶(long short-term memory,LSTM)編解碼器網絡構建特征空間,基于測量數據特征向量與特征空間的歐氏距離衡量健康狀態的退化程度。與傳統的機器學習方法相比,深度學習不需要依靠專家判斷挑選特征,在預測結果上也更有優勢。
備件庫存優化一般采用定性預測和定量預測的方法。定性預測側重于對事物發展方向或趨勢進行預測,采用方法有德爾菲法、主觀概率法、歷史類比法等;定量預測建立在數學與統計學的基礎上,利用數學模型和計算機仿真等技術進行預測[10]。呂飛等[11]考慮備件需求的隨機性和時間緊迫性,建立了帶軟時間窗的選址-庫存-路徑問題模型。黃照協等[12]以典型串并聯系統的備件庫存優化為研究對象,構建備件庫存優化模型,給出了基于邊際分析法的優化算法。羅祎等[13]根據METRIC理論,建立了具有多等級的維修供應體系、多層次結構備件的初始庫存分配通用模型。聶濤等[14]通過建立單項備件供應可用度模型,構建了兩級閉環供應鏈庫存系統優化模型,并運用邊際效能分析算法實現了系統供應效能的最大化。現有的庫存預測優化模型仍以傳統的時間序列方法為主,基于大數據統計分析的方法較少。
本文提出了一種基于深度學習的設備健康預測模型,首先采用自編碼器提取監測信號特征,然后設計一個結合遞歸神經網絡(recurrent neural network,RNN)與深度神經網絡(deep neural networks,DNN)的模型進行時序預測,并綜合預測結果構建設備健康度指標(health performance index,HPI)對設備健康狀況進行描述。其次,針對庫存優化問題,提出了一種基于統計分布判定和參數擬合的庫存預測方法,根據消耗量的分布計算出未來的消耗數量、安全庫存的設置點、重訂貨點,以及重訂貨量。最后,結合設備健康預測與庫存優化構建主動預警信息系統,將設備健康預測系統的輸出作為備品備件優化系統的輸入,進一步降低維修成本、減少庫存資金積壓、提高服務保障水平,并通過在某石化企業的應用驗證了所提方法的有效性。
設備健康狀態預測模型將各傳感器監測到的設備歷史運行數據綜合輸出為未來各時刻的健康度值,從而對設備健康狀態進行判斷。此模型的構建主要分為以下幾步:
(1)數據提取。選定一臺設備,從實時數據庫中提取傳感器采集到的轉速、壓力、溫度等監測數據,以及該設備對應的工況(正常工況、不同故障的工況)狀態。
(2)特征提取。本文使用自編碼器Autoencoder對原始數據進行降維操作。自編碼器是一種數據壓縮算法,先將原始資料進行壓縮,再將壓縮的資料還原,使得數據轉換到一個新的空間。由于自編碼器采用的是非線性的降維方式,因此降維的效果優于主成分分析(principal component analysis,PCA)等傳統降維方法。采用自編碼器將多個傳感器采集到的高維數據進行降維操作,最終得到更加簡潔而有效的特征表達。
(3)基于深度學習的預測模型搭建。該模型網絡架構如圖1所示。第一部分為模型的輸入部分,輸入的值為通過自編碼器提取到的信號在時間點t、t-1、t-2、…的歷史運行數據。第二部分為RNN層,本文的RNN層數設定為2,其神經元數目需要通過實驗確定。通過RNN的時間序列特性,找出輸入特征間的關系。第三部分為DNN層,將RNN提取出的特征進行維度的轉換,進而進行預測。本文中的DNN層數設定為2,神經元數目根據實驗確定。本文將均方誤差(mean square error,MSE)作為設備健康狀態預測模型的目標函數,通過梯度下降法(gradient descent)對模型進行訓練。第四部分為模型的輸出層,輸出各信號在未來某時刻對應的單個預測值。

圖1 基于深度學習的預測模型Fig.1 Prediction model base on deep learning network
(4)構建設備健康度指標。由于設備的健康狀況是多個特征共同作用的結果,因此通過分析工況與狀態的關聯關系,將上述設備各主要信號的預測值綜合成0~100%的評價指標,稱為HPI。HPI的值越大,設備的健康度越高,因此通過HPI對設備的健康狀態進行量化,使用戶更容易地對設備健康狀態進行判斷。
庫存預測與優化模型根據備品備件歷史消耗量的分布計算出未來的消耗數量、安全庫存的設置點、重訂貨點、重訂貨量,此模型的構建主要分為以下幾步:
(1)以備品備件的歷史消耗數據為輸入,進行備件需求分析,得到綜合的備件消耗統計特征值。對有歷史消耗的備件,預測未來一年的備件需求量:
(1)
式中,w為平滑系數,模型里取值為0.4;di為剛過去的第i個季度的備件需求量;k為要納入計算的過去的季度數。
對于無歷史消耗的備件,則綜合考慮備件總裝機量、備件平均壽命等因素,基于期望故障率進行預測:
D2=NλTm/n=NTm/(nTM)
(2)
式中,D2為未來一段時間的備件需求量;N為備件的總裝機量;λ為處于“偶然故障期”內備件的單位時間的故障率;TM為備件的平均無故障周期;T為預測的時段;m為正常使用的設備數量;n為包含正常使用和備用機的設備總數量。
(2)得到備件的消耗規律后,采用χ2匹配度檢驗來確定備件消耗規律的統計分布。通過計算χ2來判斷相應的備件消耗規律所符合的統計分布類型,為后續的儲備定額計算提供基礎。χ2的計算公式為
(3)
式中,q為分段的總數量;FAi為第i個分段的實際頻數;FEi為第i個分段的理論頻數。
(3)計算備件的安全庫存。當庫存消耗為正態分布時,需綜合考慮要求的備件服務水平、備件平均需求量、備件采購提前期及其波動情況。當庫存消耗為泊松分布時,需考慮供應的不確定性和需求的不確定性。以泊松分布的庫存為例,其最優的安全庫存水平SS的計算公式為
(4)
式中,PR表示備件的重訂貨點,當備件庫存低于該值時需要重新補充備件;μ為備件需求所滿足的泊松分布的均值;TL為備件采購提前期;z為服務水平或備件保障率所對應的相應的安全系數;σl為備件采購提前期的偏差。
(4)計算備件的重訂貨點。重訂貨點是指采用連續盤點的庫存控制策略時,庫存量下降到某個預先規定的數量而需要進行備件采購補充時的庫存值。正態分布下的重訂貨點取決于備件的安全庫存量以及采購提前期內的備件平均需求量;泊松分布下的重訂貨點取決于備件要求的服務水平和備件平均需求量。泊松分布的庫存下,需要備件時可以從庫房里得到備件的概率為
(5)
(5)計算備件的重訂貨量。本文使用經濟訂貨量法計算重訂貨量,它綜合考慮了庫存持有成本和采購成本。
(6)在得到所需要的備件儲備定額后,對計算結果進行綜合分析和評價,平衡備件儲備定額和備件保障效能,從而得到各個備件的最優的安全庫存、重訂貨點和經濟訂貨批量。
本文提出的主動預警原型系統總架構如圖2所示。設備健康預測系統的數據輸入主要是實時數據庫中的數據。設備健康預測的輸出、外部數據、企業資源計劃系統和設備關鍵等級系統一起作為備品備件優化系統的輸入,其中,外部數據主要提供設備對生產的重要性程度、采購的不穩定性等級等信息;企業資源計劃系統主要提供庫存現狀數據、采購歷史數據和消耗歷史數據等信息;設備關鍵等級系統主要提供設備關鍵等級數據等信息。將備品備件優化系統的輸出作為企業資源計劃系統的輸入,提供服務水平和庫存金額的建議。最后,通過構建此原型系統對設備健康預測模型與庫存優化模型的效果進行驗證。

圖2 系統框架Fig.2 Framework of the system
本文選擇某石化企業的泵設備作為模型評估的對象,根據2013~2017年各傳感器所監測到的該設備運行數據(包括設備的轉速、溫度、油壓、振動等信息)進行實驗。其中,2013、2014年的數據為預測模型的訓練數據,2015~2017年的數據為模型的測試數據。最后,根據設備的維修記錄對模型性能進行評價。
2017年5月10日,泵設備的運行狀態發生大幅波動。該設備在發生第一次預警后,于5月11日再次預警,并且預警時間持續延長,5月13日后,設備健康度一直低于基準線。設備在5月15日進行檢修,發現軸承已經有較大磨損,局部組件斷裂,并發生了電機缺相。這說明通過本文所設計的模型可以實現對設備運行故障的精確預警。
表1所示為本文模型的預測結果,其中,維修日期為該設備實際發生維修的日期,且故障開始時間都發生在實際維修日前的30d內;預警時間為模型輸出的設備發生故障的時間。由表1可以看出,此模型輸出的預警時間與設備故障時間是接近的,因此本模型可以對設備健康狀況進行準確預測。

表1 模型的預測輸出
本文算法和LSTM算法在不同的序列長度模型下的預測性能見表2。采用均方誤差對二者的設備健康度指標預測結果進行對比。由表2可以看到,序列長度相同時,本文算法在預測精度上顯著高于LSTM算法,訓練時間則要比LSTM算法短得多。因此,本文算法在某石化企業的數據集上取得了比現有標桿方法LSTM更好的效果。

表2 本文所提算法與LSTM算法的比較
本文以2007年1月~2016年12月某石化企業的備品備件消耗數據為訓練數據,對2017年1月~10月備品備件的消耗情況進行預測,并將其與2017年1月~10月實際的消耗數據進行比對來判斷模型的優劣程度。
每個備件的屬性和消耗量不同,需求量也會相差很大,為了更全面準確地測試模型效果,根據“建議的安全庫存是否為零”這一條件把所有5 473個備件分為2類,然后計算并比較重訂貨點檢驗指標α與安全庫存檢驗指標β的值來檢驗模型的結果,評估方法如圖3所示。

圖3 庫存預測模型結果評估的方法Fig.3 The evaluation method of inventory forecast
模型計算結果表明,1.1%的物料庫存儲備偏多,8.5%的物料庫存儲備偏少,剩余的90.4%的物料庫存儲備符合2017年1月~10月的實際消耗情況。
根據庫存優化模型,輸出每種備件的建議安全庫存數量、重訂貨點以及重訂貨量,進一步輸出備件庫存/采購總額與備件服務水平最優“包線”。包線上的任何一點都是可供選擇的,最佳選擇方案取決于對備件成本和備件服務水平的權衡和決策。與2017年的真實消耗量對比,庫存優化模型的可靠性達到90.4%,并且隨著數據的準確性和完善性提高,模型的可靠性還有進一步的提升空間。
在設備健康模型與庫存優化模型的基礎上,某石化企業開發了綜合備件主動預警平臺。該平臺界面同時顯示預測的失效時間以及現有的庫存量,可以根據備件失效的預計時間和采購的提前期,綜合考慮采購計劃,在減少庫存的同時,降低保供缺貨的風險。平臺的應用使某石化企業的備件庫存理論降幅達到2792萬元,同時備件的服務水平也從74%提高到95%。
(1)本方法在訓練時間遠低于LSTM算法的同時,預測精度高于LSTM算法,可實現對設備故障的快速精確預警。
(2)本文方法備件庫存優化模型的可靠性高達90.4%,可有效減少備件庫存。
(3)下一步的石化生產工業大數據的應用研究方向如下:①在對單個設備自身健康狀況進行預測的基礎上,自動識別與自身工況模式相似的同類設備,并對同類設備的健康狀況進行判斷;②根據石化設備健康狀態預測的結果進一步生成健康風險系數,判斷設備的健康風險等級,更好地對設備的維修維護進行指導。