孫洪展
(中國石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 青島 266580)
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展以及各領(lǐng)域?qū)W科技術(shù)的相互融合[1~3],對(duì)機(jī)械設(shè)備的時(shí)序數(shù)據(jù)的挖掘和分析顯得尤為重要。時(shí)序數(shù)據(jù)[4~5]記錄了設(shè)備運(yùn)行過程中隨著時(shí)間而產(chǎn)生的不同時(shí)刻的運(yùn)行狀態(tài)信息,充分利用這些信息對(duì)機(jī)械設(shè)備進(jìn)行故障預(yù)測(cè)可以幫助企業(yè)降低經(jīng)濟(jì)損失。
機(jī)械設(shè)備的故障預(yù)測(cè)是在了解和掌握設(shè)備的運(yùn)行狀態(tài)信息及規(guī)律的基礎(chǔ)上,根據(jù)一定的方法和策略對(duì)設(shè)備運(yùn)行狀態(tài)下未來變化趨勢(shì)及變化狀態(tài)進(jìn)行推測(cè),并對(duì)未來可能造成損失、故障的情況進(jìn)行及時(shí)預(yù)警,實(shí)現(xiàn)故障預(yù)防、視情維修等目的[6~7]。
早期的故障預(yù)測(cè)手段主要是根據(jù)專家或維修人員通過經(jīng)驗(yàn)、感官和儀器儀表等進(jìn)行判斷,但隨著機(jī)械設(shè)備的日益復(fù)雜化,傳統(tǒng)的分析手段已不滿足現(xiàn)狀。數(shù)據(jù)挖掘技術(shù)[8]的廣泛應(yīng)用,彌補(bǔ)了傳統(tǒng)方法上的不足。基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)技術(shù)[9]的典型代表有神經(jīng)網(wǎng)絡(luò)、馬爾可夫模型[10]等,通過分析數(shù)據(jù)中隱含信息進(jìn)行故障預(yù)測(cè)。
本文提出一種基于GRU 神經(jīng)網(wǎng)絡(luò)[11~12]的機(jī)械設(shè)備故障預(yù)測(cè)方法。首先,通過CRITIC 算法[13]挖掘設(shè)備運(yùn)行數(shù)據(jù)各參數(shù)之間的權(quán)重值[14~15]大小,結(jié)合設(shè)備歷史故障的特點(diǎn),確定影響故障發(fā)生的關(guān)鍵參數(shù);然后,通過GRU 神經(jīng)網(wǎng)絡(luò)對(duì)設(shè)備歷史數(shù)據(jù)進(jìn)行模型訓(xùn)練,通過多次實(shí)驗(yàn)迭代模型訓(xùn)練結(jié)果[16];最后,使用該模型對(duì)設(shè)備實(shí)時(shí)數(shù)據(jù)進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)表明,應(yīng)用該方法對(duì)**商業(yè)空調(diào)故障進(jìn)行預(yù)測(cè),避免了人工進(jìn)行預(yù)測(cè)的繁瑣步驟,提高了故障預(yù)測(cè)準(zhǔn)確率。
以**商業(yè)空調(diào)時(shí)序數(shù)據(jù)為數(shù)據(jù)樣本,首先對(duì)時(shí)序數(shù)據(jù)中含有缺失值、異常值和重復(fù)值的數(shù)據(jù)進(jìn)行清洗、填充和去除等操作,確保數(shù)據(jù)的完整性,提高數(shù)據(jù)的質(zhì)量。其次,對(duì)處理好的時(shí)序數(shù)據(jù)進(jìn)行權(quán)重值分析,挖掘設(shè)備中影響各故障發(fā)生的關(guān)鍵參數(shù)。然后,利用GRU 神經(jīng)網(wǎng)絡(luò)模型對(duì)時(shí)序數(shù)據(jù)進(jìn)行模型訓(xùn)練,不斷迭代最優(yōu)的模型訓(xùn)練結(jié)果。最后,使用該模型實(shí)現(xiàn)設(shè)備實(shí)時(shí)故障預(yù)測(cè)。
選取**商業(yè)空調(diào)數(shù)據(jù)時(shí)間、蒸發(fā)器側(cè)進(jìn)水溫度、蒸發(fā)器側(cè)出水溫度、冷凝器側(cè)進(jìn)水溫度、冷凝器側(cè)出水溫度、壓縮機(jī)吸氣溫度、壓縮機(jī)排氣溫度、蒸發(fā)器側(cè)壓力(吸氣壓力)、冷凝器側(cè)壓力(排氣壓力)、排氣過熱度、主回路液位、主供液閥開度共12個(gè)參數(shù)數(shù)據(jù)作為初始樣本集,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。通過對(duì)數(shù)據(jù)特點(diǎn)進(jìn)行分析,相鄰數(shù)據(jù)的平均值用于填充數(shù)據(jù)中的缺失值以及修正數(shù)據(jù)中的異常值。
CRITIC 權(quán)重法對(duì)多參數(shù)數(shù)據(jù)來講是一種較好的客觀賦值法,它是基于數(shù)據(jù)中參數(shù)的對(duì)比強(qiáng)度和參數(shù)間的沖突性來綜合衡量參數(shù)的客觀權(quán)重,將處理數(shù)據(jù)進(jìn)行量綱話處理后,數(shù)據(jù)的標(biāo)準(zhǔn)差可以體現(xiàn)數(shù)據(jù)參數(shù)之間的差異性:
Sj表示第j個(gè)參數(shù)類型的標(biāo)準(zhǔn)差,以此來表示各參數(shù)內(nèi)數(shù)值的差異波動(dòng)情況,標(biāo)準(zhǔn)差越大表示該參數(shù)中數(shù)據(jù)的差異越大,越能反映出更多的數(shù)據(jù)信息,也表示該參數(shù)本身的評(píng)價(jià)強(qiáng)度越強(qiáng),應(yīng)該給該參數(shù)類型分配更多的權(quán)重。
參數(shù)之間的沖突性用相關(guān)系數(shù)進(jìn)行表示:
使用相關(guān)系數(shù)來表示參數(shù)之間的沖突性,若與其他參數(shù)的相關(guān)性越強(qiáng),則該參數(shù)就與其他參數(shù)的沖突性越小,反映出相同的信息越多,所能體現(xiàn)的評(píng)價(jià)內(nèi)容就越有重復(fù)之處,一定程度上也就削弱了該參數(shù)的評(píng)價(jià)強(qiáng)度,應(yīng)該減少對(duì)該參數(shù)的分配權(quán)重。
CRITIC 權(quán)重值法以參數(shù)信息量大小的形式來表示具體的某個(gè)參數(shù)在總指標(biāo)體系中的作用,參數(shù)的信息量越大則表示該參數(shù)的作用越大,應(yīng)該給該參數(shù)分配更高的權(quán)重值,參數(shù)信息量表示如下:
因此,客觀權(quán)重值可以表示為
利用CRITIC 權(quán)重值法,計(jì)算關(guān)鍵參數(shù)中各參數(shù)的權(quán)重值,并結(jié)合設(shè)備各故障發(fā)生時(shí)的數(shù)據(jù)特點(diǎn),確定影響故障發(fā)生的關(guān)鍵參數(shù)。
設(shè)備運(yùn)行過程中的數(shù)據(jù)是不斷變化的實(shí)時(shí)數(shù)據(jù),結(jié)合故障數(shù)據(jù)特點(diǎn),利用GRU 神經(jīng)網(wǎng)絡(luò)對(duì)設(shè)備運(yùn)行的歷史故障數(shù)據(jù)進(jìn)行分析。GRU 神經(jīng)網(wǎng)絡(luò)是LSTM長短期記憶神經(jīng)網(wǎng)絡(luò)的變體,它相對(duì)于LSTM只含有兩個(gè)門控結(jié)構(gòu)。通過挖掘數(shù)據(jù)關(guān)鍵參數(shù),對(duì)篩選出設(shè)備關(guān)鍵參數(shù)的歷史數(shù)據(jù)進(jìn)行GRU 神經(jīng)網(wǎng)絡(luò)的模型訓(xùn)練。
GRU 神經(jīng)網(wǎng)絡(luò)單元在得到門控信號(hào)之后,使用重置門控得到“重置”之后的數(shù)據(jù),定義如下:
通過重置門控重置后的數(shù)據(jù)與輸入神經(jīng)元的數(shù)據(jù)進(jìn)行拼接,通過tanh 激活函數(shù)將輸入的數(shù)據(jù)縮放到-1~1的范圍之內(nèi),得到隱藏狀態(tài)數(shù)據(jù)?':
GRU 模型關(guān)鍵的步驟—更新記憶階段,在這個(gè)階段,同時(shí)進(jìn)行了遺忘和記憶:
GRU 神經(jīng)網(wǎng)絡(luò)使用一個(gè)門控單元同時(shí)實(shí)現(xiàn)輸入數(shù)據(jù)的遺忘和記憶兩個(gè)步驟,其中(1-z)⊙?t-1表示對(duì)原本數(shù)據(jù)的選擇性遺忘,忘記?t-1中的一些不重要的信息;z⊙?'表示對(duì)包含當(dāng)前節(jié)點(diǎn)信息的?'進(jìn)行選擇性“記憶”。
選取**商業(yè)空調(diào)2021 年6 月份數(shù)據(jù)作為故障預(yù)測(cè)的數(shù)據(jù)樣本。首先進(jìn)行數(shù)據(jù)預(yù)處理,填充缺失值,并對(duì)時(shí)序數(shù)據(jù)中的異常值進(jìn)行剔除。經(jīng)數(shù)據(jù)預(yù)處理后,挖掘設(shè)備數(shù)據(jù)中的關(guān)鍵參數(shù),并進(jìn)行GRU神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練。樣本數(shù)據(jù)中共包含86361 條數(shù)據(jù),12個(gè)空調(diào)設(shè)備參數(shù)。
通過與空調(diào)設(shè)備生產(chǎn)方專業(yè)人員交流,確定空調(diào)各項(xiàng)參數(shù)的正常值范圍。通過觀察正常值數(shù)據(jù),將該樣本數(shù)據(jù)中缺失的數(shù)據(jù)根據(jù)前后兩條數(shù)據(jù)的平均值進(jìn)行填充,并將數(shù)據(jù)類型錯(cuò)誤的數(shù)據(jù)按照同樣的方法進(jìn)行修正。數(shù)據(jù)預(yù)處理后的部分?jǐn)?shù)據(jù)如表1所示。
對(duì)預(yù)處理之后的數(shù)據(jù)進(jìn)行關(guān)鍵參數(shù)挖掘,除數(shù)據(jù)時(shí)間之外的11 個(gè)參數(shù)進(jìn)行CRITIC 權(quán)重法計(jì)算,經(jīng)過多次實(shí)驗(yàn)對(duì)比,選取空調(diào)設(shè)備中影響故障發(fā)生的關(guān)鍵參數(shù)。CRITIC 權(quán)重法計(jì)算各參數(shù)權(quán)重值如表2所示。

表2 各參數(shù)權(quán)重值
選取設(shè)備運(yùn)行過程中影響故障發(fā)生的關(guān)鍵參數(shù),剔除對(duì)設(shè)備運(yùn)行影響較小的參數(shù),減少該類無用參數(shù)對(duì)模型訓(xùn)練時(shí)間和結(jié)果的影響。根據(jù)CRITIC 權(quán)重法訓(xùn)練結(jié)果,選取蒸發(fā)器側(cè)進(jìn)水溫度、冷凝器側(cè)進(jìn)水溫度、冷凝器側(cè)出水溫度、壓縮機(jī)排氣溫度、冷凝器側(cè)壓力(排氣壓力)、主回路液位6個(gè)關(guān)鍵參數(shù)進(jìn)行模型分析。
利用TensorFlow搭建GRU時(shí)序數(shù)據(jù)預(yù)測(cè)模型,將挖掘的關(guān)鍵參數(shù)時(shí)序數(shù)據(jù)輸入到GRU 神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,并將該數(shù)據(jù)集進(jìn)行劃分,其中80%為訓(xùn)練集,20%為測(cè)試集。調(diào)整模型學(xué)習(xí)率、迭代次數(shù)等參數(shù),對(duì)模型進(jìn)行訓(xùn)練優(yōu)化。對(duì)設(shè)備實(shí)時(shí)數(shù)據(jù)進(jìn)行故障預(yù)測(cè),預(yù)測(cè)部分結(jié)果如表3所示。

表3 設(shè)備故障預(yù)測(cè)(部分)
根據(jù)模型對(duì)設(shè)備實(shí)時(shí)數(shù)據(jù)的預(yù)測(cè)結(jié)果,結(jié)合設(shè)備運(yùn)行過程中實(shí)際發(fā)生的故障進(jìn)行對(duì)比。實(shí)驗(yàn)表明,該方法對(duì)**商業(yè)空調(diào)機(jī)械設(shè)備故障預(yù)測(cè)準(zhǔn)確率顯著提高。
本文結(jié)合機(jī)械設(shè)備故障預(yù)測(cè)的開發(fā)現(xiàn)狀,以商業(yè)空調(diào)時(shí)序數(shù)據(jù)作為數(shù)據(jù)樣本,提出了一種基于GRU 神經(jīng)網(wǎng)絡(luò)的機(jī)械設(shè)備故障預(yù)測(cè)方法。該方法從設(shè)備實(shí)際運(yùn)行過程出發(fā),利用CRITIC 權(quán)重法從12 個(gè)空調(diào)設(shè)備運(yùn)行參數(shù)中提取影響設(shè)備運(yùn)行的關(guān)鍵參數(shù),剔除無用參數(shù)對(duì)模型訓(xùn)練結(jié)果的影響,通過GRU 神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,不斷迭代最優(yōu)模型訓(xùn)練結(jié)果。利用該模型進(jìn)行設(shè)備時(shí)序數(shù)據(jù)的故障預(yù)測(cè),能夠提前預(yù)警設(shè)備故障發(fā)生,降低了人工成本及企業(yè)經(jīng)濟(jì)損失,為機(jī)械設(shè)備故障預(yù)測(cè)工作提供支持。