王遠濤 馮 濤 孫 恰 王 晶 王藝瀚
(北京工商大學人工智能學院,北京 100048)
冷藏是食品日常保鮮的主要手段,制冷壓縮機是冷藏設備的核心部件,也是最容易出現故障的部件。壓縮機殼體的振動與其運轉狀態密切相關,壓縮機的機械運轉故障都會在殼體的振動信號中有所反映,因此,可以通過測量殼體振動信號,判斷壓縮機是否處于故障狀態。隨著人工智能的發展,作為其技術基礎的機器學習方法,也開始在壓縮機等機電設備運轉異常檢測過程得到應用,基于機器學習技術的分類模型開始得到應用[1-2]。
裴悅琨等[3]和楊志銳等[4]采用光學信號,應用機器學習方法,分別實現了櫻桃和紅棗的缺陷檢測。在機電設備檢測方面,程華利等[5]針對電機質檢工序聲信號的統計特征及質檢工藝的特點,提出了基于一分類學習的異響檢測方法。該方法以正常樣本為基礎建立質檢判別函數,避免了其他分類算法要求訓練樣本類別全面和覆蓋廣泛的條件。溫浩等[6]利用小波包時頻局部化特征和支持向量機,對電機聲信號進行分析,驗證了這種方法的有效性。張新等[7]采用機器學習的方法對汽車調光電機進行異音識別研究,結果表明采用BP神經網絡的機器學習法能夠有效地識別電機異音。常嘉樹[8]使用振動臺及消聲箱與振動測試系統,構建了一個異音異響測試環境,對汽車零部件生產線異音異響測試問題有一定的參考價值。針對洗衣機異音檢測,李春陽等[9]提出了一種洗衣機異音識別模型,根據卷積神經網絡顯著特征提取能力和平移不變性,學習洗衣機的異音特征,實現生產線洗衣機的異音自動智能識別。在壓縮機方面,Yang等[10]提出了使用支持向量機(Support Vector Machine,SVM)和人工神經網絡的方法進行壓縮機故障分類,提高了預測的可靠性和穩定性。He等[11]基于深度學習思想,提出了一種通過局部均值分解(LMD)對振動信號進行分解,后根據互相關準則構造了虛擬噪聲通道的壓縮機故障診斷方法。Li等[12]提出了一種基于修正多尺度熵(MMSE)和全局距離評價(GDE)的往復式壓縮機氣門故障診斷方法,選擇最優靈敏度尺度特征最后有效地識別往復壓縮機閥的故障。
隨著壓縮機生產技術的進步,故障機在生產中出現的比例逐步降低,這就給分類模型的訓練帶來了很大困難,主要體現在兩個方面:① 故障機樣本個數相比于正常機樣本少很多,出現了樣本不均衡現象;② 故障機樣本相比于正常機樣本,在特征空間的離散度要大很多,這兩個問題都會導致現有的分類模型在訓練過程中出現偏差。文章擬對制冷壓縮機異常振動檢測方法進行研究,基于深度學習方法,應用自編碼器神經網絡模型,不考慮故障機樣本,對單一的正常機樣本數據進行特征提取,使用正常機特征重構實測樣本信號,根據重構信號和原始信號的差異,實現壓縮機異常振動的檢測。
自動編碼器(Autoencoder,AE)是神經網絡的一種,其基本思想就是直接使用一層或者多層的神經網絡對輸入數據x進行映射,得到輸出向量h,h作為從輸入數據提取出的特征。基本的自編碼器模型是一個簡單的3層神經網絡結構,如圖1所示,一個輸入層、一個隱藏層和一個輸出層,其中輸出層和輸入層具有相同的維數,自編碼器的目標是使用稀疏的高階特征h來重構自己。
自編碼器由兩部分組成,如圖2所示,編碼器(Encoder)將輸入數據壓縮成潛在空間的表征h,可以用編碼函數表示,編碼函數為:
h=f(x)。
(1)

圖1 自編碼器結構示意圖


(2)
因此,有:

(3)


如圖4所示,壓縮機放置在托盤上,托盤隨生產線移動,到達檢測工位后,下氣缸頂起托盤,使其脫離生產線,減小生產線傳送鏈振動對測量的影響,上氣缸壓下,使加速度計緊貼壓縮機殼體表面,在上氣缸和加速度計之間通過彈性阻尼環相連,保證加速度計與壓縮機殼體可靠接觸。在生產線上使用加速度計采集壓縮機殼體振動信號,使用NI9234采集卡完成振動信號的數字采集。通過人工方式挑選出正常樣本信號,提取其譜特征作為自編碼器的訓練數據集。圖5~圖8分別為正常機和故障機信號樣本的時域波形和功率譜,因為異常振動檢測過程中只關注壓縮機殼體振動信號的波形特征,所以文中以信號的輸出電壓為單位。從圖5~圖8可以看出,故障機與正常機在時域波形圖和頻譜圖上均無顯著差異,無法直接通過時域波形或頻譜判斷樣機是否正常。

圖2 自編碼器組成示意圖

實線框部分為自編碼器的學習訓練流程,虛線框部分為自編碼器的檢測流程
在壓縮機生產線上采集壓縮機振動信號,通過數據預處理,得到2 964個振動信號樣本,樣本標簽在采集過程中由人工判定方式給出,其中正常樣本數為2 857,故障樣本數為107。樣本分為訓練和測試兩大類,相互之間沒有重疊,訓練樣本只包含正常機,數量為953;測試樣本中正常樣本數量為1 904,故障樣本數量為107。

1. 生產線 2. 壓縮機 3. 彈簧阻尼 4. 上氣缸 5. 加速度計 6. 下氣缸 7. 托盤

圖5 正常機時域波形

圖6 正常機頻譜
從圖9可以看出,從正常機的分布圖來看,其絕大部分數量分布在小于6的范圍內,從故障機的分布圖來看,故障機的絕大部分數量分布在大于6的范圍,所以可以通過特定的均方差值實現正常機和故障機的劃分。
使用準確率檢測自編碼器的判定效果,準確率的定義如下:
(4)
式中:
A——準確率,%;
TP——正常樣本中被判定為正常的數量;
FP——故障樣本中被判定為正常的數量;
TN——故障樣本中被判定為故障的數量;
FN——正常樣本中被判定為故障的數量。
下文從自編碼器參數和訓練樣本數量兩個方面,研究自編碼異常檢測的效果。自編碼器參數包括循環迭代次數和隱藏層數。圖10~圖12分別為自編碼器的循環迭代次數和隱藏層數以及訓練樣本的數量與其判定準確率的關系。由圖10~圖12可以看出,各種參數條件下,自編碼器的判定準確率都在96%以上。
設定訓練正常機的數目為191,隱藏層數為100,改變迭代次數,研究自編碼器的計算迭代次數與判別準確率的關系,結果如圖10所示。由圖10可知,隨著迭代次數的增大,準確率總體上會有少許改善,但特定情況下,迭代次數增加也不會導致判定準確率提高。比如迭代次數為1 000時,判定準確率從98.0%降低到了96.7%。

圖7 故障機時域波形

圖8 故障機功率譜

圖9 均方差值與樣本數量分布

圖10 自編碼器計算迭代次數與準確率的關系

圖11 自編碼器隱藏層數與準確率的關系

圖12 訓練樣本數量與準確率的關系
設定訓練正常機的數目為191,迭代次數為1 000,改變隱藏層數,研究自編碼器的隱藏層數與判別準確率的關系,結果如圖11所示。由圖11可知,準確率并不隨隱藏層數的增加而提高,而是呈一種起伏關系,隱藏層數由50層增加到200層,準確率會在96.3%至98.6%之間變動。
設定迭代次數為1 000,隱藏層數為100,改變訓練用正常機的數量,研究訓練樣本數量與判別準確率的關系,結果如圖12所示。由圖12可知,準確率隨訓練樣本數量的增加而提高,最高已超過99%。樣本數量較少時,準確率隨樣本數量增加有明顯提高,樣本數量較多時,準確率隨樣本數量增加而提高的程度放緩,呈一定的飽和特性。
迭代次數和隱藏層數對判定準確性有影響,但規律性不強;樣本數量對判定準確率影響顯著,會隨訓練樣本數量增加而提高,樣本數量較少時,準確率隨樣本數量增加有明顯提高,樣本數量較多時,準確率隨樣本數量增加而提高的程度放緩,呈一定的飽和特性。因此,提高訓練樣本數量是提高自編碼器判定效率的有效方法。綜上所述,在選定合適自編碼器參數和較多訓練樣本數量的條件下,自編碼器可以用于制冷壓縮機的異常振動檢測。