李貝貝,彭 力
江南大學 物聯網工程學院,江蘇 無錫214122
軸承作為各種工業現場機械設備的重要零部件之一,對工業流程的順利進行和設備運行安全有著重要意義。但在長期的高強度、大載荷的復雜工況下,軸承極易出現異常狀況,導致故障發生。若能準確、及時地檢測到異常數據,則有助于設備及時維護,避免嚴重事故的發生。在大數據時代,隨著傳感器和機器學習技術的飛速發展,通過先進理論和方法使用歷史采集的狀態監控數據提取特征,構建數據驅動的軸承異常檢測模型,并保證異常檢測的準確性和穩定性,成為了當前研究的熱點并具有明確學術價值與應用意義。
軸承的振動監測數據是最直觀最方便判斷軸承是否出現異常的數據,通過加速度傳感器可以方便快速地采集數據并實時檢測。振動數據的采集通常需要在多個位置放置多個采集傳感器,因此振動數據的特點主要包括:數據量大、維度較低、各維度之間具有一定相關性。
軸承振動異常的檢測主要使用許多異常點檢測方法。檢測方法主要包括:(1)基于統計學的方法,假定大部分正常數據服從相同的數據分布,異常數據則不屬于該分布,但此類方法確定數據的概率分布模型以及參數比較困難。(2)基于鄰域的異常檢測方法,如近鄰算法(-nearest neighbor,NN)和局部異常因子算法(local outlier factor,LOF)。NN算法易于實現,但對于異常數據占比較少、樣本不平衡的軸承振動數據表現較差。LOF 算法通過局部可達密度彌補NN 算法對于樣本不平衡的數據集表現較差的缺點,但是LOF 算法對于參數的確定極為敏感,且算法復雜度高,時間成本高。(3)支持向量機(support vector machine,SVM),通過訓練數據對象的邊界或特征來確定異常數據。此方法需要大量能用于訓練的正常數據,并確定相應參數,且參數的設置對于檢測效果影響較大。(4)孤立森林(isolation forest,iForest)算法,通過構建隔離樹檢測異常數據,具有線性時間復雜度。但其采用無監督的方式,忽略數據特征之間的相關性進行隨機選取特征構建隔離樹,因此檢測準確度較低。
近年來,深度神經網絡(deep neural network,DNN)已在特征的自動提取和識別上成功應用,可自適應地提取信息豐富的重要特征,簡化繁重且有挑戰性的特征提取過程,具有較好的普適性。自編碼器(autoencoder,AE)最早由Rumelhart 等人提出,并將其用于復雜數據處理。隨后,Hinton 等人提出了深度學習神經網絡,由此產生了深度自編碼器。在深度自編碼器的基礎上,Ng提出高維而稀疏的隱層,對隱層加入稀疏性限制提高自編碼器特征學習能力,提出了稀疏自編碼器。如今,自編碼器和深度神經網絡被廣泛應用于故障診斷、圖像識別、異常檢測等領域中。自編碼器和神經網絡也被研究應用于軸承振動等工業數據的異常檢測問題上,自編碼器因其優越的特征提取能力得到了大量研究與應用。
由于傳感器技術的發展,軸承振動數據的采集更加方便快速,但導致數據量龐大,在自編碼器和神經網絡的訓練過程中,過大的數據量使得訓練效率較低并且檢測準確度無法得到有效提升。為了減少自編碼器和神經網絡的訓練數據量,本研究通過正常振動數據樣本的馬氏距離(Mahalanobis distance)得到判定閾值,計算數據與正常數據均值的馬氏距離,將沒有超過判定閾值的數據記為不確定數據并將該部分數據用于自編碼器和神經網絡的訓練。
對于神經網絡參數初始化問題,傳統的權值隨機初始化方法依然會有陷入局部最優的風險。本研究結合自編碼器和Sigmoid 分類器構建自編碼網絡(autoencoder network,AN)解決了神經網絡參數初始化問題,并且減少了網絡訓練次數和時間,提高了訓練效率。本研究將訓練完成的自編碼器中編碼層輸出作為分類器輸入,利用自編碼器獲得的編碼層權值和偏差解決神經網絡參數初始化問題,最后使用標簽化數據進行有監督的微調以完成整個自編碼網絡的訓練。
軸承振動數據各特征之間具有相關性,馬氏距離可用作判斷數據異常與否的重要特征,因此本研究將數據的馬氏距離作為特征添加到數據的特征中用于自編碼網絡的訓練過程,有效提高了自編碼網絡對軸承振動數據的異常檢測準確度。
自編碼器常被用在高維數據的特征提取和降維過程中,而對于特征較少的低維軸承振動數據,自編碼器的特征提取和降維作用并不顯著。為了增強自編碼器的特征提取能力以獲得更好的編碼層參數,提高整個自編碼網絡的異常檢測效果,本研究加入了稀疏約束條件并構建先升維再編碼的改進自編碼器結構,提高了自編碼器特征提取能力,并通過實驗證明了該結構具有更好的收斂性和異常檢測效果。
本研究的主要貢獻如下:通過馬氏距離快速判別出一部分異常數據以減少自編碼網絡的訓練數據量;將自編碼器和分類器結合解決了神經網絡的參數初始化問題,減少了網絡訓練時間;通過數據加入馬氏距離特征、先升維再編碼的自編碼器結構、稀疏約束條件,構建了一種改進自編碼網絡用于軸承振動異常檢測;通過實驗證明了該方法對于低維軸承振動數據具有較好的異常檢測效果。
印度統計學家Mahalanobis 提出了一種考慮到各變量之間相關性的廣義距離,稱為馬氏距離(Mahalanobis distance),其主要思想是利用向量間的協方差矩陣來表示其馬氏距離。
對于包含個數據、每個數據維度為的數據集=(,,…,X),其中均值為=(,,…,μ),協方差矩陣為,其中一數據為=(,,…,x),則其馬氏距離如下所示:

其中,為協方差矩陣的逆矩陣,馬氏距離可看作數據與總體數據均值的距離。
由于馬氏距離的計算需要使用數據集的協方差矩陣,較歐式距離等其他距離的最大優勢為馬氏距離考慮數據特征之間的相關性。在數據集中,如果一個數據的馬氏距離越小,則說明其與數據集中均值數據的相似度越大。在軸承振動數據等低維工業數據中,由于工藝流程和采集設備等緣故,數據的每個特征之間有著不可忽視的相關性,馬氏距離更適合用于軸承振動數據的距離表達。
考慮在軸承振動異常檢測中,假設某數據為正常數據,使用正常數據集的均值和協方差矩陣根據式(1)計算其馬氏距離。若該數據馬氏距離與正常數據馬氏距離接近,說明該數據與正常數據相似度較大,該數據大概率為正常數據;若該數據馬氏距離與正常數據馬氏距離相差較遠,說明該數據與正常數據相似度較小,則該數據大概率為異常數據。因此能夠使用軸承振動數據的馬氏距離來判斷數據為異常數據的可能性,該思想在2.1 節中詳細說明。
如上所述,軸承振動數據的馬氏距離可以用來判斷該數據為異常數據的可能性,故考慮將數據的馬氏距離作為軸承振動數據的一個特征。由于正常數據和異常數據的馬氏距離有較大的差別,在神經網絡的訓練過程中,加入的馬氏距離特征將作為重要特征,有利于提升神經網絡的異常檢測效果。因此在本研究提出的改進自編碼網絡訓練和檢測過程中,將數據的馬氏距離加入數據特征中,5.1 節中通過對比實驗證明了該思想的優越性。
自編碼器主要包括編碼和解碼階段,且結構對稱,即若存在多個隱層時,編碼和解碼階段的隱層數量及結構相同。主要結構由輸入層、隱層和輸出層組成,如圖1 所示。隱層對輸入層數據進行編碼,輸出層對隱層表達進行解碼重構原始數據,最小化重構誤差以獲得最佳的隱層表達。其目標是擬合一個恒等函數,使得每個輸出值盡可能等于相對應的輸入值。

圖1 自編碼器結構Fig.1 Structure of AE
對于數據集=(,,…,X),為數據個數,每個數據維度為,即X∈R(=1,2,…,)。每一個數據X經過編碼過程得到隱層表達,編碼過程可描述為:

其中,和為編碼權重和偏置,σ為編碼層激活函數,目前比較常用的有Sigmoid、Tanh、ReLU 等。然后隱層表達經解碼過程得到重構數據X′,解碼過程可描述為:

其中,′和′為解碼權重和偏置,取′=,σ為解碼層激活函數。


其中,為單個數據的損失函數,在式(4)中為均方誤差損失函數。同時為了防止出現過擬合,給代價函數添加一個L2 正則化權重衰減項,為懲罰因子,控制正則化項影響權重衰減的程度,得到最終的損失函數為:

文獻[17]證明,使用Sigmoid 激活函數時,交叉熵損失函數要優于均方誤差損失函數,由于本研究構建的自編碼網絡最終輸出為二分類,且通過實驗得到,無論是自編碼器的訓練階段還是編碼層結合分類器階段,Sigmoid 作為輸出層激活函數效果最理想,因此本研究采用交叉熵代價函數為:

在自編碼器的訓練過程中,通過編碼和解碼過程使代價函數最小來學習并提取數據重要的特征,即獲得最佳的隱層表達。
假設采集到的軸承振動數據集記為=(,,…,X),數據維度為。其中正常數據集記為X=(,,…,X),正常數據均值為μ=(,,…,μ),協方差矩陣為Σ,根據式(1)計算得到正常數據集中每個數據的馬氏距離記為:

其中,M表示在正常數據集中第個正常數據的馬氏距離。
接下來根據式(1)計算整個數據集中所有數據的馬氏距離。由于某一數據的變化會影響到數據集均值的變化,馬氏距離夸大了微小變化向量的作用,從而影響其他數據的馬氏距離計算。為了改善上述馬氏距離的缺點,在計算所有數據的馬氏距離時使用的均值和協方差矩陣仍然為正常數據集中的μ和Σ,顯然獨立的μ和Σ不受向量變化影響;根據1.1節,得到的某個數據的馬氏距離可看作該數據與正常數據集均值的距離。則數據X的馬氏距離記為:

根據統計學相關知識以及后續對軸承振動數據的實驗分析可知:如果數據X為正常數據,則其馬氏距離D(X)應符合正常數據馬氏距離數據集即M的統計分布;如果X為異常數據,則D(X)不符合M的統計分布。


通過實驗驗證,馬氏距離不在(,)區間內的數據均為異常數據。將馬氏距離在(,)區間內的數據判定為不確定數據,記為X,然后使用不確定數據集X訓練自編碼網絡以完成模型構建。同時將數據的馬氏距離加入到數據特征中,用于自編碼網絡的訓練。
于是,通過馬氏距離檢測出了一部分異常數據,將剩余的不確定數據輸入自編碼網絡中。對于數據量大的軸承振動數據而言,減少了用于自編碼網絡的訓練數據,并且能夠根據馬氏距離判別閾值快速判別出一部分異常數據,提高了檢測效率。
為了提高自編碼器學習數據特征的能力,在自編碼器基礎上添加約束條件,在其代價函數上加入稀疏懲罰項,使其形成稀疏自編碼器。稀疏自編碼器代價函數為:




本研究使用自編碼器的主要目的是利用其學習并提取數據特征的能力提取數據更有用的特征,得到更好的隱層表達用于結合分類器。而對于低維軸承振動數據,由于其維度較低、特征較少,不利于自編碼器提取其特征,導致自編碼器的收斂性較差。在實際應用中已證明了自編碼器對高維數據優秀的特征提取能力,因此考慮將數據先升維再編碼的自編碼器結構,通過升維結構提高了數據的維度,類似于增加了數據的特征。增加了升維層必然增加自編碼器訓練的運算復雜度,也相應地增加了自編碼器單次訓練的時間,但是自編碼器通過較少的訓練次數便可以得到最佳的隱層表達,其收斂速度增大。就總體時間而言,先升維再編碼的自編碼器能夠用較少的時間完成訓練,得到最佳隱層表達。因此不同于一般自編碼器直接降維編碼的結構,本研究基于稀疏自編碼器,構建先升維再編碼的網絡結構以提升對軸承振動數據的特征提取能力,同時在解碼階段保持與編碼階段的對稱結構。5.2 節中通過實驗證明了先升維再編碼的自編碼器結構收斂性更好,訓練時間更短,提升了自編碼器對低維數據的特征提取能力。
本研究構建的改進自編碼器結構如圖2 所示,X為輸入數據,數據維度為維,通過升維過程得到隱層表達U,其中>,維度升為維,同時解碼過程保持對稱結構。 h為編碼層輸出,為編碼之后的維度,使用訓練數據通過無監督貪婪算法使代價函數最小,從而完成自編碼器的訓練以得到最終編碼層輸出h作為分類器的輸入。

圖2 改進自編碼器結構Fig.2 Improved structure of AE
通過自編碼器的訓練,得到了最優的權值和偏差,將h作為分類器的輸入,把最優的和作為網絡的初始化參數,解決了神經網絡參數初始化問題。如圖3 所示,S為使用Sigmoid 激活函數的分類層,h作為其輸入,X為一維輸出結果,表示正常或異常數據,通過輸入標簽化訓練數據,結合誤差反向傳播算法和隨機梯度下降進行有監督的參數微調,最終完成整個自編碼網絡的構建。

圖3 有監督的微調Fig.3 Supervised fine-tuning
通過自編碼器的訓練得到了較為合適的網絡初始化參數,因此在自編碼網絡有監督的微調階段,能夠減少所需訓練次數,提高整個網絡的訓練效率。在5.3 節中,通過與普通DNN 的對比證明了將自編碼器與分類器結合的方法能顯著減少網絡的訓練時間。
文獻[19]指出,神經網絡的隱層數量比學習算法和自編碼器結構對性能的影響更加重要,本研究主要關注自編碼器用于軸承振動異常檢測,因此在此只使用單層的神經網絡分類器結構,由于是二分類任務,故單層使用Sigmoid 激活函數,輸出分類結果。
首先對所有振動數據歸一化處理,并從中提取出部分正常數據,計算正常數據的馬氏距離,根據式(9)、式(10)得到馬氏距離判別閾值。
根據式(8)得到所有數據的馬氏距離,將馬氏距離超過閾值的數據判定為異常數據,沒有超過閾值的數據記為不確定數據,并將數據的馬氏距離加入數據特征中。
將加入馬氏距離特征的不確定數據集作為圖2 所示的改進自編碼器的輸入,以無監督的方式訓練自編碼器,得到最優的編碼層輸出h以及最優的權值和偏差參數。
將h作為Sigmoid 分類器的輸入,使用帶標簽的不確定數據作為圖3 所示的結構中的輸入,進行有監督的微調以得到整個網絡的最優參數,完成自編碼網絡的構建。
隨機選取全部振動數據的一部分作為測試數據,根據式(8)得到其馬氏距離,將超過馬氏距離判別閾值的數據判定為異常數據,將沒有超過閾值的數據加入馬氏距離特征后放入訓練好的自編碼網絡中,得到最終檢測結果。從而測試整個異常檢測模型的異常檢測效果。
實驗環境為CPU Intel Core i5-6500 3.20 GHz、12 GB RAM 和Windows10 操作系統,使用python3.6下Keras框架實現。
實驗過程所用數據集為美國國家航空航天局(National Aeronautics and Space Administration,NASA)提供的智能維護系統(intelligent maintenance system,IMS)采集的軸承振動數據集,記作IMS Bearing data。該數據集通過加速度傳感器按照一定頻率采集機械設備的軸承振動數據,每隔10 s 能夠采集到20 480 條數據;共包含3 個子數據集,每個數據集均經過長時間數據采集,包含從正常到異常的振動數據。本實驗先選擇數據集1 描述實驗過程,該數據集是通過4個加速度傳感器采集同一軸承的各部分振動數據得到的,故該數據有4 個特征,由于傳感器分布于同一軸承設備,各特征具有一定相關性。之后,使用IMS Bearing data 剩余的數據集2、數據集3 以及XJTU-SY數據集進行實驗,進一步觀察本研究提出方法的異常檢測效果。
為了進一步提高實驗中異常檢測模型的構建效率,更好地體現異常檢測效果,本實驗需對數據集進行一定的預處理。首先由于軸承振動數據不具有突變性,為了提高實驗效率,本實驗將每10 s 的數據求平均值,將其歸并為1 條數據,用該平均值表示。然后將數據歸一化到[0,1]區間,有利于更好地進行自編碼網絡的訓練。隨后,根據2.2 節中的模型構建過程,經過馬氏距離快速檢測異常數據并得到不確定數據,隨后進行自編碼器的訓練,與Sigmoid 分類器結合,構建自編碼網絡檢測模型。整個異常檢測模型如圖4 所示。

圖4 軸承振動異常檢測模型Fig.4 Bearing vibration abnormal detection model
為了更易說明實驗的評價指標,本實驗定義異常數據為正類,正常數據為負類,因此評價指標混淆矩陣如表1 所示。

表1 評價指標混淆矩陣Table 1 Evaluation index confusion matrix
研究中使用準確率(Accuracy,)、精確率(Precision,)、召回率(Recall,)、F1 值(1)這4個度量標準來評價異常檢測效果,這4 個指標越接近1,則表明效果越好。
準確率()為所有預測正確的數據量占總數據量的比重,表達式為:

精確率()也稱查準率,即數據正確預測為異常數據的數據量占全部預測為異常數據的數據量的比重,表達式為:

召回率()也稱查全率,即數據正確預測為異常數據的數據量占全部實際為異常數據的數據量的比重,表達式為:

F1 值(1)為精確率和召回率的調和平均數,在異常檢測中,1 值能更全面地說明檢測方法的效果,取值范圍從0 到1,越接近于1 表示算法效果越好,其表達式為:

實驗使用的數據集1包含4個特征,即通過加速度傳感器在4個位置采集到的振動數據,記為Bearing1、Bearing2、Bearing3、Bearing4。其變化如圖5 所示,在時間點“2004-02-16 4:02:39”開始出現異常數據,由于軸承異常為不可逆的,該時間點之后采集到的數據均為異常數據。經過預處理后的數據集1 樣本大小如表2 所示。

圖5 數據集1 的軸承振動數據Fig.5 Bearing vibration data from dataset 1

表2 數據集1 樣本大小Table 2 Size of dataset 1
實驗中選擇正常數據中時間點“2004-02-13 11:02:39”到“2004-02-14 23:52:39”之間的數據用于計算馬氏距離判別閾值,該部分數據如圖6 所示。

圖6 正常軸承振動數據Fig.6 Normal bearing vibration data
將實驗數據集進行預處理之后,根據式(1)計算上述正常數據的馬氏距離,結果如圖7 所示。同時根據式(9)、式(10)得到馬氏距離判別閾值為19.23,為-0.38。

圖7 正常數據的馬氏距離Fig.7 Mahalanobis distance for normal data
接下來根據式(8)得到所有數據的馬氏距離,如圖8 所示,并通過馬氏距離判別閾值快速判別異常數據與不確定數據。

圖8 所有數據馬氏距離Fig.8 Mahalanobis distance for all data
由圖8 可知,許多異常數據的馬氏距離明顯超過了,將馬氏距離超過的數據判定為異常數據。通過實驗,根據式(14)得此次異常檢測精確率為1,說明此次檢測結果為異常的數據均為真實異常數據,所有正常數據的馬氏距離均未超過。將馬氏距離未超過的數據作為不確定數據集進入自編碼網絡的訓練階段,其中包含正常數據與異常數據。
判定為異常數據樣本個數為362,得到不確定數據樣本個數為622,不確定數據集如表3 所示。將超過閾值的異常數據快速檢測出來,提高了檢測速度,同時明顯減少了訓練樣本數量,有利于提高自編碼網絡的訓練效率。

表3 不確定數據集Table 3 Uncertain dataset
在得到各數據的馬氏距離之后,將其馬氏距離也作為數據的一個特征,因此數據的特征即維度增加到5 個,在后續的實驗中,將證明加入馬氏距離作為數據特征可增強異常檢測的效果。
本實驗構建以式(11)為代價函數的稀疏自編碼器,首先構建如圖2 所示的先升維再編碼的改進自編碼器結構。由于輸入數據為5 維,自編碼器的輸入層為5 維。升維層和編碼輸出層的維數需通過實驗進行確定,而這兩層的維數關系到自編碼器與分類器結合的自編碼網絡異常檢測效果,因此升維層和編碼輸出層的維數通過4.3 節中自編碼網絡異常檢測實驗確定。在此,構建結構為5-10-2-10-5 的先升維再編碼的改進自編碼器以調節其他參數。
由于在代價函數中加入了稀疏性限制,稀疏懲罰項權重系數和稀疏常數的設置尤為重要。為了更為明顯地觀察自編碼器重構誤差隨參數的變化,將自編碼器的訓練次數設置為10,進行5 次實驗取最后重構誤差的平均值。圖9給出了稀疏懲罰項權重系數與自編碼器重構誤差的關系,圖10 給出了稀疏常數與自編碼器重構誤差的關系。由圖9、圖10可得稀疏懲罰項權重系數和稀疏常數的最佳值分別為0.20 和0.04。自編碼器的參數設置如表4 所示。

圖9 自編碼器訓練誤差隨β 的變化Fig.9 Training loss changes with β

圖10 自編碼器訓練誤差隨ρ 的變化Fig.10 Training loss changes with ρ

表4 自編碼器參數設置Table 4 Parameter setting of autoencoder
將上述訓練完成的自編碼器編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構建如圖11 所示的改進自編碼網絡,將通過自編碼器得到的最優和作為網絡的初始參數。通過輸入標簽化的數據進行如圖3 所示的有監督的微調,迭代訓練次數為50。

圖11 改進自編碼網絡Fig.11 Improved autoencoder network
對于本研究提出的改進自編碼網絡中的升維層和編碼輸出層的維數,在此通過改進自編碼網絡對不確定數據集的異常檢測實驗來確定。為了增強實驗的可靠性和準確性,采用5 折交叉驗證方法進行實驗,將不確定數據集隨機均勻分為5 份,輪流將其中1 份作為測試數據,剩余4 份作為訓練數據。將5 次實驗結果數據的平均值作為實驗結果。實驗結果隨兩個層的維數的變化如圖12、圖13所示。從圖12可知,將升維層的維數設置為10 最合適;另外觀察到維度小于5 即沒有升維時,異常檢測效果較差,而當維度高于5 即升維時,效果較好,進一步證明了先升維再編碼的網絡結構有利于提高自編碼網絡異常檢測效果。從圖13 可知,將編碼輸出層的維數設置為2 最合適,從自編碼器原理可知,由于輸入數據維度為5 維,編碼輸出層的維度必須小于5。

圖12 實驗結果隨U 層維度變化圖Fig.12 Experimental result changes with dimension of U layer

圖13 實驗結果隨h 層維度變化圖Fig.13 Experimental result changes with dimension of h layer
為了從不同角度進一步考察提出方法的有效性,設計4 組不同對比實驗:(1)數據是否加入馬氏距離特征進行構建自編碼網絡的異常檢測效果對比;(2)傳統自編碼網絡和改進自編碼網絡的對比;(3)本研究提出的異常檢測方法與其他傳統異常檢測方法的對比;(4)將本研究提出的方法用于IMS Bearing data 的另外兩個數據集以及XJTU-SY 數據集,觀察其檢測效果。
為了研究將數據的馬氏距離作為數據的特征放入改進自編碼網絡中進行訓練對異常檢測效果的影響,將加入馬氏距離作為特征的不確定數據集和不加入馬氏距離作為特征的不確定數據集分為兩個數據集,分別訓練本研究提出的改進自編碼器和改進自編碼網絡并測試。
不加入馬氏距離作為特征的不確定數據具有4個特征,因此輸入層維度改為4。將自編碼器的迭代訓練次數設置為15,改進自編碼網絡的訓練次數設置為25,此時已經得到較低的訓練誤差。同樣采用4.3 節中提到的5 折交叉驗證方法進行實驗,實驗結果如表5 所示。可證明,將數據的馬氏距離作為數據的一個特征,可有效提高本研究提出的改進自編碼網絡異常檢測效果。

表5 訓練數據是否加入馬氏距離的對比Table 5 Comparison of training data with or without Mahalanobis distance
首先,需要構建傳統自編碼器并結合分類器構建傳統自編碼網絡。于是在本實驗中,構建結構為5-2-5 的直接降維編碼的如圖1 所示的傳統自編碼器,除網絡結構外的參數與4.2 節中構建的改進自編碼器相同。同4.2 節所述,將不確定數據集用于訓練傳統自編碼器。同4.3 節所述,將訓練完成的傳統自編碼器的二維編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構建如圖14 所示的傳統自編碼網絡,并通過輸入標簽化的數據進行有監督的微調,迭代訓練次數仍然為50。

圖14 傳統自編碼網絡Fig.14 Traditional autoencoder network
首先進行傳統自編碼器和改進自編碼器的訓練重構誤差的比較,將不確定數據集作為兩種自編碼器的輸入進行50 次迭代訓練,兩者的訓練重構誤差曲線如圖15 所示。可知,在迭代訓練次數到達15 次左右時,改進自編碼器的訓練誤差基本達到了最小值,因此在后續對比實驗中,將改進自編碼器的迭代訓練次數設置為15。

圖15 自編碼器誤差曲線比較Fig.15 Comparison of autoencoder loss
傳統自編碼器和改進自編碼器的訓練時間對比如表6 所示,為得到最佳的隱層表達,傳統自編碼器需要50次迭代訓練,而改進自編碼器只需15次迭代訓練。
如圖15 所示,先升維再編碼的改進自編碼器通過更少的訓練次數達到了最小的訓練誤差即收斂速度更快,因此改進自編碼器較傳統自編碼器具有更好的收斂性;如表6 所示,雖然先升維再編碼的結構增加了單次迭代訓練的時間,但是由于訓練次數所需更少,改進自編碼器的訓練所需總時間更短。綜上,先升維再編碼的改進自編碼器具有更好的低維數據特征學習能力。

表6 自編碼器訓練時間的對比Table 6 Comparison of autoencoder training time
接下來進行傳統自編碼網絡和改進自編碼網絡在收斂性上的比較。將不確定數據集中的數據放入上述兩個自編碼網絡進行訓練,訓練誤差曲線如圖16 所示,訓練準確率()曲線如圖17 所示。可知,在迭代訓練次數到達30 次左右時,改進自編碼網絡的訓練誤差基本達到了最小值且訓練準確率也基本達到最大值,而傳統自編碼網絡需要50 次以上的迭代訓練次數才能夠將訓練誤差降低到最小值并得到最大的訓練準確率。因此在后續對比實驗中,將改進自編碼網絡的迭代訓練次數設置為30。

圖16 自編碼網絡誤差曲線比較Fig.16 Comparison of autoencoder network loss

圖17 自編碼網絡準確率曲線比較Fig.17 Comparison of autoencoder network accuracy
傳統自編碼網絡和改進自編碼網絡的訓練時間對比如表7 所示,改進自編碼網絡訓練次數設置為30,而傳統自編碼網絡迭代訓練次數為60 時才獲得與改進自編碼網絡相同的訓練誤差和準確率。

表7 自編碼網絡訓練時間的對比Table 7 Comparison of autoencoder network training time
如上所述,改進自編碼網絡的收斂速度要明顯優于傳統自編碼網絡,前者能夠用更少的迭代訓練次數得到不小于傳統自編碼網絡的收斂精度,故改進自編碼網絡的收斂性更好;在訓練時間方面,雖然改進自編碼網絡的單次迭代訓練時間較長,但其所需迭代訓練次數較少,訓練所需總時間更短。綜上,改進自編碼網絡能達到更好的訓練效果。
仍然采用5 折交叉驗證方法進行傳統自編碼網絡和改進自編碼網絡的異常檢測效果對比實驗,同樣將不確定數據集隨機均勻分為5 份,輪流將其中1份作為測試數據,剩余4 份用于網絡訓練數據。將5次實驗結果數據的平均值作為實驗結果,如表8 所示。由表8 及以上實驗可知,對于低維軸承振動數據,本研究提出的改進自編碼網絡異常檢測效果要優于傳統自編碼網絡。

表8 傳統自編碼網絡與改進自編碼網絡的對比Table 8 Comparison between traditional autoencoder network and improved autoencoder network
為對比自編碼網絡的穩定性,進行在不同訓練量的情況下傳統自編碼網絡和改進自編碼網絡的異常檢測效果對比。在網絡訓練階段,分別選用20%、40%、60%、80%的不確定數據集進行訓練,其余數據用于測試。自編碼器迭代訓練次數為15,自編碼網絡迭代訓練次數為30,每個實驗重復20 次取實驗結果平均值,不同訓練量下的實驗結果對比如表9所示。

表9 不同訓練數據量下的實驗結果對比Table 9 Experimental results comparison under different amounts of training data
由表9 可知,改進自編碼網絡在不同訓練數量的情況下,異常檢測效果均比傳統自編碼網絡要好。如圖18 所示,隨著訓練數據量的增加,改進自編碼網絡檢測效果越來越好,具有一定的穩定性。

圖18 實驗結果隨訓練數據量變化圖Fig.18 Experimental result changes with amount of training data
同樣采用5 折交叉驗證方法進行實驗,使用IMS Bearing data 中的數據集1,將本研究提出的軸承振動異常檢測方法與其他異常檢測方法進行對比實驗。實驗結果如表10 所示。

表10 異常檢測算法與所提方法的對比Table 10 Comparison of anomaly detection algorithms with proposed method
由表10 可知,本研究所提方法對低維軸承振動數據的異常檢測要優于其他異常檢測方法。
在表10 中,DNN 的結構設計為5-10-2-1,并將馬氏距離添加進特征,與改進自編碼網絡結構相同,但是沒有自編碼器的訓練階段。實驗中發現,由于不恰當的初始化而陷入局部最優的情形,DNN 需要更多的訓練次數而且穩定性差。實驗中,DNN 平均需要80 次迭代訓練才能達到最小的訓練誤差,每次迭代訓練時間平均為141 μs,因此DNN 所需訓練總時間為11 280 μs;本研究所提網絡的訓練時間包括自編碼器的訓練時間和自編碼網絡的訓練時間,通過5.2節可知訓練總時間為6 990 μs。可見通過自編碼器訓練后結合分類器構建的自編碼網絡比同結構的普通神經網絡所需訓練時間更少,訓練效率更高。
綜上,本研究所提方法通過自編碼器訓練得到的隱層參數用于初始化分類器網絡,減少了網絡訓練次數,大幅提高了網絡的訓練效率。
IMS Bearing data 中的數據集2 通過8 個不同位置的加速度傳感器獲取數據,因此數據集2 特征為8個,在時間點“2003-11-21 12:08:36”開始出現異常數據,其數據變化如圖19 所示。IMS Bearing data 中的數據集3 通過4 個不同位置的加速度傳感器獲取數據,數據集3 特征為4 個,在時間點“2004-04-15 10:21:53”開始出現異常數據,數據集3 的數據變化如圖20所示。XJTU-SY數據集使用兩個加速度傳感器采集軸承水平和豎直方向上的振動數據,每分鐘采樣32 768個樣本,因此其數據特征為2 個,數據預處理時將每秒鐘采集到的數據使用平均值歸為1 條數據。經過預處理之后的3 個數據集樣本大小如表11 所示。

圖19 數據集2 的軸承振動數據Fig.19 Bearing vibration data from dataset 2

圖20 數據集3 的軸承振動數據Fig.20 Bearing vibration data from dataset 3

表11 3 個數據集樣本大小Table 11 Size of 3 datasets
同樣采取上文所提的5 折交叉驗證方法進行實驗,實驗結果如表12 所示。可知本研究提出的方法在另外3 個數據集上保持了較好的檢測效果,因此對于低維軸承振動數據具有一定的泛化能力。尤其數據集3 為異常數據占比較少的不平衡數據集,本研究提出的方法依然具有良好的檢測效果。

表12 在3 個數據集上的實驗結果Table 12 Experimental results on 3 datasets
本研究針對軸承振動數據維度低、數據量大、各特征之間具有一定相關性的特點,提出了一種結合馬氏距離與自編碼網絡的異常檢測方法。通過正常數據的馬氏距離,得到判別閾值以快速檢測出部分異常數據,減少了自編碼網絡的訓練數據量;將自編碼器與分類器結合,解決了網絡參數初始化問題;提出先升維再編碼的自編碼器結構,而且將數據的馬氏距離作為特征加入到網絡訓練中,有利于自編碼網絡的訓練,提升了異常檢測效果。實驗證明了本研究所提方法較其他異常檢測算法有著更好的檢測效果,并且具有一定的穩定性和泛化能力。在未來的工作中,考慮引入時序深度學習模型研究如何實現快速在線檢測和分類。