劉嘉煜,夏曉毛,宋予熙
(博世汽車部件(長沙)有限公司,湖南 長沙 410100)
隨著工業4.0時代的到來,日益增長的對于質量和產量需求及更復雜的制造系統,使得現代制造業對加工設備的穩定性和可靠性的要求日趨嚴格。為了提升生產效率,減少制造成本,合理維修策略的制定及對于設備運行狀態的實時把控尤為重要。
20世紀90年代開始,兩種維修策略在實際生產過程中運用較為廣泛,一種是修復性維護,也被稱為故障驅動的維修,是一種在設備故障已經出現后進行維修的方式,這種方式可能導致生產過程中非計劃性的停機;另一種是按照固定的時間周期性進行預防性維護,維修計劃主要根據工程師的經驗決定[1]。Nowlan和Heap提出,89%的航空設備故障不存在狀態急劇惡化階段,故障可能按照某種模式隨機出現[2],所以基于時間的周期性維護可能由于維修計劃制定不合理造成生產資源的浪費或導致設備在兩次維護間隔之間損壞。近年來,基于設備狀態的預測性維護[3]由于其在降低維修成本,減少故障停機時間和延長設備使用壽命方面的潛力,在制造業的應用逐步增加。
預測性維護實現的核心在于通過非破壞性的方式對設備運行過程中能夠反映其健康狀態的數據進行監控,并基于實時數據進行診斷性分析和預測性分析,輔助維修計劃的制定。診斷性分析旨在對特定故障進行探測,并確定其產生的根本原因,而預測性分析主要基于當前數據和歷史數據對未來設備的工作狀況和剩余使用壽命(Remaining Useful Life,RUL)進行預測。
設備狀態的分析可依據其故障過程的物理公式,也可由數據驅動,通過數據挖掘的手段對其狀態進行識別。由于設備的復雜性逐漸提高,其狀態衰退機制難以明確,物理模型在實際生產過程中的準確應用受到了限制,因此,在先進的傳感器技術和提升的計算機算力的幫助下,數據驅動下,運用傳統機器學習和深度學習方法的預測性分析模式逐漸占據主要地位。
在基于傳統機器學習方法的預測性分析模式中,對采集的數據進行特征提取并進行特征篩選得到設備狀態的特征表示,這些特征被送入后續模型,如邏輯回歸,決策樹、支持向量機等,用于模型的訓練。訓練好的模型最后將用于設備健康狀態預測。然而特征工程的好壞對模型的表現起到關鍵作用,這一過程需要較豐富的領域知識,數據預處理和不完全的特征提取可能導致原始數據中能夠反映設備狀態的信息丟失。
近年來,日益蓬勃發展的深度學習網絡,如在自然語言處理(Natural Language Processing,NLP),圖像描述等方面起重要作用的循環神經網絡(Recurrent Neural Networks,RNN),為本質為時間序列的產線傳感器采集信號的表征提供了新思路。這些方法直接通過深度神經網絡從原始的時域信號中自適應地提取設備狀態特征表示,無需額外的領域知識,可端到端地實現設備故障的預測。
為解決傳統RNN梯度消失和梯度爆炸問題提出的長短時記憶網絡(Long Short-Term Memory,LSTM)中引入了門的操作,其對于歷史信息的記憶能力使其在捕捉傳感器數據中的時序信息方面更具優勢。Zhao R[4]等發現使用基于LSTM的網絡可以獲取傳感器信號中的有效特征,并在刀具磨損預測任務上進行了驗證。Zhao R[5]認為,除了時間上的信息外,不同維度傳感器數據之間包含的空間關系和數據中的噪音會使得僅僅使用LSTM變得不夠魯棒,所以選擇采取先使用卷積神經網絡(Convolutional Neural Networks,CNN)提取局部特征。文獻[6]中結合使用LSTM和CNN對原始信號進行特征提取后送入回歸層,實現對刀具后刀面磨損值的預測。
常用的非破壞性設備狀態監測方式包括采集聲信號、紅外信號及振動信號等[7],在Mourbray提出的P-F曲線中,振動信號能夠以相對較早的提前量幫助識別設備的潛在故障[8],文獻[9]中利用振動信號分別對設備的磨損,故障及剩余使用壽命進行了預測。同時考慮到實際生產環境中的噪聲影響,傳感器的成本及安裝的難易程度,本文中選擇采用振動信號進行設備故障的探測。
本文通過在車削機臺刀桿上加裝加速度傳感器,以26 000 Hz的頻率采集x,y,z三個方向的振動信號。利用車削機臺不同的故障狀態下,產品加工過程中的數據進行基于特征提取的機器學習模型和長短時記憶網絡的訓練,實現在真實生產環境下對機臺的不同故障類別的實時探測。
由于傳統機器學習模型對于特征工程的要求較高,為提高模型的擬合準確度,首先要對特征值進行篩選,去除無關冗余特征。本文基于Fisher Score進行關鍵特征的選取,其主要思想為對不同類別區分能力較強的特征應該具有類內方差較小,而類間方差較大的特點[10]。記總樣本數為n,第i類樣本數為ni,i∈[1,...C],C為樣本類別總數,第i類樣本集為ωi,x(k)表示樣本x在特征k上的取值, 表示第i類樣本特征k取值的均值,
表示所有樣本特征k取值的均值。則特征k的類間方差
類內方差
特征k在數據集上的Fisher Score
Fisher Score越大,則特征對于不同類別的區分能力越強。通過保留Fisher Score較大的特征進行特征篩選。
LSTM是一種特殊的循環神經網絡,通過不同的門結構來控制信息的傳遞。通過細胞狀態的使用,使得模型對不同時間間隔前后的數據具有記憶功能。這一點為在時間上具有明顯依賴性的設備狀態監控提供了有力的幫助。
式中,i t為輸入門,f t為遺忘門,o t為輸出門,⊙表示逐元素相乘,σ(·)表示sigmoid激活函數。參數W f、為隱藏層神經元個數)、U f、和通過模型學習得到,且在所有時刻取相同值。
LSTM層最后時刻的輸出 作為樣本xi的特征表示,通過全連接層和softmax層預測得到不同類別的概率softmax的計算公式為
為使得模型學習到不同時間維度信息,通過堆疊多個非線性LSTM層的方式得到深層LSTM,模型隱層的輸出在時間方向傳遞的同時也作為下一LSTM層的輸入。在僅考慮過去時間步長信息的LSTM的基礎上提出的雙向長短時記憶網絡,由于其信息流可雙向傳遞的特點,為模型同時考慮過去與未來信息的影響提供了一種可行方式。
由于模型結構復雜,參數量巨大,而實際生產過程中可獲取的樣本量較小,為了避免模型過擬合,通過在全連接層之前引入dropout層的方式,在訓練過程中隨機隱藏部分隱層輸出,對模型進行正則化。
對于深度學習模型,為獲取最優權重,模型訓練過程中,通過最小化損失函數交叉熵(Cross Entropy,CE),使用Adam進行模型權重的更新,并使用階梯式的方式調整訓練過程的學習率。交叉熵的計算公式為
為對比基于特征提取與傳統機器學習算法的模型和深度學習模型對真實生產環境下運行設備的故障探測能力,本文通過在不同時間段進行的兩次實驗,分別采集了車削機臺在兩種不同故障狀態及正常狀態下的產品加工過程中的振動數據,其中,第一次實驗的數據用作訓練集,第二次實驗數據用作測試集,故障狀態及訓練集與測試集劃分見表1。振動數據來源于車削機臺刀桿上安裝的加速度傳感器,傳感器以26 000Hz的頻率采集產品加工過程中x,y,z三個方向振動數據。

表1 數據集描述
對于本文研究的車削工藝,一片產品的加工過程大致可分為進刀段、粗車段、精車段與退刀段,其x軸方向的振動信號如圖1所示。由于進刀與退刀段的過程表現受周圍環境影響較大,故本文中僅提取與當前工序狀態相關性較強的粗車段與精車段數據進行后續的分析。同時,為消除加工不同型號產品引入的振動強度差異,將x,y,z軸數據處理為對于三軸總振幅的相對值。在數據預處理后,對表2所示模型進行了訓練。

表2 模型及訓練數據描述

圖1 產品加工過程中的x軸方向振動數據及加工階段劃分
對于傳統機器學習模型LR,SVC,DT和RF,首先對x,y,z三個方向振動數據提取時域、頻域、時-頻域特征。樣本數據記為樣本數據的快速傅里葉變換,結果記為p(f),短時傅里葉變換,結果記為S(t,f),HHT(Hilbert-Huang Transform,希爾伯特黃變換)后得到的解析信號的實部與虛部分別記為a(t)與b(t)。其中,對于頻譜偏度取均值,最大值對應頻率及過95%置信區間的點個數作為特征值;頻段的劃分取用0Hz,
3 500Hz,5 000Hz,65 00Hz,8 000Hz,9 500Hz,11 000Hz,26 000Hz,HHT作用于經驗模態分解處理后得到的1~10層本征模態函數。由此,每個產品數據由264維特征向量表征,經特征篩選降維處理后,用于上述四類模型的訓練。對于SVC、DT和RF,模型超參數的選擇采用在訓練集上進行5折交叉驗證,最大化加權f1 score的方法。
對于可直接處理時序數據的LSTM模型,為減少采樣過程中引入的隨機性[11],以100個樣本點為一組,對粗車段和精車段不同軸信號分別求取均值、標準差、最大值和最小值,保留100個時間步長,每個時間步長由32維向量構成。由于原始數據樣本量較小而模型結構相對復雜,為防止過擬合的情況發生,對于每個產品的數據,通過隨機截斷的方式,生成1 000個樣本,經過二次采樣處理的訓練集大小擴充為278 000。所用模型結構見表3和表4,對每種結構的模型分別嘗試了單向與雙向傳遞的網絡。最后的輸出均接入節點個數為3的全連接層和softmax層,得到不同類別的概率。

表3 隱藏層神經元個數相同的LSTM模型結構

表4 隱藏層神經元個數不同的LSTM模型結構
最終模型的表現使用加權精確率(precision),召回率(recall)和f1 score來衡量。對于每種機臺狀態類別i,其樣本個數記為則對于類別i
式中,M代表混淆矩陣,M[i,j]為真實值為i,預測值為j的樣本個數。模型總體的加權準確率、精確率、召回率和f1 score為
不同模型在測試集上的加權平均精確率、召回率與f1 score,以及其分類結果的混淆矩陣見表5和如圖2所示,其中LSTM(128)代表神經元個數為128的單層單向LSTM網絡,deepLSTM(8-8-8)代表每層神經元個數均為8的三層單向LSTM網絡,biLSTM(8-8-8)代表每層神經元個數均為8的三層雙向LSTM網絡。在Logistic回歸、支持向量機、決策樹與隨機森林中,隨機森林取得最高的精確率、召回率與f1 score,但其傾向于將設備正常狀態誤判為故障狀態。在不同結構的LSTM模型中,3層隱藏層,每層8個神經元的結構取得了最好的表現,在測試集上的f1 score為0.875。導致人工構造特征進行訓練的傳統機器學習模型表現整體劣于不同結構的LSTM模型的原因,一方面可能在于模型擬合能力的限制,無法捕捉不同工況下采集的振動模式的差異,另一方面可能在于人為構造特征導致的有效信息丟失。

圖2 不同模型預測結果的混淆矩陣

表5 不同類別模型表現對比

(續)
圖3和表6對比了使用不同LSTM模型結構得到的f1 score。在所有本文中嘗試的結構中,每層神經元個數均為8的三層單向LSTM網絡得到了最高的預測準確度。其中對于單向傳遞的LSTM,當每層神經元個數均為8或16時,隱層從一層到三層,模型的預測準確度逐步提高,但四層模型的表現劣于一層。當模型層數為2,3,4層時,雙向LSTM的準確度反而低于單向LSTM。對于三層LSTM,隱藏層使用相同神經元個數的模型預測能力優于每層使用不同神經元個數的模型。

表6 不同神經元個數的3層LSTM準確度對比

圖3 不同LSTM模型結構預測結果的f1 score
本文使用產品加工過程中的振動數據,嘗試對車削機臺的兩種常見故障進行預測,以實現生產過程中的預測性維護功能。在綜合對比了Logistic回歸、支持向量機、決策樹及隨機森林等使用數字信號處理方法所提取特征進行訓練的傳統機器學習模型,與不同結構的使用原始數據進行訓練的LSTM在不同時間段采集的生產數據上的預測表現后得出,能有效捕獲時序信息的深度學習網絡LSTM,對車削機臺故障預測的能力整體高于傳統機器學習模型,最高的準確率可達87.5%。
為提高預測結果的準確度,多源異質數據融合已成為設備健康度監測的主要趨勢。由于本文中僅考慮振動數據,后續工作中會結合更多數據源,如伺服電機數據及外部環境溫度數據等,向更多類別的故障預測方向進行探索。