蘇史博,畢 果,鄭守紅,劉 杉
(廈門大學航空航天學院,福建 廈門 361102)
在光學元件的超精密磨削加工中,砂輪磨損狀態關乎砂輪的磨削性能,影響加工精度和加工效率。為了保證元件的正常加工,需要及時地更換修整磨損過度的砂輪。而在車間的生產過程中,由于無法準確地判斷砂輪的磨損狀態,只能憑借經驗將剩余壽命還有較大余量的砂輪替換修整。另一方面,加工過程中的各種突發因素都可能使砂輪磨損狀態發生意外突變。因此,在線準確識別砂輪的磨損狀態從而判斷是否需要修整,既能夠保證加工的精度和安全,又能充分利用砂輪的使用壽命,具有較大的經濟價值。
磨削加工過程中砂輪與加工材料的相互作用使材料發生形變時會產生大量的彈性應力波,這就是聲發射現象。自從上世紀五十年代Kaiser首次發現聲發射現象[1]以來,聲發射被廣泛應用到很多監測和診斷上的諸多領域。伯克利大學較早地將聲發射運用于砂輪磨損狀態監測[2],Mokbel A A等發現砂輪的磨損會造成聲發射信號幅值的提升[3]。
但是上述方法常常依賴于各種精巧的閾值設置和時域特征選擇,實際應用和推廣困難,基于數據驅動的診斷方法受到了更多的關注。Ghosh N等開發了基于神經網絡的刀具狀態監測傳感器融合模型[4];劉然結合前饋神經網絡(Back Propagation Neural Network, BPNN)和自回歸移動平均模型(Autoregression and moving average, ARMA)構建了刀具磨損量評估模型[5]。砂輪磨損是一個歷經初期磨損、穩定磨損、急劇磨損三個階段的緩慢變化過程,從聲發射樣本預測砂輪的磨損狀態本質上是一個時間相關序列的模式識別問題。傳統BP神經網絡處理時間相關序列上存在較大的局限性。循環神經網絡(Recurrent neural network,RNN)是一種用于時序列識別的模型,但在砂輪磨損狀態識別問題上卻較少有研究。傳統RNN難以實現對長時間依賴的建模[6-7],不適用于從緩慢變化到急劇變化的砂輪磨損過程。Hochreiter S等提出長短時記憶模型(LSTM),將隱含層的節點替換為一個特殊的復合存儲單元,獲得建模長時間依賴序列的能力[9]。
針對砂輪磨損狀態識別的問題,本文建立了一個長短時記憶(LSTM)循環神經網絡模型,通過小波包能量系數法獲取砂輪磨損的敏感頻段特征,并使用主成分分析對特征進行降維,使用長短時記憶網絡識別砂輪的磨損狀態。在實驗的基礎上,通過與頻域分析、BP神經網絡的對比,證明LSTM構建的網絡具有識別精度高、收斂速度快、離群值較少等優點,驗證了方法的有效性。
為了克服傳統BPNN神經網絡在處理時間相關序列上的局限性,循環神經網絡(RNN)在不同層間節點連接的基礎上添加了隱含層節點與節點間的連接,使得網絡保留了過往輸入節點的信息,從而獲得了建模時間相關序列的能力[7],其網絡結構如圖1所示。砂輪聲發射信息樣本隨時間的變化中蘊含著識別砂輪磨損狀態的必要特征,在穩定磨損階段砂輪磨損狀態變化較為平緩,聲發射信號相鄰幀之間的差異較??;而當砂輪處于急劇磨損階段時,磨損狀態變化劇烈,聲發射信號相鄰幀之間的差異較大[10]。上述過程是一個緩慢變化的過程,這就要求識別模型具備建模長時間依賴的能力。RNN由于其網絡特點,如果節點循環邊的權重小于1,那么第一個時間步的輸入對最后一個時間步的輸出的貢獻將會隨時間間隔而指數衰減,如圖2所示,這就限制了網絡建模長距離時間依賴的能力。長短時記憶模型LSTM將隱含層的節點替換為一個特殊的復合存儲單元。這個特殊單元通過選擇性地保留或丟棄過往時間節點的輸入,從而獲得建模長時間依賴序列的能力,更適合用來建模砂輪的磨損過程。

圖1 RNN網絡結構圖

圖2 RNN網絡梯度消失可視化

(1)
本時刻單元的狀態ct計算表達式如式(2)~式(4)所示,其中Wi為輸入權重矩陣,Wc為狀態權重矩陣。

(2)
(3)
(4)
本時刻單元輸出ht的計算表達式如式(5)、式(6)所示,其中Wo為輸出權重矩陣。
ht=ot·tanh(ct)
(5)
(6)

圖3 LSTM單元基本結構
對模型而言輸入特征對模型精度和運算速度等尤為重要,本文使用小波包分析獲取聲發射信號各個頻段的能量系數,并計算各頻段能量系數隨砂輪磨損狀態的變化程度以確定砂輪磨損的敏感頻段,從而提取用于訓練網絡的頻域特征。

雖然小波包分析確定了聲發射信號對于砂輪磨損的敏感頻段,但是對應頻段的頻域特征數量還是很大,存在較大數量的冗余特征。如果直接將對應頻段的頻域特征作為神經網絡的輸入節點,會造成網絡規模和層數過大,對網絡的訓練和部署造成不必要的麻煩。因此本文使用主成分分析(PCA)對敏感頻段頻域特征進行降維,設定累計貢獻率為95%,將特征維度降為15維。
本文以廈門大學研發的三軸超精密成型磨床為基礎實驗平臺,金剛石砂輪安裝于機床主軸,磨削加工材料為熔融石英。聲發射傳感器通過耦合劑與工作臺接觸,熔石英玻璃置于工作臺上,四周由吸附于工作臺上的擋鐵固定。聲發射信號采集系統使用美國物理聲學所生產的PCI-2高性能聲發射采集卡,采樣頻率為1 MHz。如圖4所示。

圖4 砂輪全壽命磨削實驗平臺
使用剛修正過的砂輪進行磨削實驗,實驗中根據材料去除量設置不同的觀測節點,采集聲發射信號和砂輪表面形貌,如圖5所示??紤]到砂輪初期變化較為顯著,第1個節點對應的材料去除量為4 cm3,之后以20 cm3為間隔設置采集節點,當完成第16個節點采集后,工件表面出現明顯損壞,停止實驗。主要實驗參數如表1所示。

圖5 砂輪表面顯微形貌圖

表1 磨削加工參數
為便于分析數據的時頻域特征,將聲發射信號進行分幀處理,每幀時長為10 ms,幀間沒有重疊,對應的采樣點數為10 000點,從而構建一個砂輪磨削聲發射信號數據集。
把采集到的第1節點的數據和第16個節點的數據分別做頻域分析,如圖6所示。從圖6上可以看出,聲發射信號時域信號隨機性很強無法分辨,而頻域上頻帶很寬,分布隨機。從頻帶內雖然可以看出頻率信息發生了變化,但很難從頻率域上準確識別砂輪的磨損狀態信息。

圖6 聲發射信號頻域分析
對實驗采集到的聲發射信號進行小波包分析。對采樣頻率為1 MHz的聲發射信號進行4次分解,將信號的頻帶等分為0~500 kHz的16個部分。計算各頻段內小波包能量系數的方差,如圖7所示,可以看出,低頻段內小波能量系數的方差最大,說明此頻段為砂輪磨損狀態變化的敏感頻段,因此將低頻段的500個特征作為模型的輸入。

圖7 小波能量系數方差
對低頻段的特征使用主成分分析進行降維得到15維特征,作為神經網絡的輸入。為了驗證神經網絡是否能從聲發射信號的降維特征信息中獲取到砂輪的狀態,將處于初期磨損的第1組樣本標記為0,而將已經嚴重磨損的第16組樣本標記為1,以降維得到的15維特征為輸入,對3層的LSTM網絡進行簡單二分類訓練。收斂后的模型在測試集的ROC曲線如圖8所示,其AUC可達0.920 4,具有較為優秀的分類性能,這證明了前述特征提取和特征降維操作的有效性。

圖8 模型二分類ROC曲線
為了更準確的判斷砂輪的磨損狀態,使用LSTM來構建循環神經網絡以提取樣本間差異等特征。將樣本數據集分為訓練集(70%)和測試集(30%),以樣本對應節點為標簽,以降維得到的特征為輸入對LSTM網絡進行訓練,訓練損失函數選擇均方誤差(Mean Suqare Error,MSE),訓練的優化器選擇運行速度較快的SGD,學習率設為0.001。LSTM循環神經網絡中網絡參數、時間步長等超參數選取將影響網絡的識別能力,設置不同超參數以訓練LSTM網絡并計算各超參數設置下的模型預測誤差(MSE)以尋找最佳超參數組合。最終選定的誤差最小的模型由4層構成:輸入層,兩層LSTM隱含層,一層輸出層,隱含層由40個LSTM單元構成。
前面選定的LSTM網絡模型經過25步訓練后,訓練集均方根誤差收斂于0.53,均方誤差收斂于0.47,在測試集上的結果如圖9所示,均方根誤差為0.62,均方誤差為0.61。對應的最優傳統BPNN網絡經過1000步訓練后在測試集的結果如圖10所示,均方根誤差為1.07,均方誤差為2.30。二者的分節點測試誤差如圖11所示,可以看出LSTM網絡模型相比BPNN模型均方誤差降低了73.1%,均方根誤差降低了33.6%,而且數據波動較小,結果更加穩定。在節點10 以后的砂輪磨損后期過程中,相鄰幀之間的變化蘊含著更多信息,而傳統神經網絡由于其局限性難以對幀間差異進行特征提取。LSTM網絡由于其單元特性,能夠記憶相鄰幀見的信息,從而對砂輪的狀態做出更準確的判斷。

圖9 LSTM網絡模型預測結果

圖10 BPNN網絡模型預測結果

圖11 模型誤差比較
本文提出了一種基于LSTM循環神經網絡識別金剛石砂輪磨損狀態的方法。對于從實驗平臺金剛石砂輪磨削熔石英實驗中采集到的聲發射數據,首先通過小波包分析提取了聲發射信號中關于砂輪磨損狀態的敏感頻段特征并通過進行降維處理,從而訓練LSTM循環神經網絡并測試。測試結果表明,LSTM網絡可以比較準確地判斷砂輪的磨損狀態,在16個節點的判斷中MAE誤差可以達到0.72,證明了LSTM模型在砂輪磨損狀態識別上具有比傳統神經網絡更好的效果。本文驗證了自然語言處理領域廣泛應用的LSTM循環神經網絡在砂輪磨損狀態識別的實用性和有效性。本文的處理過程中沒有涉及閾值選擇等處理,因此較容易地推廣到其他類型砂輪和刀具的狀態識別應用中。