李 鵬,黃亦翔,夏鵬程,時 輪,2
(1.上海交通大學機械與動力工程學院,上海 200240;2.上海交大智邦科技有限公司,上海 201306)
數控機床是制造業的核心,加工過程中對其各部件的狀態進行智能化監測是實現智能制造的必要環節,其中刀具磨損狀態的監測非常重要。研究表明,可靠的刀具狀態監測系統可降低生產成本10%~40%,提高生產速度10%~50%[1]。目前,常用的刀具狀態監測方法主要包括直接法和間接法。直接監測法是通過測量刀具表面的幾何形狀參數來獲取刀具磨損狀態,如光學圖像法[2]、電阻法[3]和放射法[4]等,其精度高,但易受冷卻液、光照等的影響,且無法實現實時在線測量。間接監測法是通過采集分析加工過程中與刀具磨損相關的信號如振動、切削力、聲發射等來評估刀具磨損狀態,其精度不如直接監測法,但可實現實時在線測量,實際應用更為廣泛[5]。如Gao等[6]采集加工過程中的切削力信號,通過小波變換提取不同頻率段的信號特征,使用隱馬爾可夫模型對刀具磨損狀態進行評估;李宏坤等[7]采集加工過程中的聲發射信號,通過小波包分解提取特征并利用邏輯回歸模型評估刀具的磨損狀態;趙帥等[8]提取機床主軸電流信號的時域、頻域和小波包分解特征,使用隨機森林實現刀具磨損狀態的準確評估。以上研究均是使用傳統機器學習算法,信號特征主要通過人工提取,依賴于專家經驗知識的輔助,模型的遷移能力和泛化性能不好。近年來,深度學習算法憑借其強大的學習能力,在計算機視覺、語音處理等領域獲得了廣泛的應用,也逐漸被用于刀具磨損監測領域。如戴穩等[9]對振動信號進行小波變換獲得小波尺度圖,利用卷積神經網絡評估刀具磨損狀態;林楊等[10]使用小波變換提取銑削力信號不同頻段能量特征,基于稀疏自編碼網絡構建深度學習模型對刀具磨損狀態進行預測。以上研究雖然用到了深度學習模型,但模型輸入仍為人工提取的信號特征,沒有充分利用深度學習算法的特征學習能力,且上述研究采集的均為單一信號,而每種信號都有其不足之處,單一信號往往難以完全反映刀具磨損狀態。此外,在對信號處理時,上述研究均沒有考慮信號各時刻數據點的時序關聯性,會丟失與刀具磨損相關的信號時序特征信息。
針對上述問題,提出一種基于一維卷積長短時記憶網絡(1DCNN-LSTM)的多信號融合刀具磨損評估模型。試驗結果表明,所提出的模型在各單一工況和整體工況下均可實現刀具磨損狀態的準確識別,與其他算法模型相比,具有更好的穩定性和多工況通用性。
卷積神經網絡(CNN)是受視覺系統研究啟發,而提出的一種基于局部連接和權值共享的神經網絡結構[11],相比于全連接神經網絡,其參數量更小,更易于優化。CNN通過不同的卷積核以一定步長在輸入數據上滑動來提取數據的局部區域特征,具有強大的特征學習能力,常用的主要有一維卷積(1DCNN)、二維卷積(2DCNN)和三維卷積(3DCNN)。其中,2DCNN和3DCNN主要用于處理圖像和視頻數據,1DCNN主要用于處理一維時間序列數據,因此本文選用1DCNN對輸入的信號數據進行處理。
1DCNN的工作原理如圖1所示,假設輸入一維時間序列長度為W,卷積核長度為K,步長為S,則卷積后結果長度N的計算公式為
(1)

圖1 1DCNN工作原理
在卷積核滑動過程中,卷積核的權重向量與輸入數據進行卷積運算獲得輸出特征結果,每次卷積對應輸出結果中的1個特征數據點,計算公式為
Xout=f(W*Xin+b)
(2)
Xout為卷積輸出;Xin為卷積輸入;W為卷積核權重向量;b為卷積偏置;f(·)為激活函數。
在卷積神經網絡中常使用修正線性單元(ReLU)作為激活函數,其計算公式為
f(x)=max(0,x)
(3)
max(·)為最大值函數。
在x<0時ReLU激活函數函數的輸出為0,具有很好的稀疏性;x≥0時其導數為1,可緩解網絡訓練過程中的梯度消失問題,加快網絡收斂速度。
在網絡訓練過程中,由于前面神經層參數的不斷更新,導致網絡中隱層的輸入分布發生變化,造成內部協變量偏移問題,影響模型的訓練速度和泛化性能。批歸一化(batch normalization)通過對每層網絡中的每個神經元的輸入數據進行歸一化處理,可以較好地解決這個問題,其計算公式為
(4)

若僅使用式(4),會導致每層網絡神經元的輸入分布均一樣,影響前面神經層所學習到的特征分布。因此引入可學習重構參數γ和β,對式(4)輸入進行縮放和平移,恢復出前面神經層所學習到的特征,計算公式為

(5)
γ為縮放參數;β為平移參數。
批歸一化操作一般應用于卷積之后,激活函數之前,添加批歸一化之后的卷積計算公式為
Xout=f(Bγ,β(W*Xin))
(6)
Bγ,β(·)為批歸一化操作,由于批歸一化中有平移變換,因此卷積中不再需要偏置參數。
卷積后得到的特征維度往往較大,需要經過池化層操作進行降采樣,去除冗余特征,同時減少網絡模型的參數。池化層可視為一種特殊的卷積層,其卷積核無權重參數需要學習,一般使用最大池化算子,提取卷積核內的最大值作為降采樣后的特征,其計算公式為
(7)
p(j)為池化后第j個特征值;Kj為第j個池化區域;q(t)為池化前卷積特征在第j個池化區域內的第t特征元素值。
長短時記憶網絡(LSTM)[12]是一種特殊的循環神經網絡(RNN),可以很好地解決傳統RNN難以解決的梯度消失和長依賴問題,應用廣泛。LSTM通過細胞狀態記憶歷史和當前信息,利用遺忘門、輸入門和輸出門對細胞狀態信息進行選擇性遺忘、增加和輸出,其結構如圖2所示,圖中σ為sigmoid激活函數,輸出區間為[0,1],tanh為tanh激活函數,輸出區間為[-1,1]。

ft=σ(Wf·(ht-1,xt)+bf)
(8)
it=σ(Wi·(ht-1,xt)+bi)
(9)
(10)
(11)
Wf、Wi和Wc分別為遺忘門、輸入門和候選細胞狀態計算的權重向量;bf、bi和bc分別為遺忘門、輸入門和候選細胞狀態計算的偏置;σ(·)為sigmoid激活函數;tanh(·)為tanh激活函數。

圖2 LSTM結構
細胞狀態更新后,輸出門結合ht-1和xt,利用sigmoid激活函數得到輸出系數ot,Ct經tanh激活函數后與ot相乘得到當前時刻輸出ht,計算公式為:
ot=σ(Wo·(ht-1,xt)+bo)
(12)
ht=ot·tanh(Ct)
(13)
Wo為輸出門權重向量;bo為輸出門偏置。
基于1DCNN的特征自適應學習能力和LSTM對時序特征的提取分析能力,提出了1DCNN-LSTM多信號融合刀具磨損評估模型,結構如圖3所示,參數設置如表1所示。

圖3 1DCNN-LSTM多信號融合刀具

表1 1DCNN-LSTM模型結構參數
該模型綜合利用加工過程中主軸和工作臺的振動和聲發射信號,將4種信號數據按固定長度切片分割后輸入模型,先由1DCNN對信號進行初步特征提取,再經最大池化層對特征進一步提取簡化,之后通過3層LSTM對池化后的特征進行處理,提取分析信號的時序特征信息,然后將輸出展成一維,經全連接層和softmax分類器得到刀具磨損狀態的評估結果。
softmax分類器將輸入歸一化映射為0到1之間的類別概率,且保證和為1,在多分類問題中應用廣泛。圖3模型中全連接層輸出后的結果輸入softmax分類器,得到刀具磨損狀態各類別的概率,計算公式為
(14)
pi為第i類的概率;yi為全連接層第i個神經元的輸出;K為刀具磨損狀態的總類別數。
經softmax分類器后,模型損失函數選用交叉熵損失函數,計算公式為
(15)

本文在Matsuura MC-510V型加工中心上進行刀具磨損評估試驗研究,試驗裝置如圖4所示。振動信號由安裝于主軸和工作臺的7201-50 ENDEVCO型加速度計采集,聲發射信號由安裝于主軸和工作臺的WD 925型聲發射傳感器采集,各信號經放大、濾波和均方根(RMS)測量儀后輸入電腦。

圖4 試驗裝置示意
試驗刀具為嵌有6個KC710刀片的平面銑刀,直徑為70 mm,每個刀片上覆有TiC/TiC-N/TiN涂層,試驗加工的工件尺寸為483 mm×178 mm×51 mm。試驗共分8組,每組試驗均使用全新刀具進行多次加工,每次加工后測量刀具后刀面磨損VB值,當VB值超出閾值后該組試驗結束。試驗以切削深度、進給速度和工件材質為可變工況參數,對不同工況條件下的刀具磨損評估進行研究,其中切削深度設為1.50 mm和0.75 mm,進給速度設為0.50 mm/r和0.25 mm/r,工件材質為鑄鐵和不銹鋼,主軸轉速保持為826 r/min。各組試驗的工況參數設置如表2所示。

表2 各組試驗工況參數
以第1組試驗為例,采集的振動和聲發射信號示例如圖5所示。

圖5 采集信號示例
刀具磨損是加工過程中刀具表面材料被工件或切屑逐漸帶走的漸變過程,主要分為3個階段:初期磨損、正常磨損和急劇磨損[13]。在評估前根據每次加工后測量的刀具磨損VB值對刀具磨損狀態進行類別劃分,劃分標準如表3所示。

表3 刀具磨損狀態類別劃分
試驗所得到的各組工況下的信號數據總量較小,且信號長度較大,不宜直接用于模型的訓練測試。為實現信號數據的擴充,對采集的信號進行切片分割,將每次加工采集的信號劃分為多個樣本信號,如圖6所示。假設每次加工采集的信號長度為M,信號切片的長度為m,則切片后可得到的樣本信號數量為

(16)
?·」表示向下取整。
適當選取m的長度可有效擴充數據量,同時保證每個樣本信號中包含有效的刀具磨損信息,本文M為3 500,m取100。

圖6 信號切片分割
根據第1節所述構建1DCNN-LSTM刀具磨損評估模型,基于以下2種方式進行模型訓練測試:
a.各單一工況。對每組試驗工況,單獨訓練算法模型,測試模型在不同工況條件下的評估效果和穩定性。
b.整體工況。不考慮工況條件的變化,將試驗得到的各組工況下的數據組合為一個整體樣本數據集,訓練算法模型,測試模型在多工況條件下的通用性。
為減小偶然因素造成的誤差,每種情況下均對模型進行多次訓練測試,每次訓練測試時樣本數據集均按照9∶1的比例隨機劃分為訓練集和測試集,最后取多次測試結果的平均值,結果如表4所示。

表4 各試驗工況下1DCNN-LSTM模型評估結果
可以看出,各單一試驗工況下1DCNN-LSTM模型的評估準確率均可達到93.8%以上,且波動較小,整體工況下模型準確率可達95.3%,表明1DCNN-LSTM模型可實現刀具磨損狀態的穩定準確評估,具有很好的多工況通用性。
為驗證多信號融合的優越性,分別使用試驗采集的各單一信號對1DCNN-LSTM模型進行訓練測試,并與多信號融合進行對比,結果如圖7和圖8所示。可以看出,各單一工況和整體工況下單一信號的評估效果明顯不如多信號融合,且不同工況下單一信號的評估準確率波動較大,通用性不好。

圖7 單一信號與多信號融合評估結果對比

圖8 單一信號與多信號融合準確率均值和標準差對比
為驗證本文提出的1DCNN-LSTM模型使用1DCNN和LSTM層,對信號特征和時序特性自適應提取分析的優越性,將BP神經網絡和CNN網絡作為對比模型進行試驗。BP神經網絡模型使用人為提取的信號特征,特征提取方式為:時域分析,提取均值、標準差、均方根、峭度、波形因子和峰度特征;頻域分析,提取峰值頻率、重心頻率、頻率均方根和頻率標準差特征;db6小波包3層分解,提取各子頻帶能量特征。然后使用局部線性嵌入(LLE)進行特征降維,輸入模型進行刀具磨損評估。CNN網絡模型的結構為將1DCNN-LSTM模型中LSTM層刪除,并在最大池化層后添加1層全連接層。
試驗結果如圖9和圖10所示,可以看出BP神經網絡模型的評估效果不如CNN網絡模型,表明CNN自適應提取的信號特征相比于人為提取特征能更好地反映刀具磨損狀態,且CNN網絡模型可實現端到端的訓練,模型構建更為方便。而CNN網絡模型的評估效果差于1DCNN-LSTM模型,表明信號的時序特性對刀具磨損狀態評估具有重要意義,LSTM層對信號時序特征的提取分析可有效提高刀具磨損評估的準確性和穩定性。

圖9 不同算法模型評估結果對比

圖10 不同算法模型準確率均值和標準差對比
為實現刀具磨損狀態的準確有效識別,提出了1DCNN-LSTM多信號融合刀具磨損評估模型。綜合利用加工過程中主軸和工作臺的振動和聲發射信號,基于1DCNN和LSTM對信號特征和時序特性進行自適應提取分析,最后利用全連接層和softmax分類器對刀具磨損狀態進行評估。試驗結果表明,相比于單一信號模型、CNN網絡模型和使用人為提取特征的BP神經網絡模型,該模型具有更優的評估性能,在各單一工況和整體工況下均可實現刀具磨損狀態的準確有效識別,具有很好的穩定性和多工況通用性,可為實際生產中刀具磨損監測模型的構建提供參考。