周鵬博,劉德平
(鄭州大學機械與動力工程學院,鄭州 450001)
刀具是切削加工的核心,刀具的磨損狀態直接影響工件的加工精度和表面質量,進而影響機床的加工效率[1]。隨著數控機床的智能化發展,對刀具磨損狀態進行高效、高精度的監測成為國內外學者們的研究熱點。主要分為直接法和間接法[2]。直接法通過停機拆卸刀具后用特定檢測設備進行測量,雖然準確度高,但耗時耗力無法實現在線監測。間接法通過采集并分析切削加工過程中包含刀具磨損信息的振動、力、聲音、電流等信號實現刀具磨損狀態在線監測,是目前流行的方法[3]。間接監測法通常分三步進行:信號采集與預處理,特征提取與選擇,狀態識別[4]。
由于機加工環境的復雜,采集到的信號呈現出不平穩非線性的特征,這對故障特征的提取造成了挑戰。經驗模態分解及其改進算法常用來處理不平穩非線性信號。錢桃林等[5]用經驗模態分解(EMD)分解刀具振動信號,將篩選后本征模態分量(IMF)的均方根值作為輸入特征,用支持向量機實現刀具磨損狀態識別。
隨著人工智能技術的發展,深度學習的方法被廣泛應用到故障診斷領域。周謙等[6]將刀具振動及力信號的頻譜圖輸入深度卷積網絡VGG13進行訓練,得到刀具磨損監測模型。GUO等[7]基于切削信號的頻譜建立了金字塔長短時網絡,充分提取了信號時序特征,相比傳統LSTM方法提高了準確率和計算速度。但是單一深度學習模型不足以提取完整的磨損特征,將卷積與循環神經網絡結合起來的時空網絡方法開始出現,何彥等[8]提出了一種基于LSTM與CNN的刀具磨損在線監測模型,對刀具信號進行序列和多維度特征的提取,方法準確率高于單深度學習模型。BAZI等[9]將經過變分模態分解的信號輸入1DCNN-BiLSTM網絡實現刀具磨損狀態識別,提高了預測性能。但是更復雜的模型增加了參數量和計算量,提高了硬件成本,不利于在線監測工具的發展。
針對以上問題,本文基于輕量級卷積網絡ShuffleNetv2與高效通道注意力機制(ECA),提出了一種新的輕量型時空網絡刀具磨損監測方法BiLSTM-SN-ECA,對經過CEEMDAN處理的數控機床銑刀振動信號進行特征學習,實現了刀具磨損狀態識別。
針對EMD[10]易出現模態混疊、集合經驗模態分解(EEMD)[11]重構誤差大的缺點,提出了自適應噪聲完備集合經驗模態分解(CEEMDAN)[12],此方法避免了高斯誤差從高頻分量到低頻分量的傳播,分解具有完備性且減少了虛假分量,提高了計算速度。CEEMDAN分解步驟如下:
步驟1:生成改造信號。將N個均值為零的高斯噪聲分別加到原始信號a[n]中,產生N個改造信號ai[n](i=1,2,3,…,N);ai[n]=a[n]+ε0σi[n]
(1)
式中:ε0為添加高斯噪聲的權重,σi[n]為第i次添加的高斯噪聲。
步驟2:對改造信號進行EMD一階分解并求均值得到CEEMDAN一階分量IMF1[n],用原信號減去IMF1[n]得到一階殘余分量r1[n];
(2)
r1[n]=a[n]-IMF1[n]
(3)
式中:IMF1[n]為原始信號CEEMDAN第一階IMF,E1(·)為EMD一階分解算子,r1[n]為一階分解后參與分量。
步驟3:求CEEMDAN二階分量IMF2[n];
(4)
步驟4:對于k=2,3,…,K;rk[n]=rk-1[n]-IMFk[n]
(5)
(6)
步驟5:按k逐步分解,直到不能分為止(分量極值點不超過兩個),共分得K個分量,最終信號被分解為:
(7)
式中:R[n]為最終殘余分量。
循環神經網絡(RNN)能夠處理時間序列數據,對序列的過往信息具有記憶能力,刀具振動信號便是一種典型的時序信號,因此可以用RNN對其進行時序特征提取。長短時記憶網絡(LSTM)是一種特殊的RNN,添加3個門控單元對RNN隱藏節點的輸出信息進行控制,對過往信息進行選擇和遺忘,減輕了RNN梯度消失和梯度爆炸的問題,增強提取序列長期關系的能力。一個基本的LSTM隱藏單元如圖5所示。其中輸入門、遺忘門、輸出門的計算過程為:
f(t)=σ(Wf·[h(t-1),x(t)]+bf)
(8)
i(t)=σ(Wi·[h(t-1),x(t)]+bi)
(9)
c(t)=f(t)?c(t-1)+i(t)?tanh(Wc·[h(t-1),x(t)]+bc)
(10)
o(t)=σ(Wo·[h(t-1),x(t)]+bo)
(11)
h(t)=o(t)?tanhc(t)
(12)
式中:f(t)為遺忘門,i(t)為輸入門,o(t)為輸出門,c(t)為細胞狀態,σ為sigmoid激活函數,?為哈達瑪積,Wf、Wi、Wc、Wo、bf、bi、bc、bo分別為遺忘門、輸入門、細胞狀態、輸出門的權重和偏置,h(t)為當前時刻輸出,h(t-1)為上一時刻輸出。
雙向長短時記憶網絡(BiLSTM)由兩層LSTM隱藏層組成,一層正向傳遞獲取序列過去信息,另一層反向傳遞獲取序列未來信息,兩層輸出組合為新的輸出層,時序特征提取能力更強。BiLSTM網絡結構如圖2所示,A和B分別為前向和后向的隱藏單元。
卷積神經網絡(CNN)通過卷積和池化操作提取刀具退化的有效非線性局部特征,但為了提高準確率網絡層數不斷疊加,導致計算量激增。MA等[13]基于分組卷積(GC)與深度卷積(DWConv)以及通道混洗(CS)技術提出了ShuffleNetv2網絡。其中分組卷積如圖3所示,按通道對輸入進行分組,按組進行卷積操作,每組對應的卷積核通道數減少,參數量對應減少。而深度卷積就是將每個通道分為單獨一組的分組卷積,其輸入通道、輸出通道以及卷積核(單通道)個數相等,DWConv后面常跟逐點卷積(1*1卷積核)對特征進行降維或升維。
分組卷積雖然能夠減少網絡參數量,但是每組通道之間的信息沒有任何流通,這必然導致特征表達能力降低,通道混洗技術能將每組通道的信息進行融合。CS原理如圖4所示,首先,以通道為元素將特征矩陣轉換為兩個維度(一個維度為通道分組數,另一個維度為每組通道);其次,進行轉置操作;最后,將轉置后的矩陣進行展平即可完成通道混洗。
ShuffleNetv2網絡由普通卷積層、最大池化層、3個Stage塊、卷積層、全局池化層(GAP)和全連接層組成。每個Stage塊均由兩個基本的單元不斷疊加而成,單元如圖5所示,單元1采用了兩分支對數據進行處理,首先,對輸入特征進行通道對分,分支1進行一層1*1的普通卷積進行升維;接著,一層3*3DWConv進行特征提取;最后,1*1普通卷積進行降維保證輸入輸出通道數相同,分支2不進行操作,將兩分支級聯后進行通道混洗。當需要進行下采樣時,也就是步長為2的情況,單元2的分支1對輸入進行1*1Conv、3*3DWConv、1*1Conv,分支2對輸入進行3*3DWConv、1*1Conv,將兩分支級聯后進行通道混洗,此時的通道已經翻倍,特征圖尺寸減半。
在進行故障特征提取的過程中,難免提取到與刀具退化無關的特征,這不利于預測結果,注意力機制被提出用來學習每個特征的重要程度,從而對有效特征進行加強,對無效特征削弱。注意力機制已經被應用于各種卷積神經網絡中,提升了網絡的性能,但傳統的注意力機制通過堆加模型的復雜度來提升性能,增加了計算量。WANG等[14]基于傳統的SE-net提出了效率通道注意力網絡ECA-net,取消了SE-net中的降維操作,并通過一維卷積操作實現了跨通道信息交互,卷積核的大小z決定了局部跨通道交互的覆蓋率,還提出了一種根據輸入通道數自適應選擇z值的方法,z與輸入特征通道成正比例關系。ECA在幾乎不增加模型復雜性的情況下顯著提高了模型的性能。ECA的結構如圖6所示,ECA用GAP層將輸入矩陣轉換為長度等于通道數的向量、用卷積核大小為z的1DCNN層獲取各通道的權重向量、經過sigmoid激活函數將權重向量歸一化,最后將權重向量與輸入矩陣相乘。
ShuffleNetv2網絡應用于圖像分類領域,對于相較簡單的刀具振動數據,其網絡結構過于復雜、性能過剩,因此對ShuffleNetv2結構進行優化,減少Stage塊的重復次數,重新設計特征通道數的變化過程。同時對ShuffleNetv2的基本模塊添加ECA單元提高網絡的性能,改進的基本單元如圖7所示,只在分支1中的3*3DWConv層后添加ECA模塊。由于輸入特征圖尺寸較小,最大池化操作會使信息丟失,改進模型不再使用原模型中的最大池化層。為了防止過擬合,在網絡的末端全連接層之前添加隨機失活Dropout層,隨機丟棄一定比例的神經元。改進的SN-ECA網絡參數如表1所示。

表1 SN-ECA網絡參數表
首先,將采集到的刀具振動信號經預處理后輸入BiLSTM網絡進行刀具退化時序特征提取,BiLSTM網絡隱藏層單元為128,Dropout率為0.2。之后經過線性層將BiLSTM的輸出轉化為二維灰度圖輸入SN-ECA網絡進行多維度特征提取并預測結果。構建好的診斷模型如圖8所示。所提方法將采集到的數據劃分為訓練集、驗證集、測試集,用訓練集對網絡模型進行訓練,通過反向傳播算法不斷更新權重參數使損失函數不斷減小直到收斂。用訓練好的模型對測試集進行刀具磨損值預測。模型優化器為RMSprop,損失函數設為L1_loss,學習率為0.002,批處理大小為2048,每次實驗代數epoch=100。
為了從模型預測準確性和模型輕量化程度兩個方面全面分析所提方法的有效性,選取了以下4個指標來評估模型的性能,分別為平均絕對誤差(MAE)、均方根誤差(RMSE)、模型參數量、模型訓練時間。其中前兩個指標越小,預測值與真實值誤差越小,說明模型預測準確率越高;后兩個指標越小,說明模型效率越高、占用內存越小。MAE與RMSE表達式為:

(13)
(14)
式中:yi為真實值,f(xi)為預測值,n為樣本個數。
本實驗所用數據來自PHM2010數據挑戰賽的公開數據集,實驗機床為RFM760數控機床,實驗刀具為三刃碳化鎢球頭銑刀,工件材料為不銹鋼HRC-52[15]。在相同工況下進行6次全壽命周期循環實驗,通過傳感器采集6把刀具加工過程中的力、加速度、聲發射信號(C1~C6),信號采樣頻率為50 kHz,每次走刀沿X方向切削108 mm,每把刀具走刀315次。其中的3次實驗對每次走刀后的后刀面磨損值進行測量得到標簽數據(C1,C4,C6),因第1次走刀采集的信號不完整,對預測結果誤導較大,丟掉這一數據。本文選擇C1銑刀數據集進行實驗。用y方向振動信號預測刀具磨損值,同時把3個切削刃的磨損平均值作為標簽。
實驗利用PyTorch深度學習框架與PyCharm開發環境進行數據分析。實驗硬件配置為NVIDIA GeForce RTX3060 Laptop圖形處理器,Intel(R) Core(TM) i7-11800H @ 2.3 GHz中央處理器,16 GB內存。
由于采樣頻率過大,單個信號具有20萬以上的采樣點,為了擴充樣本數以及縮短樣本長度,從每個信號中隨機不重復地抽取200個長度為1024的樣本,按照9∶1的比例劃分為訓練集(314*200*0.9=56 520個樣本)和驗證集(314*200*0.1=6280個樣本),再從每個信號中抽取20個樣本作為測試集(314*20=6280個樣本),測試時對每20個樣本的預測結果求平均作為預測值。
將振動信號樣本進行CEEMDAN分解,得到8個IMF。根據皮爾遜相關系數計算,前6階IMF與原信號相關性較大,將后續分量去除后生成重構信號以減小冗余分量的影響。將原始信號、重構信號、前6階分量組合構成n*8的輸入特征矩陣。特征如圖9所示。
為了驗證CEEMDAN方法對信號降噪和特征增強的效果,分別對有CEEMDAN過程和無CEEMDAN過程的監測模型進行實驗,結果如表2所示,有CEEMDAN過程的刀具磨損監測模型MAE減少7.77%,RMSE減少11.37%,證明該方法能夠突出刀具振動信號中的磨損特征。

表2 有無CEEMDAN實驗結果 (μm)
研究不同的Dropout率對模型監測結果的影響,分別把Dropout率設置為0.05、0.1、0.2、0.3進行實驗。結果如表3所示,Dropout率過大時舍棄節點過多,信息損失嚴重,不利于特征學習,過小時起不到防止過擬合的作用,Dropout率為0.1時MAE與RMSE值最小。

表3 不同Dropout率實驗結果 (μm)
研究ECA添加到不同位置的影響,分別將ECA添加到分支1中、分支1和2中、CS之后進行實驗。結果如表4所示,在分支1中添加ECA模塊預測效果最好。

表4 不同ECA位置實驗結果 (μm)
將經過CEEMDAN處理的樣本按批次大小2048輸入BiLSTM-SN-ECA模型進行訓練,模型的Dropout率與ECA位置均按照上述實驗所選最優值設置。訓練集與驗證集損失函數值隨迭代數下降趨勢如圖10所示,損失函數下降較快,40次迭代后較為平穩且最終收斂。用訓練好的模型進行測試得到預測值與真實值對比如圖11所示,可以看出誤差很小,說明所提模型能夠對刀具磨損特征進行較為準確的提取,預測效果良好。

圖1 LSTM單元結構圖

圖2 BiLSTM網絡結構圖

圖3 普通卷積與分組卷積示意圖

圖5 ShuffleNetv2網絡基本單元示意圖

圖6 高效通道注意力網絡結構圖

圖7 SN-ECA網絡基本單元示意圖

圖8 刀具磨損狀態監測模型流程圖

圖9 輸入特征示意圖

圖10 損失函數折線圖
為了進一步驗證模型的效果,將所提模型與傳統的時空網絡模型(BiLSTM-CNN)、BiLSTM-ShuffleNet模型對比。BiLSTM-CNN模型采用6層的普通卷積層(卷積核大小3,步長為1,零填充為1)和3層最大池化層(k=3,s=2,p=1)代替本文模型的Stage2、Stage3、Stage4,其余部分與所提模型相同。每兩個卷積層后接一個池化層,其中卷積層進行特征提取和通道升維,池化層將特征圖尺寸減半,保證了特征圖尺寸與通道數變化過程與所提模型相同。BiLSTM-ShuffleNet模型為所提模型不進行注意力機制的改進。
把3個模型分別進行10次訓練及測試,MAE與RMSE的結果如圖12所示,可以看出,10次實驗的MAE值所提模型均為最小,8次實驗的RMSE值所提模型最小,所提模型的識別準確性與穩定性均較高。

圖12 誤差折線圖
3個模型4種評價指標10次實驗的平均值如圖13所示。
可以看出,所提模型的卷積網絡參數量比BiLSTM-CNN模型減少82.39%,訓練時間減少47.21%,MAE減少了10.82%,RMSE減少了9.90%。所提模型卷積網絡參數量只比BiLSTM-ShuffleNet增加0.02%,訓練時間只增加0.67%,但是MAE和RMSE分別減少了5.00%和3.38%。本文模型預測誤差更小且模型參數少,效率高。
本文提出了一種基于CEEMDAN與BiLSTM-SN-ECA的刀具磨損狀態識別方法。該方法用CEEMDAN對刀具振動信號進行預處理并構造特征矩陣,然后,輸入經輕量化改進并增加注意力機制的時空網絡模型,實現刀具磨損預測。最終得到的結論如下:
(1)利用CEEMDAN方法處理刀具振動信號能夠減少信號中的噪聲成分,充分提取有效的磨損信息,提高神經網絡識別準確率。
(2)對傳統時空網絡模型的卷積模塊進行輕量化改進能夠在減少模型參數量、提高訓練效率的同時,提高預測準確度。
(3)高效通道注意力能夠在幾乎不增加網絡參數的情況下提升輕量化時空網絡的性能。