周文軍,肖曉萍,李自勝,張楷,劉聰,鄭升鵬
(1.西南科技大學制造科學與工程學院,四川綿陽 621010;2.西南科技大學工程技術中心,四川綿陽 621010;3.西南交通大學機械工程學院,四川成都 610031)
制造業的快速發展對機床加工精度的要求越來越高,刀具作為加工工件的關鍵執行者,與工件直接接觸,對工件質量有直接影響[1-2]。刀具磨損狀態監測作為一種先進制造技術,是實現機床不間斷生產、加工自動化及工件高質量生產的關鍵[3]。刀具邊緣與工件之間不可避免地會產生摩擦,導致加工過程中出現刀具故障的時間占總機械故障時間的7%~20%[4],刀具本身和刀具更換成本占總加工成本的3%~12%[5],造成生產力和利潤的巨大損失。因此有必要實時準確地監測刀具磨損狀態,以降低生產成本、提高刀具利用率與工件質量[6]。
刀具磨損狀態監測方法主要分為直接法和間接法。直接法是直接識別刀刃外觀、表面質量或幾何形狀的變化[7]。直接法雖然監測精度高,但需要停機監測,不能檢測出刀具在加工過程中突然出現的磨損或破壞。間接法是利用傳感器采集刀具在切削過程中同步產生的相關參量,并通過建立特征信號與刀具磨損量之間的關系來預測刀具實際磨損情況[8]。間接法所采集的信號可能因加工工序或環境的影響而含有冗余信息,但可在刀具切削狀態下進行實時在線檢測,便于實現刀具磨損狀態的智能化監測,因此成為一種主流方法。間接法實現步驟主要包括:信號采集、信號預處理、特征提取、預測模型構建及磨損預測[9]。間接法常用的預測模型有傳統的機器學習法[10],該模型被認為是一種有效的刀具磨損狀態識別方法,被廣泛應用于刀具磨損狀態監測和識別研究中[11],其中最常用的有BP神經網絡(Back Propagation Neural Networks,BPNN)[12]、支持向量回歸模型(Support Vector Regression,SVR)[13]、隱馬爾科夫模型(Hidden Markov Model,HMM)[14]等。曹利平等[15]提出了基于遺傳算法優化BP網絡的刀具磨損狀態識別方法,對比改進前的BP網絡,驗證了該方法的有效性。KONG等[16]提出了一種集成支持向量機和鯨魚優化算法的 WOA-SVM 預測模型,該模型能快速高效識別鈦合金加工中的銑刀刀具磨損狀態。何棟磊、黃民[17]提出了遺傳算法優化HMM的預測方法,利用主軸電流信號,準確有效地監測了銑刀磨損狀態。但淺層次的機器學習法在處理高維數據時容易出現過擬合、維數災難等問題;另一方面,采集數據的本質為時間序列數據,上述模型無法用于序列數據建模,進而無法挖掘序列數據隱藏的序列特征[18-19]。
與淺層機器學習相比,深度學習模型在數據量、非線性關系和收斂性能等方面的處理能力都有明顯的優勢[20]。深度學習模型在處理時間序列數據中復雜的非線性關系時有自適應、自組織學習機制,具有有效的預測能力[21]。常用的深度學習方法有卷 積 神 經 網 絡 (Convolutional Neural Networks,CNN)[22]和堆疊式自動編碼器網絡(Sparse Autoencoders,SAE)[23]等模型。安華等人[24]提出了一種基于稀疏自編碼器的刀具狀態檢測及壽命預測方法,該方法利用切削力信號實現了刀具在各階段下的剩余使用壽命預測。周成鵬等[21]提出了一種基于特征提取長短期記憶網絡(Feature Extraction Long Short-Term Memory,FE-LSTM)的銑刀磨損量預測方法,與傳統機器學習方法相比,可實現更為精準可靠的銑刀磨損量預測。但人為設定FE-LSTM的隱藏層神經元數與學習率等模型參數,難以達到最優參數的效果[24]。
針對長短期記憶網絡預測精度難以達到最優參數效果的問題,本文作者提出使用遺傳算法(Genetic Algorithm,GA)尋找LSTM的最優參數,并將參數輸入LSTM實現改進模型GA-LSTM。利用力傳感器與振動傳感器采集信號,采用時域、頻域及時頻域方法提取信號特征以及相關性分析法篩選出與銑刀磨損量高度相關的特征,輸入GA尋出隱藏層神經元數和學習率等參數最優值,然后將參數最優值和訓練數據輸入LSTM模型訓練,最終將測試數據輸入到訓練好的LSTM模型中,實現銑刀磨損量的有效預測。
遺傳算法(GA)是一種通過模擬自然進化過程搜索最優解的方法[17]。其中,選擇、交叉和變異構成了遺傳算法的遺傳操作,使遺傳算法具有優良的特性。遺傳算法開始時隨機產生一些個體,根據GA算法里自定義的適應度函數分別對每一個個體進行計算評估,給出一個適應度值?;诖诉m應度值,選擇一些個體產生下一代,然后選擇出來的個體經過交叉和變異進行再組合從而生成新的一代,以此類推,朝著最優解的方向進化,最終輸出最優化參數[25]。
LSTM是循環神經網絡(Recurrent Neural Networks,RNN)[26]的一種變體,RNN由于梯度消失只有短期記憶,LSTM網絡通過精妙的門控制將短期記憶與長期記憶結合起來,且一定程度上解決了梯度信息傳播衰減的問題,使網絡保持長時間的記憶。LSTM的結構如圖1所示。

圖1 LSTM單元結構
圖中:ft表示輸入門;it表示遺忘門;Ot表示輸出門;Ct表示t時刻神經單元狀態;ht表示t時刻隱藏層狀態;σ和tanh為激活函數。LSTM單元數據輸入輸出遵循公式(1):
(1)
式中:W、b分別表示權重和偏置;*表示2個維度相同矩陣的對應位置元素相乘。
在LSTM模型中,選擇合適的隱藏層神經元數和初始學習率有助于提高預測精度。合理的隱藏層神經元數可以改善訓練過程中的梯度流,使得模型從訓練樣本中提取有效的潛在規律。初始學習率作為LSTM深度學習框架中的一個重要超參數,控制著損失梯度調整網絡權值的速度,決定著訓練過程中模型能否收斂至最小值以及何時收斂。為保證模型的預測性能,有必要尋出隱藏層神經元數和初始學習率的最優值。文中采用遺傳算法尋出隱藏層神經元數和初始學習率等參數最優值,進而構建GA-LSTM模型來預測刀具磨損量。遺傳算法改進LSTM模型流程如圖2所示。

圖2 基于GA-LSTM的銑刀磨損狀態監測流程
將待優化參數隱藏層神經元數和初始學習率作為遺傳算法的優化對象,并根據各自優化范圍初始化染色體,建立初始化染色體種群;將染色體重組賦值于 LSTM模型進行訓練,并將計算得到的預測值與實際值之間的均方誤差作為評價染色體適應度優劣的指標。然后對染色體進行遺傳操作,并將更新的染色體再賦值于LSTM模型訓練,直至篩選出具有最佳適應度值的染色體。最后對篩選出的染色體進行解碼,獲取到最優隱藏層神經元數和學習率,將參數輸入到LSTM模型完成模型的訓練及預測。
基于上述流程構建改進的LSTM模型,圖3所示為改進前后訓練精度效果曲線,圖4所示為改進前后訓練過程中的均方根誤差(RMSE)曲線。為驗證該模型的有效性,且減少隨機因素的影響,通過測試集進行重復實驗10次,實驗結果如表1所示。

表1 實驗結果均方根誤差單位:μm

圖3 改進前后LSTM訓練精度曲線

圖4 改進前后LSTM訓練誤差曲線
由圖3、4可知:與LSTM模型相比,GA-LSTM模型有較高的訓練精度,相對平穩且訓練誤差較低。分析表1知LSTM模型預測誤差整體較大,且浮動范圍大,穩定性差,而GA-LSTM模型的均方根誤差在2~5 μm,顯示了該模型的有效性與可靠性。
文中采用2010年PHM協會的公開數據集進行實驗[27],實驗平臺為 R?ders Tech RFM760高速數控銑床,刀具為三刃碳化鎢球頭銑刀,切削材料為不銹鋼(HRC52),表2為設置的銑削參數,圖5所示為刀具磨損實驗數據采集平臺。

表2 銑削參數設置

圖5 2010年PHM數據挑戰實驗平臺
由于切削刃的中間位置存在著較為均勻的后刀面磨損量且其部位具有合理的磨損量走勢,故每次走刀結束后采用立體顯微鏡測量銑刀的后刀面磨損值。銑刀在磨損測試期間連續采樣頻率為50 kHz,進行315次走刀測試,每次走刀長度為108 mm,所采集數據除三刃的后刀面磨損值外還包括x、y、z方向的銑削力、振動及聲發射信號。實驗使用的三刃碳化鎢球頭銑刀每次走刀結束后產生對應3個刀刃的新后刀面磨損值分別為flute_1、flute_2、flute_3。為更準確地反映刀具當前的磨損狀態,將3個刀刃后刀面磨損值取均值作為此次實驗的目標,銑削力與振動信號經預處理后得到的特征作為訓練與測試數據。
傳感器采集的原始信號不僅數據量大,且混有干擾信息,直接使用會影響銑刀磨損量預測精度,因此,需要對原始信號進行數據預處理[28]。文中對x、y、z方向上力與振動信號使用時域、頻域及時頻域方法進行特征提取,選取時域方法11個特征,頻域方法5個特征,時頻域方法為小波包分解后提取頻段能量,小波包基為db8,進行3層分解后將信號分為8個能量頻段。
上述方法共計提取了144個特征,其中可能包含一些冗余或不相關的特征,必定會影響實驗結果,采用相關性分析法從144個特征中提取與刀具磨損量相關性高的特征。相關性分析法是指對2個或多個具備相關性的變量元素進行分析,從而衡量2個變量因素的相關密切程度[29]。假設x為某一特征向量,y為后刀具磨損值,則該特征向量與后刀面磨損值之間的相關系數表達式如公式(2)所示:
(2)
式中:cov(x,y)為協方差;var(x)、var(y)分別為x和y的方差。
其中:ρxy的取值范圍為[-1,1],|ρxy|≥0.9的特征包含切削力信號44個,振動信號27個,共計提取71個特征。文中將每間隔5個數據選取一個作為測試數據,其余數據為訓練數據,故訓練數據量為71×264,測試數據量為71×51。同理,將后刀面磨損均值1×315劃分為訓練目標1×264,測試目標1×51。為提升模型的精度和收斂速度,輸入前對所有數據進行歸一化處理。圖6所示為力信號特征隨走刀次數的變化曲線。

圖6 力信號特征曲線
根據初始化參數設置隨機產生初始化染色體種群。二進制編碼可以將區間內的無窮多個點用間隔足夠小的有限個點來代替,使用二進制編碼染色體種群。將染色體重組賦值于 LSTM模型訓練,以公式(3)所示的LSTM損失函數作為評價染色體適應度的優劣指標[30]。
(3)

然后對篩選出的染色體使用公式(4)解碼獲得個體的自適應函數值。
(4)
式中:bi1,bi2,…,bil為某個個體的第i段,每段段長都為l,每個bij都是0或1;Ti和Ri是第i段分量xi定義域的左右2個端點。
為選出種群中適應度值最大的個體,文中采用輪盤賭方法選擇最優適應度。種群中的個體是否能夠遺傳到子代將取決于個體適應度值除以種群中所有個體的適應度值之和,即同一種群中適應度值越大的個體成為父代的概率越高,如公式(5)所示:
(5)
式中:fi為第i個個體的適應度;pi為第i個個體被選中的概率。
交叉算子可以保證種群的相對穩定且使所得解集朝著最優解的方向進化,故可隨機選擇2個未進行過交叉組合的個體進行交叉組合操作。設交叉概率為P′c,若交叉概率超過閾值Pc,則個體間發生交叉組合。具體交叉過程可由公式(6)表示:
C1=A(1,m-1)+B(m,n-1)+A(n,k),P′c≥Pc
C2=B(1,m-1)+A(m,n-1)+B(n,k),P′c≥Pc
(6)
式中:C1、C2為發生交叉組合后的變型基因;A、B分別為同時被選定的2個個體基因型;m、n分別表示交叉片段的起始點和結束點,且1≤m,n≤k,k為種群中所有個體基因的長度,即二進制編碼的長度。
交叉過后產生的新個體具有一定的概率發生變異,可能造成某些遺傳基因的丟失。變異算子可修復和補充選擇與交叉算子引起的某些基因的丟失,且可防止遺傳算法收斂于局部最優解,設定變異概率為Pm,隨機從種群中選擇未發生過變異的個體計算其發生變異的概率P′m,若P′m≥Pm,則對個體基因編碼的一個字符取反。若P′m≤Pm,不進行變異操作。
經以上運算過程將產生新的種群,計算適應度值后,對種群進行反復迭代,從而構造出最優適應度的參數隱藏層神經元數與學習率作為遺傳算法的尋優參數。表3為GA-LSTM模型的初始化參數設置。

表3 GA-LSTM模型參數設置
將100次迭代作為隱藏層神經元數與學習率的尋優終止條件。圖7所示為適應度與學習率隨迭代次數的變化曲線。

圖7 GA改進LSTM迭代曲線
由圖7(a)可知:隨迭代次數的增加,適應度呈現逐級下降的趨勢,迭代46次后趨于穩定,其最優適應度為0.000 23。通過GA優化后得到LSTM模型的隱藏層神經元數為88,學習率為0.049 3。
文中訓練LSTM模型采用優化器Adam,最大迭代次數為600,梯度閾值為1,訓練125輪后通過乘以因子0.2降低學習率。LSTM模型訓練時,遵循第1.2節公式(1)前向計算每個神經元的輸出值,反向計算誤差,計算權重梯度并進行迭代調整,達到最大迭代次數后輸出當前的磨損量預測模型。實驗建模流程如圖8所示。

圖8 建模流程
與絕對誤差相比,相對誤差(MAPE)更能反映測量的可信度,均方根誤差(RMSE)對時間序列的較高值更敏感[31]。因此,文中將MAPE和RMSE作為模型精度的評價指標。將測試數據輸入到訓練好的GA-LSTM模型,基于切削力信號和振動信號的融合特征進行預測實驗,圖9所示為測試集后刀面磨損值預測曲線??芍篗APE為0.045,RMSE為3.347。

圖9 兩類傳感器信號特征下的后刀面磨損值預測曲線
為驗證GA-LSTM模型的合理性,從數據量大小及同一銑刀不同信號類型進行驗證?;谡駝有盘柡颓邢髁π盘柗謩e進行預測實驗,圖10所示為振動與力信號測試集后刀面磨損值預測曲線。可知:輸入振動信號MAPE為0.083,RMSE為6.373;輸入切削力信號MAPE為0.067,RMSE為4.872。

圖10 單一傳感器信號特征下的后刀面磨損曲線
從上述實驗結果知:隨輸入特征量(27、44、71)的增大,銑刀磨損量預測效果越好,特征量達到一定程度時預測效果處于平穩狀態。振動與力信號預測結果大同小異,數據量大小是導致結果存在偏差的原因。因此,GA-LSTM可以有效運用于銑刀磨損量預測。
文中將GA-LSTM預測結果與FE-LSTM、CNN及BPNN進行對比,表4為不同模型實驗結果。

表4 不同模型實驗結果
由表4可知:GA-LSTM、FE-LSTM、CNN及BPNN均可實現銑刀磨損量的有效預測,與FE-LSTM、CNN及BPNN相比,GA-LSTM的RMSE分別下降了39.0%、51.5%、41.3%,MAPE分別下降了40.8%、56.7%、48.3%,實現了銑刀磨損量的高精度預測。
文中提出了一種基于GA改進LSTM的銑刀磨損量預測方法,該方法利用GA系統內部對參數進行優勝劣汰而求解出最優化參數的作用,求解出了隱藏層神經元數和學習率參數的最優值,并將參數最優值輸入到LSTM模型中,從而達到對模型的改進效果。實驗結果表明:改進后的LSTM模型可實現對銑刀磨損量的有效預測,與BPNN、CNN、FE-LSTM等模型相比具備更高的識別精度。另外,此次實驗所使用數據的采集裝置比較昂貴且信號采集難度大,不利于實際生產中的廣泛應用。因此,如何有效利用機床易于采集的各類信號降低信號的采集成本,應對不同種類信號時GA-LSTM模型泛化能力的提升,且將它應用于銑刀磨損量的預測是下一步要研究的問題。