李備備,陳春曉,鄭飂默,張 強
(1.中國科學院沈陽計算技術研究所,沈陽 110168;2.中國科學院大學,北京 100049;3.沈陽中科數控技術股份有限公司,沈陽 110168)
銑床刀具是金屬切削過程中經常使用的工具之一,其性能和壽命對銑削加工的質量、效率和成本具有直接影響[1]。然而,在使用過程中,刀具會遭受磨損和斷裂等故障,這導致切削力增大、表面粗糙度降低、加工精度下降等問題[2]。因此,準確預測銑床刀具的磨損量對于保證加工質量、提高生產效率、降低維修成本以及延長刀具使用壽命具有重要意義。
目前,基于數據驅動的預測方法是預測刀具磨損量的研究熱點之一。該方法通過分析刀具監測信號數據,利用信號學和特征工程的方法提取刀具磨損的退化特征,然后構建算法模型來完成刀具磨損量的預測[3]?;跀祿寗拥念A測方法的效果受到兩個主要因素的影響:信號數據的處理和刀具磨損預測模型的選擇。
在信號數據的處理方面,由于加工現場存在多種干擾源,采集到的數據常常包含大量噪聲,因此對數據進行去噪處理至關重要[4]。常用的去噪方法包括時域的平均濾波、中值濾波,頻域的低通濾波、高通濾波,以及時頻域的小波去噪等[5]。然而,針對多輪銑削加工產生的多組信號數據,上述方法難以通過一組確定的參數獲得良好的去噪效果。
在刀具磨損預測模型的選擇方面,已有的研究中,朱云偉等[6]使用LightGBM模型預測刀具磨損狀態,并通過遺傳算法對模型進行調優。梁柱等[7]將支持向量機(support vector machine,SVM)和鯨魚優化算法結合,實現了對鈦合金加工刀具磨損狀態的預測。李鑫等[8]則采用S變換提取特征,并利用隱馬爾可夫模型識別刀具磨損狀態。然而,這些研究只采用了單一傳統機器學習模型,未考慮結合多種機器學習模型的優點。
綜上所述,本文提出了一種基于自適應FIR濾波器和Stacking集成模型的刀具磨損預測方法。該方法采用自適應FIR濾波器解決工業噪聲問題,并利用Stacking集成模型解決單一傳統機器學習模型預測效果不佳的問題。通過在實際數控機床銑刀數據集上的實驗應用,與其他方法進行對比,實驗結果表明本文提出的方法相對于其他方法具有更高的預測準確性。
FIR濾波是基于有限長沖激響應的數字濾波器,其特點是結構簡單、易于實現和穩定可靠。與無限長沖激響應的IIR濾波器不同,FIR濾波器可以實現線性相位響應,因此在數字通信、語音處理、音頻處理等領域得到廣泛的應用[9]。
在FIR濾波器中,輸入信號從上一個時刻的輸入值和濾波器中的狀態序列計算得到。輸出信號的計算是在輸入信號通過濾波器后,由濾波器的輸出序列組成。
FIR濾波器的設計可以通過兩種方法實現:窗函數法和頻率采樣法。其中,窗函數法中又以Kaiser窗函數最為常用。Kaiser窗函數通過設定窗函數的形狀參數β來實現對濾波器的頻率響應進行調節,較大的β值會導致更陡峭的衰減,但可能會引入較寬的過渡帶,較小的β值會產生較寬的主瓣,但過渡帶可能較窄。它的特點是具有平滑的衰減特性,從而可以在帶阻濾波器等需要高衰減的場合中得到較好的濾波效果。
Stacking集成模型是集成學習中一種常用的模型結構。Stacking不僅可以用于提高模型的表現能力,也可以用于模型融合以及特征選擇等任務。該算法的核心思想在于將不同的模型進行串聯,使得每個模型的預測結果成為下一個模型的輸入,以此提高模型的性能和穩定性[10]。
Stacking將多個基模型組合成一個更高層次的模型,在預測時,將每個基模型的預測結果作為新特征輸入到元模型中進行訓練和預測。元模型可以是任何機器學習模型,典型的包括線性回歸、Lasso回歸、Ridge回歸等。
Stacking的訓練過程可以分為兩個階段,如圖1所示。首先,在第1階段中,使用交叉驗證將輸入數據劃分為多個折,然后在每個折中訓練多個基模型。這些基模型可以是不同的回歸器,例如SVR、LightGBM和MLP等。第2階段中,使用第1階段的基模型在訓練集上生成新的特征,并且使用這些特征訓練元模型進行最終的預測。

圖1 Stacking的訓練過程
Stacking集成模型是一種強大的機器學習融合模型,它已被廣泛應用于各種學習任務。通過將多個基模型融合在一起,Stacking可以顯著提高模型的預測性能和穩定性,同時也能夠進一步挖掘數據中的信息,使模型更具有表現力。
LightGBM是一種基于決策樹算法的快速、高效、分布式梯度提升框架[11]。其核心原理是采用直方圖算法對連續特征進行離散化,減少內存壓力和計算負擔,提高訓練速度。在構建決策樹時,LightGBM利用基于梯度的one-side相對誤差來分割數據,保證分區質量,提高了預測精度。
SVR是一種基于SVM的非線性回歸方法[12]。SVR的核心原理是通過在特征空間中找到一個能夠將樣本點映射到高維空間的決策函數,使得該函數與樣本點的距離最小。在SVR中,使用參數C來控制模型的容錯率,同時通過引入核函數將非線性問題映射到高維空間,進行復雜的非線性回歸任務。
MLP是一種基于人工神經網絡(artificial neural network,ANN)的前饋神經網絡[13]。MLP的核心原理是將輸入層、隱藏層和輸出層連接起來構成網絡模型,通過反向傳播算法進行網絡訓練,進而實現分類或回歸任務。在MLP中,每個節點用sigmoid、tanh、relu等激活函數進行非線性變換,將輸入信號傳遞到下一層節點。隱藏層的存在使得MLP具有處理非線性問題的能力,而輸出層則根據任務需求確定其節點數量和激活函數。
Lasso是一種基于L1范數正則化的線性回歸算法[14]。Lasso的核心原理是通過在普通最小二乘的基礎上加入L1正則項,實現變量選擇和模型壓縮。在Lasso中,L1正則化項通過對回歸系數進行懲罰,將某些回歸系數壓縮到0,從而可以進行變量選擇,避免模型過擬合。
針對工業噪聲問題,使用基于Kaiser窗函數的FIR濾波器,設計一個帶阻濾波器進行信號數據的去噪。為了保證設計的帶阻濾波器可以盡可能的去除噪聲頻帶,并且保留原有信息,本文使用貝葉斯優化算法對濾波器的階數、截止頻率、帶寬和Kaiser窗函數的β值組成的參數空間進行參數尋優,以最大化信噪比為目標,最終得到最優濾波器。信噪比的公式如式(1)所示。
(1)
式中:Ps是信號的功率,Pn是噪聲的功率。
針對單一傳統機器學習模型預測效果不理想的問題,設計一個Stacking集成模型。由于Stacking集成模型的基模型需要選取強回歸模型并且模型之間存在差異性,才能使得集成模型的效果變好。因此通過對多種回歸模型的實驗,最終選擇使用LightGBM、SVR和MLP作為集成模型的基模型。Stacking集成模型的元模型一般來說需要選擇比較簡單的回歸模型,這樣可以避免集成模型過擬合,因此本文通過對線性回歸、Lasso回歸和Ridge回歸3種簡單回歸模型的實驗,最終選擇效果最好的Lasso回歸作為元模型。
綜上所述,本文設計了一種基于自適應FIR濾波器和Stacking集成模型的刀具磨損預測方法,算法流程如圖2所示。

圖2 FIR-Stacking算法流程圖
為了驗證本文所提刀具磨損預測方法的有效性,選擇刀具磨損預測競賽的公開數據集進行實驗,實驗環境如圖3所示。該數據集使用Roders Tech RFM760高速數控機床,采用三槽球頭硬質合金銑刀,在HRC52硬度的不銹鋼上進行了銑削試驗,試驗條件如下:主軸轉速為10 400 r/min,進給率為1555 mm/min,徑向切深為0.2 mm,軸向切深為0.125 mm。試驗過程中,使用力、振動和聲發射傳感器進行數據采集,采樣頻率為50 kHz,共采集了7個通道的信號,包括切削力信號(3個方向)、加速度信號(3個方向)和聲發射信號。每完成一次工件表面銑削,使用萊卡MZ12型號顯微鏡進行離線測量刀具磨損量,直到刀具達到磨鈍標準停止實驗。實驗過程中進行了315次切削試驗,使用了6個刀具進行了6組試驗,得到了標記為C1、C2、C3、C4、C5和C6的6個數據集。

圖3 銑削過程中刀具監測實驗環境
本實驗將選取帶有磨損值標簽的C1、C4和C6數據集作為實驗數據集,使用7維信號數據作為實驗數據,并取其中80%作為訓練集,20%作為測試集。
在刀具加工過程中,因為存在進刀(刀具下降加工)和出刀(刀具上升移動)操作,導致產生了一些不同于正常信號的波動,這些波動可以被視為異常值,需要進行剔除。通過對信號的觀察和分析,本文決定將信號數據的前10%和后10%視為異常值,并進行剔除。剩余的信號數據具有較好的穩定性和連續性,更適合用于后續的實驗研究。另外,由于銑刀每輪加工產生的信號長度不同,因此我們在截取后的信號數據中取長度為100 000的信號數據進行后續實驗。
在工業加工中,由于存在大量不知名噪聲,這些噪聲會對刀具磨損預測的準確性和穩定性造成不良影響,因此去噪處理成為必要的步驟。
為了解決噪聲問題,使用本文設計的自適應FIR濾波器進行去噪,并且將它與原始多源信號數據進行比較,如圖4所示,是C6數據集第1輪加工中X方向振動信號的濾波前后對比圖。由圖4可以看出,原始信號存在一個信號突變,它出現的原因可能是現場干擾噪聲、顫振等,但是經過自適應FIR濾波器濾波之后,信號突變就被濾去了,并且信號變得平滑許多。

圖4 濾波前后對比圖
后續的實驗結果也表明,經過本文的自適應 FIR 濾波器處理后的信號數據與原始信號數據相比,預測準確性更高。
本文使用的刀具數據集,單把刀具只有315個樣本,由于樣本太小容易造成模型過擬合等問題,從而嚴重影響模型預測結果。因此,我們采用了數據增強技術,將原始信號數據切分成10份,對每份數據分別進行特征提取,將單把刀具的樣本量提升至3150個,提高了數據的多樣性和數量,進而提高了模型的準確性和魯棒性。
數字特征提取是信號分析和處理的重要一環,其目的是從原始信號中提取有用的信息,用于后續的建模和分析。在本文中,我們使用傅里葉變換(fourier transform,FT)得到信號的頻域信息,使用短時傅里葉變換(short time fourier transform,STFT)得到信號的時頻域信息,并對信號的時域、頻域和時頻域信息分別提取了10類常用的統計量,包括均值、偏度、峰度、標準差、能量、均方根、峰峰值、波形因子、脈沖因子和裕度因子,上述10種統計量的計算方法如表1所示。

表1 信號數據常用統計量計算方法
這些統計量可以反映出信號數據在時域、頻域和時頻域不同方面的特點和變化規律,對于刀具磨損的分析和預測具有重要的作用。其中均值、標準差和能量是信號特性的基本統計量,可以反映出信號的中心趨勢、波動程度和信號強度;偏度和峰度可以描述信號數據的非對稱程度和峰態;均方根和峰峰值可以反映信號的幅值大小和變化范圍;波形因子、脈沖因子和裕度因子可以反映信號數據的形狀特征和變化規律,對于提高刀具磨損預測準確性具有重要的影響。
在本文中,通過對于單維信號的特征提取,獲得時域、頻域和時頻域共計30種特征,然后通過將7維信號的特征進行拼接處理,獲得共計210種特征。
數據降維是在保留原始數據特征的同時,盡可能減少數據特征的數量,以達到減少計算負擔和提高模型性能的目的。在本文中,采用Pearson相關系數進行特征選擇,篩選出相關系數大于0.2的特征,作為本文所提模型的輸入。
為了驗證本文所提方法的預測性能,從數據和模型兩方面做出對比。在數據方面,分別對數據進行了不去噪、使用自適應FIR濾波器去噪兩種預處理方式,以得到不同干預下的數據集,從而探究不同預處理方式對模型預測效果的影響。在模型方面,采用了Stacking集成模型、LightGBM模型、SVR模型和MLP模型,對比不同模型的刀具磨損量預測準確性。在實驗中,我們使用平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE)作為指標來評估模型的預測準確性。MAE與RMSE的公式如式(2)、式(3)所示。
(2)
(3)
式中:ytest是測試值,ypred是預測值。
表2展示了不進行去噪處理的情況下,各個模型在樣本集上的MAE。從結果可以觀察到,與3種基本模型相比,本文設計的Stacking集成模型表現出更低的MAE值。

表2 不去噪處理方式下各模型在樣本集上的MAE
表3展示了不進行去噪處理的情況下,各個模型在樣本集上的RMSE。從結果可以觀察到,與3種基本模型相比,本文設計的Stacking集成模型表現出更低的RMSE值。

表3 不去噪處理方式下各模型在樣本集上的RMSE
表4展示了使用自適應FIR濾波器去噪的情況下,各個模型在樣本集上的MAE。從結果可以觀察到,與3種基本模型相比,本文設計的Stacking集成模型表現出更低的MAE值。

表4 自適應FIR濾波處理方式下各模型在樣本集上的MAE
表5展示了使用自適應FIR濾波器去噪的情況下,各個模型在樣本集上的RMSE。從結果可以觀察到,與3種基本模型相比,本文設計的Stacking集成模型表現出更低的RMSE值。

表5 自適應FIR濾波處理方式下各模型在樣本集上的RMSE
綜合表2~表5的結果可以看出,在數據預處理方面,使用自適應FIR濾波器去噪相比于不進行去噪效果更佳,尤其是在C6數據集上效果提升很大。并且在各種方法中,C6數據集的MAE和RMSE都要明顯低于C1數據集和C4數據集,這就說明C6相對于另外兩把刀具數據包含了更多的噪聲,從而導致預測效果不好,而本文提出的自適應FIR濾波器可以有效的過濾C6數據集中的噪聲,提高它的預測效果。在模型方面,Stacking集成模型相對于LightGBM模型、SVR模型和MLP模型具有更好的預測效果。
圖5~圖7是基于自適應FIR濾波器和Stacking集成模型預測方法在C1、C4、C6測試集上的預測圖。

圖5 C1刀具磨損量預測曲線

圖7 C6刀具磨損量預測曲線
從表4、表5和圖5~圖7可以看出,本文所提的基于自適應FIR濾波器和Stacking集成模型的刀具磨損預測方法在樣本集上的平均MAE是0.459,平均RMSE是0.920,預測準確性很高。
本文提出了一種基于自適應FIR濾波器和Stacking集成模型的刀具磨損預測方法,該方法能夠有效地解決傳感器信號存在噪聲和單一傳統機器學習模型預測準確性不理想的問題。通過在銑刀加工數據集上的對比實驗,驗證了本文所提預測方法的可行性和有效性,并且相較于其它幾種預測方法,本文所提方法在刀具磨損預測精度上有了較大的提高。
目前,本文只是利用Stacking集成模型集成了幾種不同的機器學習模型,在后續的研究中可以考慮選擇機器學習模型和深度學習模型作為基模型,從而結合兩類模型的優點,并進一步提高刀具磨損預測準確性。