謝 陽 戴逸群 張超勇 劉金鋒
1.江蘇科技大學機械工程學院,鎮江,212000 2.華中科技大學機械科學與工程學院,武漢,430074
數字化制造裝備產業是國家最重要的戰略性產業之一[1]。作為“工業母機”,機床在制造業被廣泛使用,是當今最具代表性的加工系統,具有低能效和高能耗的特點[2]。據統計,我國現存機床總數已超700萬臺,按單臺機床7.5 kW的平均功率計算,每年機床總能耗可達三峽水電站總發電量的兩倍以上。然而,在實際加工過程中,機床能量利用率不到30%[3],因此,開展數控機床的能量特性研究和能耗預測研究具有重大的現實意義和科學價值。
數控加工系統的能量源眾多,能量損耗規律復雜,這項工作也長期備受國內外學者的關注。李聰波等[4]通過優化工藝參數變量,建立了考慮刀具磨損的數控車削批量加工節能優化模型。BRILLINGER等[5]為具有可變功率需求的數控機床提供了基于數控代碼的能耗和功率曲線預測模型。PANGESTU等[6]根據可持續制造的關鍵指標,確立了最佳工藝參數的多目標多工步車削優化模型。SHI等[7]開發了一種避免模型校準的通用切削功率能耗模型,并能夠為不同的工件材料提供可靠的估計。
傳感技術的快速發展豐富了機床的可用能耗數據,進而激發了特征數據驅動機床能耗機器學習預測模型方面的研究。陳行政等[8]采用粒子群算法求解出一種以最小加工能耗和加工時間為優化目標的多刀具孔加工多目標集成優化模型。張華等[9]運用人工蜂群優化反向傳播神經網絡 (ABC-BPNN) 算法,建立了一種多特征數據驅動的數控銑削加工能耗預測模型。曾國治等[10]利用卷積神經網絡(CNN)與循環神經網絡(RNN)良好的特征提取和時序學習能力,建立了一個預測辦公建筑能耗組合模型,并對應設計了適用于深度學習模型的二維矩陣數據輸入結構。LIU等[11]利用小波變換和支持向量機 (WT-SVM) 算法對雙列軸承的振動信號進行建模,減少了不規則特征的影響。HE等[12]提出了一種以無監督方式利用深度學習算法的數據驅動能量預測方法。
綜上可見,目前大部分學者從機理模型中揭示能耗變化規律,或依靠機器學習預測建模對機床狀態進行動態評估,研究主要針對短時記憶條件下能耗機理分析,然而在實際加工過程中往往存在復雜工況下的多源影響問題,此時僅利用深度學習網絡無法精準反映能耗動態變化。而目前關于機床能耗的預測與狀態識別依然停留在機理模型的優化層面,全面、系統地分析復雜工況下能耗變化規律與機床運行狀態的研究報道較少,因此,開展面向能耗變化規律與狀態特性研究具有重大的現實意義。
基于此,本文以數控銑削加工為例,建立基于不同切削階段的能耗模型,利用小波變換對原始功率進行信號預處理,借助隨機森林(random forest, RF)集成模型與長短時記憶(long short term memory, LSTM)神經網絡進行訓練與能耗預測,采用RF分類預測方法實現機床運行狀態識別,并通過實驗驗證了融合隨機森林與長短時記憶神經網絡的模型(RF- LSTM模型)的有效性。
數控機床各系統能耗結構復雜,按各系統所消耗的能量結構進行分類,涉及機械振動、熱量散失以及機械磨損等各個要素,建模較為復雜且通用性較差,在數據采集階段無法測量各系統的功率,只能通過主軸功率對整機能耗進行評估。本文以機床的工作狀態以及子狀態分量能耗進行分類,對銑削加工能耗建模。機床的工作狀態主要包括待機階段、主軸啟停、空轉階段、空載階段以及切削階段,各階段命名以及能耗來源如表1所示。全階段銑削加工輸入功率如圖1所示。
由圖1可得,機床在啟動后會處于短暫的待機狀態,此狀態時間很短,待機功率來源于各輔助加工系統的啟動,此時功率曲線的波動較小,且不受各種工況條件的影響,故可近似將其視為恒定值,數值由各機床參數而定。當主軸啟動時,主軸電機開始運行,機床瞬時功率發生劇烈變化并出現峰值,這是由于主軸的高轉速與高動量引起的。短暫劇烈變化后,機床進入主軸空轉狀態,此時主軸轉速平穩,且無任何阻抗力。進入機床加工狀態后,控制進給的伺服電機開始運轉,帶動刀具進給,此時功率波動較大。在切削過程中,功率波動幅度最大,這是由于切削階段受切削條件、工件屬性、工作環境、刀具狀態等眾多因素的影響,同時也是預測難度最大的部分。經過切削狀態后,主軸完成加工并回到原始位置,經主軸停止、輔助系統關閉等流程,最后完成機床加工整個過程。
結合機床加工功率曲線,在機床實際加工過程中,機床某一時刻下的總功率可表示為[13]
(1)
式中,ns為主軸轉速,r/min;vf為進給速度,mm/min;f(ns)、g(vf)分別表示以主軸轉速和進給速度為自變量的二次函數;Js為主軸轉動慣量;Δαs為主軸角加速度瞬時變化量;Δωs為主軸角速度瞬時變化量;Ψ(t)表示刀具磨損時變函數;k、b為經驗參數,其值與機床參數與加工條件有關;RMR為材料去除率,mm3/min。
通過銑削加工模型能夠發現,影響能耗較大的切削參數包括主軸轉速ns、進給速度vf、切削深度ap和切削寬度ae等,即Ptotal=G(ns,vf,ap,ae)。上述參數成為影響能耗預測精準度的關鍵切削條件。同時,上述切削參數和加工時長等因素對刀具磨損時變函數Ψ(t)影響同樣較大。因此,在預測機床加工能耗時,應以這4個參數為主要加工自變量進行多工況預測,并且在實驗過程中觀察切削階段能耗的整體變化情況,從而分析Ψ(t)隨加工時長與加工能耗直接的關聯關系,以驗證能耗預測模型的普適性與識別方法的精確性。
機床能耗在各階段除了數值上有所差異外,其運行時長、波動范圍等參數同樣能夠反映機床的運行狀態。機床能耗預測與識別方法總體框架如圖2所示。首先,從建立好的銑削加工能耗模型提取出關鍵切削參數,作為實驗中切削條件的自變量。在完成最初的數據獲取后,利用小波變換對原始功率信號進行降噪預處理,并提取出信號時域、頻域和時頻域特征,以便清晰地反映出機床在各種運行參數下的加工狀態。接著,以原始數據中75%的樣本集為RF-LSTM模型的訓練樣本,采用RF算法的回歸分析進行特征重要性判斷與特征篩選,并建立回歸模型,以作為LSTM神經網絡的輸入值。經LSTM神經網絡預測完成后,對能耗模型利用主成分分析方法進行階段識別,并觀察其加工狀態識別情況。最后為驗證識別精準度,利用RF算法進行分類預測,完成能耗的智能識別過程。

圖2 機床能耗智能識別方法流程圖Fig.2 Flow diagram of intelligent identification method for energy consumption of machine tools
采集功率信號過程中常伴隨由其他設備產生的干擾信號,因此,為精準識別機床能耗,需在對功率信號進行特征提取前進行濾波處理,以減少噪聲信號的干擾。小波變換是目前最常用的信號預處理方法之一,它通過將信號分解為多個子帶,在有效消除高頻隨機噪聲的同時最大限度地保留采集信號的原始特征,在處理含噪信息時具有效率高、計算量小、不易失真的特點,且有良好的時頻特性。在處理信號的頻域特征時,小波變換能夠提供一個隨頻率改變的“時間-頻率”窗函數,對時間頻率進行局部化分析,從而克服短時傅里葉變換無法自適應時頻分析、窗口不隨頻率變化的缺陷。小波變換處理的信號時頻圖見圖3。

圖3 功率信號時頻圖Fig.3 Power signal time-frequency diagram
小波變換處理原始信號的基本結構如圖4所示。選擇合適的小波基函數將信號各尺度逐一分解,并對小波域進行閾值處理,最大程度地抑制噪聲,最后重構各尺度系數,得到降噪后的重構信號。文中采用名為“db4”且分解與重構層數為3的小波基函數,預處理圖見圖5。

圖4 小波去噪結構圖Fig.4 Structure diagram of wavelet denoising

圖5 功率信號預處理圖Fig.5 Power signal preprocessing diagram


圖6 功率信號小波尺度圖Fig.6 Wavelet scale map of power signal

表2 特征向量典型參數Tab..2 Typical parameters of feature vector
注:xi為數據樣本中第i個數據點的數值;N為數據樣本中數據點的數量;max(xi)表示數據樣本中所有數據點的最大值;min(xi)表示數據樣本中所有數據點的最小值;fs為采樣頻率,Hz;ω為角頻率,rad/s;S(ω)為離散時間序列的功率譜。
集成學習是一種通過構建并結合多個機器學習器來完成學習任務的元算法,通常適用于解決分類問題集成、回歸問題集成與特征選取集成等應用場景。RF算法屬于一種集成模型學習算法,它在原始數據集中反復隨機抽取數據并構建決策樹,再將其作為基分類器創建Bagging(裝袋)集成,以此減小RF算法的泛化誤差。
將待分類樣本數據通過RF分類器進行分類處理,最后利用多數投票的方式得到最終結果[14]。RF算法既可以處理離散型變量進行分類預測,也可以處理連續型變量進行回歸分析,流程結構如圖7所示。

圖7 隨機森林算法流程圖Fig.7 Flow chart of random forest algorithm
本文基于隨機森林袋外數據誤差來分析測試功率信號特征的重要性。假設共有I棵隨機森林決策樹,每一組數據集共有J個特征。對于第r棵決策樹的某一特征j,袋外數據誤差的計算步驟如下。
(1)計算第r棵決策樹對應的袋外數據Dr及袋外數據誤差Er。
(2)在保持數據集中其他特征不變的情況下,隨機置換Dr中的特征j序列,并重復步驟(1)。
(3)重復步驟(1)、步驟(2),得到{Er|r=1,2,…,I},{Erj|r=1,2,…,I;j=1,2,…,J},Erj為某一特征j下第r棵決策樹的袋外數據誤差。
(4)計算特征j置換序列前后的決策樹袋外數據誤差的平均變化量[15]:
(2)
式中,V(j)為特征j對目標變量的重要性。
根據上述步驟,將功率信號的21種特征進行序列編號,并計算功率信號的特征重要性,如圖8所示。

圖8 特征重要性統計圖Fig.8 Statistical chart of feature importance
經過對預處理信號的特征篩選,可得功率信號中重要特征的權重由大到小依次為整流均值、方根幅值、均方值、均方根頻率、峰值、均方差、波形因子、偏度、重心頻率和脈沖因子。建立RF回歸預測模型的主要過程為:采集功率原始信號→提取時頻域特征→特征重要性判別并篩選→形成信號訓練集與測試集→利用訓練集對RF回歸器進行訓練→輸出功率信號預測曲線。
采用RF回歸預測模型,本質是利用功率原始信號來擬合真實功率曲線,因此,基于RF回歸算法的功率信號預測模型如下:
Da={Nmea,Mtra}
(3)
Mtra={xn,sn}n=1,2,…,p
(4)
式中,Da為隨機森林回歸預測模型的參數集;Nmea為隨機森林回歸學習器的個數;Mtra為時頻域特征數據集;xn為第n組充當訓練集的樣本;sn為第n組樣本對應的功率信號預測模型;p為參與回歸訓練的樣本總數。
長短時記憶(LSTM)神經網絡是一種特殊的循環神經網絡(recurrent neural network,RNN),通過對不同的門結構以及神經元的使用來控制學習率和遺忘率,從而使模型對長短間隔的序列數據都具有記憶功能。這一點可以有效地解決傳統RNN在處理長序列時出現的梯度消失和梯度爆炸問題[16],從而可更好地捕捉長期依賴關系。LSTM神經網絡的神經元結構如圖9所示。

圖9 長短時記憶神經網絡神經元結構圖Fig.9 Neuron structure diagram of LSTM neural network
根據長短時記憶神經單元結構,可得LSTM更新公式如下:
(5)
(6)
(7)
(8)
(9)
(10)

LSTM神經網絡計算過程如下:

基于LSTM的門控單元結構,一種改進的門控循環單元(gated recurrent unit,GRU)逐漸被廣泛應用。與LSTM神經網絡相比,GRU的模型參數量更少,因此訓練速度更快。但LSTM憑借三種門控單元擁有更靈活和自由的模型優化空間,表達能力也更強,故本文中不對GRU門控循環單元進行深入考慮。
RF-LSTM模型通過RF算法對數據集進行回歸分析,衡量并評估每一個特征的重要性,并對評估結果進行合理的理解和解釋,以便了解模型的決策過程和影響因素。得到功率信號的特征重要性以及功率預測曲線,并將其作為LSTM神經網絡的輸入,可降低過擬合的風險,并提高模型的泛化能力。在LSTM神經網絡中進行進一步的訓練和學習,可提高模型的表征能力以及時間序列預測的準確性,進而完成堆疊式集成。
在RF-LSTM模型中,神經元權重值Wxi、Whi、Wxf、Who等以及調整參數qi、qf、qo等均需通過模型訓練獲得,模型訓練流程如下:
(1)加載訓練數據與測試數據;
(2)用訓練數據訓練模型,使最小化損失函數收斂;
(3)用測試數據通過訓練好的模型進行預測,若精度高,則得到最優模型結束訓練;若精度較低,則調整模型,重復步驟(2)。
本文將實驗所得數據總量的75%作為模型訓練集、25%作為模型測試集。同時引入損失函數Adam算法,該算法是對隨機梯度下降法的一種擴展,能夠計算出每個模型參數的自適應學習率,提高參數對模型的預測性能。Adam損失函數的表達式如下:
(11)
式中,Elose為損失函數值;l為訓練數據的數量;hipre、hirea分別為第i個訓練數據的功率信號預測值和真實值,并以預測值與真實值的均方差作為損失函數。
在模型訓練階段,本文通過比較功率信號真實值與預測值的平均絕對誤差Pmae與均方根誤差Prmse來判斷模型效果。若Pmae與Prmse的值過大,則表明模型預測精度不高,功率曲線預測效果不佳;若Pmae與Prmse的值較小,則表明模型預測精度較高,可用于實際應用中。Pmae與Prmse的表達式分別如下:
(12)
(13)
為驗證RF-LSTM模型的有效性與可行性,本文以銑削加工為例,選用數控加工中心CY-VMC850Le為實驗設備,對尺寸為200 mm×200 mm×50 mm的304不銹鋼工件材料進行加工,通過多種工況交叉組合完成多次銑削。采用WB9128功率傳感器以及數據采集裝置獲取機床運行過程中的功率信號并進行處理與分析。實驗中工況設定的變量具體說明以及具體加工變量數值如表3和表4所示。

表3 實驗變量說明Tab.3 Explanation of experimental variables

表4 實驗加工變量Tab.4 Experimental processing variables
為方便實驗結果的對比與分析,在前期選取三組典型的樣本數據集,并分別定義為S1、S2、S3。本實驗將濕切立銑、ns=700 r/min、vf=100 mm/min、ap=0.2 mm、ae=5 mm作為樣本數據集S1;將干切面銑、ns=800 r/min、vf=100 mm/min、ap=0.4 mm、ae=15 mm作為樣本數據集S2;將濕切面銑、ns=900 r/min、vf=200 mm/min、ap=0.6 mm、ae=25 mm作為樣本數據集S3;數控加工中心參數信息如圖10a所示,功率傳感器以及數據采集裝置如圖10b所示,銑削加工平臺如圖10c所示。

(a)數控加工中心 (b)功率傳感器及采集裝置 (c)加工平臺圖10 CY-VMC850Le機床參數及采集終端Fig.10 Machine parameters and acquisition terminals of CY-VMC850Le
本次實驗在多工況條件下完成數據采集,立銑與面銑均采用干切和濕切兩種方式進行冷卻。功率傳感器與數據采集裝置的采樣頻率均為10 Hz。當刀具沿Z方向完成20 mm立銑、沿機床X方向完成100 mm面銑后,主軸立即停止轉動,并通過NC指令恢復到初始位置,關閉輔助系統,待機床完全關閉10~15 min后進行下一階段的銑削實驗,以避免輔助系統產生的熱量對實驗結果產生影響。每一次銑削完成后對信號采集裝置采集到的功率信號點進行離線測量。最后將數據總量的75%作為訓練集訓練模型,其余25%作為測試集來評估模型性能與智能識別加工狀態。S1、S2、S3所采集到的樣本集在各階段的平均功率如表5所示。
為驗證所提出的基于RF-LSTM能耗模型的有效性與優越性,本文對相同數據集采用以下方法進行比較。
(1)線性回歸(linear regression,LR)模型。
完成功率原始信號的相關性特征提取,采用LR模型進行預測。
(2)循環神經網絡(RNN)。對原始數據作歸一化處理,通過滑動窗口完成特征提取,利用基礎RNN模型對未來時間序列數據進行預測。
(3)RF回歸模型。首先需對功率原始信號完成特征提取,然后組合決策樹模型判斷特征重要性并篩選,最后利用特征向量建立回歸模型進行預測。
(4)LSTM神經網絡。采用門結構對輸入功率原始信號進行遍歷,根據訓練集利用長時和短時記憶鏈逐步更新網絡內部狀態并生成功率信號時序預測模型。
(5)RF-LSTM模型。對功率原始信號進行特征提取與特征重要性判斷,將RF回歸模型作為LSTM神經網絡輸入序列進行預測。
因LR模型和RF回歸模型無法直接處理功率時序數據,故需提前進行特征提取,即將功率原始信號進行特征提取,轉化為時頻信號,并進行特征篩選獲得21維的空間向量,以此輸入回歸模型中進行預測。
因銑削加工采樣頻率為10 Hz,頻率較低,故在RF算法中,設置延時步長為10,決策樹總數為500。在LSTM神經網絡中,隱層神經元數目根據經驗一般設置在[0,256]的范圍內,因為隱層神經元數目對預測模型的預測精度和模型復雜度影響較大,所以本文設置隱層神經元數目為經驗范圍的平均值128,LSTM層數為3,全連接層數為1,最大訓練次數為1000,每次訓練打亂數據集,保證訓練集和測試集的隨機性,以避免模型對相同數據集重復訓練而降低模型訓練效率。
因切削參數對切削階段的功率影響最大,故對各單一變量參數所產生的切削功率進行對比。將濕切面銑、ns=700 r/min、vf=100 mm/min、ap=0.2 mm、ae=5 mm作為參考組進行單一變化量的切削功率對比,切削功率如表6所示。本文基于MATLAB建立LR、RNN、RF、LSTM、RF-LSTM模型,使用訓練集在各模型上進行訓練,使用測試集進行模型評估。各模型的Pmae與Prmse如表7所示。因LR和RNN模型對測試集的預測效果不佳,與其他模型相比,上述兩種模型的Pmae和Prmse值較大,故不展示LR和RNN模型的預測曲線情況。以RF、LSTM與RF-LSTM模型分別對典型樣本數據集S1、S2、S3進行預測,預測表現如圖11~圖13所示。

(a)RF (b)LSTM (c)RF-LSTM圖11 RF、LSTM與RF-LSTM模型在數據集S1上的預測結果Fig.11 Prediction results of RF, LSTM and RF-LSTM models on data set S1

表6 單一變量下機床切削功率Tab.6 Cutting power of machine tool under a single variable

表7 各模型預測數據集的Pmae與Prmse值Tab.7 Values of Pmae and Prmse for each model prediction on the data set
對所有預測曲線進行特征提取,建立預測特征向量Xn,并攜帶切削過程標簽的表征運行狀態特征,切削過程標簽包括待機階段、主軸啟停階段、空轉階段、空載階段和切削階段五個階段,分別以序號1~5進行命名。首先,利用主成分分析對特征向量進行降維處理,主成分累計方差貢獻值如圖14所示。

圖14 累計方差貢獻值圖Fig.14 Figure of cumulative variance contribution value
由圖14可知,當功率信號特征降至2維時,無法對功率信息進行90%的表達。當特征降至3維時,可表達出原始特征93.6%的信息。由此,選取3個主成分(principal component,PC)進行分類,三維可視化效果圖見圖15, 其中主成分分析圖像的坐標軸表示數據在相應主成分方向上的投影。

圖15 主成分降維效果圖Fig.15 Principal component dimensionality reduction rendering drawing
雖然3個主成分可完成特征降維,但是降維后的分類效果不明顯,無法進一步確定RF-LSTM模型預測結果的分類情況,因此,為使智能識別的精準度最佳,利用以下方法比較預測精度。
(1)支持向量機(SVM)。確定好核函數與懲罰因子等參數,使用訓練數據集訓練SVM模型,并通過優化目標函數求解模型參數。使用調整后的模型對測試集數據進行分類預測。
(2)徑向基函數(RBF)神經網絡。確定神經網絡隱層及神經元等信息參數,初始化神經網絡中的權重和偏置,使用訓練數據集訓練RBF神經網絡,并利用調整后的優化模型對測試集進行預測。
(3)隨機森林(RF)。根據訓練數據集構建決策樹模型,通過決策樹的特征選擇和節點分裂對訓練集進行訓練,通過修改決策樹數量、調整最大深度等方法優化決策樹模型,并對測試集進行分類預測。
采用上述三種方法處理加工階段預測結果,為直觀展現預測值的精度以及預測誤差的具體情況,將樣本總數的75%作為訓練集,剩余25%作為測試集進行分類預測,分類結果利用混淆矩陣進行分布,分布狀態如圖16所示,圖中混淆矩陣每格中上方的數字代表數據落在某一階段的個數,下方的數字代表該階段的數據總量占總數據的百分比;邊緣的方格中上方的百分比數據代表某一階段的預測精度,下方的數據為預測誤差,與上方的數據互補,右下角的百分比數據代表整個分類算法的預測精度。

(a)RF (b)LSTM (c)RF-LSTM圖16 SVM、RBF和RF模型的分類預測結果Fig.16 Results of classification prediction of SVM, RBF and RF models
由表5各階段的平均功率可以看出,因待機階段各類輔助系統的啟動受切削參數與環境條件的影響極小,故待機功率的數值沒有明顯的變化。在主軸啟停階段,其功率值主要取決于主軸轉動慣量以及角速度瞬時變化量,主軸轉速的增大會影響角加速度的瞬時變化,故使該階段功率波動較大。當機床處于空轉階段時,由于主軸轉速恒定且無進給運動,轉速對功率的影響依然較小。當機床開始進行進給運動后,功率隨進給速度的增大而增大。
由切削階段功率可以看出,切削參數對該階段影響最大。一方面因切削深度與切削寬度的增大使刀具承受更多負載,從而導致能量消耗增加。另一方面,由于刀具經過多次切削且逐漸超過初期磨損階段,磨損函數值逐漸增大,使得受刀具磨損影響的切削功率隨刀具使用時間的增加呈現非線性增長趨勢,從而在切削階段功率大幅增大。
從表6對各單一變量進行對比的結果中不難發現,主軸轉速、進給速度與切削深度對切削功率的影響較大。從功率值變化率中可以發現,主軸轉速、切削深度與功率的關系均為正相關,而進給速度與功率的關系為負相關,導致這種結果的原因是,當進給速度在100~200 mm/min范圍內時,加工時間的縮短對能耗的影響大于刀具負載的增大對能耗帶來的影響。因此,在保證主軸轉速不變的同時,可采用適當增大進給速度的方法來減少機床能耗,同時能夠縮短機床加工時間。
通過表7中的實驗結果對比可得,LR模型的誤差最大,模型預測效果不佳,其最大原因是,LR模型的回歸方程在處理非線性問題時存在局限性,包括對分離信號和噪聲的效果不理想等。此外LR模型的特征提取沒有對特征進行重要性判斷與篩選,依靠人為的特征提取很大程度上會丟失原始功率信號中的關鍵特征和信息。
根據表7中RNN與LSTM神經網絡的對比能夠發現,RNN的預測效果遠不如LSTM神經網絡的預測效果。這是由于RNN由一個循環單元組成,通過將先前的狀態傳遞給下一個時間步時無法傳遞長期記憶,并且由于簡單的網絡使其無法捕捉到能耗序列中的多維特性,導致預測效果不佳。LSTM神經網絡相比RNN能夠更好地處理長期依賴關系和記憶,并且具有更強的泛化能力。另外,LSTM模型的擬合效果明顯優于RF模型的擬合效果,這是由于原始功率信號本質上是一段時間序列數據,LSTM模型對長時與短時記憶的存儲和對序列特征的處理具有更強的能力。通過圖11~圖13中LSTM和RF模型預測效果的對比可以看出,RF模型僅能夠對主軸啟停階段的信號進行峰值預測,但預測精度遠沒有LSTM模型高。在所有模型中,RF-LSTM模型預測精度最高,盡管RF和LSTM模型對功率信號的預測值變化趨勢與真實值變化趨勢大致相同,但預測值和真實值的誤差較大。
通過圖11~圖13可以看出,S2樣本集在各階段的功率相比于S1與S3樣本集在對應階段的功率較小,這是由于S2樣本集采用干切冷卻方式,避免了噴射冷卻液產生能量消耗所導致的。RF-LSTM模型在預測主軸啟停階段的峰值信號效果要比采用LSTM模型時好,其主要原因是RF在進行特征提取和回歸分析的過程中,識別和提取峰值信號特征值的能力更為突出。在切削完成后的待機階段,LSTM模型的預測值普遍比真實值大,這是因為在主軸啟動前的待機階段時間很短,沒有足夠的數據進行模型訓練。而RF回歸模型給予LSTM待機階段的特征信息,能夠使RF-LSTM模型做到更加精確的預測。
通過圖14能夠看出,對預測出的功率信號進行主成分分析時,2個主成分的累計方差貢獻值十分接近90%,但對特征信息的表達程度還是不夠,這同時能夠說明機床加工全過程功率信號的變化特征比較復雜,需要提取3個主成分進行分析。通過圖16對三種分類預測算法進行預測對比可以發現,上述三種算法的預測精度從低至高依次為:SVM,RBF,RF。造成這個結果的原因可能是由于SVM引入核函數、懲罰因子等參數,對模型參數的選擇較為敏感,不易找到最優參數組合;另一方面SVM采用最大間隔分類器來進行分類,在二分類問題中應用廣泛,在處理多分類問題時需要進行多次二分類處理,容易出現分類偏差等問題。RBF神經網絡由于其非線性擬合能力較強,并且泛化與記憶能力強,使其在處理多分類問題時要優于SVM。然而RBF神經網絡的預測精度隨數據總量的增大而提高,數據不充分時難以確定隱層節點數、節點中心等參數,導致其在面對小樣本數據時預測精度不理想。RF依靠決策樹的組合模型,使其在預測高維度的復雜數據時準確率也極高,十分適合用于本文中高維度的離散數據集。
在圖16利用RF分類預測構建出的混淆矩陣中不難發現,主軸啟停階段和空載階段的預測效果最好,主要是因為這兩個階段的特征值差異較為明顯,識別度最高。待機階段的預測效果較好,主要原因是待機功率相比機床加工的其他階段功率最為穩定,信號波動變化最小。主軸空轉階段和切削階段分別有2個和1個樣本預測出現偏差,這是由于空轉階段和切削階段的信號波動較大,在時間序列中兩者信號值也有重疊部分,在預測分類中容易出現混亂。將預測樣本集打亂順序,使用RF算法進行多次預測并建立混淆矩陣模型,所得出5種機床加工階段的綜合智能識別精度如表8所示。

表8 加工階段智能識別精度Tab.8 Intelligent recognition accuracy in processing stages
由表8可以得出,切削階段的識別精度小于90%,主要原因是在實驗過程中,刀具反復進行銑削產生的磨損以及振動使切削能耗逐漸增加,功率值逐漸偏離理論曲線,從而使切削階段識別精度相對較低。從算法機理角度分析,切削階段的功率噪聲特征較多,其他特征相對比較冗余,導致算法在特征選擇環節無法有效篩選,從而影響算法準確率和魯棒性。采用RF算法對各階段預測的平均識別精度為95.78%,誤差小于5%,已達到精準預測的效果,驗證了基于RF-LSTM模型在智能識別機床加工狀態中的有效性及優越性,同時表明所提出的RF-LSTM模型在預測機床切削能耗的精度上有了較大的提高。
(1)本文根據機床加工能耗特性,提出了一種融合集成模型與深度學習的機床能耗預測與識別方法,該模型利用隨機森林(RF)對以時間為序列的原始功率信號進行序列特征提取、特征重要性判斷并建立回歸模型作為長短時記憶(LSTM)神經網絡的輸入,通過3次LSTM層和1次全連接層進行能耗預測,不僅避免了人為提取特征過程中提取不準確與信息丟失等問題,而且能夠通過決策樹模型挖掘出相關性更強的隱藏特征。
(2)通過實驗驗證了RF-LSTM模型在能耗預測上應用的可行性與有效性,并與另外幾種模型進行分析對比得出本文提出的RF-LSTM模型在能耗預測的精度上有了較大的提高。
(3)在能耗識別階段,利用RF算法與其他算法進行分類預測對比,得出RF在分類預測中的效果最優,并且對樣本進行隨機篩選的情況下,整體識別精度高于95%,已達到機床能耗智能識別的預期效果,從而驗證了RF分類預測的可靠性和智能識別方法的可行性。
目前,RF-LSTM模型僅以機床銑削加工為例進行了驗證,在后續的實驗與研究中,還需考慮車削、磨削等加工中的應用。本文考慮了刀具磨損對能耗模型的影響,但未深入考慮刀具在加工過程中的時變磨損量對切削過程的影響,這是未來提高機床能耗預測精度、降低能耗與碳排放的重要研究方向。在實驗設計階段,本文考慮了多工況的機床能耗預測與識別,但尚未具體考慮各單一工況對智能識別結果的影響,這是未來在機床能耗領域需要研究的重點方向。本文實現了對銑削加工能耗的預測和狀態識別,后續在機床加工過程中出現故障時如何實現快速預警并做出應急措施等具體應用需進行重點研究,這是未來將能耗預測與識別方法轉化為實際應用的關鍵一步。