馬能杰,王洪申
(蘭州理工大學機電工程學院,甘肅蘭州 730050)
電主軸作為高速加工數控機床的核心功能部件,其性能好壞嚴重影響整臺機床的加工精度[1-2]。而電主軸的發熱卻不可避免,由于其發熱所引起的誤差已經占到了總加工誤差的60%~80%。隨著機床定位精度的提高,目前熱誤差已成為影響總誤差最明顯的因素[3],因此對于高速主軸單元來說,采用必要的措施以減少其熱誤差對機床加工精度的影響就顯得尤為重要。目前主要采用硬補償和軟補償兩種方法[4-5],硬補償是通過數控設備機械結構的調整及改變來減小誤差;軟補償是通過數學方法或軟件方法提高電主軸精度,其中具有代表性的方法有:溫度控制法、熱態性能優化以及熱誤差補償法[6]。而熱誤差補償方法是在不改變電主軸結構,且成本較低的前提下通過實驗、分析、測試等過程建立一個熱誤差預測模型,并將其反饋給控制系統,從而進行實時補償的方法,因此熱誤差模型的建立成為了國內外學者研究的重點之一。
近年來,國內外學者對熱誤差模型的建立進行了大量的研究。一直以來,人們希望通過預測熱變形的規律性減小熱變形帶來的影響[7]。LI 等[8]利用鯨魚優化算法(Whale Optimization Algorithm)優化了支持向量機(Support Vector Machine),以此來建立起熱誤差模型,使得模型預測精度顯著提升。HUANG等[9]利用遺傳算法(Genetic Algorithm,GA)對BP(Back Propagation)神經網絡的初始權值和閾值進行了優化,將優化后的權值和閾值返回BP 神經網絡,使其預測精度及收斂速度大幅度提高。YANG 等[10]通過改進的灰狼優化器(Improved Gray Wolf Optimizer,IGWO)和自適應神經模糊推理系統(Adaptive Neuro-Fuzzy Inference System,ANFIS),提出一種較為精準的電主軸熱誤差模型,結果表明:新模型具有更好的泛化性和魯棒性。馬馳等人[11]對精密鏜床主軸進行研究,建立了基于PSO-BP 神經網絡的熱誤差模型,結果表明模型的有效性較BP 神經網絡有了巨大的提升。謝杰等人[12]提出一種思維進化算法,優化了基于BP 神經網絡建立電主軸熱誤差模型的方法,其最低補償率超過了90%以上。
LSTM(Long Short-Term Memory)神經網絡是一種特殊的RNN(Recurrent Neural Network),相比一般的神經網絡,它具有解決長序列訓練過程中梯度消失和梯度爆炸問題的優勢,在解決電主軸熱誤差預測精度問題上有較為理想的效果。研究表明:神經網絡的學習能力取決于網絡隱藏層的結構,其中包括隱藏層的數目和每個隱藏層中節點的數量。隱藏層的數量可以有效降低網絡的訓練誤差,提高網絡識別的準確率,但也會使網絡的拓撲結構更加復雜,訓練時間也會更長;而增加隱藏層節點數也可以提高識別的準確率,更容易觀察和調整訓練效果[13]。隱藏層節點數的選取方法有很多種,BENARDOS、VOSNIAKOS[14]利用試湊法不斷地對不同隱藏層節點數進行測試,直到數據接近理想情況為止,該方法沒有目的性,只是盲目的測試,花費成本巨大。MIRCHANDANI、CAO[15]應用經驗公式法來確定隱含層節點數,但此方法缺少相關理論依據,且只針對特定的情況,適應性較差,不能通用。ISLAM 等[16]利用增長法從一個最小的神經網絡進行試驗,依次增加隱藏層節點數,最終篩選出最適合的節點數,但對于如何終止增長的問題目前沒有較為科學的方法來進行說明。
本文作者提出一種基于優化灰狼算法(IGWO)的單隱含層的LSTM 神經網絡熱誤差預測模型,通過改變灰狼算法中收斂因子a的算法公式,解決了灰狼算法在計算最優隱藏層節點數時陷入局部最優解的問題。最后通過基于最優節點數的LSTM 網絡來預測電主軸熱誤差。
灰狼算法(Gray Wolf Algorithm,GWO)受灰狼捕獵行為啟發而提出。算法中每只灰狼的位置代表了解空間的一個可行解。在群體中將最優解命名為α,第二、第三最優命名為β 和δ,剩下的候選項記為ω,在GWO 中狩獵過程由α、β 和δ 引導,ω 跟隨這三只狼。GWO 的主要過程為包圍、狩獵和攻擊。
式中:D表示個體與獵物間的距離;X(t+1)是灰狼的位置更新公式;t是迭代代數;A和C是系數向量;Xp為獵物的位置向量;X為灰狼的位置向量。A和C計算公式如下:
式中:a是收斂因子,隨著迭代次數從2 線性減小到0;r1和r2的取值為[0,1]內的隨機向量。
灰狼個體跟蹤獵物位置的數學模型描述如下
式中:Dα、Dβ和Dδ分別表示α、β 和δ 與其他灰狼個體的距離;Xα、Xβ和Xδ分別表示α、β 和δ的當前位置;C1、C2和C3是隨機向量;X為當前灰狼的位置。
式(6)分別定義了狼群中ω 個體的朝向、前進的步長和方向,式(7)定義了ω 的最終位置。
為了模擬逼近獵物,a的值被逐漸減小,因此Ai(i=1,2,3)的波動范圍也隨之減小。換句話說,在迭代過程中,當a的值從2 線性下降到0 時[見式(8)],其對應的Ai的值也在區間 [-a,a]內變化。
式中:t為當前迭代次數;T為最大迭代次數。
如圖1 所示,當Ai的值位于區間內時,灰狼的下一個位置可以位于其當前位置和獵物之間的任意位置。當時,狼群向獵物發起攻擊(陷入局部最優);當時,灰狼與獵物分離,希望找到最合適的獵物(全局最優)。

圖1 攻擊(a)和尋找(b)獵物Fig.1 Attack(a)and hunt(b)for prey
GWO 算法在收斂過程中容易陷入局部最優,造成這些缺點的主要原因為:由公式(6)可知,GWO算法的主要搜索模式由系數向量Ai所決定。由公式(3)可知,A的大小主要由收斂因子a決定。由公式(8)可知,收斂因子a趨于線性變化,但實際情況下需要GWO 的尋優過程是非線性的,因此收斂因子a的線性變化將會導致收斂過程中的缺陷。
針對上述情況,本文作者對灰狼優化算法進行了改進,具體策略如下所述。
收斂因子a的改進。本文作者提出了一種收斂因子a的非線性計算公式,見式(9):
為進一步說明改進后的灰狼算法較未改進灰狼算法的優勢,利用MATLAB 軟件分別繪制了改進前后的GWO 收斂變化圖,如圖2 所示。未改進的GWO算法在迭代次數23~25、27~29 期間分別停留在數值4 000 和2 300 處,即陷入局部最優。而改進后的IGWO 算法則在此處跳出了局部最優,并且改進后的IGWO 算法迭代至35 代達到收斂,較未改進的GWO算法迭代至37 代才收斂的收斂速度更快,因此本文作者提出的對于收斂因子a的改進更適用于實際情況下GWO 算法的收斂運算。

圖2 收斂曲線對比Fig.2 Convergence curves comparison
LSTM 模型,本質上是一種特殊的循環神經網絡(RNN)。在RNN 模型的基礎上利用增加的門單元來解決RNN 的短期記憶問題。而電主軸熱誤差對歷史熱信息具有長期記憶特征,因此LSTM 模型適用于電主軸熱誤差預測模型的建立。
采用LSTM 神經網絡預測熱誤差,其輸入跟輸出單元數要根據實驗變量數來決定。實驗中首先需要確定熱敏點的數量跟位置,其目的是減少因傳感器過多而造成的精確性問題以及溫測點形成的強耦合而造成的多重共線性問題。
因此,通過模糊聚類法跟灰色關聯度分析模型相結合的方法[17],綜合分析和評價各溫測點,最終得到2 個位置的最佳溫測點,即后軸承殼體外表面跟前軸承主軸殼體外表面處,如圖3 所示。以此來作為LSTM 神經網絡的輸入層單元。

圖3 電主軸溫度傳感器布局示意Fig.3 Motorized spindle temperature sensor layout
主軸誤差主要有軸向和徑向兩種,由其熱伸長跟熱彎曲引起,而軸向的熱伸長量幅度遠大于徑向熱伸長量,故文中僅研究軸向位移引起的熱誤差,以此作為LSTM 神經網絡的輸出層單元。從而,LSTM 神經網絡的拓撲結構建立完成,其中輸入層單元數設置為“2”,隱含層初始單元數根據經驗公式選取為“5”,輸出層單元數設置為“1”。遺忘門采用sigmoid 函數作為激活函數,輸入門跟輸出門采用tanh 函數作為激活函數。訓練次數設置為300,學習率設置為0.005,均方根誤差ε設置為0.01。
隱藏層節點數的選擇十分復雜,與學習算法的激勵函數選擇相比,確定隱藏層節點數目的研究較少[18]。目前隱藏層節點數計算的主要方法為經驗公式法,但其只適應于特定的環境,魯棒性較差。
若隱藏層節點數太少,網絡可能根本不能訓練或網絡性能很差,且精度不夠;若隱藏層節點數太多,雖然可使網絡的系統誤差減小,但網絡訓練時間延長,另一方面也可能會引起“過擬合” 現象。
因此,合理的隱藏層節點數應在綜合考慮網絡結構復雜程度和誤差大小的情況下確定。
一般隱藏層節點計算經驗公式如式(10)所述
式中:m為隱藏層節點數;n為輸入層節點數;l為輸出層節點數;α為0~10 之間的常數。
IGWO-LSTM 模型既適用于電主軸熱誤差在實際工況下的遲滯效應,又極大地降低了模型在收斂時陷入局部最優的可能性。具體實施步驟如圖4 所述。

圖4 IGWO-LSTM 算法流程Fig.4 IGWO-LSTM algorithm flow
(1)導入電主軸240 min 內熱誤差數據。
(2)劃分訓練集與測試集。將數據集中80%的數據劃為訓練集,20%為測試集,并利用MATLAB自帶map minmax 函數對所有數據進行歸一化處理。
(3)確定灰狼種群規模為30,最大迭代次數為50,參數上下界為(ub,lb)。
(4)初始化種群位置Xi,見式(11)。
式中:r0為[0,1]內的隨機數。
(5)計算每個灰狼個體適應度值,將3 個最優解位置記為Xα、Xβ和Xδ。
(6)根據公式(3)(4)(9)更新C、A和a,根據公式(5)(6)更新灰狼位置,根據公式(7)得到獵物的最優位置。
(7)判斷是否超過最大迭代次數,若沒有則返回第(5)步,反之輸出最優隱藏層節點數。
(8)將LSTM 網絡迭代次數設置為300 次、學習率設置為0.005,設置ε為誤差允許最小值。將上一步中的最優隱藏層節點數代入LSTM 神經網絡,然后進行訓練和預測。
(9)判斷絕對誤差值是否滿足不大于允許最大誤差值,若滿足則進行下一步,若不滿足則將得到的預測值與實際值代入步驟(5)中。
(10)基于平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)以及均方根誤差(RMSE)這3種指標對優化后的IGWO-LSTM 神經網絡跟通過經驗公式計算得到隱藏層節點數的LSTM 神經網絡進行評估。其中MAE、MAPE 和RMSE 的定義式分別見式(12)、式(13)和式(14)。
式中:x(t)為實測誤差值;(t)為模型預測誤差值;n為測試樣本個數。
此次采用的電主軸為某公司研制的一種臥式銑削加工中心的電主軸,其額定功率為11 kW,轉速可達到8 000 r/min。對其進行空載運行實驗,測定其在環境溫度為22 ℃、轉速為5 000 r/min 下熱誤差數據。
采用基于LMS SCADAS 的高性能數據采集系統作為實驗平臺控制系統,數據分析與處理系統采用Test.Lab Signature 軟件,軸向熱誤差的采集使用非接觸式電渦流位移傳感器。傳感器接線布置如圖5所示。
實驗中溫度與熱誤差每2 min 采集一次樣本,共采集到120 個樣本,如圖6—7 所示。

圖7 電主軸軸向熱誤差Fig.7 Thermal error of motorized spindle along axis
由圖6—7 可知:溫升變化曲線與熱誤差變化曲線的變化趨勢比較相似。這是由于前期電主軸從靜止開始運轉,速度上升,溫度也快速上升,而熱誤差主要因為電主軸內部熱源分布不對稱、各零部件溫度上升不均勻而導致的,因此前期熱誤差變化也比較大;隨著電主軸進入熱平衡狀態,溫升變化幅度減緩,熱誤差也逐漸趨于平衡。由熱膨脹理論可知,當膨脹系數為常數時,可近似將溫升與熱誤差看作線性關系。
根據第3 節,經MATLAB 軟件編程運算,兩種模型預測結果對比如圖8、9 所示。

圖8 IGWO-LSTM 模型預測值與真實值對比Fig.8 Comparison of IGWO-LSTM model prediction value and real value
圖8 與圖9 分別為兩種模型預測值與實際值的對比。可知:IGWO-LSTM 模型預測值與實際值的擬合程度比經驗LSTM 模型預測值與實際值的擬合程度更高,且IGWO-LSTM 模型預測最大誤差為0.63 μm,與原LSTM 模型預測誤差0.71 μm 相比減少11.3%,平均絕對百分比誤差減少0.027%,平均絕對誤差減少了70.5%,均方根誤差減少了69.1%,見表1。

表1 評估結果數據Tab.1 Evaluation result data

圖9 原LSTM 模型預測值與真實值對比Fig.9 Comparison of LSTM model prediction value and real value
針對電主軸熱誤差預測模型誤差較大以及LSTM神經網絡收斂性容易陷入局部最優問題,本文作者提出一種改進的灰狼算法來對LSTM 神經網絡的隱藏層節點數進行尋優,進而對電主軸熱誤差進行預測,并得到以下結論:
(1)通過對灰狼算法(GWO)中收斂因子進行非線性計算方法的改進,降低了其陷入局部最優的可能性,且更適合實際情況下的收斂運算。
(2)利用改進后的灰狼算法算出最優隱藏層節點數,再將最優節點數代入LSTM 神經網絡中,然后將LSTM 預測所得值與實際值代入IGWO 適應度函數中重新計算最優隱藏層節點,以此循環往復形成一個閉環系統,最終達到規定迭代次數或最小均方根誤差,最后通過MATLAB 軟件對電主軸熱誤差進行訓練,得到IGWO-LSTM 熱誤差預測模型,與經驗式計算下的隱藏層節點數的LSTM 神經網絡模型預測結果進行比對,IGWO-LSTM 神經網絡的平均絕對誤差、平均絕對百分比誤差和均方根誤差均優于經驗LSTM神經網絡,因此IGWO-LSTM 能更好地實現電主軸熱誤差的預測。