王小東,王 柱,林承敏,王天雷,黃桂武,周智恒
(1.廣東科杰機械自動化有限公司,廣東 江門 529030;2.五邑大學智能制造學部,廣東 江門 529020;3.華南理工大學電信工程學院,廣州 510640)
數控加工的主要目的是減少加工誤差。一般有兩種方法:輪廓控制和軌跡跟蹤控制[1-2]。輪廓控制旨在減少加工過程中的輪廓誤差,已有學者進行了研究[3-4]。與輪廓控制不同,軌跡跟蹤控制旨在提高各軸的跟蹤性能,控制器結構簡單,魯棒性好。為獲得良好軌跡跟蹤控制性能,采用了許多傳統控制方法,如滑模控制[5-6]和前饋控制[7-8]。近年來,迭代學習被用于軌跡跟蹤控制[9-11],但其缺點是需要在同一軌跡上重復運行。需要一種能夠實現高精度軌跡跟蹤控制并適用于不同軌跡的控制算法。
隨著計算能力的提高,人工神經網絡在軌跡跟蹤控制中的應用越來越廣泛[12-14]。由于其獨特的學習能力,神經網絡可以在訓練過程中學習系統的動力學,并將其應用于控制系統。Wai R J[15]提出了一種滑模神經網絡(SMNN)控制系統,用于n剛性連桿機器人的軌跡跟蹤控制,以實現高精度的位置控制。Chen S[16]提出了一種將人工神經網絡用于迭代學習控制的方法,以減小多軸工業機器人的跟蹤誤差。使用高保真動態模擬器,針對給定的期望軌跡,對外部命令進行迭代優化,以補償機器人內環動力學。然后,使用這些期望軌跡和相應的細化輸入軌跡訓練多層神經網絡,以仿真非線性內環動力學的動態逆。最后,Li Q[17]提出了一種基于DNN的算法作為一個附加模塊,以提高經典反饋控制器的跟蹤性能。給定所需軌跡,DNN根據其學習經驗為控制器提供定制的參考輸入。
實際加工時,封裝在機床中的控制器很難修改。因此,修改參考軌跡的方法更為實用。本文提出了一種基于閉環伺服系統LSTM-NN模型的軌跡跟蹤方法。首先,分析了伺服系統各部分的動態特性,建立了系統模型。然后,通過分析系統傳遞函數,選擇LSTM-NN的輸入特征并對其進行訓練,以建立參考軌跡與實際軌跡之間的映射。最后,利用訓練好的LSTM-NN,得到修改后的參考軌跡,用于提高系統的跟蹤精度。本文的主要貢獻體現在本文介紹了一種新的基于LSTM-NN的軌跡跟蹤控制方法,該方法在不修改伺服系統控制器的情況下,提高了加工精度,適合于實際應用。
三軸數控機床系統由3個單軸伺服系統組成。由于3個軸之間耦合性較弱且系統模型相似,本文將對單軸伺服系統進行分析并建模。如圖1所示,單軸伺服系統一般分為伺服驅動器、伺服電機和機械傳動3部分,接下來分別對這3部分進行建模。

圖1 伺服系統結構
機械傳動部分的動力學方程為:

式中:JL為總慣性矩;BL為總阻尼因子;KL為總剛度;θS為輸出角;θM為期望角;TS為擾動;TL為總扭矩。
為便于分析,考慮TS=0,將轉動運動轉換為直線運動,然后進行拉普拉斯變換,得到機械傳動部分的傳遞函數:

式中:y(s)=iSθS(s),iS=l/2π,l為螺桿導程。
伺服電機通常是永磁同步電機。在d-q坐標系下,用以下4個方程來建立永磁同步電機的數學模型。
(1)電壓方程

式中:Ud和Uq分別為d軸和q軸的電壓;R為定子電阻;ψd和ψq分別為d軸和q軸的磁通;id和iq分別為d軸和q軸的電流;ω為轉子角速度。
(2)磁鏈方程

式中:Ld和Lq分別為d軸和q軸的等效電感;ψf為永磁體穿過定子繞組磁鏈的磁場。
(3)電磁轉矩方程

式中:Kc=npψf;Te為電磁轉矩;np為定子的極對數。
(4)運動方程

式中:TL為電機的負載轉矩;J為轉動慣量;D為電機的阻尼系數;ωr為電機的角速度;
基于以上4個方程,考慮Ld=L,D=0以及id=0,可以得到一個簡化的永磁同步電機模型:

在伺服系統中,通常采用三回路控制器,電流和速度環采用比例積分(PI)控制器,位置環采用P控制器。伺服驅動器包括逆變器、低通濾波器、電流環控制器、速度環控制器和位置環控制器,下面分別對其進行建模。
(3)位置環控制器為KPP,其中KPP是位置環控制器的比例增益。

式中:b0,b1和a0,a1,…,a6由圖2中簡化模型計算所得。

圖2 傳遞函數模型
基于ANN逆模型的傳統控制框架如圖3所示。采用神經網絡逆模型作為前饋控制器,通過修改控制輸入補償系統的跟蹤誤差,并采用反饋控制器抑制未知擾動和參數不確定性。在此控制框架中,建立了開環被控對象的逆模型,該模型由于不可避免的系統不確定性而限制了模型的精度。

圖3 傳統控制框架
本文提出的閉環LSTM軌跡跟蹤控制框架如圖4所示。在閉環LSTM中,控制系統可分為兩部分。第一部分是一個單軸伺服系統,其中包括一個采用三環控制的伺服驅動器,一個伺服電機和機械傳動部分。閉環PEA的輸入為參考軌跡yr(k),輸出為實際軌跡y(k)。第二部分是基于LSTM-NN的軌跡修正模塊。其輸入為給定軌跡yd(k),輸出為修改后的參考軌跡yr(k)。伺服系統中的三環伺服驅動器既能保證系統的穩定性,又能實現一定的軌跡跟蹤精度。對于相同的參考軌跡,閉環系統可以產生類似的跟蹤誤差,即與開環系統相比,該系統具有更好的魯棒性和可重復性。對于這樣的閉環系統,可以使用具有強大時間序列逼近能力的LSTM-NN學習yd(k)與yr(k)之間的映射關系。利用訓練好的LSTM-NN對參考軌跡進行修正,提高了整個伺服系統的跟蹤性能。

圖4 閉環LSTM軌跡跟蹤控制框架
提出的Closed-LSTM如圖5所示,包括一個訓練階段和一個測試階段,使用LSTM-NN學習yd(k)和yr(k)之間的映射。在訓練階段,把y(k)看作yd(k),實際軌跡y(k),y(k+1),…,y(k+N)作為LSTM-NN的訓練輸入,參考軌跡yr(k),yr(k+1),…,yr(k+N)作為LSTM-NN的訓練輸出。在測試階段,利用訓練好的LSTM-NN對期望軌跡進行修正,得到新的參考軌跡。LSTM-NN的輸入為期望軌跡yd(k),輸出為參考軌跡yr(k)。當伺服系統中輸入參考軌跡yr(k)時,如果LSTM-NN絕對準確,則其實際軌跡y(k)等于期望軌跡yd(k)。

圖5 控制系統框架
基于單軸伺服系統的簡化模型(8),將傳遞函數轉化為離散形式:

式中:Y(z)和Yr(z)分別為單軸伺服系統的參考軌跡和實際軌跡的z變換表達式;β0,β1和α0,α1,…,α6為式(8)計算得到的系數。
通過對式(9)進行z逆變換,可獲得參考軌跡和實際軌跡之間的關系:

式中:y(k)和yr(k)分別代表單軸伺服系統的在k時刻的實際軌跡和參考軌跡。
基于離散時間表達式,k時刻的參考軌跡和實際軌跡y(k+j),j=-1,0,…,5與參考軌跡yr(k-1)相關。同時,由于速度信號可以表示為位置信號的差分,并且為了提高輸入特征的豐富度,本文選擇y(k+j),j=-1,0,…,5和y˙(k+j),j=-1,0,…,5作為輸入特征,yr(k)作為輸出特征,即當前時刻的參考軌跡由前一時刻、當前時刻和后5個時刻的實際軌跡和實際速度計算而來。而參考位移yr( )k-1作為隱藏信息被LSTMNN的長期和短期記憶特征所保留和擬合。
利用LSTM-NN建立實際軌跡與參考軌跡之間的映射關系,訓練LSTM-NN的數據需要覆蓋大部分特征空間,充分激發系統的響應特性。在這個意義上,幅值逐漸增大的正弦軌跡能夠覆蓋機床運行軌跡能夠經歷的所有特征空間,非常適合作為本文的訓練集,其表達式如下:

最終得到訓練軌跡如圖6所示。

圖6 訓練集軌跡
訓練集的特征分布圖如圖7所示,能夠覆蓋所有機床運行軌跡能夠到達的特征空間,具有很好的泛化性能。

圖7 訓練集覆蓋的特征空間
2.4.1 LSTM-NN結構
LSTM神經網絡是一種對序列響應進行模型擬合的神經網絡。LSTM作為一種特殊的RNN,通過在標準RNN中加入長時記憶序列,可以適應長時記憶和短期記憶。在時域,LSTM-NN將返回兩個信息:cell狀態和hidden狀態。LSTM-NN具有良好的記憶能力,適用于長期依賴問題。
調整神經網絡參數后,確定神經網絡結構如圖8所示,其中包含3個隱藏層64個神經元,dropout參數為0.2。求解器為Adam,預設的max-epoch為10 000,minbatchsize為128,學習率初始化為0.01。

圖8 神經網絡結構
2.4.2 LSTM-NN訓練
LSTM-NN的權值參數需要離線訓練。簡而言之,訓練過程就是通過BP算法迭代更新權值參數,找到最優權值矩陣。
LSTM-NN的訓練輸入為實際的軌跡信息(濾波后的位置和速度),網絡訓練輸出為估計的參考軌跡(t)。損失函數定義為估計參考軌跡(t)與實際參考軌跡y(t)之間的均方根誤差(root mean square error,RMSE),t時刻的表達式為:

式中:‖·‖表示標準差。
在T個訓練樣本中,LSTM神經網絡的總損失函數為最后,根據J的梯度更新LSTM-NN的權值矩陣。
本文采用了三軸數控機床實驗平臺,主要由1個機械本體、3個GTHD伺服驅動器、實時仿真控制器及計算機組成,系統的整體效果如圖9所示。

圖9 實驗平臺
該實驗平臺的工作原理為:首先在計算機上的SIMULINK中實現控制算法,然后SIMULINK將相應的代碼和模塊編譯成嵌入式系統可運行的目標文件,將目標文件下載到實時仿真控制器中。實時仿真控制器通過GTHD伺服驅動器與被控伺服電機連接,伺服電機帶動3個軸進行運動。其中,伺服驅動器工作在模擬速度模式,也就是電流環和速度環在伺服驅動器端,位置環在實時仿真控制器端。伺服驅動器為GTHD-006AAP1-00伺服驅動器,平臺使用的電機為多摩川TS4607N2190E200伺服電機,實時仿真控制器為dSPACE公司的產品,型號為DS1103 PPC Controller Board。
在工業生產中,常用于機床伺服電機的控制算法是三環控制。為了驗證本算法的有效性,本實驗以常用的皇冠軌跡作為測試軌跡,如圖10所示。比較了兩種控制系統運行后的輪廓誤差:(1)三環PID控制伺服系統;(2)經過訓練后的LSTM神經網絡逆模型控制系統。

圖10 皇冠軌跡
對于兩種控制算法,給定軌跡均為皇冠曲線,對于算法1,伺服系統的輸入軌跡為皇冠曲線;對于算法2,給定軌跡為皇冠曲線,參考軌跡為給定軌跡經過LSTMNN修改后的軌跡,伺服系統的輸入軌跡為參考軌跡。如圖11和表1所示,經過逆模型補償后3個軸的單軸跟蹤誤差均有很大的下降。如圖12和表2所示,輪廓誤差也有很大的下降,最大輪廓誤差為25 μm,降低了11 μm。

圖11 跟蹤誤差對比

表1 跟蹤誤差對比

表2 輪廓誤差對比

圖12 輪廓誤差對比
針對數控機床在加工時,控制器難以修改導致加工精度提高困難問題,本文提出了一種基于閉環伺服系統LSTM-NN模型的軌跡跟蹤控制方法,該方法通過建立實際軌跡與參考軌跡之間的映射關系,對參考軌跡進行修正和補償,提高了單軸軌跡跟蹤能力,從而降低了機床加工過程中的輪廓誤差。實驗結果表明經過逆模型補償后3個軸的單軸跟蹤誤差均有很大的下降,輪廓誤差也有很大的下降。與現有的輪廓控制方法相比,所提出的控制方法不修改機床本身控制器的情況下,降低了11 μm輪廓誤差,有效地提高了數控加工的精度。在后續的研究工作中將對數控機床軌跡跟蹤控制中的抗擾問題開展進一步研究。