陸國強,許建秋
(1.三江學院 電子信息工程學院,江蘇 南京 210012;2. 南京航空航天大學 計算機科學與技術學院,江蘇 南京 211106)
路徑跟蹤控制作為拖拉機自主化作業的核心技術,可使拖拉機按照規劃路徑進行作業,提高作業質量和效率,降低駕駛員勞動強度[1-3]。拖拉機作業過程中的速度和跟蹤路徑曲率是不斷變化的,有必要提高路徑跟蹤控制方法的自適應性,保證其自主作業精度。
目前用于拖拉機的路徑跟蹤控制方法主要包括PID控制、純跟蹤控制、模糊控制、模型預測控制等[4-7]。PID 控制無需構建車輛模型,易于實現,但參數整定較難,為提高其魯棒性,將模糊控制和神經網絡與PID相結合[8-9]。純跟蹤控制是根據當前的位置偏差、航向偏差和車輛幾何學模型求得控制輸入,其結構簡單,實現方便,被廣泛應用。基于純跟蹤控制的路徑跟蹤效果的關鍵在于參數前視距離的選取,而作業速度和跟蹤路徑曲率對該參數的選取影響較大,模糊控制被用來自適應調整前視距離,提高其跟蹤精度[10-11]。模型預測控制(MPC)是基于預測模型、滾動優化和反饋矯正的控制策略,具有較強的魯棒性,且在優化求解過程中可考慮控制量、控制增量等約束條件[12-14]。
考慮到拖拉機作業過程中,控制信號會由于信號通訊、執行器等造成一定的延遲,使得當前時刻產生的控制信號在未來時刻被執行,而MPC是一種預測控制,可有效補償延遲問題。本文采用了基于MPC的路徑跟蹤控制方法。文獻[15]指出了MPC中預測時域對跟蹤效果影響較大,當速度和跟蹤路徑發生變化時,應對其適當調整。文獻[16]設計了自適應MPC控制器,根據參考軌跡曲率的變化自動調節預測時域,但并未考慮速度變化時對預測時域的調整。本文針對拖拉機作業速度和路徑曲率變化時,基于固定預測時域MPC控制器的跟蹤效果可能變差的問題,提出一種自適應MPC控制器。當作業場景變化時,利用改進的粒子群優化(PSO)算法求取最優的預測時域,保證路徑跟蹤控制器的魯棒性和精確性。
由于拖拉機的作業速度低,模型預測控制通常可采用結構簡單、易于建模的運動學模型。假設拖拉機左右對稱,四輪車模型可簡化為二輪模型,拖拉機模型示意圖如圖1所示。在導航坐標系下,得到拖拉機的運動學模型為

圖1 拖拉機模型示意圖

(1)
式中:x,y為拖拉機的質點在導航坐標系下的坐標;φ為航向角;v為縱向速度;θ為車輪轉向角;L為前后輪軸距。
路徑跟蹤控制器中采用的誤差量為系統狀態變量,基于式(1)的線性化和離散化處理,可得該系統的狀態空間方程為

(2)

控制輸入會由于信號通訊、執行器等造成一定的延遲,則狀態空間方程表示為
(3)
式中kd為輸入延遲時間,可通過試驗測量獲得。
考慮到本文是為了驗證拖拉機在不同作業速度和跟蹤路徑時,所提出的基于自適應預測時域的MPC效果,忽略了輸入延遲,采用基于式(2)的狀態空間模型。
MPC是根據當前時刻傳感器測量的拖拉機狀態信息與期望值的偏差,并通過優化求解得到控制輸入來改變拖拉機的運行狀態,進而實現路徑跟蹤效果。MPC模型的初始化參數中的預測時域P對其解算結果的影響較大,當拖拉機的速度或跟蹤軌跡有較大變化時,路徑跟蹤效果會受到影響,故本文采用了改進的粒子群優化算法對預測時域P進行適當調整。基于自適應MPC的路徑跟蹤控制算法如圖2所示。

圖2 基于自適應MPC的路徑跟蹤控制算法
MPC是結合拖拉機運動學模型、當前狀態預測之后的優化控制值,可在一定程度上補償控制器的延遲,且根據需要增加一定的約束條件。


(4)

假設預測時域為P,控制時域為C,則Δuk+C-1=Δuk+C=…=Δuk+P-1。根據上式可得時刻k的預測輸出為
(5)
令時刻k的控制序列為ΔUk,輸出序列為Zk+1,則:

模型預測控制的評價函數為
(7)

MPC的約束條件設置為

(8)
式中:umin和umax為控制量約束值;Δumin和Δumax為控制增量約束值。
通過優化求解,可得控制時域內時刻k的控制輸入增量ΔUk,則時刻k的控制輸入量為
uk=uk-1+Δuk。
(9)
拖拉機作業過程中速度和跟蹤路徑是變化的,若模型預測控制中的參數設定為固定值,路徑跟蹤效果會受到一定的影響。為了提高路徑跟蹤的自適應性,采用改進粒子群優化算法,根據工作場景對預測時域進行優化選取。
PSO算法中粒子的速度和位置更新軌跡為[17]
(10)
式中:Vj為粒子j的速度;Xj為粒子j的位置;w為慣性權重;c1、c2是加速度常數;r1、r2是隨機數;Xj,p為該粒子經過的最優位置;Xj,g是整個種群中粒子經過的最優位置;m是群體規模。
參數w反映了對全局和局部搜索的權重,對于PSO算法的尋優過程尤為重要。為了提高尋優性能,對傳統的粒子群優化算法進行改進,將w設定為分段函數,第k次迭代的慣性權重值wk為
(11)
式中:Iλ為轉折迭代次數;Imax為最大迭代次數;wλ是轉折權重值;wmax是最大慣性權重值;wmin為最小慣性權重值。
為了驗證本文算法有效性,針對拖拉機不同的作業速度和跟蹤路徑,分別對基于固定預測時域和自適應預測時域的MPC控制器進行仿真實驗和對比分析。選用東方紅-X1304拖拉機為仿真實驗對象,其前后輪軸距L為2.688 5 m。MPC控制器的相應參數設置是:采樣周期為T=0.05 s,控制量約束值分別為umin=-0.523 6 rad、umax=0.523 6 rad,控制增量約束值分別為Δumin=-0.087 3 rad、Δumax=0.087 3 rad,控制時域為C=5。粒子群優化算法的相應參數是:加速度常數為c1=c2=1.494 55,最大慣性權重值為wmax=0.9,最小慣性權重值為wmin=0.4,轉折慣性權重值為wλ=0.6,轉折迭代次數為Iλ=5,種群規模m=10,最大迭代次數Imax=50。
直線作業是拖拉機較普遍的作業方式,對作業速度v分別為1、2 m/s和變速v=1.5+0.5sin(2πt/30),采用基于不同固定預測時域值和自適應預測值的MPC控制器進行仿真實驗。初始位置偏差設定為3 m,初始航向偏差為π/3 rad。圖3給出了跟蹤直線路徑時,不同作業速度下的跟蹤路徑、航向角跟蹤誤差和控制輸入結果圖。從圖3可以看出,同一預測時域在速度不同時,預測效果不同,如預測時域P為10時,若速度為1 m/s效果較差,若速度為 2 m/s效果較好;控制輸入都在設定的約束條件內,且基于自適應預測時域的MPC控制器的控制輸入波動小,收斂速度快;基于自適應預測時域的MPC控制器在三種速度情況下,跟蹤效果都優于基于三個固定預測時域的MPC控制器。
為了驗證跟蹤不同路徑的控制器效果,對曲線路徑進行仿真實驗驗證。曲線跟蹤路徑半徑設定為20 m的圓弧,初始位置誤差為3 m,初始航向偏差為0 rad。作業速度v分別為1、2 m/s和變速v=1.5+0.5sin(2πt/30),跟蹤路徑、航向角跟蹤誤差和控制輸入結果如圖4所示。從圖4可以看出,拖拉機可以有效跟蹤曲線路徑;對于基于固定預測時域的MPC控制器,在速度不同時,最優預測時域不同,如速度為1 m/s時,預測時域為30要優于其他兩個固定預測時域值,而速度為2 m/s時,預測時域為20的控制器效果較好;三種速度下,基于自適應預測時域的MPC控制器的跟蹤效果都優于基于三種固定預測時域的MPC控制器。

(a) v=1 m/s
為了進一步分析算法的有效性,對跟蹤誤差均值和收斂時間進行了統計分析,其結果分別見表1和表2。其中,跟蹤誤差用行駛軌跡上的點到離期望路徑最近點的距離評價,收斂時間用跟蹤誤差收斂到0.05 m以內的時間統計。表1表明,在基于固定預測時域的情況下,速度越小,預測時域的值設定為較大值時跟蹤誤差越小,而速度變大時,應適當減小預測時域;不同作業速度和跟蹤路徑的工作場景中,基于自適應預測時域值的跟蹤誤差相對于其他固定時域的降低了2%~44%,跟蹤精度更高。表2表明,同一預測時域在速度或跟蹤路徑不同時,收斂效果不同,如預測時域P為20,跟蹤直線路徑時,若速度為1 m/s收斂速度要優于預測時域為30和10,若速度為 2 m/s收斂速度最慢;跟蹤曲線路徑時,若速度為1 m/s收斂速度居中。不同作業速度和跟蹤路徑時,基于自適應預測時域值的收斂時間相對于三種固定時域下的收斂時間縮短了2%~71%,收斂速度最快。

表1 跟蹤誤差均值統計

表2 收斂時間統計
針對基于固定預測時域的MPC控制器,為提高控制器的自適應性,本文結合工作場景和PSO算法對預測時域進行適當調整,并采用分段函數的慣性權重對PSO算法進行了改進。以東方紅X-1304拖拉機為仿真對象,分別對不同速度和路徑情況進行了實驗驗證和對比分析。實驗結果表明,相比于基于固定參數的MPC控制器,自適應MPC控制器在不同工作場景下都具有較好的路徑跟蹤效果。該路徑跟蹤技術可提高拖拉機自主化作業的環境適應性,為后續試驗提供研究基礎。