□姜勇
北京礦冶研究總院 北京 100160
迭代學習控制采用“在重復運動過程中學習”的控制策略,具有系統記憶功能和經驗修正功能,適用于具有重復運行特性的被控對象[1-3]。智能鏟運機在井下巷道的工作區域內,進行鏟裝、運輸、傾倒等動作,工作流程比較固定,尤其是運輸過程,行駛路徑相對固定且重復進行,恰好與迭代學習控制理論中被控對象的特性吻合。為了提高運動軌跡的控制精度,筆者運用迭代學習控制理論,提出一種應用于智能鏟運機運動軌跡控制的新算法,通過對迭代過程中的控制參數進行學習,可實現對運動軌跡的精確控制。
迭代學習控制是通過對被控對象進行控制的嘗試,利用輸出軌跡與給定軌跡之間的偏差作為反饋量來修正前期不理想的控制信號,產生新的控制信號,從而使系統的跟蹤控制性能得到提高[4-6]。被控系統的動態模型如下[7]:

式中:x?Rn×1、y?Rm×1、u?Rr×1分別為被控系統的狀態向量、輸出向量以及控制向量;f、g為具有相應維數的函數,結構和參數均未知。
要求系統在時間域 t∈[0,T]內的輸出 y(t)盡可能地跟蹤期望輸出 yr(t),假定期望控制向量 ur(t)是存在的,即:在給定初始狀態值 x(0)下,ur(t)是式(1)當 y(t)=yr(t)時的解。迭代學習控制的目標就是通過多次重復的運行,在一定的學習律下使 u(t)→ur(t),y(t)→yr(t)。 在第 k 次運行式(1)表示為:

跟蹤誤差為:

式中:下標k表示第k次運行,假設每次運行過程中期望輸出 yr(t)一直保持不變。
迭代學習控制可以分為開環迭代學習和閉環迭代學習兩種,學習律有多種,筆者采用PID型學習律[8]。
開環迭代學習控制算法如式(4)所示:第k+1次的控制量等于第k次的控制量加上第k次輸出誤差的比例、積分和微分項的線性組合量,即:

式中:KP、KI、KD分別為比例因數、積分因數和微分因數。開環迭代學習控制算法的基本結構如圖1所示。

▲圖1 開環迭代學習控制算法結構框圖
一般的開環迭代學習控制算法可以寫成:

式中:L為線性或非線性算子。
閉環迭代學習控制算法如式(6)所示,取第k+1次運行過程的誤差作為反饋修正項,即:

閉環迭代學習控制算法的基本結構如圖2所示。

▲圖2 閉環迭代學習控制算法結構框圖
一般的閉環迭代學習控制算法可以寫成:

將開環和閉環控制算法分別離散化處理,式(1)變為:

在第k次運行時可以表示為:

輸出誤差為:

離散化的開環和閉環迭代學習控制算法為:

離散化的開環和閉環一般的學習控制算法形式為:

開環迭代學習控制算法采用的是離線計算方法,因此對系統的計算要求并不高,它采用的是系統上一次的輸出誤差,因而控制效果沒有閉環迭代控制算法好。閉環迭代學習控制需要在線計算,因而對系統要求較高。
以智能鏟運機為研究對象,建立鏟運機的運動軌跡模型如圖3所示。圖中,以井下巷道的路面作為坐標平面建立正交坐標系,鏟運機定位參考點在此坐標平面上的投影點為P,該點的速度方向 (即軌跡切線方向)就是行駛方向,該方向與X軸正方向形成的夾角定義為航向角β,以X軸逆時針旋轉時形成的航向角為正,反之為負。圖中A為目標路徑(即期望軌跡),B為實際運行軌跡。P點在目標路徑上的垂直投影點為Pd,將該點的速度方向與X軸正方向之間所形成的夾角定義為目標路徑的航向角βd。將目標路徑上的航向角βd與實際運行軌跡上的航向角β之間的差值定義為航向角偏差Δβ,這一參數反映了鏟運機在運動過程中,其運動方向與目標路徑預定的行駛方向之間的偏差。鏟運機實際運行軌跡上P點與目標路徑上Pd點的距離定義為橫向位置偏差δ,以P點在目標路徑曲線左側時的橫向位置偏差為正,反之為負。該參數反映了鏟運機在行駛過程中巷道內的橫向定位情況 (即軌跡偏離情況)。鏟運機的鉸接轉向角為α,即鏟運機前后車體之間的相對轉角,以使鏟運機順時針方向轉動的角度為正,反之為負。轉向角和轉向角變化速率決定了轉向半徑的大小和實際運動行駛軌跡,鏟運機在行駛過程中通過調整鉸接轉向角的大小來實現對運動軌跡的控制。以航向角偏差Δβ和橫向位置偏差δ來表示定位參考點P點的位置坐標,即P(Δβ,δ)。P點的行駛車速為Vp,與實際運行軌跡曲線B相切,而目標路徑上Pd點的投影車速為Vd,與軌跡曲線A相切。
行駛過程中,通過控制行駛速度、轉向角度以及轉向角變化速率來實現對鏟運機的運動軌跡控制。 因此,決定鏟運機運動軌跡的因素主要有行駛速度、轉向角度以及轉向角變化速率這3個變量。
利用開環迭代學習控制算法的基本原理來實現自主行駛過程中的運動軌跡控制,選取轉向角度α和行駛速度Vp兩個量作為輸入控制量,同時選取航向角偏差β和運動軌跡偏差e這兩個參數作為迭代學習的反饋修正量,建立開環迭代學習運動軌跡控制模型。開環迭代學習運動軌跡控制模型結構框圖如圖4所示。

▲圖3 智能鏟運機運動軌跡模型
開環迭代學習控制器由4個子控制器組成,分別介紹如下。
(1)開環學習子控制器(轉角-軌跡偏差)。利用行駛過程中的運動軌跡偏差作為反饋修正量,實現對轉向角度控制量的迭代學習控制。
(2)開環學習子控制器(轉角-航向角偏差)。利用行駛過程中的航向角偏差作為反饋修正量,實現對轉向角度控制量的迭代學習控制。
(3)開環學習子控制器(速度-軌跡偏差)。利用行駛過程中的運動軌跡偏差作為反饋修正量,實現對行駛速度控制量的迭代學習控制。
(4)開環學習子控制器(速度-航向角偏差)。利用行駛過程中的航向角偏差作為反饋修正量,實現對行駛速度控制量的迭代學習控制。
開環迭代學習運動軌跡控制模型設計如下:

式中:KP1、KI1、KD1分別為開環學習子控制器 (轉角-航向角偏差)的參數;KP2、KI2、KD2分別為開環學習子控制器(轉角-軌跡偏差)的參數;KP3、KI3、KD3分別為開環學習子控制器(速度-航向角偏差)的參數;KP4、KI4、KD4分別為開環學習子控制器(速度-軌跡偏差)的參數;uαk+1(t)、uvk+1(t)分別為第 k+1 次迭代學習轉向角度和行駛速度的控制量;uαk(t)、uvk(t)分別為第 k 次迭代學習轉向角度和行駛速度的控制量。
考慮到計算機控制系統采用的是數字控制,因此對其進行離散化處理,離散化后的控制模型為:
閉環迭代學習控制算法同樣選取轉向角度α和行駛速度Vp作為輸入控制量,同時選取航向角偏差β和運動軌跡偏差e這兩個參數作為迭代學習的反饋修正量,建立閉環迭代學習運動軌跡控制模型。閉環迭代學習運動軌跡控制模型結構框圖如圖5所示。其中閉環學習控制器由4個子控制器組成,分別介紹如下。
(1)閉環學習子控制器(轉角-軌跡偏差)。利用行駛過程中的運動軌跡偏差作為反饋修正量,實現對轉向角度控制量的迭代學習控制。
(2)閉環學習子控制器(轉角-航向角偏差)。利用行駛過程中的航向角偏差作為反饋修正量,實現對轉向角度控制量的迭代學習控制。
(3)閉環學習子控制器(速度-軌跡偏差)。利用行駛過程中的運動軌跡偏差作為反饋修正量,實現對行駛速度控制量的迭代學習控制。
(4)閉環學習子控制器(速度-航向角偏差)。利用行駛過程中的航向角偏差作為反饋修正量,實現對行駛速度控制量的迭代學習控制。
閉環迭代學習運動軌跡控制模型設計如下:


▲圖4 開環迭代學習運動軌跡控制模型結構框圖

▲圖5 閉環迭代學習運動軌跡控制模型結構框圖

式中:KP1、KI、KD1分別為閉環學習子控制器 (轉角-航向角偏差)的參數;KP2、KI2、KD2分別為閉環學習子控制器(轉角-軌跡偏差)的參數;KP3、KI3、KD3分別為閉環學習子控制器(速度-航向角偏差)的參數;KP4、KI4、KD4分別為閉環學習子控制器 (速度-軌跡偏差)的參數;uαk+1分別為第k+1次迭代學習轉向角度和行駛速度的控制量;uαk(t)、uvk(t)分別為第 k 次迭代學習轉向角度和行駛速度的控制量。
同樣對其進行離散化處理,得到離散化的控制模型為:


基于迭代學習控制的基本原理,提出一種控制智能鏟運機運動軌跡的開環迭代學習控制算法和閉環迭代學習控制算法。智能鏟運機在運輸路徑上重復運行,利用其每次迭代運行過程中的航向角偏差和軌跡偏差作為反饋修正量,不斷地修正其在期望軌跡上的軌跡偏差,從而保證鏟運機盡可能準確地跟蹤期望軌跡,可實現對其運動軌跡的精確控制。
[1]Arimoto S,Kawamura S,Miyazaki F.Bettering Operation of Robots by Learning [J].Journal of Robotic Systems,1984,1(2):123-140.
[2]Wang H B,Wang Y.Open-closed Loop ILC Corrected with Angle Relationship of Output Vectors for Tracking Control of Manipulator [J].Acta Automatica Sinica,2010,36 (12):1758-1765.
[3]李世平,孫明軒,朱勝.初態學習下非仿射非線性系統的迭代學習控制[J].浙江工業大學學報,2010,9(3):268-272.
[4]張航,羅大庸,黃浩江,等.機器人模糊迭代學習控制及其仿真研究[J].自動化技術與應用,2002(2):3-5,32.
[5]詹煒.迭代學習控制的指數變增益加速學習算法及其在機器人控制上的應用[J].微計算機應用,2007,28(7):678-681.
[6]閻世梁,張華,王銀鈴,等.極坐標下基于迭代學習的移動機器人軌跡跟蹤控制 [J]. 計算機應用,2010,30 (8):2017-2020.
[7]林輝,王林.迭代學習控制理論[M].西安:西北工業大學出版社,1998.
[8]謝勝利,田森平,謝振東.迭代學習控制的理論與應用[M].北京:科學出版社,2005.