楊亮亮,胡 建
(浙江理工大學 機械與自動控制學院,浙江 杭州 310018)
迭代學習控制適用于執行重復任務的控制系統,不需要被控對象的精確數學模型,利用信息改善當前的控制輸入信號,就可以實現有限區間內的完全跟蹤[1-2]。文獻[3-4]對迭代初態與期望初態存在固定偏移情形下的迭代學習控制問題進行了討論,提出帶有反饋輔助項的PD型迭代學習控制算法,可實現系統輸出對期望軌跡的漸近跟蹤。
李巖等[5]將傳統的迭代學習控制時域和頻域分析方法擴展到一類分數階非線性系統,提出了一類新的分數階迭代學習控制框架并簡化了收斂條件,且證明了常增益情況下兩類分數階迭代學習控制收斂條件的等價性問題;文獻[6-7]提出了基于當前誤差和前次運行誤差信息的P-D型開閉環迭代學習控制律,采用了λ范數和一系列不等式技術,通過建立精確數學模型給出了該學習律收斂的充分條件,證明了它的收斂性;LUO Z等[8]采用P型迭代學習控制率,對算法收斂性和收斂速度進行了分析,并通過實驗對其進行了驗證;童少偉[9]以線性系統為模型,以系統響應與期望響應的差值為反饋,以二次型性能泛函為目標函數,通過迭代學習修正主動控制器控制信號,并給出了該方法收斂的充分條件,但是缺少對算法收斂速度的分析與研究。
本文將在上述文獻的基礎上,基于最優控制理論以誤差最小和驅動能量最小為性能目標函數,通過引入一個加權系數矩陣,以提高迭代學習算法的收斂速度。
本文將迭代學習控制算法運用到直線伺服系統進行分析,假設直線電機在每次迭代時執行時間長度t∈[0,T],采樣周期為Ts,輸入理想軌跡指令為rset,將信號進行離散化處理,取N=T/Ts,如第k次輸出信號為yk=[yk(0),yk(1),…,yk(N-1)]T。其中,yk(j)—第k次迭代時,輸出信號yk的第j+1個元素;yk—時域離散化向量。不考慮非線性因素的影響,則直線電機運動控制系統的時不變離散狀態空間表達式為:

(1)
則第k次迭代時輸入輸出關系為:
(2)
式中:H—脈沖傳遞函數矩陣,H∈RN×N;uk—有限離散控制輸入指令,uk=[u(0),…,u(N-1)]T;yk—有限離散系統輸出信號,yk=[y(0),…,y(N-1)]T,k代表迭代次數。
若控制系統誤差為:
ek=rset-yk
(3)
采用如下迭代學習算法:
uk+1(t)=Q[uk(t)+Lek(t)]
(4)
式中:Q∈n×n,L∈n×n,uk∈n,ek∈n。
基于式(4)迭代學習控制結構如圖1所示。

圖1 迭代學習控制框圖
假設矩陣A∈n×n,則矩陣譜半徑定義為:
(5)
式中:ζi(A)—矩陣A的第i個特征值。
矩陣A最大奇異值定義為:
(6)
由式(3,4)可得出:
uk+1=Q(I-LH)uk+QLrset
(7)
根據線性系統理論及迭代學習控制系統的穩定性及漸進收斂條件可知,圖1所示的迭代學習控制結構的穩定性條件為:
ρ(Q(I-LH))<1
(8)
漸近收斂條件為:

(9)
根據矩陣論知識可知,結合式(8,9)可得出:

(10)
其在頻域的收斂性條件也可表達為:
|1-L(ejω)H(ejω)|<|Q-1(ejω)| ?ω
(11)
此時迭代學習控制系統是穩定且漸進收斂的。
采用前饋及反饋二自由度控制結構如圖2所示。

圖2 二自由度控制系統結構圖C(s)—反饋控制器保證系統閉環穩定;G(s)—被控對象;rset(t)—理想軌跡;e(t)—軌跡跟蹤誤差;ub(t)—反饋控制器輸出指令;uf(t)—前饋控制指令;u(t)—被控制對象G(s)指令信號;ω(t)—擾動信號;y(t)—系統輸出
本研究在反饋控制器設計穩定的基礎上加入迭代學習控制算法,對前饋控制信號進行迭代修正,采用二自由度控制策略及迭代學習控制雙回路控制系統結構如圖3所示。

圖3 迭代學習控制系統結構圖
根據最優控制理論設定迭代學習控制算法的性能目標函數為:
(12)
式中:We,Wu—兩個半正定加權矩陣。

(13)
經推導求得:
-HTWeek+1+Wuuk+1=0
(14)
將式(3)代入式(14),可得:
uk+1=(Wu+HTWeH)-1(HTWeH)×
(uk+(HTWeH)-1HTWeek)
(15)
結合式(4)和式(15)可得出Q,L的表達式如下所示:
(16)
令We=I,Wu=ρ·I(ρ>0),則式(16)在頻域的表達式為:
(17)
式中:P(z)—輸入為uf(t),輸出為y(t)的系統對象模型(P(z)=G(z)/(1+C(z)G(z)))。
結合式(3)和式(14),經推導可得出:
(18)
式中:E0—未迭代前的軌跡誤差。
由式(18)可知,ρ的值會對迭代學習算法收斂誤差有所影響,隨著ρ的增加,E∞的值逐漸增加。
本研究采用Matlab/simulink對上述迭代學習控制算法進行仿真。仿真時理想軌跡采用三階S型點到點軌跡規劃進行軌跡規劃,生成位移軌跡為加速度連續變化三階位移曲線。規劃參數分別為:s=0.05 m,vmax=0.2 m/s,amax=10 m/s2,jmax=3 000 m/s3驗證算法性能。
軌跡規劃曲線如圖4所示。

圖4 仿真所用三階S型點到點軌跡
仿真對象采用通過對直線電機平臺辨識的模型,如下式所示:
(19)
反饋控制器采用PID控制器構成閉環系統,其參數分別為:Kp=453 677,Ki=56 807 678,Kd=0,We=I,采用圖3所示的迭代學習控制結構進行仿真,此處不考慮外界干擾對系統的影響(即默認ω(t)=0)。
加權矩陣系數ρ對迭代學習控制算法收斂速度的影響曲線如圖5所示。

圖5 ρ對收斂速度的影響曲線
從圖5中可以看到:當ρ=0.001,收斂速度最快,收斂誤差二范數為0.011,隨著ρ的增加迭代學習算法收斂速度逐漸減小,同時迭代終值收斂逐漸增大。
ρ對迭代學習控制算法穩定性的影響曲線如圖6所示。

圖6 ρ對迭代學習穩定性的影響曲線
從圖6中可以看到:當ρ=0.001時,|Q(1-LH)|幅值最大,其對應的穩定性范圍越小,隨著ρ的增加,算法的穩定性范圍越大,即算法魯棒性越強。綜上分析可知,當ρ=0.000 1時,對收斂速度的影響與ρ=0.001時的結果相似,同時為了保證迭代學習算法的魯棒性,因此,ρ的選擇是算法魯棒性與收斂速度之間的一種折衷,仿真時參數選擇為We=I,Wu=10-3·I。
迭代前后誤差曲線對比圖如圖7所示。

圖7 迭代前后誤差曲線對比圖
圖7中實線為未采用迭代學習控制之前的軌跡誤差曲線,點線、點畫線分別為第一次迭代、第三次迭代后的軌跡誤差曲線(圖中虛線為按一定比例縮小的加速度曲線)。從圖7中可以看出:沒有進行迭代時,軌跡誤差數量級為10-3m,第一次、三次迭代之后誤差數量級分別為10-4m和10-6m。
誤差的目標函數曲線隨迭代次數的變化曲線如圖8所示。

圖8 迭代目標函數曲線
從圖8中可以看出第二次迭代之后目標函數基本不變,與圖7的結論一致,收斂效果顯著。
本文的試驗平臺為兩個直線電動機構成的X-Y運動平臺,如圖9所示。

圖9 直線電機實驗平臺
兩個直線電動機均采用Baldor公司的LMCF02C-HCO,電動機的連續推力為58 N,峰值推力為173 N,直線電動機的運動位置由GSI公司分辨率為0.5 μm的光柵尺測量,讀數頭型號為MII1600-40。伺服驅動器為Baldor公司的FMH2A03TR-EN23,采用電流控制方式。由于位于上層直線電動機具有相對較低的慣量,為了驗證高速高精性能,實際試驗時采用下層直線電動機鎖死,只對上層直線電動機進行試驗。
實際直線伺服平臺控制器與仿真結構相同,實驗所采用和仿真相同三階S型點到點軌跡。運行時間為0.5 s,伺服周期為0.000 5 s,迭代次數為10次,實驗采用和仿真相同控制結構。
本文采用Matlab與C混合編程模式,利用白噪聲獲得閉環對象的輸入輸出響應,再通過Matlab系統辨識工具箱進行濾波之后經過辨識獲得P(z)的ARX模型[10]:
A(z)y(t)=B(z)u(t)+e(t)
(20)
其中,
(21)
反饋控制器采用PID控制器,其參數如表1所示。

表1 控制器參數
此時令We=I,則ρ對迭代學習收斂速度的影響曲線如圖10所示。

圖10 ρ對收斂速度的影響曲線
圖10為加權矩陣系數ρ對迭代學習控制算法收斂速度的影響曲線,從圖10中可以看到:當ρ=0.001時,收斂速度最快,收斂誤差二范數約為0.001,隨著ρ的增加迭代學習算法收斂速度逐漸減小,同時迭代收斂誤差逐漸增大。
ρ對迭代學習控制算法穩定性的影響曲線如圖11所示。

圖11 ρ對迭代學習穩定性的影響曲線
從圖11中可以看到:當ρ=0.001時,|Q(1-LH)|幅值最大,其對應的穩定性范圍越小,隨著ρ的增加,算法的穩定性范圍越大,即算法魯棒性越強。
迭代前后誤差曲線對比圖如圖12所示。

圖12 迭代前后誤差曲線對比圖
圖12中實線為未進行迭代之前的軌跡誤差曲線,點畫線、虛線分別為第三次迭代、第五次迭代后的軌跡誤差曲線(圖中點線為按一定比例縮小的加速度曲線),在進行迭代5次之后,勻速期(即:0.05 s—0.27 s期間)誤差得到了明顯的收斂。
迭代目標函數曲線圖如圖13所示。

圖13 迭代目標函數曲線圖
從圖13的目標函數曲線可以看出,誤差在進行5次迭代之后基本上保持不變的趨勢。由于實際直線電機平臺存在一些非周期性擾動、辨識誤差以及摩擦力等非線性因素的影響,誤差沒有完全收斂到零,但是通過實驗充分驗證了將本文提出的迭代學習控制算法運用到直線電機中,并且通過引入加權矩陣系數提高了算法的收斂速度。
基于最優控制理論,本文對迭代學習控制的收斂性進行了分析,引入加權矩陣系數,增強了算法的魯棒性和收斂速度,并通過仿真和實際電動機平臺試驗,驗證了本文算法的正確性;
實驗結果表明:本文算法針對勻速段的收斂效果顯著,提高了直線電機的運動精度。但是加減速段的收斂效果并不理想,經過對其軌跡誤差頻譜進行分析發現,直線電機在加減速階段存在一個36 Hz左右的擾動信號,因此,關于加減速段的收斂效果有待進一步研究。
參考文獻(References):
[1] 馬 航,楊俊友,袁 琳.迭代學習控制研究現狀與趨勢[J].控制工程,2009,16(3):286-290.
[2] NORRL?F M. Iterative learning control-analysis, design, and experiments[D]. Link?ping: Department of Electrical Engineering, Link?pings universitet,2000.
[3] MA F, LI C. Open-closed-loop PID-type iterative learning control for linear systems with initial state error[J].JournalofVibrationandControl,2011,17(12):1791-1797.
[4] 孫明軒,畢宏博,周國良,等.反饋輔助PD型迭代學習控制:初值問題及修正策略[J].自動化學報,2015,41(1):157-164.
[5] 李 巖,陳陽泉,安孝晟.分數階迭代學習控制的收斂性分析[J].控制理論與應用,2012,29(8):1031-1037.
[6] 劉長良,賈萬根.一般非線性離散系統P-D型迭代學習收斂性研究[J].電力科學與工程,2012,28(6):69-73.
[7] 葉 騰,李傳東.一類非線性時滯系統的迭代學習控制設計[J].機電工程,2010,27(2):68-70.
[8] LUO Z, WEI W, WANG J R. Robust convergence analysis of iterative learning control for impulsive Riemann-Liouville fractional-order systems[J].AdvancesinDifferenceEquations,2016(1):256.
[9] 童少偉.迭代學習型瞬時最優控制及其收斂性分析[J].力學與實踐,2015,37(6):698-703.
[10] 倪博溢,蕭德云.MATLAB環境下的系統辨識仿真工具箱[J].系統仿真學報,2006,18(6):1493-1496.