嚴求真 孫明軒 蔡建平
迭代學習控制的參考信號初始修正方法
嚴求真1孫明軒2蔡建平3
針對一類非參數(shù)不確定系統(tǒng),提出狀態(tài)受限迭代學習控制的參考信號初始修正方法,以解決任意初態(tài)下的狀態(tài)受限軌跡跟蹤問題.通過構造修正參考信號,利用一種新型的障礙Lyapunov函數(shù)設計迭代學習控制系統(tǒng),采用魯棒方法與學習方法相結(jié)合的策略處理非參數(shù)不確定性,經(jīng)過足夠多次迭代后,可實現(xiàn)系統(tǒng)狀態(tài)在整個作業(yè)區(qū)間上對修正參考信號的零誤差跟蹤,以及在預設作業(yè)區(qū)間上對參考信號的零誤差跟蹤.同時,將濾波誤差約束于預設的界內(nèi),并由此實現(xiàn)對系統(tǒng)狀態(tài)在各次迭代運行過程中的約束.仿真結(jié)果表明了本文所提控制方法的有效性.
迭代學習控制,初值問題,非參數(shù)不確定性,障礙Lyapunov函數(shù)
在工業(yè)實際中,存在著大量在有限區(qū)間上重復運行的系統(tǒng)或設備,例如機械臂、磁盤驅(qū)動器和逆變電路等.問世于上世紀80年代的迭代學習控制技術,適合為這類重復作業(yè)對象設計軌跡跟蹤控制器.采用迭代學習控制技術設計控制系統(tǒng)時,不需對受控對象的模型精確已知,其策略是利用跟蹤誤差不斷修正控制輸入,經(jīng)過有限次迭代,使得系統(tǒng)狀態(tài)或系統(tǒng)輸出以預設精度跟蹤期望軌跡[1].通過三十余年的發(fā)展,學習控制的理論逐漸豐富與完善,并應用于諸多工業(yè)控制場合[2?6].
基于Lyapunov方法設計學習控制系統(tǒng)是當前迭代學習控制領域的熱點之一[2?3].采用學習方法,可以對控制系統(tǒng)中的各類參數(shù)不確定性進行估計.文獻[7]利用微分學習方法處理常參數(shù)不確定性,文獻[3]在構造Lyapunov泛函的基礎上,設計差分學習律估計時變未知參數(shù).文獻[8]采用由微分與差分相混合的學習方式估計未知常參數(shù).非線性參數(shù)不確定性[9]與參數(shù)隨迭代次數(shù)變化[10]問題也在人們的考慮之列.到目前為止,研究非參數(shù)不確定系統(tǒng)學習控制方法的文獻數(shù)量還較少.文獻[11]采用魯棒方法處理非參數(shù)不確定性,即利用界函數(shù)設計反饋項對其予以補償.文獻[12?14]采用魯棒方法與學習方法相結(jié)合的策略處理非參數(shù)不確定性.此外,也可采用傅立葉級數(shù)等逼近工具處理非參數(shù)不確定性[15].
常規(guī)迭代學習控制算法常假設迭代誤差的初值為零,這樣,經(jīng)過足夠多次迭代后,可以實現(xiàn)整個作業(yè)區(qū)間上的零誤差軌跡跟蹤.但在現(xiàn)實中,受復位條件所限,上述假設很難滿足.為拓寬迭代學習控制技術在實際中的應用范圍,有必要研究可在任意初始誤差情形下實施的學習控制算法.在利用Lyapunov方法為連續(xù)系統(tǒng)設計控制器時,常見的初值問題解決方案有時變邊界層、誤差跟蹤和初始修正等.文獻[16]給出基于時變邊界層的模糊學習控制方法,閉環(huán)系統(tǒng)的濾波誤差可在足夠多次迭代后,收斂至與迭代初值相關的時變死區(qū).文獻[17]研究非線性系統(tǒng)的誤差跟蹤學習方法,并將其與參考信號初始修正方法進行對比.早在上世紀90年代,人們在設計壓縮映射學習控制系統(tǒng)時,就采用初始修正方法解決學習控制的初值問題[18].近年來,初始修正方法重新受到人們的關注[17,19].文獻[20]考慮MIMO參數(shù)不確定系統(tǒng)的參考信號初始修正問題.文獻[21?22]針對具有任意初始誤差的非參數(shù)不確定系統(tǒng),給出的自適應學習控制算法適用于固定初始誤差情形.
最近,構造障礙Lyapunov函數(shù)設計狀態(tài)/輸出受限學習控制系統(tǒng),引起了人們的關注.采用這種方法設計控制器,可以對迭代學習過程中的狀態(tài)/輸出進行約束,從而增強系統(tǒng)的魯棒性.文獻[23?24]分別考慮輸出受限情形和狀態(tài)受限情形下的重復學習控制算法.文獻[25]給出一種形式簡單的二次分式型障礙Lyapunov函數(shù)構造方案,在迭代學習過程中實現(xiàn)對系統(tǒng)狀態(tài)的整體約束.文獻[26]研究迭代誤差初值任意情形下的狀態(tài)受限誤差跟蹤學習控制方案,同時解決初值問題和狀態(tài)約束問題.文獻[27]利用時變神經(jīng)網(wǎng)絡估計不確定性,結(jié)合時變邊界層方法設計狀態(tài)受限學習控制系統(tǒng).
本文研究非參數(shù)不確定學習控制系統(tǒng)的初值問題及狀態(tài)受限問題,在利用參考信號初始修正方法解決初值問題的同時,采用障礙Lyapunov函數(shù)設計學習控制系統(tǒng),對各次迭代學習過程中的系統(tǒng)狀態(tài)予以約束.為了提高利用障礙Lyapunov函數(shù)設計學習控制器時的便捷性,本文構造了一種新型的障礙Lyapunov函數(shù),改進了已有的同類設計方案.經(jīng)過足夠多次迭代后,藉由系統(tǒng)狀態(tài)對修正參考信號在整個作業(yè)區(qū)間的完全跟蹤,獲得系統(tǒng)狀態(tài)對參考信號在預設部分作業(yè)區(qū)間上的完全跟蹤.在各次迭代過程中,閉環(huán)系統(tǒng)中的濾波誤差被約束于預設的界內(nèi),由此實現(xiàn)對系統(tǒng)狀態(tài)在各次迭代運行過程中的約束.文中算法采用魯棒學習控制方法處理非參數(shù)不確定性,并根據(jù)學習方法估計魯棒項的增益系數(shù),克服了以往同類算法中在某些場合應用時,可能出現(xiàn)的增益過大之不足.
考慮在有限時間[0,T]上迭代運行的非參數(shù)不確定系統(tǒng):


不失一般性[23],系統(tǒng)(1)中的不確定性滿足下述假設:假設 1.對于 ? ξ1∈ Rn,? ξ2∈ Rn,函數(shù) f(·,·) 和 g(·,·)分別滿足

與

其中,αf(·,·,·) 和 αg(·,·,·) 為非負連續(xù)函數(shù).
本文的控制目標是設計uk,實現(xiàn)對在 [tδ,T]上的完全跟蹤(0<tδ<T).為了實現(xiàn)該任務,下文構造修正參考信號.,為一常數(shù),但具體大小不需已知.



此處,

本文中,xn+1,k(t)表示˙xn,k(t),xn+1,k(0)=˙xn,k(0).上文所構造的修正參考信號,在t=tδ處的導數(shù)是連續(xù)的.可以看出,上文給出的構造方法比較簡便,易于實施.
在t∈[0,T]上,定義

選擇合適的正實數(shù) ci(i=1,2,···,n?1),使得多項式Δ(λ)= λn?1+cn?1λn?2+···+c2λ +c1為 Hurwitz 多項式,且使的范數(shù).為敘述方便,分別記為.在不引起混淆時,為敘述簡便,文中將函數(shù)的時間變量t略去.
由式(7)可得




對上式兩邊同取范數(shù),根據(jù)Bellman-Gronwall引理,

根據(jù)積分中值定理,存在一未知常數(shù)ωk1(t)∈[0,1],滿足

于是由上述兩式可得

利用積分中值定理,由上式可以推出,存在ωk2(t)∈[0,1],滿足


式中,θ(t)=μ1t‖A‖eˉωt‖A‖,μ1>0為設計參數(shù).將式(15)的結(jié)果應用于式(11),

由此,設計控制器

及相應的學習律

此處,ηk為η的估計值,θk為θ的估計值,μ2>0為設計參數(shù),γ1> 0,γ2> 0,γ3> 0,ε? 0.本文中,sat(·)的定義為:對于∈R,為對應的限幅.學習律(18)~(20)均采用完全限幅學習方法估計被學習量.

根據(jù)sk與之間的不等式關系[21?22,26]

控制器(17)也可改為

在T‖A‖的取值較大場合,(1+T‖A‖eT‖A‖)是個很大的數(shù).本文設計控制系統(tǒng)時,沒有采用上述控制器設計方案,而是利用學習方法估計θ,有利于減小設計中的保守性.
注 1.迄今,人們已經(jīng)構造了多種障礙Lyapunov函數(shù)[23?26],例如等,利用這些障礙Lyapunov函數(shù)設計控制器,都可以有效地對系統(tǒng)狀態(tài)或輸出進行相應的約束.本文構造了一種新型的障礙Lyapunov函數(shù),其具有的一個特點是.本文根據(jù)該障礙Lyapunov函數(shù)設計控制器時,利用了這一特點,具體而言:在由式(14)推出式(15)的過程中,利用了.
1.2方法兩組患者均在全麻狀態(tài)下實施手術,需注意讓患者在手術前6~8h嚴禁進食進水,以免術中因麻藥反應產(chǎn)生嘔吐,嘔吐物堵塞氣管造成危險。對照組實施開放型手術,即將腦顱打開將瘤體清除。觀察組采用顯微手術方式治療,具體操作如下。
根據(jù)上文給出的控制設計,閉環(huán)系統(tǒng)具有的性質(zhì)可總結(jié)為定理1.

并確保在各次迭代運行過程中,|sk|<bs成立.
證明.1)變量有界性及系統(tǒng)狀態(tài)的受限性


記h=|sk|,注意到:1)在每次迭代的開始時刻,sk=0;2)函數(shù)在h∈[0,bs)區(qū)間內(nèi)單調(diào)遞增,且limh→bs?ν(h)=+∞.因此,當在[0,bs)內(nèi)的|sk|足夠大時,必有


可見,系統(tǒng)狀態(tài)在各次迭代運行過程中均受到相應的約束.
2)誤差收斂性

根據(jù)式(27),當k>0時,

根據(jù)學習律(18),

類似地,根據(jù)學習律(19)及(20),分別可以推出

及

綜合以上四式,有

進一步地,

考慮在[0,T]上運行的非線性系統(tǒng)




圖1 x1及其期望軌跡x1dFig.1 x1and its desired trajectory x1d
為對比起見,采用無約束的初始修正學習控制律


圖3 誤差e1和e2Fig.3 The errors e1and e2

圖4 修正誤差Fig.4 The recti fi ed error

圖5 修正誤差Fig.5 The recti fi ed error

圖6 控制輸入Fig.6 Control input

圖7 狀態(tài)受限情形下Jk的收斂過程Fig.7 The history of Jkin the case of constraint
進行仿真,式中,

仿真結(jié)果表明,利用本文給出的狀態(tài)受限參考信號初始修正方法設計學習控制器,可以解決非參數(shù)不確定學習控制系統(tǒng)的初值問題,實現(xiàn)系統(tǒng)狀態(tài)對修正參考信號在整個作業(yè)區(qū)間上的完全跟蹤,并確保將各次迭代過程中的濾波誤差約束于預設的界內(nèi),對系統(tǒng)狀態(tài)予以約束.上述結(jié)果說明了本文所提控制方法的有效性.

圖8 Jk收斂過程Fig.8 The history of Jk
本文提出狀態(tài)受限迭代學習控制的參考信號初始修正方法,解決非參數(shù)不確定系統(tǒng)在任意初態(tài)情形下的狀態(tài)受限軌跡跟蹤問題.文中給出了修正參考信號構造方案,并利用一種新型的障礙Lyapunov函數(shù)設計迭代學習控制器,采用魯棒學習控制方法處理非參數(shù)不確定性.經(jīng)過足夠多次迭代后,藉由系統(tǒng)狀態(tài)對修正參考信號在整個作業(yè)區(qū)間的完全跟蹤,獲得系統(tǒng)狀態(tài)對參考信號在預設部分作業(yè)區(qū)間上的完全跟蹤.在各次迭代過程中,閉環(huán)系統(tǒng)中的濾波誤差被約束于預設的界內(nèi),由此實現(xiàn)對系統(tǒng)狀態(tài)在各次迭代運行過程中的約束.本文采用學習方法估計魯棒項的增益系數(shù),克服了以往同類算法在某些場合應用時可能出現(xiàn)的增益過大現(xiàn)象.
1 Arimoto S,Kawamura S,Miyazaki F.Bettering operation of robots by learning.Journal of Field Robotics,1984,1(2):123?140
2 Dixon W E,Zergeroglu E,Dawson D M,Costic B T.Repetitive learning control:a Lyapunov-based approach.IEEE Transactions on Systems,Man,and Cybernetics,Part B(Cybernetics),2002,32(4):538?545
3 Xu J X,Tan Y.A composite energy function-based learning control approach for nonlinear systems with time-varying parametric uncertainties.IEEE Transactions on Automatic Control,2002,47(11):1940?1945
4 Zhang Yu-Dong,Fang Yong-Chun.Learning control for systems with saturated output.Acta Automatica Sinica,2011,37(1):92?98(張玉東,方勇純.一類輸出飽和系統(tǒng)的學習控制算法研究.自動化學報,2011,37(1):92?98)
5 Zhang Li,Liu Shan.Basis function based adaptive iterative learning control for non-minimum phase systems.Acta Automatica Sinica,2014,40(12):2716?2725
(張黎,劉山.非最小相位系統(tǒng)的基函數(shù)型自適應迭代學習控制.自動化學報,2014,40(12):2716?2725)
6 Bu Xu-Hui,Hou Zhong-Sheng,Yu Fa-Shan,Fu Zi-Yi.Iterative learning control for trajectory tracking of farm vehicles.Acta Automatica Sinica,2014,40(2):368?372
(卜旭輝,侯忠生,余發(fā)山,付子義.基于迭代學習的農(nóng)業(yè)車輛路徑跟蹤控制.自動化學報,2014,40(2):368?372)
7 French M,Rogers E.Non-linear iterative learning by an adaptive Lyapunov technique.International Journal of Control,2000,73(10):840?850
8 Tayebi A,Chien C J.A uni fi ed adaptive iterative learning control framework for uncertain nonlinear systems.IEEE Transactions on Automatic Control,2007,52(10):1907?1913
9 Chen Wei-Sheng,Wang Yuan-Liang,Li Jun-Min.Adaptive learning control for nonlinearly parameterized systems with periodically time-varying delays.Acta Automatica Sinica,2008,34(12):1556?1560
(陳為勝,王元亮,李俊民.周期時變時滯非線性參數(shù)化系統(tǒng)的自適應學習控制.自動化學報,2008,34(12):1556?1560)
10 Yin C K,Xu J X,Hou Z S.A high-order internal model based iterative learning control scheme for nonlinear systems with time-iteration-varying parameters.IEEE Transactions on Automatic Control,2010,55(11):2665?2670
11 Ham C,Qu Z.A new learning control based on the Lyapunov direct method.In:Proceedings of Southcon/94 Conference Record.Orlando,USA:IEEE,1994.121?125
12 Xu J X,Yan R.On repetitive learning control for periodic tracking tasks.IEEE Transactions on Automatic Control,2006,51(11):1842?1848
13 Marino R,Tomei P,Verrelli C M.Robust adaptive learning control for nonlinear systems with extended matching unstructured uncertainties.International Journal of Robust and Nonlinear Control,2012,22(6):645?675
14 Chen Peng-Nian,Qin Hua-Shu,Fang Xue-Yi.Iterative learning control for uncertain nonlinear systems with time-varying control gain.Journal of Systems Science and Mathematical Sciences,2012,32(6):693?704
(陳彭年,秦化淑,方學毅.控制增益時變的非線性系統(tǒng)的迭代學習控制.系統(tǒng)科學與數(shù)學,2012,32(6):693?704)
15 Liuzzo S,Marino R,Tomei P.Adaptive learning control of nonlinear systems by output error feedback.IEEE Transactions on Automatic Control,2007,52(7):1232?1248
16 Chien C J,Hsu C T,Yao C Y.Fuzzy system-based adaptive iterative learning control for nonlinear plants with initial state errors.IEEE Transactions on Fuzzy Systems,2004,12(5):724?732
17 Sun M X,Yan Q Z.Error tracking of iterative learning control systems.Acta Automatica Sinica,2013,39(3):251?262
18 Sun Ming-Xuan,Huang Bao-Jian.Iterative Learning Control.Beijing: NationalDefenceIndustry Press,1999.182?184
(孫明軒,黃寶健.迭代學習控制.北京:國防工業(yè)出版社,1999.182?184)
19 Yan Qiu-Zhen,Sun Ming-Xuan,Li He.Iterative learning control for nonlinear uncertain systems with arbitrary initial state.Acta Automatica Sinica,2016,42(4):545?555
(嚴求真,孫明軒,李鶴.任意初值非線性不確定系統(tǒng)的迭代學習控制.自動化學報,2016,42(4):545?555)
20 Li X D,Chow T W S,Cheng L L.Adaptive iterative learning control of non-linear MIMO continuous systems with iteration-varying initial error and reference trajectory.International Journal of Systems Science,2013,44(4):786?794
21 Li Xiang-Yang.Iterative learning control for a class of nonlinear time-varying system.Control Theory&Applications,2014,31(8):1087?1093
(李向陽.一類非線性時變系統(tǒng)的迭代學習控制.控制理論與應用,2014,31(8):1087?1093)
22 Li Xiang-Yang.Iterative learning control based on fi nite time tracking di ff erentiator.Acta Automatica Sinica,2014,40(7):1366?1375
(李向陽.基于有限時間跟蹤微分器的迭代學習控制.自動化學報,2014,40(7):1366?1375)
23 Jin X,Xu J X.Iterative learning control for outputconstrained systems with both parametric and nonparametric uncertainties.Automatica,2013,49(8):2508?2516
24 Xu J X,Jin X.State-constrained iterative learning control for a class of MIMO systems.IEEE Transactions on Automatic Control,2013,58(5):1322?1327
25 Sun Ming-Xuan,Zhang Wei-Bo,Yan Qiu-Zhen.Constrained iterative learning control of a class of non-parametric uncertain systems.Control Theory&Applications,2014,31(4):479?484
(孫明軒,張偉博,嚴求真.非參數(shù)不確定系統(tǒng)約束迭代學習控制.控制理論與應用,2014,31(4):479?484)
26 Yan Qiu-Zhen,Sun Ming-Xuan.Error-tracking iterative learning control with state constrained for nonparametric uncertain systems.Control Theory&Applications,2015,32(7):895?901
(嚴求真,孫明軒.非參數(shù)不確定系統(tǒng)狀態(tài)受限誤差跟蹤學習控制方法.控制理論與應用,2015,32(7):895?901)
27 Yu Qiong-Xia,Hou Zhong-Sheng.Adaptive iterative learning control for a class of non-parametric uncertain systems.Journal of Systems Science and Mathematical Sciences,2016,36(1):1?13(余瓊霞,侯忠生.非參數(shù)不確定系統(tǒng)的自適應迭代學習控制.系統(tǒng)科學與數(shù)學,2016,36(1):1?13)
28 Zhuang Kai-Yu,Zhang Ke-Qin,Su Hong-Ye,Chu Jian.Terminal sliding mode control for high-order nonlinear dynamic systems.Journal of Zhejiang University(Engineering Science),2002,36(5):482?485,539
(莊開宇,張克勤,蘇宏業(yè),褚健.高階非線性系統(tǒng)的Terminal滑模控制.浙江大學學報(工學版),2002,36(5):482?485,539)
29 Xie Hua-Ying,Sun Ming-Xuan,Jin Kui.Iterative learning controller designs with fi nite-time convergence performance.In:Proceedings of the 29th Chinese Control Conference.Beijing,China:TCCT,2010.5845?5850
(謝華英,孫明軒,金奎.有限時間收斂迭代學習控制器設計.見:第 29屆中國控制會議論文集.北京:中國自動化學會,2010.5845?5850)
嚴求真 浙江水利水電學院信息工程學院講師.主要研究方向為學習控制.E-mail:zjyqz@126.com
(YAN Qiu-Zhen Lecture at the College of Information Engineering,Zhejiang University of Water Resources and Electric Power.His main research interest is learning control.)
孫明軒 浙江工業(yè)大學信息工程學院教授.主要研究方向為學習控制.本文通信作者.E-mail:mxsun@zjut.edu.cn
(SUN Ming-Xuan Professor at the College of Information Engineering,Zhejiang University of Technology.His main research interest is learning control.Corresponding author of this paper.)
蔡建平 浙江水利水電學院應用數(shù)學研究所副教授.主要研究方向為自適應控制.E-mail:caijp@zjweu.edu.cn
(CAI Jian-Ping Associate professor at the Institute of Applied Mathematics,Zhejiang University of Water Resources and Electric Power.His main research interest is adaptive control.)
Reference-signal Rectifying Method of Iterative Learning Control
YAN Qiu-Zhen1SUN Ming-Xuan2CAI Jian-Ping3
This paper presents a reference-signal rectifying method of iterative learning control to address the trajectorytracking problem for a class of state-constrained uncertain systems,in the presence of arbitrary initial states.For design of the iterative learning control scheme,a recti fi ed reference signal is constructed and a new type of barrier Lyapunov function is used.In order to deal with the nonparametric uncertainties,a robust learning approach is applied.It is shown that the closedloop system′s state follows the recti fi ed reference signal perfectly over the entire time interval as iteration increases.In turn,the system state tracks the reference signal on the speci fi ed interval.During each iteration,the fi ltering-error is constrained in the pre-speci fi ed region,and the system state is thus constrained.Numerical results are presented to demonstrate the e ff ectiveness of the learning control scheme.
Iterative learning control,initial condition problem,nonparametric uncertainties,barrier Lyapunov function
March 26,2016;accepted September 11,2016國家自然科學基金(61374103,61573320,61573322),浙江省公益技術研究項目(2016C32093,2017C33155),浙江省教育廳科研項目(Y201635861)資助
嚴求真,孫明軒,蔡建平.迭代學習控制的參考信號初始修正方法.自動化學報,2017,43(8):1470?1477
Yan Qiu-Zhen,Sun Ming-Xuan,Cai Jian-Ping.Reference-signal rectifying method of iterative learning control.Acta Automatica Sinica,2017,43(8):1470?1477Hangzhou 310023 3.Institute of Applied Mathematics,Zhejiang University of Water Resources and Electric Power,Hangzhou 310018
2016-03-26 錄用日期2016-09-11
Supported by National Natural Science Foundation of China(61374103,61573320,61573322),Science and Technology Project of Zhejiang Province(2016C32093,2017C33155),Scienti fi c Research Project of Education Department of Zhejiang Province(Y201635861)
本文責任編委 王聰
Recommended by Associate Editor WANG Cong
1.浙江水利水電學院信息工程學院 杭州 310018 2.浙江工業(yè)大學信息工程學院 杭州 310023 3.浙江水利水電學院應用數(shù)學研究所 杭州 310018
1. College of Information Engineering,Zhejiang University of Water Resources and Electric Power,Hangzhou 310018 2.College of Information Engineering,Zhejiang University of Technology,
DOI10.16383/j.aas.2017.c160292