陳增強,吳瑕,孫明瑋,孫青林
?
時滯系統的自抗擾廣義預測控制的性能分析
陳增強1, 2,吳瑕1,孫明瑋1,孫青林1
(1. 南開大學 計算機與控制工程學院,天津 300350;2. 天津市智能機器人重點實驗室,天津 300350)
為了實現對時滯系統的高性能控制,提出1種自抗擾廣義預測控制算法。首先闡述自抗擾廣義預測控制算法的設計原理,得到算法的閉環反饋結構。然后利用頻域分析法推導出算法的頻域特性,分析并總結時滯系統自抗擾廣義預測控制算法的參數整定原則。最后對自抗擾廣義預測控制算法以及傳統的廣義預測控制算法的動態性能進行比較。研究結果表明:自抗擾廣義預測控制算法無需在線辨識被控對象精確的數學模型,可以離線求得丟番圖方程的解析解,算法的在線計算量大大減少;相比于傳統的廣義預測控制算法,自抗擾廣義預測控制算法具有更好的動態性能。
廣義預測控制;自抗擾控制;自抗擾廣義預測控制;閉環反饋結構;頻域分析法
自抗擾控制(active disturbance rejection control,ADRC)是利用PID控制和現代控制理論的先進成果而探索出來的一種不依賴于被控對象精確模型的新型實用數字控制技術[1?3]。其核心思想是將系統的外部擾動以及內部未建模動態綜合作為總擾動并將其擴張成一個新的狀態,利用擴張狀態觀測器對其進行實時估計和補償。因此,自抗擾控制既能有效抑制外界干擾,又可以減弱算法對于模型的依賴,增強了系統的魯棒 性[4?7]。此前,CLARKE等[8]在保持最小方差自校正控制的在線辨識、輸出預測、最小方差控制等特點的基礎上,吸收了動態矩陣控制和模型算法控制中的滾動優化策略,提出了廣義預測控制(generalized predictive control,GPC)算法。它以受控自回歸滑動平均模型(CARIMA)為預測模型,并結合了滾動優化和在線反饋校正等特征,對開環不穩定、非最小相位以及大時滯系統有很好的控制效果。但廣義預測控制對被控對象精確的數學模型具有較強的依賴性,且對模型參數較敏感,在線計算量大,限制了其應用范圍[8?10]。本文作者針對廣義預測控制的不足,提出1種改進的廣義預測控制算法—自抗擾廣義預測控制算法(ADRC?GPC)。與傳統的廣義預測控制算法相比,該改進的算法可以離線求得丟番圖方程的通解,且無需辨識被控對象的參數,因此,算法在線計算量大大減少。由于廣義預測控制算法具有很強的魯棒性,當被控對象不能被完全轉化成積分串聯的形式,有一定的誤差時,廣義預測控制的強魯棒性仍舊可以保證算法的性能。對于時滯系統,采用忽略時滯的思想來設計自抗擾廣義預測控制器[2]。首先介紹無時滯系統自抗擾廣義預測控制算法的設計過程。由于自抗擾廣義預測控制算法是由連續被控對象和離散控制器組合而成的混合控制算法,難以用時域方法分析算法的穩定性,因此,針對二階時滯系統,本文作者先將混合系統轉化為統一的離散形式,給出閉環控制穩定的條件。之后利用離散域的開環傳遞函數頻率特性,分析算法中各參數的變化對算法性能的影響,獲得控制器參數調整的原則與規律;在此基礎上,比較ADRC?GPC和GPC這2種算法的動態性能,為ADRC?GPC算法的推廣應用提供參考依據。

ADRC?GPC運行機理如下:首先將系統的外部擾動以及內部未建模動態綜合在一起看成總擾動或擴張狀態,并利用擴張狀態觀測器(extended state observer,ESO),采用輸出反饋的方式對擴張狀態的實時作用量進行在線估計和補償,使得被控對象被轉化成標準的串聯積分器的形式。針對串聯積分器模型設計廣義預測控制律,以達到控制目標。只需要知道系統的階次以及對總擾動的估計信息+1,就可以完成ADRC?GPC控制器設計。

圖1 ADRC?GPC結構
二階線性系統表達式如下:

式中:為控制器的增益;1和2分別為系數;為連續時間變量。


將式(2)寫成狀態空間的形式:

式中:1和2分別為系統輸出及其一階導數;3為總擾動或擴張狀態。針對擴張后的系統(見式(3)),設計狀態觀測器即ESO,分別對1,2和3進行估計:

式中:1,2和3分別為不同擴張狀態觀測器的增益;1,2和3分別為狀態1,2和3的估計值。由于實際輸出1是可以直接測量的,通過減少對其的估計可以減少相位延遲,也就是說,式(4)中的ESO與降階ESO相比,有一定的滯后性,尤其是對于時滯系統來說,會使得時滯對象的滯后加劇。因此,對于時滯系統,設計如下的降階擴張狀態觀測器。將系統的狀態方程即式(3)改寫成如下形式:

構造如下降階ESO表達式:




通過式(8)可分別得到降階ESO的輸出即1和2,繼而可以分別求得2和3的估計值2和3。
設計如下控制律:

式中:為虛擬控制量,用來對簡化后的系統施加控制作用。

在自抗擾廣義預測控制算法中,廣義預測控制器是對經過ESO估計和補償后的積分器串聯型系統施加控制作用,其從輸入()到輸出()之間的傳遞函數的表達式為


式中:a為多項式系數,=1,2,…,n;b為多項式系數,=1,2,…,n;c為多項式系數,=1,2,…,n。為簡單起見,令(?1)=1。
CARIMA模型固有的積分作用有助于消除系統的靜態偏差,但由于經ESO估計補償后的被控對象本身就是積分器串聯型控制系統,若采用CARIMA模型作為預測模型,則增加了積分環節。對于時滯系統,當觀測器的帶寬接近于0時才能實現穩態控制,因此,針對時滯系統,為了改善控制效果,以CARMA模型作為預測模型:

式中:為離散域上的采樣時間。
對于二階系統,在經過ESO估計和補償之后,被控對象被簡化成一個二階積分器,其傳遞函數0()為

式中:為連續域的拉普拉斯算子。
采用零階保持器得到積分器串聯型系統的脈沖傳遞函數0(?1):

式中:為變換算子,為采樣周期。
忽略擾動信號,將式(13)改寫成如下形式:

式中:1(?1)為脈沖傳遞函數,其表達式為

式(15)和式(17)相對應,由此可以得到

基于CARMA模型,考慮式(19)中的丟番圖方程,則有

式中:=1,2,…,。E,F,G和H分別為關于?1的多項式:

式中:e和g分別為對應的多項式系數,=1,2,…,;f為多項式系數,=1,2,…,+1,h為多項式系數,=1,2,…,-1(其中=1,2,…,)。
當1時,H(?1)=0。將式(16)~(18)代入式(19)可以得到二階系統丟番圖方程的通解。

廣義預測控制性能指標函數如下:

式中:()為對輸出的預測序列;()為將來的控制序列;()為設定值的柔化序列;為控制時域;(>0)為控制加權因子;()=0(,…,),表示在u步后控制量不再變化。()的作用是使輸出()可以平穩到達設定值(),其向量表達式如下:


將式 (17)和(19)代入式(16),可以得到步后系統的輸出預測值():

將式(23)寫成向量形式,則有

其中:


將式(21)寫成向量形式,則有

將式(24)代入式(25),可以求得使性能指標取得最小值時的控制律為

取的第1個元素作為控制量()。將()代入式(9)可以得到基于CARMA模型的二階系統在自抗擾廣義預測控制下的控制律。
從上述分析中可以看出[11?12]:


將式(22)代入式(27)可得:

即

其中:


此時,GPC算法可以轉化成閉環離散系統的形式,其廣義預測控制下的閉環控制系統結構如圖2 所示。

圖2 廣義預測控制下的系統閉環反饋結構
現對圖1中虛線框內ESO和被控對象組合而成的回路部分進行簡化,整理式(6)~(8)可得[13]

由此可以得到二階時滯系統降階ESO的內模控制的結構示意圖如圖3所示(其中為時滯)。

ADRC?GPC下的閉環離散系統的結構示意圖如圖4所示。
由圖3可以求得到的傳遞函數:


圖4 自抗擾廣義預測控制下系統的閉環反饋結構

將指數函數在零點處按二階泰勒展開[14],e?τs近似為

則閉環系統的特征方程變為




圖5 自抗擾廣義預測控制下系統簡化閉環反饋結構
根據離散系統的穩定性條件,設

則圖5中閉環系統的特征方程為

頻域分析法是分析算法性能的常用方法,主要以Bode圖或奈氏曲線為分析工具。與時域分析法相比,頻域分析簡單、直觀,無需大量計算,通過系統的開環傳遞函數可以定性分析算法的性能。因此,為分析ADRC?GPC算法的性能,只需考慮(?1)(?1)的頻率響應就可以,其表達式如下:

根據離散系統奈式判據,可得到在ADRC?GPC的控制下閉環系統穩定的條件。
設二階時滯被控對象的傳遞函數為

對于時滯系統,增大0能夠提高時延系統的穩定性,實現期望的控制性能。因此,選擇0=30,采樣周期=0.1,o=10,根據式(35)和(36),可以得到被控對象的離散化模型:

從上述分析可知:自抗擾廣義預測控制的性能主要受到,o,,和N這5個參數的影響。下面分別對其進行調整,利用Bode圖來觀察參數變化對算法的性能的影響。
當o取值分別為2,5,10,15,20,25和30時,取=15,=1,=0.9,=0.5,0=35,采樣周期=0.1。o變化時系統的Bode圖如圖6所示。圖6所對應的截止頻率和相角裕度如表1所示。
從圖6可以看出:對于時滯系統來說,o增加對系統的響應速度和穩定性有很大影響。o越大,時滯系統的截止頻率越高,系統的響應速度越快,但是系統的相角裕度減小,降低了系統的穩定性。由于ESO的估計精度與o有關,o越大,ESO估計精度越高,性能越好。但是,o增加使得系統的輸入和輸出對噪聲更敏感。因此,o需要限制在合適的范圍內,既能起到濾波的作用,又能保證一定的觀測精度,從而獲得滿意的的控制效果。

(a) 幅值;(b) 相角

表1 ωo變化時系統的相角裕度和截止頻率
由于時滯的存在,的取值應該稍微大一些,因此從=15開始,當分別取值為15,20,25,30,35,40,45,50和55時,取=2,o=10,=0.1,0=30,=0.9,采樣周期=0.1。系統的Bode圖及其離散階躍響應如圖7所示。圖7所對應的截止頻率和相角裕度如表2所示。
從圖7可以看出:預測時域改變會同時改變系統的截止頻率和相角裕度。當較小時,系統截止頻率較大,系統具有較快的響應速度,但是系統的相角裕度相對較小,穩定性相對較差,可能會產生較大的超調。當較大時,系統截止頻率較小,使得系統的響應速度減慢,增加了計算時間,系統的實時性降低;但是系統的相角裕度較大,系統具有較高的穩定性。因此,在實際選擇時應選擇合適的,使控制系統既具有較快的響應速度,又能達到穩定性的要求。改變對算法快速性的影響可以從圖7中的階躍響應看出。


(a) 幅值;(b) 相角

表2 N變化時系統的相角裕度和截止頻率
當u改變時,為更好觀察其變化對于系統性能的影響,分以下2種情況考慮:≤0.5和≥0.5。取=25,o=5,=0.1,0=30,=0.9,此時系統的Bode圖分別如圖8和圖9所示。圖8和圖9所示的Bode圖所對應的截止頻率和相角裕度如表3所示。
相對于其他參數來說,對于系統的穩定性和快速性影響較小。在廣義預測控制中,由于優化的輸出預測最多只受到個控制增量的影響,所以,應滿足≤。從圖8可以看出:越小,跟蹤性能越差。為了改善跟蹤性能,需要增加控制步長來提高對系統的控制能力。當<0.5時,隨著增大,系統的截止頻率比=1時的截止頻率小,即響應速度與=1時相比開始減慢,而系統的相角裕度比=1時的相角裕度大,系統的穩定性與=1時相比得到改善。而當≥0.5時,系統截止頻率和相角裕度不會隨著增大而發生改變。從式(24)可以看出,增大會使得矩陣的維數增加,算法在線計算量增加,使得算法的實時性降低,因此,在選擇時,應該兼顧快速性和穩定性。

(a) 幅值;(b) 相角

(a) 幅值;(b) 相角

表3 Nu變化時系統的相角裕度和截止頻率
當取值分別為5.0,1.0,0.5,0.1,0.5×10?1,0.1×10?1,0.5×10?2,0.1×10?2,0時,取=15,o=5,=0.9,=1,0=30,采樣周期=0.1。系統的Bode圖如圖10所示。圖10所示的Bode圖所對應的截止頻率和相角裕度如表4所示。
是用來限制控制增量Δ的劇烈變化,以防止對被控對象造成過大沖擊。從圖10和表4可以看出:對系統的快速性和穩定性有很大影響;當很小時,減小對系統的截止頻率和相角裕度幾乎沒有影響;而當較大時,增大會使得系統的截止頻率逐漸降低,系統響應速度減慢,而系統相角裕度提高,系統的穩定性得到改善,可以實現穩定控制。但由式(26)可知增加會使得控制作用減弱,因此,實際選擇時,應取一個合適的值,使得系統既能實現穩定控制,又具有較快的響應速度,且控制量的變化滿足設計要求。
當取值分別為0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8和0.9時,取=15,o=5,=0.1,=1,0=30,采樣周期=0.1。系統的Bode圖如圖11所示。圖11所對應的截止頻率和相角裕度如表5所示。
(0≤<1)為柔化因子,可以使當前的輸出()平穩到達設定值r()。增加降低了系統的截止頻率,減緩了系統的響應速度,但使得系統的相角裕度增加,穩定性得到提高,系統超調量減小。從表5可以看出:當≤0.5時,隨著增加,系統的截止頻率和相角裕度基本不變;而當>0.5時,隨著越來越接近1,系統的截止頻率和相角裕度的變化越來越明顯,系統響應速度和超調量減小速率逐漸加快。因此,在實際進行參數選擇時,若確定了預測時域的值,則為了保證閉環系統的穩定性,的選取應充分接近1。

(a) 幅值;(b) 相角

表4 λ變化時系統的相角裕度和截止頻率

(a) 幅值;(b) 相角
:1—0.1;2—0.2;3—0.3;4—0.4;5—0.5;6—0.6;7—0.7;8—0.8;9—0.9。
圖11變化時系統的Bode圖
Fig. 11 Bode diagram of system whenchanges

表5 α變化時系統的相角裕度和截止頻率
對于時滯系統來說,當0=時,很難達到系統的穩定性要求,而增大0能夠提高時滯系統穩定性。因此,當0取值分別為10,15,20,25,30,35和40時,取=15,o=5,=0.1,=3,=0.9,采樣周期=0.1。系統的Bode圖如圖12所示。圖12所對應的截止頻率和相角裕度如表6所示。
對于時滯系統,可以看出0對系統的穩定性有很大影響。0增加明顯降低了系統的截止頻率,減緩了系統的響應速度,降低了系統的實時性。但0增加能夠提高系統的相角裕度,改善系統的穩定性,使得系統實現期望的控制性能。因此,實際選擇時應該綜合考慮,應既能滿足響應速度的要求,又能實現穩定控制。

(a) 幅值;(b) 相角

表6 b0變化時系統的相角裕度和截止頻率
從上述分析可知,自抗擾廣義預測控制器與廣義預測控制器的參數調整原則基本一致,所不同的是,對于時滯系統來說,,0,,o和變化都會對ADRC?GPC算法的穩定性和快速性造成較大影響。在實際選取參數時,對于簡單的時滯系統,N和取值比較固定,N選為1,而取近似于1,它們可以作為固定的參數無需調節,且當N選為1時,矩陣為列向量,算法的在線計算量減少,算法實時性提高。當控制系統穩態性能的要求較高時,N取值應該稍微大一些。的選取應該從0或者1個較小的數開始緩慢增加,直至獲得滿意的性能且控制律的變化滿足設計要求。,0和o是ADRC?GPC算法中3個主要的可調參數。其中,0是根據來設計的,一般情況下,0相對于越大越好,但是0過大使得系統的調節時間過長,降低了算法的實時性。在實際選擇時,可以先將0選定為1個相對來說較大的數,在獲取滿意的穩態性能后,可以緩慢減小0來獲得滿意的動態性能。的取值一般小于/,由于時滯的存在,不能過小,否則系統不能實現穩定控制,并且的取值應隨著時滯增大而有所增加。在實際選擇時,可以從一個相對于/來說較小的數開始調整,如果出現超調,緩慢增加;而且增大時,也應該相應增加,否則,較大的和較小的可能會影響系統的穩定性。而o的選取需要限制在一定范圍內,在時滯系統中,o不能選取過大,否則系統會出現較大超調甚至發散。此外,o的選取需要保證ESO的估計精度。
為了實際比較GPC與ADRC-GPC這2種算法的動態性能,對式(39)中的系統施加階躍響應,2種控制器的參數如表7所示。在仿真時間的1/2處,調節參數不變,對控制量施加給定值20%的階躍擾動,系統的階躍響應曲線如圖13所示。

表7 2種控制器的參數

1—ADRC?GPC;2—GPC。

1) 本文提出的自抗擾廣義預測控制算法無需辨識被控對象的參數,避免了由于參數辨識不準確而影響算法性能的問題。該算法可以離線求得丟番圖方程的解析解,與傳統的廣義預測控制算法相比,算法的實時性得到提高。
2) 得到自抗擾廣義預測控制算法的閉環反饋結構。針對二階時滯系統,研究了在ADRC?GPC的控制器作用下系統的頻域特性,分析了控制器以及觀測器的參數變化對系統性能的影響,獲得控制器參數調整的原則與規律。
3) 通過比較在 ADRC?GPC以及GPC控制器作用下二階時滯系統的動態響應,驗證了ADRC-GPC算法相對于GPC算法的優越性。
[1] HAN Jingqing. From PID to active disturbance rejection control[J]. IEEE Trans on Industrial Electronics, 2009, 56(4): 900?906.
[2] 韓京清. 自抗擾控制技術—估計補償不確定因素的控制技術[M]. 北京: 國防工業出版社, 2008: 183?287. HAN Jingqing. Active disturbance rejection control technique: the technique for estimating and compensating the uncertainties[M]. Beijing: National Defense Industry Press, 2008: 183?287.
[3] 韓京清. 抗擾控制器及其應用[J]. 制與決策, 98, 13(1): 19?23. HAN Jingqing. Active disturbance rejection controller and its applications[J]. Control and Decision, 1998, 13(1): 9?23.
[4] GAO Zhiqiang. Active disturbance rejection control: from an enduring idea to an emerging technology[C]//Proceedings of the 10th International Workshop on Robot Motion and Control. Poznan, Poland: IEEE, 2015: 269?282.
[5] 葉孝璐, 俞立, 張文安等. 基于串級ADRC的四旋翼飛行器懸停控制[J]. 中南大學學報(自然科學版), 2017, 48(8): 2079?2087. YE Xiaolu, YU Li, ZHANG Wenan, et al. Cascade ADRC-based hover control for quadrotor air vehicles[J]. Journal of Central South University(Science and Technology), 2017, 48(8): 2079?2087.
[6] 陳增強, 孫明瑋, 楊瑞光. 線性自抗擾控制器的穩定性研究[J]. 自動化學報, 2013, 39(5): 574?580. CHEN Zengqiang, SUN Mingwei, YANG Ruiguang. On the stability of linear active disturbance rejection control[J]. Acta Automatica Sinica, 2013, 39(5): 574?580.
[7] HUANG Yi, XUE Wenchao. Active disturbance rejection control: methodology and theoretical analysis[J]. ISA Transaction, 2010, 53 (4): 6083?6090.
[8] CLARKE D W, MOHTADI C, TUFFS P S. Generalized predictive control: part 1 and part 2[J]. Automatica, 1987, 23(2): 137?160.
[9] 席裕庚. 預測控制[M]. 2版. 北京: 國防工業出版社, 2013: 1?23. XI Yugeng. Predictive control[M]. 2nd ed. Beijing: National Defense Industry Press, 2013: 1?23.
[10] 陳增強, 孫明瑋, 袁著祉. 采樣系統預測控制的設計與分析[J]. 控制理論與應用, 2002, 19(2): 268?270. CHEN Zengqiang, SUN Mingwei, YUAN Zhuzhi. Predictive control design and analysis for sampled-data systems[J]. Control Theory and Applications, 2002, 19(2): 268?270.
[11] 毛宗星, 陳增強, 孫青林, 等. 基于頻域的廣義預測控制的魯棒性分析[J]. 華東理工大學學報(自然科學版), 2002, 28(S1): 15?19. MAO Zongxing, CHEN Zengqiang, SUN Qinglin, et al. Analyzing the robustness of generalized predictive control based on frequency domain[J]. Journal of East China University of Science and Technology (Science and Technology), 2002, 28(S1): 15?19.
[12] 毛宗星, 陳增強, 孫青林, 等. 基于頻域的廣義預測控制的穩定性分析[J]. 控制與決策, 2002, 11(6): 859?862. MAO Zongxing, CHEN Zengqiang, SUN Qinglin, et al. Stability analysis of generalized predictive control based on frequency domain[J]. Control and Decision, 2002, 11(6): 859?862.
[13] 徐琦, 孫明瑋, 陳增強, 等. 內模控制框架下時延系統擴張狀態觀測器參數整定[J]. 控制理論與應用, 2013, 30(2): 1?5. XU Qi, SUN Mingwei, CHEN Zengqiang, et al. Extended state observer tuning for time-delay systems in the framework of internal model control[J]. Control Theory and Applications, 2013, 30 (2): 1?5.
[14] 楊瑞光. 線性自抗擾控制的若干問題研究[D]. 天津: 南開大學計算機與控制工程學院, 2011: 64?71. YANG Ruiguang. On linear active disturbance rejection control[D]. Tianjin: Nankai University. College of Computer and Control Engineering, 2011: 64?71.
(編輯 伍錦花)
Performance analysis of active disturbance rejection generalized predictive control on time-delay systems
CHEN Zengqiang1, 2, WU Xia1, SUN Mingwei1, SUN Qinglin1
(1. College of Computer and Control Engineering, Nankai University, Tianjin 300350, China; 2. Key Lab of Intelligent Robotics of Tianjin, Tianjin 300350, China)
In order to achieve high performance control of time-delay system, a new algorithm, i.e., active disturbance rejection generalized predictive control (ADRC-GPC) was proposed. First, the design process of the new algorithm was introduced. Then the closed-loop feedback structure of ADRC-GPC algorithm was deduced. Second, frequency domain analysis method was used to analyze frequency characteristics of ADRC-GPC method, and the parameters tuning principle of the algorithm was summarized. At last, dynamic performance of ADRC-GPC algorithm was compared with that of GPC algorithm. The results show that the proposed method can get the general solutions to Diophantine equations off-line and does not need to identify the system parameters, so the online calculation burden is reduced greatly. ADRC-GPC algorithm shows better dynamic performance than the traditional GPC control algorithm.
generalized predictive control; active disturbance rejection control; active disturbance rejection generalized predictive control; closed-loop feedback structure; frequency domain analysis methods
TP273
A
1672?7207(2018)08?1960?11
10.11817/j.issn.1672?7207.2018.08.017
2017?08?01;
2017?09?17
國家自然科學基金資助項目(61573199,61573197)(Projects(61573199, 61573197) supported by the National Natural Science Foundation of China)
陳增強,博士,教授,博士生導師,從事智能預測控制、工業過程控制等研究;E-mail:chenzq@nankai.edu.cn