蔡光斌 肖永強 胡昌華 楊小岡 凡永華
實際系統由于安全和性能方面的要求,以及一些物理器件的限制,會不可避免地受到各種約束條件的限制,如果約束條件得不到滿足,系統性能將可能急劇下降甚至出現不穩定.為滿足實際應用需求,有必要研究系統在不同約束條件下的控制問題.常見的約束條件包括: 輸出約束、狀態約束和輸入約束等,其中輸出約束是指系統輸出需滿足特定的約束條件.現有的輸出約束控制方法主要有模型預測控制[1]、參考軌線調節[2]以及基于不變集的方法[3]等,但這些方法均基于數值計算,計算量較大.與這些方法不同,基于障礙Lyapunov 函數(Barrier Lyapunov function,BLF)的設計是處理輸出約束問題的一種常用的方法,其基本思想是當自變量的值趨于某些區域邊界時,BLF 的值趨于無窮大,通過保證BLF 的有界性,進而使系統輸出滿足約束條件[4].經過近些年的發展,所研究的問題由對稱常值輸出約束問題[4]發展到非對稱時變輸出約束問題[5],應用方面也包括在直升機系統[6]、航天器交會對接[7]等領域的實際應用.然而,大多數基于BLF的輸出約束控制方法,需要將輸出約束問題轉換為系統跟蹤誤差約束問題,會造成系統輸出初始值較為保守的問題.
針對上述問題,有學者提出了基于非線性轉換函數的輸出約束控制方法,將輸出約束問題轉換為非線性轉換函數的有界性問題,即無需將其轉換為跟蹤誤差約束問題,設計過程較為簡單,且系統輸出初值可以在整個約束區域內選取,放寬了對系統輸出初值選取的要求[8-9].基于這一方法,學者們研究了嚴反饋系統、切換系統、隨機系統、純反饋系統、MIMO (Multiple-input and multiple-output)系統等定常輸出約束以及時變輸出約束控制問題[8-14],同時在應用方面也研究了四旋翼飛行器[15]、機器人[16]等實際系統的輸出約束控制問題,在這一領域取得了較多的研究成果.
然而,上述方法是應用一階系統方法(狀態空間方法)進行研究的.由于牛頓定律、拉格朗日定律、角動量定律等物理定律的應用,大多數實際系統最初被建模為二階或高階形式.文獻[17-20]指出,當采用一階系統方法設計控制器時,需要對二階或高階系統降階,將其轉化為一階系統,這樣會破壞系統的全驅特性、增大系統階數、增加控制器的設計步驟.針對這一問題,有學者提出了全驅系統方法,該方法直接對高階系統設計控制器而不需要降階,通過設計偽線性狀態反饋控制律,將閉環系統轉化為具有特定結構的線性定常系統,并基于參數化設計方法配置閉環系統的特征多項式系數矩陣實現期望的系統特性,從而滿足系統控制需求[17-20].
目前,基于全驅系統方法,在自適應控制、最優控制、預測控制、故障診斷、亞全驅系統控制[21-27]等領域取得了較多的研究成果,且都具有良好的控制效果.同時全驅系統方法也出色應用到了航天器制導、控制,以及飛行器制導控制一體化[28-30]等領域.尤其針對高階嚴反饋系統,文獻[31-33]基于全驅系統方法提出高階反步法,不需要將高階系統轉化為多個一階子系統,所需推導的步驟少,過程簡潔高效.同時,在其基礎上,文獻[21-22,34]進一步研究了高階嚴反饋系統動態面、指令濾波控制等問題.上述工作取得了較多的研究成果,但尚未考慮系統輸出約束控制問題.文獻[35]研究了高階嚴反饋系統的輸出約束問題,但其研究的是基于BLF的對稱常值輸出約束控制問題.
由于許多實際系統的狀態參數和控制參數是時變的,因此研究時變輸出約束更具有一般性.受上述研究工作的啟發,本文研究高階嚴反饋系統的非對稱時變輸出約束控制問題,旨在實現直接對高階系統設計控制器,而不需要將其轉化為一階系統.本文提出的高階自適應動態面輸出約束控制方法具有以下特點:
1)不同于狀態空間框架下一階嚴反饋系統的輸出約束問題,本文針對高階嚴反饋系統,研究其輸出約束問題.基于全驅系統方法,直接研究高階系統,不需要將其轉化為一階系統,減少了控制器設計的步驟,從而減輕計算負擔.
2)與基于BLF 的輸出在對稱常值約束下的控制問題相比,本文在其基礎上進一步研究輸出在非對稱時變約束下的控制問題.非對稱時變約束相比于對稱常值約束更加復雜,更具一般性.且與基于BLF 的方法相比,本文基于非線性轉換函數的方法能夠將系統輸出初值可行區間擴大為整個約束區間,避免了系統輸出初始值較為保守的問題.
本文結構安排如下: 第1 節是問題描述,介紹不確定高階嚴反饋系統,并給出一些必要的假設和引理;第2 節和第3 節分別給出高階自適應動態面輸出約束控制器的設計和穩定性證明,從理論上證明系統輸出約束得到滿足,且閉環系統所有信號是一致最終有界的;第4 節基于柔性關節機械臂系統進行仿真,驗證本文所提出控制方法的有效性;最后,在第5 節給出本文的結論.
為了簡化表達,定義一些符號如下:λmin(Pi) 和λmax(Pi) 分別表示矩陣Pi的最小和最大特征值.矩陣Pi>0 表示矩陣Pi是一個正定對稱矩陣.以及
考慮含有模型不確定性的高階嚴反饋系統[33]
其中,F1(t) 和F2(t) 為已知時變約束邊界函數.
注 1.在工程實際中,根據物理定律建模得到的系統模型一般是高階的,因此本文研究的高階嚴反饋系統(1)相比于傳統一階形式的嚴反饋系統更貼近于物理實際.同時,全驅系統方法是基于系統的全驅特性直接對原始的高階系統模型設計控制器,而不需要將其轉化為一階形式.針對高階系統(1),本文無需將其轉化為一階形式,直接對每個高階子系統設計控制器,尤其對反步法而言,更少的設計步驟更有利于降低算法的復雜度.
本文控制目標是: 設計高階自適應動態面控制器使得系統(1)輸出在滿足約束條件(2)的情況下有效跟蹤期望的參考信號,閉環系統所有信號都是一致最終有界的,且跟蹤誤差能夠收斂到零附近的足夠小的鄰域內.
為實現本文控制目標,給出必要的假設以及引理.首先,系統(1)需要滿足如下的全驅系統假設.
假設1[33].≠0,j=1,2,···,n.
假設2[9,13,21].期望的參考信號yd(t) 是光滑且可以得到的,并滿足
假設4[9,13].約束邊界函數F1(t) 和F2(t) 以及其導數(1≤i≤n) 是連續且有界的.
注2.假設1 為全驅系統假設,相比于傳統一階嚴反饋系統要求控制增益非零,高階嚴反饋系統也要求控制增益非零.假設2 要求期望的跟蹤信號及其各階導數是連續有界的,在狀態空間框架下的動態面控制方法同樣要求跟蹤信號及其各階導數連續可導,這個假設也是容易實現的.假設3 是為了保證約束上下邊界不交叉,且期望的跟蹤信號在約束邊界內,這是符合工程實際的.假設4 要求約束邊界函數及其各階導數連續有界,也是合理的.
本文中,通過選取A0~n-1使得矩陣Φ(A0~n-1)是Hurwitz 的.為了方便后續控制器設計,給出如下引理.
引理 1[33].對任意μ>0,存在A0~n-1使得
進一步可得存在正定對稱矩陣P(A0~n-1),使得
根據文獻[9]和文獻[13],引入如下非線性轉換函數
在系統輸出初值在區間D1內確保ζ1(0) 有界的前提下,只需設計控制器使得ζ1在[0,∞) 內有界,輸出約束條件(2)就能始終得到滿足.
對轉換函數式(5)求導可得
將式(9)與式(6)結合可得
進而將含有輸出約束的原系統(1)轉化為如下系統
當系統輸出初始值在D1內,只需設計控制器使得系統(11)的第1 個狀態ζ1有界,則原系統(1)的輸出約束就能得到滿足[9,13].
針對輸出受時變約束的不確定高階嚴反饋系統(1),基于全驅系統方法[21,33],設計高階自適應動態面控制器,主要步驟如下.
步驟1.定義如下坐標變換
在區間 Ωd內是一個連續的有界函數.
定義
虛擬控制律x1d通過一系列低通濾波器[21]得到x1c
其中,ω10=x1d,ω1(m1-1)=x1c,設計的濾波參數α1i>0,i=1,2,···,m1-1 為常值,初值ω10(0)=ω11(0)=···=ω1(m1-1)(0).
定義濾波誤差為
可以得到
以及
選取Lyapunov 函數為
對式(19)求導,可得
取虛擬控制律為
其中,k0>0 為一常數,則可得
由式(14)可得
虛擬控制律x2d通過一系列低通濾波器得到x2c
其中,ω20=x2d,ω2m2=x2c,設計的濾波參數α2i>0,i=1,2,···,m2為常值,初值ω20(0)=ω21(0)=···=ω2m2(0).
定義濾波誤差
進一步可得
取虛擬控制律為
其中,矩陣P1為引理1 中描述的正定矩陣.
對式(35)求導,結合式(34),并根據引理1 可得
式中,下標L表示相應矩陣的最后一列.
對式(31)求導,可得
對式(39)求導,可得
取自適應律為
其中,常值γ1>0 為設計參數,進一步可得
其中,虛擬控制律x(i+1)d通過一系列低通濾波器得到x(i+1)c
其中,ω(i+1)0=x(i+1)d,ω(i+1)mi+1=x(i+1)c,設計的濾波參數α(i+1)j>0,j=1,2,···,mi+1為常值,初 值ω(i+1)0(0)=ω(i+1)1(0)=···=ω(i+1)mi+1(0).
定義濾波誤差為
進一步可得
進一步可得
取虛擬控制律為
對式(52)求導,可得
對式(48)求導,可得
取自適應律為
其中,γi>0 為設計參數.進一步可得
步驟 n.
進一步可得
取控制律為
對式(63)求導,可得
對式(59)求導,可得
取自適應律為
其中,γn>0 為設計參數,可得
結合第2 節中的控制器設計過程,給出定理1,并根據Lyapunov 理論給出其證明.
定理 1.考慮滿足假設1~4 下的具有時變輸出約束的高階嚴反饋系統(1).由虛擬控制律(23),(33),(50),控制律(61),自適應律(41),(57),(68),組成的高階自適應動態面輸出約束控制,能夠使閉環系統所有信號是一致最終有界的,系統輸出滿足時變約束條件,并能有效跟蹤期望的參考信號,且跟蹤誤差可通過調整參數收斂到零附近足夠小的鄰域內.
證明.
定義
則可以得到
由假設3 以及式(7)可知,σ1>0,根據Young's不等式可得
結合式(71)和式(72),可得
且有如下不等式成立
進一步可得
且結合如下不等式
因此,只需設計參數滿足
其中,κ>0 為一常數.進一步可得
其中
對式(86),若選取參數滿足κ≥ε/V(0),則≤0.所以對任意t≥0,有V(t)≤V(0) 成立.因此可知 Ω 是一個不變集.根據比較原理[36]可得
因此,可得V(t) 是一致最終有界的.進一步可知,坐標轉換誤差zi,i=0,1,···,n,濾波誤差s11,···,s1(m1-1),s21,···,s2m2,···,si1,···,simi以及參數估計誤差i=1,···,n是一致最終有界的,即閉環系統所有信號都是一致最終有界的.且由于limt→∞V(t)→ε/κ,而ε不依賴于κ,所以可通過調整參數使得ε/κ足夠小.由于z0=ζ1-x0c,且x0c在 Ωd內有界,所以可知ζ1有界,從而x1∈D1,即輸出約束始終得到滿足.定義跟蹤誤差為
由式(5),(12)和(13),可得
注 3.由上述分析可以看出,本文不需要將高階嚴反饋系統轉化為一階形式,直接對其設計控制器,會簡化一些步驟.且可通過調整設計參數使得ε/κ足夠小以提高跟蹤精度,然而這樣會增大控制輸入,因此在實際應用中,應考慮跟蹤精度和控制輸入之間的權衡.
為驗證所提算法的有效性,選取柔性關節機械臂系統對本文算法進行仿真驗證,機械臂系統模型為[37-38]
其中,q∈Rn表示連桿位置,其一階導數和二階導數分別代表連桿的速度和加速度,IQ ∈Rn×n是連桿轉動慣量;M∈Rn和L∈Rn分別為連桿質量和長度;g為重力加速度;J∈Rn×n是電機轉動慣量;θ,,∈Rn表示轉子的角位移、角速度和角加速度;K ∈Rn×n表示等效彈簧彈性系數;τ∈Rn為電機控制力矩;Δ1和 Δ2表示系統模型不確定性,其表達式為 Δ1=0.1(MgLsinq+Kq) 和 Δ2=0.1K(θ-q).機械臂模型參數[37]為IQ=1(kg·m2),J=1(kg·m2),M=0.5 kg,L=1 m,K=40 (N·m·rad-1),g=10 (m·s-2).
定義x1=q,x2=θ,u=τ,可得
其中,g1=40,g2=1,f1=f10=-5 sinx1-40x1,f2=f20=40x1-40x2.θ1和θ2為系統未知的模型不確定參數,其真實值為0.1.
為驗證本文方法的有效性,首先將本文方法與不考慮輸出約束的自適應動態面控制方法[39]進行對比仿真.令x1=q,x2=,x3=θ,x4=,將機械臂系統(92)轉化為如下一階系統的形式,如式(94)所示,再對其設計自適應動態面控制器.
情況 2.增加更為復雜的約束邊界進行仿真對比,期望的跟蹤信號為yd=cos(2t)+sin(0.5t),約束邊界為F1=1.01×2-2t+1-cos(2t)-sin(0.5t),F2=0.56×2-1.2t+0.84+cos(2t)+sin(0.5t),系統初值設置為x1(0)=2,x2(0)=1,x3(0)=x4(0)=0.5.其他相關參數及記法與情況1 一致,得到系統輸出仿真結果如圖2 所示.
由圖1 和圖2 可知,系統本身存在輸出約束,但是自適應動態面控制器不考慮輸出約束問題,就無法始終保持系統輸出在約束范圍內.從仿真結果來看其中存在系統輸出超出約束邊界的情形,這對于實際工程比如無人車系統、隧道無人機系統等,超出約束邊界就意味著無人車沖出跑道、無人機撞到隧道邊界,出現事故.而本文算法能夠有效使系統輸出始終保持在約束范圍內,不違反約束條件.

圖2 情況2 下的系統輸出跟蹤結果Fig.2 System output tracking results in Case 2
為說明本文算法的先進性,將本文算法與基于非對稱障礙Lyapunov 函數(BLF),即參考文獻[5]中的方法以及傳統基于非線性映射函數(Nonlinear mapping,NM),即參考文獻[8-9]中的方法,在情況1 和情況2 兩種情況下進行對比仿真,相關參數和初值保持不變.將對比的兩種方法簡稱為一階BLF 方法和一階NM 方法.將本文方法仿真結果記為x1,h,eh,(h),(h),uh;將一階BLF 方法仿真結果記為x1,f1,ef1,(f1),(f1),uf1;將一階NM 方法仿真結果記為x1,f2,ef2,(f2),(f2),uf2.情況1 的仿真結果如圖3~7 所示;情況2 的仿真結果如圖8~12 所示.

圖3 系統輸出跟蹤結果(情況1)Fig.3 System output tracking results (Case 1)
上述仿真結果中,圖3、圖8 和圖4、圖9 分別為系統輸出跟蹤結果和跟蹤誤差,可知三種控制方法下的系統輸出均能有效地跟蹤期望信號,且系統輸出不違反約束條件,始終保持在約束范圍內;相比于一階BLF 方法和一階NM 方法,在相同的控制參數及相同的初值條件下,本文方法收斂速度和精度都略優.圖5、圖6 和圖10、圖11 為系統參數估計結果,可知三種控制方法下的參數估計值均能有效收斂到參數真實值附近,且本文方法收斂精度和收斂速度更好.圖7 和圖12 為系統控制輸入,可知三種控制方法的輸入均在合理范圍內,相比于一階BLF 方法和一階NM 方法,本文方法控制輸入初值更小.

圖4 系統跟蹤誤差(情況1)Fig.4 System tracking errors (Case 1)

圖6 參數估計(h),(f1),(f2) (情況1)Fig.6 Parameter estimation (h),(f1),and (f2) (Case 1)

圖7 系統控制輸入(情況1)Fig.7 System control inputs (Case 1)

圖8 系統輸出跟蹤結果(情況2)Fig.8 System output tracking results (Case 2)

圖9 系統跟蹤誤差(情況2)Fig.9 System tracking errors (Case 2)

圖10 參數估計(h),(f1),(f2) (情況2)Fig.10 Parameter estimation (h),(f1),and (f2) (Case 2)

圖11 參數估計 (h),(f1),(f2) (情況2)Fig.11 Parameter estimation (h),(f1),and (f2) (Case 2)

圖12 系統控制輸入(情況2)Fig.12 System control inputs (Case 2)
注 4.對于反步法/動態面控制方法而言,隨著系統階數的增多,控制器設計步驟也會增多,不僅會增加控制器設計的復雜度、引起微分爆炸問題,還會增加中間步驟的誤差.而本文方法直接對高階系統設計控制器,不僅省去了將高階系統轉換為一階系統這一步驟,還能減少控制器設計步驟,從而有效減弱上述問題.
為進一步說明本文方法的優勢,將本文方法與上述一階BLF 方法以及一階NM 方法在相同的仿真參數下,并在同一臺計算機同一個仿真軟件下運行50 次,比較三者在情況1 和情況2 兩種情況下的運行時間,結果如表1 所示.可知相比于一階NM 方法和一階BLF 方法,由于本文方法設計步驟更少,所需仿真時間更少,具有更高的效率.

表1 三種算法運算時間對比(s)Table 1 Comparison of operation time of three algorithms (s)
由上述仿真結果可知,本文所提出的算法不需要將原始系統轉化為4 個一階子系統,設計步驟更少,能使系統始終滿足輸出約束要求.相比于一階系統方法,本文方法在收斂精度、收斂速度方面略優,控制輸入初值更小、仿真時間更少.
注 5.一階BLF 方法、一階NM 方法以及本文方法均能有效處理輸出約束問題,對應的文獻從理論方面說明了三種方法能確保閉環系統所有信號一致最終有界,輸出約束能始終滿足,而且本文的仿真也證實了三種方法都能有效處理輸出約束問題.從仿真結果來看,本文方法的收斂精度、收斂速度略優于一階BLF 方法和一階NM 方法,性能指標方面并沒有很突出的優勢.這是因為本文的優勢主要在于能減少設計步驟、降低算法設計復雜度,從而減弱反步法/動態面控制方法的微分爆炸問題,這對于反步法/動態面控制是很有意義的.從仿真結果中也能證實本文方法控制輸入初值更小、算法運算時間更少,具有更高的效率.
針對不確定高階嚴反饋系統,基于全驅系統方法,本文提出一種高階自適應動態面時變輸出約束控制方法.首先通過非線性轉換函數將原輸出約束系統轉換為無約束的系統,進而可通過確保新系統的有界性使得原系統輸出約束得到滿足.然后基于全驅系統方法,在高階動態面控制方法的框架下直接對每個高階子系統設計控制器,而不需要將其轉化為一階系統形式,減少了一些步驟;通過引入一系列低通濾波器來獲得虛擬控制律的高階導數,進而將復雜的高階求導運算轉化為簡單的代數運算,更加簡潔高效.通過Lyapunov 穩定性理論證明閉環系統所有信號都是一致最終有界的,系統輸出約束條件始終得到滿足,且可通過調整參數使得系統跟蹤誤差收斂到原點的任意小鄰域內.最后通過對實際的機械臂系統進行仿真,驗證了本文所提控制方法的有效性.