張志飛 ,章兢 ,曾凡智
(1.佛山科學技術學院自動化學院,廣東佛山528000;2湖南大學電氣與信息工程學院,湖南長沙4100823.佛山科學技術學院電子與信息工程學院,廣東佛山528000)
Acrobot是一種在垂直平面上運動的欠驅動兩連桿機器人[1]。這種機器人由于在肘部關節減少了驅動裝置,使得系統在重量、成本及能耗等方面具有很大的優勢;同時驅動裝置的減少也使得機器人的動力學模型受到二階的非完整條件約束,因此要對其進行控制設計具有很大的難度[2]。
近二十年來,為實現Acrobot在垂直向上平衡點處的穩定控制目標,學者們進行了深入研究,提出了多種控制方法。具有代表性的結果可概括為二類,一類是控制無約束條件下的連續控制律[3-5],另一類是控制受限下性能指標最優控制律[6-8]。由于Acrobot非線性復雜,構造合適的Lyapunov去尋找合適的控制律沒有明確的方法,需要很高的技巧。在控制受限條件下,可以利用極大值原理來求得控制律,但極大值原理所求控制律僅是性能指標最優的必要條件,并不能保證性能指標最優。關于性能指標最優控制,文獻中常見的是時間最短MTC(minimum time control)作為性能指標[6-7],針對其它形式的性能指標的控制律設計鮮有報道,也少見最優性能指標下的控制律的穩定性分析。
取時間與控制能量均衡最小為性能指標,討論控制律的設計問題。考慮到起始區控制律僅能保證系統收斂至最大不變集,同時考慮在垂直平穩點附近連桿的姿態調整要求,將最優控制律切換至LQR,以確保運動過程平穩性。運用LaSalle′s不變集原理討論了控制量有無約束二種情形下的最優控制律的系統穩定性,全局穩定性由切換定理保證。
Acrobot的模型結構如圖1所示。其中mi(i=1,2),表示第i桿的質量,li是第i桿的長度,lci代表從i關節到i桿質心的距離,Ii表示為第i桿相對于質心的慣性,q1表示第一桿相對于垂直向上y軸的角度,q2表示第二桿相對第一桿的角度,τ2是作用在第二連桿上的控制力,g為重力加速度。

圖1 Acrobot的模型結構
令 q=[q1,q2]T,Acrobot的動力學方程滿足[1]


式(2)中,

f3(x),f4(x),b1(x),b2(x)為非線性函數,它們分別為

Acrobot的搖起控制目標為:從垂直向下的穩定平衡點 x0=[π,0,0,0]T搖起到垂直向上的不穩定平衡點 xd=[0,0,0,0]T。
為實現這一目標,本文采用最優控制的思想來設計來設計控制律。取性能指標為:

對應的Hamilton函數為

則J取極值的條件為[8]:
正則方程:

控制方程:

將τ2代入正則方程有

將上述討論概括為下列定理:
定理1 設控制率無約束,則優化性能指標(8)的控制律為

其中參數λ滿足式(9)。
從式(11)容易得到下列結論:

對于時間最短性能指標MTC,即性能指標為

在式(12)中取β→0+,便有下列結論:

這是眾所周知的bang-bang控制。
至此優化控制問題轉化為解其初始條件為x(0)=[π000]T,λ(0)(為待定參數),求解微分方程組(2)和(10)的問題。
系統在任一位置的能量

其中:

將上式改寫為狀態空間形式,有

計算E(x)關于時間的全導數,有

構造Lyapunov函數

Ex=E(x)-Ed,Ed為頂點處勢能,δ為合適大小的正常數。
由式(18),沿運動軌跡(2)計算 V(x)的關于時間的全導數,利用式(18),有

取τ2=-Msign(Exx4),則有(x)≤0。換言之,存在bang-bang控制律,使V(x)單調不增。由拉薩爾不變集原理[9]可知,系統將收斂到不變集。
下面討論連續控制律式(11)下的穩定特性。設有某bang-bang控制律τ2使系統收斂到不變集,即(x)=Exx4τ2≤ 0。由式(14)知,-λTb 與 τ2同號,故Exx4τ2≤ 0→λTbExx4≤ 0,此意味式(10)的控制律也能使系統收斂至不變集。
將上述結論概括如下:
定理3 最優化性能指標的控制律確保系統運動至系統的最大不變集。
許多文獻的研究表明,一般情況下,系統的不變集包含了垂直頂部不穩定平衡點,但并不能保證系統運動至不穩點,系統將在不變集上做周期運動,這種情況下,須采取另一種控制律打破這種周期運動,這種切換控制的穩定性由開關定律得以保證。一種較為常見的處理方法是,在系統運動至不變集過程中,當系統的狀態變量滿足線性化條件時,將系統線性化,采用線性系統理論來設計控制器[3][5]。線性系統理論已經成熟,這里不做過多討論,線性化帶來的誤差處理方法可參見文獻[5]。
確定控制律的關鍵是求解正則方程(10),以系統進入吸引區(可線性化區域)為目標,求解微分方程(10)的初值條件λ(0),其算法流程圖如圖2所示。

圖2 確定λ(0)的算法
以文獻[3]為例,結構參數 θ1=1.333,θ2=1.33,θ3=1,θ4=14.7,θ5=9.8。搖起區采用最優控制律為τ2=-λTb,初始條件 λ(0)=[-9,-10,10,7]T。
線性化系統為[5]

其中

取吸引區性能指標[3]為

其中Q=I4,R=0.6。控制律取為狀態反饋τ2=Kx,控制增益為K=-BTR-1P,其中P是下列Ricatti方程的解。

由此可得


圖3 平衡區范圍為π/6的仿真結果
為方便比較,列出文[3]的結果如圖4所示。

圖4 文獻[9]仿真結果
本文結果系統在3.25 s處切換,在5 s附近穩定,文獻[3]中系統在7.66 s處切換,在9 s處穩定,本文結果優于文獻[3]。
提出了一種基于性能指標的Acrobot機器臂的控制方法,控制策略是使用最優控制律驅動系統向不變集運動,當系統運動至可線性化區域時,切換控制至LQR,使系統穩定在垂直向上平衡點。討論了最優控制律下系統的局部穩定性和切換控制的全局穩定性,建立了控制器的算法。值得一提的是,文中控制律可能出現奇異非平凡問題(即某時段內開關函數恒為0)是將來需要進一步解決的問題。