陳志勇,李振漢,張婷婷
(福州大學 機械工程及自動化學院,福州 350116)
為降低宇航員從事高危艙外作業的頻率、拓展人類對外層空間的探索范圍,空間機器人已逐漸被用于執行各類航天器對接、目標衛星抓取等空間試驗任務。空間機器人技術目前已受到美、加、俄、日、中等國的普遍關注[1-7]。近年來,各國部分已上天試驗或已進入實用階段的空間機器人系統雖能較好地執行預期所規劃的各種空間作業任務,但其操控精度卻在很大程度上受限于系統的結構柔性[8]。為了確保上述空間機器人的控制精度,人們常采用“低速、緩動”的操作模式來盡可能降低系統結構柔性的影響,但此種操控方式頗為被動且耗時耗力。可見,在系統數學建模、控制理論研究中主動計及結構柔性的影響,對于提高未來空間機器人的實時操控精度具有重要的現實意義。
我們注意到,目前國內外在處理空間機器人臂桿柔性問題上已積累了大量的研究經驗[9-10],在關節、基座柔性問題研究方面雖取得部分階段性成果卻仍存有大量問題亟待解決[11-13],尤其是針對關節柔性、基座柔性并存的工況[14]。通常來說,空間機器人的關節因制造、結構等原因往往存在有無法消除的柔性,而安裝于基座桁架導軌上機械臂的擺動又會使基座導軌出現柔性振動效應。顯然,上述兩種柔性效應共同影響下的空間機器人屬于一種結構更為復雜的剛柔耦合非完整動力學系統,其系統動力學方程已不滿足常規參數線性化性質;同時,由于太空環境極為惡劣,空間機器人受到外部干擾影響的概率很大,其控制系統所需各高階信號亦會因噪聲等原因而難以精確測得;再者,空間機器人載體姿態調整常通過反作用噴氣裝置來實現,但反作用噴氣裝置所提供的控制力矩很可能會因系統傳動等原因而出現不確定性控制輸入比例,進而影響整個系統的操控精度。以上這些問題都將使柔性基、柔性鉸空間機器人的動力學控制問題研究變得更有難度。奇異攝動技術常被用于實現柔性空間機器人控制器的設計,為了解決在結構或非結構不確定性影響下柔性空間機器人的控制問題,人們基于奇異攝動技術紛紛設計了自適應控制、魯棒控制、神經網絡控制等慢控制律與相應快控制律所組成的復合控制方案[15-17]。上述方案雖然達到了預期的控制效果,但都存在有不足之處。如許多自適應或魯棒控制方法往往要求慢變動力學模型必須滿足線性參數化性質;神經網絡控制器的結構及參數不易確定,且網絡在外部環境變化時具有一定的學習滯后性;此外,上述方案在設計過程中均忽略了系統所可能存在的高階信號難以精確測量及不確定控制輸入比例問題。
生物免疫系統是生物體中一種功能強大的信息處理系統,該系統內部所擁有的獨特信息處理機制使其在大量外部干擾及不確知環境中仍能保持有很強的魯棒性[18],此類系統能夠通過自身強大的免疫應答機制來精確識別并有效清除異物,以確保生物體各項機能的正常運行。與現有許多自適應、魯棒等控制方法相比,基于生物免疫系統演化得到的人工免疫控制器并不依賴于被控對象的數學模型且結構簡單,較適用于各類不確定非線性系統的運動控制[19]。
為此,本文針對具有外部擾動及不確定姿態控制輸入比例的柔性基、柔性鉸空間機器人系統,提出一種基于狀態觀測的模糊免疫混合控制及柔性振動抑制方案。結合柔性補償設計,推導了空間機器人的奇異攝動快、慢變子系統。在軌跡跟蹤控制方面,從T細胞介導的免疫應答過程出發,先行引入了一種傳統人工免疫控制算法;之后利用線性速度觀測器及模糊控制思想對上述控制算法加以改進,進而為慢變子系統設計一種對系統外部擾動、基座姿態控制輸入比例不確定性保持有良好魯棒鎮定作用的模糊免疫混合控制律。在基座、關節柔性振動抑制方面,設計了一種基于線性觀測器的最優控制律。利用所提方案對系統進行仿真控制,仿真結果驗證了方案的有效性。
在空間某位置執行平面操作任務的柔性基、柔性鉸空間機器人系統的結構如圖1所示。圖中,B0表示漂浮載體基座、B1和B2表示兩剛性外伸桿、B3表示末端夾持的目標體;O0表示載體基座的質心,O1和O2分別表示連接B0和B1、B1和B2的柔性旋轉鉸S1、S2的幾何中心。不失合理性,根據系統各構件的實際變形情況,將載體基座導軌柔性簡化為一個無慣性質量、只做平面軸向伸縮運動、彈性系數為k0的線性伸縮彈簧模型,將旋轉關節鉸Si(i=1,2)的柔性簡化為一個無慣性質量、只做平面旋轉運動、彈性系數為kim(i=1,2)的線性扭轉彈簧模型[20]。在空間機器人運行軌道上建立系統平動慣性系Oxy,并為系統各分體Bi(i=0,1,2)建立連體系Oixiyi;θ0,θi(i=1,2)分別表示載體基座姿態角及各剛性桿轉角,θim(i=1,2)表示各關節內部驅動電機轉角,x′和δi(i=1,2)分別表示空間機器人基座的線彈性變形及關節的扭轉彈性變形,且δi=θim-θi。文中各系統慣性參數采用如下符號進行約定:mi,Ji(i=0,1,2,3)分別表示分體Bi(i=0,1,2,3)的質量及轉動慣量;l0,li(i=1,2)分別表示載體質心O0沿x0軸方向到邊緣點Ob的距離、分體Bi(i=1,2)的桿長;Jim(i=1,2)表示機械臂關節鉸Si(i=1,2)內部驅動電機的轉動慣量。

圖1 柔性基、柔性鉸空間機器人Fig.1 Flexible-base flexible-joint space robot
參閱文獻[14]的建模過程,不計空間微重力,利用動量守恒原理及拉格朗日法,可進一步導出考慮了外部擾動及不確定基座姿態控制輸入比例影響下的柔性基、柔性鉸空間機器人的動力學模型

(1)

(2)

為將奇異攝動法應用到具有較小關節剛度柔性空間機器人的控制器設計,擬對τm實施如下柔性補償[21]
τm=knun-kekmδ
(3)

(4)
及柔性快變子系統動力學方程
(5)


針對慢變子系統式(4),本節擬借鑒生物免疫系統中的T細胞介導免疫應答機制及其免疫控制算法,設計一種不依賴于被控對象慢變子系統模型、基于速度觀測器且對系統不確定性保持有較強魯棒性的改進模糊免疫混合控制律。
人體免疫系統所產生的多功能干細胞可分化發育出兩大類細胞:B細胞和T細胞(包括輔助性TH細胞及細胞毒性TC細胞)。B細胞可分泌用于清除入侵抗原Ag的抗體Ab;輔助性TH細胞對B細胞的抗體分泌起促進性作用,同時也會對自身起到激活作用;細胞毒性TC細胞能夠殺傷靶細胞,且對B細胞的抗體分泌起抑制性作用。T細胞介導的免疫應答過程如圖2,其應答機制大致可描述如下。

圖2 免疫應答簡圖Fig.2 Map of immune response
(1)當抗原Ag侵入生物體后,輔助性TH細胞及細胞毒性TC細胞均會接收到入侵信息并得到不同程度的激活,進而對B細胞產生相應的刺激;
(2)在處于正反饋調節的免疫初期,主要是輔助性TH細胞得到較大活化,輔助性TH細胞在T細胞中的占比增大,而細胞毒性TC細胞在T細胞中的占比減小;此時輔助性TH細胞起決定作用,不斷活化更多的B細胞,活化后的B細胞則會分泌更多的抗體Ab來加速清除抗原Ag;
(3)在處于負反饋調節的免疫后期,隨著抗原Ag的減少,細胞毒性TC細胞得到較大活化,細胞毒性TC細胞在T細胞中的占比增大,而輔助性TH細胞在T細胞中的占比減小;此時細胞毒性TC細胞將不斷抑制輔助性TH細胞的活性,使B細胞減少抗體Ab的分泌;
(4)經過一段時間的免疫應答調整,生物免疫系統將趨于平衡穩定狀態。
結合上述免疫應答機制,設ag(κ)、ab(κ)、Th(κ)、Tc(κ)分別表示生物免疫系統第κ代的抗原濃度、抗體濃度、輔助性TH細胞濃度及細胞毒性TC細胞濃度。由于生物免疫系統中輔助性TH細胞、細胞毒性TC細胞分別對抗體Ab分泌起促進及抑制作用,故將ab(κ)與Th(κ)、Tc(κ)間的關系描述為
ab(κ)=Th(κ)-Tc(κ)
(6)
為確保免疫控制算法穩定,要求第κ代輔助性TH細胞濃度Th(κ)與第κ代抗原濃度ag(κ)滿足
Th(κ)=fh[ag(κ)]
(7)
式中:fh(*)表示一種類似于希爾函數的非線性函數。
生物免疫系統中細胞毒性TC細胞的分化一般與生物體內的抗體濃度及抗體濃度差有關,但相對于抗體濃度差的作用效果,抗體濃度影響較小。為此,忽略抗體濃度影響并設第κ代細胞毒性TC細胞濃度Tc(κ)與第κ-1代和第κ-2代的抗體濃度差Δab(κ-1)相關,且存在如下關系
Tc(κ)=fc[Δab(κ-1)]
(8)
式中:Δab(κ-1)=ab(κ-1)-ab(κ-2),fc(*)為一種適當選擇的非線性函數。
綜合考慮式(7)和式(8),式(6)可轉化為
(9)
若將上述免疫控制算法應用于空間機器人剛性運動控制器的設計,我們可將空間機器人的剛性運動跟蹤誤差視為生物免疫系統中入侵的抗原,其控制力矩視為生物免疫系統中用于清除抗原的抗體。當空間機器人跟蹤誤差較大(抗原較多)時,系統需較大的控制力矩(較多的抗體)來減小跟蹤誤差(清除抗原);當系統跟蹤誤差小到一定程度(抗原較少)時,其控制系統只需輸出較小的控制力矩(少量抗體)即可繼續減小跟蹤誤差(清除殘余抗原)。
由于本節考慮的是柔性基、柔性鉸空間機器人基座姿態調整、臂桿關節剛性運動的控制問題,下文擬為慢變子系統式(4)設計一種由三個并行的子免疫控制器所組成的人工免疫控制器。在該人工免疫控制器中,每個子免疫控制器對應控制一個運動對象,各子免疫控制器的設計過程如下文闡述。
令θ0d(t)、θ1d(t)和θ2d(t)為系統基座姿態角θ0(t)、連桿1關節角θ1(t)和連桿2關節角θ2(t)的連續二階可導期望函數,則系統的位置誤差ei(t)(i=0,1,2)可表示為
ei(t)=θi(t)-θid(t)
(10)
(11)

(12)


agi(t)=ki1ei(t)+ki2ωi(t)
(13)
式中:ki1和ki2(i=0,1,2)為用于調整子免疫控制器動態特性的控制常數。

(14)
結合輔助性TH細胞與抗原濃度ag(t)之間的變化趨勢,將式(7)中的非線性函數fh(*)設計為如下滿足希爾函數曲線特性的Sigmoid函數
(15)
同時,將式(8)中非線性函數fc(*)設計為

(16)

結合式(9)、式(15)和式(16),可獲得慢變子系統各子免疫控制器的控制律

(17)
結合免疫應答理論并觀察式(17)可知,本文所提免疫控制律實際上就是一個系統比例增益隨控制器輸出變化的Sigmoid函數非線性控制器。Sigmoid函數相當于擴展后的希爾函數,其變化趨勢與慣常希爾函數相一致,即中間密、兩邊疏的變化形式。眾所周知,模糊控制主要是利用人類控制專家總結的控制規則來實現被控對象的有效穩定控制;人們在設計模糊控制器時,也往往選用中間密、兩邊疏的形式。可見,Sigmoid函數的變化趨勢與模糊控制輸出量的變化趨勢相一致,其控制思想類似于模糊控制思想,人們常可通過選取適當的Sigmoid函數控制參數來確保此類控制器的穩定性。而此處結合了免疫應答機制得到的比例增益自調節Sigmoid函數控制器(即免疫控制律式(17))則可使系統具有較強的抗擾性及自適應能力,提高了系統的整體控制性能。
同時,免疫控制研究亦表明:在適當范圍內提高免疫控制參數kh、kc,可有效提高系統跟蹤精度及響應速度;但kc值選取過大則容易使系統產生過免疫“振蕩”問題。為此,下文擬引入一種模糊控制器來實時調節式(17)中kc的取值,即采用模糊控制動態輸出量kct來代替式(17)中的kc。





圖3 輸入量及輸出量kct的隸屬度函數Fig.3 Membership function of input and output kct
模糊控制器的推理算法采用Mamdani的最大-最小合成法;去模糊算法選用常見的面積重心法。

結合上述模糊控制器及式(17),可獲得修正后的基座姿態控制力矩
τ0(t)={kh-kctgc[Δτ0(t-ts)]}×
(18)
及第i(i=1,2)個連桿關節的慢變控制力矩

(19)


(20)

(21)

定義二次型能量指標函數
(22)
可設計出用于振動抑制的最優控制律
(23)
且Pf為如下方程的解
(24)
式中:Qf∈R6×6、Rf∈R2×2均為適當選取的對稱、正定權重常值陣。

將所提方案應用于圖1所示的柔性基、柔性鉸空間機器人的控制,并通過模擬仿真運算實驗來檢驗方案在系統剛性軌跡跟蹤控制及柔性振動抑制上的有效性。柔性基、柔性鉸空間機器人的參數見表1。

表1 空間機器人的慣性參數Tab.1 Inertial parameters of space robot
選取空間機器人所要追蹤的期望運動軌跡函數為(單位:rad)
同時,設動力學方程式(1)中的基座姿態控制力矩不確定輸入比例系數為Ψ=1.5,且系統所受到的有界外部擾動為(單位:N·m)
ud=[10sin(2t), 6sin(t), 5cos(3t)]T
系統基座、各連桿關節及各關節驅動電機的初始構形分別為
x′(0)=0 m,θ0(0)=0.05 rad,
θ(0)=[0.1,1.1]Trad,θm(0)=[0.1,1.1]Trad
用于仿真的系統控制參數選取為
ke=diag[32,32],Ψ0=1,Le0=Le1=Le2=40,
Lp0=Lp1=Lp2=40,k01=k11=k21=10,
k02=9,k12=k22=1.2,
Lξ=Lφ=diag[180,180,180],
Rf=diag[1,1],Qf=diag[0.01]6×6
利用由補償控制項式(3)、速度觀測器式(11)~(12)、模糊免疫混合控制律式(18)~(19)及基于式(20)~(21)的最優控制律式(23)組成的系統總控制律對式(1)~(2)所描述的柔性基、柔性鉸空間機器人進行實時運動仿真控制,仿真總耗時設定為t=10 s,采樣時間設定為ts=0.01 s。圖4為采用上述控制律得到的柔性基、柔性鉸空間機器人基座姿態角、機械臂各連桿轉角的跟蹤誤差收斂情況;圖5為其間系統基座姿態角速度誤差觀測量ω0(實線)、連桿1角速度誤差觀測量ω1(虛線)及連桿2角速度誤差觀測量ω2(點劃線)的收斂情況;圖6~8為開啟及關閉快變最優控制律式(23)時系統的柔性振動情況對比。其中,圖6為空間機器人載體基座的柔性振動情況對比;圖7為關節1的柔性振動情況對比;圖8為關節2的柔性振動情況對比。圖9為關閉快變最優控制律后系統的剛性軌跡偏離情況。



圖4 系統跟蹤誤差Fig.4 Tracking errors of the system

圖5 系統各角速度誤差觀測量Fig.5 Observation of angular velocity errors


圖6 基座的柔性振動Fig.6 Flexible vibration of the base


圖7 關節1的柔性振動Fig.7 Flexible vibration of joint 1
仿真圖4~5表明,在所提控制方案的控制下,空間機器人系統的基座姿態及各連桿關節將會穩定地跟蹤上其所期望的運動軌跡,并在仿真時間t=4 s之后達到較為理想的跟蹤精度,且系統各觀測角速度誤差同樣在經歷t=4 s的波動調整后也會漸近趨向于0;從圖6~9又可以看出,提出的快變最優控制律能夠快速、主動地抑制系統載體基座及關節所產生的高頻柔性振動,可有效降低機器人小范圍柔性振動對其大范圍剛性運動的影響,提高了系統的整體控制精度。


圖8 關節2的柔性振動Fig.8 Flexible vibration of joint 2

圖9 關閉最優控制后的軌跡跟蹤Fig.9 Trajectory tracking without the optimal control




圖10 新工況下的跟蹤誤差Fig.10 Tracking errors under the new working condition

圖11 新工況下的系統各角速度誤差觀測量Fig.11 Observation of angular velocity errors under the new working condition



圖12 新工況下的柔性振動Fig.12 Flexible vibration under the new working condition
上述各種仿真分析結果均表明,本文設計的基于柔性補償、狀態觀測的改進模糊免疫混合控制及抑振方案是可行、有效的。
(1) 所提改進模糊免疫混合控制及抑振方案由于結合了關節柔性補償控制設計,因此可適用于具有較強關節柔性的柔性基、柔性鉸空間機器人系統的控制。
(2) 通過在慢、快變子控制律設計中引入線性速度觀測器,提出的方案可有效避免對系統的相關速度信號進行測量與反饋;其中的模糊免疫混合控制律可獨立于被控慢變子系統模型而設計,其結構簡單、易于實現,并使系統具有較強的抗擾能力。
(3) 仿真控制結果表明,所提控制方案能夠有效消除系統不確定性影響,確保柔性基、柔性鉸空間機器人剛性期望運動軌跡的精確跟蹤及基座、關節柔性振動的主動、有效抑制。