雷榮華 陳 力
1.福州大學機械工程及自動化學院,福州,350116 2.福建省高端裝備制造協同創新中心,福州,350116
空間機器人不僅能降低宇航員出艙活動的危險,還可以減少載人航天的費用,因此,對空間機器人的動力學與控制進行研究是當前航天領域的研究熱點[1-3]。空間機器人的執行器長期重復地執行控制指令,極易發生失效故障,而執行器的失效,輕則導致系統控制精度下降,重則導致整個控制系統崩潰。由此可見,空間機器人的執行器失效是一類發生幾率高且危害大的故障。值得一提的是,空間機器人由于缺少地面站的支持,一旦執行器發生故障,往往是無法維修的,因此在不對其進行外部維修而僅依靠自身容錯能力來維持控制系統的可靠運行,在整個航天任務中顯得至關重要[4-6]。
空間機器人的載體基座處于自由漂浮狀態,機械臂關節與載體之間存在強烈的運動學與動力學耦合作用,這就導致對地面機器人行之有效的控制方法通常都難以直接推廣到對空間機器人的控制當中[7-9]。近年來,空間機器人控制方法的研究在理論和實際應用中都取得了一些新成果。針對受外部擾動的空間機器人,于瀟雁等[10]設計了一種無速度反饋的增廣自適應算法,該算法僅需測量系統的位置信息就可以實現期望軌跡的精確跟蹤控制;對于空間機器人執行器輸出力矩受限的問題,梁捷等[11]提出了一種自適應抗飽和模糊神經網絡控制器,實現了有限輸出力矩條件下載體與機械臂關節之間的協調運動。對于參數不確定與受外部干擾的空間機器人,謝立敏等[12]提出了一種魯棒反步控制法,保證了機械臂運動軌跡相對參考軌跡的漸進跟蹤。葉柄能等[13]基于時延估計技術對參數不確定的空間機器人提出了一種魯棒H"控制方法。但以上研究并未考慮執行器部分失效故障對系統控制性能的影響。LUCA等[14]利用高階滑模觀測器實現了對機械臂系統執行器故障的實時估計,但并未給出有效的容錯控制方法以實現對關節期望軌跡的跟蹤控制。對于執行器發生部分失效故障的可重構機械臂,趙博等[15]設計了一種基于神經網絡的分散容錯控制方法,但該方法需要測量系統的速度信號。當前,針對執行器故障的容錯控制研究主要集中于地面機器人,而專門針對空間機器人的相關研究尚不多見。
本文針對執行器發生部分失效故障的空間機器人,設計了一種非奇異終端滑模分散容錯控制方法。
做平面運動的n連桿空間機械臂系統結構如圖1所示。該系統由自由漂浮的衛星基座(載體)B0與剛性臂Bi(i=1,2,...,n)組成。其中,OXY為系統的慣性坐標系,oixiyi為各分體(載體或某剛性臂)的主軸坐標系;Oc為系統質心,Oci為各分體的質心,Oi為各分體的轉動中心,且Oc0與O0重合;忽略安裝在各分體上的驅動電機的質量[12],mi、Ji分別為各分體的質量和轉動慣量;l0為基座轉動中心O0與剛性臂B1的轉動中心O1之間的距離,li為機械臂Bi的長度,di為轉動中心Oi到質心Oci之間的距離;ri、rc分別為各分體質心Oci和系統質心Oc相對坐標原點O的矢徑;θ0為y0軸與Y 軸之間的夾角,θi為yi-1與yi之間的夾角。載體可做平面移動與繞其轉動中心O0的平面轉動,機械臂Bi做繞Oi的平面轉動。

圖1 漂浮基n連桿空間機械臂Fig.1 A free-floating n-link space manipulator
考慮在每個分體上安裝執行器(驅動電機)以控制其轉動。執行器故障可分為加性故障與乘性故障,本文僅考慮乘性故障,因此將故障建模成乘積因子的形式[6]。假設此空間機械臂在運動過程中不受外部力或(和)力矩作用,則系統滿足線動量守恒定理。根據拉格朗日法,可得載體位置不控、姿態受控的n連桿空間機器人的系統動力學方程為

式中,q=[θ0,θ1,…,θn]T為系統的廣義坐標;D(q)∈R(n+1)×(n+1)為系統的對稱、正定慣性矩陣;H(q,q·)q·為系統包含科氏力、離心力的列向量;τ為載體與關節的執行器驅動力矩組成的列向量;ρ為表示執行器的有效因子的對角矩陣。
第i個子系統執行器的有效因子滿足0<ρi≤1(i=1,2,…,n+1),ρi=1表示第i個執行器正常工作,0<ρi<1表示第i個執行器發生部分失效故障但仍在工作,因此有效因子可作為執行器當前健康狀態的表征。
空間機器人系統動力學方程(式(1))中的相關矩陣具有如下性質[10-11]。
性質1 矩陣D(q)為有界矩陣,即‖D(q)‖≤ξD,其中ξD為正常數,‖·‖表示標準歐氏范數。
性質2 矩陣D(q)與H(q,q·)滿足斜對稱關系,即yT(D·(q)-2 H(q,q·))y=0,y∈Rn+1。
傳統的集中控制方法存在控制器維數高、結構復雜、計算量大的問題,尤其是隨著桿件數量(自由度)的增加,這些問題將變得更加突出。為了簡化控制結構,可將各分體考慮為一個交聯子系統,采用分散控制器對每個子系統進行單獨控制,同時利用分散神經網絡對交聯項進行補償。
從式(1)的系統動力學方程中分離出局部變量(qi,q·i,q··i),i=1,2,…,n+1,則子系統的動力學模型可以描述為[15]

式中,Di(qi)為子系統的慣性參數項;為子系統科氏力、離心力項;分別為向量τ的第i個元素;Dij(q)、Hij(q,q·)分別為矩陣D(q)、H(q,q·)的第ij 個元素;Zi()為子系統交聯項。
定義子系統的狀態向量xi=(xi1,xi2)T=()T,i=1,2,…,n+1,則式(2)可寫成如下的狀態空間方程

因此,本文的控制目標是針對載體位置不控、姿態受控的空間機器人動力學子系統(式(2)),設計一種融合有效因子的非奇異終端滑模容錯控制器。利用神經網絡對系統的執行器故障進行估計,并自適應地補償神經網絡逼近誤差,保證控制系統的穩定性,使得空間機器人在執行器發生故障的情況下,系統輸出軌跡仍然能跟蹤給定期望軌跡。
定義qi、q·i分別為qi與q·i的觀測值,令xi1=qi,xi2=q·i。設計分散滑模觀測器為

式中,ki1為增益fi(qi,q·i)與gi(qi)的神經網絡估計;vi(ei2,θip)為補償交聯項對系統影響的待設計項;δi用于補償神經網絡估計誤差對控制精度的影響。
定義狀態xij的觀測誤差為eij=xij-xij(j=1,2),結合式(4)與式(5)可得相應的狀態誤差動力學方程為

由式(4)可知,fi(qi,q·i)、gi(qi)分別為關于(qi,q·i)和qi的非線性未知函數。由于神經網絡函數能以任意精度逼近緊集內的非線性光滑函數[15],故采用學習速度快 的徑向基(radial basis function,RBF)神經網絡,分別以(qi,q·i)與qi為輸入樣本,利用 RBF神經網絡對fi(qi,q·i)與gi(qi)進行逼近。假設理想神經網絡逼近為

式中,θif、θig分別為fi(qi,q·i)和gi(qi)的理想神經網絡權值;σif、σig為神經網絡基函數;εif、εig為神經網絡估計誤差,且εif與εig未知有界。
定義θif、θig分別為θif、θig的估計值,σif、σig分別為σif與σig的估計值,則fi(qi,q·i)與gi(qi)的RBF神經網絡輸出為

定義權值估計誤差θ~if=θif-θif,θ~ig=θig-θig,有

采用下式所示的RBF神經網絡補償交聯項hi(q ,q·,q··)對系統的影響:

式中,θip為理想權值θip的估 計值,θ~ip為 權值估計誤差;σip為基函數σip的估計值,σ~ip為估計誤差。
假設1 交聯項hi(q,q·,q··)有界且滿足

自適應參數θif,θig,θip與δi的更新律設計為
3個學段,北京版、北師版、冀教版和人教版的平行四邊形內容有13個知識點,蘇教版和青島版有11個知識點.其分布詳見表3.

式中,ηif、ηig、ηip、λi為自適應調節系數,且均為正常數。
定義神經網絡的最小估計誤差為

假設2 神經網絡估計誤差ωi= ωi1+ωi2有界,且滿足

式中,δi為δi的理想值。
定理1 對于式(4)的故障子系統模型,在假設1與假設2成立的前提下,采用式(15)~式(18)所示的參數更新律,可保證式(5)的滑模觀測器的觀測誤差漸進收斂至零,即當t→∞,eij→0。
證明:構造如式(22)所示的正定Lyapunov函數

從以下兩個步驟來對定理1的結論進行證明。
(1)將V1對時間求導,可得


注意到ei2<ej2Ei<Ej,應用Chebyshev不等式[15],可得


為了使空間機器人在執行器發生部分失效故障情況下,系統輸出軌跡仍然能夠穩定地跟蹤期望軌跡,本文設計了一種非奇異快速終端滑模分散容錯控制律,可以有效改善系統的控制性能。
定義期望軌跡為qd=[θ0dθ1d… θnd]T,其中θid,θ·id與 θ··id(i=0,1,…,n)均為連續有界函數。狀態xi1的跟蹤誤差為

式(27)對時間求導,可得

非奇異快速終端滑模面si設計為

式中,αi、βi為正常數;ki、li、pi、qi為正奇數,且滿足1<pi/qi<2,ki/li>pi/qi。
式(29)對時間求導,并利用式(5)的第二式,可得
基于非奇異快速終端滑模的分散容錯控制律設計如下:


式中,ζi與ηi為正常數。
由于1<pi/qi<2,ki/li>pi/qi,故式(31)的控制律不含任何負指數項,因此不存在計算奇異問題。
定理2 對于故障子系統模型(式(4)),設計分散滑模觀測器(式(5)),應用終端滑模容錯控制律(式(31)),可保證整個閉環系統漸進穩定,即當t→∞,εi→0。
證明:構造正定Lyapunov函數

式(32)對時間求導,可得

將式(31)代入式(33),可得

由此可見,當si≠0時,由于1<pi/qi<2,則0<pi/qi-1<1,考慮到βi>0,pi與qi為互質奇數,因此

(2)當εi=0,而εi≠0時,系統處于非穩定狀態,可以證明系統不會一直保持在此狀態(εi=0,εi≠0),而將漸進地抵達并保持在非奇異終端滑此時軌跡跟蹤誤差εi也會漸進收斂至零。
綜上可知,閉環系統是漸進穩定的。定理2證畢。
值得注意的是,式(31)的控制器并不含有效因子,因此該控制器不需要了解執行器故障的具體信息,適合于所有執行器部分失效故障的容錯控制。自適應神經網絡減弱了傳統控制算法對執行器故障下確界必須是已知的約束[6],便于工程實現。
為驗證本文提出的分散容錯控制律的有效性,對圖1所示的平面空間機械臂系統進行數值仿真,取n=2。空間機器人的慣性參數為m0=40kg,m1=m2=3kg,l0=1.5m,l1=l2=3m,d1=d2=1.5m,J0=34kg·m2,J1=J2=1kg·m2。
對于前述RBF神經網絡,選取基函數為高斯函數:

式中,xif,xig與xip為高斯函數的輸入變量;cif,cig與cip為高斯函數的中心;bi為高斯函數的寬度。
選擇神經網絡參數為:輸入變量xif=心cif,cig與cip隨機地分布在區間[-2.5,2.5],寬度bi=2;神經網絡隱層節點數為5。
采用以上的慣性參數與神經網絡參數,針對常值型與隨機時變型執行器失效故障進行仿真。仿真時考慮了空間機器人工作過程中最嚴重的一種故障情況,即所有執行器均發生部分失效故障。
常值型故障的有效因子ρi(i=1,2,3)可描述為[5]

控制器參數選取為pi=5,qi=3,ki=7,li=3,ki1=0.16,αi=18,βi=22,ζi=45,ηi=20;自適應增益系數選取為ηif=0.000 2,ηig=0.000 2,ηip=60,λi=5;載體與關節的期望軌跡選取為θ0d=cos(0.2πt)-1,θ1d=sin(0.2πt),θ2d=cos(0.2πt);系 統 初 始 運 動 位 置 為 q (0)=[0.1 0.2 0.8]T,xi1(0)=0.5;初 始 速 度 為q·(0)=[0 0 0]T,xi2(0)=0。仿 真 結 果 見圖2。
由圖2可知,在故障未發生時,盡管初始階段存在一定跟蹤誤差,但由于容錯控制器的作用,使得載體、關節1與關節2分別在2s、6s與1s內實現對期望軌跡的穩定跟蹤,直至在故障發生時,仍能保持這種良好的跟蹤性能。仿真結果表明所設計的控制器對常值型執行器故障的容錯有效性。
隨機時變型故障的有效因子ρi可描述為[6]


圖2 軌跡跟蹤曲線(常值型故障)Fig.2 Trajectory tracking curves(constant faults)
式中,rand(1)表示為0至1之間的一個隨機常數[6]。
控制器參數選取為pi=5,qi=3,ki=7,li=3,ki1=0.14,αi=25,βi=25,ζi=35,ηi=6;自適應增益系數選取為ηif=0.000 2,ηig=0.000 2,ηip=75,λi=2;載體與關節的期望軌跡選取為θ0d=sin(0.2πt),θ1d=cos(0.2πt)-1,θ2d=sin(0.2πt);系 統 初 始 運 動 位 置 為 q (0)=[-0.2 0.2 0.1]T;初 始 速 度 為 q·(0)=[0 0 0]T,xi2(0)=0。仿真結果見圖3。
由圖3可知,當執行器發生隨機時變型失效故障時,盡管有效因子未知,但由于神經網絡控制器對其具有良好的在線估計能力,能夠及時消除失效故障對控制系統的影響,使得載體、關節1與關節2分別在6s、1s與3s內實現對期望軌跡的穩定跟蹤。仿真結果表明所設計的控制器對于隨機時變型執行器故障亦具有良好的容錯能力。

圖3 軌跡跟蹤曲線(隨機時變型故障)Fig.3 Trajectory tracking curves(stochastic time-varying faults)
本文針對執行器發生部分失效故障的空間機器人,提出了一種基于非奇異終端滑模的容錯控制方法。利用分散神經網絡對系統的執行器故障進行估計,根據估計結果在線設計控制律消除執行器失效故障對系統穩定性的影響,并通過數值仿真驗證了控制方法的有效性與理論分析的正確性。
本文提出的控制方法具有以下優點:非奇異快速終端滑模避免了傳統線性滑模的計算奇異現象;自適應神經網絡減弱了傳統容錯控制方法中對執行器故障下確界必須是已知的約束;利用速度觀測器對系統的速度信號進行了實時觀測,可以一定程度上代替速度傳感器,節省了載人航天的成本。該控制方法具有潛在的工程應用前景。