馬衛華,袁大鐘,孟思洋,羅建軍
(1. 航天飛行動力學技術重點實驗室,西安 710072;2. 西北工業大學航天學院,西安 710072;3.上海機電工程研究所,上海 201109)
對空間目標,特別是非合作目標,進行慣性參數辨識是實施后續精準操作的基礎,典型的辨識策略大致分為兩類,基于視覺測量的非接觸式辨識和基于主動激勵的接觸式辨識。
Aghili[1]針對攜帶相機的機械臂,建立了基于目標表面特征點信息的非接觸參數辨識方法,基于傳統運動學模型,采用濾波方法估計目標的姿態參數、轉動慣量比以及質心位置。在此基礎上,Hou等[2]改進運動學模型,采用對偶四元數重新建模,減少了辨識過程中的計算量。這類辨識方法無需和被測目標發生物理接觸,但只能辨識目標的質心位置和轉動慣量比,無法給出轉動慣量絕對值,以及非常重要的質量信息。
接觸式辨識多見于攜帶機械臂的空間操作機器人,將操作平臺和非合作目標通過機械臂物理連接構建為組合體,利用操作平臺的主動激勵改變組合體線運動和角運動,實施對組合體的慣性特征參數辨識。Yoshisada等[3]詳細闡述了基于兩大原理(動量守恒方程、牛頓-歐拉方程)的空間非合作目標慣性參數辨識方案,利用線性辨識方程求廣義逆完成目標慣性參數辨識。Roberto和Gerhard[4]利用牛頓-歐拉方程,并通過使用加速度計測量來辨識空間非合作目標的慣性參數。
目前很多學者對于目標慣性參數辨識的研究都是基于動量守恒原理,在剛體/撓性體、辨識求解方法等方面開展的。
采用剛體目標假設,Walker等[5]學者引入線動量守恒方程與角動量守恒方程,根據機器人運動學,采用單臂連續運動的激勵方式,實現了空間機器人慣性參數的完全辨識; Ma等[6]提出了基于單機械臂主動機動從而辨識本體參數的方法,利用機械臂運動改變本體運動,只需要測量本體的速度、角速度,即可實現空間本體慣性參數的完全辨識,辨識算法簡化,實現方案容易;金磊等[7]基于動量守恒原理提出了全增量式(線動量和角動量)的辨識方程,研究了單臂自由飄浮空間機器人抓取未知目標的質量特性參數辨識問題;洪炳镕等[8-9]基于動量守恒原理針對雙臂/多臂機器人探討了其捕捉非合作目標過程中的參數辨識;為提高辨識精度,Chu等[10]學者提出引入末端操作機構的接觸力信息,較為準確的反映出操作階段的運動學、動力學過程,避免常規外界測量誤差對系統辨識精度的影響,從而更能準確的描述抓捕作用過程,改善辨識效果。采用撓性體目標假設,何驍等[11]針對大角度機動情況下帶撓性附件航天器轉動慣量在軌辨識的問題,提出一種將轉動慣量參數估計和撓性附件狀態估計相結合的并發遞推算法。
在辨識求解方法上,除了常規最小二乘法外,徐文福等[12]提出了基于參數解耦的最小二乘法和基于PSO算法的非線性優化兩種方法;孫俊等[13]針對傳統依賴廣義逆求解的辨識方法的問題,諸如辨識過程運算量大、數值容易產生劇烈振蕩,造成辨識結果不穩定等,采用基于歸一化最小均方(Normalized least mean square, NLMS)準則的Adaline神經網絡方法進行空間非合作目標慣性參數的辨識,但需要解決NLMS準則中α,β參數的最優選取問題。顯然,優化、智能算法將會進一步應用于目標慣性參數辨識中。
綜上可見,僅依賴視覺的非接觸辨識方法,無法獲得目標轉動慣量和質量信息;而接觸式辨識中,要求本體必須具備主動激勵能力,這對于未裝備機械臂之類裝置的飛行器,特別是微小型衛星平臺而言是較難實現的。
隨著微重力環境黏附技術的發展[14],具備黏附能力的新型飛行器有望形成。這類裝有黏附裝置的空間飛行器在具有一定相對沖量的前提下,可黏附在目標航天器表面上。而對于空間目標來說,相對沖量是一種自然激勵,會導致其運動狀態的變化,相當于產生了接觸辨識中的主動激勵。因此,黏附過程應當具備辨識空間目標慣性參數的潛力。
由于一般情況下黏附過程的激勵程度較小,完整辨識目標慣性參數的能力有限。為此,本文基于非接觸辨識和接觸辨識的特點,提出了基于黏附激勵的辨識方法。首先采用視覺非接觸辨識方式,建立基于視線信息估計目標慣性參數和相對運動參數的濾波器,并估計黏附前的目標質心和轉動慣量比;然后利用黏附激勵改變目標運動狀態,直接利用非接觸方式的濾波器估計黏附后目標(組合體)質心運動速度,并基于動量守恒辨識目標質量參數;最后通過數值仿真完成驗證了方法的有效性。
假設主星攜帶黏附衛星,并安裝有相機來獲取目標特征點的位置和視線信息,圖1給出了目標和主星的相對位置關系。
借鑒文獻[1]中Aghili的研究工作,定義相關物理量及坐標系含義:{A}代表慣性坐標系,原點在主星質心處;{B}代表目標本體系,三軸方向與目標主軸方向平行,原點在目標的質心處;{C}代表目標表面特征點本體系,原點在特征點處。鑒于部分特征點本體系和目標本體系近似重合,為簡化問題,在此假設{C}和{B}重合。

轉動慣量比p定義為[1]:
(1)
式中:Ixx,Iyy,Izz為目標的主慣量矩。
因為假設{C}和{B}近似重合,所以本節定義的狀態向量數目少于Aghili給出的狀態向量,狀態方程、觀測方程和文獻[1]對應模型相比略微簡單。后續1.2、1.3、1.4節中的參數模型的具體推導過程可參見文獻[1]。
選取目標姿態四元數矢量部分qv、旋轉角速度ω、質心r、速度v、轉動慣量比p和特征點相對目標質心位置ρ構建狀態向量:
(2)
通過對文獻[1]狀態方程適當簡化得到:
(3)
(4)
(5)
其中,
B=diag(bx,by,bz),
式中:用a×表示矢量a對應的反對稱矩陣,ω×即為矢量ω對應的反對稱矩陣。
ε表示系統噪聲,
(6)
式中:ετ和εf為過程噪聲,均定義為標準正態分布的白噪聲。
主星可以利用相機獲取目標表面特征點的方位信息以及位置信息(均在坐標系{A}中測量得到),定義測量矢量z為:
(7)
其中:rs為特征點在{A}系中的位置,其模型為[1]:
rs=r+A(q)ρ
(8)
其中:A(q)是從{B}系到{A}系的坐標旋轉矩陣,由四元數q確定:
(9)
其中:η為特征點在{A}系中的位置和特征點坐標系姿態指向四元數,近似認為和q相同:
η=q
(10)
式(7)中的ν表示測量噪聲,假設為高斯白噪聲,協方差R=E[ννT]。
擴展Kalman濾波要求對非線性狀態方程和觀測方程(7)作線性化。在文獻[1]中相關矩陣基礎上,本文直接簡化得到對應的雅克比矩陣。
狀態方程的雅克比矩陣F為:
(12)
(13)
N(ω)=diag(ωyωz,ωxωz,ωxωy)
(14)
觀測方程的雅克比矩陣H
(15)
(16)
聯合式(3)、式(7)、式(12)、式(15),利用擴展卡爾曼濾波基于視覺信息估計黏附前目標質心和轉動慣量比。
黏附過程中,目標受到黏附衛星的碰撞后會有兩種運動情況:一種是碰撞后彼此分離,沿各自軌跡進行運動;另一種是碰撞后連接形成組合體一起運動。假設黏附能力足夠強,黏附衛星和目標形成了組合體,如圖2所示。
VT,VS和V′分別為目標黏附前速度、黏附衛星初始速度和黏附后組合體速度;ms,mT分別表示黏附衛星質量、目標星質量;ωr,ω′分別表示黏附前后目標的旋轉角速度。
黏附前及黏附后,主星將持續觀察目標,借助1.2節的濾波器可以估計黏附后目標的質心速度,估計算法和第1步完全一致。
黏附前后滿足動量守恒:
mSVS+mTVT=(mS+mT)V′
(17)
該動量守恒方程在主星當地軌道坐標系中是成立的,方程中的速度均是相對速度,數值一般比較小,碰撞前目標和主星保持相對靜止,目標速度一般可認為接近0,則上述模型可以進一步簡化為
mSVS=(mS+mT)V′
(18)
目標質量的估計模型為
mT=mS(V′TVS)(V′TV′)-1-mS
(19)
如果假設黏附衛星質量、目標質量、黏附衛星速度、目標黏附后速度的測量精度均方差分別用σδmS,σδmT,σδVS,σδV′表示,根據式(18)可以得到辨識后質量的相對精度模型:
(20)
式中:σδmT是目標質量誤差的協方差。顯然,目標質量相對精度和黏附衛星初始速度有關,隨其數值增大而提高,和黏附衛星/目標的質量比也有關,如果二者質量相近,則目標質量估計精度最好,反之則會變差。
3.1.1目標參數和黏附衛星參數
根據文獻[1]設定主星部分狀態的真值見表1,
論文仿真計算中對應的狀態估計初值及部分誤差參數也列于該表。
黏附衛星的質量、在目標軌道系初始速度和黏附點在目標本體系下位置分別為20 kg、[0.5 m/s,0 m/s,0 m/s]和[0.25 m,0 m,0 m]。為驗證不同質量比下目標質量的辨識精度,目標質量分別設定為2 kg,4 kg,20 kg,80 kg,200 kg,黏附衛星/目標的質量比分別為10,5,1,0.2,0.1。
3.1.2測量與其他仿真參數
目標姿態軌道的動力學/運動學積分步長為0.05 s,測量裝置的輸出頻率2 Hz。測量的特征點位置和方位精度分別為0.045 m(1σ)和0.003°(1σ)。
3.1.3仿真計算流程
完整仿真數據流程如下圖所示。
3.2.1黏附前的目標特性參數估計
目標轉動慣量比估計變化如圖4所示,目標質心位置估計誤差、質心運動速度估計誤差、特征點位置估計誤差曲線分別見圖5、圖6、圖7。圖4中三條虛線表示標準的轉動慣量比,圖5~圖7中對稱分布的黑色曲線為估計誤差協方差值(3σ),考慮到三軸數據類似,圖5~圖7只提供了X軸數據。
根據仿真結果可見,大概30 s后目標轉動慣量比、質心位置、質心速度和特征點位置的估計值分別接近真實值,誤差基本在3σ誤差協方差曲線以內,誤差估計和方差吻合得比較好。表2給出了仿真所得的參數辨識末端精度,對應的三向合成精度分別為0.08 m(1σ)、2.47 mm/s(1σ)、0.0053(1σ)、0.07 m(1σ)。

表2 黏附前辨識末端的目標參數精度Table 2 Terminal estimation precision of target parameter before adhesion
基于視覺信息的濾波計算可以較好的估計出目標的質心、質心速度、轉動慣量比以及特征點位置等參數。特別是目標質心速度的良好估計,為黏附后黏附過程的目標質量辨識提供了良好的條件。
3.2.2黏附后的目標質量估計
根據式(20),目標質量估計精度主要取決于黏附衛星/目標的質量比以及目標質心速度精度。
首先估計目標質心速度精度。
主星采用和黏附前相同的濾波器估計組合體質心速度,黏附衛星/目標不同質量比下黏附后目標質心運動速度估計如圖8所示,圖中對稱分布的虛線為估計誤差協方差值(3σ),末端精度統計見表3。圖形左端的數字表示黏附衛星/目標質量比。

黏附衛星與目標質量比速度估計精度/(mm·s-1,1σ)X向Y向Z向三向10510.20.1101.591.331.652.6552.601.482.934.1912.951.643.444.820.21.151.141.141.980.13.943.572.225.76
從末端精度統計看,組合體質心速度估計精度沒有呈現明顯規律性變化,各種情況下的精度相差不大,基本可以認為在mm/s量級精度范圍,因此可以近似認為目標和微小衛星的質量比變化時,組合體質心速度估計精度是近似相當的。
其次針對不同目標/黏附衛星質量比分析目標質量估計精度。
完成5種工況下的仿真結果,鑒于結果曲線波動形態較為相似,在此僅給出黏附衛星/目標質量比為10和1的仿真曲線,相對誤差的統計分析結果展示于表4中。
依仿真可見,依據動量守恒定理計算目標質量時,目標質量估計精度受黏附衛星/目標質量比的影響很明顯。兩者質量相當時,質量估計精度最高,相對精度大概5%;隨著質量差異明顯,精度逐漸下降,在比值為1∶10或10∶1時(見圖9,圖10),目標質量辨識的相對誤差在20%左右。

黏附衛星/目標質量比目標質量估計相對誤差/%1∶10201∶5101∶155∶11010∶120
黏附衛星以一定相對速度逼近并黏附于目標,產生可改變目標運動狀態的自然激勵,文中基于此提出了利用黏附過程的自然激勵實施空間目標慣性參數辨識的辨識方法。
相對于常規辨識方法,文中提出的辨識方法僅利用主星視覺測量、充分利用黏附過程自然激勵即可實現對目標轉動慣量比、質心和質量的辨識,無需常規辨識方法必須的額外主動激勵,且辨識過程中算法統一、無需切換,使用更為便捷。
仿真結果證實了所提方法能夠實現對非合作目標質心、質心速度、轉動慣量比的估計,驗證了算法的可行性。
鑒于算法和目標、主星、黏附衛星的初始狀態有密切關系,且沒有獲取目標轉動慣量具體數值。后續將對此進行完善,分析算法穩定運行條件,并將辨識約束融入黏附策略設計中。