張 召,王 恒,荊武興,高長生
(哈爾濱工業大學航天學院,哈爾濱 150001)
為降低對彈道導彈中段目標群識別技術的需求,美國導彈防御局提出一種多攔截器(Multiple kill vehicle,MKV)技術[1-2]。它通過運載器將一個攜帶多枚微小型攔截器(Kill vehicle,KV)的母艙送至指定位置,然后釋放攔截器對一定范圍內所有目標進行打擊[3]。針對上述場景,本文重點研究多攔截器對多目標的協同跟蹤以及協同制導問題。
多傳感器對多目標的協同跟蹤[4-5],一般包括傳感器管理和多源信息融合兩個內容。在MKV作戰中,傳感器管理和攔截器管理是耦合在一起的,甚至后者優先級更高,屬于武器目標分配問題(Weapon-target assignment,WTA)[3,6]。在完成WTA后,傳感器分配的操作空間不大,本文將研究重點放在了多源信息融合上。
攔截器配備的紅外導引頭,可以提供自己目標及其臨近目標的角度信息[7]。但相應的可觀測性較低,對目標狀態的估計精度不高[8]。多傳感器信息融合,是提高估計精度的有效方法。從結構上看,多源信息融合可分為3種[9]:集中式測量融合,分布式狀態融合和混合式融合。集中式測量融合架構的核心是信息融合中心,它接收所有傳感器的測量數據并負責所有的數據處理工作,如此可以有效利用探測信息,形成全局最優的估計結果。然而,集中式方法存在著一些缺點,比如生存能力低、可靠性低、較重的通信負擔和計算消耗[10]。分布式狀態融合根據各傳感器對觀測目標的測量數據,分別進行濾波跟蹤,生成多個局部航跡,信息融合中心接收所有的局部航跡,對各局部航跡進行數據關聯和融合等處理。如此減小了網絡通信壓力,避免了大范圍網絡不確定性問題,但仍存在傳感器不確定性問題[11]。混合式融合結構兼具上述兩者的優點,但缺點是通信帶寬和計算量更大。為滿足大氣層外多傳感器信息融合的要求,需要綜合以上結構的特點,重新設計融合結構。
同時需要注意,以傳感器網絡的形式進行工作,需要處理以下不確定性問題:網絡延遲、丟包以及測量丟失(或者傳感器故障)。一般而言,這些不確定性可以用隨機參數進行描述[12],比如一個四維狀態馬爾科夫鏈[13]或三個伯努利隨機變量[14],然后基于這些隨機參數的描述,使用新息分析的方法可以推導出一些次優和最優的濾波算法[12]。其中一個比較重要的問題是,出現故障的傳感器如果不能即時診斷和隔離,會造成隨即變量相關性問題,嚴重影響信息融合的精度和穩定性。一些學者的處理辦法是改變隨機變量的模型[15],而這又會涉及到模型結構和參數的設計問題。為保證信息融合的穩定性,亟需開展針對大氣層外傳感器網絡的故障診斷和隔離研究。
多攔截器對多目標的協同制導,是指各攔截器之間在飛行中相互配合,遵循某種戰術策略意義上的運動學規律,共同完成制導任務[16]。協同制導的研究主要集中在實現制導時間、空間或功能上的協同一致性。當前熱點集中在無人機協同問題、平臺問題、反艦以及防空問題等[17-18]。主要有兩種協同方式,隱式協同和顯式協同[19]。在隱式協同中,飛行器之間通過設置一些參數來實現協同,比如要求攔截器以一定的角度攔截目標;而在顯式協同中,則需要優化一些團隊性能指標,例如需要多枚攔截器保持一定的幾何構型。相對來說,隱式協同設計方法較為簡單,靜態或動態地給各個飛行器分配協同參數,然后以帶約束方式設計其制導律即可;而顯式協同需要考慮的約束更多,本文不做研究。一般而言,帶約束的制導可以看作是經典比例導引的衍生算法,相應的設計方法有滑模控制、最優控制、微分對策、線性二次型調節器等[19-21]。然而,該領域研究大多針對大氣層內飛行器,而且需要連續可變控制力,這是大氣外飛行器所不能提供的。蘭伯特制導雖能實現時間控制,但是需要攔截器以速度突變方式工作,與實際的有限推力不符。隨著MKV技術的發展,為避免攔截作戰相互間的干擾,對多目標實現同時擊毀的需求越來越迫切,需要對此時間協同制導進行研究。
針對上述多源信息融合、傳感器故障、大氣層外時間協同制導三個問題,本文進行了細致的研究。首先,提出各攔截器與其周圍數個攔截器共享測量數據,進行局部集中式測量融合的策略,以避免紅外測量信息不完全和全局融合造成的大范圍網絡不確定性問題;然后,對于傳感器故障,本文將研究的重點放在了診斷和隔離上,使用殘差檢驗的方法,及時隔離出現故障的傳感器,排除其對估計的影響;最后,為實現時間協同,本文以隱式協同的方式預設各個攔截器的打擊時間,并以此為約束結合相對運動解析解設計其制導律,保證多枚攔截器在同一時間擊中各自的目標。
在MKV技術研究上比較成熟并且取得了初步研究成果的機構主要有,洛克希德馬丁(Lockheed Martin Space Systems Company)和雷神(Raytheon Company)兩家公司,其方案分別稱為MKV-L[22]和MKV-R[23]系統。以MKV-R為例進行問題描述,其由一組完全相同的攔截器組成,每個都有同樣的傳感器、數據鏈、軟件和推進系統。母艙攜帶多枚攔截器構成有效載荷,由助推火箭運送至大氣層外指定位置。之后,母艙經由數據鏈獲取威脅評估,并適時釋放第一枚攔截器。隨后該攔截器立即開啟紅外導引頭獲取目標信息,并輔以數據鏈信息,快速估計分析戰場敵我雙方的態勢。捕獲確認敵方多個目標后,控制和引導陸續發射的攔截器攻擊不同目標(即WTA),如圖1所示。最后,各攔截器導引頭對準各自目標,由軌控發動機進行軌道控制實施攔截。
由于彈目距離遠大于敵方目標群散布尺度,一個目標可能會進入多個攔截器的視場,經數據共享和數據關聯處理后,可以獲得針對該目標的多批次探測數據。為了緩解角度測量可觀測性低造成的估計精度差,研究對該多批次探測數據進行多源信息融合,為制導系統提供精確的目標信息;同時考慮到可能出現的傳感器故障,結合濾波框架設計故障診斷隔離算法,排除其對估計效果的干擾;最后為了避免爆炸對臨近攔截器的干擾,需要保證多攔截器時間協同一致性,以打擊時間為約束設計各攔截器的制導律。
以臨近的多個攔截器的紅外探測數據為基礎,通過最小二乘算法對指定目標進行幾何定位(Geometry positioning,GP),實現初步的信息融合。之后,基于偽測量信息設計非線性跟蹤濾波算法,對目標狀態進行更加精確的估計。最后,依托濾波框架,設計殘差檢驗算法,對出現故障的傳感器進行診斷和隔離,排除其對估計效果的干擾。
基于多個攔截器紅外導引頭的探測數據,對目標進行幾何定位。假設目標位置為r=[x,y,z]T,攔截器位置為ri=[xi,yi,zi]T,則相應的角度關系為:
(1)
式中:αi為方位角,βi為高低角。對式(1)進行整理,可得:
(2)
寫成矩陣形式為:
Mr=Y
(3)
式中:
通過最小二乘算法對上式進行求解,可得:
r=(MTM)-1MTY
(4)
在實際應用中,會存在測量噪聲。因此,不僅需要對目標進行定位,而且需要提供定位誤差的統計信息。基于上述結果,并結合誤差傳播規律,可以確定幾何定位結果的誤差協方差。假設初始的測量方程為:
θ=h(x)+vθ
(5)

r*=(MTM)-1MTY
(6)
式中:
M=
Y=
(7)
(8)
(9)
同理,可得:
(10)
(11)
根據誤差傳播公式,可得:
(12)
式中,?表示Schur乘積(元素對元素相乘)。
考慮到各個傳感器是相互獨立,可以忽略測量之間的相關性,則定位誤差協方差可以簡寫為:
Rz≈diag(σr*?σr*)
(13)
則初始的非線性測量方程,變為線性測量方程:
z=Hx+vz
(14)
(15)
考慮到狀態方程為目標的動力學方程,仍為非線性方程,本文采用基于無跡變換(Unscented transformation,UT)的無跡卡爾曼濾波(Unscented kalman filter,UKF)[24],實現對目標狀態的估計。系統模型如下:
(16)
UKF濾波的遞推公式可以表示如下。
1)初始狀態統計特性為:
(17)
2)設計UT的采樣策略。
γi,k|k-1=fk-1(ξi,k-1),i=0,1,…,2n
(18)
(19)
(20)

4)測量更新。考慮到測量方程已經線性化,直接使用線性卡爾曼濾波(Kalman filter,KF)的測量更新:
(21)
(22)
(23)

(24)
得方位角的預估值為:
(25)
方差可以表示為:
(26)
將真實的測量值與預估值作差,若超出均方差:
(27)
則認為出現故障,剔除該攔截器提供的信息。
同理,可以基于高低角信息進行故障診斷,在此不再贅述。
將上述故障診斷算法,融入前文的UKF算法,形成故障診斷無跡卡爾曼濾波(Fault diagnosis unscented kalman filter,FDUKF)算法,如圖2所示,可以實現較為穩定的跟蹤。
為實現時間協同打擊,本文將制導過程分為兩個階段:控制打擊時間的中制導以及消除脫靶量的末制導。其中,中制導律設計思路是:基于推導的動力學解析解(稱為制導動力學模型),以預設打擊時刻彈目距離為零為指標,設計當前時刻的指令推力。由于中制導的消耗,末制導階段的軌控能力有限,有必要研究以一次點火消除脫靶量的策略,則點火時刻的設計至關重要。因此,末制導律的設計思路是:以動力學解析解為基礎,以軌控發動機關機時刻彈目進入零控攔截流型為指標,設計發動機的點火時刻。
彈目相對運動模型如下:
(28)
式中:rm、rt分別為攔截器位置rm和目標位置rt的模;ac表示攔截器控制系統產生的加速度,在工作時間內視為常值;μ為地球引力常數。

(29)
式中:v=vt-vm,r=rt-rm。解式(29)方程得:
(30)
式中:r(t0)和v(t0)分別為當前時刻t0彈目相對位置和相對速度,r(t)和v(t)分別為t時刻彈目相對位置和相對速度。以此為基礎,進行中制導律的設計。
假設發動機于當前時刻t0點火,關機時刻為tb,預設打擊時刻為tf。其中,發動機關機時刻由發動機特性決定,預設打擊時刻可根據分離前彈目軌道的脫靶時刻進行設計。在t0至tb時間段內,指令加速度ac為常值,則由式(30)可得:
(31)
發動機關機之后,攔截器以零控方式飛行,即在tb至tf時間段內,ac=0,可得:
(32)
時間協同制導要求r(tf)=0,聯立式(32)可得當前時刻指令加速度:
ac=-A/B
(33)
式中:
cosω(tf-tb)+[-r(t0)ωsinω(tb-t0)+
由指令加速度ac可以計算得到指令推力Fc。在每個采樣周期內計算Fc,并進行閾值判斷,當Fc的模大于閾值時則發動機點火;若發動機已經處于工作狀態,則需根據最新計算結果調整推力方向。
進入末制導后,攔截器需要對準目標,軌控系統只能提供側向力,即:
(34)
則可得指令加速度為:
(35)
式中:fc為發動機額定推力,m1為攔截器質量,r1和v1為點火時刻t1的彈目相對位置和速度。那么,該階段制導律主要是設計發動機的點火時刻t1,以進入零控攔截流型,過程如下。
在當前時刻t0至點火時刻t1內,ac=0,可得:
(36)
在點火時刻t1至關機時刻tb,ac由式(35)確定,可得:
(37)
式中:下標b表示關機點。
發動機關機后進入零控攔截流型的條件為:
(38)
聯立,經推導可得:
(39)
經少量迭代可求解式(39),進而確定點火時刻t1。
設計如下場景:包含1個母艙、8個KV及其對應的8個目標;每個KV重5 kg,裝藥0.5 kg,共4臺固體軌控發動機,每臺發動機推力為61 N,持續工作2.5 s;在J2000.0坐標下描述,132 s時刻開始中制導,彈目距離約500 km;此時母艙狀態(位置km、速度m/s)為[2017.6, 7551.3, 31.8, 2778.5, -1271.2, 330.4]T,各個KV靠自身軌控發動機于此點分離;此時目標運載器狀態為[2460.9, 7444.1, 234.8, -3815.6, 304.1, -2693.5]T,各個子目標以其為中心構成一個直徑8 km的目標群;彈目距離進入200 km后,開啟末制導。
以1號KV對1號子目標為例,對協同跟蹤進行分析。以臨近的5個KV傳感器的探測數據為基礎,使用前文設計的算法進行協同定位。然后依托常速度(Constant velocity,CV)、常加速度(Constant acceleration,CA)、制導動力學(Guidance dynamic,GD)模型和對式(28)的二階離散動力學(Second-order discrete dynamics,SD)模型,設計跟蹤算法。其中,前兩者使用KF即可,形成CVKF和CAKF;后兩者需要使用前文設計的UKF算法,形成GDUKF和SDUKF。進行蒙特卡洛仿真,以位置均方根誤差(Root mean square error,RMSE)為指標進行評估,結果如圖3所示。
從圖3可以看出,隨著彈目距離的減小,GP的精度逐步提高,相應的跟蹤精度也逐步提高。但是以CV為模型的跟蹤出現了發散的情況,這是由于模型不匹配造成的。其余的三個估計器精度差別不大,均可實現較為精確的跟蹤。對整個跟蹤過程的位置RMSE取均值和均方差,如表1所示。可見,以本文設計的制導動力學模型進行跟蹤,RMSE均值最小,發散程度最小,為后文所采用。

表1 跟蹤模型分析Table 1 Analysis on tracking model
傳感器故障的一種表現是輸出異常,即數據偏離正常值,這將會干擾估計結果。在170 s時刻,一個臨近KV的傳感器出現故障,持續時間1 s。根據前文設計的故障診斷算法對其進行診斷隔離,與不進行診斷隔離的跟蹤進行比較,如圖4所示。可以發現,當故障出現時,GP算法出現了較大的誤差,同時引起UKF算法的發散。原因是故障傳感器輸出異常,造成GP結果異常,并輸入到濾波器;此時的濾波器已經趨于穩定,穩定的濾波增益權衡模型和測量的不確定性給出估計結果;然而異常數據的統計特性,并不符合預設的測量不確定性描述,濾波增益無法及時調節,造成異常數據將估計結果拉偏的情況。由于設計了故障診斷功能,FDUKF則可以及時檢測出故障傳感器的異常輸出并將其隔離,避免了估計結果的發散,保證了估計精度和穩定性,詳細數據如表2所示。
根據分離前彈目軌道的脫靶時刻,設計預設打擊時刻為200 s時刻,基于以上跟蹤和協同制導律,對1號攔截器的軌道進行控制,如圖5和圖6所示。中制導過程,150 s時刻以后計算得到的指令推力逐

表2 傳感器故障診斷分析Table 2 Analysis on the sensor fault diagnosis
步上升,直至超過閾值,軌控發動機點火;由于發動機的控制,預測打擊誤差減小,并保持在一個較小的范圍內,如此可以有效控制打擊時間。末制導過程,制導指令是軌控發動機的點火時刻,若計算得到的點火時刻在當前時刻之前,則發動機立即點火;若在當前時刻之后,則需要等待,等待過程中仍然要根據跟蹤數據不斷更新點火時刻;發動機關機后,彈目進入零控攔截流型,如此可以有效減小脫靶量。最終的時間偏差為0.0876 s,脫靶量為0.3228 m。
使用蒙特卡洛仿真算法,對整個攔截場景進行分析,攔截效果(時間偏差和脫靶量)如表3所示。由表3可知,對打擊時間的控制較為精確,將時間偏差控制到了0.1 s以內;脫靶量的控制較差,控制到了0.5 m左右,這與末制導的制導周期以及軌控發動機的工作模式有很大關系。同時,可以看出制導律設計時并未考慮跟蹤結果的不確定性,這勢必造成制導指令的波動,引起發動機能量的損失,需要進一步研究。

表3 攔截結果分析Table 3 Analysis on interception results
本文對大氣層外多對多攔截中涉及到的協同跟蹤和協同制導問題進行了研究,提出了帶故障診斷的協同跟蹤算法、時間協同中制導律以及消除脫靶量的末制導律,得出了以下結論:1)詳細推導了以最小二乘算法為基礎的協同定位算法,并研究了其誤差傳播規律,實現了局部信息融合以及測量方程的線性化;2)設計了基于殘差檢驗的傳感器故障診斷算法,可以有效保證信息多源融合結果的穩定性;3)基于簡化的動力學模型,設計了有限推力下的時間協同中制導律和消除脫靶量的末制導律,可以完成對多目標的同時擊毀。