王 巍, 吳志剛, 孟凡琛, 徐小明, 鄔樹楠
(1. 中國航天科技集團有限公司, 北京 100048; 2. 中山大學, 深圳 518107;3. 北京航天控制儀器研究所, 北京 100039)
多源自主導航是國家綜合PNT(Positioning,Navigation and Timing)體系下應用終端端的重要技術發展方向[1-4]。 由于面對多種載體、 應用場景、導航信息源等, 多源自主導航系統面臨著復雜而關鍵的系統級信息處理決策任務。 運載體導航信息源的接觸、 檢測、 切換、 調度等操作構成了多源自主導航信息處理基本面, 決策操作的效果直接影響多源自主導航系統性能[5-6]。
多源自主導航系統的可信性主要用于滿足復雜環境下自主導航系統的決策需求, 提供多源信息有機融合的自主導航可信服務, 要求其具備導航信號自主評估與可信判斷能力, 以提高智能決策的可信度。 文獻[7]將載體動力學模型集成到導航系統中,用估計的狀態誤差對慣導進行校正, 提升了全球衛星導航系統拒止條件下慣性導航的精度。 通過動力學模型對載體狀態估計, 無需依賴外部條件, 具有較強的自主性和適用性, 可以提升導航系統的自主決策能力[8]。 因此, 載體動力學輔助導航方法得到了快速發展, 但研究僅限于較為簡化的動力學模型[9-11]、 較為簡單的應用場景[12-13], 也很難考慮復雜環境載荷對載體動力學特征的影響[14-16]。 在復雜應用場景中, 載體通常是一個復雜的動力學系統, 環境載荷對于載體動力學行為的影響至關重要。 然而,環境載荷的高精度動力學建模需要較大的計算量,難以滿足導航任務的實時性要求。 因此, 亟需突破載體動力學模型復雜度與計算效率等技術瓶頸, 將載體動力學與導航系統深度融合, 實現復雜應用場景下導航信息的智能自主可信決策。 人工智能方法的快速發展, 為復雜系統行為預測與演化分析提供了新的解決思路[17-18]。 通過神經網絡擬合復雜非線性函數[19-21], 再將物理知識與深度學習相結合[22-24],人工智能方法不僅可以在降低動力學模型復雜度的同時提升模型精度, 還可以顯著提升模型求解的計算效率, 在載體系統動力學建模領域展現了良好的應用潛力。
針對復雜應用場景下導航信息的智能自主可信決策問題, 現有研究主要圍繞如何通過簡單的載體動力學模型估計來校正慣性導航誤差。 復雜場景下精確動力學模型的計算效率較低, 同時模型精度受環境影響較大, 有些環境因素還有可能是未知的, 傳統動力學建模方法很難滿足多源導航任務對動力學模型求解實時性以及高精度的要求。 為構建多源自主導航系統統一的表征、 判定、量化、 評估理論體系, 在現有多源自主導航系統指標體系的基礎上, 本文聚焦于多源自主導航系統技術的“可信性”[4], 系統性地闡述多源信息有機融合的“可信性” 理論構建存在的科學問題及其對應的解決方案, 為綜合PNT 體系的終端設備研制和技術發展提供參考。
多源自主導航系統的可信性是基于多源自主導航系統的有限邊界條件(包括資源配置和運行條件等), 通過運載體動力學機理等系統固有特征,用于描述多源自主導航系統功能及結果可信的內在屬性, 可以衡量多種信息源經過干擾及故障檢測、 故障識別、 故障排除、 系統重構后解算結果可信的能力。 可信性基本特征的描述如圖1 所示。多源自主導航系統可信性需要具有可表征、 可判定、 可量化、 可評價等基本特征, 是利用動力學模型知識、 先驗信息、 觀測數據等信息進行定性和定量描述, 并提供輕量級的、 隨時隨地可用的安全、 彈性的可信能力。

圖1 多源自主導航系統可信性示意圖Fig.1 Basic characteristics of dependability for multi-source autonomous navigation system
面向多源自主導航系統決策需求, 需要從載體動力學特征的學習、 預測與更新著手, 重點量化接入多源導航信號的可信度, 保證信號通路與導航性能的無縫銜接和無感切換, 研究基于復雜導航系統行為演化的動態調控策略, 分析影響多源異構導航系統時空多尺度動態拓撲的進化機制, 強化決策行為的動態迭代學習預測能力, 發展精準的、 可解釋的、 融合載體動力學特征與場景的多源自主導航系統可信決策理論, 為構筑安全、 可信、 彈性的多源自主導航系統奠定決策理論基礎。
多源自主導航系統面向廣泛的載體系統, 如無人機、 無人車、 無人艇等。 載體系統動力學特征與多源自主導航系統深度耦合, 相互作用, 使其面臨著復雜的決策任務。 首先, 多源導航系統中信息流動頻繁, 信息形式多樣, 信息來源冗雜,載體特征各異, 決策場景復雜, 實際應用中多源自主導航系統決策面臨實時性、 準確性、 可信性等復合約束。 其次, 面向復雜的應用場景, 尤其在危險、 極端、 特殊、 惡劣等環境下, 為保證多源自主導航系統綜合性能, 基于載體的導航信息源的接入、 切換、 調度操作構成多源自主導航系統的決策基本面, 決策效果直接影響導航系統性能。 另外, 多源自主導航系統決策行為復雜, 在載體動力學和環境影響的作用下, 決策行為難以實現智能優化。 目前, 針對多源自主導航系統,統一的可信決策度量方法缺失, 無縫無感決策機制難以實現, 決策行為的自主性和智能性較為低下, 決策行為與載體動力學及應用場景融合度存在不足之處。 綜上所述, 本文圍繞基于載體動力學特征的導航信息可信決策等問題, 主要歸納為如下科學技術問題:
(1)基于載體動力學特征的導航信息決策可信性自主判定問題
復雜應用場景下多源導航信息將面臨接入信息不安全、 載體特征與接入信息匹配不充分等問題, 導致其可信性難以評估。 因此, 如何將載體動力學特征與多源導航信息相融合, 提出基于載體動力學特征的導航信息智能決策可信性判定量化準則, 實現多源導航信息可信性的智能自主判定, 這是導航信息智能決策的“可信性” 理論亟待解決的問題之一。
(2)融合載體動力學信息的導航方式無感自主切換問題
多源自主導航系統的應用場景切換時, 導航信號的切換時機通常難以準確預測, 不恰當的切換時機和形式可造成導航性能波動或損失, 載體的動力學特性變化也將對導航信號產生重要干擾。因此, 如何將載體動力學特征與多源信號切換過程相融合, 提出考慮載體動力學特征的信息源切換時機判定方法, 實現導航方式的智能無感切換,這是導航信息智能決策的“可信性” 理論需要著重解決的另一個問題。
(3)基于多源觀測信息的載體運動特性知識動態更迭優化問題
在干擾欺騙等復雜環境下, 多源自主導航系統決策支撐信息通常呈現出時空數據不完備性,載體動力學特征以及環境特性難以充分認知, 基于載體和環境特性的決策操作不易順暢成熟, 過程決策經驗需要整合提升。 因此, 面向復雜場景下系統級決策任務, 如何實現面向多源觀測信息的載體動力學模型學習與決策行為動態迭代優化,這是導航信息智能決策的“可信性” 理論需要重點關注的又一個問題。
針對無人機、 無人車、 無人艇等典型載體,多源自主導航系統智能決策的“可信性” 理論主要涉及載體動力學建模與計算、 融合載體動力學特征的導航方式智能無感切換、 可信性自主判別與動態迭代優化, 聚焦于建立導航方式無縫無感切換的可信性判定測量與量化表征準則, 最終實現不同場景和任務下的導航信息智能決策可信性自主判定。 多源自主導航系統“可信性” 理論的總體構建方案如圖2 所示。

圖2 多源自主導航系統“可信性” 理論的總體構建方案Fig.2 Overall scheme of dependability theory for multi-source autonomous navigation system
(1)不同載體系統動力學模型構建與計算
面向無人機、 無人車和無人艇等典型載體,考慮不同載體機動運動過程中所帶來的影響, 可根據經典理論構建結合物理特征的無人機、 無人車和無人艇系統動力學模型, 其形式上的動力學方程可表達為如下形式
式(1)中,x與u分別為動力學系統的狀態量與控制量,x0為狀態初值,Fd為動力學系統中具有確定動力學特性的部分,Fu則為系統中不確定特征的部分。
考慮到上述載體系統動力學模型一般存在結構復雜、 求解時間長等問題, 采用內嵌物理知識深度神經網絡(PINN)對動力學模型進行快速解算。具體來說, 首先建立用于模型解算的輕量級深度神經網絡, 選取合適的初始化條件設置初始參數,然后根據高精度動力學模型中用于描述物理系統的偏微分方程組, 構建由初始條件、 邊界條件以及采樣區域中選定點處偏微分方程的殘差項組成的損失函數項, 具體表達式為
式(2)中,θ與λ分別為深度神經網絡與動力學模型的內部參數,Lx0為初始條件殘差,Lxb為邊界條件殘差,LF為偏微分方程殘差,Lx為數據殘差。
結合上述損失函數, 利用無約束優化方法中的梯度下降迭代法對深度神經網絡進行訓練, 經過訓練達到需求精度的深度神經網絡可用于對物理系統的動力學模型進行快速解算。 PINN 算法原理如圖3 所示。

圖3 PINN 算法原理Fig.3 Principle of PINN algorithm
(2)具有自適應能力的載體運動特性智能預測
考慮多源導航過程中常面臨干擾、 廣義故障等不利因素以及隨著場景切換環境與載體動力學特征可能會發生突變的問題, 結合域隨機化(Domain Randomization) 思想, 基于深度學習等人工智能技術, 研究基于觀測信息的載體動力學模型修正更新方法, 開展基于更新后模型的載體動力學特征分析。 通過動力學模型動態更新迭代, 實現載體運動特性智能預估。 針對傳統物理特征模型僅能精確描述確定性載荷的局限性, 根據不同載體和任務場景的需求, 融合深度學習、 元學習等方法, 描述難以精準建模的環境干擾力項。
為了讓訓練的深度神經網絡快速自主地適應環境干擾力的變化, 可以分解深度神經網絡中的非線性網絡部分與線性網絡部分。 首先, 基于對抗網絡優化框架, 使用非線性網絡部分學習環境干擾力中的不變表征
式(3)中,為用于擬合系統不確定特征的部分Fu的函數,φ為一個深度神經網絡,a為線性系數,h為另一個用作判別器的深度神經網絡,L為損失函數,α為一個控制正則化程度的超參數,e為標準基函數;δkj在k=j時為1, 其他情況下為0。 然后, 采用線性回歸方法使線性網絡適應不同環境干擾力中的變化部分
在精確建模外部環境干擾力后, 即可將其融合到載體自身的高精度物理特征動力學模型中,構建具有高度環境自適應能力的智能動力學統一框架。
(3)動力學模型輔助的組合導航系統誤差估計與修正
在具有環境自適應能力的智能動力學建模基礎上, 可以進一步將動力學模型輸出信號與衛星導航、 慣性導航等多種導航信息進行融合, 開展動力學模型輔助的組合導航系統誤差估計與修正, 提升組合導航精度, 為導航信息源的接入以及決策可信性判定提供參考依據。 具體來說, 動力學模型與自主導航系統的子系統狀態模型可表示為
其中,com表示市場競爭,pay和mh分別表示薪酬激勵和股權激勵變量,control為控制變量,定義和模型 (1)一致。
式(5)中,xi為待估計的第i個子系統狀態量,yi為第i個子系統的量測輸出,wi與vi分別為子系統的動態噪聲與測量噪聲,Ai、Bi、Ci分別為子系統的狀態轉移矩陣、 噪聲驅動矩陣以及觀測矩陣。 然后利用聯邦卡爾曼濾波方法, 整體系統狀態模型可表達為
式(6) 中,x、y、w、v、A、B與C都為整體系統的相應量。
在聯邦卡爾曼濾波方法中, 動力學模型被用作公共參考系統, 其輸出的狀態矩陣xk, 一方面作為虛擬測量值應用于每個子濾波器, 另一方面直接應用于主濾波器。 整個信息融合過程先是分別得出其子濾波器的估計值
多源數據信號接入與融合過程具有復雜性,直接導致了導航系統的整體行為難以理解、 預期和調控。 針對多源導航系統狀態特征判定問題,提出了基于多源自主導航系統信息演化分析與動態調控的數學模型, 發展了面向系統動態非線性行為的演化學習方法。 針對多源導航系統信息演化行為穩定性問題, 提出了基于網絡拓撲熵和李雅普諾夫指數的臨界閾值耦合分析方法。 通過分析載體系統動力學行為的臨界現象, 探究干擾故障與不確定條件下載體導航數據的動態特性及演化規則, 挖掘其中蘊含的數理規律。 通過分析解耦后的簡單行為在不同干擾及邊界條件下的動力學分岔類型及特征, 完善系統全局可控性定量度量指標體系, 分析演化行為的臨界現象與不同任務場景下導航信息演化模式, 揭示系統突變與隨機擾動下的跨尺度動態特性。 根據復雜系統大多具有無窮多周期軌道而無窮多周期軌道中存在有限基本周期軌道集合的特點, 可以通過求解有限“基本周期軌道” 構成的代數方程, 建立對系統動態行為與結構動態復雜性的智能可計算分析方法,其內在原理可量化為[18]
式(9) 中,m為系統演化時間,pl1、pl2、 …、plk為周期≤m的所有基本周期軌道的周期,為穩定收縮方向的特征值,DH為Hausdorff 分維數, 并依此建立基于基本周期軌道自適應逼近復雜系統的有效途徑。
通過事件驅動判斷信號接入時機是否適用于場景切換條件明確、 環境確定性較強的情況, 當無人機、 無人車、 無人艇受到干擾、 阻礙等不利因素以及場景突變導致其環境信息未知、 復雜、動態變化時, 多源導航信息面臨不可信的問題。此時, 需要導航系統能夠進行自主環境感知, 利用環境信息實現多源導航信息的可信決策。 為此,首先需要根據多源導航信息以及載體動力學模型對載體在空間中的位置、 姿態以及環境信息進行精準的多源檢測; 然后, 對其所獲得的信息進行智能分析及環境模型進行自主建立, 即環境感知和建模; 在此基礎上, 將載體動力學模型、 復雜系統相變機理以及知識庫更迭相結合, 建立智能認知模型, 實現具有知識記憶、 學習及推理特性的導航信息認知融合以及智能規劃導航路徑。 以智能認知模型為基礎, 可以進一步提出自主感知、可信判斷與動態決策的多源自主導航方法, 實現具有環境自適應能力的導航方式智能決策與無感切換。 導航方式無感切換與智能決策框架如圖4所示。
(1)導航信息智能決策可信性模型表征
進行多源自主導航系統可信性自主判別, 首先需要合理準確地表征可信性模型, 其目的是利用系統的已知信息, 建立一個描述系統功能和失效模式的數學模型。 因此, 基于典型載體動力學模型, 考慮復雜場景與任務下導航信息源的切換與調度操作等約束條件, 研究導航信息智能決策的可信性表征方法, 基于故障樹等系統狀態的分析方法, 建立不同載體導航信息智能決策的可信性模型, 并對系統失效概率進行分析。
(2)導航信息智能決策可信性量化方法
在不同載體導航信息智能決策可信性模型基礎上, 提出不同載體、 不同場景轉換情況下導航信息決策可信性判定方法。 可信能力用可信度Dp(Dependability)衡量[4], 可信度從可信覆蓋率(全局/部分可信)、 穩定度、 可靠度、 能觀度等4 個層面量化表征多源自主導航系統的可信能力, 具體如下
式(10)中,為與可信性的可信覆蓋率相關參數;Li為第i個可信模式的相對穩定度;Qi為第i個可信模式的相對可靠度;Gi為第i個可信模式的相對能觀度;分別為第i個可信模式中穩定度、 可靠度、 能觀度的權重, 且為可信模式的總數。 基于具有高度環境適應能力的載體動力學模型, 結合多源異構導航信息, 通過蒙特卡羅實驗、 可靠性分析、動力學知識建模分析, 得到不同導航信息源的概率意義下可信覆蓋率、 穩定度、 可靠度、 可維護性、 可用性以及能觀性表征; 然后, 基于信息源的多種表征、 可信度定義、 載體動力學模型以及干擾模型, 運用貝葉斯網絡推演, 得到面向典型載體與應用場景的導航信息可信性量化信息; 通過引入載體特定場景下性能邊界, 得到多種應用場景下導航信息可信性判定標準。
(3)多源自主導航系統決策行為動態迭代優化
分析導航決策行為在不同干擾故障攻擊及邊界條件下的動力學分岔類型及特征, 研究系統在面臨多種環境擾動及系統內部噪聲時的可信閾值條件, 進而提出多源異構信息演化規律及耦合方法, 發展局部性特征尺度和全局性動態尺度相互結合的算法理論框架。 然后, 基于導航決策集、嵌入的基準決策邏輯, 梳理載體、 環境、 任務等多方面決策影響因素, 形成決策知識, 動態擴充決策行為核心庫, 并確定核心庫邊界。 基于決策行為核心庫與邊界, 分析評估可信評價與無感切換行為, 并指導可信評價與切換優化迭代; 同時,面向泛化性需求, 實現決策行為庫與邊界的動態遷移, 最終形成核心庫小回路的動態迭代優化以及可信決策行為大回路的動態迭代優化。
在具體實施時, 可考慮重放、 拒絕服務、 覆蓋、 錯誤數據注入等攻擊行為, 考慮時變和時不變、 觀測和動態、 持續和間歇等故障, 考慮隨機性和確定性、 靜態和動態、 內部和外部等干擾,則導航信息觀測模型為
式(11)中,yi(k)為獲得的導航信息,Hi(k) 為觀測通道和載體動力學綜合作用狀態轉移矩陣,vi(k)為觀測噪聲,ai(k)為攻擊或加性故障,i為多源導航系統中第i組導航觀測,k為觀測時刻。 基于觀測模型以及信息融合算法, 可以得到不同類型干擾故障等不利因素的作用通道和范圍。 基于隨機化算法, 得到多種因素綜合作用下的導航性能評價信息以及關系圖譜。 運用載體動力學特征,與不利因素作用圖譜, 實現基于動力學模型的決策不完整信息預測, 為導航信息接入和切換操作提供數據支撐。 運用分支理論等方法, 分析導航決策行為在不同干擾故障攻擊及邊界條件下的動力學分岔類型及特征, 實現多源異構信息演化與耦合。 基于歷史操作數據及動力學模型知識, 構建決策操作基本庫, 采用知識圖譜與圖神經網絡等技術, 實現對決策行為的可解釋性智能推演,給出決策操作可信預測概率, 進而依據實時決策操作行為, 通過對比學習與場景聚類, 實現對決策操作庫的有效更新, 保證決策操作知識的動態更迭。
針對多源自主導航系統“可信性” 理論與技術瓶頸問題, 本文聚焦于多源信息智能決策理論框架, 系統論述了載體動力學智能建模與計算、融合載體動力學特征的導航方式智能無感切換、可信性自主判別與動態迭代優化等科學技術問題及其對應的解決方案, 提出了復雜場景下多源自主導航系統導航方式無縫無感切換的可信性判定與量化表征方法, 助力多源自主導航系統技術體系的構建。
在未來研究中, 需要進一步發展導航系統可信性統一的表征、 判定、 量化與評估方法, 實現復雜場景下導航方式的無縫無感切換、 可信判定與動態迭代。 同時, 多源自主導航系統需要加強與人工智能技術的交叉融合, 并充分利用高精度動力學建模技術, 發展精準的、 可解釋的、 融合載體動力學特征與場景的多源自主導航系統可信決策理論, 支撐先進導航技術的創新發展和規模應用。