李 洪,張大銘,嚴晞雋,梁晨光,劉靖東
(1.中國航天科技集團有限公司,北京 100048;2.北京宇航系統工程研究所,北京 100076;3.中國運載火箭技術研究院,北京 100076)
隨著電子通信行業的快速發展,信息獲取技術更加多樣(如紅外、可見光、合成孔徑雷達(SAR)、主被動聲吶等),信息類型和容量急劇增長,信息處理呈現出分層級、復雜融合的發展趨勢,形成了多源信息融合(multi-source information fusion)技術。它是指將傳感器等設備獲取的多種信息按照一定規則組合,減少或消除信息中的干擾及不確定性,進而對某些問題做出全方位準確可靠判斷的一種信息處理技術[1]。多源信息融合相對于同源數據融合具有明顯的優勢,因為對各種類型的特征數據進行綜合,能夠提高融合結果的準確性。因此,多源信息融合在科學探測、環境感知等方面發揮著重要作用[2]。特別是在需要多數據源信息獲取和目標判斷的海洋科學探測領域應用前景廣闊,例如船只搜索導航、水下生物辨識、洋流變化分析、海嘯和臺風預警、海底地質活動觀測等。
當前,基于美國數據融合專家組發布的數據融合系統(DFS)功能模型[3],多源信息融合技術發展自底向上可劃分為3個層級:數據級、特征級、決策級。
1)第一層級是數據級融合,主要為目標的所處方位、運動軌跡估計。該層級直接處理各種采集到的原始數值數據,一般以最優估計、卡爾曼濾波、參數匹配等技術為基礎,包含了多數表決法、加權平均法、小波變換、主成分分析法等[4]。這種融合在各種原始觀測信息未經預處理之前就進行數據綜合分析,是最低層級的融合。它的優點是能保持盡可能多的現場數據,提供其他融合層級所不能提供的細微信息。其局限性在于處理的信息種類單一,信息量較大,處理代價高,實時性差。
2)第二層級是特征級融合,主要為目標的特征分析和辨識。該層級包括目標特征的提取和評估,利用多源信息之間的互補性剔除模態間的冗余性,基于貝葉斯、D-S證據推理等算法、支持向量機(SVM)模型、淺層及深度學習神經網絡等模型方法[5],學習到更好的特征表示,進行數據校準、目標識別、態勢判斷等。特征級融合的優點是實現了對多類型、大容量信息的有效壓縮,有利于實時處理,具有較大的靈活性,但缺點在于損失了部分原始信息,可能會導致融合質量有所下降。
3)第三層級是決策級融合,主要為整體感知和決策判斷,屬于一種高層次的融合。該層級針對探測研究的目標,采用二次特征提取和專用判決機制等多元化的方法,綜合得出結論,為辨識和決策提供依據。相比特征級融合,決策級融合抽象層次更高、能夠基于目標的一些關鍵性質,快速實現對其定性和辨識[6],通信數據量和計算復雜度更小。但是如果對關鍵性質把握不準,可能會帶來較大偏差的誤判[7]。
通過上述分析可以看出,不同層級、多源數據融合的方法各有優勢。但是,要應用到面向海洋的科學探測的具體領域,特別是研究目標的特征提取與分析識別,這些通用性的方法在信息融合的各環節上還面臨著諸多難點和挑戰,具體表現在以下幾個方面。
1)信息獲取片面化。海洋范圍廣、深度大,海洋探測中的目標(如航行船只、海洋生物、局部冰川、海域洋流和海底地質環境等)靈活性強、運動軌跡復雜。當前的探測技術(如紅外[8]、SAR圖像探測[9]、聲吶頻率探測等[10-11])性能受限,探測平臺(如機載巡航、懸浮聲吶等)相對被動,各類探測設備以“單打獨斗”為主,缺乏面向廣域、深海的監測系統,難以形成整體性、全面性和及時性的信息獲取機制,使得獲取到的信息質量低、碎片化嚴重。
2)特征融合質量差。與陸地和空間探測不同,海洋探測受海潮雜質、海底地質等水下復雜情況的影響很大[12]。例如,頻繁變化的聲速、溫度和風浪等,都會直接影響到主被動聲吶探測、水下信息通信傳輸[13]的性能。此外,探測設備獲取到的往往是目標運動變化產生的現象的數據,只能反映出目標的一些“間接”特征,如遙感衛星設備拍攝的淺水區內波尾跡圖像,懸浮聲吶收集的水下聲波振動頻譜等。這些參數不能直接反映目標本身的特征,導致后續特征融合與辨識的質量難以保證。
3)目標誤判概率大。現有的海洋探測手段獲取信息并處理得到的特征結果(如合成尾跡圖、聲波振動譜等),往往只能反映目標的局部特征而非關鍵性特征[14]。因此,無法全面、準確地區分出海洋探測目標的差別(如航行器、海洋設施和生物體等),容易發生誤判和虛警,降低對海洋環境探測感知的準確性,進而影響海洋活動計劃的制定和實施。
針對上述信息獲取片面化、特征融合質量差、目標誤判概率大等技術難點,本文從信息獲取模式、特征提取方法以及目標判別策略等幾個方面入手,有針對性地提出解決思路。
海洋探測的信息獲取雖然困難重重,但并非鐵板一塊,除傳統的圖像(如可見光、紅外、合成孔徑雷達等)和聲學(如主被動聲吶等)等獲取技術外,引入多種先進探測手段(如磁異探測、水下固定網絡探測、甚低頻探測、重力梯度探測等),能夠綜合獲取“形、跡、聲、電、磁”與目標有關的全方位特征信息,為后續的特征融合提供更多可能。
針對當前海洋探測中信息獲取不系統、碎片化等問題,可依據目標在海岸附近、大陸架、大陸坡到深海的活動范圍和時間規律展開分析,構建“天、空、地、海、網”全方位、立體式的海洋信息探測體系,如圖1所示。利用衛星實現高、中、低軌道全覆蓋,采用高效的推掃策略實現周期性的廣域探測;對目標活動變化軌跡的紅外、可見光和雷達圖像信息進行同一時間分別捕獲;利用磁異、重力梯度等探測設備搭載海上無人機進行跨介質海洋探測,獲取相關的熱力學、磁場強度分布信息;利用水面浮標、水下固定探測網對局域范圍內目標的活動特征進行收集。此外,在民用商船及試驗、保障等船只上配置聲學、電磁學等探測設備,通過全球范圍內廣域、長期航行獲取和累積海洋中目標活動變化的離散點位信息等;地面測控站利用衛星、無人機、遠洋船以及水下固定探測網等構建起一體化海洋探測網絡,匯集多類型、全時段的探測數據,為后續更高層次的信息融合提供全面、及時、充足的原始信息。

圖1 海洋信息探測體系場景圖
針對深遠海水下目標特征量受海洋環境影響大、無法直接獲取、融合難度大等問題,本文提出分布式融合的策略,將復雜的多源信息按照聲學、非聲學進行分類,從低到高融合層級排序,從各部分數據處理到整體融合實現特征獲取。聲學信息類型相同或接近,采用數據級融合方式進行活動軌跡等信息關聯性分析,可有效剔除環境干擾和預測誤差,提高融合精度,更好地提取運動特征。圖像、磁異探測等非聲學信息類型差異較大,分批采用特征級融合的方式,可以分別提取目標形態、局部熱力學、電磁學分布等特征,減少中間量屬性的特征參數在信息融合中的不確定性。
如圖2所示,在基于衛星圖像進行海洋生物探測的特征級融合方案中,信息獲取源被分為電子偵察衛星和遙感成像衛星兩類,再分別進行信息融合,形成脈沖信號、內波尾跡圖像和尾流溫差等3種中間量特征信息,再將這些不同類型信息輸入人工神經網絡等數學模型中進行二次特征提取,實現可供識別的海洋生物目標特征信息;在決策級融合中,針對特征級提取的聲學、圖像等各類目標特征信息進行綜合,利用機器學習等智能化手段實現再提取,最后進行綜合判定。通過這樣的方式,能夠在每級獲取局部最優特征提取,在多層級逼近全局最優目標識別。

圖2 基于衛星圖像的特征級信息融合識別方案框圖
本文以局部海域的鯨魚活動探測為例,進一步說明采用分布式融合方法在目標識別中的優勢。基于網絡公開數據,采用高斯分布、正態分布等通常分布模式,設置樣本方差,生成訓練樣本和測試樣本,包括3個類別鯨魚游動尾跡波紋、體型輪廓投影、關鍵部位特征和主要活動規律等4類特征信息。首先采用支持向量機(SVM)對測試樣本按照4類特征屬性進行聚類處理,再利用反向傳播網絡(BP)神經網絡進行目標的特征識別與分類。網絡層與層之間采用全互連方式,包括輸入層、隱含層和輸出層。網絡中設置輸入層節點數為4(4類特征信息),隱含層節點數為12,輸出層節點數為3(3種類別目標),最大訓練迭代次數為500。利用訓練樣本生成網絡,利用測試樣本對目標類型識別效果進行驗證。
在實驗中設置訓練樣本為1 200,選取類別1的130個測試樣本數據進行測試。如圖3所示,在測試中有5個樣本錯分為類別2,有2個樣本錯分為類別3。識別率(正確識別個數與總樣本數的比值)達到94.62%。如圖4所示,采用BP網絡直接進行所有原始數據訓練的單步驟信息融合方法,得到的識別率為79.23%。相比之下,分信息屬性SVM聚類+整體BP網絡識別的分布式信息融合方法能夠獲得較高的識別準確率。因為此方法最大限度地緩解了特征級和決策級融合中信息量損失、信息類型復雜導致的低精度問題。一般而言,對于目標種類更多、信息特征類型更復雜的情況,采用分布式融合方法進行目標識別的提升效果更為明顯。

圖3 基于多源信息的分布式融合效果的實例

圖4 基于多源信息的單步驟融合效果的實例
為了有效區分海洋探測中目標的關鍵性差別,提高決策級融合的準確性,在決策級引入多元化、先驗性特征知識,輔助進行識別判定[15]。一方面,針對目標本身的關鍵特性進行分析,包括:外形輪廓、水流特征振動聲紋特征等,尾流圖、聲紋庫等一系列關鍵特征判別數據庫;另一方面,基于目標的歷史活動觀測記錄和軌跡分析,提煉變化規律,構建智能化仿真和預測模型,有針對性地進行廣域和局域的海洋監控及探測模型驗證,提高預測精度,為最終信息辨識、海洋活動計劃制定構建多個維度的輔助判定標準,減少在決策級信息融合中由于關鍵信息缺失或人為因素干擾帶來的誤判和虛警。
基于上述深遠海探測信息融合技術分析,本文對多源信息融合技術未來的應用和發展提出如下思考與建議。
1)發展新型探測技術,完善體系化探測系統。傳統聲學和圖像等探測手段在信息獲取中存在探測深度淺、范圍小、易受干擾等問題。進一步拓展面向海洋探測的信息傳感技術[10-11]、研發新型探測手段有利于彌補當前系統的不足。以海洋探測應用為例,藍綠激光在海水中信號衰減小,可利用光波獲取高分辨率水下圖像;重力梯度法能夠跨介質將水下探測范圍拓展到km級別;光量子探測技術能夠通過水體參數快速識別目標位置;甚低頻聲波技術能夠通過觀察水動力場識別水下低噪聲聲源和遠距離探測;紫外線照射海洋發光細菌來標記水下目標熒光尾流軌跡的生物探測技術等。有針對性地發展和引入這些新型探測技術,能夠更好地完善體系化探測系統,更全面、及時地獲取海洋探測的有效信息。
2)針對具體應用場景構建分層次、分布式的信息融合機制。隨著海洋活動越來越頻繁,探測手段愈發多源化,數據量加速增長,環境場景日趨復雜,采用層次化、分布式的思路有針對性地構建信息融合機制,有利于快速降低信息融合的復雜度,提高態勢感知決策效率。相比于集中式信息融合,分布式信息融合根據信息類型的劃分,將數據初步處理放在信息源頭,特別是在軟硬件資源約束條件下,通過復雜問題劃分和多源信息屬性分類,實現單類型信息數據的最佳逼近,能夠有效提高融合質量,降低特征提取偏差、誤識別機率等。通過構建信息融合機制數據庫,在不同場景需求下篩選合適的信息融合機制,可以大幅提升多源多維探測效率和質量。
3)針對具體目標特性構建起先驗知識庫。知識是信息傳播中獲取的經驗,知識的積累有益于不斷提高信息獲取的效率,使人們對于事物及其變化規律的認知更加清晰、穩定。構建先驗知識庫,是提高信息融合和算法模型效率的重要手段,在已知信息下進行融合分析,不僅能極大地減少模型訓練的難度和周期,還可以快速剔除大量錯誤判斷情況[13]。對于海洋探測而言,先驗知識庫的建立需要充分利用海底光纜、航行船只、水下懸浮網絡節點等方式,針對水下探測目標的聲紋特征、尾跡形態、活動規律等關鍵信息進行綜合協同和長期積累。持續更新的先驗知識庫有助于和當前有限的特征級融合結果進行快速比對,進行決策級目標辨識,同時這對于復雜環境下系統化、體系化的態勢感知、判斷和決策,都有至關重要的作用。
4)針對具體信息特點優化智能算法和模型。從支持向量機到神經網絡模型,越來越多的智能算法和模型幫助人們在多源數據融合中實現有效地聚類、分類、計算和預測,在減少計算復雜度的同時,提高目標特征的提取質量。在具體應用過程中,還需要考慮數據量的大小,數據類型的關聯性等特征,合理選擇模型的類型和規模,減少數據訓練過程中梯度消失、無法收斂等問題;同時也要結合模型長期訓練的方法和經驗,在增強學習的過程中不斷加入新的樣本,逐漸提高模型預測的魯棒性和準確度,探索模型架構的通用性優化思路、測試方法和評價標準[16]等,不斷提升模型構建的效率。
5)目前,多源信息融合的研究主要停留在理論研究層面上,我國自主研發信息融合系統的能力不強,這是由于信息融合系統涉及結構模型、實時響應、判決準則等多方面的因素,而相應的技術與平臺都需要進一步的完善。采用全局化體系構建、多元化平臺研發、關鍵性技術突破、局限性近似等效、研究難點分解、多方聯合驗證等綜合治理手段,能夠由點及面、分階段地實現多源信息融合系統工程的落地和應用。
隨著科學探測環境日趨復雜和信息獲取技術快速發展,多源信息融合分析已成為人們進行環境感知、活動決策的關鍵性輸入條件。但應用到海洋探測等具體領域時,通用化的融合方法會導致信息獲取片面化、特征提取質量低、目標誤判概率大等問題。基于本文提出的體系化探測、分布式融合和利用先驗性知識等一系列解決思路,可以有效提高目標辨識準確率,減低多源信息融合計算復雜度。隨著全球星座組網部署應用、新型探測技術加速突破、體系化探測平臺構建優化、多源信息融合機制深入探究和先驗知識系統不斷完善,針對具體應用場景探測感知的多源信息融合技術及工程實踐將發揮更大的作用。