高順凱
(武漢市江夏區藏龍大道709號 武漢 430205)
未來戰場需要較高的自動化指控能力[1],從而提高部隊的反應速度,戰術輔助決策正是實現此能力的關鍵技術。在作戰前進行輔助決策時,會根據作戰對象和作戰地點的具體情況,對作戰態勢進行感知[2];在作戰過程中,輔助決策可以幫助指揮員快速、準確地進行決策,為我方作戰提高優勢。
對敵方兵力部署[3]進行估計是戰術輔助決策的一個重要環節。每次作戰前,我方偵察分隊可以偵察到敵方部分兵力,還有一部分兵力則不能被偵察出來。兵力部署估計[4~6]可以根據已偵察出來的敵方兵力情況,預測出敵方未被偵察出來的兵力的位置及屬性。
完整的兵力部署估計模型原理流程圖如圖1所示。
偵察分隊偵察總結出偵察信息后,系統首先進行規范化方便計算機進行處理。針對規范化的偵察信息,系統進入兵力聚合模塊,對一個個作戰實體進行分群和識別,即實體聚合和屬性估計,最終形成各個作戰群體。兵力聚合模塊得到的輸出再作為兵力部署估計模塊的輸入,由已知的偵察信息估計敵方在其他地域可能的配置,在理想情況下該配置信息對應于概率最大的數個兵力部署方案。最后經過經驗模板篩選和地形模板篩選,輸出當前戰場上實際的兵力部署估計結果。

圖1 兵力部署估計模型原理流程圖
兵力部署估計的目標是為了找出未被偵察到的兵力部署的位置和可能的屬性。以兵力聚合的分群解釋作為輸入,其屬性包括群體名稱、群體類型、群體位置(橫坐標、縱坐標)、跨度、可信度,構成的特征向量如下:

兵力部署估計方法的核心思路是:
1)首先建立兵力部署模板庫,該庫中的每一個模板包含各個群體的構成信息和(相對)位置信息;
2)接著將兵力聚合后的分群解釋輸入兵力部署估計模塊,與模板庫中的模板一一匹配,得到一系列匹配得分;
3)提取得分最大(即概率值最大)的數個模板作為結果輸出;
4)模板中各群體的拓撲關系,即是所有偵察到和未被偵察到的兵力間的拓撲關系,由模板可直接推測出未知兵力的位置及屬性。
兵力部署估計的方法有如下幾種:
貝葉斯網絡推理[7]。網絡包含兩層節點,第一層為N 個證據節點,每個證據節點有兩種狀態(激活和未激活),第二層為T 個中的1 個兵力部署節點,每個兵力部署節點對應一個兵力部署模板。每一個證據節點與部署節點間存在一個條件概率表,該表包含對應證據在激活與未激活的條件下各模板發生的條件概率。
動態矢量匹配[8]。該方法將各群體之間相互的拓撲關系提取出來,組合后形成兵力部署模板庫,通過群體間矢量的匹配來進行防御軸線偏轉角計算、群體屬性估計及模板匹配。
圖神經網絡[9]。將每個兵力聚合得到的作戰群體看作是圖的一個節點,多個作戰群體構成一張圖,進而模板匹配問題轉化為圖匹配問題。兩張圖作為圖神經網絡的輸入,經過學習得到模型參數,對于新來的偵察群體圖,經過和所有模板圖進行匹配,得到得分最高(完全匹配)的數個模板。
動態矢量匹配的方法雖然可以解決貝葉斯網絡方法無法處理群體屬性未知的情形,但同樣存在一些不足。例如輸入群體和模板群體的對應,會在群體屬性重復情況下失效,即無法處理有多個同屬性群體的情況;矢量的計算對矢量模長敏感,輸入群體的相對距離與模板群體的相對距離有尺度的縮放關系,尺度發生改變匹配結果有可能產生很大改變;完全不確定屬性的群體的屬性估計依賴待選屬性的人工選擇,必須在計算量和準確度之間折中等等。而圖神經網絡的方法可以有效解決上述問題。
本文采用圖神經網絡中的SuperGlue[10]進行圖匹配,進而進行兵力部署估計。
傳統的深度學習方法被應用在提取歐氏空間數據的特征,而新興的圖神經網絡則被提出用來處理傳統方法處理不佳的非歐式空間,包括節點分類、鏈接預測和聚類等任務。
圖神經網絡的研究與圖嵌入或網絡嵌入密切相關。圖嵌入旨在通過保留圖的網絡拓撲結構和節點內容信息,將圖中頂點表示為低維向量,以便使用簡單的機器學習算法進行處理。圖嵌入與深度學習的結合即是圖神經網絡。
圖神經網絡包括,圖卷積網絡(Graph Convolution Networks,GCN)[11]、圖注意力網絡(Graph Attention Networks)[12]、圖自編碼器(Graph Autoencoders)[13]、圖生成網絡(Graph Generative Networks)[14]和圖時空網絡(Graph Spatial-temporal Networks)[15]。
SuperGlue 由Paul-Edouard Sarlin 和Daniel DeTone 于2020 年提出,是一種基于圖卷積神經網絡的特征匹配算法,它的輸入是兩張圖像中的特征點及描述子(手工特征或者深度學習特征均可),輸出是圖像特征之間的匹配關系。原論文中Super-Glue用于圖像配準環節中的第二步,根據特征描述符找到最佳匹配的關鍵點。其特點有如下幾項:
1)構建了一個可學習的特征匹配器;
2)利用SuperPoint[16]計算得到關鍵點與描述子;
3)關鍵點編碼,將關鍵點的位置∕坐標嵌入到具有多層感知器(Multilayer Perceptron,MLP)的高維向量,再與對應的描述子進行融合;
4)多 頭 注 意 力 機 制[17],其 中 自 注 意 力 層(self-attention)用于提升局部描述符感受野,交叉注意力層(cross-attention)用于提升兩圖特征信息交流;
5)最優傳輸優化匹配[18],將兩組學習后的特征向量進行矩陣運算得到得分矩陣S,對得分矩陣采用Sinkhorn[19]算法,求得最優的分配矩陣P,然后根據分配矩陣得到最佳匹配的關鍵點。
SuperGlue 的大框架是將局部特征點匹配轉化為可微最優傳輸問題。如圖2 所示,框架由注意力圖神經網絡和最佳匹配層組成。

圖2 SuperGlue架構
3.2.1 注意力圖神經網絡
注意力圖神經網絡(Attentional Graph Neural Network,AGNN)使用關鍵點編碼器將關鍵點位置p 及其視覺描述符d 映射到高維向量中,然后使用交替的自注意力層和交叉注意力層(重復L 次)來創建更強大的描述信息f 。
關鍵點編碼。特征點位置及描述子合并成每個特征點i 的初始表示為(0)xi,其中位置信息借助高維感知器嵌入到一個高維向量中:

上式將視覺外觀和特征點位置進行耦合,使得后續的注意力機制能夠充分考慮特征的外觀和位置相似度。
注意力聚合網絡。該網絡中的圖C 是是由原始的圖A 和圖B 組合成的超圖。其中的邊有兩種:一種連接圖A 或圖B 內部的特征點,εself(self edge);一種連接圖A 和圖B 之間的特征點,εcross(cross edge)。令lxiAorB表示圖A 或圖B 上第i 個特征點在第l 層的中間表達形式。令mε→i表示通過自注意力和交叉注意力,聚合與它相鄰的所有特征點{ j:( i,j )∈ε} 后,得到的信息(message)。從第l層到l+1層的更新方式為,當前特征點的描述符加上,經過聚合的特征點進行感知器處理后的更新信息。其更新公式如下:

其中,ε ∈{εself,εcross}。
這里交替進行自注意力和交叉注意力聚合,仿佛在模擬人類來回匹配瀏覽的過程。其中自注意力使特征更加具有匹配特異性,交叉注意力為這些具有特異性的點做圖間特征相似度的比較。
線性投影。經過L 次網絡計算的描述符再經過一個線性投影,得到最終進行匹配的特征向量:

3.2.2 最佳匹配層
最佳匹配層(Optimal matching layer)創建一個M×N 的得分矩陣,然后使用Sinkhorn 算法(對于T次迭代)解算出最優特征分配矩陣。即最佳匹配層在進行最優傳輸問題求解。
最優傳輸問題。根據最優傳輸理論,對于兩組特征點和,其中μs和μt分別表示X 和Y中點的重要程度,pts和ptj為概率∕權重,δ(·)為激活∕脈沖函數。然后定義損失矩陣(Cost Matrix),代表從xi到yj匹配需要的代價:Mi,j=dist( xi,yj)。局部特征點匹配問題轉化為

Sinkhorn 算法。對于得分矩陣,先逐行做歸一化,再逐列做歸一化,重復以上縮放過程N(N>2)步,得到分配矩陣。該算法能夠以一種迭代的方式求解最優傳輸問題。
進行兵力部署估計時,輸入為兵力聚合的輸出。由式(1)可知,關鍵信息為位置信息,包括橫坐標(Abscissa)、縱坐標(Ordinate)、跨度(Span)和特征信息,包括群體類型(ArmType)、可信度(Probability)。特征點的位置信息則是3 維的位置向量。對于有D 種群體類型的模板庫,可進行one-hot 編碼得到D維屬性向量,各維的值即是對應群體類型的可信度∕概率值。這兩者正好可以作為SuperGlue輸入的特征點位置和描述子。
基于已知的T 個模板,建立相應的T 個模板圖。每個模板圖的坐標向量間的拓撲關系代表典型的陣型。各節點的特征向量由該節點類型的one-hot編碼得到。
訓練所用數據集由模板圖變換得到。包括位置型變換:平移、鏡像、旋轉和伸縮;特征型變換:掩藏節點、分散可信度;混合型變換:位置型變換和特征型變換的組合。特征型變換中,掩藏節點得到的圖相當于戰場上有未被偵察的作戰群體的情形;分散可信度得到的圖相當于戰場上某個特定的作戰群體屬性存疑或未知。
位置向量(節點的坐標向量)和屬性向量(節點的特征向量)在進行耦合前,位置向量會經過多層感知器嵌入到高維空間。該多層感知器的層數和每層的維數作為超參數需要進一步評估。在耦合時,還應當加入權重項λ 平衡二者的重要程度,公式如下:

注意力聚合網絡中,若把一次自注意力和交叉注意力交替作為一層,該網絡的深度L 對訓練和測試的影響有待進一步評估。
由分配矩陣可得到圖A 與圖B 間節點的匹配關系。完配:圖A 與圖B 間節點的匹配關系全部準確。未配:圖A 中的節點在圖B 中存在對應關系,但分配矩陣沒有匹配結果。錯配:圖A中的兩個節點均在圖B 中有對應關系,但分配矩陣得到的匹配結果卻是交叉匹配。1 未配:有一個節點未配,其他都配對正確。1 錯配:有一對節點錯配,其他都配對正確。完配率:完配的圖數占圖總數的百分比。1 未配率:1 未配的圖數占圖總數的百分比。1錯配率:1錯配的圖數占圖總數的百分比。
由于深度學習的各種原因,得到百分百準確率的結果是一件非常嚴苛的事情。故仿真實驗中允許存在一定程度的未配和錯配。
注意力圖神經網絡和最佳匹配層都是可微的,這使得反向傳播成為可能。網絡訓練使用監督學習,圖A 與圖B 構成的真值匹配矩陣作為學習目標,最小化分配矩陣P的負對數似然函數。
實驗基于Python 3.9.7 和PyTorch 1.10.1 實現。人工編輯8 個模板,5 種混合型變換,隨機實現10次,共400 個數據圖。按8:2 比例分為320 個圖的訓練集和80個圖的測試集。
分別進行了三組對照實驗,比較編碼維數kens、網絡層數gnns、權重項alpha對結果的影響。

圖3 編碼維數的對比實驗

表1 不同超參數下的預測效果

圖4 網絡層數的對比實驗
從圖3 中可以看出,編碼的維數太低,損失波動較大,效果會略遜一些;編碼維數增高,效果相對會好一些。但整體收斂在差不多的范圍??梢?,編碼維數應當稍微高一些,讓位置信息映射到較高的高維空間;編碼維數并不影響收斂范圍。
從圖4 中可以看出,隨著網絡層數的增加,收斂效果越來越差。一種可能的解釋是特征向量本身的維度并不高,應當選擇適合該維數的深度,過深的網絡只會造成學習的飽和。同時隨著網絡的加深,優化時間也會大大增加,影響學習性能。
從圖5 中可以看出,權重項alpha 為1 的時候,收斂效果最好。可見,本目標的學習內容不適合調動該參數。
表1 是上述七個模型參數對應的預測效果。由表一可知,kens=[6,18,36],gnns=30,alpha=1 的模型預測效果最好。增加網絡層數到一定深度和降低屬性向量權重到一定值都會導致預測效果顯著下降。

圖5 權重項的對比實驗
本文提出了通過SuperGlue進行兵力部署估計的方法。通過以上仿真實驗結果可以看出,該算法可以有效匹配模板,發現原群體陣型中未知的兵力情況和估計不確定屬性群體的屬性。仿真實驗中僅考慮了模板存在的匹配情況,因此不存在于模板庫中的新陣型匹配將是本模型需要進一步關注的對象。