陳 昊,趙 斐,王世珠,劉思培
(1.北京跟蹤與通信技術研究所,北京 100094;2.北方信息控制研究院集團有限公司,南京 211153)
現代戰爭已由過去的打火力、打機械時代進入到了打信息戰時代,伴隨爭奪制信息權而來的問題是戰場信息量的急劇增長、高價值信息易被淹沒在信息汪洋中;傳統將戰場態勢信息不加選擇、全部展現的方式已經落伍,而面向不同作戰單元和群體將所需要的態勢信息快速而準確地定制推送、一致顯示已經成為新的趨勢;戰場態勢信息精準推薦定制能力逐漸成為衡量指控系統效能的重要指標。目前常用的推薦方法一般可分為基于內容的推薦[1-6]、基于協同的推薦[7-13]、基于規則的推薦[14-15]。其中,基于內容的推薦多基于文本形式,對其他多模態數據的特征提取受到限制,特征數據的匱乏導致無法發現用戶潛在的興趣和信息需求,用戶對推薦的信任度和滿意度不高;基于規則的推薦具有數據支持的廣泛性,可按照用戶級別、任務類型和數據種類進行規則或策略定制,但存在規則制定復雜、作戰場景適應性差、用戶維護不便、應用體驗不佳的問題。綜上,以上方法對于態勢信息精準推薦應用而言都有其局限性。
為了解決態勢信息精準推薦的問題,本文提出了基于用戶畫像與協同過濾算法的態勢信息精準推薦方法。該方法以用戶單元或群體的行為或興趣為基礎,實時生成用戶畫像;通過一定的相似度度量用戶之間的相關性,特別是引入用戶畫像偏好指數,應用和優化協同過濾算法,將鄰居用戶已訪問過而目標用戶還未訪問的項目作為最終推薦項目,從而可以實現具有一定聯想性的目標用戶個性化推薦。
戰場態勢是發生在一定空間和時間范圍的戰場要素以及要素之間相互關系的集合。戰場態勢信息一般包括戰場環境、兵力部署、作戰企圖、作戰決心、戰場目標等戰場信息。20 世紀90 年代后期,美軍為適應信息化聯合作戰的強烈需求,提出了態勢圖族概念即互操作作戰圖族FIOP(Family of Interop Operational Pic)。互操作作戰圖族FIOP 包括3 類態勢圖:1)共用作戰態勢圖COP(Common Operational Picture),主要用于國家和戰區層面的作戰活動;2)共用戰術圖CTP(Common Tactical Picture),主要用于支持戰術作戰;3)單一合成態勢圖SIP(Single Integrated Picture),主要用于支持火力打擊。通過應用互操作作戰圖族FIOP,美軍構建了涵蓋戰略、戰役、戰術用戶的戰場態勢生成體系,針對3 類作戰用戶提供互操作作戰圖族FIOP 的訂閱分發服務能力,極大提升了戰場態勢圖的作戰應用效能。
在隨后的應用過程中,美軍發現互操作作戰圖族FIOP 分類過于粗獷、數據量大、傳輸效率低,雖然能夠覆蓋戰略、戰役、戰術等用戶的需求,但不同層級用戶在進行戰場態勢感知時,無法從大量的戰場態勢信息中及時、高效地發現、獲取自身急需的信息。因此,美軍在統一態勢圖的基礎上,提出了一致態勢圖的理念,認為戰場態勢的表達并不需要構建統一的態勢圖,而更側重于在基于一致態勢認知的基礎上為不同的用戶生成定制的態勢。因此,后續又發展了用戶定制態勢圖(UDOP),其核心思想是圍繞作戰用戶的態勢感知需求,定制生成面向終端用戶作戰所需要態勢。同時,美軍在《2020 聯合構想》中將COP 由戰場感知領域擴展到作戰領域,以網絡互聯和知識共享環境為基礎,融合陸、海、空、天、電等作戰域的火力、ISR、后勤、機動等信息,形成一個立體完整的戰場態勢。
傳統的態勢信息生成與分發過程,主要依據態勢信息的固有模型,通過采集、解析、處理戰場感知數據,運用態勢估計算法實現態勢提取與理解,實時、近實時地生成戰場態勢,并根據約定的用戶范圍,進行戰場態勢信息的按需分發。

圖1 統一態勢分發(左)與一致態勢分發(右)
如圖1 所示,其態勢信息生成與分發的模式一般可包括兩種:
1.2.1 統一態勢生成與分發
基于統一態勢的生成與分發,一般圍繞態勢主題或應用層級,通過分析態勢元素間的固有關系實現態勢建模,生成統一態勢,并針對用戶訂閱需求進行全局或局部分發共享。
1.2.2 一致態勢生成與分發
基于一致態勢的生成與分發,主要面向不同用戶個體的態勢信息需求建模,生成專有的用戶態勢信息,完成態勢信息的定制生成與分發。
態勢信息的質量可從內容質量、集合質量、表達質量、效用質量等方面分析評價。從態勢生成與分發角度考慮,本研究側重于考察態勢的集合質量。態勢集合質量包括態勢的完整性和態勢的相關性兩項指標。
1.3.1 態勢的完整性
完整性即通過感知手段獲取的戰場目標反映戰場真實目標數量的程度。當無虛假目標(虛警或雜波)時,態勢的完整性可以定義為:

其中,N0(tk)表示tk時刻戰場真實目標總數,N1(tk)表示tk時刻所獲取的目標數。Com∈[0,1],Com=1 表示系統態勢是完整的。
在基于用戶畫像的態勢信息精準推薦過程中,態勢的完整性會影響整體態勢信息的質量,但其結果并不參與態勢信息推薦過程。因此,我們不使用態勢信息的完整性來評價和指導精準推薦過程。
1.3.2 態勢的相關性
相關性即通過融合處理生成的態勢實體與用戶需求的態勢信息的關聯程度。態勢的相關性可以定義為:

其中,Ttk表示tk時刻的態勢實體向量,Ptk表示tk時刻用戶期望的態勢實體向量。Sim∈[0,1],Sim=1 表示生成的用戶態勢和用戶期望的態勢是完全相關的。可知,態勢相關性能夠直接反映態勢推薦的結果。在本研究中,態勢相關性被泛化為信息相似度。
本文所涉基于用戶畫像的態勢精準推薦研究是假定在已經生成精確、完整的全局態勢集合基礎上,圍繞提升用戶態勢集合質量,提高態勢集合質量中的相關性指標,基于一致態勢生成模式提出的一種面向用戶的態勢精準生成方法。其應用架構如圖2 所示,通過對云上匯集的態勢數據進行分類、聚類、分析,關聯用戶的身份、作戰任務等屬性,同時考慮用戶的操作習慣、偏好信息,實時計算精準生成用戶的一致態勢信息,并面向用戶完成定向分發。具體過程如圖3 所示,包括4 個部分內容:

圖2 態勢精準推薦應用架構
第1 步,建立統一的戰場資源描述框架,統一數據、信息、模型、用戶畫像的表示機制,建立“數據、信息、模型、用戶畫像”四維一體的戰場信息描述模型,以便系統具備相同的“信息基因”;從用戶畫像(特征)、關聯關系(需求)兩個維度梳理戰場數據構建領域本體,形成以“用戶畫像(特征)、關聯關系(需求)”為核心的結構化的戰場數據描述規范;為后續用戶態勢信息、用戶需求信息、任務信息關聯和統一描述奠定基礎;
第2 步,將態勢信息中的目標、任務等信息構建成本體,提取天基數據、地面戰場感知數據等,將目標、任務中所包含的位置、時間等信息構建成本體的數據屬性和關聯關系,實現態勢信息建模;
第3 步,分析用戶角色、用戶身份的特點和信息需求建立作戰用戶基礎特征模型;梳理各類作戰任務的任務類型、任務對象、任務力量等特征建立面向任務的高價值任務信息關聯模型;記錄用戶操作、用戶習慣等行為模式數據建立用戶偏好模型;結合先驗數據、訓練樣本數據,綜合用戶基礎特征模型、任務信息關聯模型、用戶偏好模型和戰場數據,實時更新用戶畫像;
最后,針對實時態勢信息,查找發現與實時態勢信息相似的用戶信息需求,計算即時態勢信息與用戶信息的相似度。針對信息相似度結果,過濾不相關態勢信息,精準推薦用戶戰場態勢。

圖3 態勢精準推薦
用戶畫像(UserProfiling),又稱為用戶打標簽(UserLabeling)、用戶建模(UserModeling),是描述用戶的一系列用戶屬性的集合,可通過數據挖掘方法分析用戶的行為、觀點等,抽取出用戶的典型特征,從而將人物原型標簽化;同時在描述記錄用戶完整特征的同時,側重于挖掘信息需求關聯關系。
基于信息需求關聯的用戶畫像生成,主要包括戰場資源統一描述框架和作戰用戶畫像原型設計兩部分。
2.2.1 戰場資源統一描述框架

圖4 態勢用戶畫像構建
戰場資源統一描述框架基于本體論和知識圖譜等相關理論,采用“概念、屬性、關系、實例”等基本元語,按照“實體-關系-實體”和“實體-屬性-取值”的描述形式。其中,概念是一類對象的抽象描述,如作戰人員、武器平臺、目標等;屬性是指對各類實體的特征抽象,類比為數據庫表的列字段,如年齡、射程、速度等;關系是支持不同實體之間的關聯依賴,如裝備和編制單位的隸屬或配備關系、跟蹤雷達和作戰平臺的隸屬關系等;實例是某概念的具體表現實體,如1 連指揮車和2 號陣地的氣象信息等。
戰場信息描述模型基于本體技術中概念、屬性、關聯和實例等幾個元語,進行分別定義和表征。信息描述模型分為兩個層次,即概念層和實例層。在概念層次,是對戰場所有涉及到實體和要素進行統一抽象,形成基于概念、屬性和關系的戰場數據本體模型;在實例層次,按照“實體-關系-實體”和“實體-屬性-取值”的形式對各類戰場信息進行統一描述,形成數據信息集合。
2.2.2 作戰用戶畫像設計
用戶畫像設計是用戶對態勢信息的興趣偏好和興趣內容特征的描述和表征,獲取、表示、存儲和修改用戶興趣偏好,更好地理解用戶的需求和任務,從而更好地提供用戶所需要的態勢信息資源。用戶畫像可分為個體用戶畫像、用戶群組畫像。個體用戶畫像區分不同身份特征用戶,用戶群組畫像基于群組內的所有個體用戶具有極其相似的興趣的假設。
用戶畫像的設計包括用戶基礎特征模型設計、任務信息關聯模型設計、用戶偏好模型設計等。任務信息關聯模型是以作戰任務所涉及到作戰力量、打擊目標、作戰區域、作戰計劃等各類要素為基礎,按照任務類別、任務狀態、任務階段和應用軟件需求等角度,在領域本體的框架下建立各類要素與戰場信息之間的關聯描述模型;用戶偏好模型構建是在個體用戶畫像和群組畫像構建的基礎上,綜合考慮不同用戶的各自任務角色、用戶身份和用戶行為操作等方面特征,動態構建個體用戶與戰場信息之間的篩選和過濾,將用戶畫像中的概念標簽映射為戰場信息中具體實例信息。
通過協同過濾實現態勢信息推薦,其本質是忽略數據內容本身的內涵,而聚焦目標用戶需求興趣相似的鄰居用戶對于目標文檔的評價來預測目標用戶的評價。根據態勢信息與目標用戶信息需求的匹配程度,將態勢推薦給需要的用戶。

圖5 態勢協同過濾
這個方式本身對于用戶比較稀少的戰場環境有其固有缺陷,而且具有數據稀少時無法推薦的問題。本文從兩個角度進行限制或改進,以提高協同過濾算法應用可行性。一是聚焦到任務驅動的高價值信息的推薦方面,由于作戰任務信息類型和用戶角色相對固定,執行相似作戰任務對信息需求比較類似,不受時間、空間和信息源的限制;二是在應用系統環境下,建立用戶對推送信息的評價和反饋機制,利用用戶主動或被動相結合的方式,定位和監控用戶對推送數據的使用頻度和信息度,定期將數據同步到后臺日志中作為訓練的依據,一定程度緩解數據量稀少的問題。將上述兩項因素轉換為計算因子,計算生成與用戶畫像潛在關聯的用戶畫像偏好指數,將提升優化用戶需求態勢信息協同過濾效率,在邏輯層面實現為每個用戶個性化推薦效果。協同過濾實現步驟如下:

1)首先建立用戶模型和用戶-態勢信息評分矩陣UT其中,m 表示作戰用戶數量,n 表示態勢信息條數,Tij戶對第i 個作戰用戶對j 個態勢信息的評價值。然后基于用戶-態勢信息評分矩陣使用相似度算法計算用戶相似度找出近鄰用戶:

其中,Si、Sj分別表示用戶i 和用戶j 對態勢信息的評分集合,Si,j=Si∩Sj表示用戶i 和用戶j 共同評分過的態勢信息,Ris、Rjs表示用戶i 和用戶j 對態勢信息s 的評分,Rj、Ri為用戶i 和用戶j 對態勢信息評分的平均值。選擇合適閾值m,確定待推薦用戶的最近鄰用戶集合:

2)根據相似用戶的態勢信息按照權重進行排序,將權重較高的態勢信息推薦給目標用戶。得到Um之后,通過對Um進行加權來預測用戶o 對態勢信息t 的評分Rot:

其中,Ro、Ri為用戶o 和用戶j 對態勢信息偏好的平均值,Sim(o,j)代表用戶o 和用戶j 的相似度,Rjt代表著用戶j 對態勢信息t 的用戶偏好。
對于信息精準保障內容用戶無進一步操作行為和反饋,或者與用戶執行的任務不相關,則適當應該降低用戶對當前實例標簽或類別標簽的興趣權重;如果對于信息精準保障內容用戶給與正面的反饋或進一步操作行為,或者與用戶執行的任務相關則調高相關興趣標簽的權重。
為驗證態勢信息精準推薦算法,模擬某爭議地區發生沖突,某部隊對重點軍事目標偵察、打擊。試驗中,重點關注衛星過境信息、天基信息,同時實時模擬作戰過程中己方感知、傳統偵察手段獲取的作戰分隊信息、戰場環境、目標毀傷信息、戰果戰損信息;利用基于用戶畫像和協同過濾算法的態勢信息精準推薦方法,精準生成和推薦不同任務的作戰用戶態勢。
本次試驗設定某部隊指揮員、天基偵察員、目標保障員、火力協調員為戰場態勢信息的主要保障用戶,針對不同的作戰任務、不同的作戰階段向其精確推送保障態勢。
試驗中模擬了兩部分數據:一是戰場信息,包括作戰分隊位置信息、環境信息、目標毀傷信息、戰果戰損信息、衛星過境信息等;二是用戶任務信息。通過分析用戶的基本信息、用戶任務信息以及先驗知識數據庫,提取用戶特征信息,生成19 個用戶畫像;結合本次試驗場景,著重選取、關注與本次打擊任務相關的4 個用戶,生成的初始用戶畫像如圖6所示。

圖6 初始用戶畫像
梳理各類作戰任務的任務類型、任務對象、任務力量等特征建立面向任務的高價值任務信息關聯模型。最后,綜合用戶模型和任務信息關聯模型生成用戶信息需求模型,并計算出用戶相似度。試驗設定用戶1(部隊指揮員)、用戶3(情報偵察員)、用戶12(地面目標偵察員)、用戶15(火力協調員)為信息精準保障的用戶。
基于用戶任務和用戶行為角度,用19 個用戶分別與指揮員、情報偵察員、地面目標偵察員、火力協調員的信息需求對比,分析與其用戶信息相似度,結果如圖7、圖8、下頁圖9、圖10 所示。

圖8 情報偵察員用戶相似度

圖9 地面目標偵察員用戶相似度

圖10 火力協調員用戶相似度
由上述表格和圖可知,如設定用戶信息相似度50%為推薦閾值,則推薦給部隊指揮員的信息,不會推薦給其他3 類用戶;推薦給情報偵察員的信息,會推薦給偵察分隊指揮員、空中目標偵察員、地面目標偵察員;推薦地面目標偵察員的信息,會推薦給情報偵察員、空中目標偵察員、火力操控員、火力協調員;推薦給火力協調員的信息,會推薦給部隊指揮員。因此,僅根據用戶特征生成的用戶相似度度,與設定4 類用戶的初始信息需求相似度并不一致,無法按照設定推薦戰場態勢產品。

圖11 用戶信息相似度
我們以4 類用戶畫像共同的信息需求模型抽象出來的實體為全集,以19 類用戶的信息需求模型實體為子集,生成19 類用戶的用戶信息相似度,如圖9 用戶信息相似度所示。由圖可知,19 類用戶的初始用戶信息相似度比較接近,很難過濾掉不需要推送的用戶。

表1 不同條件下的用戶信息相似度
將用戶歷史數據輸入系統,訓練用戶信息相似度;通過兩個步驟加以訓練完善,訓練后數據如表1所示。
1)訓練基于用戶的信息相似度模型。將用戶歷史數據輸入系統,訓練用戶信息相似度;
2)訓練基于內容的協同過濾算法。通過采集用戶偏好值,將用戶偏好向量,生成用戶偏好指數。
根據表1 生成不同用戶的信息相似度圖,如圖12 所示。系列1 藍線代表原始的用戶信息相似度,系列2 黃線代表用戶歷史數據訓練的用戶信息相似度,系列3 褐線代表基于用戶偏好的用戶信息相似度。在沒有引入用戶畫像偏好指數前,信息相似度的計算結果在各個用戶上更趨近于平均,這顯然不符合客觀實際;在引入用戶畫像偏好指數后,模型的精準推薦結果更接近于經驗分布。

圖12 訓練后用戶信息相似度圖
從用戶基礎特征、任務關聯信息、用戶偏好等角度構建用戶畫像,進行用戶態勢信息需求分析,可實現態勢信息的精準推薦保障。通過在戰場態勢信息空間與用戶需求之間建立關聯映射關系,并對用戶歷史態勢信息使用記錄、任務動態趨勢分析學習,建立可動態更新的用戶畫像。特別是通過引入用戶畫像偏好指數,可提高協同過濾精度,實現態勢信息的精準推薦。