學喆 張岳 陳軍
摘要:為了減少無人機與有人機的頻繁交互,本文提出無人-有人機混合主動式交互決策模型方法。首先,采用基于規則的模糊認知圖(RBFCM),構建決策任務選擇規則庫,實現決策任務的快速選擇;其次,根據決策任務、無人機狀態和當前戰場態勢,考慮到戰場信息的不確定性,構建基于模糊灰色認知圖(FGCM)的協同決策需求推理模型;最后,根據協同決策需求程度和有人機(飛行員)的任務負荷水平等信息,采用模糊認知圖(FCM)建立交互方式決策模型。其中,在協同決策需求推理模型和交互方式決策模型中引入粒子群算法(PSO)學習模型的權重矩陣,使權重矩陣更加客觀。通過仿真試驗,驗證了無人-有人機混合主動式交互決策模型方法的有效性和可靠性。該模型可以實現從決策任務的快速選擇到交互方式的自主決策,為無人-有人機混合主動式交互決策研究提供新思路。
關鍵詞:混合主動式;人機協同;交互決策;模糊認知圖;粒子群算法
中圖分類號:V19文獻標識碼:ADOI:10.19452/j.issn1007-5453.2022.05.007
有人機與無人機協同可以實現兩者的優勢互補,提升編隊的整體作戰效能,它是未來空戰的重要樣式[1-2]。其中,無人機與有人機的交互活動貫穿協同探測、任務規劃、協同控制、協同攻擊等任務環節[3-7]。為了減少頻繁交互、降低飛行員的任務負荷,無人機應充分發揮自主潛能,根據人-機-環狀態自主地選擇應該執行的決策任務,推理該決策任務的協同需求,進而確定與有人機的具體交互方式。這種混合主動式的交互決策模式適用于具有較高自主水平的無人機與有人機的協同,有助于提升智能人機系統的融合交互水平[8-11]。
目前,國內外學者主要對混合主動交互模式下的協同控制等具體問題開展了研究,如Clare等[12]使用混合主動方式實現了多個無人駕駛車輛的自動任務分配和調度,操作員只在必要時處理不可預見的問題。Schmitt等[13]研究了有人機/無人機系統中混合主動式交互的方法,使無人機可協助有人機實現任務規劃和管理。吳立珍等[14]建立了基于多模態交互的多無人機混合主動控制系統,根據決策等級和多任務動態分配原則切換人的控制權限和無人機的控制權限,實現操作員對多無人機的混合主動控制。但對于無人-有人機混合主動式的交互決策問題研究比較少。
混合主動式交互決策是指無人機能夠根據自身狀態、有人機(包括飛行員)狀態,以及作戰任務使命要求,自主確定其應執行的決策任務,推理該決策任務的交互需求,進而選擇采用何種方式與有人機進行交互。它可以有效發揮無人機的智能決策推理能力,減少與有人機的交互頻次,降低飛行員任務負荷,促使無人機的角色從有人機“聽命的隨從”轉變為“忠誠的伙伴”,非常符合未來高端無人機和先進有人機的協同決策技術發展趨勢。
因此,本文擬采用基于規則的模糊認知圖,實現無人機決策任務的快速選擇;考慮到復雜戰場的不確定性,擬運用模糊灰色認知圖實現協同決策需求的智能推理,并基于無人機自主級別劃分標準建立交互方式決策模型。在建模過程中,需要充分發揮先驗知識和可用數據的作用,提高交互決策模型的有效性和可靠性。
1 FCM及其擴展模型
1.1模糊認知圖
模糊認知圖(fuzzy cognitive map,FCM),是一種較理想的、可用于建模和模擬動態系統知識表示和決策支持的工具。經典FCM模型由概念節點、有向弧及其關聯權值矩陣組成。節點表示系統的屬性、特征、性能等;有向弧表示節點間的影響關系,其影響程度由關聯權值矩陣描述,通過各概念之間的因果關系以及相互作用來模擬復雜系統行為,如圖1所示。
由于FCM建模方法簡單、靈活,容易引入其他智能方法和學習算法,以及在不同應用場景良好的適應性和易用性,使得FCM的發展迅速,衍生出許多FCM擴展模型[15],主要包括基于規則的模糊認知圖[16]、模糊灰色認知圖[17]、直覺模糊認知圖[18]、動態模糊認知圖[19],并且在人機協同領域取得了廣泛應用[20-21]。
1.2兩種模糊認知圖的擴展形式


2混合主動式交互決策模型架構
無人-有人機混合主動式交互決策模型架構如圖3所示。模型主要包括決策任務選擇模型、協同決策需求推理模型和交互方式決策模型。
為了實現無人機對決策任務的快速選擇,采用RBFCM模型方法對決策任務選擇進行建模。其中,輸入節點集合主要來源于戰場態勢CEnv、無人機狀態CUAV和有人機的狀態CMAV。初始選擇模糊規則集R(·)由專家知識庫構建,可采用知識圖譜的方法抽取獲得[22]。輸出節點集合為決策任務類型CDecisionTask,可以引入規則評價值支持模糊規則的學習更新,如圖4所示。
針對復雜戰場環境的不確定性特征,采用FGCM對協同決策需求推理進行建模;從協同決策需求程度CDemand、飛行員任務負荷水平CMissionLoad和無人機自主等級CLOA等方面構建交互方式決策模型,如圖5所示。模型的參數可以采用粒子群算法(PSO)進行學習,減小模型實際輸出與期望輸出之間的誤差,并利用歷史數據樣本學習優化權重矩陣。DB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA

3決策任務選擇模型
基于“觀察-判斷-決策-行動”(OODA)的任務回路,一般無人機可選擇的決策任務主要為:目標確定、威脅判斷、航路選擇、機動決策、攻擊判斷等[23]。從戰場態勢、無人機狀態和有人機狀態三個方面提取特征因素作為模型節點,如圖4所示構建基于RBFCM的決策任務選擇模型。
戰場態勢包括地形、氣象以及電磁三個特征因素,其模糊化表征見表1。
無人機狀態包括自主等級、資源水平和智能水平三個特征因素。表2為改進的LOA劃分標準,能與有人機協同決策的無人機自主等級最高應達到IV-V級,具備同意管理或例外管理模式。
無人機資源水平是指物理域中無人機所固有的、基于其裝備水平的任務活動實施能力。資源支持為定值,僅受其裝備水平影響,從無人機機動性、探測能力、通信中繼能力、續航能力、戰斗能力、交互能力、協作能力、電磁能力等方面綜合考慮,將資源水平模糊化為[0,1]之間的5個等級。無人機智能水平指認知域內無人機觀察、認知、分析、計劃、決定、行動、溝通方面智能水平的支持能力。綜合考慮上述因素,同樣將其智能水平模糊化為[0,1]之間的5個等級。
在不同的特征因素下,無人機最適合執行的決策任務也不同。例如,當環境條件惡劣、無人機自主等級較低且有人機飛行員任務負荷較重時,無人機適合執行無須操作員授權、危險系數和對智能水平要求較低的航路選擇等決策任務。
特征因素模糊化值可用編碼的形式表示,方便RBFCM的推理,如圖6所示。用5維矢量表示一個特征因素在[0,1]區間上的表現情況。例如,航路選擇中特征因素地形的編碼為[1,1,1,0,0]表示在航路選擇決策任務中地形相對平坦,分布在前三個模糊區間。根據專家先驗知識構建決策任務選擇RBFCM模型的初始規則,見表3。
4協同決策需求推理模型
從使命任務、無人機狀態和戰場態勢三個方面提取特征因素,構建基于FGCM的協同決策需求推理模型,并采用灰數的方式量化特征參數。
任務使命決定了任務的復雜度,根據不同任務類型的側重點,模糊量化任務復雜度見表4。
無人機狀態從物理域、認知域、信息域三個方面的需求進行描述。(1)物理域:無人機的需求體現在機動性、探測能力、通信中繼能力、續航能力、戰斗能力、交互能力、協作能力、電磁能力等資源水平的支持上,用Lp表示。(2)認知域:無人機的需求體現在觀察、認知、分析、計劃、決定、行動、溝通方面智能水平的支持上,用Lc表示。(3)信息域:將無人機抽象為節點,無人機間信息傳遞方向表示節點連接關系,主要從時效和安全角度考慮無人機信息傳遞拓撲結構所產生的作戰效益。
戰場態勢方面與表2選取的特征相同,不同的是它們的取值不再是一個確定的數,而是一個灰度區間。根據選取的特征因素及其影響關系,構建基于FGCM的協同決策需求推理模型如圖7所示。其中,各節點含義見表5。模型初始權重矩陣確定如下


5交互方式決策模型
基于FCM構建的交互方式決策模型選取協同決策需求程度C1、當前無人機自主等級C2、飛行員的任務負荷水平C3三個因素為輸入節點,推理結果由節點C4輸出,并通過兩個門限參數ε和δ將結果映射到三種交互方式:協同決策、同意管理、例外管理。門限參數可通過數據樣本學習調整。決策推理模型如圖9所示。
在同意管理和例外管理的無人-有人機交互方式下,有人機不參與無人機自主決策,只負責對無人機上報的決策方案進行批準或默認,此時無人機的決策自主等級處于IV-V級。在協同決策交互方式中,由于決策條件的不充分,導致無人機要么無法給出決策結果,要么只能列出可能的所有決策方案或是若干最可行的決策方案,此時無人機的決策自主等級處于I-III級,需要請求有人機干預其自主決策活動。
在數據樣本的支持下,同樣可以采用PSO算法優化交互方式決策模型的權重矩陣。與FGCM模型不同的是,FCM模型的PSO算法個體由模型中的非零權值組成,由于權重矩陣的非零值有5個,為了進一步提高模型的客觀性,將兩個門限參數ε和δ也作為學習的參數,但要滿足0<ε<δ<1。因此,個體編碼長度為7位。由FCM和兩個門限參數ε和δ的定義可知,在種群的初始化和迭代過程中,每一位權值在[-1, 1]。
6仿真試驗
6.1決策任務選擇模型驗證
基于RBFCM的決策任務選擇模型的驗證主要考察規則集是否完備且無沖突。
由表3易知,對于任意輸入組合都有決策任務與之對應,所以規則是完備的。
對于沖突的檢驗,采取遍歷所有輸入組合的方法。按照規則表進行推理,找出沖突的輸入組合并根據沖突的結果對規則進行調整。經過檢驗發現目標確定和機動決策存在沖突,對相應的規則進行調整,通過完備性和無沖突檢驗的規則集見表6(加粗部分為調整之后)。DB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA



根據調整后的規則表,可以獲得每種決策任務下各項特征參數的分布區間。以航路選擇為例,其特征參數的分布區間如圖10所示。根據特征參數的分布區間圖,可以直觀地看出模糊規則下不同決策任務的特征參數分布特點,根據調整后完備、無沖突的RBFCM模型,可以實現快速的決策任務選擇。
6.2協同決策需求模型驗證
根據數據樣本學習、調整權重矩陣,當訓練集上的誤差滿足設計要求時,將此時的權重矩陣作為最終矩陣。訓練樣本示例見表7(訓練樣本為收集到的歷史數據,故均為精確值且經過歸一化處理)。設置PSO算法的種群大小為500,慣性因子取為1,學習因子取為2。為防止粒子更新步長過大,設置粒子最大速度為0.1,最大迭代步數300步。在學習過程中,對于超出限定范圍的個體進行重新初始化,30組訓練數據下,由于前10步誤差與后面的誤差不是同一量級,為了便于觀察判斷,從第11步開始繪制樣本擬合誤差下降曲線,如圖11所示。
經過300步的訓練,誤差下降到非常小的范圍內,此時得到FGCM模型的最終權重矩陣如下(結果精確到小數點后兩位)。
可見,采用PSO算法,收斂快,效率高,權值矩陣的學習提高了模型的客觀性。
6.3交互方式決策模型驗證
基于FCM的交互方式決策模型的權重矩陣同樣采用PSO算法進行學習。與協同決策需求推理FGCM模型不同的是,FGCM的權重矩陣是在專家給定的初始權值基礎上進行學習、調整,目標函數是訓練樣本的實際輸出與期望輸出之間的誤差,而這里的初始矩陣需要隨機生成,目標函數為樣本數據中的交互方式決策正確率,其訓練樣本示例見表8(數據均經過歸一化處理)。
同樣設置PSO算法的種群大小為500,慣性因子取為1,學習因子取為2。為防止粒子更新步長過大,設置粒子最大速度為0.1,最大迭代步數500步。在學習過程中,對于超出限定范圍的個體進行重新初始化,30組訓練數據下,訓練準確率如圖12所示。
此時,兩個門限參數分別為0.31、0.65,交互方式決策模型的準確率達到95%。
使用20組測試數據進行推理,三種交互方式分布如圖13所示。在不同的情況下,無人機根據無人機自主等級、協同決策需求程度以及飛行員的任務負荷水平的不同,推理出適合此情境下的交互方式。例如,在無人機自主等級高而協同決策需求程度以及飛行員的任務負荷水平低時,選擇例外管理交互方式。而在傳統的交互方式中,不同情況下無人機均采用同一種交互方式,缺乏針對性,導致飛行員的頻繁介入或不能及時介入,進而造成飛行員認知負荷過重或無法發揮人機協同的最大效果。
7結論
本文從避免頻繁交互的角度出發,開展了無人-有人機混合主動式交互決策研究,主要工作如下:
(1)采用FCM及其擴展模型進行建模,考慮到戰場態勢的實時性,建立了基于RBFCM的決策任務選擇模型,仿真試驗表明,此模型的規則表完備且無沖突,可以實現決策任務的快速選擇。
(2)面對戰場信息的不確定性,建立了基于FGCM的協同決策需求推理模型,通過灰數表達戰場信息的不確定性,并引入PSO算法,通過歷史數據學習、調整權重矩陣,提升了模型推理的客觀性和準確性。
(3)根據以上兩個模型的結果建立基于FCM的人機交互決策推理模型,同樣使用PSO算法學習權值矩陣。仿真表明,模型經過500步訓練后,人機交互推理模型的交互模式選擇準確率可以達到95%以上。
綜上所述,基于混合主動式無人-有人機交互決策模型可以實現從無人機決策任務選擇到無人機協同決策需求推理,再到其與有人機交互方式決策的全過程,可為未來高端無人機與先進有人機的協同決策技術研究提供方法參考。
參考文獻
[1]牛軼峰,沈林成,李杰,等.無人-有人機協同控制關鍵問題[J].中國科學:信息科學,2019,49(5):538-554. Niu Yifeng, Shen Lincheng, Li Jie, et al. Key scientific problems in cooperation control of unmanned-manned aircraft systems[J]. Scientia Sinica Informationis, 2019,49(5):538-554.(in Chinese)
[2]樊銳,張鑫龍,馬磊,等.有人/無人機協同作戰研究[J].中國電子科學研究院學報,2020,15(3):230-236. Fan Rui, Zhang Xinlong, Ma Lei, et al. Research on manned / unmannedaerialvehicleteaming[J].JournalofChina Academy of Electronics and Information Technology, 2020,15(3):230-236. (in Chinese)DB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA
[3]孫曉聞.無人/有人機協同探測/作戰應用研究[J].中國電子科學研究院學報,2014,9(4):331-334. Sun Xiaowen. Application research for cooperative detection combat of unmanned/manned aerial vehicles[J]. Journal of China Academy of Electronics and Information Technology, 2014,9(4):331-334. (in Chinese)
[4]胡月.有人/無人機協同作戰任務分配與航跡規劃研究[D].南京:南京航空航天大學,2020. Hu Yue. Research on mission assignment and flight path planning of manned/unmanned aerial vehicles cooperative operations[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2020. (in Chinese)
[5]于星棋,陳春,王淵.聯合作戰條件下有人機與無人機蜂群協同作戰研究[J].艦船電子工程,2021,41(10):5-6,29. Yu Xingqi, Chen Chun, Wang Yuan. Research on the cooperative operation of drones and man-machine swarm under the condition of joint operation[J]. Ship Electronic Engineering, 2021,41(10):5-6,29. (in Chinese)
[6]張杰勇,鐘赟,孫鵬,等.有人/無人機協同作戰指揮控制系統技術[J].指揮與控制學報,2021,7(2):203-214. Zhang Jieyong, Zhong Yun, Sun Peng, et al. Command and control system and technology for manned/unmanned aerial vehicle cooperative operation[J]. Journal of Command and Control, 2021,7(2):203-214. ( in Chinese)
[7]劉莎,張碩,劉祿.基于動態非零和博弈的無人機集群協同對抗方法研究[J].航空科學技術,2022,33(2):75-83. Liu Sha, Zhang Shuo, Liu Lu. Research on cooperative confrontation of UAV cluster based on dynamic non-zero-sum game[J]. Aeronautical Science & Technology, 2022,33(2):75-83.(in Chinese)
[8]Endsley M. Autonomous horizons:system autonomy in the air force-a path to the future(Volume I:human autonomy teaming)[M]. Washington:U.S. Department of theAir Force,2015.
[9]Allen J E,Guinn C I,Horvtz E. Mixed-initiative interaction[J]. IEEE Intelligent Systems and their Applications,1999,14(5):14-23.
[10]Tecuci G,Boicu M,Cox M T. Seven aspects of mixed-Initiative reasoning:an introduction to this special issue on mixedinitiative assistants[J].AI Magazine,2007,28(2):11-18.
[11]薛澄岐,王琳琳.智能人機系統的人機融合交互研究綜述[J].包裝工程, 2021,42(20):112-124. Xue Chengqi, Wang Linlin. Review of human-computer integration interaction in intelligent human-computer system[J]. Packing Engineering, 2021,42(20):112-124.(in Chinese)
[12]Clare A S,Macbeth J C,Cummings M L. Mixed-initiative strategies for real-time scheduling of multiple unmanned vehicles[C]//2012 American Control Conference(ACC),Montreal,CANADA,2012:676-682.
[13]Schmitt F,Schulte A. Mixed-initiative mission planning using planning strategy models in military manned-unmanned teaming missions[C]//2015 IEEE International Conference on Systems,Man,and Cybernetics(SMC),City Univ Hong Kong,Hong Kong,China,2015:1391-1396.DB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA
[14]吳立珍,牛軼峰,王菖,等.多無人機監督控制系統設計與實踐[J].無人系統技術,2020,3(4):42-52. Wu Lizhen, Niu Yifeng, Wang Chang, et al. Design and practice of supervisory control system for multiple unmanned aircraft systems[J]. Unmanned Systems Technology, 2020,3(4): 42-52. (in Chinese)
[15]Amirkhani A,Papageorgiou E I,Mohseni A,et al. A review of fuzzy cognitive maps in medicine:taxonomy,methods,and applications[J]. Computer Methods and Programs in Biomedicine,2017,142:129-145.
[16]Zdanowicz P,Petrovic D. New mechanisms for reasoning and impacts accumulation for rule-based fuzzy Cognitive Maps[J]. IEEE Transactions on Fuzzy Systems,2018,26(2):543-555.
[17]Harmati I A,Koczy L T. On the convergence of fuzzy grey cognitive maps[C]//3rd Conference on Information Technology,Systems Research and Computational Physics(ITSRCP),Krakow,POLAND,2018:74-84.
[18]Hajek P,Froelich W. Integrating TOPSIS with interval-valued intuitionistic fuzzy cognitive maps for effective group decision making[J]. Information Sciences,2019,485:394-412.
[19]Arruda L V R,Mendon?a M,Neves F,et al. Artificial life environment modeled by dynamic fuzzy cognitive maps[J]. IEEE Transactions on Cognitive and Developmental Systems,2018,10(1):88-101.
[20]陳軍,梁晶,程龍,等.基于FCM的多無人機協同攻擊決策建模方法[J].航空學報, 2022, 43(3):325526. Chen Jun, Liang Jing, Cheng Long, et al. Cooperative autonomous attack decision of multiple UAVs based on FCM[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(3):325526.(in Chinese)
[21]陳軍,徐嘉,高曉光.基于ABFCM模型框架的UCAV自主攻擊決策[J].系統工程與電子技術,2017,39(3):549-556. Chen Jun, Xu Jia, Gao Xiaoguang. Autonomous attack decision-making of UCAV based on ABFCM model framework[J]. Systems Engineering and Electronics, 2017, 39(3): 549-556. (in Chinese)
[22]鐘昊,郭永貞,宗孝鵬.基于知識圖譜的智能決策輔助系統研究[C]//第九屆中國指揮控制大會,2021:133-138. Zhong Hao, Guo Yongzhen, Zong Xiaopeng Research on intelligent decision support system based on knowledge atlas[C] //Proceedings of the 9th China Command and Control Conference, 2021:133-138. (in Chinese)
[23]吳兆香,歐陽權,王志勝,等.基于人工智能的無人機區域偵察方法研究現狀與發展[J].航空科學技術,2020,31(10):57-68. Wu Zhaoxiang, Ouyang Quan, Wang Zhisheng, et al. Status and development of regional reconnaissance methods of UAV based on artificial intelligence[J]. Aeronautical Science & Technology, 2020,31(10):57-68.(in Chinese)
Research on UAV-MAV Mixed-Initiative Interactive Decision
Xue Zhe1,Zhang Yue1,Chen Jun1,2
1. Northwestern Polytechnical University,Xian 710072,ChinaDB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA
2. Chongqing Institute for Brain and Intelligence,Guangyang Bay Laboratory,Chongqing 400064,China
Abstract: In order to reduce the frequent interaction between UAV and MAV, a hybrid active interactive decision model method of UAV and MAV is proposed. Firstly, the rule-based fuzzy cognitive map (RBFCM) is used to construct the decision task selection rule base to realize the rapid selection of decision tasks. Secondly, according to the decision tasks, UAV status and current battlefield situation, considering the uncertainty of battlefield information, the fuzzy grey cognitive map(FGCM) is constructed. Finally, according to the collaborative decision-making demand degree and the task load level of MAV(pilot), the interactive decision-making model is established by using fuzzy cognitive map (FCM). Among them, particle swarm optimization(PSO) algorithm is introduced into the collaborative decision-making demand reasoning model and interactive decision-making model learns the weight matrix of the model to make the weight matrix more objective. Through simulation experiments, the effectiveness and reliability of the hybrid active interactive decision-making model method of unmanned man-machine are verified. The model can realize the rapid selection of decision-making tasks to autonomous decision-making in interactive mode, which provides a new idea for the research of unmanned-man-machine hybrid active interactive decision-making.
Key Words: mixed-initiative; human-robot cooperation; interaction strategy; fuzzy cognitive map; particle swarm optimizationDB90CEC3-3942-44E5-ABC4-FEBBBB41B9CA