黃長強,唐傳林,黃漢橋,王勇,杜海文
(空軍工程大學 航空航天工程學院,陜西 西安710038)
近年來,隨著國內無人機領域的快速發(fā)展,以無人機(UAV)協同作戰(zhàn)相關內容的研究工作已經廣泛地開展,并取得很多研究成果。任務決策是多UAV 協同任務規(guī)劃的重要組成部分,隨著未來UAV的規(guī)模、執(zhí)行任務的能力以及任務的復雜性和多重耦合性的增加而更顯重要。
多UAV 協同任務決策問題有很多求解方法。例如,遺傳算法[1]、合同網[2]、貝葉斯算法[3]、線性規(guī)劃[4]、粒子群算法[5]、蟻群算法[6]、分布式拍賣算法[7]等,這些文獻對多UAV 任務決策進行了研究,但是都沒有考慮UAV 的歷史任務完成情況,沒有對UAV 的任務信任度進行評估,在實時環(huán)境中,不能為UAV 執(zhí)行后續(xù)任務提供可信的決策支持。現有的大多數方法基于任務的耦合性和次序性進行研究,將環(huán)境因素的影響理想化。文獻[8 -9]雖然考慮了環(huán)境因素,但只是將目標的機動或者突現作為不確定條件看待,而對目標的重要性和UAV 執(zhí)行任務的可信程度則沒有進行研究。目前,國內外學者對多UAV 協同作戰(zhàn)任務信任度的研究還很少,幾乎沒有相關的研究成果。
在任務決策過程中,必須考慮重要目標優(yōu)先被打擊。因此,在任務開始前,應該首先對目標進行重要性評估,在此基礎上根據UAV 的當前任務信任度進行任務決策,以便得到更符合實戰(zhàn)環(huán)境的決策結果。針對該問題,本文首先通過改進的模糊物元目標重要性評估方法,得到目標重要性排序,然后建立UAV 信任度模型,提出通過編隊中各個UAV 的歷史任務信息來評估、計算UAV 的當前任務信任度,以當前任務信任度作為編隊Leader 選擇的依據,實施可信的決策。
復雜環(huán)境下,由于UAV 自身探測能力的限制和復雜電磁環(huán)境對飛機電子靜默和戰(zhàn)術隱身的要求,UAV 不能形成完備的戰(zhàn)場態(tài)勢感知信息,而有限分布式Leader-Follower 的異構型結構[10]使這一困難得以解決,本文采用有限分布式結構實現UAV 間的信息交互。
任務設定為:UAV 編隊執(zhí)行反恐打擊任務,每個目標上須依次執(zhí)行4 類任務:搜索發(fā)現、目標確認、攻擊、目標毀傷評估。
1)對目標區(qū)預先進行偵察,獲取該區(qū)域目標的相關信息,包括:防空單元、反雷達裝置、房屋、車輛等。設定UAV 編隊起降點,根據偵察結果,規(guī)劃好航跡。
2)進行目標重要性評估,決定目標任務的執(zhí)行順序。
3)在UAV 執(zhí)行任務的過程中如果發(fā)現新目標,對目標進行識別并更新態(tài)勢信息,對新發(fā)現目標進行重要性評估,并將新目標信息發(fā)布給所有UAV。
4)UAV 返回對新目標的任務意向信息,長機根據各個UAV 的歷史任務數據、當前狀態(tài)等信息,求解基于UAV 歷史任務信任度的信任網絡模型,為UAV任務決策提供一個判據,優(yōu)化UAV 任務決策結果。
由于在復雜環(huán)境下,UAV 依靠自身的傳感器收集的信息有模糊性[11]。構建目標的模糊物元R ={M,Z,V},其中M 表示目標名稱,Z 表示目標評價指標,V 表示評價指標量值。
目標評價指標體系為:1)目標類型(z1);2)機動性(z2);3)電磁干擾能力(z3);4)目標距離(z4);5)時間敏感性(z5);6)目標安全時間(z6);7)火力毀傷程度(z7);8)易損性(z8)。每個UAV 依據上述評價指標進行綜合模糊評判,綜合評判函數為

式中:aji表示UAV jth對目標ith的綜合評價;ηjik為UAVjth對目標ith的第k 項評價指標權重;val(zjik)為UAVjth對目標ith的第k 項評價指標的估值。根據本文所述重點,目標類型在目標評價指標體系中占較大權重,其余評價指標權重可合理分配。易知aji值域區(qū)間為[1,100].
對模糊物元R={M,Z,V}的組元進行置換。根據評價指標,各個UAV 已計算出各個目標的綜合指標量值A,用A 代替模糊物元中評價指標量值V.用UAV 代替評價指標Z.于是得到各UAV 對各目標的基于目標重要性的模糊物元集Rmn:

定義 論域U 上,模糊集R∈U,給定了一個映射:f:R→[0,1],則稱f(R)為模糊集合的隸屬函數。f(a)表示U 中各個元素a 屬于R 集合的程度,當a是一個確定的元素a0時,稱f(a0)為元素a0對模糊集合的隸屬度。構造統一隸屬函數f(x),稱之為S型隸屬函數,其函數形式為

S 型隸屬函數中參數a,b 的取值范圍為:a∈(0,Rmin],b∈(a,Rmax],其中,Rmin表示模糊集的最小元素值,Rmax表示模糊集的最大元素值。由aji知,模糊集取值范圍在(0,100]之間,故本文取a=1,b=100.
與概率函數[12]相比,使用S 型隸屬函數作為衡量函數的特點及其對物元評估結果的影響在于:1)S 型隸屬函數具有映射值分布均勻合理的特性,模糊值與隸屬度值呈一一映射關系;2)在目標數目即模糊集發(fā)生變化時,只需要對新目標進行模糊評估,避免了重復計算。
將模糊物元集Rmn中的元素bij經過隸屬度函數f(x)處理后,得到新物元μij, 構成物元集R?mn:


利用信息熵進行數據處理:

式中osi表示經數據處理得到的目標i 的物元值,最終得到各個目標模糊物元R'OS:

考慮到UAV 作戰(zhàn)前預先指定了首要攻擊目標,在上面的基礎上,加入影響因子

則最終物元

通過引入影響因子,使首要攻擊目標的重要性增大,在任務執(zhí)行過程中就能優(yōu)先被攻擊,體現作戰(zhàn)主觀意圖。
隨著任務的執(zhí)行,UAV 編隊及戰(zhàn)場環(huán)境可能發(fā)生變化,導致UAV 的任務發(fā)生改變。以任務過程中新增目標任務為例,本文提出一種基于UAV 歷史任務信任度的任務決策模型,作為UAV 能否執(zhí)行新增任務的判別依據。
將編隊各個飛機的信任關系用網絡表示,如圖1所示。在網絡中,節(jié)點表示各個飛機,整個編隊構成一個節(jié)點集node_set ={a,b,c,d,e,f,g},節(jié)點之間的連線表示二者的信息交互關系,所賦權值定義為信任度,定義2 個緊連的節(jié)點為直接信任關系。由于信任不具有對稱性,所以信任度是有向的。

圖1 信任網絡模型Fig.1 Model of trust network
UAV 信任度分為直接信任度和間接信任度[13]。信任度的評價因子有UAV 的任務完成度tc、任務效費比與預定效費比偏差值戰(zhàn)損度bd、剩余載彈量rl、航跡保持度pk、剩余燃油量ro.信任度是基于UAV 歷史完成任務信息,根據上述評價因子綜合分析結合時間衰減性、任務相關性計算出的信任估計值。
UAVith對UAVjth第n 次任務的直接信任度值計算公式為

UAVith對UAVjth的前n 次直接信任度ψij=其中0≤≤1,設直接信任度閥值為Q,ψij中所有大于等于Q 的值組成集合Sij=所有小于Q 的值組成集合Fij=ψij-Sij,即則UAVith對UAVjth執(zhí)行第n+1 次任務的直接信任度值dtn+1ij,其計算公式為

式中:δc為任務相關性因子,表示前后任務的銜接程度,如果前后任務銜接緊密則取值為1,否則取小于1 的常數值;?t為時間衰減因子,對于近期執(zhí)行的任務取值為1,隨著交互記錄距今時間的增加而逐漸減小;當前位置函數φ(cp)刻畫與目標的距離關系,其值越靠近1 則距離目標越近;α 為權值參數。
間接信任度可以通過多條信任鏈獲取,但是間接推薦的信任度應遵循如下原則:
原則1:從推薦的多條信任鏈中,除去開始節(jié)點和終節(jié)點,每條信任鏈中間節(jié)點構成的集合之間的交集為空集。
原則2:從某條信任鏈中,最終得到的間接信任度應小于該信任鏈中節(jié)點的最小信任度。Tab.
設UAVith與UAVjth之間不緊連且存在N 條信任鏈,每條信任鏈由若干節(jié)點相連,則UAVith與UAVjth的間接信任度表示為idtnij,計算公式如下所示:

式中wt為第t 條信任鏈的權重,間接信任度隨著信任鏈中節(jié)點數的增加而不斷減小,其可信程度也越來越小。因此本文中設定為3 層,以控制其不可信程度。
UAVith對UAVjth的總信任度用tn+1ij表示,本文采用文獻[13]中設計的計算公式,引述如下:

當UAV 間不存在緊連關系即z =0 時,則不必考慮直接的推薦信任。
權值qd的大小根據直接信任度和間接信任度自身的不確定性來設定。采用的信息熵理論,直接信任度的熵函數如(14)式所示,權值計算方法如(16)式所示。

式中p 為信任度評估等級數。本文可將信任分為5 個級別:完全信任(信任度等于1)、比較信任(信任度大于等于0.8、小于1)、一般信任(信任度大于等于0.5,小于0.8)、不信任(信任度大于等于0.2,小于0.5)以及完全不信任(信任度小于0.2).間接信任度權值的計算方法同直接信任度計算方法。
由此,編隊Leader 就獲得了編隊中各UAV 的歷史任務信任度。在任務變更或者新任務出現時,編隊Leader 便可以根據知識庫里的各個UAV 的當前時刻任務信任度以及各UAV 提供的對新任務的效費比信息,進行加權求和獲得各個UAV 的總效益值,對所有UAV 按照總效益值進行降序排列,總效益值高的UAV 將優(yōu)先獲得新目標的任務,待新任務分配完畢后,編隊Leader 將任務決策結果發(fā)送給各個UAV.由于戰(zhàn)場環(huán)境的實時動態(tài)性,在出現新任務時,UAV 編隊的環(huán)境條件不盡相同,因此對于此處加權權重的選取,由編隊Leader 根據實時戰(zhàn)場情形主觀確定。
設計2個實驗說明本文所提出的評估方法的性能。
1)假設UAV 編隊規(guī)模為7 架機,發(fā)現4 個目標,飛機對目標的評估構成的模糊物元,見表1所示。通過本文所提的評估方法,得到目標重要性評估結果,如圖2所示。仿真環(huán)境為XP 系統,主頻1.8 GHz,內存3.25 G,Matlab 平臺。仿真時間為0.056 096 3 s.

表1 模糊物元Tab.1 Value of fuzzy matter-elements

圖2 目標重要性隸屬度Fig.2 Target importance membership grade
2)在執(zhí)行任務過程中,發(fā)現2 個新目標,經過傳感器的探測,得到各機對目標的評估數據如表2所示。

表2 各機對新目標的評估值Tab.2 New targets’evaluated value among UAVs
圖3顯示了新增目標后的仿真結果。在相同的仿真環(huán)境下,仿真時間為0.056 979 7 s.圖2和圖3都是采用本文提出的目標重要性評估方法,根據設定的仿真初始數據進行計算得出的結果,沒有考慮加入影響因子λ,是由于只要知道了原本的目標重要性排序(圖2、圖3所示),作戰(zhàn)決策者就可根據作戰(zhàn)意圖,引入影響因子,很容易得到基于作戰(zhàn)主觀意圖的最終目標重要性排序。

圖3 目標重要性隸屬度Fig.3 Target importance membership grade
從仿真結果可看出,目標數的變化導致原有目標的隸屬度發(fā)生了輕微的變化。這是由于新增目標的影響,用于提取信息量的熵函數中對新目標進行了數據融合,所以原有目標的隸屬度會發(fā)生變化。從仿真運行時間看,時間差為0.000 88 s,不到毫秒級。理論上本方法可以在實時環(huán)境中用于進行目標重要性的評估。
對于目標數很大或者目標急劇增加的情況。實驗假設UAV 從1 增加到30,目標數從1 增加到50.仿真時間變化如圖4所示。從圖中可以更進一步證明,理論上該方法能夠滿足在線評估的要求。

圖4 仿真時間變化趨勢Fig.4 Variety trend line of running time
對于在執(zhí)行任務過程中出現的新目標,應根據當前各UAV 的任務信任度以及對新任務所持態(tài)度綜合做出決定,由哪些UAV 執(zhí)行任務。
實驗假設在任務過程中發(fā)現了新目標,經過目標重要性評估后,確定為優(yōu)先攻擊對象。假設當前各機已經執(zhí)行6 次任務。任務數據見表3.
設置表3中6 個評價因子的權重分別為0.22、0.2、0.13、0.14、0.17、0.14,任務相關性因子δc根據各UAV 的任務情況決定,時間相關性因子?t分別為0.089、0.11、0.31、0.53、0.78、0.82,當前位置φ(cp)由各UAV 決定。其中α1、α2、α3的權重分別為0.4、0.2、0.4.
實驗設置編隊規(guī)模如圖5所示。直接信任度可由實驗數據直接求得,間接信任鏈為3 層。例如,求“1—2”的間接信任度可通過“1—3—2”和“1—7—2”求得。
當新目標出現時,要求Leader 根據各機的任務完成情況進行信任度評估。通過本文建立的信任度評估模型,計算得到當前各UAV 執(zhí)行下一次任務的直接信任度、間接信任度和總信任度分別見表4~表6.

表3 UAV 歷次任務數據Tab.3 History mission data of UAVs

圖5 編隊規(guī)模Fig.5 Dimension of formation

表4 直接任務信任度評估結果Tab.4 Results of direct mission trust value evaluation

表5 間接任務信任度評估結果Tab.5 Results of indirect mission trust value evaluation

表6 總任務信任度評估結果Tab.6 Results of collective mission trust evaluation
表4~表6表明了當前時刻UAV 編隊的直接信任度和間接信任度及總任務信任度。
在上述相同的仿真環(huán)境下仿真時間為0.388 5 s.由于本實驗設計1 號機為Leader,為了任務決策方便有效,故其他UAV 對1 號機的信任度置為0,同時UAV 對自身的信任度也置為0,信任鏈中節(jié)點數大于3 時,其信任度為0.
同樣的條件下,在沒有使用信任網絡模型的情況下,如果選擇執(zhí)行新任務的UAV 是6 號機,通過信任網絡模型可以看出7 號機的信任度比6 號機高,使用7 號機較好地完成新任務的可信度更強。因此決策結果為派遣7 號機執(zhí)行新任務。根據歷史任務數據提供的信息提取出的當前UAV 任務可信度作為UAV 任務決策的判據,可使任務決策結果更優(yōu)。
針對多UAV 協同任務決策問題,提出了一種考慮目標重要性和UAV 任務信任度兩種因素的任務決策方法。該方法由基于改進的模糊物元的目標重要性評估和基于歷史任務的UAV 任務信任度評估兩部分組成。其中,前者通過改進物元組成結構以及采用統一隸屬函數,使得改進后的目標評估方法實時性強,能迅速求解出評估結果。后者以UAV 歷史任務數據為基礎,構建了多UAV 信任網絡模型,給出直接信任度、間接信任度和通過信息熵理論計算總信任度的計算方法。仿真結果表明,本文提出的任務決策方法實時性強,能夠滿足UAV 任務決策需求,具有一定的可行性。
References)
[1] 余家祥,王紹華,程文鑫.基于改進局部搜索遺傳算法的目標分配決策[J].系統工程與電子技術,2008,30(6):1114 -1117.YU Jia-xiang,WANG Shao-hua,CHENG Wen-xin.Target allocation decision making based on improved genetic algorithm with local search[J].System Engineering and Electronics,2008,30(6):1114 -1117.(in Chinese)
[2] 劉躍峰,張安.有人機/無人機編隊協同任務分配方法[J].系統工程與電子技術,2010,32(3):584 -588.LIU Yue-feng,ZHANG An.Cooperative task assignment method of manned/unmanned aerial vehicle formation[J].System Engineering and Electronics,2010,32(3):584 -588.(in Chinese)
[3] 張安,史志富,劉海燕,等.基于貝葉斯優(yōu)化算法的UCAV 編隊對地攻擊協同任務分配[J].電光與控制,2009,16(1):1 -5.ZHANG An,SHI Zhi-fu,LIU Hai-yan,et al.Cooperative task allocation for UCAV air-to-ground combat based on Bayesian optimization algorithm[J].Electronics Optics & Control,2009,16(1):1 -5.(in Chinese)[4] Serdar Erkan,Mahmut Kandemir,Gary Giger.Advanced task assignment for unmanned combat aerial vehicles targeting cost efficiency and survivability[C]∥46th AIAA Aerospace Sciences Meeting and Exhibit.Reno:AIAA,2008 -873.
[5] 葉文,朱愛紅,歐陽中輝.基于混合離散粒子群算法的多無人作戰(zhàn)飛機協同目標分配[J].兵工學報,2010,3(31):331 -336.YE Wen,ZHU Ai-hong,OUYANG Zhong-hui.Multi-UCAV cooperation mission assignment based on hybrid discrete particle swarm optimization algorithm[J].Acta Armamentarii,2010,3(31):331 -336.(in Chinese)
[6] 陳晶,潘全科.改進蟻群算法求解同型機任務調度問題[J].計算機工程與應用,2011,47(6):44 -48.CHEN Jing,PAN Quan-ke.Improved ant colony algorithm to solve identical parallel machine task scheduling problem[J].Computer Engineering and Applications,2011,47(6):44 -48.(in Chinese)
[7] Sujit P B,Beard R.Multiple MAV task allocation using distributed auctions[C]∥AIAA Guidance,Navigation and Control Conference and Exhibit.Hilton Head:AIAA,2007 -6452.
[8] Mehdi Alighanbari,Jonathan P How.A robust approach to the UAV task assignment problem[J].International Journal of Robust and Nonlinear Control,2008,18(2):118 -134.
[9] Johnson L B,Ponda S,Choi H-L.Asynchronous decentralized task allocation for dynamic environments[C]∥Proceedings of the AIAA Infotech@ Aerospace Conference,St.Louis:AIAA,2011-1441.
[10] 孫海波,周銳,鄒麗,等.通信和測量受限條件下異構多UAV分布式協同目標跟蹤方法[J].航空學報,2011,32(2):299-310.SUN Hai-bo,ZHOU Rui,ZOU Li,et al.Distributed cooperation target tracking for heterogeneous multi-UAV under communication and measurement constraints[J].Acta Aeronautica et Astronautica Sinica,2011,32(2):299 -310.(in Chinese)
[11] 楊兆蘭.多目標決策模糊物元分析[J].甘肅聯合大學學報:自然科學版,2005,19(3):12 -14.YANG Zhao-lan.Fuzzy matter-element analysis on multi-objection decision[J].Journal of Gansu Lianhe University:Natural Sciences,2005,19(3):12 -14.(in Chinese)
[12] 任佳,高曉光,鄭景嵩,等.復雜環(huán)境下的無人機任務決策模型[J].系統工程與電子技術,2010,32(1):100 -103.REN Jia,GAO Xiao-guang,ZHENG Jing-song,et al.Mission decision making for UAV under dynamic environment[J].System Engineering and Electronics,2010,32(1):100 -103.(in Chinese)
[13] 彭濤,竇萬峰.群組協同決策中基于決策者可信的信任模型研究[J].南京師范大學學報:工程技術版,2010,10(2):79-83.PENG Tao,DOU Wang-feng.Research on trust model based on trusted decision makers in group collaborative decision making[J].Journal of Nanjing Normal University:Engineering and Technology Edition,2010,10(2):79 -83.(in Chinese)