肖宗豪,張鵬,遲文升,劉暢
(1.空軍工程大學 研究生院,西安 710051; 2.空軍工程大學 裝備管理與無人機工程學院,西安 710051;3.中國人民解放軍 32151部隊,邢臺 054007)
世界的發展總是新事物不斷代替舊事物,戰爭模式始終都在隨著武器的發展而不斷革新。當前各類飛行武器、防空武器、電磁武器飛速發展,作戰環境日趨復雜,信息更多源、態勢更復雜、情景更動態、邏輯更多變。單無人機由于自身局限性、低容錯性,而難以適應充滿未知和不確定性的作戰環境。相比之下,無人機集群擁有高機動、強魯棒、強擴展、高費效比等優勢[1],在作戰中系統通過功能分布化、攻擊飽和化等方式形成群智效應[2]和蜂擁效應[3],可極大提高系統作戰效能,因此無人機集群作戰必將成為優于傳統空戰的新型作戰樣式,可應用于空中對抗、飽和攻擊、協同偵察等領域[1-4]。
無人機集群是指通過約定組織規則,使擁有自主能力的無人機,通過一定規則形成超大規模無人機作戰群體,通過群間協作形成群體智能及效能涌現,以較小代價較高效率完成作戰任務。而集群有效執行任務的前提是對集群實現有序、高效的動態控制,控制策略的優劣直接影響集群系統的安全與穩定,因此集群控制方式是集群研究的關鍵。
當前無人機集群控制方式研究的主流思想分為2種,即自上而下的集中式控制和自下而上的分布式控制[5-6]。集中式控制主要有領航-跟隨法[7-8]、虛擬結構法[9],分布式控制主要有行為控制法[10-13]、一致性理論法[14-16]。領航-跟隨法以領航者無人機作為位置和姿態基準,其余無人機以其為中心跟隨飛行,通過控制領航者的飛行狀態使集群按照預定航跡飛行。該方法全局協調性好、結構清晰、系統簡單,但對領航者節點脆弱,系統容錯性、靈活性差。虛擬結構法是對領航-跟隨法的一種改進,將集群編隊看成虛擬剛性結構,每架無人機跟隨虛擬長機飛行。該方法很好地解決了由于長機故障造成編隊混亂的問題,且提高了系統控制精度,但通信負載隨集群數量成比例增加,并且仍存在容錯性、靈活性差的問題。行為控制法是受生物群行為啟發為無人機設計相應基礎行為,通過不同基礎行為組合實現個體無人機及集群的控制。該方法使得集群系統具有良好擴展性,并可通過實時環境反饋及時調整編隊狀態,但易陷入局部最小值。一致性理論法指無人機利用鄰近無人機狀態信息更新自身狀態,通過一致性算法使集群實現一致。該方法使集群系統機動性、可靠性、適應性增強,但通信要求高且隊形變換整體性較差。
無論集中式還是分布式,各自都存在著優勢與不足,對于集群控制若無交互則魯棒容錯性差,若無中心則全局可控性差。因此本文嘗試將2種控制方式結合,提出了一種基于Agent與元胞自動機(Cellular Automata,CA)的集群混合式控制模型,使集群系統既可控又靈活,既局部穩定又全局一致,既降低整體通信消耗又避免中心節點過載。將集群分為中心長機、小組長機、個體無人機3個層次,依據集群作戰流程構建無人機集群混合式控制體系框架結構及相關控制規則。考慮元胞自動機模型具有演化規則統一、個體受局部影響特點,Agent模型具有層次性、個體不限于鄰域作用特點,遂通過2個模型實現2種控制方式結合,構建集群混合式控制模型。最后以集群的編隊集結與保持任務為背景,采用50架集群規模對分布式、集中式與混合式3種控制進行對比仿真,驗證了本文集群控制模型的有效性。
CA[17-19]是在時間、空間維度離散的動力學系統。CA由元胞、鄰居、元胞空間和狀態更新規則等構成,各部分關系如圖1所示。CA系統可表示為A=(Ld,S,NA,f),A為CA系統;L為元胞空間;d為元胞空間維數;S為有限的元胞狀態集;NA為包括當前元胞在內所有鄰居元胞集合;f為CA狀態演化規則。元胞狀態受上一時刻狀態及鄰居元胞狀態影響,并按設定的局部規則更新狀態,大量元胞通過局部作用使元胞空間整體變化。
Agent概念是一類具有相互之間溝通能力、環境適應能力及通過學習改變自身行為和運行規則的個體[20-22]。在多智能體系統(Multi-agent System)中,多個智能體能夠按照一定組織形式集合起來組成一個具有一定結構的系統,不同智能體具有不同角色、層次、演化規則。基本的Agent模型結構一般包含感知器、效應器、決策器、知識庫、通信器等部分,如圖2所示。
圖2 Agent結構模型Fig.2 Agent structure model
CA和Agent理論都可對復雜集群系統進行反映、描述,在理論方法研究和應用存在關聯,兩者共性包括:①都具有良好的開放性;②都運用規則驅動系統運行;③都采用并行運算方式將問題離散化;④都具備空間性。這些共性為兩者結合提供了可能。
兩者差異包括:①系統結構不同,Agent系統層次性強,而CA系統是由同質元胞組成的單層結構;②個體形式不同,Agent的個體允許不同存在形式且可自治,而CA元胞形式單一且同質;③演化規則不同,Agent運行規則多樣且多層,而元胞自動機演化規則統一;④影響因素不同,CA中個體元胞受局部及自身狀態影響,Agent相互影響不限于局部范圍還考慮環境。這些為兩者結合提供了必要性。
無人機集群是復雜系統,其中不同無人機個體既存在層次性、差異性,又存在共通的運行規則。CA模型具有規則簡單、運算快速等特點,但難以體現集群個體差異;Agent模型能準確地描述集群系統層次性和差異性,但無法充分體現集群個體的局部作用和統一個性,且實現復雜。因此,通過對模型適當改進實現Agent與CA結合,可更加全面地對無人機集群系統進行構建與描述。
無人機集群是龐大的復雜系統,集群控制策略的設計需從集群實際作戰流程出發。
OODA作戰環[23]是從整體角度對作戰流程進行描述,如圖3所示。無人機集群作戰流程包含OODA作戰環的各個要素,一次完整的集群作戰行動就是一次觀察、判斷、決策、行動的大循環,而每一項要素又包含OODA小循環,因此,復雜的集群作戰可被分解為眾多的OODA環,大到整個作戰系統小到單個無人機,但不同環節不同層次的控制策略不同,大循環更加注重系統戰略性、整體性,小循環則側重于局部性、實時性。
圖3 OODA作戰環Fig.3 OODA operations ring
在具體作戰流程上,無人機集群作戰的時序安排如圖4所示,主要包括信息融合、戰場態勢分析與籌劃、集群決策、集群編隊抵近任務區、戰術決策與編隊布局、集群攻擊、退出戰斗。信息融合是將集群的狀態、地形、氣候、敵方部署與目標狀態等進行融合。戰場態勢分析與籌劃是根據情報對敵我作戰實力、戰場實時態勢進行分析。集群決策是根據整體態勢對戰略布局、任務調整、航線選擇等進行決策。集群編隊抵近任務區是指集群按規劃航線向作戰空域飛行,必要時進行航線重規劃及編隊重構。戰術決策與編隊布局是指到達作戰區域后集群對目標、防御等態勢進行感知,而后制定戰術戰法,對編隊進行戰術部署。集群攻擊指集群按照預定戰法對敵目標攻擊,攻擊過程中集群小組可實時調整局部編隊、路徑,攻擊完畢對攻擊效果及兵力狀況評估確定是否二次攻擊。集群完成任務或收到退出命令則有序撤出戰斗返回基地。
圖4 無人機集群作戰流程Fig.4 Flowchart of UAV swarms operations
由此可知,集群作戰控制復雜、任務多樣、層級明顯、環環相扣。針對不同作戰任務及模塊,集群控制所側重的系統性與局部性、統一性與靈活性、戰略性與實時性要求存在很大差異,而無論是集中式還是分布式都難以單獨滿足復雜的差異性要求。
集群作戰是非常復雜的系統網絡,為此需要一個復雜、多層的指揮體系對集群約束,又要兼顧集群個體的自主涌現性。本文構建了集群混合式控制框架與通信拓撲網絡結構,將自上向下多層指揮的可控性與自下向上底層個體的涌現性融合。
2.2.1 無人機集群混合式控制框架結構
無人機集群混合式控制框架結構主要分為3級:集群中心控制主體、局部指揮控制主體、底層交戰主體,如圖5所示。當集群接收到作戰任務,中心控制主體對任務進行分析與部署,將任務分配、傳達給各集群小組,任務執行過程中各集群小組相互配合協同作戰,而在各自的分任務中各集群小組以局部主體負責指揮,底層主體協調配合共同完成。集群中心控制主體由集群中心長機擔任,局部指揮控制主體由各集群小組的小組長機組成,底層交戰主體為集群中個體無人機,中心長機與小組長機、小組長機與個體無人機之間成雙向集中式控制結構,小組長機與其他小組長機、個體無人機之間成分布式結構。
圖5 無人機集群混合式控制框架結構Fig.5 Hybrid control framework for UAV swarms
中心長機性能較高,具有較強的認知決策能力。其負責與指揮控制中心通信,接收上級實時指令、反饋戰場態勢和集群狀態;主要通過小組長機對集群進行命令下達、態勢共享、編隊控制等;對作戰任務進行戰略戰術決策、任務分解分配。
小組長機負責接收、傳遞中心長機任務指令,向中心長機反饋集群小組狀態、情報數據;對小組成員進行狀態管理、局部控制、態勢共享;對小組作戰任務進行戰術規劃、組內分配、評估檢測;與其他小組進行信息共享、戰術協同。
個體無人機受小組長機指揮,實時反饋自身狀態及探測信息;與組內無人機個體通過信息交互實現一致性控制;在小組任務中個體無人機按照上級指令要求,與其他無人機個體自主協同作戰。
該混合式控制框架通過指令互聯、態勢共享等將三者融為一體,實現以點控面、以面聚點。中心長機將多源態勢信息融合形成全局態勢信息,并將態勢按需共享給集群小組。小組長機與個體無人機受上級指揮,又可通過分布式網絡與其他無人機協同交互。因此,該控制框架使集群兼顧了整體全局性、有序性與個體的自主性、涌現性。
2.2.2 無人機集群通信拓撲網絡結構
在多智能體控制理論中,對無人機間通信拓撲網絡結構的描述一般采用圖論的方法。按通信方向可分類為有向拓撲和無向拓撲;按通信拓撲結構可分為固定拓撲和時變切換拓撲。本文無人機集群通信網絡采取時變切換混合式拓撲結構,如圖6所示,紅色雙向連接線為集中式通信,黑色雙向連接線為分布式通信,中心長機與小組長機采用集中式通信拓撲,小組長機之間構建可交互的分布式通信拓撲,小組長機與組內無人機同樣采用集中式通信拓撲,組內無人機之間應用分布式通信拓撲,且通信方向采用雙向信息傳輸方式。同時可根據任務需求調整通信連接屬性,既能實現指揮控制中心對全局的集中式通信,又可實現局部分布式通信,滿足指令下達與信息交互反饋需求。該結構在保證集群通信網絡連通性的基礎上,極大地降低了中心節點通信負荷以及整體通信能源消耗,提高了通信網絡的魯棒性、靈活性、擴展性,可有效避免集群數量增加而導致的通信網絡的復雜,便于戰時通信網絡的分解與重構。
圖6 無人機集群時變混合式通信拓撲結構Fig.6 Time-varying hybrid communication topology of UAV swarms
混合式控制框架與通信拓撲網絡結構為集群控制提供了硬性支撐,而要實現集群高效運行,還需集群控制規則作軟性約束,根據集群層次特點,將控制規則分為集群個體行為規則和整體控制規則。
2.3.1 集群個體行為規則
集群個體行為規則適用于集群各層次無人機,包括中心長機、小組長機、個體無人機,確保每一個體在集群中生存安全、狀態同步,主要規則如下。
1)集群凝聚:集群中無人機個體應凝聚成一群體,不過于分散。
2)集群分離:集群中鄰近無人機個體之間應保持一定安全距離,避免發生碰撞。
3)方向匹配:集群內無人機個體與周邊無人機的速度大小、方向要盡可能匹配,確保無人機個體與局部狀態的一致性。
4)有限通信交互:無人機個體在群內飛行時,臨近的個體之間存在相互參考作用,且只與周圍有限個體進行通信交互,通過較少的交互量,實現穩定控制,減少通信冗余與信息干擾。
這些規則是集群的高效運行的基礎原則。
2.3.2 集群整體控制規則
集群整體控制規則是對集群從整體、系統、戰略戰術角度進行調控,具體規則如下。
1)集群功能分布多樣化
將功能高度集中的先進戰機所具備的探測、打擊、干擾、評估等功能分解,交由大量成本低廉、功能簡單的無人機實現,一定數量的無人機通過不同的組織結構可形成多種的作戰功能,由無人機集群代替先進平臺功能,既可降低研發設計成本與作戰損耗,又增強了作戰系統的抗毀性、多變性。
2)功能組合與編隊構型依任務而定
在任務執行過程中,集群所需采取的戰術組合、應具備的作戰功能、運用的編隊構型及控制方式需依據任務目標而定。如圖7所示,根據作戰任務類型確定集群功能組合及戰術方案;根據作戰需求將集群作戰任務由上而下進行分解,一級分解為集群小組子任務,二級分解為個體任務;集群無人機個體將自身作戰能力自下而上進行上報;中心長機根據任務分解及個體能力情況,以功能為導向將多個功能個體進行組合,形成具有完成子任務能力的集群小組,再對小組內的無人機個體分配對應的個體任務;根據集群戰術安排及各集群小組功能,集群整體構建戰術編隊,集群小組構建功能編隊。
圖7 集群任務分解Fig.7 Swarms task decomposition
一般無人機個體具備一個至多個單體功能,針對同一任務可形成多種形式的集群小組,同一集群小組通過變換可形成不同的群功能。形成的集群系統戰術組合多樣、功能動態涌現、編隊機動靈活。
3)長機控制度與個體自由度隨作戰時序而變
集群作戰主要的時序階段包括編隊飛向任務區、抵達任務區、任務區域內作戰,在不同階段由于作戰環境、任務要求不同,各層級無人機的主要任務、自主程度也隨之調整改變,如圖8所示。
圖8 集群個體自由度變化Fig.8 Change of individual degree of freedom in swarms
編隊飛向任務區時戰場威脅較少,為降低集群控制難度、通信消耗,集群控制偏向集中式,中心長機負責控制監督群狀態、規避大型障礙、飛行航線規劃等,小組長機負責跟隨中心長機、組間協同等,無人機個體跟隨小組長機、避免碰撞,此時中心長機控制度較高而其余個體自由度較低;集群抵達任務區,集群在等待區域集結并進行作戰部署,中心長機進行態勢評估、戰術決策、集群任務分配,小組長機進行組內任務分配、小組編隊重構、攻擊路徑規劃,無人機個體進行組內隊形變換,此時中心長機權限下放,小組長機獲得部分規劃決策權,無人機個體自由度提升;集群在任務區域內作戰,由于威脅障礙增多、戰機稍縱即逝,集群實時性、快速性要求高,集群小組擁有更多戰場決策權,小組長機負責小組戰術規劃、攻擊決策、群組配合等,無人機個體進行快速機動、目標識別攻擊、友機協同,中心長機監督、調整集群狀態,此時小組長機與無人機個體自由度最大,中心長機控制度較弱。
隨作戰時序推進,中心長機控制度與個體自由度動態調整,使集群在特定階段發揮更大效能。
4)信息服務與通信拓撲按需可變
中心長機將通過指揮控制中心、小組長機、個體無人機及自身傳感器獲取的信息融合形成整體作戰態勢信息,同時根據集群小組作戰區域、任務類型,將其需要的局部態勢共享給小組長機;小組長機將小組局部態勢與個體最新反饋的信息融合,按需將個體局部態勢信息共享給無人機個體。
集群通信拓撲可在時變混合式通信拓撲基礎上按需動態調整,當要求集群整體性、系統性,形成集中式通信拓撲;當要求集群靈活性、適應性,形成分布式通信拓撲;當無人機個體執行特殊任務或有重要情報時,可與中心長機直接建立通信。
5)集群應激自修復
集群應激自修復指在長機受損、個體加入或退出、突發特情、外部擾動等場景下集群維持穩定、自我修復的規則。
①長機更替。當中心長機及小組長機由于敵方攻擊或自身故障等而無法承擔長機任務時,則將設定的替補長機補充到空缺位置,也可通過聯盟或協商機制分別在小組長機中選出中心長機、在集群小組中選出小組長機,若無合適對象則擴大遴選范圍。
②局部編隊調整。當集群有新無人機加入或有個體脫離時,集群在局部范圍內進行隊形調整重構。
③集群應急重構。當集群作戰環境及任務突然變化,中心長機通過備用方案或實時任務規劃對集群功能、編隊構型做出迅速調整,形成最優隊形。
④集群狀態反饋。當集群內部不穩定因素及外界環境擾動時,無人機個體將狀態反饋至小組長機,小組長機再反饋至中心長機,中心長機、小組長機根據反饋信息對集群及小組的飛行速度、機動角度、保持距離等參數進行調節,確保編隊結構穩定。
根據Agent與CA理論各自特點,本文建立Agent與CA的集群混合式控制結構,該模型通過融合2種理論的優勢,將集中式與分布式控制有效結合,滿足復雜集群系統的結構層次化和基本規則共通化要求。其結構如圖9所示,該結構主要分為CA模塊和Agent模塊,兩者通過Agent的感知器和效應器連接,實現Agent規則在元胞空間的運行。
圖9 Agent與元胞自動機混合控制結構Fig.9 Hybrid control structure of Agent and cellular automata
CA模塊主要實現個體基本運行規則,包括元胞空間、鄰域范圍、演化規則等部分。
Agent模塊主要實現集群的分層、個體差異化設計以及個體較復雜基本規則構建,能夠根據任務需求、外界環境、集群狀態對集群進行調整,主要包括協調控制器、反應器、知識庫系統、學習系統、通信、感知器、效應器等。通過為不同層次個體設計不同知識庫和規則庫、通信拓撲,來區分中心長機、小組長機、個體無人機。協調控制器接收感知器搜索的信息并進行分類,若為簡單且緊急情況則交由反應器,若為復雜且時間充裕則交由規劃器、決策器;反應器以規則庫作支撐,主要使無人機對簡單、緊急情況做出迅速的處理;規劃器對復雜任務進行規劃,由于不同層次無人機對應不同類型知識庫做支撐,中心長機可進行集群全局的、長期的作戰規劃,小組長機完成局部的、中短期的規劃,個體無人機進行個體目標攻擊規劃;決策器主要結合知識庫進行戰術決策、攻擊決策、功能組合與目標分配決策、通信拓撲與編隊構型決策等,不同層次無人機擁有不同決策權限與能力;學習器可通過對行動效果進行評估后,將效果好的方案加入知識庫和規則庫進行更新;感知器主要對外界環境、元胞空間、其他無人機個體進行感知;效應器根據決策結果、反應命令對外界環境、元胞空間、其他無人機個體進行反饋。
假設無人機集群由N架無人機組成,在二維空間中分布,將單個無人機視為質點,則對無人機i(i=1,2,…,N)運動模型描述為
式中:x為無人機位置矢量;v為無人機速度矢量;u為無人機加速度矢量;同時v、u應滿足:
式中:Vmax為無人機個體最大速度;umax為無人機個體最大加速度。
集群中無人機劃分為中心長機、小組長機、無人機個體,設立1個中心長機、M 個小組長機、N-M-1個無人機個體,將集群分為M 個小群組,每群組中有一定數量無人機個體,中心長機通過小組長機實現對群組的集中式控制,小組長機間進行分布式交互,小組長機對無人機個體進行集中式控制,無人機個體進行分布式交互。集群任務類型劃分為K種,設定MI={Mission1,Mission2,…,MissionK}為任務集合,對應偵察、攻擊、干擾、反輻射、評估等任務。集群作戰時序劃分為NT種,設定T={Time1,Time2,…,TimeNT}為作戰時序集合,對應集群飛向任務區、抵達任務區、任務區域內作戰等時序。不同任務類型和作戰時序下集群構型及控制度不同。
3.3.1 元胞空間及鄰域設定
本文元胞空間運用二維網格空間結構,其鄰域采用Moore型,如圖10所示,一個元胞的上、下、左、右、左上、左下、右上、右下相鄰8個元胞為該元胞的鄰居,可定義如下:
圖10 Moore型鄰域元胞Fig.10 Moore neighborhood cell
式中:(pox,poy)為中心元胞的位置坐標,(pox,poy)∈Z2,(pix,piy)∈Z2,Z為整數集合。
3.3.2 演化規則
元胞下一時刻的狀態由該時刻自身及鄰域內元胞狀態決定,當元胞被占用狀態為1,沒有被占用狀態為0,受無人機氣動性能限制,設定元胞下一刻移動方向為當前運動方向及鄰近45°方向。
傳統CA,元胞從當前位置移動到下一元胞位置時每步長速度固定,為體現無人機運動真實性,本文無人機元胞運動速度的方向、大小能夠隨周邊無人機狀態進行調整。速度變化應使個體滿足集群凝聚、集群分離、方向匹配的原則[24]。
式中:dij為無人機i與無人機j的d-范數距離;xi-xj為兩者實際的距離矢量;γ>0,d-范數將多維距離向量轉化為一維距離。
在感知范圍R內,當無人機i與無人機j距離越近時,其控制作用則更迅速,為使控制作用大小在有限范圍R內隨距離平滑變化,引入具有有限截止點的沖擊函數:
式中:h∈(0,1),為沖激函數下降點;fh(z)在[0,1]平滑下降,在(1,0)處截止。令z=dij/R,使截止點與感知范圍R相匹配。
無人機i與無人機j凝聚、分離作用以安全保持半徑R0為分界點變化,為此設計反曲線函數:
設置R=15、R0=5、h=0.3、a=2、b=3,ρ(dij)圖像如圖11所示。由圖11可知,當dij在安全保持半徑R0內時,隨著距離的縮小分離作用迅速變強,當dij逐漸偏離安全保持半徑R0時,為使dij穩定保持在R0處,在一定范圍內聚合作用隨偏離距離的增大而快速增強,而后聚合作用隨距離的增大而緩慢變小,直至感知半徑R變為0。
圖11 平滑力函數圖像Fig.11 Smooth force function image
考慮無人機i與無人機j速度方向、大小要匹配,基于一致性控制理論[26],結合式(8)設計如下控制律:
式中:u1i為無人機與鄰域無人機進行凝聚、分離、速度匹配的控制輸入,為無人機基本運行規則;第1項為距離保持項,通過式(8)的平滑力函數確保無人機凝聚、分離作用;第2項為速度匹配項,確保無人機速度在鄰域范圍的一致性;c1、c2為正常數,分別為位置保持系數和速度匹配系數;aij為無人機i與無人機j的通信連接權重。
3.4.1 集群個體類型
3.4.3 通信拓撲
集群任務類型劃分為K種,任務集合設定為MI={Mission1,Mission2,…,MissionK},集群作戰時序劃分為NT種,作戰時序集合設定為T={Time1,Time2,…,TimeNT},在不同任務類型和作戰時序下集群會形成特定通信拓撲結構Ak,NT,其中k=1,2,…,K為任務代號,NT=1,2,…,NT為時序代號。
一般情況下,中心長機UAVo為實現對小組長機UAVg集中式控制,會與每一小組長機建立通信連接,當個體無人機UAVa在發現重大情報或攻擊重要目標等特殊情況下,UAVo會與UAVa建立臨時通信,同時與鄰域集合χno(t,κ)內的個體建立通信,因此中心長機UAVo的通信拓撲連接設定為
個體無人機與同一群組內的無人機個體UAVa進行分布式通信,在群組m中的個體無人機i的通信拓撲連接設定為
3.4.4 集群構型
集群飛行時的編隊構型要符合作戰任務需求,并適應當前時序下的作戰環境。定義集群編隊構型矩陣H=[hij]∈RN×N,hij=hj-hi為無人機i與無人機j期望編隊構型的相對位置矢量,hi、hj分別為無人機i與無人機j在編隊中期望位置。在任務k、時序NT下集群編隊構型矩陣設定為Hk,NT。
3.4.5 跟隨控制
假定中心長機的飛行路徑通過結合指揮控制中心上傳路徑與自主規劃形成,最終規劃路徑和運動狀態為x*o(t)、v*o(t),則中心長機UAVo的控制輸入為
小組長機主要跟隨中心長機運動狀態來保持在編隊中的位置及速度狀態,并通過與周圍小組長機交互達到鄰域狀態的一致性,則第m小組長機UAVg的控制輸入為
式中:λ1、λ2、λ3、ci1、ci2、ci3、ci4為在任務k、時序NT下預先設定的正常數;λ1為對u*1i(t)控制的權重;λ2為對小組長機m狀態跟蹤的權重;λ3為與群組內UAVa一致性控制的權重;ak,NTmi表示在任務k、時序NT下群組m中個體無人機i的與小組長機m的通信連接值;aoi為與UAVo通信連接值;Δuoi為UAVo對無人機個體i的介入控制量。
3.4.6 反饋控制
在集群編隊飛行過程中,各層次無人機運動性能都受到各自最大速度Vmax和最大加速度umax限制,當長機速度調整過快,遠超跟隨無人機加速能力時,跟隨無人機難以快速跟蹤長機速度,同時當集群過于離散,無人機難以在短時間內到達預定編隊位置,這都對集群編隊構型的形成與保持產生影響。因此,長機的速度調整需要結合跟隨無人機狀態的反饋,本文采用分層反饋機制,個體無人機狀態反饋至小組長機,小組長機狀態反饋至中心長機。
個體無人機到小組長機反饋,主要從速度偏差與離散位置2個方面反饋群組m內的無人機個體狀態信息。群組m內的無人機個體速度與小組長機速度的離散方差為
由式(20)、式(21)可知,當無人機個體速度、位置與小組長機的相對值偏差變大時,群組m的速度離散方差與位置離散方差增大,反饋函數fm增大,由式(23)可知,小組長機m控制輸入um(t)減小;當速度、位置偏差變小時,小組長機m控制輸入um(t)增大。通過動態調整小組長機m加速度,便于組內個體跟隨小組長機,使集群在局部群組范圍快速形成預定編隊。在式(19)個體無人機控制輸入ui(t)中,小組長機m加速度um(t)更新為調整后的控制輸入式(23)。
同理,小組長機到中心長機的反饋,主要對m個小組長機及其所處群組的速度偏差與離散位置的狀態進行評估反饋。集群內M 個小組長機與中心長機的速度的離散方差為
由式(24)~式(27)可知當小組長機及其所處群組的速度、位置離散狀態變大時,反饋函數fo增大,中心長機控制輸入減小;當小組長機及其所處群組離散狀態變小時,中心長機控制輸入增大。通過反饋調整中心長機加速度,小組長機能夠快速進入預定位置,從而集群更加高效地形成并保持戰術編隊。
在小組長機控制輸入式(23)中,uo(t)調整為反饋后的中心長機控制輸入式(27)。
為驗證本文混合式集群控制方法的有效性,在集群進行作戰編隊集結并動態保持的任務背景下,采用MATLAB進行編程仿真。設定集群數量總共為50架,其中1架中心長機,7架小組長機,每個小組6架個體無人機,最大速度100 m/s,期望速度80 m/s,最小速度60 m/s,無人機間的安全保持半徑為50 m。其他仿真參數若無特殊說明則如表1所示。
表1 仿真參數Table 1 Simulation parameters
為更加客觀地檢驗本文所提出模型對集群控制的改進效果,加入了集群分布式控制與集中式控制的對比仿真,3種控制方式的集群數量都為50,跟蹤速度一致,差異設置具體如下:混合式控制中中心長機感知半徑為300 m,小組長機感知半徑為250 m,無人機個體感知半徑為70 m;分布式控制中少數個體可獲取跟隨速度信息,其余個體通過分布式交互實現與周圍個體速度、位置的一致,設置個體感知半徑為90 m;集中式控制中中心長機獲取跟蹤速度信息,個體無人機在長機的集中式控制下進入編隊位置并保持與長機狀態一致,個體通信交互僅滿足規避需求,設置中心長機感知半徑為370 m,個體感知半徑為60 m。
集群中無人機的初始位置在[0,500]m×[0,500]m范圍內隨機產生;無人機的初始速度大小在[0,10]m/s范圍內隨機產生,方向在[0,2π]rad內隨機選取;仿真步長為0.1 s,時間區間為[0,500]s。集群仿真環境初始化如圖12(a)所示。在圖12(a)中,藍圈代表無人機,無人機間的藍色連線為通信連接,紅色箭頭表示無人機速度大小及方向信息。
3種控制方式的仿真結果如圖12(b)~(f)所示。圖12(b)與(c)分別給出了基于分布式控制的集群在感知半徑為70 m和90 m下的編隊最終狀態,從中可以看出,在感知半徑為70 m時,由于交互范圍限制,集群未形成連續的通信連接,存在部分無人機游離在集群之外而組成離散小群,而當感知半徑擴大為90 m時,無人機可與更多的鄰域個體進行交互,單節點通信連接數增加,集群通信網絡暢通,形成一不規則編隊整體。圖12(d)給出了集中式控制方式下的集群狀態,在紅色圓圈代表的中心長機集中控制下,集群形成一規則的三角形編隊,與分布式編隊相比集中式編隊具有較強的整體性、可控性。圖12(e)與(f)顯示了基于混合式控制的集群分別在100 s和500 s時的狀態,由圖12(e)可看出,在100 s時刻小組長機已基本進入相對應的編隊位置,個體無人機也陸續到達各自小組長機附近,但小組編隊還未形成,在500 s時刻圖12(f)顯示集群已形成7個穩定的集群小組,且規則分布在紅色圓圈代表的中心長機周圍,中心長機到小組長機的藍色連線表示集中式通信,圖中綠色連線表示小組長機間的分布式通信,2種通信結構的融合使集群通信網絡具有較強的連通性與抗毀性,而混合式控制下形成的編隊擁有較強的規則性、一致性。
圖12 集群編隊狀態Fig.12 Swarms formation status
圖13(a)~(c)依次顯示了分布式、集中式、混合式3種控制方式下集群速度變化曲線,由圖13(a)~(c)可知,3種控制方式都能使集群到達設定速度80 m/s,圖13(a)中分布式控制下集群速度大約在150 s接近80 m/s,但后續集群中個體速度并沒有快速地一致收斂到80 m/s,而是在80 m/s附近波動。圖13(b)、(c)中集中式、混合式控制下集群速度能夠較快地一致收斂到80 m/s,在反饋機制的作用下,2種控制方式的集群速度在到達最小安全速度60 m/s后波動遞升,相比之下集中式控制的集群速度遞升波動較長,在300 s后才相對穩定保持在80 m/s,而混合式控制的集群速度在200 s就已到達并穩定保持在80 m/s,且其速度波動調整幅度較小,其整體速度收斂效果明顯優于前2種方式。
圖13 三種控制方式集群速度變化曲線Fig.13 Swarms speed variation curves of three control modes
圖14(a)~(c)依次顯示了3種控制方式下編隊內不同個體之間的速度一致性偏差,比較發現,圖14(a)中分布式控制編隊速度一致性偏差的幅度明顯小于后2種方式,且較快地(在200 s處)將偏差控制在較小范圍,但后續偏差并未完全一致趨近于0,而在0的小范圍波動。在圖14(b)、(c)中,集中式與混合式控制的編隊速度偏差能夠一致收斂到0,在前期兩者偏差幅值較分布式偏大,在收斂速度上混合式明顯快于集中式,且波動周期短,收斂效果平穩。
圖14 三種控制方式編隊速度一致性偏差Fig.14 Formation speed consistency deviation of three control modes
圖15顯示了由式(26)定義的集群速度與位置的綜合離散度。由圖可知,3種控制方式都能使集群離散程度降低并逐漸趨向于0,從而實現集群整體在速度與位置上的一致。通過比較發現,在收斂過程中離散度幅值集中式最大,分布式最小,混合式居中,在收斂速度上混合式最快,集中式次之,分布式則最慢。這是由于混合式與集中式中的中心長機能夠通過反饋信息對集群整體進行調控,進而使整體收斂一致,而分布式中個體能夠較快地與鄰域實現一致性,因此集群整體的離散度幅值能夠保持較小狀態,但由于缺少整體的調控,個體局部的一致轉化為整體全局的一致需要較長的時間周期。
圖15 三種控制方式的集群離散度變化曲線Fig.15 Variation curves of swarms dispersion in three control modes
圖16與圖17分別給出了3種控制方式下集群通信次數變化曲線與不同層次節點的最大通信次數。定義無人機與其他個體建立一次連接為一次通信。在圖16中,集群某時刻的通信次數為個體通信次數的總和,隨著編隊整體趨向一致,集群通信次數也逐漸穩定,分布式集群通信次數最多且單時刻趨于410,混合式居中且單時刻趨于170,集中式最少且單時刻趨于148。在圖17集中式集群的中心長機節點最大通信次數為49次,個體無人機節點最大通信次數為3次;混合式集群的中心長機節點最大通信次數為12次,小組長機節點最大通信次數為15次,個體無人機節點最大通信次數為7次;分布式集群的個體無人機節點最大通信次數為10次。由此可知,混合式控制既避免了中心長機節點通信的過載,又降低了個體無人機這一集群主體的通信消耗,從而使集群整體通信次數降低。
圖16 三種控制方式集群通信次數變化曲線Fig.16 Swarms communication frequency variation curves of three control modes
圖17 三種控制方式單節點最大通信次數Fig.17 Maximum number of single node communications in three control modes
本文針對無人機集群控制問題,通過結合集中式與分布式2種控制方式,提出基于Agent與無胞自動機(CA)的集群混合式控制。首先,分析了Agent與CA結合的可能性與優勢性。其次,通過分析無人機集群作戰流程,從體系結構層面構建了無人機集群控制體系框架,將集群分為中心長機、小組長機、個體無人機,并設計相關通信拓撲結構及集群控制規則。在此基礎上,結合Agent與CA特性,設計了基于Agent與CA的集群混合式控制模型,CA實現集群個體基本的聚合、分離、速度一致規則,Agent模型實現分層交互規則。最后,以集群編隊集結與保持任務為背景,對分布式、集中式與混合式3種控制進行仿真對比,驗證了本文混合式集群控制方法的有效性。
然而本文中集群的飛行環境為理想狀態,未考慮外界干擾對集群的影響作用,因此下一步需要考慮設計在復雜環境下混合式控制集群的抗擾優化算法。同時本文只針對典型的編隊集結與保持任務下的集群控制策略進行了驗證,而對于其他場景下的集群混合式控制策略建模、仿真可作為后續研究的突破點。