謝家豪, 黃樹彩, 韋道知, 張曌宇, 王文豪
(空軍工程大學防空反導學院, 陜西 西安 710051)
多傳感器協同探測的一種重要的方式是組建多傳感器聯盟,目前大多數聯盟的建立都是基于串行結構,該結構存在的主要問題是效率低,而且容易造成資源浪費或過度緊張。串行多傳感器聯盟求解問題主要分為組建和更新兩部分。目前國內外對多傳感器聯盟組建的算法有很多,如多傳感器交叉提示算法、多目標規劃方法、粒子群算法等。但是以上算法并未考慮環境的動態變化以及在組建聯盟過程中產生的消耗問題。對于多傳感器聯盟機制,文獻[13]提出了“量測即更新”更新機制,文獻[14]提出了“預測即更新”機制,但是這兩種更新機制未考慮到戰場環境的動態變化,交接過程中也存在丟失目標的風險。同時在實際的作戰環境中,空間內部署的傳感器本身性能指標和傳感器所受外界的威脅存在較大的不確定性。但是串行多傳感器聯盟模型并不能很好地解決上述問題,本文在考慮聯盟求解效率低以及聯盟求解過程中存在的不確定性的基礎上建立不確定混合多傳感器聯盟模型。
不確定混合多傳感器聯盟模型求解問題本質上是不確定性多目標規劃問題,目前國內外對該問題的傳統求解模式是先將原問題轉化為確定的多目標規劃問題,再通過經典的多目標規劃方法將其轉化為確定的單目標規劃問題。但是,該方法大多數情況適用于目標函數之間是不相關的,也容易忽略不確定問題的不確定本質,因此本文提出了一種基于P準則的不確定混合多傳感器聯盟的求解方法。首先將不確定多目標規劃問題通過不確定理想點法變成不確定單目標規劃問題,其次進一步通過一定的序關系準則實現不確定單目標規劃問題向確定單目標規劃問題的轉變,在基本煙花算法(fireworks algorithm, FWA)的基礎上通過設計基于改進選擇策略的FWA (improved selected strategy FWA, ISSFA)得到原問題的有效解,進行聯盟組建,并與已有文獻進行對比仿真分析,驗證其有效性。同時提出“預測再預測”機制完成聯盟的更新任務,實現對目標的穩定跟蹤。

在對目標的跟蹤過程中采用擴展卡爾曼濾波(extended Kalman filter, EKF)算法對目標的狀態進行估計。算法過程如下:

(1)

(2)
(+1)=(+1|)(+1)·
[(+1)(+1|)(+1)+]
(3)
(+1|)=(+1|)(|)(+1,)+-1
(4)

(5)

組建不確定混合多傳感器聯盟問題中建立的目標函數。
(1) 組建聯盟所需的時間最短
組建個傳感器聯盟在執行個任務所用的時間越少,表示每個任務由離其最近的傳感器聯盟執行,從而大大提高了傳感器資源的分配效率。依托專家信度分析可得傳感器的相對能耗值和傳感器所受的威脅度對組建聯盟所需的時間影響較大,據此可建立如下目標函數:

(6)
(2) 組建聯盟產生的消耗最少
混合多傳感器聯盟完成任務產生的消耗主要有傳感器自身的消耗和各傳感器之間的消耗兩部分。假設每個傳感器產生的消耗為(=1,2,…,;=1,2,…,),每個傳感器聯盟記為=()×,其中=1表示傳感器對目標進行跟蹤,=0表示傳感器不對目標進行跟蹤。依托專家信度分析可得傳感器的探測距離和傳感器所受的威脅度對組建聯盟影響較大,據此可建立如下目標函數:

(7)
(3) 組建的聯盟對目標的跟蹤精度誤差最低
假設我方有個傳感器{,,…,}對來襲目標進行跟蹤,{,,…,}為各傳感器對應的跟蹤精度誤差因子。跟蹤精度誤差因子定義為

(8)
式中:(=1,2,…,)為基于第個傳感器得到的目標狀態最小二乘估計的誤差陣;tr(·)表示矩陣的跡。
依托專家信度分析可得傳感器所受的威脅度和傳感器的相對能耗值對組建聯盟的影響較大,據此可建立如下目標函數:

(9)
約束條件如下:
(1) 傳感器是否加入混合多傳感器聯盟實現對目標的跟蹤過程,即=1代表加入聯盟對目標跟蹤,否則=0;
(2) 每個傳感器聯盟所能承擔的任務數有上限,即≤;
(3) 每個傳感器所能參加跟蹤任務的數量有限,不能超過所能允許范圍的最大值。
不確定多目標規劃模型一般可以表示為

s.t.(,)≤0,=1,2,…,
(10)
式中:∈為決策變量。
在實際工程應用中,不同目標函數的具體特征值具有不同的意義,所以需要通過一定的序關系準則P來確定不同目標函數的具體特征值的具體意義。由于不確定目標函數其本身也是不確定變量,所以本文首先使用符號p和p=來定義不確定變量之間的關系。序關系準則通常包括期望準則和期望-方差準則,具體定義如下:
(期望準則,P準則)假設,為兩個不確定變量,當且僅當E[]≤E[]或E[] (期望-方差準則,P準則)假設,為兩個不確定變量,當且僅當E[]≤E[]或E[] 在實際工程應用中,期望-方差準則即P準則應用最為廣泛,所以接下來的研究主要是在P準則下對不確定混合多傳感器聯盟進行求解。 不確定理想點法是指通過優化各個目標函數點到最優理想點的距離來實現不確定多目標規劃問題向不確定單目標規劃問題的轉化。應用不確定理想點法,可以得到: (11) 在P準則下,不確定多目標規劃問題的有效解的定義如定理1所述。 在P準則下,不確定單目標規劃的最優解是不確定多目標規劃問題的有效解。 且至少存在一個(1≤≤),使得 進一步可得 證畢 由上述證明可以得到不確定混合多傳感器聯盟的求解流程如圖1所示。 圖1 模型的求解流程Fig.1 Solution process of the model 通過不確定理想點法實現不確定條件下多目標規劃問題向不確定單目標規劃問題轉化,具體形式為 (12) 式中:,和分別是(,),(,)和(,)在可行解集序列上的下界。 在P準則下,不確定單目標規劃問題可以進一步轉化為相應的等價確定模型: (13) 假設3個不確定變量,,服從線性不確定分布,之字形不確定分布和正態形概率分布:~L(15,18),~Z(08,12,16),~N(15,3),分別記作(),()和()。 以為例,通過邀請專家評估傳感器的相對能耗值對組建多傳感器聯盟的影響,他們認為根據100%的可靠性,傳感器的相對能耗值對組建聯盟的影響將小于18。同時,專家認為根據0%的可靠性,傳感器的相對能耗值對組建聯盟的影響將小于15。假設傳感器的相對能耗值影響程度在區間內與專家可靠性呈線性關系,其具體不確定度分布為 同理可得~Z(08,12,16)和~N(15,3)。 為了描述清楚,記 在P準則下,式(13)可以轉化成如下確定單目標規劃問題: (14) 根據3個目標函數的函數單調性可以得到(,),(,)關于和嚴格單調遞增,(,)關于嚴格單調遞減。因此可以將和的下界和的上界分別代入3個目標函數中。 將原問題轉化成確定性問題時,本質上已經轉化為一個確定的混合多傳感器聯盟組建問題,故設計基于ISSFA進行求解,改進算法通過建立峰值煙花和探索煙花的概念,并將前一個峰值火花作為下一代煙花。峰值火花可以確保所有具有最佳適應度的火花都成為峰值火花,峰值火花是其附近的最佳火花(最低適應度),而其附近的其他火花不能成為火花,從而確保下一代火花是其附近的最佳火花,而其附近的其他火花則是其附近的最佳火花。這種選擇策略確保為下一代煙花和多樣性煙花選擇高質量的火花。為了增強煙花的整體探索能力,將所有相距最遠的火花稱為探索火花,同時也稱為下一代煙花,以保持煙花的整體探索能力。在這個策略下選擇的煙花是最邊緣的火花,可以不斷探索到邊緣,改變基本煙花算法對初始值敏感、搜索精度低等不足。算法流程圖如圖2所示。 圖2 ISSFA流程圖Fig.2 Flow chart of ISSFA 在得到不確定混合多傳感器聯盟組建方案后,由于多傳感器組成的預警探測網絡覆蓋范圍較大,導致各個傳感器不能及時響應作戰需求,同時對目標狀態的估計時刻在變化,處在一種動態變化環境之中,當時刻目標的實際跟蹤精度達不到預測精度時,在聯盟交接過程中極易導致跟丟目標,通過濾波算法預測+1時刻的目標運動狀態,會出現在預測范圍內無法實現對目標跟蹤的情況,因此本文提出“預測再預測”機制,來降低聯盟丟失目標的概率,更好地實現聯盟的交接,即在時刻,由于傳感器和目標狀態估計處在動態變化中,當在預測范圍內無法實現對目標的跟蹤,則預測失敗,需采用二分法減小時刻的采樣周期,再次預測直到跟蹤精度滿足條件。混合多傳感器聯盟交接過程如圖3所示。 圖3 多傳感器聯盟更新過程Fig.3 Process of multi-sensor alliance updating 圖4給出傳感器及目標的部署信息,圖5給出了部署在目標周圍的傳感器網絡中的各傳感器性能指標。 圖4 傳感器和目標的部署信息Fig.4 Sensors and targets deployment information 圖5 傳感器性能指標Fig.5 Performance indicators of sensor EKF算法初始參數設置如下。 觀測噪聲協方差矩陣: 系統噪聲的協方差陣 基于ISSFA參數設置如表1所示。 表1 ISSFA參數設置 3.2.1 確定混合多傳感器聯盟組建仿真 為了驗證該算法的有效性,選擇了FWA和離散動態粒子群優化(discrete dynamic partical swarm optimization, DDPSO)算法進行比較分析和討論。根據ISSFA參數設置,,和的解如圖6所示。 圖6 目標函數適應度值變化曲線Fig.6 Curve of target function fitness value 由圖6可以看出3種算法都有相同的下降趨勢,最終分別收斂到3.095 96,1.206 61和0.513 08。但這3種算法的收斂速度不同。ISSFA更快地收斂到最優值,FWA收斂速度慢,優化效果差,容易陷入局部最優解。與ISSFA相比,DDPSO能找到全局最優解,但收斂速度不如ISSFA快。結果表明,ISSFA防止陷入局部最優的能力強于DDPSO和FWA,更有利于解決復雜的優化問題,同時也證明了ISSFA的有效性。 在得到3個參數,和的解后,可以使用3個參數值計算在P準則下的多傳感器聯盟組建方案,圖7給出了使用傳統求解不確定多目標規劃方法的多傳感器聯盟內傳感器響應序號。圖8給出了使用不確定理想點法的多傳感器聯盟內傳感器響應序號。同時表2詳細地列出了使用傳統理想點法和不確定理想點法的多傳感器聯盟組建方案,其中0表示傳感器不加入組建聯盟,1表示傳感器加入組建聯盟。 圖7 傳統求解方法下的多傳感器聯盟內的傳感器響應序號Fig.7 Sensor response number within multi-sensor alliance under traditional ideal point method 圖8 不確定理想點法下的多傳感器聯盟內的傳感器響應序號Fig.8 Sensor response number within multi-sensor alliance under uncertain ideal point method 表2 聯盟組建方案 從圖7、圖8和表2中可以看出,采用傳統理想點法和不確定理想點法兩種方法均可以生成多傳感器混合動態聯盟,且傳感器在全過程探測中都發揮了一定的作用,相比而言,采用不確定理想點法得到的混合多傳感器聯盟方案要整體優于采用傳統理想點法得到的聯盟方案,對于每一個目標組建的聯盟中,8個傳感器幾乎沒有出現閑置的情況,方案中的傳感器利用率更高,有效地避免了傳感器資源浪費,這樣組建的聯盟會大大提高對目標的跟蹤精度,意味著在后續的探測過程中探測效果更好。 同時還可以看出對于同一個不確定問題,利用不同的理想點法得到的結果是不同的,主要原因為每種方法對于不確定性的處理順序存在差異,但在P準則下,它們都是有效的多傳感器聯盟方案。但是不確定規劃問題往往具有固有的不確定性以及各個目標函數之間不是完全獨立,具有一定的相關性,因此采用了不確定理想點法來解決此類問題,仿真結果表明使用不確定理想點法確實在最終得到的結果上優于傳統求解方法。 3.2.2 不確定混合多傳感器聯盟更新仿真 為了驗證傳感器聯盟在更新過程中采用“預測再預測”機制的有效性,用本文提出的“預測再預測”(predict and re-predict, P&R-P)機制與“量測再更新”(measure and re-predict, M&R-P)和“預測即更新”(predict and update, P&U)兩種更新機制進行對比,采樣次數設為200,仿真結果如圖9所示。 圖9 采用不同更新機制時目標跟蹤誤差Fig.9 Target tracking error under different updating mechanisms 目標跟蹤的位置均方根誤差(root mean square error, RMSE)如表3所示,算法運行時間如圖10所示。 表3 目標跟蹤的位置RMSE 圖10 采用不同更新機制時運行時間Fig.10 Algorithm running time under different updating mechanisms 圖10和表3顯示了采用不同更新機制時對3個目標的跟蹤誤差及算法的運行時間比較結果。結果表明,本文提出的更新機制產生的誤差最小,而且收斂性明顯優于其他兩種機制,這是由于目標處在動態環境中,傳感器對目標的狀態估計形成的聯盟能夠提供精確的量測值,從而大大減小了跟蹤誤差,同時運行時間較短。 本文針對不確定多傳感器混合聯盟求解問題,主要工作及創新點如下: (1) 在給出了不確定性變量之間關系的定義后,將不確定性理想點方法應用于模型中,將不確定多目標規劃問題轉化為確定的單目標規劃問題; (2) 提出基于ISSFA求得模型的有效解,通過與FWA和DDPSO的比較,得到了該算法的解,證明了該算法可以避免選擇性能相似、質量低劣的粒子進行迭代,進而通過計算得到多傳感器混合聯盟組建方案; (3) 通過與傳統方法和不確定理想點法的比較,不確定理想點法可以解決目標函數相關的問題,使最終聯盟方案總體上優于傳統方法; (4) 通過對比分析不同更新機制對3個目標的跟蹤誤差及算法的運行時間來驗證傳感器聯盟在更新過程中采用“預測再預測”機制的有效性。
















3 仿真實驗
3.1 仿真參數設置





3.2 仿真參數設置










4 結 論