張 堯,王建楠
(1. 武警工程大學 研究生大隊, 陜西 西安 710086; 2. 武警部隊研究院 裝備技術研究所, 北京 100012;3. 武警特種警察學院 情報偵察系, 北京 102211)
無人機作為新型作戰力量的典型代表,其戰場效能需要大量專業人才支撐。無人機飛行技能是無人機各專業崗位必須掌握的一項通用型技能,是戰場戰術協同的前提。組訓者及教練人員是無人機教學訓練的核心[1],而當前日常教學訓練往往憑借教員專業經驗進行組訓,資源配置隨意性較大,缺少客觀量化依據,對施訓者自身素質水平依賴性較強,訓練效果難以保證。當前,無人機操控人員短缺,訓練資源匱乏,如何在有限條件下提升無人機飛行訓練資源配置效率成為亟待解決的一個重要問題。
層次分析法(analytic hierarchy process,AHP)是美國著名的運籌學家薩迪教授在1980年提出[2],并確立一種層次化、定性和定量結合的多目標決策評價方法[3]。目前在復雜系統效能評估和方案優選中應用較為廣泛的依然是層次分析方法及其衍生方法[4]。大量研究表明,將AHP方法與其他決策方法或數學模型進行結合得到了廣泛應用[5]:劉建華等[6]運用層次分析法-逼近理想解排序法(analytic hierarchy process-technique for order preference by similarity to an ideal solution, AHP-TOPSIS)模型解決選擇工具困難的問題,通過MATLAB軟件計算最終貼近度T進行優劣排序;周云[7]將模糊 AHP層次分析法與服務等級協定(service level agreement, SLA)業務管理數據模型結合用于評估軍事通信網絡系統效能,使指標權重能夠更全面地反映用戶體驗和保障效能;王彪等[8]利用指數標度法構建正互反矩陣的方法計算無人機作戰能力指標權重,降低了標度的主觀性影響;Badri[9]將AHP方法與目標規劃方法相結合,在目標模型中引入優先權重,輔助公司在資源限制條件下選擇最佳服務質量控制系統; Korpela等[10]和Jung等[11]將AHP與數學優化模型結合,在預算約束條件下尋求最優質量目標。上述研究雖然進行了一定程度的改良,但人為賦權主觀性影響依然較大。同時,也有部分學者將Arena軟件應用于AHP方法所得結論的模擬驗證上:Raja等[12]基于AHP矩陣得出的高密度聚乙烯回收物流路徑,利用Arena軟件模擬驗證并尋找最優路徑;鞠儒生等[13]通過熵值模型分析了AHP模型的合理性,并利用Arena軟件驗證了結果。上述研究僅僅利用Arena軟件作為模擬驗證結論的手段,與AHP方法本身并未融合。
本文從無人機飛行訓練本質特征出發,提出了一種基于AHP方法與Arena仿真建模技術的飛行訓練資源配置效率綜合評價方法,用模擬仿真分析取代人為主觀評價,改良影響因素權重確定過程,大幅降低了傳統AHP方法中人為評價主觀片面性影響,為無人機飛行訓練資源配置效率評價、方案優選及高效組訓提供客觀的量化決策依據。
無人機飛行訓練資源配置,應以飛行訓練成效最好為導向,以資源周轉效率最大為目標。首先應從飛行訓練流程主要環節入手,確定影響訓練資源配置效率的主要因素,引入評價指標,建立飛行訓練資源配置效率層次型綜合評價體系。
無人機飛行訓練是學員熟悉無人機真實環境操控特性,掌握飛行控制技能和培養良好飛行習慣的重要訓練內容。通過訓練過程分析,無人機飛行訓練主要圍繞檢查調試、展開訓練、電池保障、現場維修4個基本環節進行,流程如圖1所示。

圖1 無人機飛行訓練流程Fig.1 UAV flight training process
無人機飛行訓練各環節均需要投入人力、設備和時間等資源,訓練資源配置直接影響訓練效果。訓練資源配置效率受到多方面因素的影響,且影響因素呈現出非線性、動態性、模糊性的特點[14],主要可概括為人員因素和設備保障因素兩個方面:人員因素包括師資力量、操控水平、訓練態度等定性因素;設備保障包括訓練機數量、電池及充電設備配備數量等定量因素。通過分析各環節工作內容,分別歸納出各環節的主要影響因素,如圖2所示。

圖2 無人機飛行訓練資源配置效率影響因素Fig.2 Influencing factors of allocation efficiency of UAV flight training resource
經過歸納整理,訓練資源配置效率影響因素主要有無人訓練機配置數量、電池配置數量、充電設備配置數量、機體訓練完好率、現場修復率。其中,人員因素可通過機體完好率和現場修復率間接體現。
無人機飛行訓練資源配置效率從達成率和經濟性兩個維度進行評價。達成率主要體現在每次訓練達到有效飛行訓練時間的人數,即訓練達標能力指標P1;經濟性主要體現在訓練過程中訓練資源循環周轉效率,包括訓練資源周轉指標P2及資源最大等待時間P3。
1.3.1 訓練達標能力指標P1
訓練達標能力指標P1,指一次完整訓練中達到有效飛行訓練時間(1 h/(人·d))的人數與參訓總人數的比例。P1值越大,該訓練資源配置方案訓練達標人數越多,可表示為:
(1)
其中:P1為訓練達標能力,0≤P1≤1;Cf表示達到有效飛行訓練時間的參訓人數;C表示參訓總人數。
1.3.2 訓練資源周轉指標P2
訓練資源周轉指標P2,指訓練過程中參訓者等待訓練資源的平均時間。P2值越小,訓練資源循環周轉效率越高,可表示為:
(2)
其中:P2表示訓練資源周轉效率,P2≥0;T(Wait)i表示第i個參訓者在訓練過程中等待資源的全部時間,單位min。
1.3.3 資源最大等待時間P3
資源最大等待時間P3,指參訓者等待某一訓練資源釋放的最大等待時間(P3≥0),用以描述訓練過程中周轉效率最差的情況,單位min。P3值越大,表示該訓練資源配置方案短板越明顯;P3值越小,表示該訓練方案中資源周轉效率普遍較高。
AHP層次分析法是一種簡捷、實用的定性與定量相結合的決策方法[15]。依據AHP層次分析理論,可以將無人機飛行訓練過程涉及的各類非序列因素,劃分為條理分明、相互聯系的有序層次,形成有利于分析和比較的層次結構[16],如圖3所示。無人機飛行訓練資源配置效率評價體系以飛行訓練資源配置效率Z為目標層,向下分解為指標層,設指標集P={P1,P2,P3};因素層,設影響因素集U={無人訓練機配置數量U1,電池配置數量U2,充電設備配置數量U3,機體訓練完好率U4,現場修復率U5};方案層,設方案集S={資源配置方案S1, 資源配置方案S2, …, 資源配置方案Sn}。

圖3 無人機飛行訓練資源配置效率評價體系Fig.3 Evaluation system for allocation efficiency of UAV flight training resources
結合以上論述,將基于AHP-Arena的無人機飛行訓練資源配置效率綜合評價方法步驟進行概括,如圖4所示。

圖4 AHP-Arena綜合評價步驟Fig.4 Steps for AHP-Arena comprehensive evaluation
在運用AHP過程中,指標權重設置(即重要程度的量化)是非常重要的,它直接影響了分析結果[17]。由圖4可知,該方法通過對訓練流程的分析,在確定無人機飛行訓練資源配置效率影響因素基礎上,利用Arena建模仿真軟件將訓練流程轉換為訓練過程動態邏輯仿真系統[18],隨后基于仿真系統運用單變量數值仿真法[19]獲得各影響因素對應的指標值,再通過均方差決策法[20]賦予影響因素單排序權重及綜合權重,最后將經過提煉整理的資源配置方案進行無量綱化處理,并分別與各影響因素綜合權重通過線性加權[21]得到資源配置效率綜合評價系數,從而獲得方案優選排序。
2.2.1 Arena仿真技術簡介
仿真是對有限資源分配、占用、釋放方式進行研究的試驗工具。本文選用的Rockwell Arena軟件,是美國羅克韋爾自動化(Rockwell Automation)有限公司于1993年開始研制開發的新一代通用仿真軟件,可以實現離散系統、連續系統和混合系統的仿真,具有功能強大、使用方便、界面直觀、輸入輸出與過程分析功能強大等優點[22]。Arena采用可視化建模和運行環境,在數據輸入、輸出及模型調試等方面比Flexsim、eM-Plant等更穩定[23]。利用Arena仿真技術,構建無人機飛行訓練運行過程和各環節資源約束規則的邏輯和數量關系模型,用以客觀反映訓練組織過程和訓練成果,便于分析各環節影響因素變化對訓練資源配置效率的影響,達到提升訓練資源配置成熟度,增強訓練組織的可行性、合理性的目的。
2.2.2 仿真系統設計與實現
無人機飛行訓練過程屬于典型的離散事件系統[24]。仿真系統設計以訓練資源為元素,以參訓人員為實體,以訓練資源配置效率評價指標為輸出,規劃輸入、運行和輸出3個組成部分。其中,運行過程設計4個子系統,分別對應檢查調試、展開訓練、電池保障、現場維修4個環節,如圖5所示。

圖5 無人機飛行訓練仿真系統示意圖Fig.5 Schematic diagram of UAV flight training simulation system
仿真系統源于真實的訓練過程,更能準確直觀地體現各環節資源運行細節,以此來替代人為主觀經驗所得出的結論更具針對性和客觀性,為無人機飛行訓練過程提供了一種低成本、高效率的動態模擬仿真手段。
單變量數值仿真指在仿真過程中,僅改變單一影響因素數值,其他因素均不發生變化,以分析該影響因素變動對評價指標的影響[25]。因此,基于構建的無人機飛行訓練仿真系統,對影響因素集U中各因素分別進行m組單變量數值仿真,對應獲得指標集P中對應指標值Aij/Bij/Cij(i=1,2,…,m;j=1,2,…,5),如表1所示。

表1 單變量數值仿真P1/P2/P3指標值Tab.1 P1/P2/P3 indicator value of single-variable numerical simulation
均方差可以直觀地描述一組隨機變量的離散程度,均方差決策法就是基于均方差求解多指標決策權重系數的方法,該方法能夠進一步降低人為決策偏差和主觀賦權法的隨機性[26]。
2.4.1 確定影響因素單排序權重系數步驟公式
計算Aij/Bij/Bij均值,即
(3)
計算Aj/Bj/Cj均方差,即
(4)
計算影響因素單排序權重系數,即
(5)
2.4.2 確定影響因素綜合權重系數步驟公式
計算影響因素單排序權重均值,即
(6)
計算影響因素單排序權重均方差,即
(7)
計算影響因素綜合權重系數,即
(8)
結合訓練流程分析和組訓經驗,擬制資源配置備選方案,并經提煉整理后形成備選方案集S,如表2所示。
采用Min-Max標準化方法[27]對表2方案數據進行無量綱化處理,消除各數值量綱不一致的問題,即:
(9)
式中:tqj(q=1,2,…,n;j=1,2,…,5)為方案數據標準化后的數據值;Tqj為方案原始數據,Tqjmax、Tqjmin分別為表2中各列數據的最大值和最小值。

表2 訓練資源配置方案數據Tab.2 Data sheet of training resource allocation scenario
綜合2.4.2節影響因素綜合權重系數ωj與2.5節無量綱化處理后的方案數據tqj,通過線性加權綜合法計算資源配置效率綜合評價系數Kq(ω),計算公式如下:
(10)
式中,Kq(ω)越大,表示該訓練資源配置方案效率更優,對比Kq(ω)即可實現對多個訓練資源配置方案效率評價與優選。
以某無人機培訓班多旋翼無人機飛行訓練過程為例,參訓人數30,一個教學日完整飛行訓練約360 min,一個月設置22個教學日。
訓練仿真系統中多旋翼飛行訓練過程基礎參數設置,如表3所示。

表3 飛行訓練過程基礎參數Tab.3 Basic parameters on the flight training process
按照2.2.2節中仿真系統的設計構想,以滿足人均有效訓練時間(1 h/(人·d))、人數最大化為前提,以訓練資源周轉效率最大化為目標,利用Arena仿真建模軟件,綜合應用Create(創建模塊)、Batch(打包模塊)、Separate(分離復制模塊)、Process(過程模塊)等單元構建訓練流程動態邏輯模型,通過Decide(條件判斷模塊)和Assign(變量定義模塊)組合實現邏輯關系判斷,并設置可視化插件對訓練資源動態變化進行監視,實現無人機飛行訓練仿真系統,系統界面如圖6所示。

圖6 無人機飛行訓練仿真系統界面Fig.6 System interface of UAV flight training simulation
以某階段已結課的無人機培訓班資源配置方案作為樣本數據對仿真系統有效性進行檢驗。資源配置情況如表4所示,樣本中飛行訓練過程各項基礎參數與表3保持一致。按照22個教學日運行仿真系統后,將仿真系統輸出的達標人數與樣本中達標人數進行對比。仿真系統輸出達標人數結果(13人)與樣本訓練達標人數結果(12人)誤差僅為8.3%(小于10%),仿真系統與實際訓練情況基本相符,該仿真系統有效,可用于后續綜合評價步驟。

表4 樣本數據訓練資源配置Tab.4 Allocation of training resources in the sample
Step1:運行3.2節無人機飛行訓練仿真系統,輸入訓練資源配置基準方案作為仿真系統初始方案,基準方案數據如表5所示。

表5 訓練資源配置基準方案Tab. 5 Reference project of training resources allocation
Step2:采用單變量數值仿真法,按照2.3節所述步驟方法分別對影響因素集U中各因素仿真獲得對應指標值,如表6~8所示。

表6 訓練達標能力指標P1指標值Tab.6 Value of training compliance indicator P1

表7 訓練資源周轉指標P2指標值Tab.7 Value of training resource turnover indicator P2

表8 資源最大等待時間P3指標值Tab.8 Value of the maximum wait time for resources P3
Step3:采用均方差決策法,按照2.4.1節所述步驟公式分別獲得5個影響因素對應的層次單排序權重xj、yj、zj,如表9所示。

表9 影響因素層次單排序權重系數Tab.9 Hierarchical single sorting weight coefficient of influencing factors
Step4:采用均方差決策法,按照2.4.2節所述步驟公式分別獲得5個影響因素的綜合權重系數ωj=(0.399,0.094,0.192,0.115,0.200)。
Step1:基于飛行訓練流程分析,綜合現有訓練資源、購置預算經費、仿真系統運行結果及學員操控熟練水平等多方面制約因素,擬制資源配置初步方案,按照影響因素提煉數據、分類整理后得到資源配置備選方案集S,如表10所示。

表10 訓練資源配置備選方案集STab.10 Training resource allocation alternative set S
Step2:采用Min-Max標準化方法,按照2.5節所述公式依次對方案集S資源配置數據進行無量綱化處理,如表11所示。

表11 訓練資源配置備選方案集S(無量綱化)Tab.11 Training resource allocation alternative set S(Nondimensionalization)
Step3:采用線性加權綜合法,按照2.6節所述步驟公式分別計算獲得5個備選方案綜合評價系數Kq(ω)=(0.409,0.529,0.644,0.460,0.591)。
由綜合評價系數Kq(ω)對比可得,訓練資源配置備選方案優選排序為:S3>S5>S2>S4>S1,即S3方案訓練資源配置效率優于其他方案。因此,建議選擇S3方案為該無人機培訓班飛行訓練資源配置方案。
為了驗證S3方案的優越性,將該方案導入“無人機飛行訓練資源配置效率評價實例”中的無人機培訓班訓練過程進行模擬。結果顯示,在同樣訓練時間內,S3資源配置方案下的訓練達標人數由原方案的12人增加到30人,增幅達250%,達到了預期效果。同時,在實際組訓中,一方面進行訓練資源調配與購置補充時,須以S3方案作為各訓練資源的配置目標,避免以往“越多越好”的粗放式配置;此外,在預算和課時分配調整時,按S3方案中影響因素綜合權重順序安排先后主次,將有限的時間和經費花在“刀刃上”。
訓練資源配置效率評價是衡量訓練過程資源配置合理性、組訓科學性的重要手段和有效措施。本文融合AHP理論和Arena仿真建模技術,將模擬仿真分析取代人為主觀評價,建立了無人機飛行訓練資源配置效率綜合評價體系,概括了基于AHP-Arena方法評價步驟,其核心步驟在于準確構建訓練模擬仿真系統,仿真系統越貼合實際運行過程,權重系數越合理。該綜合評價方法的創新性主要可概括以下三個方面:
1)該綜合評價方法中層次單排序和綜合權重系數是基于真實訓練過程的仿真系統模擬分析和均方差計算綜合確定,無人為評價步驟,極大地降低了人為判斷時個人主觀片面性影響,提高了權重確定的客觀性、簡便性和科學性,但對仿真系統構建的準確性要求較高。此外,通過訓練流程動態邏輯模型及參數的調整變化可靈活根據訓練的創新發展升級優化,增強了方法的時效性、適應性和成長性。
2)該方法可以有效輔助組訓單位或個人解決三個方面問題:一是預估資源配置方案訓練效果;二是已知參訓規模情況下擬制資源配置方案;三是基于現有訓練資源評估承訓規模。
3)該綜合評價方法思路和模型可進一步推廣至其他類似訓練過程,亦可為其他多因素、多指標評價決策過程提供借鑒,具有較高的可復用性、較強的實踐性和良好的擴展性。