陳偉龍,陳春良,劉彥,王雄偉
(裝甲兵工程學院 技術保障工程系,北京 100072)
戰場搶修[1]是指在戰場上運用應急診斷與修復技術,迅速地對受損裝備進行評估并根據需要快速修復損傷部位,使裝備能夠完成某項預定任務或實施自救的活動。搶修任務動態調度則是指在搶修任務分配方案的決策時刻,所需決策信息僅部分可知,先依據已知信息決策出該時刻的一個滿意方案并付諸實施;而后根據逐步獲取的信息,不斷調整搶修任務分配方案,以期獲得最優的搶修效益。
戰場搶修任務動態調度問題,則是指在作戰過程中,因敵炮火打擊,勢必造成我方部隊在不同時刻和地點、隨機地出現戰損裝備;但搶修力量有限,無法在作戰持續時間內完成對修理范圍內的所有待修裝備的修理。通過綜合權衡待修裝備的優先程度、所需修理工時、距離遠近、不同搶修組的修理能力差異等因素,從修理范圍內的眾多故障裝備中迅速地選擇部分裝備并將其分配給各個搶修組;并根據戰場態勢發展以及不斷變化的搶修需求信息,適時、動態地調整搶修任務分配計劃,使搶修力量能夠在有限作戰持續時間內盡可能多地修復或部分修復損傷裝備,進而取得最優的整體搶修效益。
本文針對戰場搶修任務動態調度的國內外研究現狀進行綜述,分析現有研究存在的不足,旨在為后續解決戰場搶修任務動態調度問題找到立足點和突破口,進而達到提高搶修效益、維持部隊作戰能力的目的。
基于系統工程思想進行分析,搶修任務動態調度系統主要由5個元素構成,包括:搶修對象及其相關信息、搶修力量及其相關信息、環境信息、決策模型與求解算法、修竣裝備與搶修效益。
(1) 搶修對象的相關信息主要包括:① 損傷信息,如損傷時刻、坐標位置、裝備類型、預計所需維修工作量等;② 搶修進度信息,如修竣與否、恢復狀態、預計修竣時刻、實際修竣時刻、動態調度時刻的剩余修理工作量等。
(2) 搶修力量的相關信息主要包括:① 各個搶修組的編制信息,如各搶修組的保障裝備的種類和數量信息、保障人員的數量和修理技能水平信息等;② 在進攻作戰持續時間內的任意時刻,所有搶修組的狀態信息,如各搶修組在任意時刻的位置信息、人員/裝備損失情況信息等。
(3) 環境信息是指在一體化機動進攻作戰持續時間內,除卻搶修力量和搶修對象的相關信息外,與搶修任務動態調度問題相關的其他所有信息。主要包括:① 作戰起止時刻;② 各作戰單元、武器裝備在任意時刻的任務信息、位置信息;③ 各作戰單元、武器裝備的相互關系信息;④ 地形、道路、氣象水文信息等。
(4) 決策模型與求解算法是指在一體化機動進攻作戰持續時間內,為求得搶修任務動態調度問題在各個決策時刻的決策方案(各搶修組間的任務分工和搶修組內的搶修序列),所需借助的數學模型和求解方法。
(5) 修竣裝備與搶修效益,是指在一體化機動進攻作戰持續時間內,各搶修組通過實施巡回修理,修竣的待修裝備及獲得的修理效益。
基于控制論的思想,從系統輸入、系統過程、系統輸出、系統限制以及逆向聯系5個方面,構建搶修任務動態調度系統的運行圖,如圖1所示,旨在從整體上呈現出系統各構成元素及其相互關系。
(1) 長期開展基礎研究
戰場搶修,美軍稱之為BDAR(battle damage assessment and repair),最初由美軍提出并開始使用。在目睹了以色列在1973年中東戰爭中戰場搶修取得的巨大軍事效益、以及1982年英阿馬島之戰中英國海軍的慘重損失后,美軍開始進行關于戰場搶修的系統研究。1982年和1984年,美陸軍、空軍制定了各自的《BDAR綱要》和《ABDR綱要》,主要包括:BDAR手冊、BDAR成套工具、BDAR組織與訓練、BDAR后勤[2],用于指導各軍兵種編制各自的BDAR綱要和開展BDAR工作。在20世紀90年代初的海灣戰爭中,美軍各型飛機的完好率平均水平保持在了92%,艦船達到了90%,進一步驗證了戰場搶修在作戰中的重要作用。
與平時維修相較,由于修理需求、作業環境和時間限制等巨大差異,使得戰場搶修與前者存在很大區別,詳見表1。戰場搶修具有搶修時間緊迫、作業環境惡劣、修復手段靈活、恢復狀態多樣4個主要特點[3];其中,戰場搶修的修復手段包括換件修理、原件修復、應急修理(包括拆拼、置換、替代、重構等)[1]。
戰場搶修的搶修方式可分為現地修理和后送修理,其中現地修理又包括使用分隊自主修理、伴隨修理、巡回修理,后送修理則主要采用定點維修,相關概念如表2所示。
對于信息化作戰而言,交戰時間十分有限,戰場搶修的首要目標是使損傷裝備在最短的時間內再次投入戰斗任務,最大制約因素是時間,核心工作是應急修理,主要采取伴隨搶修的方式,且并不要求恢復裝備的全部功能,也不必限定人員、工具、器材等。我軍的搶修實施原則如表3所示。

表1 戰場搶修與平時維修的區別Table 1 Difference between battlefield repair and routine maintenance

表2 搶修方式的定義Table 2 Definition of rush-repair mode
(2) 持續完善行政和技術法規
20世紀80年代以來,世界各國特別是美、英、德、法、俄等發達國家對戰場搶修進行了系統研究,完善和制定了戰場搶修的行政法規和技術法規。1985年,美軍發布了軍用規范MIL-M-63003《戰場損傷評估與維修手冊的編制》,對BDAR手冊的內容和編制格式做了統一規定。1988年美空軍發布了軍用規范MIL-M-87158A《飛機BDAR手冊的編制》,用以指導型號飛機BDAR手冊的編制。日本陸軍的《軍械條例》、俄羅斯的《現代戰斗中坦克和摩步分隊技術保障》等,明確了各級指揮機構在戰場搶修中的和任務分工。我軍頒布實施了國軍標GJB/Z20437-97《裝備戰場損傷評估與修復手冊的編寫要求》,為編制各類武器裝備的BDAR手冊明確了要求、提供了具體的技術途徑;許多具體型號裝備的BDAR手冊相繼出爐;空軍也制訂了《空軍飛機戰傷搶修研究規劃》,加速推進飛機戰傷搶修研究。
(3) 建設搶修專業隊伍,開展搶修實踐
外軍建立了訓練有素的應急搶修專業分隊[4-5],如美軍的“上等牛排”工程部隊和“紅馬”重型作業土木中隊,英國空軍基地的皇家工兵連、德國空軍基地的快速修復連。美軍斯特瑞克旅(Stryker)[6-7]作為美軍數字化部隊作戰能力與保障能力建設的突出代表,是美國陸軍根據“網絡中心戰”[8]、“數字化部隊”、“模塊化部隊”[9-10]等現代軍事概念和理論打造的一支新型陸軍部隊,十分重視建設和發揮戰場搶修的作用。圖2~4簡要給出了斯特瑞克旅的總體編制、支援營編制以及修理連編制。其中,支援營的主要職能是計劃、準備、快速部署并遂行各種勤務保障活動,為旅提供不間斷的后勤支援,保持和恢復旅在全譜作戰中的持續作戰能力。修理連的主要職能是負責旅武器裝備的維修保障、備件供應等。其中,維修控制分排主要負責指導和管理各修理單位戰場搶修活動,并對修竣裝備進行技術檢查;戰斗搶修組在戰斗中遂行伴隨保障任務,主要負責對通用戰斗裝備進行快速搶救、搶修及其他應急處理;輪式車輛修理排主要負責建制內輪式車輛的修理工作,并對前方戰斗搶修組無力修復的輪式車輛進行修理;修理支援排主要負責對斯特瑞克旅的特種裝備進行維修[11]。
(4) 創新多樣化搶修訓練方法
創新了眾多搶修訓練方式,包括相關搶修條令條例和技術手冊的學習、實踐性搶修訓練、虛擬訓練[12]、3D課件教學、網絡教學等,定期組織搶修技術人員進行搶修培訓和訓練。美國陸軍軍網和移動式培訓教室還為士兵提供戰場搶修虛擬教室的入口。例如,20世紀90年代末,美軍的SURVIAC(生存性易損性信息中心)開發了TWE/BDAR A&R System(威脅彈頭/戰場損傷評估與修復檔案與修補系統),該系統以現有搶修案例為基礎,可為訓練人員提供特定的裝備損傷和修復事件的損傷評估與搶修訓練,以提高戰場搶修人員和戰斗人員的戰時修理效率。2000年,美國空軍研究實驗室開發了空軍戰場搶修演示系統,其重點為戰場損傷評估,既可通過訓練加快技術人員的評估速度,又能提高評估的精確度和完備度。在2003年的伊拉克戰爭中,NGRAIN公司研發了一種面向任務的3D交互式戰場損傷評估與修復訓練系統,提高了搶修訓練的效率,以更低的費用取得了更好的訓練效果。

表3 戰場搶修的實施原則Table 3 Implementation principle of battlefield repair
(5) 運用新技術提升搶修能力
將條形碼、光存儲卡、射頻識別等技術廣泛運用于遠程檢測與診斷系統、交互式電子技術手冊[13]、綜合檢測設備和嵌入式故障診斷設備之中,提高了故障診斷正確率。實現了搶修工程車輛的多功能化,提高了其性能和使用效率;研制了面向戰地快速維修的零部件移動醫院[14],并給大部分主戰裝備配備了數字化工具箱。運用維修“遠程支援”系統,使得后方技術人員能夠為前方的戰場搶修提供及時的技術支持。研制并應用搶修新材料與新技術,如碳纖維加固技術、無電焊接技術[15]、3D打印技術[16]等,縮短了搶修時間,提高了搶修效率。
(6) 開展搶修任務分配方案的決策技術研究
學者提出了眾多的搶修任務指派(排序)模型及相應的求解方法。文獻[17]從受損裝備擔負作戰任務重要程度、搶修任務的搶修性特征、資源的重組性、裝備受損情況、搶修環境5個方面建立了戰場搶修任務重要度決策指標體系,構建了基于證據推理的多任務搶修重要度決策模型。文獻[18-23]針對戰損裝備搶修排序問題,分別提出了基于模糊綜合評判法、多屬性決策理論、改進TOPSIS方法、BP神經網絡、貝葉斯網絡、案例推理的求解方法,提高了指揮員戰時決策的準確性。文獻[24]依據任務緊急程度對戰損裝備搶修任務進行分類,構建了基于不同緊急度的裝備搶修任務指派模型,并利用蟻群算法設計求解。文獻[25]以最短的時間、最少的手段使裝備至少具有完成部分任務的能力為目標,建立了艦船搶修任務規劃約束優化模型,提出了貪婪隨機變鄰域搜索算法。文獻[26]考慮搶修任務的時間約束、邏輯約束、搶修力量的平衡度約束、搶修力量的能力、搶修花費代價等約束,以作戰單元戰斗力恢復最大、搶修花費代價最小為目標,建立了戰時搶修力量多目標調度模型。文獻[27]以最短時間、最短距離和最優分隊指派為目標,采用遺傳算法進行了戰損艦艇裝備的搶修分隊調度優化模型。文獻[28]和文獻[29]針對戰時維修時間有限與維修任務眾多這一矛盾,以定點修理中的維修任務分配為研究對象,提出了2種不同約束條件下的動態維修任務調度方法,并設計了相應的求解方法。文獻[30]引入戰場搶修任務分工復雜性概念,通過NASAT-LX(NASA task load indes)法對戰場搶修任務分工復雜性進行度量,建立了基于加權支持向量回歸的戰場搶修任務分工復雜性的測算模型,有利于提高搶修任務分工的準確性。
(7) 加快搶修資源配置與重組技術研究
文獻[31]運用排隊論原理,將戰損的工程裝備隊列進行優先權等級劃分,以工程裝備完好率為目標,確定了配置維修小組的最小數量。文獻[32]針對搶修備件配置問題,分別建立了基于可用度的非戰斗損傷搶修備件需求量模型和戰時搶修備件的需求量模型,應用Monte Carlo算法對模型進行了仿真分析與計算。文獻[33]以戰時協同維修保障過程為背景,針對維修任務間客觀存在的資源短缺及資源沖突等問題,基于搶修開始時刻最早、支援點數量最少的要求,建立了戰場搶修多需求點多資源優化調度模型,設計了基于需求點優先度的資源優化調度方法和算法。文獻[34]針對搶修任務間的資源需求沖突問題,以總搶修效益最大為目標,建立了搶修資源重組決策模型,設計了混合粒子群進行求解。文獻[35]基于不確定決策理論中的拉普拉斯準則及網絡上任意一點均有可能發生任務需求的假設,以整個機動交通網的覆蓋率最大為目標,構建了雙重覆蓋標準選址模型,運用遺傳禁忌算法求解。文獻[36]從滿足一定戰備完好率出發,引進戰場搶修允許時間,建立了防空作戰戰場搶修的保障資源配置地域選擇模型。文獻[37]分析了裝備戰損規律,提出了戰損率計算模型,分析了戰時陸戰裝備搶修實施過程,給出了陸戰裝備戰場搶修力量編組和配置,運用Simio仿真平臺建立了面向具體任務的損傷修復模型和搶修力量配置調度模型。
(8) 同步推進其他方面的研究
文獻[38]研究了烏克蘭沖突中的裝備損傷案例,分析了其損傷模式、損傷等級分布、損傷部位及其被彈概率,為我軍提供了有益參考。文獻[39]集成多Agent建模仿真技術、元胞自動機技術、環境-規則-智能體(ERA)方案,通過建立基于Agent的BGC2R(belief-goal-command-capabilities-role)模型,解決了裝甲裝備修理分隊搶修能力動態評估問題。文獻[40]提出了一種適用于陸地輪式戰斗車輛的現地搶修單元。文獻[41]綜述了建模仿真技術在飛機戰傷搶修研究中研究概況。文獻[42]針對直升機懸翼的具體搶修問題開展了研究。文獻[43]闡述了可持續性的內涵及特點,分析了飛行器發動機及其鏈路系統的戰場損傷評估及搶修的步驟和工序,介紹了一種能夠快速完成戰場損傷評估的工具。文獻[44]提出了電源裝備戰場損傷等級劃分方法,探討了電源裝備損傷評估一般程序和方法,以及其戰場修復方法。
任務動態調度問題,其實質是動態的任務分配問題,可以抽象為動態車輛路徑問題(dynamic vehicle routing problem,DVRP)或動態旅行商問題(dynamic traveling salesman problem, DTSP)的延伸問題(DVRP與DTSP實質是相同的)。國內外學者對該問題的研究已經取得了豐碩的研究成果。
(1) 研究對象與應用范疇日趨廣泛
DVRP最先由Wilson和Colvin提出,隨后Psaraftis[45]界定了immediate request的概念:對既定車輛路徑進行快速調整以盡快滿足顧客提出的新需求。1996年GPS(global positioning system)的誕生、智能手機以及地理信息系統(geographic information systems,GISs)的發展,許多公司加快推動DVRP問題的研究,通過快速追蹤其車隊行蹤、動態調整行進路線,為顧客提供更優質的服務,并縮減服務成本。其中最典型的DVRP是處理任務執行過程中的客戶新需求問題,需求包括貨物[46-52]和服務[53-57],路途時間[58-64]也作為絕大部分現實問題的一個動態組成部分被納入到研究范圍內來,而服務時間則基本沒有考慮,如Intelligent Transport Systems (ITSs)中的Advanced Fleet Management Systems (AFMSs)[65-67]。最新一些研究考慮了動態需求集合[68-70]、車輛可用與否[71-73]、執行任務過程中的車輛損壞[74]、動態環境[75]。
1) 在應用DVRP解決客戶服務需求方面,限制條件包括服務地點、可能的服務時間(即時間窗)、車輛的容量限制,其中最簡單的可歸結為動態旅行商問題(DTSP)[76]。① 修理工的調度問題。維修公司給不同的修理工提前指定不同的行進路線,服務已提出預定的客戶,新的緊急客戶需求則需要插入到原行進路線中,其實際約束條件包括修理工技能的柔性、工具限制、新的維修需求所需要耗費的時間[77]等。② 醫生的調度問題。急診病人的電話需求隨機動態到達,值班醫生需要衡量嚴重性,并派出相應醫生隨救護車前往救治;與此同時,醫院還需要考慮留下一定數量的醫生,以滿足自行到醫院就醫的急診病人。
2) 在應用DVRP解決貨物/人員運輸方面,典型應用包括:① 城市快遞服務[78-80]??爝f員被派往固定流轉中心送、取快遞,或者是被派往某個顧客處提供服務(包括送、取快遞及其他服務),顧客依據路途遠近和服務質量付費。快遞公司往往擁有一個混合車隊,包括自行車、摩托車、小汽車、貨運車等,核心問題在于動態地安排快遞員行進路線,影響因素不僅包括事先已知的顧客需求類型及需求量、送(取)貨物的地點、時間窗,還包括交通變化情況和路途時間的不確定性。② 人員接送問題[81-84]。該問題與貨物運輸問題相似,但額外的約束包括等待時間、交通擁堵情況、服務時間長短、空載費用消耗等。最典型例子包括出租車電調問題、學生(老人、病人、殘疾人)接送問題。③ 航線安排問題[85-88]。航空公司為顧客提供選擇機會,是否選擇小機場(以縮減手續辦理時間和安檢等待時間)、是否接受飛機經停、是否有富裕旅行時間,然后綜合顧客需求安排飛機類型和航線。
(2) 采用“動態問題靜態化”的求解思路
就已查閱到的現有文獻而言,求解任務動態調度問題的核心思路均屬于:動態問題靜態化,即將動態調度問題轉化為一系列靜態子問題[89],然后采用適合的精確計算方法或智能優化算法,最終求得這些靜態子問題的最優解。
文獻[90]通過計劃周期分片,將動態車輛路徑問題轉換為一系列靜態子問題,采用插入法構造初始解,利用重定位法、節點交換法和2-opt*法進行線路間局部搜索。文獻[91]根據優化時間點的選取將帶時間窗DVRP轉化成靜態子模型,并對比研究了4種優化調度策略的優劣。文獻[92]考慮更貼合實際的約束條件,將動態車輛路徑問題分解為車輛選擇問題和路線優化問題,建立了多車型開放式動態需求車輛路徑兩階段數學規劃模型,制定了“預優化路線調度”和“實時動態調度”兩階段求解方法。文獻[93]建立了多維修需求點、多維修任務和多維修保障單位的動態調度問題數學模型,采用“動態問題靜態化”思路進行求解,即同一時刻的靜態優先級是不變的,而不同時刻具有不同的優先級。
(3) 提出多樣化的求解方法
動態任務調度問題絕大部分均屬于NP難題,在求解方法方面,可以分為3大類:精確求解方法、基于仿真的方法和智能優化算法。
1) 精確求解方法
① 線性規劃(linear programming, LP)[94]是將調度問題的目標函數與約束條件用線性規劃方程表示出來,爾后利用單純形法求取多變量線性函數的最優解。② 整數規劃(integer programming, IP)[95]可解決自變量限制為整數的任務調度問題,常用方法包括:割平面法、枚舉法和分枝定界法等。其中,分枝定界法應用比較廣泛,但僅適用于求解小規模的任務調度問題。③ 動態規劃(dynamic programming, DP)[96]將多階段決策過程轉化為一系列單階段問題,并利用各階段之間的相關性逐個求解,最終得到最優決策。④ 排隊論(queues theory, QT)[97]適用于分析任務調度系統的性能、設計適合的配置規則,如用于確定維修保障機構中的修理組數量。
綜上所述,針對小規模的任務調度問題,精確求解方法可在較短時間內求得最優解。但隨著問題規模增大,求解所需時間和求解難度呈指數遞增,實用性變得很差;且精確求解方法大多建立在某些理想化假設的基礎上,不能反映戰場搶修的環境復雜性、不確定性、動態性。
2) 基于仿真的方法
與精確求解方法不同,基于仿真的方法并不單純追求最優解,它側重于對裝備保障系統運行的邏輯關系進行描述,能夠對搶修任務分配方案進行評價,并可驗證求解算法的有效性。但該方法花費高,仿真的準確性、可信度難以保證,即使高精度的仿真模型也無法快速找到最優解,且很難從特殊實驗中提煉出一般規律。
3) 智能優化方法
典型方法包括:模擬退火算法、禁忌搜索、遺傳算法、人工智能方法等。
a) 模擬退火算法(simulated annealing, SA)[98]基于蒙特卡羅迭代算法求解,由某一高溫度開始,利用具有概率突變特性的Metropolis抽樣策略,在解空間隨機搜索,隨著溫度不斷下降,重復搜索過程,最終得到問題的全局最優解。SA收斂速度慢,很難用于實時動態任務調度。
b) 禁忌搜索(tabu search, TS)[99]采用禁忌表來封鎖剛搜索過的區域以避免迂回搜索、增加計算量,同時赦免禁忌區域中的一些優良狀態,進而保證搜索的多樣性,最終達到全局優化。TS不易陷入局部最優,但受初始解影響較大,若初始解選擇不當,則難以達到全局最優。
c) 遺傳算法(genetic algorithm, GA)[100]借鑒進化論思想,在確定初始種群的基礎上,采用選擇、交叉、變異算子逐步進化,經過優勝劣汰,最終求得最優解。GA在搜索過程中不易陷入局部最優,找到全局最優解的概率極大,算法具有并行性,非常適合處理大規模任務調度問題;且易于與其他技術方法相結合,形成性能更優的算法。但GA搜索效率低,易于早熟。
d) 人工智能方法是利用人工智能的原理和技術進行搜索,譬如將優化過程轉化為智能系統動態的演化過程,基于系統動態的演化來實現優化[101]。典型方法包括:神經網絡[102]、專家系統[103]、蟻群算法[104]、粒子群算法[105]等。
智能優化方法可用于求解較大規模的任務調度問題,且所需計算時間較短,但不能保證尋得問題的最優解。
(1) 對裝備戰場損傷的內涵外延、戰場損傷評估、戰場損傷修復、組織實施等進行了廣泛研究,但缺乏對戰場搶修組織實施的定量研究,即如何通過模型的定量化計算,合理地確定出搶修力量的任務區分和部署配置,并依據戰場態勢的發展變化,適時地對搶修力量進行指揮控制,使得整體搶修效益最高。
(2) 關于戰場搶修任務調度(指派)的現有研究成果,絕大部分將其修理方式限定為定點修理,進而將戰場搶修問題轉化為平時的定點維修問題來解決;這一轉化的前提是戰時需花費大量時間進行偵察與后送,但這樣的轉化策略,忽略了時間這一戰場搶修的首要因素,與戰場搶修“使損傷裝備在最短的時間內再次投入戰斗或能夠自救”的目標相違背。缺乏關于伴隨搶修和巡回搶修的研究。
(3) 搶修任務分配方案的決策,缺乏定量化測算模型及求解方法,只能依靠決策者的主觀經驗和定性搶修原則進行決策,導致決策主觀性過強、風險較高;且在實際操作過程中,這些搶修原則往往相互矛盾沖突、難以調合,使得有限的搶修時間、保障人員、保障裝備分配不合理,該先修的未及時修,可后修的卻先修了,出現不恰當或無效的修理,使得整體搶修效益不高。
(4) 雖有部分關于維修任務靜態分工的研究成果,但其與“搶修需求呈現出的時間、地點的不確定性規律”不符;缺乏關于搶修任務動態調度的研究,忽略了對部分實際約束條件的合理抽象(如恢復狀態的不確定性、不同搶修單元間的搶修能力差異等),沒有考慮不同的動態驅動策略對任務分配結果的影響。
本文從戰場搶修和任務動態調度2個方面,對戰場搶修任務動態調度問題進行了研究現狀的歸納梳理,分析了現有研究存在的不足,提出了建設建議和發展方向,為后續解決戰場搶修任務動態調度問題提供了方向指引。