王鵬 彭琿 薛芳俠 許一男
摘要:針對當前CGF行為建模時存在的決策過程過于呆板和教條化、仿真實體逼真度存在缺陷、同一仿真實體建立不同決策模型時采用的方法過于單一等問題,對行為建模技術進行了研究,建立了自行高炮CGF的戰術規則庫,重點研究如何應用基于規則的專家系統對自行高炮CGF人類行為模型進行開發,最后基于此方法對車長的行為模型進行了設計實現。該方法避免了對復雜的乘員決策行為進行分析和建模的過程,實時性好,對今后相關的研究工作具有較好的參考價值。
關鍵詞:計算機生成兵力; 自行高炮; 行為建模; 規則庫; 專家系統
中圖分類號:TN911?34; TP391.9 文獻標識碼:A 文章編號:1004?373X(2013)02?0100?04
計算機生成兵力(Computer Generated Forces,CGF)是能在基于分布交互仿真技術構建的虛擬戰場環境中,產生一定自治性智能行為實體的仿真軟件[1],如何有效地對自行高炮CGF實體對象及其行為進行建模,是自行高炮CGF研究的重要內容。CGF的行為建模分為物理行為建模和人類行為建模,其中人類行為建模是CGF行為建模的重點[2]。本文將論述當前CGF人類行為建模存在的問題,針對這些問題給出行為建模方法,重點研究如何應用這些方法對自行高炮CGF人類行為模型進行開發。
1 CGF人類行為建模問題分析
人類行為建模是CGF的核心技術之一,按照DoD的定義,它是指“對在軍事仿真中需要表示的人的行為或表現進行建模”[3]。CGF系統中許多軍事仿真中的合成兵力采用相對原始的人類模型來構造,其中決策行為往往采用一種粗糙、脆弱的方式來表示,這使得所產生的虛擬兵力表現出不切實際的行為和過分簡單化的反應,不符合真實的戰斗員和分隊的行為[4]。當前CGF系統中使用的決策方法存在的主要問題有:
(1)決策過程過于呆板和教條化。決策行為缺乏可變性、柔順性和適應性[5]。
(2)仿真實體逼真度存在缺陷。很多仿真實體所使用的決策模型都沒有考慮到個體的疲勞程度、作戰經驗、情緒沖動、時間壓力以及作戰技能水平等因素對決策結果產生的影響,并且這些因素對于每個仿真實體所產生的影響應當有所不同。
(3)同一仿真實體建立不同決策模型時采用的方法過于單一。
2 行為建模技術研究
2.1 行為建模技術分析
在此針對上節提出的人類行為建模中存在的問題,對自行高炮CGF的行為建模技術進行研究,給出其解決方法。開發CGF的難點和重點之一在于CGF實體行為的生成,如何生成真實可信的實體行為是CGF研究的核心問題。CGF系統中常用的決策方法可以分為兩大類:基于人工智能技術的決策方法和基于效用理論的決策方法。前者又可以分為基于規則的專家系統和符號推理系統兩類;后者可以分為基于屬性的決策方法和對策方法兩類。其中,基于規則的專家系統最常見,專家系統是一種模擬人類專家解決領域問題的計算機程序[6]。自行高炮的防空作戰過程是一個非常有序的動態過程,采用基于規則的專家系統可以直接使用車長、炮手的作戰經驗,避免了對復雜的乘員決策行為進行分析和建模的過程,而且計算開銷小,實時性好。
2.2 規則庫的構建
自行高炮CGF實體在虛擬戰場中與對手作戰并不是隨意進行的,而是根據自行高炮作戰經驗的積累而已經形成的一些基本戰術原則,自行高炮乘員在防空作戰時一般基于這些規則選擇一定的戰術動作,并操縱高炮完成所選動作?;谝巹t的專家系統中,最根本的就是知識庫,也稱規則庫。規則庫由一條條戰術規則構成,戰術規則由軍事專家制定,包括產生戰術動作的產生條件和戰術動作。戰術規則的基本形式為:
3 人類決策行為模型實現
根據上節可知,車長和炮手決策行為的規則較為有序,本文以車長的決策行為為例,采用基于規則的專家系統對車長的決策行為模型進行建立,并給出相應的仿真實現,其中車長的決策行為模型主要為車長改變威脅度的決策行為模型。單炮搜索雷達能自動判決威脅度,采用的是V/D準則[9],并以此來定出1號、2號……威脅度。在實戰時有時需要攻擊按V/D準則確定的2號或其他號目標,而炮塔調轉只允許調往1號目標威脅度目標方位,為此需要人工改變威脅度號將要攻擊目標的威脅度改為1號威脅度[10]。
3.1 改變威脅度的時機分析
改變威脅度的時機與轉移火力的時機有密切的關系,在有上級的轉移火力指示時,按上級指示進行,當得不到上級指示時,則應根據當時的空情自行掌握。
本文通過對車長作戰行為進行分析,建立如下決策指標:是否接到上級轉移火力指示、目標是否被擊落、目標是否過捷徑點離遠飛行以及是否突然發現威脅更大的目標。根據指標體系建立的改變威脅度時機的行為規則如圖1所示。仿真開始后,首先判斷有沒有接到上級轉移火力的指示,若有,則放棄原威脅度為1的目標;若沒有,則判斷目標是否被擊落,若目標被擊落,則雷達利用V/D準則自動地對其余目標進行威脅度判斷;若沒有被擊落,則判斷目標是否過捷徑點遠離飛行,若目標已過航,則放棄原威脅度為1的目標;若沒有過航,則判斷車長是否發現對高炮威脅度更大的目標,若沒有發現,攻擊原威脅度為1的目標;若發現有威脅度更大的目標,則放棄原威脅度為1的目標,車長通過改變威脅度編號,使高炮攻擊改變威脅度后威脅度為1的目標,仿真結束。
3.2 車長改變威脅度的行為模型實例
將CGF實體放在綜合作戰環境中,訓練水平和個人性格特征差異體現在其具有不同的獲取和記憶能力。
在作戰環境中有的CGF實體會感到“疲勞”和“緊張”,而有的則不會,參加訓練的人員仿佛是“真人”或其控制的實體進行交互,從而提高了訓練的真實性和交互性。根據改變威脅度的戰術行為規則進行實例開發,考慮到決策行為對系統實時性、運算速度以及軟件的可移植性要求較高,故本文基于VC 6.0開發環境進行開發。圖2為某車長改變威脅度決策行為的實例應用。
圖1 改變威脅度的決策行為規則
某次仿真訓練中,由藍方武器節點生成4批目標,目標信息傳送到車長威脅度決策行為模型中,通過目標威脅度判斷,分別得到4批目標的威脅度,車長根據威脅度判斷的結果和戰場態勢來判斷最終要攻擊的目標批次。決策調節器來反映不同技能車長的決策效能,根據作戰技能和時間壓力的輸入值得出該車長的技能參數為2.055,時間壓力指數為0.48,即該車長具有一定的實戰經驗,在本次決策中時間壓力適中。決策中接到上級轉移火力的指示后,放棄原來威脅度最大的目標,轉而通過改變威脅度來攻擊上級指示的目標。
圖2 車長改變威脅度的決策行為模型實例
4 結 語
本文對自行高炮CGF中的人類行為建模進行了研究,首先分析了CGF人類行為模型的主要內容及其重要意義,針對當前人類行為建模存在的問題給出相應的解決方法。提出智能決策規則庫的構建方法,通過對自行高炮作戰規則的提取,采用基于規則的專家系統對車長的決策行為進行建模。
該方法避免了對復雜的乘員決策行為進行分析和建模的過程,而且計算開銷小,實時性好,對今后相關的研究工作具有較好的參考價值。
參考文獻
[1] 郭齊勝,楊立功,楊瑞平,等.計算機生成兵力導論[M].北京:國防工業出版社,2006.
[2] 楊立功,郭齊勝.計算機生成兵力研究進展[J].計算機仿真,2000,17(3):4?7.
[3] 薄濤.格斗空戰行為建模技術研究[D].長沙:國防科學技術大學,2002.
[4] 尹全軍.基于多Agent的計算機生成兵力建模與仿真研究[D]. 長沙:國防科學技術大學,2005.
[5] 連云峰.基于CGF技術的坦克排進攻戰斗行為建模與仿真研究[D].石家莊:軍械工程學院,2008.
[6] 梁冠輝.基于仿真平臺的自行高炮武器系統作戰效能評估方法研究[D].石家莊:軍械工程學院,2010.
[7] 孫少斌,陳璐,張仁友.基于智能體技術的CGF行為模擬研究[J].火力與指揮控制,2009,34(3):79?83.
[8] 熊會祥.自行高炮武器系統作戰指揮模擬訓練關鍵技術研究與應用[D].石家莊:軍械工程學院,2009.
[9] 孫珠峰,孫堯,黃文斌.計算機生成兵力定量化行為的調整模型[J].計算機工程,2005,31(3):158?160.
[10] 陳選社.PGZ95式25 mm自行高炮作戰指揮[D].鄭州:鄭州防空兵學院,2003.