王邑,孫金標,華玉光,王繼輝
(空軍指揮學院,北京100097)
基于Epsilon-Nash策略的動態武器-目標分配方法*
王邑,孫金標,華玉光,王繼輝
(空軍指揮學院,北京100097)
在大型任務規劃軟件的作戰單元任務分配中,搜索零和博弈問題的納什均衡點是求解任務分配的一種有效的方法。然而,納什均衡點在決策中并不一定總是存在且唯一,這造成了納什均衡策略在實際使用時具有較大的局限。通過采用Epsilon-Nash策略克服這種局限,并將其應用于自主空戰任務規劃系統中,通過仿真實驗,證實Epsilon-Nash策略具有近似于納什策略的效果。
戰術決策,武器-目標分配,Epsilon-Nash,博弈論
動態武器-目標分配問題(Dynamic Weapon-Target Assignment,WTA)是戰場指揮決策中的關鍵問題[1]。對該問題的求解,是很多武器任務規劃軟件的核心功能。
以博弈論為基礎的作戰指揮控制理論在戰場指揮決策中得到了廣泛的應用。在敵我雙方具有一定情報信息理解的前提下,通過構造對策矩陣,尋找博弈均衡點,來搜尋作戰收益最高的分配方案,是解決武器-目標分配問題的可行的方法。
博弈論中最常討論研究的博弈均衡為納什均衡(Nash Equilibirum),采用納什均衡解決任務規劃問題的時候,必須保證決策矩陣都有全局唯一的納什均衡點。這種決策矩陣博弈對策中存在且唯一的納什均衡點稱之為純納什均衡點,而據文獻[2],大多數非零和博弈對策矩陣不存在純納什均衡點,因此,在實踐中,必須考慮納什均衡點非唯一或不存在的情形。在理論探討中,通常采用混合策略(Mixed Strategy)[3],簡化決策矩陣[4]等方法來進行無純納什均衡點矩陣的決策。……