肖遙 冮鐵強


摘? 要:該文結合了變分法和離散力學,提出一種新的半直接追逃問題的數值求解方法。首先利用變分法將微分對策問題轉化為含約束的最優控制問題,再結合離散力學理論將最優控制問題轉化為非線性規劃問題,最后使用序列二次規劃(SQP)方法進行數值求解。以小車追逃模型作為算例驗證了該方法的正確性。
關鍵詞:追逃問題? 變分法? 離散力學
中圖分類號:O3 ? ?文獻標識碼:A 文章編號:1672-3791(2020)02(c)-0213-02
20世紀50年代,Isaacs 等人首先提出了用微分對策求解追逃問題。但是微分對策問題的求解一直是一個難題,很多學者對于追逃問題的數值求解方法進行了大量的研究。徐光延等人[1]使用變分法將微分對策問題轉化為最優控制問題,再用偽譜法和SNOPT求解器計算最優解;針對三維無人機追逃問題,Conway等人使用間接法和遺傳算法求解[2],而對于導彈攔截問題,他們則提出了一種半直接非線性規劃算法(semi-DCNLP)進行了數值求解[3]。該文提出一種半直接的數值求解方法,先把問題轉化為最優控制問題,再結合離散力學理論將最優控制問題轉化為非線性規劃問題,最后使用序列二次規劃(Sequential Quadratic Programming,SQP)方法進行數值求解。
1? 微分對策問題的轉化
使用文獻[1]中的轉化形式,將微分對策問題轉化為最優控制問題。
(1)
s.t.
(2)
(3)
(4)
(5)
其中:下標P和E分別表示追方和逃方;ΦE和DE分別為目標函數的末值項和代價函數,為連續可微的標量函數; qE,qP∈Rn和uE,uP∈Rm分別為追逃雙方的狀態變量和控制變量;式(3)和式(4)為追逃雙方的狀態方程;t0和tf分別為給定的初始時刻終端時刻。
2? 離散力學和最優控制
離散力學最優控制方法(DMOC)[4]是求解最優控制問題的一種數值方法。
在離散的情況下,我們將固定時間間隔[t0,tf]以時間間隔h劃分為N個小區間[t0,t0+h],[t0+h,t0+2h],…,[t0+(N-1)h,t0+Nh],系統運動狀態q也每隔時間步長h進行采樣從而得到一系列的采樣點qk(t0+kh),k=0,1,2,…,N,使用中點法代替廣義坐標q,使用采樣點的差商代替廣義坐標。使用文獻[4]中的方法,將式(1)和(2)構成的最優控制問題轉化為:
(6)
(7)
(8)
(9)
其中f-k=f+k為統中含有摩擦力、耗散力或額外控制力等非有勢力的離散形式k=1,2,…,N-1。此時,式(6)~(9)就構成一個非線性規劃問題,利用計算機軟件很容易數值求解。
3? 基于離散力學的追逃問題的半直接數值解法
將追方極值條件式(4)~(5)離散:
(10)
(11)
其中HP,k為離散的哈密頓函數,FP,d為離散的狀態方程,k=1,2,…,N-1。此時,式(8)~(11)構成一個與微分對策問題(1)~(5)等價的非線性規劃問題。
4? 算例
考慮如圖1中的小車追逃模型。其中,下標P和E分別表示追方和逃方;F為小車的最大推力,θ為小車推力方向與X軸的夾角,(x,y)為小車位置坐標。
取qP=[xp,yp]T和qE=[xE,yE]T作為追逃兩只小車的狀態變量,取up=θp和uE=θE作為控制量;給定初始參數xp=0,yp=0,xe=500,ye=1000,θp=0,;為保證追方一定能追上逃方,則必有追方推重比大于逃方推重比,即,取=8,=3.5;采樣周期h=1,采樣次數N=100。使用第3節的方法建立模型,使用MATLAB軟件進行數值仿真(使用Control Toolbox中的fmincon函數,算法選擇SQP),數值仿真結果如圖2所示。可以看出,逃方采用轉向機動躲避追擊,而擁有速度優勢的追方做出相同的轉向機動并最終追上逃方,雙方的策略都是非常合理的。
5? 結語
該文創新提出使用基于離散力學的半直接數值解法求解了追逃問題。首先使用間接法將微分對策問題轉化為最優控制問題,再結合離散力學理論將問題轉化為非線性規劃問題進行直接優化求解。為了驗證方法的有效性,在第4節給出一個小車追逃的算例,在MATLAB中應用SQP方法進行數值求解和仿真。對仿真結果的分析表明,雙方都采用了合理的策略進行博弈。仿真結果表明了該文提出的方法是正確的、有效的。
參考文獻
[1] 徐光延,史光普.無人機三維追逃問題的半直接法求解[J].電光與控制,2017,24(10):27-31.
[2] CONWAY B A, PONTANI M. Numerical solution of the three-dimensional orbital pursuit-evasion game[J].Journal of Guidance, Control, and Dynamics,2009,32(2):474-487.
[3] CONWAY B A, PONTANI M. Optimal interception of evasive missile warheads: Numerical solution of the differential game[J].Journal of Guidance, Control, and Dynamics,2008,31(4):1111-1122.
[4] OBER-BLOBAUM S. Discrete Mechanics and Optimal Control[J].IAFC Proceedings Volumes,2005,38(1):538-543.