姜 彬
(南通航運職業技術學院 管理信息系, 江蘇 南通 226000)
?
偏微分方程最優控制中的變分迭代法應用
姜彬
(南通航運職業技術學院 管理信息系, 江蘇 南通226000)
首先使用極大值原理得到偏微分方程問題的最優性條件,然后使用變分迭代法求解Hamilton-Pontryagin方程,實現了偏微分方程最優控制問題的準確快速求解。結合兩個最優控制的經典實例,對模型和算法進行了仿真實驗,證明了該方法的可行性和有效性。
變分迭代法; 偏微分方程; 最優控制; 極大值原理
有很多實際的工業生產過程中的優化模型本質上是偏微分方程的最優控制問題。常微分方程的最優控制問題已經有了較為成熟的求解方法,而偏微分方程的最優控制問題由于計算復雜,偏微分方程往往不存在解析解等困難,在常微分方程里邊常見的經典分析方法不能夠完全適用[1]。因此,對偏微分方程最優控制問題的研究顯得很有意義。
基于常微分方程的最優控制問題已經有了很多有效的方法來進行求解,例如變分法、極大值原理、動態規劃[2-4]等。對于偏微分方程的最優控制,文獻[5]提出了基于Hamilton-Pontryagin方程的求解方法,文獻[6-8]通過導出偏微分方程的對偶方程,給出該類問題的最優性條件。雖然這些方法理論上可以應用,但往往由于數值求解的計算復雜性,使這些方法有很大的局限性。今年以來變分迭代法被廣泛地應用到偏微分方程的求解中,文獻[9]提出了一種變分迭代方式。文獻[10]證明了變分迭代法的解可以收斂于精確解。文獻[11]將傳統的參數攝動法和變分迭代法相結合,給出了一種改進的變分迭代公式。
文中在全面研究了變分迭代法理論的基礎上,從工業生產過程中抽象出一類偏微分方程最優控制問題,先推導出Hamilton-Pontryagin方程,在此基礎上采用變分迭代法來求解原偏微分方程和對偶的偏微分方程,并采用了參數的方法來表示偏微分方程的初始解和邊界條件。實驗表明,該方法能夠快速地逼近偏微分方程的真實解,從而簡化了計算過程。
我們考慮如下的偏微分方程最優控制問題:
(1)
初始條件為:
(2)
邊界條件為:
(3)
末端條件為
(4)
在一些問題中,末端條件也可以是自由的,根據所討論問題不同會有一些小的變化,這里討論更加一般的問題。
上面偏微分方程最優控制問題中,u(x,t)是控制量,y(x,t)是狀態變量,yt(x,t),yx(x,t),yxx(x,t)分別表示狀態變量對時間的導數、對空間的一階導數和二階導數。r是一個常數,表示對控制量懲罰的大小。α0,α1,β0,β1分別是常數。
對式(1)分析可知,我們希望在t∈[0,T],x∈[0,L]時,狀態量y(x,t)能夠盡量接近設定值yd,同時對控制量進行一定的懲罰。式(2)和式(3)分別是偏微分方程的初始條件和邊界條件。式(4)是終點約束。
根據極大值原理可以得出該最優控制問題最優解的必要條件。由極大值原理分析該問題可得到如下結論:
(5)
式中:p(x,t)——對偶狀態,可以由對偶方程得出。
極小化該哈密頓函數,即可得到最優解。
如果假設最優的控制律滿足如下的函數表達式:
(6)
那么可知:

(7)
最優的控制律和對偶狀態還滿足以下的對偶方程約束:
(8)
邊界條件為:
(9)
初始條件為:

(10)
式(8)的兩個偏微分方程,一個是原問題的偏微分方程,另一個是對偶的偏微分方程,可以看到它們很相似,但也有不同對偶方程有著自己的邊界條件和初始條件,對偶方程和原方程互相耦合在一起。所以,在求解的時候必須同時求解原方程和對偶方程。因此,要想利用最優性條件求解該問題就必須求解原偏微分方程和對偶的偏微分方程。
2.1變分迭代法
近年來對變分迭代法的研究很多,該方法被廣泛的用來求解偏微分方程取得了很好的效果。我們要使用變分迭代法來求解原偏微分方程和對偶偏微分方程。考慮如下的一個偏微分方程:
(11)
式中:Lt,Lx——微分算子;
N——非線性算子;
f(x,t)——普通的非線性函數。
由此,我們給出如下的變分迭代法的迭代公式:
(12)
上式中等式右邊第二項是校正項,λ是拉格朗日乘子,可以由變分理論最佳確定,yk是對微分方程解的第k次迭代時的近似。該方法通過給定一個初始解y0(x,t),然后通過不斷的迭代去修正這個初始解來逼近真解。函數y(x,t)的改變量為自變函數的變分,可以用δy(x,t)表示。
如式(12)是常見的變分迭代法的公式,但對于復雜的偏微分方程,該方法往往收斂速度較慢,甚至無法收斂到最優解。文中基于迭代優化的思想提出了雙層結構的變分迭代公式。考慮如下偏微分方程:
(13)

(14)
其中
由此可以得出,迭代表達式為
(15)
同時對其兩邊求變分,可以得到修正之后的表達式:
(16)
對式(16)兩邊同時求變分可知
(17)
由此可得拉格朗日乘子的駐值條件
(18)
令初始條件
(19)
由此可知,近似解yk(x,t)能夠通過迭代公式完全確定,最后可以確定該偏微分方程的近似解為:
(20)
2.2算法流程
首先要求解原偏微分方程和對偶偏微分方程,即式(8),根據式(16)可以給出如下的迭代表達式:
(21)
(22)
方程的近似解式(17)和式(18)必須驗證初始條件、邊界條件、橫截條件和最終狀態條件是否滿足。因此,提出了選擇這些零的近似作為獨立變量的多項式函數z和t,涉及未知參數被強加邊界和橫截條件。值得注意的是變分迭代法收斂到近似解選擇為零的近似,但所需的迭代次數達到這樣的精度取決于所選的零級近似[13]。
(23)
迭代次數也與所選最終的終止條件有關,在這里我們選擇這樣的一個終止條件。
(24)
式中:ε——一個可以自由確定的小數,可根據經驗來給定。
由此,給出變分迭代法求解該偏微分方程最優控制問題的算法流程:
1)令k=1,選擇初始解y0(x,t)和λx(τ)=λp(τ)=1。
2)依據變分迭代的公式,即式(17)和式(18)來計算出yk(x,t)和pk(x,t)。
3)檢驗yk(x,t)和pk(x,t)是否滿足邊界條件和初始條件,若不滿足,則返回步驟2)繼續修正迭代yk(x,t)和pk(x,t);若滿足,則進入下一步。

給出一個具體的偏微分方程最優控制問題,該問題是一個經典的控制問題,我們使用變分迭代法來求解。
考慮如下的最優控制問題:
r[u(x,t)]2dxdt



(25)
由此可得,該最優控制的哈密頓函數為:
(26)
由式(26)可知該問題的極值條件為
(27)
由式(27)可知

(28)
將式(28)代入式(26)可得
(29)
由對偶方程的表達式可知:
(30)
邊界條件為


(31)
初始條件為

(32)
使用變分迭代法來求解原偏微分方程和對偶偏微分方程,由變分迭代法的公式,即式(21)和式(22)可得:
(33)
(34)
對上式兩邊同時求變分可得:
(35)
(36)
對上式整理可得:
(37)
(38)
又因為
我們可得
(39)
由此可以得出關于拉格朗日乘子的約束:
(40)
由此可以解出λx(τ)=λp(τ)=1,將上式代入式(33)和式(34)中,可得
(41)
(42)
迭代所求的解必須滿足初始條件和邊界條件,對偶狀態也要滿足相應的約束,由此可以對其進行參數化處理。
(43)
經過兩次迭代,可以得到如下的結果:
(44)
迭代初始條件和邊界條件可得:
(45)
將邊界條件代入式(44),由此可以解得參數:
(46)
因此可得其近似解為
(47)
近似的最優控制
(48)
由此計算出適應值函數為:
(49)
之后的迭代過程與前面是一樣的過程,下面直接給出第6步迭代的結果,此時已經得到了最優解。
(50)
(51)

表1 適應值函數迭代變化過程
由表1分析可知,適應值的變化量是在逐步減少的,當小于預先設定值時,該算法終止,即得出最優解。
讓我們考慮如下的最優控制問題
(52)
考慮如下約束


由此可得該問題的哈密頓函數為:
(53)
由此得出狀態方程,協態方程和它們的邊界條件為:

x(x-1)p(x,t)=0

(54)
由此給出迭代的表達式為:
(55)
(56)
同理可知,我們還是要檢驗該方程是否滿足初始條件和邊界條件。若該解滿足微分方程的初始條件和邊界條件,則可以對其進行參數化表示:
(57)
該問題通過變分迭代法迭代5步即得到最優解,適應值函數迭代變化過程見表2。

表2 適應值函數迭代變化過程
由表2分析可知,適應值的變化量是在逐步減少的,當小于預先設定值時,該算法終止,即得出最優解。
最優狀態量隨時間空間的分布如圖1所示。

圖1 最優狀態量變化圖
由圖1分析可知,最優的狀態量能夠很好地跟蹤我們給出的設定值。
對偶狀態量隨時間空間的分布如圖2所示。

圖2 最優對偶狀態量變化圖
由圖2分析可知,最優的對偶狀態量能夠滿足初始條件和邊界條件。
最優的控制量隨時間和空間的分布如圖3所示。

圖3 控制量變化圖
由圖3分析可知,最優的控制量隨著時間的增大控制量要相應的增大,來達到最優的控制目標。
采用變分迭代法解決偏微分方程的最優控制問題。先由經典的極大值原理導出該問題的最優性條件,即Hamilton-Pontryagin方程導出最優性條件,然后給出適當的邊界和橫截性條件。為了求解這些方程,我們使用了全新的變分迭代法進行求解。
采用對近似解析解不斷迭代校正的方法來通過多項式函數逼近真實解。并且文中由兩個應用實例說明了該方法的有效性。下一步的研究方向是如何改進變分迭代法,使得該方法的收斂速度加快,能夠在較快的時間內收斂到真實解。
[1]EugeniuszZieniuk,Dominik.Parametricintegralequationssystemsin2Dtransientheatconductionanalysis[J].InternationalJournalofHeatandMassTransfer,2014,78(12):571-587.
[2]譚拂曉,劉德榮,關新平,等.基于微分對策理論的非線性控制回顧與展望[J].自動化學報,2014,40(1):1-15.
[3]HYe,FLiu,VAnh,etal.Maximumprincipleandnumericalmethodforthemulti-termtime-spaceRiesz-Caputofractionaldifferentialequations[J].AppliedMathematicsandComputation,2014,227(15):531-540.
[4]孫勇,張卯瑞,梁曉玲.求解含復雜約束非線性最優控制問題的改進Gauss偽譜法[J].自動化學報,2013,39(5):672-678.
[5]程建鋒,董新民,薛建平,等.基于Gauss偽譜法的飛機最優目標瞄準控制[J].計算機應用,2013,33(11):3291-3295.
[6]Penalty.MPQImethodforconstrainedparabolicoptimalcontrolproblems[J].InternationalJournalofComputerScience,2014,2(12):635-648.
[7]劉西林,王澤文,邱淑芳.基于Priwitt算子的偏微分方程圖像去噪模型[J].計算機應用,2013,32(12):3385-3388.
[8]郝巖,許建樓.迭代重加權的小波變分修復模型[J].電子與信息學報,2013,35(12):2916-2920.
[9]AndrejCherkaev.Variationalmethodforoptimalmultimaterialcompositesandoptimaldesign[J].InternationalJournalofEngineeringScience,2014,83(12):162-173.
[10]AsgharGhorbani,JafarSaberi-Nadjafi.AneffectivemodificationofHe’svariationaliterationmethod[J].NonlinearAnalysisRealWorldApplications,2009,10(5):2828-2833.
[11]陳學松,劉富春.一類非線性動態系統基于強化學習的最優控制[J].控制與決策,2013,12(3):20-23.
[12]汪友明,吳青,王文慶.偏微分方程的算子自定義小波解耦算法研究[J].計算機仿真,2013,30(2):261-264.
[13]SAKhuri,ASayfy.Variationaliterationmethod:Green’sfunctionsandfixedpointiterationsperspective[J].AppliedMathematicsLetters,2014,32(10):28-34.
Variation iteration method in optimal control ofpartialdifferentialequations
JIANG Bin
(Department of Management & Information Technology, Nantong Vocation & Technical Shipping College, Nantong 226000, China)
Themaximumprincipleisusedtogettheoptimalconditionsofpartialdifferentialequation,andthenvariationiterationmethodisappliedtosolvetheHamilton-Pontryaginequation.Withtwoclassicalexamplesofoptimalcontrol,themathematicalmodelandalgorithmsimulationshowthatitiseffectiveandfeasible.
variationiterationmethod;partialdifferentialequations;optimalcontrol;maximumprinciple.
2016-05-10
江蘇省教育科學“十二五”規劃重點資助課題(蘇教科規領[2015]1號); 南通航運職業技術學院院級課題(2013HYJY/18)
姜彬(1980-),男,漢族,江蘇如皋人,南通航運職業技術學院講師,碩士,主要從事人工智能與智能系統方向研究,E-mail:jiangb_nt@163.com.
10.15923/j.cnki.cn22-1382/t.2016.4.08
TP273
A
1674-1374(2016)04-0348-08