柴琴琴,林雙杰,林瓊斌
(1.福州大學電氣工程與自動化學院,福建福州350116; 2.福州大學先進控制技術研究中心,福建福州350116)
時滯系統終端時間參數優化控制
柴琴琴1,2,林雙杰1,林瓊斌1
(1.福州大學電氣工程與自動化學院,福建福州350116; 2.福州大學先進控制技術研究中心,福建福州350116)
針對時滯系統終端時間優化控制問題,提出一種基于參數化的數值求解方法.首先將優化控制向量用分段常數函數來近似;然后引入時間轉換方法將未知切換時間點和未知終端時間映射到新時間域的固定時間點上,從而將原未知時域的時間最優控制問題近似為固定時域的非線性規劃問題;最后采用全聯通粒子群算法求解.資源再生系統優化控制問題的仿真結果表明所提方法是有效的.
時滯系統;終端時間最優;控制參數化
隨著社會經濟的發展,時間長短成了衡量化工、生物、制藥、工業制造等過程和企業效益的重要因素[1-4],時間最優控制問題也成了亟需解決的現實問題.時間最優控制問題通常可描述為在滿足一定狀態變量約束的條件下,尋找最優控制變量和終端時間,使得目標函數值最優.這類優化控制問題很難采用極大值原理求解獲得解析解,只能采用數值方法來求解.常用的策略是首先用罰函數策略或Lagrange乘子處理約束條件,將約束優化控制問題轉化為無約束優化控制問題;再將時間進行網格劃分,在離散化時間區間上采用控制參數化方法將控制向量用分段函數來近似,其中分段函數參數代替原來的控制變量成為待求解的優化變量.至此,原帶約束的時間優化控制問題轉化為以在終端時間和分段函數參數為優化變量的高維非線性規劃問題.然而,未知終端時間仍給近似非線性規劃問題的求解帶來了困難,為此,文[5-7]提出控制參數化增強轉換方法,把未知控制時間和(或)分段函數切換點時刻均映射到一個新時間尺度的固定時間點上,從而將終端時間未知的優化控制問題轉化為終端時間已知的優化控制問題,然后采用現有的優化方法進行求解.該方法已成功應用于求解化工、航天等過程的時間優化控制問題[8-9].此外,文[10]針對復雜約束的最優控制問題提出一種分階方法來求解時間優化控制問題.然而上述方法主要針對非時滯系統設計,實際系統普遍含有時滯,現有數值求解方法在求解時滯系統時間優化控制問題方面具有局限性.為此,研究如何將參數化控制方法應用于求解時滯系統的時間優化問題.
考慮如下時滯系統:
其中:T>0為未知終端時間;x∈Rn為狀態向量;x(t-α)∈Rn為滯后的狀態向量;α為給定的時滯時間; u(t)∈Rm為系統未知控制向量;f∈Rn為給定的非線性系統函數;φ為0時刻以前系統狀態函數.假定函數f為連續可微函數,且φ為二次連續可微函數.
假定系統(1)~(2)滿足以下約束:
式中:Tmin、Tmax分別為未知終端時間變化的最小值、最大值;bi、ci,i=1,…,m,分別為第i個未知控制變化的最小值和最大值;gl為第l個狀態約束條件;Φl為給定非線性函數.則終端時間優化控制問題可描述為:
問題(P).給定系統(1)~(2),尋找滿足約束(3)~(5)的最優終端時間T和控制參數u使如下性能指標最優:
式中:Φ0為給定非線性函數,且式(5)、(6)中Φl具有如下統一形式,其中第一項表示終值項,第二項為積分項.
01N-1Niki=1,…,m為第i個控制變量在第k個區間段的分段時間函數高度;χ為指示函數,當t∈[τi-1,τi)時,
令σN=[σ1,…,σN]T,表示分段數為N時近似的分段函數高度矩陣,其中σk=[σ1k,…,σmk]T.
針對終端時間未知的問題,令:
首先將控制參數u在時間域[0,T]上用僅在分段點處可能不連續的分段常數函數來近似,該分段常數函數的高度值僅在分段點處發生改變.假定時間域[0,T]被均勻劃分為N段,則有:
其中:θ>0是未知的時間尺度參數.顯然當N為已知時,原未知的時間域[0,T]映射到了以s表示的新時間尺度上的固定時間域[0,N]上.則時間轉換后的控制變量為:
將式(9)~(10)代入原系統方程(1)~(2)中,有:
原系統約束條件(3)~(5)變為:
目標函數轉化為:
則自由終端時間控制問題(P)可近似為參數優化控制問題(P1).給定的系統(11)~(12),尋找合適的分段數N,滿足約束(13)~(15)的最優時間尺度參數θ和控制參數σN最小化目標函數(16).
顯然分段數目N的選取會影響求解效率及控制結果,理論上當N→+∞時問題(P1)的最優解將會收斂到原問題(P)的最優解[11],然而實際計算過程中不可能使得N→+∞.一方面,分段數目N可以通過優化方法來選取,考慮到分段數目N為整數,而時間及控制參數為正實數,若是一起進行優化,則優化問題將為一個混合整數動態規劃問題,求解困難.此外,隨著N值增加,優化問題維數成倍增長,實際過程中N往往不大.因此,在數值計算過程中,采用分層優化方法,外層優化分段數N,當N為已知時,內層求解問題(P1)的優化變量σN*、θ*,轉外層優化.重復上述過程直到目標函數值的變化滿足精度為止.對每個給定分段數N,近似優化控制問題(P1)是一系列子空間上的參數優化選擇問題,可采用數學規劃方法或啟發式算法求解.然而經過參數化處理后,原問題的未知積分時間隱含在了近似時間優化控制問題的時滯非線性系統中,使得時滯變為了未知.因此,目標函數對未知參數的梯度信息不僅與目標函數有關,還與時滯系統有關,很難直接采用導數法則求得.另一方面,粒子群算法具有簡單、快速及全局收斂等特點,已成功應用于許多高維約束優化問題的求解,針對維數災難問題本研究將采用具有啟發性的粒子群算法求解內層優化控制問題.
3.1 全聯通粒子群算法
粒子群算法中將候選解叫做粒子,所有粒子的集合稱作種群.粒子群算法中粒子通過對自身經驗和社會經驗(種群經驗)的學習不斷調整自己的位置和速度,從而更新種群直到找到最優結果為止.考慮到基本粒子群算法中粒子對單一鄰域內最優粒子經驗過分看重而導致重要信息丟失、甚至早熟的缺點,文[12]提出全聯通粒子群算法(fully informed particle swarm optimization,FIPSO).該算法中粒子的速度和位置按下式進行更新:
其中:p表示粒子群算法尋優過程中的第p次迭代;q,q=1,…,M表示種群中粒子編號,M為種群大小; λ=0.729 8為自身學習因子;ψ=ψ1+…+ψβ為鄰域學習因子,β為粒子的鄰域粒子個數;υp,q、Xp,q分別表示第p次迭代過程中第q個粒子的速度和位置,滿足邊界約束:
Pwq表示第q個粒子從鄰域中獲得的綜合信息其中:ωd∈[0,1]為權重系數;Pd,q為第q個粒子鄰域中第d個粒子的個體歷史最優位置
3.2 基于FIPSO的近似問題求解
粒子群算法只能用來求解僅帶優化變量邊界約束的約束優化問題,即只能處理邊界約束條件(14),對于含有復雜等式約束或狀態約束的近似參數選擇問題無法直接求解.為此,引入罰函數方法將狀態約束條件和其它約束條件轉化為目標函數的懲罰項,從而使優化問題轉化為FIPSO可以求解的形式.則問題(P1)可近似為全聯通粒子群算法近似求解問題(P2).給定的系統(11)~(12),尋找合適的分段數N及滿足約束(13)~(14)的最優時間尺度參數θ和控制參數σN最小化如下目標函數:
式中:ρl,l=1,…,r為給定的較大值正數,表示對違反第r個約束的優化變量的懲罰.
對于給定的N,基于FIPSO的近似問題求解,按如下步驟進行:
步驟1.給定粒子群算法參數:種群大小M、學習因子、權重因子、粒子鄰域、終止條件.
步驟2.初始化滿足式(13)~(14)種群PM、各個粒子速度和鄰域;令個體粒子歷史最優位置矩陣等于初始種群PM.對種群中的每個粒子執行步驟3.
步驟3.從s=0到s=N求解系統方程(11)~(12)獲得狀態向量x槇;代入公式(19)中求目標函數值.
步驟4.與歷史最優解相比更新個體粒子的歷史最優位置和種群最優位置.若種群最優解對應的目標函數值滿足要求或者迭代次數達到則停止優化轉步驟6,否則轉步驟5.
步驟5.按式(17)更新粒子速度和位置獲得新的種群,當粒子速度或位置超過約束(18)時取其邊界值.按步驟3求對應的目標函數值;轉步驟4.
步驟6.保存得到的最優解為σN*、θ*,對應的目標函數值為J(N,σN*,θ*)、θ*,最優解X*;增加分段數為N/.若分段數為N與N/所對應的目標函數值變化量小于精度要求則停止計算,否則轉步驟2.
其中:x為生物(魚類)總質量,kt;u為開采或捕撈力度,kt.漁業資源再生優化控制問題就是要在維持或超過當前資源規模的前提下,避免過度捕撈,在最短的時間內控制捕撈力度使得效益最大化.即在滿足如下資源約束條件:x(t)≥2,u(t)≥0,0.6≤T≤20(t∈[0,T])的基礎上,最小化代價方程[13]為:
考慮如下漁業資源再生變化模型[13-14]:
式(22)中第一項為終端時間相關目標函數,第二項為效益相關函數[14].
采用第3節的方法近似處理后的優化控制問題可描述為問題(P3).給定系統:
式中:ρ為懲罰系數.
采用Matlab編制求解程序,懲罰系數ρ=105.FIPSO參數選擇為:種群為30,迭代次數2 000次,鄰域中粒子數為6個,權重為1/6.當分段數N分別取2、4、5、8、9、10時,得到的最優目標函數分別為-11.158、-17.491、-25.679、-25.976、-26.160、-26.160.從該結果可看出,隨著分段數的增加,目標函數值減少明顯,當N≥9時,目標函數值變化小于0.001,達到預設精度要求,因此停止優化.N=9時,對應的最優時間為T=12.10,目標函數最優值為J=-26.16,狀態變量和控制向量如圖1和圖2所示.與文[13]結果T=12.24,J=-26.146相比,雖然采用參數化方法獲得的目標函數與文[13]的結果差不多,但最優控制時間更短.此外,從圖1和圖2中可看出控制參數的變化幅值不大,隨著時間的增長系統有趨于穩定的趨勢.
研究一類時變時滯系統終端時間優化問題,即針對給定時滯系統尋找合適的終端時間和控制向量使目標函數最小.針對時滯系統時間最優問題難直接求解的問題,提出基于控制參數化方法和全連通粒子群算法的數值近似求解方法,并用資源可再生優化控制過程的時間優化控制問題驗證了所提方法的有效性.
[1]王龍耀,王嵐.頭孢菌素C過濾過程中總過濾時間的優化與控制[J].化工學報,2013,64(9):3 256-3 261.
[2]劉澤明,張青斌,豐志偉,等.柔性空間結構時間-燃料多目標優化控制研究[J].宇航學報,2010,31(3):724-728.
[3]程國卿,胡金高.限速伺服系統的近似時間最優控制方案[J].西安電子科技大學學報(自然科學版),2015(1):180-186.
[4]YEBI A,AYALEW B.Optimal layering time control for stepped-concurrent radiative curing process[J].Journal of Manufacturing Science and Engineering,2015,137(1):011020(1-10).
[5]雷陽,李樹榮,張強,等.基于非均勻參數化的自由終端時間最優控制問題求解[J].系統科學與數學,2012,32(3): 277-287.
[6]李國棟,劉興高.一種求解最優控制問題的變時間節點控制向量參數化方法[J].化工學報,2015,66(2):161-167.
[7]LI R,TEO K L,WONG K H,et al.Control parameterization enhancing transform for optimal control of switched systems[J].Mathematical and Computer Modelling,2006,43(11/12):1 393-1 403.
[8]CHAI Q,LOXTON R,TEO K L,et al.A max-min control problem arising in gradient elution chromatography[J].Industrial and Engineering Chemistry Research,2012,51(17):6 137-6 144.
[9]郭尚生,楊榮軍,王良明.非均勻參數化方法在彈道優化中的應用[J].彈道學報,2013,25(1):37-41.
[10]張兵,杜文莉,顏學峰,等.時間最短控制問題求解的分級優化策略[J].華東理工大學學報(自然科學版),2007,33 (1):100-103.
[11]TEO K L,GOH C J,WONG K H.A unified computational approach to optimal control problems[M].Essex:Longman Scientific and Technical Publisher,1991:471-486.
[12]MENDES R,KENNEDY J,NEVES J.The fully informed particle swarm:simpler,maybe better[J].IEEE Transactions on Evolutionary Computation,2004,8(3):204-210.
[13]BOCCIA A,FALUGI P,MAURER H,et al.Free time optimal control problems with time delays[C]//Proceedings of the 52nd IEEE Conference on Decision and Control.Firenze:IEEE Publisher,2013:520-525.
[14]GOLLMANN L,KEM D,MAURER H.Optimal control problems with delays in state and control variables subject to mixed control-state constraints[J].Optimal Control Applications&Methods,2009,30(30):341-365.
(責任編輯:沈蕓)
Final time optimal control for time delay systems using control vector parameterization
CHAI Qinqin1,2,LIN Shuangjie1,LIN Qiongbin1
(1.College of Electrical Engineering and Automation,Fuzhou University,Fuzhou,Fujian 350116,China; 2.Research Center for Advanced Process Control,Fuzhou University,Fuzhou,Fujian 350116,China)
A class of final time optimal control problem for time delay systems is considered.A numerical solving method base on control vector parameterization is proposed.In this method,firstly,the control variables are approximated by piecewise constant functions.Then time scaling transformation is used to map the unknown final time and control switching times to fixed time points in a new time horizon.For this,the original final time optimal control problem on an unknown time interval is approximated by a series of nonlinear programming problems on a fix time interval.Finally,a fully informed particle swarm optimization method is then used to solve the approximated problem.Numerical results on a renewable resource optimal control problem demonstrate the effectiveness of the proposed method.
time delay system;final time optimal;control vector parameterization
TP13
A
10.7631/issn.1000-2243.2016.06.0779
1000-2243(2016)06-0779-05
2015-10-26
柴琴琴(1985-),講師,主要從事復雜過程建模、優化控制技術研究,qq.chai@fzu.edu.cn
福建省自然科學基金資助項目(2016J05154);福建省科技重大基金資助項目(2013Y4003);福州大學人才基金資助項目(XRC-1353)