中圖分類號(hào):TP13 文獻(xiàn)標(biāo)識(shí)碼:A
Optimal Control for Discrete-time Singular Systems with Multiplicative Noise and Multiple Time Delays
KONG Xiangtong,QIU Yongxin,LIU Zhenbing,XIE Jing (School of Information and Control Engineering,Qingdao University of Technology,Qingdao 26652o,China)
Abstract: Due to the presence of the singular matrix in discrete-time singular systems, state variables cannot be directly updated,which makes the traditional optimal control method diffcult to apply directly. This paper investigates the finite-horizon linear quadratic optimal control problem for discrete-time singular systems with stochastic multiplicative noise and multiple input delays. To address this issue,the paper constructs an augmented matrix to transform the discrete singular stochastic system with multiple time delays into a standard discrete stochastic system while ensuring its regularity and causality. Then, based on the maximum principle,the optimal control conditions are derived,and the optimal control law and minimum cost function are obtained using coupled Riccati difference equations. Finally,simulation results demonstrate that under the influence of random disturbances and input delays,the proposed method effectively stabilizes the system state,verifying its effectiveness.
Keywords: discrete-time singular system; linear quadratic optimal control; multiple time delays; coupled Riccati difference equation
最優(yōu)控制理論在最省燃料控制系統(tǒng)、線性調(diào)節(jié)器、電力系統(tǒng)控制等方面應(yīng)用廣泛[1-4]。近年來(lái),研究者針對(duì)離散時(shí)間奇異系統(tǒng)的線性二次最優(yōu)控制問(wèn)題做了大量研究。WANGF等[5研究了具有乘性噪聲的離散時(shí)間奇異系統(tǒng)的有限時(shí)域LQ最優(yōu)控制問(wèn)題,在離散時(shí)間形式下為奇異隨機(jī)系統(tǒng)建立了最大值原理;LI H等[6]利用極大值原理研究了具有乘性噪聲和隨機(jī)系數(shù)的離散時(shí)間系統(tǒng)的LQ最優(yōu)控制問(wèn)題,提出處理含有隨機(jī)系數(shù)的正倒向隨機(jī)差分方程,為本文研究提供了重要參考。離散時(shí)間奇異系統(tǒng)由于包含奇異矩陣,使得其最優(yōu)控制問(wèn)題需要考慮正則性和因果性,所以求解過(guò)程更復(fù)雜[7]。針對(duì)離散奇異系統(tǒng)研究,ZHANG Y等[8研究了有限時(shí)域下離散奇異馬爾可夫系統(tǒng)的不定LQ最優(yōu)控制問(wèn)題,證明了在權(quán)重矩陣不定的情況下系統(tǒng)依然能夠達(dá)到最優(yōu)狀態(tài);FENGJ等[9研究了具有多重時(shí)滯的不確定隨機(jī)最優(yōu)控制問(wèn)題,將問(wèn)題轉(zhuǎn)換為標(biāo)準(zhǔn)不確定隨機(jī)系統(tǒng)上的最優(yōu)控制問(wèn)題,并基于遞推方程得到了相關(guān)問(wèn)題的最優(yōu)值,為處理奇異系統(tǒng)提供了解決方案。對(duì)帶有乘性噪聲和輸入滯后的離散時(shí)間奇異系統(tǒng)的最優(yōu)控制問(wèn)題進(jìn)行研究,可應(yīng)對(duì)系統(tǒng)面臨的滯后和外部干擾問(wèn)題,更有效地描述實(shí)際最優(yōu)控制問(wèn)題,并且相關(guān)研究尚不成熟。因此,本文對(duì)含有隨機(jī)乘性噪聲和多重輸入時(shí)滯的離散時(shí)間奇異系統(tǒng)的有限時(shí)域LQ最優(yōu)控制問(wèn)題進(jìn)行研究。
1系統(tǒng)描述
考慮以下具有多時(shí)滯的線性離散奇異系統(tǒng),其動(dòng)力學(xué)模型為
其中, x(k)∈Rm 為系統(tǒng)的狀態(tài)變量, xl 為系統(tǒng)初始狀態(tài), u(k)∈Rn 為系統(tǒng)的控制輸入;
,
,
且
,
均為常數(shù)矩陣。 ω (20是定義在完備概率空間 (Ω,F(xiàn),{Fk}k?k0,P) )上的一維布朗運(yùn)動(dòng)滿足 E(ωk+1∣Fk)=0 且
1。矩陣 E∈Rm×m 是奇異的且滿足 0
此外,矩陣 E,A(k),Ai(k),C(k) 滿足以下條件:
考慮有限時(shí)間性能指標(biāo)
其中,權(quán)重 L(k)∈Rm×m : Si(k)∈Rm×m 、 R(k)∈Rn×n 和 P(N+1) 均是對(duì)稱正定的。
假設(shè)1:系統(tǒng)矩陣 A(k),Ai(k),C(k) 和權(quán)重矩陣 L(k),Si(k),R(k) 均是一致有界 Fk-1 可測(cè)的,P(N+1) 為 FN 可測(cè)的。
問(wèn)題1:找到一個(gè)確定性的最優(yōu)控制器 u∈UN ,使得在滿足系統(tǒng)(1)的條件下性能指標(biāo)函數(shù)(2)最小為
UN={u={u(0),…,u(N)}∣u(k)∈Rn}
其中, u(k) 對(duì)于 k=0,1,…,N 是確定性的。
2等價(jià)變換
為了方便后續(xù)運(yùn)算,系統(tǒng)(1)等價(jià)為增廣系統(tǒng),即
其中, 。即:
同時(shí),有限時(shí)間性能指標(biāo)(2)等價(jià)為
其中,權(quán)重矩陣 為對(duì)稱正定矩陣, R(k)∈Rn×n , Q(k)∈Rm(h+1)×m(h+1) (20
定義 1[6] :如果 ,則
稱為正則。如果
是正則,且rank(det( zE (20號(hào)
,則對(duì)
稱為因果關(guān)系。如果 σ(E,A)?o(0,1) , o(0,1) 表示中心為原點(diǎn)的恒等圓的內(nèi)部,則 σ(E,A) 的值取決于
)的特征值 λ ,則該對(duì)
稱為穩(wěn)定。
定義 2[6] :如果離散時(shí)間奇異系統(tǒng) 同時(shí)是正則和因果系統(tǒng),則稱為正則和因果系統(tǒng)。如果系統(tǒng)是正則的、因果的和穩(wěn)定的,則稱離散時(shí)間廣義系統(tǒng)是可容許的。
假設(shè)2:假設(shè)矩陣 滿足下列等式:
系統(tǒng)(3)在矩陣 可逆的情況下成為一個(gè)標(biāo)準(zhǔn)的不確定隨機(jī)系統(tǒng)。接下來(lái)將研究
不可逆情況下的隨機(jī)奇異多時(shí)滯最優(yōu)控制問(wèn)題,建立不確定的隨機(jī)奇異系統(tǒng)(3)與標(biāo)準(zhǔn)不確定隨機(jī)系統(tǒng)之間的關(guān)系。
對(duì)于系統(tǒng)(3),假設(shè)存在兩個(gè)正交矩陣 U∈Rm(h+1)×m(h+1) L∈Rm(h+1)×m(h+1) 滿足
那么系統(tǒng)(3)受限系統(tǒng)等價(jià)于
由等式(6),系統(tǒng)的二次性能指標(biāo)(4)可等價(jià)表示為
其中, Q1(k)∈R(q+mh)×(q+mh) Q4(k)∈R(m-q)×(m-q),P1(N+1)∈R(q+mh)×(q+mh) ,以及
由正交矩陣 U 和 L ,式(5)相應(yīng)的等價(jià)變換為
根據(jù)等價(jià)變換(6),,得
,且
成立;根據(jù)等式(10)得 rank
,因此矩陣
是行滿秩。
由文獻(xiàn)[8]的引理1知,存在一個(gè)非奇異矩陣 ? 使 ,其中 Φ=
,其逆矩陣為
由非奇異矩陣Φ∈R(m-q+n)x(m-q+)定 定義如下非奇異線性變換
根據(jù)線性變換(11)可由等式(7)進(jìn)一步得到
將式(12)中第2個(gè)等式帶入式(12)的第1個(gè)等式,得
為了方便對(duì)代價(jià)函數(shù)進(jìn)行相應(yīng)的等價(jià)變換,借助式(7)的第2個(gè)等式可知
根據(jù)式(14),系統(tǒng)的二次性能指標(biāo)(8)表示為
由性能指標(biāo)函數(shù)(4)和(15)可知, 是列滿秩矩陣,因此結(jié)合文獻(xiàn)[10]可知,下列矩陣和
均是對(duì)稱正定的。
系統(tǒng)的二次性能指標(biāo)函數(shù)為
其中, 。且
其中,矩陣 是非奇異的,矩陣
是對(duì)稱正定的,因此矩陣
和矩陣
均為對(duì)稱且正定的。
通過(guò)式(13)得到一個(gè)標(biāo)準(zhǔn)的不確定隨機(jī)系統(tǒng)
問(wèn)題2:經(jīng)過(guò)上述等價(jià)變換后,問(wèn)題1相應(yīng)的變換為尋找一個(gè)確定性的最優(yōu)控制器 且 UN=
使得在滿足系統(tǒng)(17)的條件下二次性能指標(biāo)(16)最小。
3主要結(jié)果
為了得到最優(yōu)控制和最優(yōu)代價(jià)的顯式表達(dá)式,根據(jù)文獻(xiàn)[11]中引理2的結(jié)果,對(duì)系統(tǒng)(17)和二次性能指標(biāo)(16)應(yīng)用龐特里亞金極大值原理,得到伴隨方程和平橫條件為
為了進(jìn)一步討論,引入Riccati差分方程,當(dāng) k=N 時(shí)作如下定義
fj(N)=0j=1,2,…N
當(dāng) k=N-1,N-2,…0 時(shí),定義為
定理1:若假設(shè)1和假設(shè)2均成立,等式(24)中的矩陣 Y(k) 可逆,則問(wèn)題2是唯一可解的,且最優(yōu)控制器為
相應(yīng)的最優(yōu)二次性能指標(biāo)為
此外,系統(tǒng)狀態(tài) 與協(xié)狀態(tài) λ(k-1) 之間的關(guān)系為
證明:(必要性)數(shù)學(xué)歸納法得到最優(yōu)控制 、協(xié)狀態(tài) λ(k-1) 以及最優(yōu)代價(jià)函數(shù)的表達(dá)式。在假設(shè)2成立的條件下,現(xiàn)需要證明公式(24)中的矩陣 Y(k) 可逆。當(dāng) k=N 時(shí),變換后的二次性能指標(biāo)函數(shù)(16)表示為
取 時(shí),由系統(tǒng)狀態(tài)方程
,可得性能指標(biāo)的二次型
因?yàn)閱?wèn)題1具有唯一解,那么對(duì)于任意 ,有 J(N,N)gt;0 成立,因此 Y(N)gt;0 。將等式(18)中第三個(gè)等式帶人等式(18)的第1個(gè)等式,結(jié)合等式(20)可得
由式(31)推導(dǎo)得到 k=N 時(shí)最優(yōu)控制 為
將 帶入式(18)中第2個(gè)等式,結(jié)合(23)和(26)得到 k=N 時(shí)協(xié)狀態(tài)
因此,通過(guò)將等式(32)帶入式(33)得到
至此,當(dāng) k=N 時(shí),最優(yōu)控制 表達(dá)式和協(xié)狀態(tài) λ(N-1) 證明完成。
下面討論對(duì)任意 k=n 且當(dāng) 0?n 和協(xié)狀態(tài) λ(k-1) 的表達(dá)式。假設(shè)當(dāng) k? n+1 時(shí), Υ(N) 是正定的且最優(yōu)控制 表達(dá)式和協(xié)狀態(tài) λ(k-1) 分別滿足等式(27)和(29),接下來(lái)將證明當(dāng) k=n 時(shí)等式依然成立。
根據(jù)上述假設(shè)條件對(duì)當(dāng) k?n+1 時(shí),通過(guò)等式(17)和等式(18)得到如下等式
對(duì)等式(35)的兩邊從 k=n+1 到 k=N 加和可得
從而,有
取 時(shí),上述方程可簡(jiǎn)化為
,由于問(wèn)題2的解具有唯一性,那么對(duì)于任意非零的 u(n) ,得到 J(n,N)gt;0 ,也就是說(shuō) Y(n)gt;0 可逆。
當(dāng)任意 k=n 且 0?n 表達(dá)式為
由于假設(shè)對(duì) k?n+1 時(shí),等式(28)成立,因此得到下列等式
將等式(39)和等式 帶入等式(38),得到
通過(guò)對(duì)等式(40)進(jìn)行移項(xiàng)處理后得
為了獲得 k=n ( 0?n
同樣,由前面假設(shè)條件可知,對(duì) k?n+1 時(shí),等式(29)是成立的,因此可得:
將等式(43)帶入等式(42)中,得到
由等式(23)、(25)、(26)和(44)進(jìn)一步得到
(充分性)假設(shè) Y(n) 可逆,證明當(dāng)控制器按照式(27)設(shè)計(jì)時(shí),系統(tǒng)(17)的二次性能指標(biāo)函數(shù)的數(shù)學(xué)期望具有最小值。
首先定義一個(gè)函數(shù) VN(kξ1ξ2ξ3) ),其中 k∈[n,N] ,其形式為
同時(shí),得到 )的表達(dá)式為
通過(guò)將等式(47)和等式(46)做差可得
上述等式兩邊從 k=0 到 k=N 累加,得到
(204號(hào) (49)由于 Y(n) 是正定的,最優(yōu)控制器為
,任意 0?k
證畢。
4仿真算例
以2個(gè)旋轉(zhuǎn)質(zhì)量塊組成的系統(tǒng)為例,如圖1所示。該質(zhì)量塊的轉(zhuǎn)動(dòng)慣量分別為 J1 和 J2 ,角速度為 ω1 和 ω2 ,扭矩 M1 和 M4 由執(zhí)行器提供,而 M2 和 M3 為內(nèi)部扭矩。
根據(jù)文獻(xiàn)[4],考慮隨機(jī)擾動(dòng)下的系統(tǒng)模型(1),其對(duì)應(yīng)的系統(tǒng)向量為 ,u(k)=[M1M4]T ,系統(tǒng)擾動(dòng)噪聲 {ωk:k=0,1,2,…} 是均值為0且方差 σ=1 的白噪聲序列,初始條件x(0)=[2100]T ,x(—1)=[0.5-0.70.20.2]。該動(dòng)態(tài)系統(tǒng)的系數(shù)矩陣參數(shù)為
同時(shí),系統(tǒng)二次性能指標(biāo)函數(shù)中的加權(quán)矩陣取值為
通過(guò)定理1及等式(23),計(jì)算Riccati方程的解為
仿真結(jié)果如圖 2~5 所示。由圖2中5條完全獨(dú)立且隨機(jī)的乘性噪聲 ω(k) 可以看出,生成的隨機(jī)擾動(dòng)是符合設(shè)計(jì)預(yù)期的。圖3中展示的5條隨機(jī)擾動(dòng)下生成的控制輸入 u(k) 是由定理1求得,可以看出控制輸入在起始階段變化較大,但很快趨于穩(wěn)定,表明系統(tǒng)控制器能夠快速調(diào)節(jié)輸入,從而抑制狀態(tài)偏差將系統(tǒng)狀態(tài)迅速引導(dǎo)回期望的軌跡或目標(biāo)范圍,說(shuō)明設(shè)計(jì)的控制器是有效的,根據(jù)最優(yōu)控制得到最小代價(jià) min{JN}= 7.109 3。
圖4和圖5上下2部分圖像分別展示了閉環(huán)系統(tǒng)在5條隨機(jī)擾動(dòng)作用下的狀態(tài)軌跡 x1(k) 、 x2(k) 、x3(k) 和 x4(k) ,由圖4和圖5可以看出,在控制器的作用下,能夠克服乘性噪聲的干擾并且在較短的時(shí)間內(nèi)達(dá)到穩(wěn)定,說(shuō)明了該控制器具有較高的收斂速度和穩(wěn)定性,效果良好。
5 結(jié)束語(yǔ)
本文基于離散時(shí)間奇異系統(tǒng),研究了具有乘性噪聲和多重時(shí)間滯后的LQ最優(yōu)控制問(wèn)題。將問(wèn)題轉(zhuǎn)化為標(biāo)準(zhǔn)的LQ最優(yōu)控制問(wèn)題,通過(guò)隨機(jī)極大值原理求解了此類問(wèn)題最優(yōu)控制的表達(dá)式,最后借助仿真算例展示了所提出方法的有效性。接下來(lái)的研究重點(diǎn)是基于離散時(shí)間奇異系統(tǒng)下具有乘性噪聲和多重時(shí)滯的混合最優(yōu)控制問(wèn)題,通過(guò)2個(gè)控制器分別處理確定項(xiàng)和隨機(jī)擾動(dòng)項(xiàng),提高控制器的效率。
參考文獻(xiàn)
[1]劉曉童,趙紅,袁煥濤,等.基于等效燃油消耗的軌跡參考控制策略研究[J].青島大學(xué)學(xué)報(bào)(工程技術(shù)版),2022,37(3):68-73.
[2] 王瑩瑩,王冬青.基于卡爾曼濾波的二級(jí)倒立擺 LQR控制方法[J].青島大學(xué)學(xué)報(bào)(工程技術(shù)版),2015,30(3):21-26.
[3]閆海敬,楊倩,嚴(yán)天一,等.車輛半主動(dòng)懸架粒子群最優(yōu)控制策略研究[J].青島大學(xué)學(xué)報(bào)(工程技術(shù)版),2013,28(1):45-50.
[4]CHAVE-FUENTES JR,COSTA E F,TERRA M H,et al. The linear quadratic optimal control problem for discretetime Markov jump linear singular systems[J]. Automatica,2021,127:109506.
[5]WANG F,LIANGJ,WANGF. Optimal control fordiscrete-time singular systems with multiplicative-noise and inputdelay[C]// 10th Asian Control Conference(ASCC). Kota Kinabalu: IEEE,2015:1-6.
[6]LI H,LIX,F(xiàn)UM,etal.Deterministicoptimalcontrolfordiscrete-time systems with multiplicative noises andrandomcoefficients[J].Automatica,2023,150:110852.
[7]HUONG PT,PHAT VN.Suboptimalfinite-timecontrolof singularlarge scale discrete-time equations with delayed in-terconnections[J].European Journal of Control,2022,67:100701.
[8]ZHANG YQ,SHIP,AGARWALRK,et al. Event-based mixed H∞ and passive filtering for discrete singular stochas-tic systems[J]. International Journal of Control,202o,93(10):2407-2415.
[9]FENG J,CUI P,HOU Z. Singular linear quadratic optimal control for singular stochastic discrete-time systems[J].Optimal Control Applications and Methods,2013,34(5): 505-516.
[10]JORGE R CF,EDUARDOFC,MARCO H T,et al. The linear quadratic optimal control problem for discrete-timeMarkov jump linear singular systems[J].Automatica,2021,127:109506.
[11]QI QY,XIEL H,ZHANG HS,et al. Optimal control for stochastic systems with multiplecontrolers of diferent in-formation structures[J]. IEEE Transactions on Automatic Control, 2020,66(9): 4160-4175.