何德峰 韓 平 王青松
近年來,經濟模型預測控制(Economic model predictive control,EMPC)在工業界和學術界引起了廣泛關注[1-2].作為一種新近發展的先進控制技術,EMPC 有望成為解決復雜系統節能、降耗和增效優化控制問題的重要手段,目前已應用于能源、造紙、車輛等系統的能效優化控制[3-9].除具有常規模型預測控制 (Model predictive control,MPC)的顯式處理約束和多變量控制的優點外,EMPC 還能優化 “經濟”類目標函數,通常這類函數不是設定值跟蹤偏差的正定函數,而是系統狀態和控制變量的非凸或非正定函數[1-9].因此,把以設定值跟蹤偏差的正定函數為優化目標的常規MPC 稱為目標跟蹤MPC,而不以跟蹤偏差的正定函數為優化目標的MPC 統稱為經濟MPC[2].現有研究表明:經濟最優性目標與閉環系統的穩定性目標具有一定的沖突性[1-2],因此近年來EMPC 的穩定性綜合策略得到了廣泛研究.
為建立EMPC 關于經濟平衡點的穩定性,一種主要方法是構造基于經濟優化目標函數的Lyapunov 函數[5,10-17].例如,使用終端等式約束和強對偶性假設,定義經濟目標函數的旋轉代價函數并將其作為閉環系統的一個Lyapunov 函數[10],而引入廣義終端等式約束[15],建立了經濟性能變化下的遞推可行性與閉環系統的有界穩定性[11].進一步,采用嚴格耗散性條件、終端不等式約束和終端代價函數代替,降低了EMPC 穩定性綜合策略的保守性[12-13].在無終端約束EMPC 策略中,閉環軌跡在足夠長的預測時域情況下收斂到平衡點的鄰域[16-17].雖然無終端約束增大了閉環系統的吸引域,但長時域預測將大大增加了在線優化的計算負擔.進一步,EMPC穩定性和經濟性是一對存在沖突的控制目標[18-19],且穩定性和經濟性目標無法統一度量,難以通過權重標定.對此,從多目標優化控制角度,考慮非線性系統強對偶性或耗散性條件難以滿足情況,文獻[20-21]通過構造穩定性收縮約束,建立閉環系統關于最優經濟平衡點的漸近穩定性.
實際系統總是存在不確定擾動,現有EMPC 策略通常難以保證受擾系統的可行性和穩定性.對于目標跟蹤MPC,目前已有較多魯棒穩定性結果[22-32],主要包括本質魯棒MPC[22]、Tube 魯棒MPC[24-25]以及min-max MPC[26-32]等,其中min-max MPC 采用微分對策原理,在使最壞擾動輸入情況下系統的性能指標上界達到最小.相比于本質魯棒MPC和Tube 魯棒MPC,min-max MPC 能大大降低魯棒MPC 的保守性,但會增加優化問題的在線計算量[1].為降低min-max MPC 的在線計算量,文獻[30]采用仿射輸入結構,使MPC 含有抑制擾動的閉環成分和易于求解的開環優化.另一方面,輸入到狀態穩定性(Input-to-state stability,ISS)成為分析不確定系統魯棒穩定性的一個有效工具[23,27-32],并應用到了EMPC 魯棒性研究,如文獻[33-34]采用強對偶性假設和約束緊縮方法,證明了周期性擾動下線性系統EMPC 閉環收斂性,文獻[35]獲得了非線性系統EMPC 的有界穩定性結果,提高了經濟性能優化的靈活性,文獻[36]將穩定性目標和經濟性目標相加,證明EMPC 線性系統關于經濟目標的最大值是ISS 的,文獻[37]施加保證魯棒穩定性的顯式收縮約束,提出兩種非線性系統魯棒EMPC算法,文獻[38]提出Lipschitz連續非線性系統的隱式收縮魯棒EMPC 策略,提高了系統的平均經濟性能.
本文針對含有未知有界擾動的不確定非線性系統,提出一種新的具有遞推可行性以及ISS 保證的魯棒EMPC 策略.該策略明確考慮經濟最優性和魯棒穩定性控制目標的矛盾特點,采用微分對策原理在線滾動優化計算這對沖突目標的min-max 問題.離線計算最優經濟平衡點,并利用狀態與該平衡點的偏差定義魯棒穩定性目標函數,而經濟目標函數則由系統的經濟性能給定.通過特殊設計EMPC 優化問題的隱式收縮約束,并在魯棒穩定性目標優化問題中引入一個新約束,保證EMPC 優化的遞推可行性和閉環系統關于不確定擾動輸入的ISS.相比現有魯棒EMPC 策略,本文首先建立了約束非線性系統具有ISS 的魯棒EMPC 策略;其次,EMPC 遞推可行性和魯棒穩定性無需強對偶性或耗散性假設條件,從而擴大了魯棒 EMPC 的應用范圍;最后,采用微分對策原理得到了保守性更低的容許擾動上界.采用一個受擾非線性連續攪拌釜反應器(Continuous stirred tank reactor,CSTR)的仿真實例,驗證本文提出策略的有效性與優越性.
符號說明:Z+表示非負整數集,Ia:b表示集合{i ∈Z+:a ≤i ≤b,a ∈Z+,b ∈Z+},I≥j表示集合{i ∈Z+:i ≥j,j ∈Z+}.x+表示x的下一時刻狀態,|x|表示x的歐幾里得范數,‖x‖=sup{|x(k)|,k ∈Z+},x(i|k) 表示在第k時刻對未來第k+i時刻的預測變量.連續函數h1:R+→R+稱為K類函數系指該函數單調遞增,且h1(0)=0 ;函數h2:R+→R+稱為K∞類 函數系指該函數是K類函數,且當s →∞時,有h(s)→∞;函數h3:R+×R+→R+稱為KL函 數系指對于任意固定的t≥0,h3(·,t) 是K類函數,而對于任意固定的s>0,h3(s,·) 是單調遞減,且當t→∞時,h3(s,t)→0 .
考慮不確定離散時間非線性系統

其中,x(k)∈Rn,u(k)∈Rm,w(k)∈Rq和z(k)∈Rs分別表示系統在k時刻的狀態、控制輸入、擾動輸入和輔助輸出.假設f1(·),f2(·),f3(·)和g(·) 分別為定義在 Rn上的光滑函數,滿足f1(0)=0,f2(0)=0,f3(0)=0 以及g(0)=0 .系統(1) 在k時刻的狀態x(k)=φ(k;x0,u,w) 由初始狀態x0,控制序列u={u(0),u(1),···}和擾動序列w={w(0),w(1),···}表示.假設系統(1)的狀態完全可測,且系統狀態和控制輸入滿足約束

其中,集合X?Rn和U?Rm均為凸的緊集,且它們內部包含某些平衡點 (xe,ue) .
假設 1.擾動輸入w滿足如下約束

其中,W為包含平衡點 (xe,ue) 的緊集.滿足約束(3)的擾動稱為容許擾動.注意w表示參數不確定性、模型失配以及持續外部擾動等多種有界不確定性[29],其上界表示為‖w‖=sup{|wt|:wt∈W,t ∈Z+}.
考慮系統(1)的經濟性能函數Le:X×U →R,基于系統(1)的名義模型x+=f1(x)+f2(x)u離線計算如下最優經濟平衡點

不失一般性,后文假設系統(1)的最優經濟平衡點為原點.
下面介紹輸入到狀態穩定(ISS)相關理論,首先回顧魯棒不變集的概念.考慮一般離散不確定非線性系統x+=f(x,w) .
定義 1[27].考慮系統x+=f(x,w)和集 Θ?Rn,如果對于任意x∈Θ和w∈W,該系統滿足x+=f(x,w)∈Θ,則稱 Θ 為該系統的一個魯棒不變集.
定義 2[27].考慮系統x+=f(x,w) 及其內含原點的魯棒不變集 Θ?X,如果對于任意初始狀態x0∈Θ 及w∈W,存在K∞類函數α和KL類函數β使系統滿足

則該系統在 Θ 內是ISS 的.
引理 1[29].考慮系統x+=f(x,w) 及其內含原點的魯棒不變集 Θ?X,如果對于任意x∈Θ和w ∈W,存在連續函數V:Rn→R+滿足

其中,ξ1,ξ2和ξ3為K∞類函數,ρ1和ρ2為K類函數,則該系統在 Θ 內ISS,稱V為該系統的ISSLyapunov 函數.
注 1.由定義2 可知,當系統不受擾動或僅受衰減擾動作用時,系統最終在原點處漸近穩定;當受持續有界擾動作用時,系統有界穩定,且狀態軌跡最終收斂的范圍與持續擾動的上界有關.
本文目標是針對不確定非線性系統(1),通過極小化經濟性能函數在線計算魯棒EMPC 控制器,要求相應閉環系統滿足約束條件(2),且閉環系統的最優經濟平衡點相對于容許擾動(3)具有ISS.
考慮有限預測步長N∈I≥1,定義k∈Z+時刻的N步控制序列u(k)={u(0|k),u(1|k),···,u(N-1|k)}、擾動序列w(k)={w(0|k),w(1|k),···,w(N-1|k)}以及對應的預測狀態序列x(k)={x(1|k),x(2|k),···,x(N|k)},并且x(i|k)=φ(i;x(k),u(k),w(k)),其中x(k) 為當前時刻系統狀態.考慮系統(1)的經濟性能函數Le,定義N步經濟目標函數

其中,x(0|k)=x(k)
為計算魯棒EMPC 控制器,在每個時刻優化經濟目標函數(7).由于擾動的存在,在魯棒EMPC 中求解如下min-max 經濟最優控制問題:

其中,(u*(k),w*(k)) 為k時刻的經濟最優解,對應最優預測狀態序列x*(k) ;x(0|k)=x(k) 為初始條件;x(N|k)∈Ω 為終端狀態約束,終端約束集 Ω?X且內含原點;(8e)為待設計的魯棒穩定性收縮約束,λ∈[0,1) 為收縮因子.進一步定義如下關于最優經濟平衡點的魯棒穩定性目標函數:

其中,函數L:X×U →R+,Lw:W →R+和E:X →R+為連續有界函數.為書寫簡潔,令VR(x)=VR(x,u,w) .
假設 2.存在K∞類函數αl,αw和βw,使魯棒穩定性目標函數VR(x) 滿足:L(x,u)≥αl(|x|),?x ∈X,?u∈U;αw(|w|)≤Lw(w)≤βw(|w|),?w ∈W.
假設 3.在終端約束集 Ω 內存在局部反饋控制律u=π(x) 使 得π(x)∈U,?x ∈X和如下不等式成立:

其中,αf(|x|)≤E(x)≤βf(|x|),αf和βf為K∞類函數.
注意,局部控制律u=π(x) 可采用如H∞控制方法求解[26,30].為此,定義對稱矩陣

其中,P為對稱正定矩陣,I為單位矩陣.令R=R(0) .不失一般性,令擾動抑制水平γ=1 .
引理 2[30].假設矩陣P滿足Riccati 不等式方程

注 2.如果假設3 成立,則對于任意w∈W,Ω為閉環系統(13)的一個魯棒不變集,同時E(x) 為該系統在 Ω 內的一個ISS-Lyapunov 函數.文獻[30]給出了保證 Ω 魯棒不變性的一個充分條件,即容許擾動w的上界

其中,lx和lw分別為閉環系統(13)關于x和w的局部Lipschitz 常數,λmax和λmin分別為矩陣P的最大和最小特征值.如擾動w滿足式(15),則 Ω 為閉環系統(13)的魯棒不變集,且π(x)∈U,?x ∈Ω .
下面構造收縮約束函數η.令x(k)為當前時刻系統狀態,求解如下有限時域魯棒性最優控制問題
其中,(u*(i|k-1),w*(i|k-1)) 是 優化問題(8)在k-1 時刻最優解 (u*(k-1),w*(k-1)) 的 分量.將 (u*(k-1),w*(k-1))和(u0(k),w0(k)) 分別代入VR(x),據此定義函數

如果優化問題(8)在k時刻可行,則根據滾動時域控制原理,將u*(k) 的第1 個分量定義為魯棒EMPC 控制律,即u(k)=umpc(x(k))=u*(0|k),對應閉環系統為

計算魯棒EMPC 控制器的算法總結如下:
算法 1.魯棒EMPC 算法
步驟 1.初始化.設定N∈I≥1,λ ∈[0,1),λ1≥1,Le(x,u),L(x,u),Lw(w)和E(x) ;離線計算π(x)以及 Ω ;令k=0,考慮初始狀態x0,令η充分大;求解優化問題(8),得到經濟最優解 (u*(0),w*(0)),并將u*(0) 的首個分量u*(0|0) 作用于系統(1).
步驟 2.在k時刻,利用k-1 時刻經濟最優解(u*(k-1),w*(k-1)) 構 造(u1(k),w1(k)),更 新(16e);求解優化問題(16),得到當前時刻魯棒最優解 (u0(k),w0(k)) .
步驟 3.計算和,更新η;求解優化問題(8),得到當前時刻經濟最優解(u*(k),w*(tk)) .
步驟 4.將u*(k) 的首個分量u*(0|k) 作用于系統(1).
步驟 5.令k=k+1,測量系統(1)的狀態;返回步驟2.
為更清晰地描述算法1 的運行過程,圖1 給出了每個時刻兩個優化問題的求解順序.
由算法1和圖1 可知,在初始時刻k=0,由于約束(8e)不起作用,故在初始時刻無需求解優化問題(16),并可令η(x0,λ)→∞.

圖1 魯棒EMPC 算法運行過程示意圖Fig.1 A schematic diagram of the robust EMPC algorithm
閉環系統(19)具有ISS 性質的前提是需要保證算法1 具有遞推可行性,即兩個優化問題在每個時刻都至少存在一組可行解(不一定最優),使得對于任意容許擾動,經濟優化問題(8)和魯棒性優化問題(16)的所有約束均滿足.注意,(8b)~(8d)與(16b)~(16d)具有相同約束.
考慮約束不確定系統(1)~(3)和狀態τ=x(0|k)∈X.對于優化問題(8),定義N步可行控制序列集為

其中,N步擾動約束集WN=W ×W ×···×W.
定義 3.考慮系統(1)和狀態τ=x(0|k)∈X,如果可行控制序列集UN(τ) 非空,則稱τ為該系統的初始可行狀態.所有初始可行狀態τ的集合稱為系統的初始可行狀態集XN.
定理 1.如果假設1~3 成立,且容許擾動滿足式(15),則優化問題(16)具有遞推可行性.
證明.考慮序列對 (u1(k),w1(k)) 并代入系統(1)得到狀態序列x1(k)={x*(1|k-1),···,x*(N|k-1),x1(N|k)},其中x*(N|k-1)∈Ω 是對應于u*(k-1)的終端預測狀態.由假設3和注2 可知,Ω 是閉環系統(13)的魯棒不變集,故對于任意w1(N -1|k)∈W,u1(N -1|k)=π(x*(N|k-1))∈U和x1(N|k)=φ(N;x*(N|k-1),u1(N -1|k),w1(N -1|k))∈Ω 成立.利用序列對 (u1(k),w1(k)) 構造優化問題(16)在k時刻的備選解

其對應狀態序列x2(k)={x1(1|k),···,x1(N|k),x2(N|k)},其中x1(N|k)∈Ω.又 Ω 是魯棒不變的,則對于任意w2(N -1|k)∈W,u2(N -1|k)=π(x1(N|k))∈U和x2(N|k)=φ(N;x1(N|k),u2(N-1|k),w2(N -1|k))∈Ω 成立,因此約束(16b)~(16d)滿足.
再分別 將 (u1(k),w1(k))和(u2(k),w2(k)) 代入函數VR(x) 中,計算得
故約束(16e)滿足,從而 (u2(k),w2(k)) 為問題(16)在k時刻的可行解,即優化問題(16)具有遞推可行性.□
定理 2.如果假設1~3 成立,且容許擾動滿足式(15),則優化問題(8)具有遞推可行性.

故約束(8e) 成立.由定理1 可知,(u0(k),w0(k))作為優化問題(16)在k時刻的最優解滿足約束(8b)~(8d).因此,在k時刻總存在可行控制序列u0(k) 滿足優化問題(8)的所有約束,從而優化問題(8)具有遞推可行性.□
根據定理1和定理2,本文魯棒EMPC 策略中的雙目標優化問題皆具有遞推可行性.下面將基于定理1和定理2 給出閉環系統(19)的ISS 結果.
定理 3.如果假設1~3 成立,且容許擾動滿足式(15),則當優化問題(8)在初始時刻存在可行解時,閉環系統(19)在魯棒不變集XN內相對于擾動具有ISS.
證明.由定理1和定理2 可知,當優化問題(8)在初始時刻存在可行解時,該優化問題在任意k時刻都是可行的,則對任意x(k)∈XN和w(k)∈W,閉環系統(19)滿足x(k+1)∈XN.由定義3 可知,XN為閉環系統(19)的一個魯棒不變集.


成立.則聯立不等式(26),(32)和(36),由引理1 可知,值函數VN(x(k))為閉環系統(19)的一個ISSLyapunov 函數.因此,閉環系統(19)在XN內相對于擾動具有輸入到狀態穩定性.□
考慮不確定非線性連續攪拌釜反應器(CSTR)

其中,cA和cB分別為組分A和B的濃度,Q為反應器進料流量,cAf和cBf分別為進料中組分A和B的濃度,Δc為進料中組分A 濃度的不確定波動,體積V和反應動力學參數k0.當忽略進料中組分濃度的波動,該模型廣泛用于名義穩定EMPC 綜合策略的驗證[10,13,21].這里假設進料中組分A的濃度波動是有界的,用于驗證本文魯棒EMPC 的有效性.取模型參數[10]:cAf=1.0 mol/l,cBf=0,V=10 l和k0=1.2 l/(mol·min).
令 [cA,cB]T為系統狀態[x1,x2]T,Q為控制輸入u,w為擾動 Δc.進一步,定義狀態約束和控制約束

選擇采樣周期Ts=0.1 min,利用歐拉差分法離散化連續時間模型(37),得CSTR 非線性離散時間模型

其中,k為采樣時刻.定義CSTR 經濟性能指標[10]

進一步,為保證終端狀態集 Ω 的魯棒不變性,由式(15)計算容許擾動上界為0.143 6.
令預測步長N=5,仿真總步長Tsim=100,系數λ1=1,并考慮不同收縮因子λ∈[0,1) 的控制效果.選擇系統初始狀態x0=(0.15,0.7)T,仿真結果如圖2和圖3 所示,圖2 對應持續擾動w(k)=0.1436 sin(k/2)的仿真結果,圖3 對應衰減擾動w(k)=0.1436 exp(-k/10) 的仿真結果.分析圖2 可知,在持續擾動下,閉環系統最終在最優經濟平衡點附近有界穩定;分析圖3 可知,在衰減擾動下,閉環狀態軌跡漸近收斂于.根據圖2和圖3 可知,對于不同收縮因子λ∈[0,1),由算法1 得到的魯棒EMPC 控制器使得閉環系統在相對于容許擾動總是ISS 的,但不同λ對應的閉環狀態軌跡的動態響應不同.以衰減擾動w(k)=0.1436 exp(-k/10)為例,由圖3 可知,因子λ越小,閉環狀態軌跡的收斂過渡時間Ttr越短,具體數據如表1 最右列所示.

圖2 持續擾動 w (k)=0.1436 sin(k/2) 的仿真結果Fig.2 Simulation results under continuous disturbance w(k)=0.1436 sin(k/2)

圖3 持續擾動 w (k)=0.1436 exp(-k/10) 的仿真結果Fig.3 Simulation results under continuous disturbance w(k)=0.1436 exp(-k/10)
定義閉環系統T步平均經濟性能指標

取T=100,表1 給出了不同λ值對應的閉環系統平均經濟性能.分析表1 可以看出,因子λ越大,閉環系統平均經濟性能越好.這表明,無論是名義系統還是不確定系統,閉環系統的經濟最優性和穩定性是互相沖突的雙控制目標[10,21].在本文魯棒EMPC 策略中,可以通過調節收縮因子λ對經濟性控制目標和魯棒穩定性控制目標進行權衡,從而實現經濟性和魯棒穩定性綜合控制效果.

表1 平均經濟性能和收斂過渡時間Table 1 Average economic performance and transient time
進一步,為了驗證本文魯棒EMPC 策略(簡記為MM-EMPC)的優越性,對比文獻[38]中魯棒收縮EMPC 策略(簡記為RC-EMPC),研究不同容許擾動上界對系統穩定性的影響.對約束CSTR 系統(37)和(38),在系統參數相同情況下,RC-EMPC 策略容許擾動上界d1=0.0136,MM-EMPC 容許擾動上界d2=0.1436.選擇持續擾動w(k)=0.04sin(k/5),令初始狀態x0=(0.5,0.5)T,仿真步長Tsim=500.在相同仿真環境下,兩種魯棒EMPC 策略的控制結果如圖4 所示,其中,實線表示MM-EMPC 策略仿真結果,虛線表示RC-EMPC 策略仿真結果.

圖4 閉環狀態軌跡和控制輸入曲線Fig.4 Closed-loop state trajectorand control input profiles
從圖4 可以看出,MM-EMPC 策略對應的閉環狀態軌跡和控制輸入曲線均收斂于附近,而RC-EMPC 策略對應的閉環軌跡雖然收斂,但存在較大的穩態誤差,且MM-EMPC 閉環系統的動態響應更加快速.進一步,考慮衰減擾動w(k)=0.04 exp(-k/5),選擇4 個不同的初始狀態對兩種控制策略進行仿真對比分析,控制結果如圖5 所示.綜合圖4和圖5 分析可知,當容許擾動上界d ∈(d1,d2) 時,MM-EMPC 策略下的閉環系統相對于擾動是ISS 的,而RC-EMPC 卻無法保證閉環系統相對于擾動具有ISS,其中一個重要原因是RCEMPC 對大擾動會丟失遞推可行性.因此,相較于RC-EMPC 策略,本文策略在保證閉環系統ISS 同時,能夠獲得更大的容許擾動上界,從而降低魯棒EMPC 控制器的保守性.

圖5 不同初始狀態的閉環系統相軌跡Fig.5 Phase trajectories of the closed-loop system from different initial states
本文針對有界擾動下的約束不確定仿射輸入非線性系統,提出了一種新的魯棒EMPC 策略.基于微分對策原理分別對經濟目標函數和關于最優經濟平衡點的魯棒穩定性目標函數進行優化,利用得到的魯棒穩定性目標最優值函數構造隱式收縮約束,保證了雙控制目標優化問題的遞推可行性,并建立了閉環系統在最優經濟平衡點處相對于擾動的輸入到狀態穩定性結果.通過對不確定CSTR 經濟優化控制的對比仿真實驗,驗證了本文策略的有效性和優越性.
盡管基于微分對策的min-max 魯棒EMPC 在理論上能有效提高魯棒EMPC 的性能,但minmax 優化在線計算復雜,將阻礙魯棒EMPC 在快速響應系統中的應用.因此,降低min-max 魯棒EMPC 的在線優化計算量和設計更高效的魯棒EMPC 策略(如Tube 魯棒EMPC、本質魯棒EMPC 等)將是后續研究重點.