非線性系統(tǒng)自適應最優(yōu)切換控制方法

2023-10-30 10:13:34毛艷嶺

自動化學報 2023年10期

毛艷嶺富月

實際工業(yè)過程的被控對象大多是非線性的,比如電镕鎂砂熔煉過程的電極、鋼球磨煤機制粉過程的磨機等等.非線性系統(tǒng)結構復雜,往往難以得到精確的數(shù)學模型,其控制問題一直是控制領域相關學者和工程師的研究難點和熱點之一.

經(jīng)典的非線性控制方法,如反饋線性化方法[1-2],由于需要已知精確的數(shù)學模型,無法應用到實際的工業(yè)過程中.為了解決這個問題,文獻[3]針對具有全狀態(tài)約束的高階非線性隨機系統(tǒng),利用模糊邏輯系統(tǒng)逼近未知非線性函數(shù),提出了一種新的模糊自適應反步控制方法.文獻[4]在文獻[3]的基礎上,針對具有指數(shù)型性能函數(shù)的高階非線性隨機系統(tǒng),提出了基于模糊邏輯系統(tǒng)和反步法的模糊自適應有限時間跟蹤控制方法.當被控對象的非線性較弱或在某一平衡點附近運行時,通常采用近似線性模型進行描述,并針對該模型設計控制器.例如,文獻[5]利用遞歸近似理論,將非線性系統(tǒng)看作線性時變序列系統(tǒng)的極限,針對線性時變序列系統(tǒng)設計線性二次最優(yōu)序列控制器,從而實現(xiàn)原非線性系統(tǒng)的二次最優(yōu)控制.文獻[6]利用泰勒公式將非線性系統(tǒng)在某一平衡點附近表示為線性模型與高階非線性項的組合,將開環(huán)解耦補償器、非線性神經(jīng)網(wǎng)絡補償器和一步超前最優(yōu)加權自適應控制器結合,提出了非線性系統(tǒng)基于神經(jīng)網(wǎng)絡的自適應動態(tài)解耦控制方法.文獻[7]考慮到模型階次的不匹配問題,通過引入降階模型,采用帶死區(qū)的歸一化投影算法對線性模型參數(shù)進行辨識,利用高階神經(jīng)網(wǎng)絡估計高階非線性項,將帶有濾波器的極點配置自適應比例積分微分(Proportional integral derivative)控制器與神經(jīng)網(wǎng)絡補償器相結合,提出了非線性系統(tǒng)基于神經(jīng)網(wǎng)絡的自適應PID 控制方法.神經(jīng)網(wǎng)絡收斂速度較慢且容易陷入局部極小點,高階非線性項的估計精確度較低.為了解決這一問題,文獻[8]首次引入了控制器驅動模型和虛擬未建模動態(tài)的概念,基于線性控制器驅動模型構造一步超前最優(yōu)自適應控制器,結合虛擬未建模動態(tài)補償器,提出了非線性系統(tǒng)自適應切換控制方法.文獻[9]針對復雜的熱交換過程,設計了具有虛擬未建模動態(tài)補償?shù)囊徊阶顑?yōu)比例積分(Proportional integral)控制器,并提出了數(shù)據(jù)驅動的雙速率控制方法.上述控制方法雖然能夠取得良好的控制效果,但是當系統(tǒng)的非線性較強或平衡點發(fā)生變化時,這種只考慮單一平衡點的控制方法往往會使控制性能下降甚至導致整個系統(tǒng)失穩(wěn).

很多實際工業(yè)過程的平衡點都會隨著工況的不同而發(fā)生變化,比如電熔鎂砂熔煉過程的平衡點隨著原料成分和加料階段的不同會發(fā)生變化;鋼球磨煤機制粉系統(tǒng)中磨機的平衡點隨著原煤成分和濕度的不同而發(fā)生變化.本文針對一類具有M個平衡點的非線性系統(tǒng),研究基于多模型切換的自適應控制方法.多模型自適應控制方法一般用于改善系統(tǒng)的暫態(tài)性能或解決參數(shù)跳變系統(tǒng)的控制問題,如文獻[10]針對一類連續(xù)時間線性系統(tǒng),為改善系統(tǒng)的暫態(tài)性能,提出了基于直接模型參考自適應控制的多模型切換控制方法.文獻[11]針對一類參數(shù)跳變離散時間線性系統(tǒng),提出了基于間接自校正控制的多模型切換控制方法.文獻[12]針對一類參數(shù)跳變離散時間非線性系統(tǒng),通過引入k-差分算子,分別設計了線性自適應控制器和基于神經(jīng)網(wǎng)絡的非線性自適應控制器,通過兩個控制器之間的切換,可以提高系統(tǒng)的性能和穩(wěn)定性.為了避免不良切換行為,文獻[13]采用滯后切換邏輯消除了參數(shù)估計器對初始條件的依賴,通過利用魯棒線性時不變工具實現(xiàn)高性能的控制目標,結合控制器混合策略,提出了多模型自適應混合控制方法.針對文獻[13]所提方法需要模型數(shù)量大的問題,文獻[14]采用分離處理原則,充分利用所有辨識模型信息,采用二級自適應方法建立自適應控制器.為了消除系統(tǒng)非線性項對控制輸入應嚴格線性的限制,文獻[15]針對離散時間非線性系統(tǒng),采用極點配置控制方法,提出了由線性間接自校正控制器、基于神經(jīng)網(wǎng)絡的非線性間接自校正控制器和切換機制組成的多模型自適應控制器.很多研究將多模型自適應控制方法應用到實際系統(tǒng)中,并且取得了較好的控制效果.文獻[16]將多模型自適應切換控制方法應用于電力系統(tǒng)低頻振蕩中,建立了不同工況下的線性小信號模型,采用遞歸貝葉斯方法計算每個模型代表實際電力系統(tǒng)的概率,根據(jù)這個概率得到每個控制器輸出的占比權重,最終的控制輸出即為每個控制器輸出的概率加權平均值.文獻[17]針對動態(tài)特性隨不同負載狀態(tài)而變化的柔性傳送系統(tǒng),分別在不同負載狀態(tài)處建立線性模型,提出了基于閉環(huán)輸出誤差最小化的參數(shù)估計算法和基于極點配置的多模型自適應切換控制方法.文獻[18]以鋼球磨煤機制粉系統(tǒng)為例,針對一類具有多變量強耦合強非線性且動態(tài)特性隨不同運行條件而變化的復雜工業(yè)過程,將其在不同平衡點處用不同的線性模型和非線性未建模動態(tài)項組成的估計模型來描述,提出了由非線性解耦控制器、線性解耦控制器和多模型切換機制組成的智能解耦控制方法.文獻[19]針對串聯(lián)電容補償輸電線路的風力系統(tǒng)次同步諧振問題,采用傳統(tǒng)線性控制方法設計控制器,根據(jù)系統(tǒng)條件設計該控制器的監(jiān)控控制器,該方法之后被拓展到了雙饋異步發(fā)電機在串聯(lián)補償輸電系統(tǒng)中的次同步振蕩問題[20].上述多模型控制方法中,用于切換的控制器是針對單一時刻的性能指標設計的,具有次優(yōu)性,無法保證切換序列和控制系統(tǒng)的最優(yōu)性.

在實際工業(yè)生產(chǎn)過程中,保證控制系統(tǒng)性能最優(yōu)對實現(xiàn)工業(yè)過程整體優(yōu)化控制是至關重要的.本文針對具有未知動態(tài)和M個平衡點的連續(xù)時間非線性系統(tǒng),將嵌入轉換法和近似動態(tài)規(guī)劃技術相結合,提出了一種自適應最優(yōu)切換控制方法,一方面能夠保證切換序列的最優(yōu)性,另一方面可以實現(xiàn)控制系統(tǒng)的最優(yōu)性能,改善控制系統(tǒng)的動態(tài)品質.首先在非線性系統(tǒng)的M個平衡點附近采集M組輸入和狀態(tài)數(shù)據(jù),利用黎卡提方程的迭代求解公式和最小二乘方法得到針對每個線性模型的最優(yōu)控制器增益的估計,利用極小值原理得到M個近似線性化模型.然后利用嵌入轉換法將M個近似線性化模型嵌入到一個連續(xù)時間大系統(tǒng)中,通過二次規(guī)劃技術得到非線性系統(tǒng)的線性自適應最優(yōu)切換控制器和最優(yōu)切換序列.最后,將線性自適應最優(yōu)切換控制器和未建模動態(tài)補償器相結合,實現(xiàn)了控制目標.仿真實驗驗證了本文所提方法的有效性、優(yōu)越性和實際可應用性.

本文針對具有未知動態(tài)和M個平衡點的連續(xù)時間非線性系統(tǒng),提出了自適應最優(yōu)切換控制方法.主要創(chuàng)新點如下:

1)提出了由線性最優(yōu)切換控制器、切換準則和未建模動態(tài)補償器組成的控制器結構;

2)模型參數(shù)已知時,基于嵌入轉換技術提出了由M個模型、M個最優(yōu)控制器和切換準則組成的線性最優(yōu)切換控制器;

3)模型參數(shù)未知時,基于嵌入轉換技術和近似動態(tài)規(guī)劃思想提出了由M個近似線性化模型、M個自適應最優(yōu)控制器和切換準則組成的線性自適應最優(yōu)切換控制器.

1 問題描述

考慮由如下模型描述的具有M個平衡點的連續(xù)時間非線性非仿射系統(tǒng):

其中x(t)=[x1(t),x2(t),···,xn(t)]T是n維狀態(tài)向量,u(t)=[u1(t),u2(t),···,um(t)]T是m維控制輸入向量,f(x(t),u(t))=[f1(·,·),f2(·,·),···,fn(·,·)]T:Rn×Rm →Rn表示連續(xù)可微的未知非線性向量函數(shù).

本文的目標是針對具有M個平衡點的未知非線性系統(tǒng)(1),尋找最優(yōu)切換序列和自適應最優(yōu)切換控制律u(t),使得閉環(huán)系統(tǒng)漸近穩(wěn)定.

非線性非仿射系統(tǒng)結構復雜,很難直接根據(jù)它的模型設計控制器.通常的做法是將非線性系統(tǒng)在某一平衡點附近線性化,針對等價的近似線性模型設計控制器,從而實現(xiàn)對原非線性系統(tǒng)的有效控制,如文獻[4-5]等.為此本文將非線性系統(tǒng)(1)在M個平衡點附近泰勒展開,得到第i∈{1,2,···,M}個平衡點(xi,ui)附近的等價近似線性模型:

其中b是整數(shù),則系統(tǒng)(1)可表示為

其中σ(t)∈{1,2,···,M}表示切換信號.與此同時,本文所提出的控制器結構也包括兩部分,第一部分根據(jù)基于線性化模型建立的如下控制器設計模型進行設計:

第二部分根據(jù)線性化產(chǎn)生的建模誤差來設計,用于消除未建模動態(tài)影響,實現(xiàn)閉環(huán)系統(tǒng)漸近穩(wěn)定.在不引起混淆的情況下,接下來我們將簡化為.

2 自適應最優(yōu)切換控制器設計

2.1 參數(shù)已知時的最優(yōu)切換控制器

當Ai和Bi(i=1,···,M)已知時,我們提出了如圖1 所示的由線性最優(yōu)切換控制器、切換準則、未建模動態(tài)補償器以及非線性系統(tǒng)組成的控制系統(tǒng)結構,其中線性最優(yōu)切換控制器和切換準則根據(jù)控制器設計模型(4),利用嵌入轉換法[21]、極小值原理和二次規(guī)劃方法獲得;未建模動態(tài)補償器根據(jù)非線性系統(tǒng)狀態(tài)和最優(yōu)模型狀態(tài)之間的誤差設計.

圖1 Ai和Bi已知時的控制系統(tǒng)結構Fig.1 Control system structure whenAiandBiare known

首先令δ(σ(t)-i)在區(qū)間[0,1]內連續(xù)變化,利用嵌入轉換法將式(4)嵌入到一個連續(xù)時間大系統(tǒng)中.然后根據(jù)該嵌入式連續(xù)時間大系統(tǒng)的最優(yōu)控制問題:

其中δ(σ(t)-i)∈[0,1],Q、R為適當維數(shù)的參數(shù)矩陣且可觀,采用極小值原理和二次規(guī)劃方法得到切換準則函數(shù):

其中Pσ(t)根據(jù)如下黎卡提方程求解:

每一時刻,比較Jσ(t),選擇與最小的Jσ(t)對應的線性最優(yōu)切換控制律:

其中σ(t)為最優(yōu)切換序列,Kσ(t)表示線性最優(yōu)切換控制器的增益,通過下式求解:

接下來,為消除未建模動態(tài)對控制系統(tǒng)性能的影響,我們設計了如下未建模動態(tài)補償器:

其中a1∈Rm×n為可調參數(shù)矩陣,a2為可調參數(shù),em=x-x*為建模誤差,x*為最優(yōu)線性化模型σ(t)的狀態(tài).

綜上,Ai和Bi(i=1,···,M)已知時最優(yōu)切換控制律為:

注 1.線性最優(yōu)切換控制律和最優(yōu)切換序列推導過程見附錄A.

注 2.針對控制器設計模型(4),通過嵌入擴大δ(σ(t)-i)的取值范圍,令δ(σ(t)-i)在區(qū)間[0,1]內連續(xù)變化,將由多個近似線性模型組成的式(4)嵌入到一個連續(xù)時間大系統(tǒng)中;通過轉換將針對控制器設計模型(4)的最優(yōu)切換控制問題轉化為針對該嵌入式連續(xù)時間大系統(tǒng)的最優(yōu)切換控制問題.

2.2 參數(shù)未知時的自適應最優(yōu)切換控制器

當Ai和Bi(i=1,···,M)未知時,無法通過式(7)得到Pσ(t),無法得到如式(6)所示的切換準則函數(shù)和式(8)所示的線性最優(yōu)切換控制律.為解決這一問題,本文提出了一種自適應最優(yōu)切換控制方法.首先在非線性系統(tǒng)的M個平衡點附近采集M組輸入、狀態(tài)數(shù)據(jù),利用黎卡提方程的迭代求解公式和最小二乘算法得到針對線性化模型σ(t)的自適應最優(yōu)控制器增益以及黎卡提方程近似解,并根據(jù)貝爾曼方程得到Pσ(t)Aσ(t)的估計,從而得到M個平衡點附近的M個線性化模型;然后將M個線性化模型嵌入到一個連續(xù)時間大系統(tǒng)中,針對該嵌入式連續(xù)時間大系統(tǒng)基于極小值原理和二次規(guī)劃技術設計線性二次型最優(yōu)控制律,進而得到最優(yōu)切換序列和線性自適應最優(yōu)切換控制律;最后將線性自適應最優(yōu)切換控制律和未建模動態(tài)補償器相結合應用到非線性系統(tǒng)中,實現(xiàn)對未知動態(tài)非線性系統(tǒng)的自適應最優(yōu)切換控制.

針對控制器設計模型(4),當Ai和Bi(i=1,···,M)已知時,根據(jù)Kleinman 定理[22],很容易得到如下推論:

推論 1.令Kσ(t),0∈Rm×n為針對線性化模型σ(t)的穩(wěn)定反饋控制器增益矩陣,Pσ(t),k為下面李雅普諾夫方程的對稱正定解:

其中δ(σ(t)-i)∈{0,1}且,k=1,2,···表示迭代次數(shù),Kσ(t),k滿足

則Kσ(t),k和Pσ(t),k分別收斂于針對線性化模型σ(t)的最優(yōu)控制器增益Kσ(t)和黎卡提方程解Pσ(t),即

定理 1.針對控制器設計模型(4),當Ai和Bi(i=1,···,M)未知時,使性能指標

最小的切換準則函數(shù)為:

其中Θσ(t),和Ξσ(t)的定義見后文,vec(C)是把m×n維矩陣C按列的順序一列接一列地組成的mn維向量,?代表克羅內克積,

線性自適應最優(yōu)切換控制律為:

其中σ(t)為與最小的Jσ(t)對應的最優(yōu)切換序列.

證明.首先根據(jù)離線采集的M組輸入、狀態(tài)數(shù)據(jù),計算針對線性化模型σ(t)的自適應最優(yōu)控制器增益以及黎卡提方程近似解.受文獻[23]啟發(fā),將式(4)等價表示為:

其中Aσ(t),k=Aσ(t)-Bσ(t)Kσ(t),k.根據(jù)式(12)和式(13),沿著式(20)的解,可以得到

由克羅內克積的定義,可知

其中,In表示n維單位矩陣.定義如下運算

對于正整數(shù)l,定義矩陣

其中0≤t0＜t1＜···＜tl.由式(22)和式(23)可知,式(21)可等價表示為:

當Θσ(t),k為列滿秩矩陣時,

由此,可以得到線性化模型σ(t)第k次迭代的自適應最優(yōu)控制器增益Kσ(t),k+1.

接下來,針對線性化模型σ(t)求解矩陣Pσ(t)Bσ(t)和Pσ(t)Aσ(t)的估計,從而得到M個平衡點附近的M個線性化模型.當Ai和Bi已知時,易知

因此,Ai和Bi未知時,若記Lσ(t)為Pσ(t)Bσ(t)的估計,則

Pσ(t)Aσ(t)的估計可根據(jù)線性化模型σ(t)的貝爾曼方程得到,易知

將式(27)代入上式,利用離線采集的第σ(t)組輸入、狀態(tài)數(shù)據(jù),通過求取最小二乘解可以得到如式(18)所示的矩陣Pσ(t)Aσ(t)的估計Nσ(t).根據(jù)Dσ(t),Nσ(t)以及,可以很容易得到M個平衡點附近的近似控制器設計模型:

最后求取最優(yōu)切換序列和線性自適應最優(yōu)切換控制律.針對模型(29),應用嵌入變換法,使δ(σ(t)-i)在[0,1]內連續(xù)變化,為此令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T并記1,δ(σ(t)-i)≥0}.定義哈密頓函數(shù):

易知,針對嵌入式近似控制器設計模型的最優(yōu)控制律為:

將式(31)代入式(30),化簡可得

下面將δ(σ(t)-i)作為決策變量,通過最小化H(x,δ),可以得到最優(yōu)切換序列.

實際上,選擇δ(σ(t)-i)使H(x,δ)最小等價為使式(33)最小

這是一個二次規(guī)劃問題,由于W是凸集,是凹函數(shù),該問題的全局極小值一定在δ(σ(t)-i)∈{0,1}取得[21],且該全局極小值對應的σ(t)即為最優(yōu)切換序列.由此可以得到如式(16)的切換準則函數(shù)和式(19)的線性自適應最優(yōu)切換控制律.

注3.由式(27)可知Lσ(t)的估計精度由的估計精度決定.由文獻[23]易知,收斂于參數(shù)已知時的最優(yōu)控制器增益Kσ(t),因此Lσ(t)收斂于Pσ(t)Bσ(t).由式(28)可知Nσ(t)的估計精度由最小二乘估計算法的精度和的估計精度共同決定.

注4.在每個平衡點附近,如果存在正整數(shù)l0,使得對于任意l≥l0,都有mn,即矩陣Θσ(t),k是滿秩的,那么序列和分別收斂到黎卡提方程的解Pσ(t)和最優(yōu)控制器增益Kσ(t)[23].

未建模動態(tài)補償器的設計與線性模型參數(shù)已知時的情況類似,即

其中a1∈Rm×n為可調參數(shù)矩陣,a2為可調參數(shù),為建模誤差,為最優(yōu)線性化模型σ(t)的狀態(tài).

綜上,Ai和Bi(i=1,···,M)未知時自適應最優(yōu)切換控制律為:

自適應最優(yōu)切換控制器設計流程如圖2 所示.

圖2 自適應最優(yōu)切換控制器設計算法流程Fig.2 Flow chart of adaptive optimal switching control algorithm

3 仿真實驗

為了驗證本文所提方法的有效性,我們分別進行了模型參數(shù)已知時最優(yōu)切換控制和模型參數(shù)未知時自適應最優(yōu)切換控制的數(shù)值仿真實驗,并分別與單一的針對一個模型的最優(yōu)控制器和自適應最優(yōu)控制器進行了對比.除此之外,為了驗證本文所提方法的實際可應用性,我們進行了模型參數(shù)未知時雙容水箱液位系統(tǒng)的自適應最優(yōu)切換控制仿真實驗.

3.1 參數(shù)已知時最優(yōu)切換控制數(shù)值仿真實驗

考慮如下連續(xù)時間非線性系統(tǒng):

其中x=[x1,x2]T∈R2是狀態(tài)向量,u=[u1,u2]T∈R2是輸入向量.

我們的目標是針對已知的非線性系統(tǒng)(36),尋找最優(yōu)切換序列和最優(yōu)切換控制律,使得閉環(huán)系統(tǒng)漸近穩(wěn)定.為此,首先分別將u=[u1,u2]T=[-3,10]T,[-2,10]T和[-1,10]T施加到非線性系統(tǒng)(36)上,并令得到非線性系統(tǒng)(36)的三個平衡點,即 [ur1,ur2,xr1,xr2]T=[-3,10,-4.4685,0.5592]T,[-2,10,-4.2642,0.7565]T和 [-1,10,-4.0264,1.1119]T.將式(36)分別在上述三個平衡點處泰勒展開,并令δ(σ(t)-i)∈{0,1}且i)=1,可以得到非線性系統(tǒng)(36)在3 個平衡點附近的控制器設計模型:

其中

接下來給定隨機初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,并選擇控制器參數(shù)矩陣

和未建模動態(tài)補償器參數(shù)

最后將最優(yōu)切換控制器(6)～(11)加入到系統(tǒng)(36),得到如圖3 所示的狀態(tài)曲線,如圖4 所示的控制輸入曲線和如圖5 所示的最優(yōu)切換序列.結合圖3和圖4,在t=50 s和t=100 s時,雖然系統(tǒng)的平衡點發(fā)生變化,但是采用本文提出的最優(yōu)切換控制方法仍能夠將狀態(tài)很快調節(jié)到平衡點附近并保持不變.

圖3 采用最優(yōu)切換控制器時系統(tǒng)的狀態(tài)Fig.3 State curves of the system when using the optimal switching controller

圖4 采用最優(yōu)切換控制器時系統(tǒng)的控制輸入Fig.4 Input curves of the system when using the optimal switching controller

圖5 采用最優(yōu)切換控制器時系統(tǒng)的最優(yōu)切換序列Fig.5 Optimal switching sequence of the system when using the optimal switching controller

為了驗證本文所提最優(yōu)切換控制方法的優(yōu)越性,我們與單一的針對一個模型的最優(yōu)控制方法進行了對比實驗.以針對平衡點[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型為例,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,選擇控制器參數(shù)矩陣如式(38)所示,未建模動態(tài)補償器參數(shù)如式(39)所示.

圖6和圖7 分別為所得到的狀態(tài)曲線和控制輸入曲線.根據(jù)圖6 和圖7 可以看出,針對平衡點[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型設計的控制器只能將狀態(tài)調節(jié)到對應的平衡點附近.當平衡點發(fā)生變化時,系統(tǒng)的狀態(tài)存在穩(wěn)態(tài)誤差.但是由于平衡點的變化引起的建模誤差可近似為常數(shù),因此狀態(tài)曲線雖然偏離平衡點但恒定不變.

圖6 采用最優(yōu)控制器時系統(tǒng)的狀態(tài)Fig.6 State curves of the system when using the optimal controller

圖7 采用最優(yōu)控制器時系統(tǒng)的控制輸入Fig.7 Input curves of the system when using the optimal controller

3.2 參數(shù)未知時自適應最優(yōu)切換控制數(shù)值仿真實驗

本節(jié)的目標是針對未知非線性系統(tǒng)(36),尋找最優(yōu)切換序列和自適應最優(yōu)切換控制律,使得閉環(huán)系統(tǒng)漸近穩(wěn)定.不失一般性,這里我們以兩個平衡點為例進行仿真實驗.結合圖2,首先分別在平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T和[ur1,ur2,xr1,xr2]T=[2,10,-2.5517,3.6570]T附近施加激勵輸入信號,即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態(tài)數(shù)據(jù),計算δxx,Ixx,Ixu.選擇控制器參數(shù)矩陣

終止循環(huán)的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數(shù).根據(jù)式(17)分別得到針對兩個模型的,即:

然后利用所采集的輸入和狀態(tài)數(shù)據(jù)求解式(18),分別得到針對兩個模型的Nσ(t),即:

最后,根據(jù)式(29)可以得到兩個線性化模型如下式所示:

將兩個線性化模型嵌入到一個連續(xù)時間大系統(tǒng)中,結合圖2,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4,0]T和初始時間t0=0 s,設置tmax=100 s,選擇未建模動態(tài)補償器參數(shù)

將自適應最優(yōu)切換控制器(35)加入到非線性系統(tǒng),當滿足t≥tmax時,可以得到如圖8 所示的狀態(tài)曲線,如圖9 所示的控制輸入曲線和如圖10 所示的切換序列.在t=50 s,由于平衡點突變,切換序列發(fā)生改變,導致系統(tǒng)的狀態(tài)震蕩,經(jīng)過1.8 s 的調節(jié)時間,系統(tǒng)的狀態(tài)被調節(jié)到平衡點附近并保持不變.

圖8 采用自適應最優(yōu)切換控制器時系統(tǒng)的狀態(tài)Fig.8 The state curves of the system when using the adaptive optimal switching controller

圖9 采用自適應最優(yōu)切換控制器時系統(tǒng)的控制輸入Fig.9 The input curves of the system when using the adaptive optimal switching controller

圖10 采用自適應最優(yōu)切換控制器時系統(tǒng)的切換序列Fig.10 The switching sequence of the system when using the adaptive optimal switching controller

為了驗證本文所提自適應最優(yōu)切換控制方法的優(yōu)越性,我們以平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T為例,與單一的針對一個模型的自適應最優(yōu)控制方法進行了對比實驗.選擇控制器參數(shù)矩陣如式(40),根據(jù)式(17)和式(18)可以得到和N1分別如式(41)和式(42)所示,根據(jù)式(29)可以得到線性化模型如式(43)所示,選擇未建模動態(tài)補償器參數(shù)如式(44)所示.所得到的狀態(tài)曲線和控制輸入曲線如圖11 和圖12 所示.從圖11 和圖12 可以看出,針對平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T設計的自適應最優(yōu)控制器只能將狀態(tài)調節(jié)到對應的平衡點附近.與模型參數(shù)已知時情況相同,當t=50 s時,平衡點發(fā)生變化,系統(tǒng)狀態(tài)存在穩(wěn)態(tài)誤差.但是由于平衡點的變化引起的建模誤差可近似為常數(shù),因此狀態(tài)曲線雖然偏離平衡點但恒定不變.

圖11 采用自適應最優(yōu)控制器時系統(tǒng)的狀態(tài)Fig.11 State curves of the system when using the adaptive optimal controller

圖12 采用自適應最優(yōu)控制器時系統(tǒng)的控制輸入Fig.12 Input curves of the system when using the adaptive optimal controller

3.3 參數(shù)未知時雙容水箱液位系統(tǒng)的自適應最優(yōu)切換控制仿真實驗

為了進一步驗證所提方法的實際可應用性,接下來針對如圖13 所示的雙容水箱液位系統(tǒng)進行仿真實驗[24].它主要由水池、水泵1、水泵2、水罐1 和水罐2 及兩個液位傳感器組成.水泵1 和水泵2 分別將水池中的水經(jīng)過橡膠管抽取到水罐1 和水罐2 中,兩個水罐底部存在漏水孔,水罐1 中的水經(jīng)過漏水孔流入水罐2,水罐2 中的水經(jīng)過漏水孔流入水池,形成閉環(huán).

圖13 雙容水箱結構Fig.13 Structure of the coupled-tank

根據(jù)物料平衡原理,建立雙容水箱液位系統(tǒng)的機理模型:

其中x1和x2分別表示水罐1 和水罐2 的液位,u1和u2分別表示水泵1 和水泵2 的電壓,Kp1、Kp2、Ao1、Ao2、At1、At2和g的含義及取值如表1 所示.

表1 模型中涉及的符號含義及取值Table 1 The symbol meaning and value involved in the model

我們的目標是針對雙容水箱液位系統(tǒng)(45),尋找最優(yōu)切換序列和自適應最優(yōu)切換控制律,使系統(tǒng)的液位漸近穩(wěn)定.為此,首先分別將u=[u1,u2]T=[6.5,4]T和[8,4]T施加到雙容水箱液位系統(tǒng)(45)上,并令得到雙容水箱液位系統(tǒng)(45)的兩個平衡點,即[6.5,4,14.17,25.2]T和[8,4,11.2,21.17]T.結合圖2,分別在兩個平衡點附近施加激勵輸入信號,即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態(tài)數(shù)據(jù),計算δxx,Ixx,Ixu.選擇控制器參數(shù)矩陣

終止循環(huán)的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數(shù).根據(jù)式(17)分別得到針對兩個模型的,即:

然后利用所采集的輸入和狀態(tài)數(shù)據(jù)求解式(18),分別得到針對兩個模型的Nσ(t),即:

最后,根據(jù)式(29)可以得到兩個近似線性化模型如下式所示:

將兩個近似線性化模型嵌入到一個連續(xù)時間大系統(tǒng)中,結合圖2,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[0,0]T和初始時間t0=0 s,設置tmax=160 s和輸入電壓限幅為0～22 V,選擇未建模動態(tài)補償器參數(shù)

當t=80 s時,將自適應最優(yōu)切換控制器(35)加入到雙容水箱液位系統(tǒng),當滿足t≥tmax時,可以得到如圖14 所示的液位曲線,如圖15 所示的控制輸入曲線和如圖16 所示的切換序列.在t=120 s,平衡點突變,經(jīng)過2.1 s 的調節(jié)時間,系統(tǒng)的液位被調節(jié)到平衡點附近并保持不變.

圖14 采用自適應最優(yōu)切換控制器時水箱的液位Fig.14 Levels of the coupled-tank when using the adaptive optimal switching controller

圖15 采用自適應最優(yōu)切換控制器時水箱的控制輸入Fig.15 Input curves of the coupled-tank when using the adaptive optimal switching controller

圖16 采用自適應最優(yōu)切換控制器時水箱的切換序列Fig.16 Switching sequence of the coupled-tank when using the adaptive optimal switching controller

為了驗證本文所提自適應最優(yōu)切換控制方法的優(yōu)越性,我們以平衡點[6.5,4,14.17,25.2]T為例,與單一的針對一個模型的自適應最優(yōu)控制方法進行了對比實驗.選擇控制器參數(shù)矩陣如式(46)所示.根據(jù)式(17)和式(18)可以得到和N1分別如式(47)和式(48)所示.根據(jù)式(29)可以得到線性化模型如式(49)所示.選擇未建模動態(tài)補償器參數(shù)如式(50)所示.可以得到如圖17 所示的液位曲線和如圖18 所示的控制輸入曲線.根據(jù)圖17 和圖18可以看出,針對平衡點[6.5,4,14.17,25.2]T設計的自適應最優(yōu)控制器只能將液位調節(jié)到對應的平衡點附近.當t=120 s時,平衡點發(fā)生變化,系統(tǒng)液位存在穩(wěn)態(tài)誤差.

圖17 采用自適應最優(yōu)控制器時水箱的液位Fig.17 Levels of the coupled-tank when using the adaptive optimal controller

圖18 采用自適應最優(yōu)控制器時水箱的控制輸入Fig.18 Input curves of the coupled-tank when using the adaptive optimal controller

4 結論

針對具有未知動態(tài)和M個平衡點的連續(xù)時間非線性系統(tǒng),本文提出了一種自適應最優(yōu)切換控制方法.該方法首先在非線性系統(tǒng)的M個平衡點附近采集狀態(tài)信息和輸入信息,利用最小二乘法和黎卡提方程迭代求解公式得到最優(yōu)控制器增益的估計,利用極小值原理得到M個平衡點附近的線性化模型.然后將嵌入轉換法和近似動態(tài)規(guī)劃方法相結合,得到了非線性系統(tǒng)的最優(yōu)切換序列和線性自適應最優(yōu)切換控制器.最后,將線性自適應最優(yōu)切換控制器和未建模動態(tài)補償器相結合,實現(xiàn)了對非線性系統(tǒng)的最優(yōu)控制.仿真實驗表明和單一的最優(yōu)控制方法相比,本文所提方法能夠實現(xiàn)較好的控制效果且具有實際可應用性.

附錄A 參數(shù)已知時的線性最優(yōu)切換控制律和最優(yōu)切換序列推導過程

令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T,并記.針對控制器設計模型(4)的嵌入式模型:

其中δ(σ(t)-i)∈[0,1],定義哈密頓函數(shù):

則協(xié)態(tài)方程為

把式(A4)代入式(A2)可以得到

接下來,我們將問題轉化為如何選擇δ(σ(t)-i)使H最小.易知,選擇δ(σ(t)-i)使H最小可簡化為使下式最小:

它可看作是一個二次規(guī)劃問題:

其中G(t)=λT(t)Bσ(t)R-1BσT(t)λ(t),W={δ∈RM:為凸集.當R為正定矩陣時,-G(t)≤0,因此問題式(A7)可看作凹函數(shù)在凸集W上的最小化問題,H0的全局最小值一定在δ(σ(t)-i)∈{0,1}取得[21].根據(jù)式(A6),選擇切換準則函數(shù):

其中Pσ(t)為對稱實矩陣.對式(A9)兩邊分別求導并整理得

將式(A3)和式(A10)對比,可以得到

式(A9)分別代入式(A8)和式(A4)可以得到:

由于δ(σ(t)-i)∈{0,1},結合式(A12)和式(A11),可以得到切換準則函數(shù):

其中Pσ(t)根據(jù)黎卡提方程求解:

每一時刻,計算并比較Jσ(t),求出最小的Jσ(t)對應的線性最優(yōu)切換控制律:

其中σ(t)表示最優(yōu)切換序列,Kσ(t)表示線性最優(yōu)切換控制器的增益,通過下式求解: