谷小峰,馬慶魯,黃文杰,李國慶
(1.華南理工大學化學與化工學院,廣州 510640;2.山東京博石化公司)
隨著流程工業,如煉油、化工、冶金、制藥等行業生產工藝復雜程度不斷增加,其傳統的基于機理模型的控制方法(model-driven control,MDC)正面臨越來越多的挑戰[1-3]。隨著信息技術的發展,工業過程數據收集和處理能力越來越強,這些數據包含了大量的工藝和設備信息,如何在難建立甚至無法建立機理模型的情況下,利用這些數據進行控制成為了控制研究的新課題。數據驅動控制(DDC)正是基于這種設想,通過挖掘蘊藏在數據中的信息而直接實現控制方案和控制器設計。近年來,DDC得到了迅速發展,出現了十余種方法[2,4-7],其中之一是無模型自適應控制(MFAC)[8-9],其基于偽偏導(PPD)概念將離散時間非線性系統轉化成動態線性系統。偽偏導是一個時變參數,僅靠系統的輸入/輸出(I/O)數據估算,而無需建立被控對象的機理模型。同時借助于動態線性化方法,控制器的設計也相對簡便。目前,MFAC已應用于自動泊車系統[10]、自動駕駛[11]、機械臂[12]、電機[13-14]、航天器姿態控制[15]和煉油化工過程[16-19]。
當前,MFAC研究主要從兩方面展開:
(1)參數整定。MFAC有4個經驗參數λ,ρ,η,μ,λ、μ為權重因子,ρ、η為步長因子。它們在控制方案設計過程中恒定不變,發明者未給出其整定方法,但它們深刻影響MFAC的跟蹤性能。許多學者對參數整定進行了研究。郭代銀[20]發現MFAC控制器與增量式比例-微分(PI)和比例-積分-微分(PID)控制器在結構上相似,可以用PID參數Z-N整定法和臨界比例度法等來整定MFAC參數。胡益民等[16]提出了基于系統前3個時刻的初值,用擬牛頓法計算MFAC參數的方法,案例表明能改善MFAC的穩定性、不超調,但末期迭代次數較多。宋澤雨等[17]用遺傳算法將四參數問題轉化為單參數問題,在加速初期控制過程的同時也避免了可能出現的超調和震蕩。但無一例外,上述方法都是離線整定,即通過系統初始參數整定得到的四參數在其后控制過程中一直保持不變,因而不能更好地適應時變過程,限制了偽偏導對控制過程的影響,自適應性不強。Yang Ye等[18]利用被控系統的輸入輸出實測數據用徑向基函數(RBF)神經網絡直接在線逼近每一時刻偏格式MFAC的偽梯度(PG);并利用長短期記憶(LSTM)神經網絡,利用系統誤差集和梯度信息集對控制方法的基本參數在線調優。最后,通過單輸入單輸出離散非線性系統仿真和三容水箱系統仿真驗證了方法的有效性和適用性。
(2)優化MFAC跟蹤控制。程志強等[21]針對執行器執行能力有限,即執行器飽和問題,提出了預報和濾波下一時刻輸出,從而使預報值盡可能跟蹤期望輸出的方法。侯忠生等[10]提出了基于坐標補償的MFAC算法,以消除自動泊車系統控制過程中實際泊車軌跡與目標軌跡存在的穩態誤差,對下一時刻的輸出期望進行修正,不過這一改進只是針對某一類對象,不具有普遍性。江浩斌等[22]結合滑模控制、模型預測控制改進了MFAC控制器,用理論分析證明了其穩定性,但算法參數多,十分復雜。
總體而言,MFAC在參數整定方面發表的研究多是離線整定,實時在線整定較少。在線整定根據系統當前I/O數據對每一時刻的四參數進行計算,因而能有效地提高控制過程的跟蹤性能和自適應性能。本課題采用RBF神經網絡對緊格式MFAC的四參數λ,ρ,η,μ進行在線整定,以建立一種新的RBF-MFAC方法,提高偽偏導對控制過程的影響,并將其應用于某非線性系統控制和某煉油廠0.3 Mt/a氣體分餾(簡稱氣分)裝置丙烯塔的操作調整中。
MFAC分為緊格式、偏格式和全格式3種。基于緊格式動態線性化的無模型自適應控制(CFDL-MFAC[23])的穩定性和收斂性有嚴格數學證明,本課題以其為研究對象。
考慮一類單輸入單輸出(SISO)離散時間非線性系統:
y(k+1)=f[y(k),…,y(k-n1),u(k),…,u(k-n2)]
(1)
式中:y(k)∈R,u(k)∈R分別為系統在k時刻的輸出和輸入;n1和n2是正整數;f(…):Rn1+n2+2R為未知非線性函數。可以證明,如果f(…)關于所有變量的偏導均連續,且系統滿足廣義Lipschitz條件,則有[23]:
Δy(k+1)=φc(k)Δu(k)
(2)
式中:Δy(k+1)=y(k+1)-y(k),Δu(k)=u(k)-u(k-1)分別為兩個相鄰時刻的輸出和輸入變化;時變參數φc(k)稱為偽偏導。基于控制準則函數,可以證明[23]:

(3)

(4)


(5)

Δy(k+1)=Φc(k)Δu(k)
(6)

(7)

(8)

(9)

(10)



圖1 SISO系統MFAC流程示意
MIMO系統的控制流程類似SISO系統,在此不贅述。
RBF神經網絡是由輸入層、隱含層和輸出層構成的三層前饋網絡,是非常有效的非線性估計方法[24]。
RBF網絡的輸入可以表示為向量x,中心向量c與輸入向量x維度相同,激活函數一般為高斯徑向基函數(Gaussian radial basis function),隱含層的輸出為:
(11)
式中:‖x-cj‖為兩個向量間的歐氏距離;bj為基函數寬度,是正標量;m為隱含層神經元節點數。
RBF網絡輸出可以表示為:
(12)
式中:ω為輸出層的權值;v為RBF神經網絡輸出;n為輸出層節點數。
為了使RBF神經網絡輸出結果逼近系統期望輸出,用于訓練權值的誤差為:
e(k)=vm(k)-v(k)
(13)
式中:vm(k)為系統期望輸出;v(k)為系統實際輸出。
取性能指標函數為:
(14)
利用誤差反傳播來更新RBF網絡各層的權值系數。根據梯度下降法(GD),隱藏層至輸出層的權值更新計算式為:
(15)
ωj(k)=ωj(k-1)+Δωj+α[ωj(k-1)-ωj(k-2)]
(16)
隱藏層基函數的系數bj和cij的更新計算式為:
(17)
bj(k)=bj(k-1)+Δbj+α[bj(k-1)-bj(k-2)]
(18)
(19)
cji(k)=cji(k-1)+Δcji+α[cji(k-1)-cji(k-2)]
(20)
式中:ξ∈[0,1]為學習率,ξ∈[0,1];α為動量因子,α∈[0,1]。
高斯徑向基函數徑向對稱、兩邊遞減,選取的中心向量接近輸入向量時,對輸入具有真實的映射作用,因此RBF神經網絡具有學習速度快、不易陷入局部最優的特點[25],適用于解決MFAC的四參數實時整定問題。


圖2 基于RBF神經網絡的參數在線整定示意
(21)
(22)
(23)
(24)
而后利用誤差反傳播來更新RBF網絡各層的權值系數和中心向量[25]。由式(16)得到:

(25)
分別對ρ,μ,η求梯度,同理可得到ω2j(k+1),ω3j(k+1),ω4j(k+1)。
由式(18)得到:

(26)
分別對ρ,μ,η求梯度,同理可得到b2j(k+1),b3j(k+1),b4j(k+1)。
由式(20)得到:

(27)
分別對ρ,μ,η求梯度,同理可得到其余基函數系數。
上述方法同樣適用于MIMO系統,僅需將偽偏導數改為偽偏導矩陣,在此不贅述。
綜上得到基于RBF神經網絡實施四參數在線整定的MFAC算法(簡稱RBF-MFAC)框圖,如圖3所示。

圖3 SISO系統RBF-MFAC示意
為了驗證RBF-MFAC方法的優越性,將其應用于如下非線性系統[23]:
(28)
系統期望輸出為:
(29)
圖4為該非線性系統現有MFAC和RBF-MFAC控制跟蹤性能,可見RBF-MFAC控制追蹤性能優于MFAC。
圖5為某煉油廠0.30 Mt/a氣體分餾(氣分)裝置的原則流程。由脫丙烷塔T101、脫乙烷塔T102和丙烯塔T103組成,工藝目標是分離來自催化裂化裝置的液化氣,得到摩爾分數99.6%的丙烯。由于丙烯、丙烷沸點接近(常壓沸點分別為-47.7 ℃和-42.1 ℃),丙烯塔分離難度大,采用兩塔串聯,板數達200~240塊,一旦原料組成波動,操作很難穩定[16]。研究目的是采用有效的控制策略,使丙烯產品純度和產量盡快達標。

圖5 某0.30 Mt/a氣分裝置原則流程
下面分SISO和MIMO兩種情況進行討論。
表1為丙烯塔進料和產品組成,產品中丙烯摩爾分數只有91.2%,未達到合格品要求。

表1 丙烯塔SISO系統進料和產品組成 x,%
丙烯塔SISO系統操作參數見圖6。保持丙烯塔塔頂壓力1.79 MPa不變,丙烯塔自由度為1,故選擇塔底再沸器負荷為輸入u1,塔頂產品丙烯摩爾分數為輸出y1,期望輸出為yr1=99.6%。

圖6 丙烯塔SISO系統操作示意
Aspen Plus與Matlab數據交互平臺,如圖7所示。丙烯塔計算由大型商用流程模擬軟件Aspen Plus V11完成,RBF-MFAC控制過程由Aspen Plus V11和Matlab 2022b交互平臺實現。首先由Aspen Plus模擬取得k時刻I/O數據,然后由Matlab編寫的MFAC或RBF-MFAC程序代碼調用,未達到控制目標時,按圖3流程整定得到k+1時刻四參數,計算得到的u(k+1)返回Aspen Plus模擬得到y(k+2),依次迭代,實現丙烯塔操作自動調整,達標后結束。
3.1.1MFAC方案

按圖1流程得到丙烯塔SISO系統現有MFAC控制跟蹤效果和偽偏導變化趨勢,如圖8所示,其中:y為塔頂丙烯摩爾分數;k為操作調整次數,可以理解為操作調整一次所需的單位時間。實際生產中塔的操作調整后,從當前的穩態生產轉換到新操作參數下的新穩態時,需要一個過渡時間。由于本課題所提方法尚未應用到實際生產中,故該時間段長度未知。因此作了簡化處理,近似認為每次調整操作后到新穩態的時間間隔相等。由圖8可見:k=217時塔頂丙烯摩爾分數達到99.6%目標值;MFAC四參數保持不變時,偽偏導值變化緩慢,達到控制目標過程緩慢。

圖8 丙烯塔SISO系統MFAC跟蹤性能
3.1.2RBF-MFAC方案
保持丙烯塔SISO系統初值和MFAC初始參數設置不變。采用RBF神經網絡實時整定四參數,設置RBF學習率ξ=0.1,動量因子α=0.07。按圖2流程得到丙烯塔SISO系統現有MFAC控制跟蹤效果和偽偏導變化趨勢,如圖9所示。圖9(a)顯示k=125時丙烯摩爾分數達到99.6%的目標。由圖9(b) MFAC控制過程中偽偏導的變化趨勢可見,相較于MFAC方案,RBF實時整定MFAC四參數時,偽偏導的變化更快,控制跟蹤性能更好。

圖9 SISO系統RBF-MFAC跟蹤性能
圖10為RBF-MFAC中四參數λ,μ,η,ρ的變化趨勢。由圖10可見:四參數初期變化較快,這是為了迅速達到期望值,提高跟蹤性能;后期接近期望輸出時,為避免超調,變化變緩。通過四參數的實時整定,RBF-MFAC自適應性增強。達到控制目標時,MFAC和RBF-MFAC操作調整次數分別為k=217和k=125,降幅為42.4%;仿真運行時間分別為1 189.0 s和694.5 s,降幅為41.6%(計算機為Win10系統,CPU為12th Gen Intel(R) Core(TM) i5-12400@2.50 GHz,RAM為16 GB DDR4 3 200 MHz)。

圖10 SISO系統RBF-MFAC四參數變化趨勢
表2為丙烯塔當前操作的進料和產品組成,塔頂丙烯摩爾分數為94.6%,未達到合格品要求。

表2 丙烯塔MIMO系統進料和產品組成 x,%
在3.1節基礎上,增加塔壓調節。即輸入u1為再沸器負荷,u2為塔頂壓力P1;輸出y1為塔頂丙烯摩爾分數,期望值yr1=99.6%,y2為丙烯產量D,期望值yr2=9 890 kg/h。故研究對象為二輸入二輸出的2I2O系統。圖11為丙烯塔2I2O操作示意。

圖11 丙烯塔2I2O操作示意
3.2.1MFAC方案



—yr1(k); —y1(k)
3.2.2RBF-MFAC方案
保持丙烯塔MIMO系統初值和MFAC初始參數設置不變。采用RBF實時整定MFAC參數,設RBF學習率ξ=0.1,動量因子α=0.07。實施圖3流程,得到丙烯塔MIMO系統RBF-MFAC控制跟蹤效果和偽偏導變化趨勢,如圖13所示。由圖13可知,k=37時丙烯產量達標,k=42時兩個目標均達標。
MIMO系統中yr1=99.6%和yr2=9 890 kg/h兩個目標同時達到時,MFAC和RBF-MFAC操作調整次數分別為k=191和k=42,后者對前者的降幅為78.0%;仿真運行時間分別為1 048.8 s和246.4 s,降幅為76.5%。
圖14為RBF-FMAC的λ,μ,η,ρ四參數變化趨勢。從圖14可以看出:控制初期四參數變化快,幅度相對較大,因此控制輸入變化大,快速逼近期望目標;控制后期四參數變化緩慢,減小了對控制輸入的影響,防止超調。

圖14 MIMO系統RBF-MFAC四參數變化趨勢
(1)針對現有無模型自適應控制算法中四模型參數恒定不變導致算法的跟蹤性能和自適應性不強等問題,采用基于徑向基函數的RBF神經網絡,基于上兩次調整的輸入和偽偏導,以期望輸出與實時輸出差值為訓練誤差實時整定四參數。
(2)改進了現有SISO和MIMO離散時間非線性系統緊格式動態線性化無模型自適應控制流程,提出了RBF-MFAC控制算法。通過一個非線性系統驗證了RBF-MFAC跟蹤性能的優越性。
(3)將RBF-MFAC應用于某煉油廠0.30 Mt/a氣分裝置丙烯塔,其中I/O數據獲取、RBF神經網絡整定四參數、MFAC控制被集成在Maltab-Aspen軟件平臺中。計算結果表明:較現有MFAC控制,采用RBF-MFAC控制時丙烯塔SISO系統丙烯產品純度達標調整次數減少42.4%,MIMO系統丙烯濃度和產量同時達標調整次數減少78.0%。說明RBF-MFAC控制過程跟蹤性能相比MFAC明顯增強。