迭代學(xué)習(xí)模型預(yù)測(cè)控制研究現(xiàn)狀與挑戰(zhàn)

2022-07-03 02:10:50馬樂(lè)樂(lè)劉向杰高福榮

自動(dòng)化學(xué)報(bào) 2022年6期

馬樂(lè)樂(lè) 劉向杰高福榮

在現(xiàn)代智能制造業(yè)中,批次生產(chǎn)方式占據(jù)越來(lái)越重要的地位,多用于生產(chǎn)具有高附加值的精細(xì)化產(chǎn)品[1],廣泛分布在化工、冶金等傳統(tǒng)重工業(yè)領(lǐng)域[2-4]和生物制藥、人工智能、半導(dǎo)體制造等高新工業(yè)領(lǐng)域[5-7].批次生產(chǎn)過(guò)程通常具有特定的加工順序,并通過(guò)重復(fù)操作批量獲得同種產(chǎn)品,其控制目標(biāo)通常為在有限時(shí)間區(qū)間內(nèi)重復(fù)跟蹤設(shè)定運(yùn)行軌跡.

批次過(guò)程的本質(zhì)特性明顯區(qū)別于連續(xù)過(guò)程,可以歸納為 “多樣產(chǎn)品”、“重復(fù)運(yùn)行”、“時(shí)段切換”和 “變換指標(biāo)”四個(gè)方面[8].自20 世紀(jì)90 年代起,由于產(chǎn)品種類(lèi)增多、市場(chǎng)需求變化加快導(dǎo)致批次生產(chǎn)方式愈受青睞,批次過(guò)程控制也逐漸成為一項(xiàng)獨(dú)立的研究課題.總體來(lái)說(shuō),批次過(guò)程控制研究歷經(jīng)了連續(xù)過(guò)程控制方法、迭代學(xué)習(xí)控制(Iterative learning control,ILC)和迭代學(xué)習(xí)模型預(yù)測(cè)控制(Iterative learning model predictive control,ILMPC)三個(gè)階段,圖1 顯示了其發(fā)展歷程.

圖1 批次過(guò)程控制發(fā)展歷程Fig.1 Development of batch process control

20 世紀(jì)90 年代,依托于連續(xù)過(guò)程控制理論的飛速發(fā)展,衍生了第一代批次過(guò)程控制技術(shù).其核心思想是將批次過(guò)程視為有限時(shí)間內(nèi)的連續(xù)過(guò)程,采用成熟的連續(xù)過(guò)程控制技術(shù)對(duì)批次過(guò)程進(jìn)行時(shí)域控制,控制手段從傳統(tǒng)的比例-積分(Proportion integration,PI)控制策略[9]逐步發(fā)展至模型預(yù)測(cè)控制(Model predictive control,MPC)[10-12]、模糊控制[13]、神經(jīng)網(wǎng)絡(luò)控制[14]等先進(jìn)控制方法.但是連續(xù)過(guò)程控制方法沒(méi)有考慮批次過(guò)程 “多重時(shí)變”的特有性質(zhì),難以解決實(shí)際批次過(guò)程的高精度軌跡跟蹤問(wèn)題.批次過(guò)程的動(dòng)態(tài)變化具有雙向性:沿時(shí)間方向,批次過(guò)程的設(shè)定值是時(shí)變的,需要在每個(gè)采樣點(diǎn)跟蹤不同的目標(biāo)值;沿批次方向,各批次執(zhí)行重復(fù)的生產(chǎn)任務(wù),需要利用積累的控制經(jīng)驗(yàn)不斷提高跟蹤性能.這種特殊的控制目標(biāo)和控制結(jié)構(gòu)激發(fā)了眾多學(xué)者去探索基于迭代學(xué)習(xí)的批次過(guò)程控制方法.

迭代學(xué)習(xí)控制提出于20 世紀(jì)80 年代[15],最早應(yīng)用于機(jī)器人控制.它對(duì)同一軌跡進(jìn)行重復(fù)跟蹤,以前一迭代次序中輸出信號(hào)與給定目標(biāo)的偏差修正下一迭代次序的控制信號(hào),從而逐步提高系統(tǒng)的跟蹤性能,最終實(shí)現(xiàn)有限區(qū)間上的完全跟蹤.ILC 的迭代控制結(jié)構(gòu)與批次過(guò)程重復(fù)操作的特點(diǎn)高度契合,能夠?qū)崿F(xiàn)批次過(guò)程高精度軌跡跟蹤的控制目標(biāo).因此,從20 世紀(jì)90 年代中期開(kāi)始,ILC 在批次過(guò)程控制中獲得了廣泛關(guān)注.韓國(guó)學(xué)者Lee 等最早將ILC 應(yīng)用于聚合反應(yīng)器控制[16],采用基于反饋的ILC 沿批次更新學(xué)習(xí)律,提高系統(tǒng)跟蹤精度;隨后,Lee 等結(jié)合最優(yōu)學(xué)習(xí)律,提出基于二次型指標(biāo)的Q-ILC(Quadratic-criterion-based ILC,Q-ILC)策略,顯著提高了ILC 在批次過(guò)程中的學(xué)習(xí)性能.Lee 等在發(fā)表于Control Engineering Practice的論文中系統(tǒng)綜述了ILC 應(yīng)用于批次過(guò)程的幾種形式,并集中討論了實(shí)際應(yīng)用中需要解決的問(wèn)題[17].基于Lee 等的研究工作,后人針對(duì)批次過(guò)程的時(shí)滯、參數(shù)不確定性、隨機(jī)干擾等問(wèn)題,構(gòu)造了魯棒ILC 策略[18-21];針對(duì)批次過(guò)程的初態(tài)偏移及變參考軌跡等問(wèn)題,提出了改進(jìn)的自適應(yīng)ILC 策略[22-25];此外,ILC 還與模糊規(guī)則、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)驅(qū)動(dòng)等技術(shù)結(jié)合,利用批次過(guò)程數(shù)據(jù)同時(shí)實(shí)施建模和控制[25-31].基于ILC的控制方法融合了批次過(guò)程有限時(shí)間重復(fù)操作的特點(diǎn),沿迭代軸建立了批次間的控制關(guān)系,其產(chǎn)生和發(fā)展標(biāo)志著批次過(guò)程控制正式獨(dú)立于連續(xù)過(guò)程控制,形成了適應(yīng)批次過(guò)程特性的迭代控制結(jié)構(gòu).

ILC 的應(yīng)用將批次過(guò)程控制從時(shí)域引入迭代域,但是無(wú)論是傳統(tǒng)連續(xù)過(guò)程控制方法還是基于ILC 的批次過(guò)程控制方法,其控制信號(hào)只作用于一個(gè)維度.在時(shí)域上,ILC 是典型的開(kāi)環(huán)控制,不具備抗實(shí)時(shí)干擾能力,無(wú)法保證系統(tǒng)的閉環(huán)穩(wěn)定性和魯棒性.根據(jù)ILC 的控制結(jié)構(gòu),當(dāng)前批次出現(xiàn)的干擾和偏差直到下一批次才能被處理,導(dǎo)致批次過(guò)程的時(shí)域跟蹤性能下降.因此,將ILC 算法與成熟的時(shí)域控制技術(shù)結(jié)合成為了批次過(guò)程控制研究的新方向.文獻(xiàn)[32-33]嘗試將ILC 算法與傳統(tǒng)比例-積分-微分(Proportion integration differentiation,PID)控制策略結(jié)合,利用ILC 沿批次進(jìn)行設(shè)定點(diǎn)迭代學(xué)習(xí).但是PID 控制只適用于調(diào)節(jié)問(wèn)題,而批次過(guò)程的設(shè)定值是時(shí)變的,PID 控制無(wú)法滿足批次過(guò)程高精度軌跡跟蹤的控制要求.MPC 能夠根據(jù)系統(tǒng)模型預(yù)測(cè)未來(lái)的狀態(tài)及輸出,在當(dāng)前時(shí)刻的滾動(dòng)時(shí)域優(yōu)化中直接采用時(shí)變的設(shè)定值軌跡作為目標(biāo)輸出,因而在軌跡跟蹤控制方面具有突出優(yōu)勢(shì)[34-35].將ILC 與MPC 結(jié)合不僅能保留ILC 的批次學(xué)習(xí)能力,同時(shí)可以大大提高時(shí)域閉環(huán)跟蹤性能,由此形成的迭代學(xué)習(xí)模型預(yù)測(cè)控制(ILMPC)標(biāo)志著批次過(guò)程控制進(jìn)入二維(Two-dimensional,2D)控制時(shí)代,其算法結(jié)構(gòu)如圖2 所示.ILC 根據(jù)歷史數(shù)據(jù)以批次為單位更新全區(qū)間控制律,MPC 在各批次內(nèi)通過(guò)預(yù)測(cè)未來(lái)系統(tǒng)狀態(tài)和輸出進(jìn)行滾動(dòng)時(shí)域優(yōu)化獲得當(dāng)前時(shí)刻的控制信號(hào).

圖2 迭代學(xué)習(xí)模型預(yù)測(cè)控制結(jié)構(gòu)Fig.2 Structure of ILMPC

加拿大學(xué)者Bone 于1995 年在Automatica期刊上首次提出將ILC 與廣義預(yù)測(cè)控制(Generalized predictive control,GPC)結(jié)合[36],利用ILC 的學(xué)習(xí)能力改善GPC 在重復(fù)性干擾下的控制效果,形成了ILMPC 算法的雛形;韓國(guó)學(xué)者Lee 等于1999 年在AIChE Journal發(fā)表的論文中結(jié)合ILC和模型算法控制(Model algorithm control,MAC)建立了批次模型預(yù)測(cè)控制(Batch model predictive control,BMPC)策略,并首次將ILMPC 算法應(yīng)用于間歇反應(yīng)器控制[37];2000 年,Lee 等在IEEE Transactions on Automatic Control期刊上對(duì)BMPC 的收斂性進(jìn)行了嚴(yán)格的理論證明[38],將ILMPC 的理論研究推向新的高度;文獻(xiàn)[39-40]在BMPC的基礎(chǔ)上,令I(lǐng)LC 和MPC 分別作用于批次方向和時(shí)間方向,形成經(jīng)典的兩段式ILMPC (Twostage ILMPC) 控制架構(gòu).

歷經(jīng)20 多年的發(fā)展,ILMPC 已經(jīng)成為批次過(guò)程控制領(lǐng)域的主流方法[41].本文將在分析現(xiàn)有成熟的迭代學(xué)習(xí)模型預(yù)測(cè)控制理論的基礎(chǔ)上,指出其面臨的挑戰(zhàn),綜述該領(lǐng)域的研究動(dòng)態(tài),并展望迭代學(xué)習(xí)模型預(yù)測(cè)控制的未來(lái)研究方向.本文的結(jié)構(gòu)框架及主要內(nèi)容如圖3 所示.

圖3 結(jié)構(gòu)及主要內(nèi)容Fig.3 The structure and main contents

1 迭代學(xué)習(xí)模型預(yù)測(cè)控制的基本問(wèn)題

在由ILC 和MPC 共同作用的2D 控制框架下,ILMPC 算法的模型搭建、控制律優(yōu)化及跟蹤性能分析都需要從時(shí)間軸和迭代軸兩個(gè)方向同時(shí)進(jìn)行.綜合來(lái)看,ILMPC 的理論體系包含三個(gè)基本問(wèn)題:二維預(yù)測(cè)模型建立、控制律迭代優(yōu)化以及二維穩(wěn)定性分析.

1.1 二維預(yù)測(cè)模型

MPC 的預(yù)測(cè)功能需要基于預(yù)測(cè)模型實(shí)現(xiàn),預(yù)測(cè)模型的形式靈活多變.在經(jīng)典的MPC 理論中,MAC 采用的脈沖響應(yīng)預(yù)測(cè)模型和動(dòng)態(tài)矩陣控制(Dynamic matrix control,DMC)采用的階躍響應(yīng)預(yù)測(cè)模型均是通過(guò)工業(yè)試驗(yàn)得到的非參數(shù)模型;GPC 采用的受控自回歸積分滑動(dòng)平均(Controlled autoregressive integrated moving average,CARIMA)預(yù)測(cè)模型和非線性MPC 經(jīng)常使用的狀態(tài)空間預(yù)測(cè)模型都可劃分為參數(shù)模型.隨著現(xiàn)代工業(yè)系統(tǒng)逐步朝著高復(fù)雜度和高集成度方向發(fā)展,利用機(jī)器學(xué)習(xí)技術(shù)建立數(shù)據(jù)驅(qū)動(dòng)非參數(shù)預(yù)測(cè)模型對(duì)提高模型精度和控制品質(zhì)具有重要意義.

ILMPC 預(yù)測(cè)模型的作用與MPC 相同,可以適應(yīng)多種參數(shù)和非參數(shù)形式.但是ILMPC 在控制結(jié)構(gòu)上與MPC 有本質(zhì)區(qū)別,其二維控制結(jié)構(gòu)要求預(yù)測(cè)模型同時(shí)包含時(shí)間和批次兩個(gè)方向的信息.MPC算法只需考慮對(duì)象的時(shí)域動(dòng)態(tài)特性,預(yù)測(cè)模型通常是基于當(dāng)前時(shí)刻狀態(tài),構(gòu)造控制時(shí)域內(nèi)的輸入向量與預(yù)測(cè)時(shí)域內(nèi)的輸出向量間的關(guān)系.而ILMPC 需要同時(shí)考慮對(duì)象在時(shí)域和迭代域上的動(dòng)態(tài)特性,在時(shí)域預(yù)測(cè)模型的基礎(chǔ)上進(jìn)一步搭建相鄰批次間的迭代關(guān)系,形成2D 預(yù)測(cè)模型.在現(xiàn)有ILMPC 研究中,2D 預(yù)測(cè)模型形式基本沿襲了MPC 預(yù)測(cè)模型,大致可以分為三類(lèi):2D 輸入輸出預(yù)測(cè)模型、2D 狀態(tài)空間預(yù)測(cè)模型和2D 非線性隱式預(yù)測(cè)模型.

1.1.1 2D 輸入輸出預(yù)測(cè)模型

輸入輸出模型主要通過(guò)實(shí)際工業(yè)系統(tǒng)歷史數(shù)據(jù)辨識(shí)得到,結(jié)構(gòu)相對(duì)簡(jiǎn)單,便于直接推導(dǎo)輸入迭代變化量和輸出跟蹤誤差之間的關(guān)系.因此,早期的ILMPC 算法大都采用2D 輸入輸出預(yù)測(cè)模型.文獻(xiàn)[36]利用平均算子建立系統(tǒng)干擾沿批次的迭代關(guān)系,得到了二維CARIMA 預(yù)測(cè)模型,其中控制變量?jī)H體現(xiàn)沿時(shí)間方向的動(dòng)態(tài)變化;文獻(xiàn)[37]將相鄰批次的系統(tǒng)模型作差并沿時(shí)間軸展開(kāi),形成了基于脈沖響應(yīng)矩陣的2D 輸入輸出模型,其控制變量形式進(jìn)一步體現(xiàn)了迭代變化規(guī)律;文獻(xiàn)[42]通過(guò)將階躍響應(yīng)模型沿批次作差構(gòu)造2D 輸入輸出模型,建立了控制輸入增量的迭代變化關(guān)系;文獻(xiàn)[43-45]利用CARIMA 模型沿批次的增量模型,推導(dǎo)了系統(tǒng)控制變量為輸入增量迭代變化量的2D 預(yù)測(cè)模型,其中還同時(shí)包含干擾的迭代變化量;文獻(xiàn)[46]結(jié)合了2D 脈沖響應(yīng)預(yù)測(cè)模型和模糊神經(jīng)網(wǎng)絡(luò)技術(shù),構(gòu)造了非線性系統(tǒng)的2D 模糊神經(jīng)網(wǎng)絡(luò)輸入輸出預(yù)測(cè)模型.盡管采用2D 輸入輸出預(yù)測(cè)模型有利于降低ILMPC 控制器設(shè)計(jì)難度,但是輸入輸出結(jié)構(gòu)無(wú)法表征復(fù)雜系統(tǒng)的重要狀態(tài)變量信息,難以與現(xiàn)代控制理論和系統(tǒng)優(yōu)化理論接軌,在算法應(yīng)用和發(fā)展上都存在一定局限性.

1.1.2 2D 狀態(tài)空間預(yù)測(cè)模型

狀態(tài)空間方法是現(xiàn)代控制理論和系統(tǒng)優(yōu)化理論的重要基礎(chǔ).MPC 理論體系立足于最優(yōu)控制,其可行性及穩(wěn)定性結(jié)論都以狀態(tài)空間方法為工具.因此,在ILMPC 中采用2D 狀態(tài)空間預(yù)測(cè)模型進(jìn)行控制器設(shè)計(jì),不僅對(duì)復(fù)雜批次過(guò)程控制具有指導(dǎo)意義,還便于利用MPC 成熟的理論體系對(duì)ILMPC 的穩(wěn)定性、收斂性等系統(tǒng)性能進(jìn)行定性分析.狀態(tài)空間模型通過(guò)狀態(tài)變量聯(lián)立系統(tǒng)輸入和輸出,為建立跟蹤誤差與系統(tǒng)輸入間的迭代關(guān)系,通常需要進(jìn)行狀態(tài)增廣.文獻(xiàn)[47]將分段仿射(Piecewise affine,PWA)狀態(tài)模型沿批次進(jìn)行增廣,構(gòu)建了2D Fornasini–Marchesini (FM)模型,增廣后的狀態(tài)變量為狀態(tài)迭代變化量和輸出跟蹤誤差,再沿時(shí)間軸基于2D FM 模型預(yù)測(cè)未來(lái)的增廣狀態(tài),形成2D FM狀態(tài)空間預(yù)測(cè)模型;文獻(xiàn)[48-51]基于線性定常(Linear time invariant,LTI)系統(tǒng)推導(dǎo)以系統(tǒng)狀態(tài)和輸入變量為增廣狀態(tài)的狀態(tài)空間模型,再通過(guò)作差的方式得到相鄰批次間的迭代關(guān)系,構(gòu)造了控制變量為輸入信號(hào)增量迭代變化量的2D 預(yù)測(cè)模型.文獻(xiàn)[52]針對(duì)一類(lèi)具有未知輸入非線性的系統(tǒng),借助全局Lipschitz 連續(xù)性條件構(gòu)建了顯式的線性2D 狀態(tài)空間預(yù)測(cè)模型,使非線性ILMPC 轉(zhuǎn)化為簡(jiǎn)單的二次規(guī)劃(Quadratic programming,QP)問(wèn)題;文獻(xiàn)[53]考慮一類(lèi)具有未知干擾非線性的系統(tǒng),建立了具有干擾不確定性的顯式2D 狀態(tài)空間預(yù)測(cè)模型,通過(guò)迭代計(jì)算逼近干擾量進(jìn)而獲得ILMPC 的近似最優(yōu)解.文獻(xiàn)[54]針對(duì)一般非線性系統(tǒng),通過(guò)工作點(diǎn)線性化得到了顯式2D 狀態(tài)空間預(yù)測(cè)模型,并利用Lipschitz 條件在ILMPC 優(yōu)化中實(shí)現(xiàn)了對(duì)線性化誤差的補(bǔ)償.

1.1.3 2D 非線性隱式預(yù)測(cè)模型

上述的2D 輸入輸出預(yù)測(cè)模型和2D 狀態(tài)空間預(yù)測(cè)模型都可以歸結(jié)為顯式預(yù)測(cè)模型,它們采用2D 線性模型或者近似線性模型進(jìn)行預(yù)測(cè),能夠直接推出未來(lái)一段時(shí)間內(nèi)系統(tǒng)輸入到系統(tǒng)輸出的顯式關(guān)系,形成的優(yōu)化問(wèn)題大都能夠通過(guò)QP 高效求解.隨著現(xiàn)代工業(yè)的發(fā)展,批次過(guò)程的生產(chǎn)規(guī)模、設(shè)備種類(lèi)以及結(jié)構(gòu)復(fù)雜性日益增長(zhǎng),簡(jiǎn)單的顯式預(yù)測(cè)模型已經(jīng)不足以描述批次過(guò)程的復(fù)雜動(dòng)態(tài)特性.為了保證跟蹤精度,直接采用較為精確的非線性模型進(jìn)行隱式預(yù)測(cè)成為ILMPC 的另一重要研究方向.文獻(xiàn)[55-56]利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行隱式預(yù)測(cè),得到的非線性?xún)?yōu)化問(wèn)題通過(guò)序列二次規(guī)劃(Sequential quadratic programming,SQP)、粒子群算法(Particle swarm optimization,PSO)或遺傳算法(Genetic algorithm,GA)等方法進(jìn)行求解;文獻(xiàn)[57]建立了插電式混合動(dòng)力汽車(chē)的2D Roesser 非線性機(jī)理模型,通過(guò)隱式預(yù)測(cè)形成非線性ILMPC 優(yōu)化問(wèn)題,并通過(guò)改進(jìn)動(dòng)態(tài)規(guī)劃(Improved dynamic programming,IDP)方法進(jìn)行求解.雖然2D 非線性隱式預(yù)測(cè)模型能夠最大程度地保證控制精確性,但同時(shí)導(dǎo)致ILMPC 優(yōu)化的計(jì)算復(fù)雜度大大增加.如何設(shè)計(jì)更為有效的2D 預(yù)測(cè)模型結(jié)構(gòu)以實(shí)現(xiàn)跟蹤精度和計(jì)算效率的平衡,是ILMPC 理論研究的難點(diǎn)之一.

1.2 控制律迭代優(yōu)化

ILMPC 需要根據(jù)過(guò)去批次的過(guò)程數(shù)據(jù)沿迭代軸進(jìn)行控制律更新,這通常是通過(guò)沿批次的迭代優(yōu)化實(shí)現(xiàn)的.現(xiàn)有ILMPC 研究工作主要圍繞著兩種優(yōu)化結(jié)構(gòu)展開(kāi):1)將ILC 和MPC 集成為一個(gè)二維優(yōu)化問(wèn)題,在每個(gè)采樣時(shí)刻對(duì)當(dāng)前控制律進(jìn)行更新;2)按順序分別進(jìn)行ILC 優(yōu)化和MPC 優(yōu)化,在每個(gè)批次開(kāi)始前基于2D 模型求解整個(gè)批次內(nèi)的ILC 控制律,再采用MPC 基于2D 預(yù)測(cè)模型進(jìn)行滾動(dòng)時(shí)域優(yōu)化,在ILC 控制律的基礎(chǔ)上進(jìn)一步修正.通常,具有第1 種優(yōu)化結(jié)構(gòu)的ILMPC 算法稱(chēng)為整體式(Intergrated) ILMPC,具有第2 種結(jié)構(gòu)的ILMPC算法稱(chēng)為兩段式(Two-stage) ILMPC.

1.2.1 整體式ILMPC

整體式ILMPC 控制器本質(zhì)是基于2D 預(yù)測(cè)模型的MPC 控制器,它借助存儲(chǔ)的前一批次控制信息,通過(guò)最小化未來(lái)一段時(shí)間的跟蹤誤差獲得當(dāng)前批次當(dāng)前時(shí)刻的控制輸入迭代變化量,從而實(shí)現(xiàn)學(xué)習(xí)功能[37,42-44],其結(jié)構(gòu)如圖4 所示.整體式ILMPC的最優(yōu)性、可行性及穩(wěn)定性等性質(zhì)可以通過(guò)MPC理論進(jìn)行定性分析,優(yōu)化算法的可實(shí)施性較強(qiáng),同時(shí)計(jì)算負(fù)擔(dān)較小.整體式ILMPC 的控制信號(hào)直接產(chǎn)生于MPC 控制器,一方面降低了約束處理的難度,另一方面利于與魯棒、隨機(jī)等先進(jìn)控制技術(shù)結(jié)合.文獻(xiàn)[58-59]分別針對(duì)批次系統(tǒng)的模型參數(shù)不確定性和干擾不確定性問(wèn)題,基于2D LTI 狀態(tài)空間預(yù)測(cè)模型設(shè)計(jì)了魯棒整體式ILMPC 方法;文獻(xiàn)[60-61]分別考慮批次過(guò)程的隨機(jī)擾動(dòng)和隨機(jī)狀態(tài)約束問(wèn)題,構(gòu)造了隨機(jī)整體式ILMPC 策略.

圖4 整體式ILMPC 結(jié)構(gòu)Fig.4 Scheme of integrated ILMPC

1.2.2 兩段式ILMPC

兩段式ILMPC 多基于前饋-反饋機(jī)制,通常形式為先基于存儲(chǔ)的前一批次數(shù)據(jù)進(jìn)行離線ILC 優(yōu)化得到整個(gè)批次的前饋控制律,再在每個(gè)采樣間隔進(jìn)行滾動(dòng)時(shí)域MPC 優(yōu)化得到反饋控制律,其控制結(jié)構(gòu)如圖5 所示.這種Two-stage 優(yōu)化方案將ILC功能和MPC 功能進(jìn)行了分離,沿批次進(jìn)行的ILC控制只處理重復(fù)性干擾,沿時(shí)域進(jìn)行的MPC 控制負(fù)責(zé)抑制隨機(jī)干擾.因而Two-stage ILMPC 的迭代學(xué)習(xí)進(jìn)程不受隨機(jī)過(guò)程信息的影響,其學(xué)習(xí)效率和收斂速度通常高于整體式ILMPC.文獻(xiàn)[39-40]基于2D 脈沖響應(yīng)預(yù)測(cè)模型,采用前饋-反饋機(jī)制構(gòu)建Two-stage ILMPC 算法,通過(guò)ILC 優(yōu)化和MPC優(yōu)化分別產(chǎn)生ILC 控制量和MPC 控制量,施加于被控系統(tǒng)的控制作用為兩者之和;文獻(xiàn)[55]基于2D 非線性模糊神經(jīng)網(wǎng)絡(luò)模型,先獨(dú)立優(yōu)化ILC 控制律,再利用已知的ILC 控制量和待優(yōu)化的MPC控制量推導(dǎo)時(shí)域隱式預(yù)測(cè)模型,通過(guò)滾動(dòng)時(shí)域優(yōu)化求解得到MPC 控制量.另一種典型Two-stage ILMPC保持了ILC 和MPC 功能的整體性,只根據(jù)控制目標(biāo)將ILMPC 優(yōu)化過(guò)程分割為兩個(gè)階段,第1 階段抑制非重復(fù)性干擾,第2 階段在重復(fù)性干擾下最小化跟蹤誤差,提高系統(tǒng)跟蹤精度和收斂速度[62].

圖5 Two-stage ILMPC 結(jié)構(gòu)Fig.5 Scheme of two-stage ILMPC

綜合前述的模型形式和優(yōu)化結(jié)構(gòu)差異,ILMPC的分類(lèi)情況及各自?xún)?yōu)勢(shì)、局限性如表1 所示.

表1 迭代學(xué)習(xí)模型預(yù)測(cè)控制分類(lèi)Table 1 Categories of ILMPC

1.3 二維穩(wěn)定性分析

ILMPC 是典型的二維控制系統(tǒng),其穩(wěn)定性應(yīng)從迭代和時(shí)間兩個(gè)維度進(jìn)行分析,稱(chēng)為二維穩(wěn)定性分析.在迭代軸方向上,ILMPC 系統(tǒng)的穩(wěn)定性主要體現(xiàn)為沿批次的收斂性問(wèn)題.在時(shí)間軸方向上,ILMPC的穩(wěn)定性主要體現(xiàn)為沿時(shí)間的Lyapunov 穩(wěn)定性.針對(duì)ILC 的收斂性問(wèn)題,現(xiàn)有研究主要是通過(guò)代入控制變量顯式地推導(dǎo)跟蹤誤差的迭代關(guān)系,得出系統(tǒng)收斂的不等式條件[63-64].這種分析方法較為簡(jiǎn)便,且能得到系統(tǒng)嚴(yán)格收斂的結(jié)論,但是不適用于無(wú)法得到顯式解的帶約束問(wèn)題;針對(duì)MPC 的穩(wěn)定性問(wèn)題,基于終端約束集的控制器設(shè)計(jì)方法是保證系統(tǒng)Lyapunov 穩(wěn)定性的最有效途徑[65],通過(guò)在滾動(dòng)時(shí)域優(yōu)化問(wèn)題中引入終端代價(jià)函數(shù)和終端約束,使得由系統(tǒng)優(yōu)化目標(biāo)函數(shù)充當(dāng)?shù)腖yapunov 函數(shù)沿時(shí)間軸遞減.然而,對(duì)于具有強(qiáng)非線性或不確定性的系統(tǒng)而言,設(shè)計(jì)終端約束集仍面臨很大困難.ILMPC的二維結(jié)構(gòu)決定了系統(tǒng)的時(shí)域特性和迭代域特性互相影響,互相牽制,因此無(wú)法單獨(dú)采用ILC 或MPC領(lǐng)域的已有方法進(jìn)行收斂性或穩(wěn)定性分析.此外,批次過(guò)程的強(qiáng)非線性、不確定性及多約束等問(wèn)題導(dǎo)致ILMPC 的二維穩(wěn)定性分析愈加困難.

1.3.1 時(shí)域Lyapunov 穩(wěn)定性

2D 系統(tǒng)的時(shí)域性能和迭代域性能密不可分,時(shí)域穩(wěn)定性是實(shí)現(xiàn)迭代收斂性的重要前提,在2D框架下構(gòu)造具有時(shí)域穩(wěn)定性的ILMPC 控制器能夠?yàn)橄到y(tǒng)的實(shí)時(shí)跟蹤性能提供有力保障.從MPC 穩(wěn)定性理論出發(fā),ILMPC 系統(tǒng)的時(shí)域Lyapunov 穩(wěn)定性即指基于二維預(yù)測(cè)模型的時(shí)域優(yōu)化目標(biāo)函數(shù)沿時(shí)間軸的收斂問(wèn)題.對(duì)于約束系統(tǒng),通常要基于系統(tǒng)遞歸可行性的前提保證穩(wěn)定性.利用最優(yōu)解必定優(yōu)于可行解的一般性結(jié)論,得到ILMPC 閉環(huán)系統(tǒng)的時(shí)域Lyapunov 穩(wěn)定性結(jié)論.文獻(xiàn)[37,46]通過(guò)假設(shè)在t+1 時(shí)刻控制時(shí)域內(nèi)最后一個(gè)輸入的迭代變化量為零,利用t時(shí)刻的最優(yōu)解構(gòu)造了t+1 時(shí)刻的最優(yōu)解,進(jìn)而根據(jù)最優(yōu)解與可行解的關(guān)系,證明了目標(biāo)函數(shù)在無(wú)窮時(shí)域內(nèi)的有界性.文獻(xiàn)[55-56]采用變預(yù)測(cè)時(shí)域的ILMPC 優(yōu)化機(jī)制,保證每個(gè)時(shí)刻的最優(yōu)解必定是下一時(shí)刻的可行解,進(jìn)而實(shí)現(xiàn)了目標(biāo)函數(shù)沿時(shí)間軸非增.文獻(xiàn)[58-59]在時(shí)域上采用了魯棒預(yù)測(cè)控制結(jié)構(gòu),將系統(tǒng)物理約束和Lyapunov 穩(wěn)定性條件均轉(zhuǎn)化為線性不等式約束,構(gòu)造反饋控制律令系統(tǒng)若初始可行必遞歸可行.

1.3.2 迭代收斂性

ILMPC 的迭代收斂性是指:當(dāng)?shù)涡蜈吔鼰o(wú)窮時(shí),系統(tǒng)跟蹤誤差收斂到零或者某一常數(shù).ILMPC的收斂性分析主要遵循兩種方式:

針對(duì)無(wú)約束系統(tǒng),直接求出ILMPC 優(yōu)化問(wèn)題的顯式解,將顯式解代入系統(tǒng)模型,推導(dǎo)相鄰批次間跟蹤誤差的迭代關(guān)系,從而得到跟蹤誤差沿迭代軸單調(diào)收斂的不等式條件.文獻(xiàn)[42]將ILMPC 優(yōu)化問(wèn)題的顯式解代入階躍響應(yīng)模型,得到了相鄰批次間跟蹤誤差向量的等式關(guān)系,再令轉(zhuǎn)移矩陣的譜半徑或范數(shù)小于1 得到ILMPC 系統(tǒng)的單調(diào)收斂條件;文獻(xiàn)[48]基于所有批次初始狀態(tài)保持不變的假設(shè),將顯式解代入Kalman 濾波器作用下的LTI 狀態(tài)模型,得到ILMPC 的單調(diào)收斂條件.

針對(duì)約束系統(tǒng),首先通過(guò)設(shè)計(jì)穩(wěn)定預(yù)測(cè)控制器保證跟蹤誤差在每個(gè)批次內(nèi)的收斂性或有界性,再利用批次過(guò)程的重復(fù)特性,證明跟蹤誤差沿批次的收斂性.文獻(xiàn)[38]基于預(yù)測(cè)控制的穩(wěn)定性分析方法推得優(yōu)化目標(biāo)函數(shù)值的時(shí)域有界性,進(jìn)而通過(guò)前一批次末端狀態(tài)和后一批次初態(tài)間的關(guān)系,證明了跟蹤誤差沿迭代軸收斂到零;文獻(xiàn)[55]基于變時(shí)域預(yù)測(cè)控制目標(biāo)函數(shù)的非增性質(zhì),在系統(tǒng)初態(tài)保持不變的前提下利用夾逼定理證明了跟蹤誤差沿迭代軸收斂到某一常數(shù);文獻(xiàn)[59]在時(shí)域上采用基于終端不變集的MPC 優(yōu)化方法保證了系統(tǒng)跟蹤誤差的有界性,繼而借助最優(yōu)解的性質(zhì)遞推證明了批次內(nèi)任意采樣時(shí)刻跟蹤誤差沿迭代軸的收斂性.

2 迭代學(xué)習(xí)模型預(yù)測(cè)控制面臨的挑戰(zhàn)

迭代學(xué)習(xí)模型預(yù)測(cè)控制衍生于發(fā)展成熟的ILC和MPC 技術(shù),具有較為完備的理論基礎(chǔ).但是,ILC和MPC 從控制目標(biāo)、優(yōu)化結(jié)構(gòu)等方面存在本質(zhì)區(qū)別,將兩者融入到一個(gè)2D 框架下對(duì)系統(tǒng)的建模、優(yōu)化、穩(wěn)定性分析等帶來(lái)了挑戰(zhàn).建立從建模、優(yōu)化到性能分析的完整理論體系仍是批次過(guò)程ILMPC 的研究難點(diǎn).同時(shí),批次過(guò)程 “多重時(shí)變”的特點(diǎn)要求ILMPC 控制器對(duì)變參考軌跡、變批次長(zhǎng)度、變模型參數(shù)等情況具有良好的適應(yīng)性.如何在不影響系統(tǒng)2D 穩(wěn)定性的前提下提高對(duì)批次過(guò)程變工況的適應(yīng)性是ILMPC 控制器設(shè)計(jì)面臨的又一挑戰(zhàn).

2.1 建模問(wèn)題

建模問(wèn)題一直是批次過(guò)程控制領(lǐng)域的研究熱點(diǎn)[66-68].ILMPC 的時(shí)域跟蹤性能和迭代域收斂特性都很大程度上依賴(lài)于模型的準(zhǔn)確性.盡管ILC 在發(fā)展初期被定位為無(wú)模型控制系統(tǒng)綜合方法,但在系統(tǒng)模型可獲得的情況下利用模型構(gòu)造學(xué)習(xí)律能大大提高學(xué)習(xí)效率,縮短學(xué)習(xí)過(guò)程[69-70].MPC 是一種基于模型的先進(jìn)控制技術(shù),其算法魯棒性和穩(wěn)定性都與預(yù)測(cè)模型的準(zhǔn)確度息息相關(guān)[71-72].因此,建立精確的2D 模型對(duì)ILMPC 算法功能的實(shí)現(xiàn)尤為重要.實(shí)際批次過(guò)程通常具有明顯的非線性特征,按模型可獲取程度大致可以分為兩類(lèi):第1 類(lèi)是可以獲取具有足夠精度的機(jī)理模型的簡(jiǎn)單過(guò)程;第2 類(lèi)是機(jī)理模型及辨識(shí)模型無(wú)法獲取或難以用于控制的復(fù)雜過(guò)程.

2.1.1 機(jī)理建模

針對(duì)簡(jiǎn)單非線性過(guò)程,最可靠的建模方法就是根據(jù)被控系統(tǒng)內(nèi)部機(jī)制或者物質(zhì)流的傳遞機(jī)理建立精確的機(jī)理模型.機(jī)理模型又稱(chēng)白箱模型,它是基于質(zhì)量平衡方程、能量平衡方程、動(dòng)量平衡方程、相平衡方程以及某些物性方程、化學(xué)反應(yīng)定律、電路基本定律等而獲得對(duì)象或過(guò)程的數(shù)學(xué)模型.機(jī)理模型的優(yōu)點(diǎn)是參數(shù)具有非常明確的物理意義,模型參數(shù)易于調(diào)整,具有很強(qiáng)的適應(yīng)性.但是實(shí)際工業(yè)對(duì)象的過(guò)程特性通常無(wú)法精確表達(dá)為數(shù)學(xué)形式,并且表達(dá)式中存在大量難以確定的參數(shù),進(jìn)而影響到模型的精確性.在現(xiàn)今發(fā)展階段,ILMPC 的研究工作主要面向?qū)A(chǔ)控制理論的改進(jìn)和完善,因此大都直接基于對(duì)象非線性機(jī)理模型建立相應(yīng)的ILMPC算法[47-54].為了在控制器設(shè)計(jì)和性能分析中運(yùn)用成熟的線性系統(tǒng)控制理論,通常需要將非線性機(jī)理模型進(jìn)行線性化,基于所得線性模型推導(dǎo)2D 預(yù)測(cè)模型,其中線性化誤差項(xiàng)一般考慮為系統(tǒng)的不確定擾動(dòng).文獻(xiàn)[47]將非線性機(jī)理模型進(jìn)行分段線性化,并在各階段設(shè)計(jì)不同的優(yōu)化目標(biāo)函數(shù)求解ILMPC控制量;文獻(xiàn)[54]通過(guò)泰勒展開(kāi)的方法對(duì)非線性機(jī)理模型進(jìn)行工作點(diǎn)處線性化,利用Lipschitz 連續(xù)性條件在2D 預(yù)測(cè)模型中補(bǔ)償線性化高階項(xiàng)產(chǎn)生的不確定性;文獻(xiàn)[58]將非線性注塑系統(tǒng)描述為具有參數(shù)不確定性的線性化系統(tǒng),設(shè)計(jì)了對(duì)應(yīng)的魯棒ILMPC 策略.

2.1.2 數(shù)據(jù)驅(qū)動(dòng)建模

針對(duì)復(fù)雜非線性過(guò)程,可以采用數(shù)據(jù)驅(qū)動(dòng)建模的手段為ILMPC 設(shè)計(jì)提供模型支撐.批次生產(chǎn)過(guò)程中每時(shí)每刻都產(chǎn)生并儲(chǔ)存了大量的關(guān)于過(guò)程運(yùn)行和設(shè)備狀態(tài)的數(shù)據(jù),且數(shù)據(jù)量隨著重復(fù)操作的進(jìn)行不斷累積增大.利用這些離線或在線的數(shù)據(jù)獲取被控系統(tǒng)的動(dòng)態(tài)特性是解決難建模批次過(guò)程控制問(wèn)題的有效途徑.以迭代軸作為參考方向,批次過(guò)程數(shù)據(jù)進(jìn)行在線積累和更新;以時(shí)間軸作為參考方向,批次過(guò)程數(shù)據(jù)進(jìn)行離線存儲(chǔ)和調(diào)用.批次過(guò)程控制特有的2D 結(jié)構(gòu)要求數(shù)據(jù)采集和利用也必須迭代進(jìn)行.神經(jīng)網(wǎng)絡(luò)模型具有超強(qiáng)的非線性映射能力、泛化能力、自學(xué)習(xí)和自適應(yīng)能力,在批次過(guò)程數(shù)據(jù)驅(qū)動(dòng)建模方面得到了廣泛關(guān)注.文獻(xiàn)[29]基于遞歸神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)非線性進(jìn)行重復(fù)辨識(shí),并利用過(guò)去批次的平均建模誤差對(duì)當(dāng)前批次的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行校正;文獻(xiàn)[55]基于批次過(guò)程數(shù)據(jù)進(jìn)行模糊神經(jīng)網(wǎng)絡(luò)建模,在當(dāng)前批次開(kāi)始前利用前幾批次存儲(chǔ)的過(guò)程數(shù)據(jù)更新模型參數(shù);文獻(xiàn)[73]利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對(duì)非線性批次過(guò)程進(jìn)行迭代建模,并采用最速下降法獲得網(wǎng)絡(luò)連接權(quán)值沿迭代軸的更新方程.

隨著工程數(shù)學(xué)與應(yīng)用物理的深度融合以及人工智能的迅猛發(fā)展,機(jī)理建模和數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)都日益成熟.然而,批次過(guò)程的 “多重時(shí)變”特性對(duì)其建模過(guò)程提出了許多新要求.首先,批次過(guò)程通常用于生產(chǎn)高精細(xì)化產(chǎn)品,控制系統(tǒng)需時(shí)刻保持高跟蹤精度,這對(duì)模型精確性提出了更高的要求.無(wú)論是機(jī)理建模方法還是數(shù)據(jù)驅(qū)動(dòng)建模方法都不可避免地存在建模誤差,利用迭代軸上累積的過(guò)程數(shù)據(jù)反復(fù)進(jìn)行誤差估計(jì)和補(bǔ)償是提高系統(tǒng)跟蹤精度的關(guān)鍵,也是批次過(guò)程迭代建模中的重點(diǎn)和難點(diǎn).其次,一個(gè)完整的批次過(guò)程通常包含多個(gè)操作階段,每個(gè)階段的動(dòng)態(tài)特性存在明顯差異,如何實(shí)現(xiàn)多階段精確建模和平滑切換是未來(lái)批次過(guò)程建模的重要研究方向.

2.2 優(yōu)化問(wèn)題

ILMPC 控制系統(tǒng)在每個(gè)采樣間隔需要求解基于2D 預(yù)測(cè)模型的約束優(yōu)化問(wèn)題.當(dāng)采用簡(jiǎn)單的線性模型為預(yù)測(cè)模型時(shí),優(yōu)化問(wèn)題的求解效率較快,但是線性模型與實(shí)際非線性過(guò)程的失配問(wèn)題會(huì)導(dǎo)致控制器的最優(yōu)性下降.當(dāng)直接采用較為準(zhǔn)確的非線性模型作為預(yù)測(cè)模型時(shí),盡管控制最優(yōu)性會(huì)得到一定程度的提升,但是運(yùn)用非線性規(guī)劃求解方法會(huì)導(dǎo)致每個(gè)采樣周期內(nèi)的計(jì)算負(fù)擔(dān)加重,從而造成控制效率的下降.ILMPC 優(yōu)化的研究難點(diǎn)主要在于如何實(shí)現(xiàn)最優(yōu)性和優(yōu)化計(jì)算效率間的平衡.

2.2.1 最優(yōu)性

對(duì)于基于預(yù)測(cè)模型的ILMPC 算法,提高控制最優(yōu)性的首要問(wèn)題是實(shí)現(xiàn)對(duì)模型誤差的有效補(bǔ)償.模型失配的程度越小,控制信號(hào)對(duì)于實(shí)際非線性批次過(guò)程的適用性就越高.文獻(xiàn)[37]將非線性批次過(guò)程辨識(shí)為線性脈沖響應(yīng)模型,在每個(gè)采樣間隔利用Kalman 濾波器對(duì)預(yù)測(cè)狀態(tài)進(jìn)行反饋校正,使控制信號(hào)的最優(yōu)性提高;文獻(xiàn)[54]在ILMPC 算法內(nèi)考慮了線性化導(dǎo)致的模型失配問(wèn)題,利用Lipschitz連續(xù)性條件將優(yōu)化目標(biāo)函數(shù)表示為真實(shí)跟蹤誤差的上界,從而提高控制輸入的最優(yōu)性.

對(duì)于帶不確定性的ILMPC 系統(tǒng)而言,魯棒性的提高通常會(huì)導(dǎo)致最優(yōu)性的下降.為降低系統(tǒng)不確定性對(duì)跟蹤性能的影響,魯棒ILMPC 的設(shè)計(jì)目標(biāo)通常是保證已知范圍內(nèi)的所有可能干擾對(duì)系統(tǒng)性能指標(biāo)的影響小于某一界限,或在參數(shù)不確定性包含的所有可能情況下滿足魯棒穩(wěn)定性條件.文獻(xiàn)[58]設(shè)定系統(tǒng)在所有可能參數(shù)下的目標(biāo)函數(shù)小于某一定值,不可避免地造成了控制器的保守性,在一定程度上犧牲了最優(yōu)性;文獻(xiàn)[59]針對(duì)約束批次過(guò)程設(shè)計(jì)基于終端橢圓不變集的魯棒ILMPC 策略,由于橢圓不變集無(wú)法實(shí)現(xiàn)終端域的最大化,這種保證2D 穩(wěn)定性的方法必然以犧牲最優(yōu)性為代價(jià).因此,在解決系統(tǒng)不確定性問(wèn)題時(shí),如何定性分析系統(tǒng)保守性并最大限度提高最優(yōu)性是一項(xiàng)重要研究?jī)?nèi)容.

僅從優(yōu)化層面上看,ILMPC 解的最優(yōu)性取決于采用的尋優(yōu)方法.在線性模型下,ILMPC 優(yōu)化問(wèn)題通常是簡(jiǎn)單的凸優(yōu)化問(wèn)題,其局部最優(yōu)解即是全局最優(yōu)解,因此尋優(yōu)方法通常不會(huì)影響解的最優(yōu)性;在非線性模型下,ILMPC 優(yōu)化問(wèn)題通常為非凸優(yōu)化問(wèn)題,可能存在多個(gè)局部最優(yōu)解,采用有下降參考的傳統(tǒng)尋優(yōu)方法計(jì)算量大,并容易陷入局部最優(yōu),導(dǎo)致解的最優(yōu)性下降.針對(duì)非凸優(yōu)化問(wèn)題,采用PSO、GA 等啟發(fā)式尋優(yōu)方法能大幅提高尋至全局最優(yōu)解的幾率,但是這類(lèi)尋優(yōu)方法需要的搜索時(shí)間相對(duì)較長(zhǎng),只適合于采樣間隔較大的慢變過(guò)程.在快變非線性批次過(guò)程中,如何達(dá)到最優(yōu)性和計(jì)算效率的最佳平衡是現(xiàn)今ILMPC 領(lǐng)域的難點(diǎn)問(wèn)題.

2.2.2 優(yōu)化計(jì)算效率

在實(shí)際非線性批次過(guò)程控制中,ILMPC 的優(yōu)化計(jì)算效率主要取決于兩個(gè)因素:預(yù)測(cè)模型和尋優(yōu)算法.降低模型復(fù)雜度和減小尋優(yōu)計(jì)算負(fù)擔(dān)是提高ILMPC 優(yōu)化效率的兩個(gè)重要途徑.通過(guò)對(duì)非線性系統(tǒng)進(jìn)行線性化獲得線性預(yù)測(cè)模型,可以有效降低模型復(fù)雜度,將復(fù)雜的ILMPC 非線性規(guī)劃問(wèn)題轉(zhuǎn)化為易于求解的線性規(guī)劃問(wèn)題[48].但任何降低模型復(fù)雜度的方法勢(shì)必會(huì)導(dǎo)致模型精確度下降,因此需要同時(shí)解決模型失配問(wèn)題.

在ILMPC 尋優(yōu)過(guò)程中,需要從初始點(diǎn)開(kāi)始進(jìn)行多步迭代才能到達(dá)局部最優(yōu)解,因此減小尋優(yōu)計(jì)算量應(yīng)從減少迭代步數(shù)或減小每步迭代的計(jì)算量這兩個(gè)角度出發(fā).減少迭代步數(shù)意味著加快尋優(yōu)算法的收斂速度.傳統(tǒng)尋優(yōu)算法如梯度下降法、牛頓下降法和拉格朗日乘子法等都在每一步迭代中提供了下降的方向和大小參考,因此收斂速度較快;基于窮舉搜索的網(wǎng)格法、基于隨機(jī)搜索的模擬退火算法以及基于啟發(fā)式搜索的PSO、GA 和蟻群算法(Ant colony optimization,ACO)的尋優(yōu)過(guò)程不依賴(lài)于下降參考,參數(shù)選擇和更新具有一定隨機(jī)性,搜索速度較慢,需要較長(zhǎng)的時(shí)間才能收斂到局部最優(yōu)解.為提高啟發(fā)式尋優(yōu)算法的收斂速度,交叉算法[74]、非線性慣性權(quán)重[75]、局部聚類(lèi)[76]等方案在GA、PSO 及ACO 中得到了應(yīng)用,同時(shí)還出現(xiàn)了大量將啟發(fā)式尋優(yōu)算法與傳統(tǒng)下降式尋優(yōu)算法結(jié)合的研究工作,比如PSO 梯度法[77]和蒙特卡洛梯度法[78].文獻(xiàn)[79]提出一種交替尋優(yōu)算法,強(qiáng)制每一步的損失函數(shù)小于前一步,并設(shè)置每次尋優(yōu)的最大迭代步數(shù)來(lái)減輕計(jì)算負(fù)擔(dān).在每一步計(jì)算中,減少可變參數(shù)的數(shù)量是提高計(jì)算效率的有效途徑.例如在梯度下降法中減少待優(yōu)化變量數(shù)量可以減少每步求導(dǎo)的次數(shù)和復(fù)雜程度,從而降低每步迭代的計(jì)算負(fù)擔(dān),提高整體計(jì)算效率.

對(duì)于快變非線性批次過(guò)程,現(xiàn)有的ILMPC 算法難以同時(shí)兼顧最優(yōu)性和計(jì)算效率的問(wèn)題.以尋優(yōu)算法的內(nèi)在機(jī)制為切入點(diǎn),對(duì)ILMPC 的目標(biāo)函數(shù)結(jié)構(gòu)進(jìn)行改造以提高尋優(yōu)算法收斂速度或減小每步迭代的計(jì)算量,是發(fā)展高效ILMPC 的潛在方法.

2.3 適應(yīng)性問(wèn)題

批次過(guò)程 “多重時(shí)變”的特點(diǎn)決定了其工況會(huì)隨批次或隨時(shí)間變化.ILMPC 的時(shí)域滾動(dòng)優(yōu)化機(jī)制可以有效處理時(shí)變問(wèn)題.但是經(jīng)典ILMPC 理論是基于批次過(guò)程的重復(fù)特性構(gòu)建的,對(duì)于沿批次的變工況問(wèn)題還沒(méi)有有效的解決方案.在批次生產(chǎn)過(guò)程中,產(chǎn)品類(lèi)型或生產(chǎn)條件的改變會(huì)導(dǎo)致系統(tǒng)初始狀態(tài)、參考軌跡、批次長(zhǎng)度和模型參數(shù)不斷發(fā)生變化[8].這造成ILMPC 所依賴(lài)的對(duì)象重復(fù)性前提被打破,難以發(fā)揮沿批次的學(xué)習(xí)作用.為將ILMPC 應(yīng)用于實(shí)際批次過(guò)程,必須設(shè)法提高它對(duì)變初始狀態(tài)、變參考軌跡、變批次長(zhǎng)度和變模型參數(shù)等工況的適應(yīng)能力.ILMPC 理論的奠基者Lee 早在2007 年就明確指出,ILMPC 研究的一個(gè)重要方向就是在變工況下實(shí)現(xiàn)批次間跟蹤誤差信息的有效轉(zhuǎn)換[17].

2.3.1 變初始狀態(tài)

現(xiàn)有的ILMPC 算法大多要求系統(tǒng)的迭代初態(tài)在每一批次都嚴(yán)格定位在期望初態(tài)上,從而實(shí)現(xiàn)對(duì)二維系統(tǒng)穩(wěn)定性的嚴(yán)格證明.但是實(shí)際環(huán)境中的重復(fù)定位操作會(huì)導(dǎo)致系統(tǒng)存在初態(tài)偏移,且每個(gè)批次的偏移量大小都是隨機(jī)的,這直接影響到系統(tǒng)的時(shí)域閉環(huán)穩(wěn)定性和迭代域誤差收斂性.ILC 通常只考慮沿批次的一維(One-dimensional,1D)無(wú)約束學(xué)習(xí)律優(yōu)化,可以直接將初始狀態(tài)偏差量或其范圍代入系統(tǒng)動(dòng)態(tài)方程,獲得跟蹤誤差沿迭代軸漸近收斂的充分條件[80-82].文獻(xiàn)[83]基于2D Roesser 模型對(duì)ILC 系統(tǒng)在變初始狀態(tài)下的收斂性開(kāi)展了理論分析,證實(shí)了必定存在一種D 型學(xué)習(xí)律使系統(tǒng)跟蹤誤差沿迭代軸漸近收斂至零.文獻(xiàn)[84]進(jìn)一步證明了PD 型學(xué)習(xí)律下ILC 系統(tǒng)的跟蹤誤差在變初始狀態(tài)下必有界.在此基礎(chǔ)上,文獻(xiàn)[85]設(shè)計(jì)了一種自適應(yīng)ILC 學(xué)習(xí)律,使系統(tǒng)輸入同時(shí)根據(jù)離線數(shù)據(jù)和在線數(shù)據(jù)沿迭代軸進(jìn)行更新,保證初始狀態(tài)有界時(shí)系統(tǒng)跟蹤誤差沿迭代軸漸近收斂至零.與ILC 策略不同,ILMPC 在每個(gè)采樣時(shí)刻進(jìn)行滾動(dòng)時(shí)域優(yōu)化,初始條件的變化會(huì)對(duì)約束系統(tǒng)的時(shí)域穩(wěn)定性產(chǎn)生很大影響,進(jìn)而危及迭代收斂性.若初始狀態(tài)在某一批次跳出被控系統(tǒng)吸引域,該批次內(nèi)跟蹤誤差無(wú)法穩(wěn)定到最優(yōu)值.基于不穩(wěn)定的前置控制經(jīng)驗(yàn),后續(xù)批次的跟蹤精度和收斂速度都會(huì)明顯降低.因此,在系統(tǒng)初始狀態(tài)有界變化的情況下設(shè)計(jì)2D 穩(wěn)定ILMPC策略十分必要.

2.3.2 變參考軌跡

在實(shí)際批次生產(chǎn)中,同一生產(chǎn)線通常需要承擔(dān)不同種類(lèi)、不同規(guī)格產(chǎn)品的生產(chǎn)任務(wù),導(dǎo)致系統(tǒng)的參考軌跡會(huì)隨批次發(fā)生變化,因此變參考軌跡問(wèn)題一直是批次過(guò)程控制的研究熱點(diǎn).對(duì)于具有2D 結(jié)構(gòu)的ILMPC 而言,變參考軌跡帶來(lái)的影響不僅體現(xiàn)在迭代軸上,還會(huì)沿時(shí)間方向持續(xù),給ILMPC 的系統(tǒng)性能分析帶來(lái)了很大困難.相比之下,采用沿批次的一維ILC 控制,只需在迭代方向上考慮參考軌跡變化量,通過(guò)常規(guī)收斂性分析手段就可以推導(dǎo)出修正后的收斂性條件.因此,現(xiàn)有研究工作在變參考軌跡下的批次過(guò)程控制中基本都采用1D 的改進(jìn)ILC 方法.文獻(xiàn)[86]針對(duì)隨機(jī)系統(tǒng)變軌跡跟蹤問(wèn)題,提出兩種自適應(yīng)ILC 策略,一是在控制器設(shè)計(jì)中選擇當(dāng)前批次的輸出軌跡與下一批次的參考軌跡的差值作為新的狀態(tài)變量,另一種是在每一個(gè)批次的末尾利用卡爾曼濾波器重新進(jìn)行系統(tǒng)辨識(shí);文獻(xiàn)[87]針對(duì)離散非線性系統(tǒng),設(shè)計(jì)模糊自適應(yīng)ILC 控制器,通過(guò)不斷更新模糊參數(shù)來(lái)近似變參考軌跡下的系統(tǒng)動(dòng)態(tài);文獻(xiàn)[25]設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)ILC控制器,引入當(dāng)前批次的參考軌跡作為反饋,并將過(guò)去批次的參考軌跡作為前饋以實(shí)現(xiàn)對(duì)變參考軌跡的跟蹤.然而,1D 的ILC 算法仍存在實(shí)時(shí)抗干擾能力差、無(wú)法保證時(shí)域穩(wěn)定性和收斂速度慢等弊端,亟需探索能夠解決變參考軌跡跟蹤控制問(wèn)題的2D穩(wěn)定ILMPC 策略.

2.3.3 變批次長(zhǎng)度

經(jīng)典批次過(guò)程控制假設(shè)每個(gè)批次的操作長(zhǎng)度完全一致,并基于此前提建立學(xué)習(xí)機(jī)制.但在實(shí)際批次過(guò)程中,生產(chǎn)周期改變、傳動(dòng)裝置誤差以及不可控人為因素都會(huì)導(dǎo)致批次長(zhǎng)度沿批次不斷變化[88].變批次長(zhǎng)度問(wèn)題的關(guān)鍵在于對(duì)過(guò)程信息的整合.ILMPC 依靠前一批次的控制經(jīng)驗(yàn)調(diào)整當(dāng)前批次的控制信號(hào).當(dāng)相鄰批次的長(zhǎng)度不等時(shí),必然會(huì)出現(xiàn)信息過(guò)剩或者信息不足的情況,需要進(jìn)行信息刪減或補(bǔ)償保證迭代學(xué)習(xí)沿批次按步推進(jìn).近年來(lái),已有許多學(xué)者針對(duì)批次過(guò)程控制中的變批次長(zhǎng)度問(wèn)題開(kāi)展了改進(jìn)的一維ILC 算法研究.為將各批次過(guò)程數(shù)據(jù)調(diào)整為相同長(zhǎng)度,文獻(xiàn)[88-95]設(shè)定所有缺失的誤差信息為零,文獻(xiàn)[96-98]將批次終端的誤差信號(hào)延長(zhǎng)至期望長(zhǎng)度;為綜合利用多歷史批次數(shù)據(jù),文獻(xiàn)[88-91]引入了迭代平均算子,利用歷史誤差數(shù)據(jù)的平均值更新ILC 學(xué)習(xí)律;文獻(xiàn)[94]采用高階學(xué)習(xí)結(jié)構(gòu),根據(jù)多個(gè)歷史批次誤差數(shù)據(jù)和輸入數(shù)據(jù)的加權(quán)值更新控制律.然而,以上方法過(guò)多使用了控制效果較差的早期批次運(yùn)行數(shù)據(jù),損失了迭代學(xué)習(xí)的最優(yōu)性.對(duì)此,文獻(xiàn)[99]提出一種基于改進(jìn)復(fù)合能量函數(shù)(Composite energy function,CEF)的迭代學(xué)習(xí)機(jī)制,令控制系統(tǒng)在每個(gè)采樣時(shí)刻只根據(jù)具有充足過(guò)程信息的最近一個(gè)批次更新學(xué)習(xí)律,實(shí)現(xiàn)了對(duì)新近批次的優(yōu)先學(xué)習(xí).綜合來(lái)看,現(xiàn)有的變長(zhǎng)度批次過(guò)程控制方法仍然在如下方面需要改進(jìn):首先,已有誤差修正方法僅致力于構(gòu)造等長(zhǎng)的批次數(shù)據(jù),而忽視了補(bǔ)充信息精確性對(duì)系統(tǒng)學(xué)習(xí)性能的影響.其次,現(xiàn)有的學(xué)習(xí)結(jié)構(gòu)通常缺乏靈活性,無(wú)法同時(shí)適應(yīng)學(xué)習(xí)數(shù)據(jù)為真實(shí)數(shù)據(jù)和補(bǔ)償數(shù)據(jù)的兩種情況.利用ILMPC 的時(shí)域預(yù)測(cè)功能能夠在變批次長(zhǎng)度工況下對(duì)缺失誤差信息實(shí)現(xiàn)更為準(zhǔn)確的補(bǔ)償;針對(duì)不同數(shù)據(jù)類(lèi)型需設(shè)計(jì)多種學(xué)習(xí)結(jié)構(gòu),有利于同時(shí)保證學(xué)習(xí)經(jīng)驗(yàn)的先進(jìn)性和實(shí)際性.如何在2D 框架下基于預(yù)測(cè)修正誤差進(jìn)行變學(xué)習(xí)模式的ILMPC 系統(tǒng)性能分析將是此課題的研究難點(diǎn).

2.3.4 變模型參數(shù)

除了上述的初始狀態(tài)、參考軌跡和批次長(zhǎng)度等外部條件,批次過(guò)程自身的動(dòng)態(tài)特性也會(huì)改變,通常體現(xiàn)為模型參數(shù)沿批次方向發(fā)生變化.ILMPC的二維預(yù)測(cè)和優(yōu)化高度依賴(lài)系統(tǒng)模型的一致性,變模型參數(shù)會(huì)破壞ILMPC 時(shí)域和迭代域上的遞歸可行性,增大了ILMPC 二維穩(wěn)定性分析的難度.目前,關(guān)于批次過(guò)程變模型參數(shù)控制的研究仍局限在ILC 領(lǐng)域.在模型參數(shù)已知或可估計(jì)的情況下,ILC可以通過(guò)在更新方程中直接代入變模型參數(shù)或其上界,構(gòu)造自適應(yīng)或魯棒學(xué)習(xí)律提高算法適應(yīng)性,并基于1D 控制結(jié)構(gòu)推導(dǎo)出系統(tǒng)的顯式收斂條件.文獻(xiàn)[100-103]均采用線性高階內(nèi)部模型(High-order internal model,HOIM)描述隨批次變化的系統(tǒng)動(dòng)態(tài)特性,構(gòu)造自適應(yīng)ILC 策略得到系統(tǒng)的漸近收斂條件;文獻(xiàn)[104-106]和文獻(xiàn)[107]分別就變參數(shù)狀態(tài)空間模型和變參數(shù)輸入輸出模型給出了線性系統(tǒng)在一般開(kāi)環(huán)學(xué)習(xí)律控制下的有界條件和收斂條件;文獻(xiàn)[108]結(jié)合廣義擴(kuò)展?fàn)顟B(tài)觀測(cè)器(Generalized extended state observer,GESO),基于變參數(shù)線性狀態(tài)空間模型設(shè)計(jì)二自由度閉環(huán)魯棒ILC 策略,保證了系統(tǒng)跟蹤誤差的有界性.借鑒ILC 領(lǐng)域的理論成果,在ILMPC 中設(shè)計(jì)自適應(yīng)和魯棒控制結(jié)構(gòu)將是處理變模型參數(shù)問(wèn)題的可行方案.然而,在改進(jìn)ILMPC 結(jié)構(gòu)中如何確保二維遞歸可行并盡可能降低系統(tǒng)保守性仍是一個(gè)頗具難度的復(fù)雜問(wèn)題.

綜上,ILMPC 特有的二維控制結(jié)構(gòu)給其建模、優(yōu)化和穩(wěn)定性都帶來(lái)了巨大挑戰(zhàn)(如圖6 所示).在建模中實(shí)現(xiàn)多階段迭代誤差估計(jì)和補(bǔ)償,在優(yōu)化中實(shí)現(xiàn)最優(yōu)性和計(jì)算效率的平衡,在穩(wěn)定性分析中突破嚴(yán)重復(fù)性條件的桎梏,是ILMPC 理論中亟待解決的三個(gè)關(guān)鍵科學(xué)問(wèn)題.

圖6 ILMPC 的挑戰(zhàn)Fig.6 Challenges of ILMPC

3 當(dāng)前研究動(dòng)態(tài)

隨著控制工程界對(duì)批次過(guò)程與連續(xù)過(guò)程的界定愈加清晰,在過(guò)去20 年間迭代學(xué)習(xí)模型預(yù)測(cè)控制立足于批次過(guò)程特有的 “多重時(shí)變”性質(zhì)向著更深的理論層次發(fā)展.ILMPC 二維時(shí)變框架下的建模、優(yōu)化及適應(yīng)性等瓶頸問(wèn)題都得到了越來(lái)越多的關(guān)注,衍生了一系列優(yōu)秀的階段性成果.總體來(lái)看,ILMPC當(dāng)前研究工作主要集中于兩個(gè)方向:

1) 由基于機(jī)理模型的ILMPC 向基于數(shù)據(jù)模型的ILMPC 過(guò)渡.ILC 作為無(wú)模型算法,通過(guò)學(xué)習(xí)積累的歷史批次數(shù)據(jù)實(shí)現(xiàn)對(duì)參考軌跡的高精度跟蹤,實(shí)際上是一種數(shù)據(jù)驅(qū)動(dòng)控制策略.而MPC 作為一種基于預(yù)測(cè)模型的優(yōu)化控制算法,其時(shí)域控制效果很大程度上依賴(lài)于對(duì)系統(tǒng)動(dòng)態(tài)模型的精確掌握.ILMPC 繼承了ILC 的學(xué)習(xí)能力和MPC 的時(shí)域魯棒性,但同時(shí)也丟失了ILC 不依賴(lài)控制對(duì)象模型的優(yōu)勢(shì).當(dāng)被控批次過(guò)程具有復(fù)雜非線性特征,難以建立精確機(jī)理模型時(shí),經(jīng)典ILMPC 的實(shí)施面臨很大困難.隨著機(jī)器學(xué)習(xí)在本世紀(jì)的井噴式發(fā)展,很多學(xué)者開(kāi)始利用神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)等方法對(duì)ILMPC的控制結(jié)構(gòu)進(jìn)行轉(zhuǎn)化,建立數(shù)據(jù)驅(qū)動(dòng)ILMPC 算法,直接基于歷史數(shù)據(jù)辨識(shí)被控系統(tǒng)的2D 動(dòng)態(tài)特性用于時(shí)域預(yù)測(cè),打破了模型預(yù)知這一嚴(yán)苛條件對(duì)ILMPC理論深化和應(yīng)用拓展的束縛.

2) 對(duì)已有的ILMPC 理論進(jìn)行擴(kuò)展和改進(jìn),使其滿足批次過(guò)程在承擔(dān)不同生產(chǎn)任務(wù)時(shí)的特殊需求.批次過(guò)程類(lèi)型眾多、生產(chǎn)條件各異,從系統(tǒng)動(dòng)態(tài)上可分為快時(shí)變和慢時(shí)變,從運(yùn)行條件上可分為設(shè)計(jì)工況和變工況.對(duì)于快時(shí)變批次過(guò)程,需要在ILMPC 設(shè)計(jì)中關(guān)注控制器的計(jì)算效率問(wèn)題,確保控制的實(shí)時(shí)性.對(duì)于存在變初始狀態(tài)、變參考軌跡、變批次長(zhǎng)度以及變模型參數(shù)等變工況擾動(dòng)的批次過(guò)程,必須在ILMPC 設(shè)計(jì)中解決其引發(fā)的系統(tǒng)不確定性問(wèn)題.近年來(lái),ILMPC 研究領(lǐng)域的學(xué)者利用魯棒、自適應(yīng)、模糊、神經(jīng)網(wǎng)絡(luò)以及預(yù)測(cè)函數(shù)等先進(jìn)技術(shù),對(duì)經(jīng)典ILMPC 框架進(jìn)行了系統(tǒng)而深入的改進(jìn),針對(duì)性地解決了實(shí)際批次過(guò)程的控制需求,極大地豐富了ILMPC 的理論體系和應(yīng)用場(chǎng)景.

3.1 數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)模型預(yù)測(cè)控制

隨著工業(yè)過(guò)程的生產(chǎn)規(guī)模及結(jié)構(gòu)復(fù)雜性不斷增長(zhǎng),許多批次過(guò)程呈現(xiàn)出強(qiáng)非線性動(dòng)態(tài)特性,難以通過(guò)分析生產(chǎn)過(guò)程的內(nèi)部機(jī)制或者物質(zhì)流的傳遞機(jī)理獲取其精確機(jī)理模型.近年來(lái),直接利用離線數(shù)據(jù)進(jìn)行優(yōu)化控制的方法備受關(guān)注.在當(dāng)前階段,數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)模型預(yù)測(cè)控制的研究方向大致分為兩類(lèi):

1) 基于批次過(guò)程不斷產(chǎn)生的有限時(shí)域過(guò)程數(shù)據(jù)利用神經(jīng)網(wǎng)絡(luò)沿迭代軸辨識(shí)系統(tǒng)的二維預(yù)測(cè)模型,再基于神經(jīng)網(wǎng)絡(luò)模型進(jìn)行ILMPC 的優(yōu)化求解.針對(duì)仿射型非線性批次過(guò)程,文獻(xiàn)[56]采用控制仿射型前饋神經(jīng)網(wǎng)絡(luò)(Control affine feedforward neural network,CAFNN)對(duì)復(fù)雜非線性批次過(guò)程的重復(fù)動(dòng)態(tài)特性進(jìn)行迭代建模,構(gòu)建基于Tube 的數(shù)據(jù)驅(qū)動(dòng)ILMPC,保證在存在建模誤差時(shí)系統(tǒng)跟蹤軌跡能夠收斂至參考軌跡附近的不變集內(nèi);針對(duì)非仿射型非線性批次過(guò)程,文獻(xiàn)[73]采用了徑向基(Radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)對(duì)其動(dòng)態(tài)特性進(jìn)行辨識(shí),并在數(shù)據(jù)驅(qū)動(dòng)ILMPC 中結(jié)合CEF 實(shí)現(xiàn)建模誤差和跟蹤誤差沿迭代軸的收斂.

2) 直接利用系統(tǒng)離線數(shù)據(jù)擬合每個(gè)批次內(nèi)輸入序列與輸出序列間的轉(zhuǎn)移矩陣,基于所得輸入輸出模型對(duì)未來(lái)多個(gè)批次的輸出序列進(jìn)行預(yù)測(cè).文獻(xiàn)[109-110]針對(duì)預(yù)測(cè)所需未來(lái)批次過(guò)程動(dòng)態(tài)無(wú)法獲得的難題,提出了一種基于不斷積累的批次過(guò)程離線數(shù)據(jù)估計(jì)未來(lái)批次系統(tǒng)轉(zhuǎn)移矩陣的新算法,成功構(gòu)造了沿迭代軸的數(shù)據(jù)驅(qū)動(dòng)ILMPC 策略;文獻(xiàn)[30]考慮批次過(guò)程不確定性未知的情況,利用離線數(shù)據(jù)中包含的過(guò)程信息對(duì)未來(lái)批次的系統(tǒng)整體動(dòng)態(tài)進(jìn)行預(yù)測(cè),消除不確定項(xiàng)對(duì)ILMPC 跟蹤性能的影響.

3.2 高效迭代學(xué)習(xí)模型預(yù)測(cè)控制

為了適應(yīng)工業(yè)機(jī)器人[111]、運(yùn)載工具[112]以及快速化學(xué)反應(yīng)器[113]等快動(dòng)態(tài)非線性批次過(guò)程的高效率控制需求,建立計(jì)算負(fù)擔(dān)低的優(yōu)化控制策略也是現(xiàn)今ILMPC 領(lǐng)域的研究熱點(diǎn)之一.通常采用的手段是將控制對(duì)象復(fù)雜的非線性動(dòng)態(tài)表征為線性形式,從而實(shí)現(xiàn)非凸優(yōu)化問(wèn)題到凸優(yōu)化問(wèn)題的轉(zhuǎn)化,降低優(yōu)化求解的在線計(jì)算量.文獻(xiàn)[114]介紹了一種即時(shí)學(xué)習(xí)(Just-in-time-learning,JITL)方法,根據(jù)輸入輸出數(shù)據(jù)將非線性模型沿標(biāo)稱(chēng)軌跡線性化,建立線性時(shí)變參數(shù)模型;文獻(xiàn)[115]直接沿參考軌跡通過(guò)泰勒展開(kāi)線性化非線性模型,并在控制器設(shè)計(jì)中對(duì)線性化高階項(xiàng)誤差進(jìn)行補(bǔ)償,能夠同時(shí)保證計(jì)算效率和跟蹤精度.

此外,降低待優(yōu)化變量維數(shù)也是提高控制效率的有效途徑之一.文獻(xiàn)[115-116]在時(shí)域控制上采用了具有特殊結(jié)構(gòu)的預(yù)測(cè)函數(shù)控制,通過(guò)將待優(yōu)化變量表示為一系列基函數(shù)的加權(quán)和,將維數(shù)較高的控制時(shí)域輸入序列求解問(wèn)題轉(zhuǎn)變?yōu)榫S數(shù)較低的基函數(shù)權(quán)重系數(shù)序列求解問(wèn)題,從而顯著提高在線求解速度.

3.3 變工況迭代學(xué)習(xí)模型預(yù)測(cè)控制

變工況控制是拓展ILMPC 策略應(yīng)用范圍必須克服的難點(diǎn)問(wèn)題.隨著經(jīng)典ILMPC 理論逐漸發(fā)展成熟,近幾年來(lái)變初始條件、變參考軌跡以及變批次長(zhǎng)度等工程實(shí)踐問(wèn)題受到越來(lái)越多專(zhuān)家學(xué)者的關(guān)注,打破經(jīng)典ILMPC 要求各批次工況完全一致帶來(lái)的應(yīng)用桎梏已成為當(dāng)前研究亟需解決的問(wèn)題.

針對(duì)變初始條件問(wèn)題,通常有兩種解決思路.一是構(gòu)造基于終端約束的ILMPC 策略[117],利用可行初始狀態(tài)軌跡計(jì)算控制器的終端約束集及終端代價(jià)函數(shù),并通過(guò)迭代逐步提高控制最優(yōu)性;二是先采用固定初態(tài)的系統(tǒng)方程進(jìn)行二維預(yù)測(cè),再通過(guò)系統(tǒng)真實(shí)輸出與預(yù)測(cè)輸出的差值數(shù)據(jù)對(duì)控制律更新方程不斷修正[118].

有關(guān)變參考軌跡的ILMPC 研究工作主要分為兩個(gè)方向:經(jīng)過(guò)固定期望點(diǎn)的變參考軌跡跟蹤控制和全區(qū)間變參考軌跡跟蹤控制.前一研究方向針對(duì)只需在部分采樣點(diǎn)跟蹤參考值的特定批次過(guò)程,設(shè)定系統(tǒng)參考軌跡為穿越各個(gè)期望點(diǎn)的隨機(jī)軌跡,將參考軌跡跟蹤問(wèn)題縮小為固定點(diǎn)跟蹤問(wèn)題,通過(guò)建立點(diǎn)對(duì)點(diǎn)ILMPC 策略[51,119],保證系統(tǒng)對(duì)期望點(diǎn)的跟蹤精度;后一研究方向針對(duì)參考軌跡全工作區(qū)間變化的一般情況,將其變化量表示為ILMPC 的迭代擾動(dòng)項(xiàng),結(jié)合魯棒控制技術(shù)加以抑制[120-121],保證系統(tǒng)對(duì)整個(gè)參考軌跡的跟蹤精度.

ILMPC 算法的核心思想是在滾動(dòng)時(shí)域下基于前一批次的控制經(jīng)驗(yàn)對(duì)當(dāng)前批次的控制輸入進(jìn)行校正,其中隱含了相鄰批次等長(zhǎng)的條件.變批次長(zhǎng)度打破了迭代學(xué)習(xí)功能依賴(lài)的基本前提,給ILMPC的2D 遞歸可行性和穩(wěn)定性分析帶來(lái)了巨大挑戰(zhàn).因此,變批次長(zhǎng)度是實(shí)現(xiàn)ILMPC 所面臨的最嚴(yán)峻的變工況問(wèn)題,目前還沒(méi)有建立與之相對(duì)應(yīng)的完善的ILMPC 策略.文獻(xiàn)[122]中討論了一種具有預(yù)測(cè)功能的改進(jìn)ILC 策略,通過(guò)建立系統(tǒng)輸入輸出預(yù)測(cè)模型,采用預(yù)測(cè)值對(duì)數(shù)據(jù)缺失的批次進(jìn)行補(bǔ)充,將每一批次的過(guò)程數(shù)據(jù)重構(gòu)為相等長(zhǎng)度.這為在ILMPC中建立缺失信息預(yù)測(cè)補(bǔ)償機(jī)制提供了參考,在此基礎(chǔ)上繼續(xù)探索變批次長(zhǎng)度下的多學(xué)習(xí)模式和2D 性能分析方法是當(dāng)今ILMPC 的理論研究新趨勢(shì).

3.4 迭代學(xué)習(xí)模型預(yù)測(cè)控制的應(yīng)用動(dòng)態(tài)

迭代學(xué)習(xí)模型預(yù)測(cè)控制理論正朝著無(wú)模型、強(qiáng)魯棒性、強(qiáng)適應(yīng)性的方向迅速發(fā)展,這為其在實(shí)際工業(yè)過(guò)程中的應(yīng)用提供了有力支撐.截至目前,ILMPC策略已在化工[123-127]、電力[46]、供熱[128]、醫(yī)療[129-131]、精密儀器[132]等多個(gè)領(lǐng)域取得成功應(yīng)用.香港科技大學(xué)高福榮教授團(tuán)隊(duì)在注塑過(guò)程迭代學(xué)習(xí)模型預(yù)測(cè)控制方面開(kāi)展了卓有成效的研究工作[47,50,123],實(shí)現(xiàn)了對(duì)注射速度的精準(zhǔn)控制,提升了注塑產(chǎn)品質(zhì)量和生產(chǎn)效益.山東科技大學(xué)王友清教授團(tuán)隊(duì)將ILMPC成功應(yīng)用于人工胰臟智能控制[129-131],根據(jù)患者血糖動(dòng)態(tài)變化實(shí)時(shí)調(diào)節(jié)胰島素注射速度.

ILMPC 的實(shí)際應(yīng)用不僅限于化學(xué)反應(yīng)器、注塑機(jī)、機(jī)械手臂等典型間歇過(guò)程,也廣泛滲透于發(fā)電、供熱、煉鋼等典型連續(xù)過(guò)程.對(duì)于動(dòng)態(tài)變化具有重復(fù)性的連續(xù)過(guò)程,可以對(duì)其操作流程進(jìn)行人為的周期劃分,構(gòu)造ILMPC 所需的 “迭代軸”.目前,基于模糊建模的ILMPC 已應(yīng)用至火力發(fā)電控制[46],通過(guò)迭代學(xué)習(xí)周期性歷史數(shù)據(jù)保證了對(duì)負(fù)荷指令的快速、準(zhǔn)確跟蹤.這種周期劃分方法打破了迭代學(xué)習(xí)模型預(yù)測(cè)控制與連續(xù)過(guò)程間的應(yīng)用屏障,ILMPC將向著應(yīng)用場(chǎng)景多樣化、應(yīng)用形式靈活化的方向繼續(xù)發(fā)展.

4 未來(lái)研究方向展望

作為智能制造的重要生產(chǎn)方式,批次過(guò)程的最終控制目標(biāo)是保證各批次持續(xù)產(chǎn)出高質(zhì)量成品,提高經(jīng)濟(jì)效益和社會(huì)效益.結(jié)合迭代學(xué)習(xí)模型預(yù)測(cè)控制的發(fā)展現(xiàn)狀和批次過(guò)程控制的特殊需求,ILMPC的未來(lái)研究工作需要在解決復(fù)雜非線性建模、2D高效優(yōu)化以及變工況適應(yīng)性的基礎(chǔ)上綜合考慮批次生產(chǎn)過(guò)程的經(jīng)濟(jì)性問(wèn)題,其途徑主要包含兩個(gè)層面:設(shè)計(jì)成品質(zhì)量預(yù)測(cè)和控制策略、建立二維動(dòng)態(tài)經(jīng)濟(jì)優(yōu)化機(jī)制.

4.1 成品質(zhì)量控制

實(shí)際批次過(guò)程通常無(wú)法直接監(jiān)測(cè)產(chǎn)品質(zhì)量,大多通過(guò)測(cè)量溫度、壓力等過(guò)程參量并令其跟蹤預(yù)設(shè)的變化軌跡保證成品質(zhì)量.因此,ILMPC 自誕生以來(lái)大都以跟蹤預(yù)定軌跡為控制目標(biāo).但是各批次間配料和進(jìn)程的偏差以及隨機(jī)干擾都會(huì)導(dǎo)致既定的參考軌跡不再具有質(zhì)量最優(yōu)性.在ILMPC 基礎(chǔ)上建立質(zhì)量評(píng)價(jià)體系,沿時(shí)間軸同時(shí)進(jìn)行系統(tǒng)輸出序列和成品質(zhì)量預(yù)測(cè),共同優(yōu)化參考軌跡跟蹤性能和成品質(zhì)量指標(biāo),能夠?qū)崿F(xiàn)對(duì)批次過(guò)程產(chǎn)品質(zhì)量的實(shí)時(shí)調(diào)控.基于此思想,韓國(guó)學(xué)者Lee 等提出了早期的質(zhì)量批次模型預(yù)測(cè)控制(Quality BMPC,QBMPC)策略[133-135],利用推斷控制技術(shù)推導(dǎo)在線過(guò)程可測(cè)變量與成品質(zhì)量間的相關(guān)性模型(又稱(chēng)軟傳感器),并將其與系統(tǒng)動(dòng)態(tài)模型組合形成增廣預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)成品質(zhì)量的實(shí)時(shí)預(yù)測(cè)和優(yōu)化(圖7).該策略在甲基丙烯酸甲酯(Methyl methacrylate,MMA)聚合反應(yīng)控制中取得成功應(yīng)用[136].

圖7 QBMPC 結(jié)構(gòu)Fig.7 Scheme of QBMPC

然而,批次過(guò)程的成品質(zhì)量與過(guò)程因素及環(huán)境因素都存在著錯(cuò)綜復(fù)雜的關(guān)系,無(wú)論是線性相關(guān)模型還是非線性回歸模型都難以對(duì)其進(jìn)行可靠、準(zhǔn)確的預(yù)測(cè),這導(dǎo)致QBMPC 的研究熱潮僅在本世紀(jì)初曇花一現(xiàn),隨后便一直處于發(fā)展停滯狀態(tài).現(xiàn)今工業(yè)大數(shù)據(jù)及人工智能技術(shù)的迅速崛起有望為QBMPC 注入新的活力,依靠實(shí)際批次過(guò)程豐富的數(shù)據(jù)支持和神經(jīng)網(wǎng)絡(luò)強(qiáng)大的辨識(shí)能力,建立精確的成品質(zhì)量預(yù)測(cè)模型將不再是難題,高度發(fā)展的數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)將使QBMPC 策略重新成為批次過(guò)程控制領(lǐng)域的研究熱點(diǎn).

4.2 動(dòng)態(tài)經(jīng)濟(jì)性

為實(shí)現(xiàn)運(yùn)行優(yōu)化與反饋控制的有效結(jié)合[137-138],實(shí)際批次過(guò)程通常采用分層控制結(jié)構(gòu)[139-140],如圖8(a)所示.在實(shí)時(shí)優(yōu)化層(Real-time optimization,RTO)優(yōu)化經(jīng)濟(jì)性能指標(biāo)獲得最優(yōu)參考軌跡,再將參考軌跡傳遞給動(dòng)態(tài)控制層進(jìn)行跟蹤控制.ILMPC 策略通常應(yīng)用于動(dòng)態(tài)控制層,利用其迭代學(xué)習(xí)和滾動(dòng)優(yōu)化的特點(diǎn),實(shí)現(xiàn)對(duì)參考軌跡的高精度穩(wěn)定跟蹤.然而,這種分層結(jié)構(gòu)只在上層考慮了系統(tǒng)經(jīng)濟(jì)性能,丟失了動(dòng)態(tài)跟蹤過(guò)程中的經(jīng)濟(jì)信息.當(dāng)被控過(guò)程出現(xiàn)模型失配、隨機(jī)干擾等不確定性時(shí),上層優(yōu)化得到的參考軌跡不再是動(dòng)態(tài)跟蹤過(guò)程的經(jīng)濟(jì)最優(yōu)軌跡.

圖8 傳統(tǒng)分層控制結(jié)構(gòu)與ILEMPC 結(jié)構(gòu)對(duì)比Fig.8 Comparison of hierarchical control structure and ILEMPC structure

經(jīng)濟(jì)模型預(yù)測(cè)控制(Economic model predictive control,EMPC)將實(shí)時(shí)優(yōu)化和動(dòng)態(tài)控制融合在一個(gè)框架下實(shí)現(xiàn),直接采用經(jīng)濟(jì)性能指標(biāo)作為動(dòng)態(tài)跟蹤問(wèn)題的目標(biāo)函數(shù),可以有效提高系統(tǒng)動(dòng)態(tài)經(jīng)濟(jì)性能[141-143].近期,許多學(xué)者開(kāi)始嘗試將EMPC 理念與傳統(tǒng)ILMPC 結(jié)合[144-147],形成了迭代學(xué)習(xí)經(jīng)濟(jì)模型預(yù)測(cè)控制(Iterative learning economic model predictive control,ILEMPC),它通過(guò)優(yōu)化基于前次迭代數(shù)據(jù)的滾動(dòng)時(shí)域經(jīng)濟(jì)性能指標(biāo)獲得每一時(shí)刻的控制輸入,其結(jié)構(gòu)如圖8(b)所示.與經(jīng)典ILMPC沿迭代軸提高跟蹤精度不同,ILEMPC 沿迭代軸直接實(shí)現(xiàn)系統(tǒng)經(jīng)濟(jì)性能的穩(wěn)步提升,目前已在間歇化學(xué)反應(yīng)器[145-146]和太陽(yáng)能熱水器[148]控制中取得成功應(yīng)用.

然而,作為一種新興控制結(jié)構(gòu),ILEMPC 在控制性能定性分析方面還存在明顯欠缺.首先,經(jīng)濟(jì)目標(biāo)函數(shù)通常具有非二次型形式,使得傳統(tǒng)的終端約束集方法無(wú)法保證系統(tǒng)的時(shí)域Lyapunov 穩(wěn)定性,進(jìn)而會(huì)影響迭代收斂性.如何將EMPC 的穩(wěn)定性理論(如基于強(qiáng)耗散性的終端約束EMPC[142]、基于Lyapunov 收縮約束的雙模EMPC[149])運(yùn)用至二維的ILEMPC 系統(tǒng)是未來(lái)研究的重要內(nèi)容;其次,與傳統(tǒng)ILMPC 算法需保證跟蹤誤差沿迭代軸收斂至最小值不同,ILEMPC 追求的是動(dòng)態(tài)經(jīng)濟(jì)性能沿迭代軸收斂至最優(yōu).對(duì)于各類(lèi)批次過(guò)程如何設(shè)定經(jīng)濟(jì)目標(biāo)函數(shù)并建立合理的經(jīng)濟(jì)性能迭代分析方案是ILEMPC 在未來(lái)發(fā)展中必須解決的關(guān)鍵問(wèn)題.

總體來(lái)說(shuō),ILMPC 理論在過(guò)去20 多年間呈現(xiàn)快速發(fā)展趨勢(shì),在變工況適應(yīng)性、魯棒性、控制效率等方面已取得矚目成績(jī),在經(jīng)濟(jì)性方面正以完善理論體系、拓寬應(yīng)用范圍為目標(biāo)逐步深入.未來(lái)ILMPC的理論研究需緊密跟隨批次過(guò)程智能化、精細(xì)化的趨勢(shì),在深化迭代學(xué)習(xí)功能的同時(shí)加強(qiáng)與工業(yè)大數(shù)據(jù)的交互,汲取工業(yè)控制領(lǐng)域與其他交叉學(xué)科的最新成果,實(shí)現(xiàn)在精度、靈活性、安全性、高效性等控制性能上的不斷提升,并兼顧對(duì)現(xiàn)有2D 穩(wěn)定性分析方法的拓展和突破.