王建宏,朱永紅
(景德鎮陶瓷學院機電系,江西 景德鎮333403)
兩自由度控制器的直接數據驅動辨識
王建宏,朱永紅
(景德鎮陶瓷學院機電系,江西 景德鎮333403)
研究閉環條件下非線性系統對象存在時,非線性控制器和線性控制器的數據驅動辨識問題。為避免對非線性系統的建模,對于非線性控制器的設計,將其轉化為非線性函數在某基函數展開下的辨識;對于線性控制器的設計,引進虛擬參考反饋校正思想,采用遞推最小二乘辨識法來辨識線性控制器參數。在閉環系統結構中,增加關于非線性系統的利普希茨連續性假設,定義非線性系統的有限增益穩定性;推導需保證非線性系統對象的輸出為有限增益時,某特定利普希茨常數應滿足的不等式條件;給出跟蹤誤差的上界值。最后利用某仿真算例來驗證方法的有效性。
兩自由度;直接數據驅動辨識;虛擬參考反饋校正;支持向量機
因控制器設計的主要困難是在于需同時考慮控制輸入和由反饋帶來的外部擾動之間的相互作用性,此相互性使得整個閉環系統中的某些變量間存在耦合現象。為避免此耦合性對控制器性能的影響,常需要引入解耦。對于控制器的設計,常采用基于模型的控制器設計策略,即事先假設系統中的被控對象的數學模型是已知的,控制器的設計圍繞已知的系統模型來展開[1]。在實際的工業控制應用過程中,系統模型的數學描述是很難獲得的,獲取過程往往需要付出很大的精力和財力。
當被控對象的模型辨識不準確時,可重復建模過程,直至得到滿意的模型。此復雜過程可敘述為:模型辨識—模型檢驗—模型辨識—模型檢驗—控制器設計。其中模型辨識是屬于系統辨識范疇,其過程是僅利用整個閉環系統的輸入—輸出觀測數據對來辨識系統。為簡化控制器設計的建模過程,嘗試直接利用輸入—輸出觀測數據對設計控制器,繞開系統對象的建模。此思路即為直接數據驅動的含義,即不僅利用數據來驅動整個閉環系統,還讓數據來給出合適控制器的大致概貌。
在閉環系統中,當系統對象為非線性形式時,對于非線性控制器的設計,需要深入研究非線性系統的本質;對于線性控制器的設計可采用成熟的方法。文獻[1]采用虛擬參考反饋校正思想,將非線性控制器建模成輸出觀測數據序列的直接加權和形式,采用最優必要條件來辨識加權值。文獻[2]采用數據學習法來設計非線性控制器,并在集員辨識框架下,定義多個總體和局部誤差來分析閉環系統的穩定性。文獻[3]在非線性系統滿足某些嚴格塊因果形式下,設計虛擬參考反饋式的非線性控制器。文獻[4]考慮在噪聲存在下,稀疏非線性控制器的重構;文獻[5]采用最優化方法分析機械大生產下能源發動機的非線性控制器設計。文獻[6]分析可持續智能交通的高速實時非線性控制。文獻[7]提出非線性系統的集員辨識;文獻[8]考慮非線性系統集員辨識的模型質量評估性;文獻[9]分析非線性時間序列的集員預測;文獻[10]提出非線性集員辨識的數據濾波設計問題。文獻[11]分析非線性函數的稀疏辨識及參數化的集員辨識最優性分析;文獻[12]對非線性系統設計直接濾波處理,提出最優濾波器設計方法。所有關于非線性系統的集員辨識及非線性控制器設計都為本文的理論部分打下牢固基礎。
研究閉環條件下,非線性系統對象存在時,非線性控制器和線性控制器的數據驅動辨識設計問題。即如何僅利用閉環系統的輸入-輸出觀測數據對直接設計非線性控制器和線性控制器,而無需非線性系統對象的模型。對于非線性控制器的設計,將其轉化為非線性函數在某種基函數展開式下的辨識問題。當基函數未知時,對于簡化的優化性能指標函數增加關于預測誤差的約束條件。對于約束最優化問題,從基-對偶角度考慮其最優解,并分析最優解的統計有偏性。為避免基函數的先驗信息,將支持向量機引進非線性系統辨識中。支持向量機在無需施加任何關于動力系統和未知非線性的先驗信息下,可辨識估計出目標系統。文獻[13]指出支持向量機可看作一種特殊的核函數法,且其核函數可由某些回歸矢量構成;文獻[14]將此聯合法應用于多輸入多輸出Hammerstein模型的參數辨識;文獻[15]卻將支持向量機與預測誤差法相結合,并用以解決復雜動態網絡在閉環反饋條件下的參數辨識問題。在非線性控制器的直接數據驅動辨識中,將由線性回歸矢量組成的矩陣定義為Grammian矩陣,利用統計學習理論[16]中的Mercer定理,將Grammian矩陣表示成無需任何關于回歸矢量先驗信息下的核函數。對于反饋通道中線性控制器的設計問題,引進虛擬參考反饋校正思想[17],在無需建模非線性系統對象模型條件下,僅僅使用觀測數據序列對來保證閉環系統的輸出能跟蹤某個期望給定的閉環傳遞函數。對于參數化的PID線性控制器,提出采用遞推最小二乘辨識法來辨識線性控制器參數[18]。在閉環系統結構中,增加對于非線性系統的利普希茨連續性假設[19],定義非線性系統的有限增益穩定性概念;推導出保證非線性系統對象的輸出為有限增益穩定性時,某特定利普希茨常數所應滿足的不等式條件;給出跟蹤誤差的上界值。
考慮閉環條件下,前饋非線性控制器和反饋線性控制器同時作用于單輸入單輸出離散時間非線性系統,其中系統對象和前饋控制器都是未知的非線性形式,反饋控制器是未知的線性形式。兩自由度閉環反饋控制系統的結構如圖1所示。

圖1 閉環反饋控制系統結構Fig.1 Closed loop feedbak system structure
圖1中S表示非線性系統對象模塊,Knl表示前饋非線性控制器,Klin表示反饋線性控制器,u(t)表示系統對象的輸入變量或兩自由控制器的輸出變量,y(t)表示整個閉環系統的輸出變量,ε(t)表示作用于系統對象S的外部干擾量。r(t)表示整個閉環系統的輸入參考信號,unl(t)表示非線性控制器Knl的輸出變量,ulin(t)表示線性控制器Klin的輸出變量,σ(t)表示誤差變量或跟蹤誤差,其作為反饋線性控制器Klin的輸入變量。
將圖1中的非線性系統對象模塊描述為

雖然非線性函數g是未知的,但S左右兩端的輸入和輸出變量可在任意的離散時刻處利用物理裝置來測取。即可獲取的觀測數據集為,其中N表示觀測數據總個數。由圖1可見u(t)是由非線性控制器Knl的輸出和線性控制器Klin的輸出相加而得,即u(t)=unl(t)+ulin(t)。兩自由度控制器分別描述為

非線性控制器Knl位于復合控制中,其目的是用于穩定閉環系統,而線性控制器Klin位于反饋控制中,通過反饋誤差作用來保證降低閉環誤差,使閉環系統具有良好的實時跟蹤性能。
2.1 模型逆方法的缺點
非線性控制器可直接采用模型逆方法來獲取,設非線性函數g的辨識模型為


其中規范常數ρy和ρu分別定義為

u≥0為設計參數,用以折中跟蹤精度和試驗的復雜程度。由式(3)和式(4)可知,模型逆方法是首先利用機理分析或系統辨識方法來得到非線性系統對象模塊S的辨識估計模型,再分別通過求解各個時刻處的一個最優化問題來得到各個時刻處時的非線性控制器形式unl(t)。但要得到辨識模型是復雜過程,為此繞開辨識模型,采用直接數據驅動的方法來設計非線性控制器Knl(r(t))。
非線性控制器Knl(r(t))的輸出變量unl(t)可通過采集裝置來獲取其集信號,而Knl(r(t))的輸入變量r(t)在某給定期望閉環傳遞函數M下,利用虛擬參考反饋校正思想有

定義一個虛擬的輸入參考變量為


2.2 最小二乘法
對非線性控制器Knl(y(t))采用參數化的基函數展開形式為

式中:ψi為利普希茨連續基函數,系數θi∈R為未知待辨識的參數,M為基函數的總個數。定義如下的未知參數矢量θ和回歸矢量φ(t)為

式(6)的參數化形式可改寫成線性回歸形式為

式中e(t)表示預測誤差,在采用一組基函數作用下,控制器的設計可轉化為一個未知參數矢量θ的辨識。對于式(7)中的辨識,當回歸矢量φ(t)已知時,采用最小二乘法的辨識步驟如下。
算法1

步3:通過求解最小化目標準則函數J1(θ)來得到參數化控制器中的未知參數矢量估計值θ,即

步4:選擇合適的若干充分不等式條件,得以保證非線性閉環系統的穩定性。
對于式(9)的最小化運算,利用最優必要條件可得


其中U和Φ分別定義為

因在算法1的計算過程中,需要已知(6)式的基函數族。若基函數族未知,以至于回歸矢量φ(t)和回歸矩陣也是未知的,則算法1的使用已不再適用。為解決基函數族未知下未知參數矢量的辨識,此時可引入支持向量機的概念來近似替換由線性回歸矢量的乘積所構成的Grammian矩陣。
2.3 最小二乘支持向量機
根據線性回歸關系式(7),建立性能指標函數的緊湊形式為



由式(28)和式(18)可見,當引進支持向量機的核函數后,非線性函數可表示成核函數的加權和形式。因核函數可直接由輸入-輸出觀測數據對序列構成,加權和形式中起關鍵逼近作用的量是對偶變量α。而對偶變量α可由式(25)來表示,且式(25)中的Grammian矩陣同樣可由所定義的核函數來替換。其具體的最小二乘支持向量機辨識過程可歸納如下。
算法2
步1:令τ←0;
步2:根據(24)式經核函數K來計算Grammian矩陣G;
步3:經(22)式估計對偶矢量α(0);
步4:重復過程;
步5:τ←τ+1;
步7:重復步6過程,直至α(τ)收斂或變化的范圍非常小;
將式(28)中的y(t)替換成M-1y(t)即得非線性控制器Knl(M-1y(t))。
對于反饋線性控制器Klin的設計,采用虛擬參考反饋校正思想,利用線性控制器Klin兩端的采集觀測序列來校正線性控制器。根據虛擬參考反饋校正的思想,將圖1所示的閉環反饋系統抽取處局部相關的部分,該局部部分僅包含線性控制器Klin和非線性系統對象模塊S的閉環部分結構見圖2所示。

圖2 虛擬參考閉環反饋系統結構Fig.2 Virtual reference closed loop feedback system structure
圖2中包含給定期望的閉環傳函M,當采集輸出數據y(t),可定義一個虛擬的參考信號使得

定義參考跟蹤誤差為

將此參考跟蹤誤差應用于虛擬試驗中控制器Klin的輸出信號為

由圖1可知,ulin(t)可表示為

控制器Klin的輸入和輸出數據分別為σ(t)和δu(t)。線性控制器Klin的參數化形式可取為

式中:β表示兩已知的線性離散時間傳遞函數矢量;η表示維數為n的未知參數矢量。利用輸入和輸出觀測數據和參數化線性控制器形式式(33),可通過如下的優化問題來求解未知的參數矢量η

式中的未知參數矢量η可采用常見的最小二乘法來辨識為
算法3

式中對應的遞推最小二乘辨識算法為
算法4

將圖1所示的非線性閉環反饋系統描述為

式中非線性控制器Knl和線性控制器Klin均為滿足利普希茨連續性的兩函數,且非線性函數g頁滿足該利普希茨連續性。在利普希茨連續的假設條件下,非線性函數g可描述為

其中


定義殘差函數為殘差函數也滿足利普希茨連續性,即存在一個非負常數γy使得,對于不同的y和y′有

為分析非線性閉環反饋系統的穩定性能,首先需給出有限增益穩定性的概念定義。
定義1 在輸入u(t),輸出y(t)和噪聲ε(t)下,非線性系統為有限增益穩定的條件是:存在有限的非負常數Γu,Γε和Λ使得成立

根據式(3)可見:在式(37)所示的非線性控制器和線性控制器的直接數據驅動辨識形式下,得到一個以y(t)和r(t)為輸入,為輸出的動態系統,且該動態系統在定義1的基礎上滿足有限增益穩定性,即存在三個有限非負常數Γy,Γr和Λf使得成立

利用上述定義和多個不等式條件下,非線性閉環反饋系統的有限增益穩定性的相關結果可歸納為定理2。
定理2 對于任意的初始條件y(0),(37)式所代表的兩自由度控制器的非線性閉環反饋系統滿足有限增益穩定性的充分條件是

此時非線性閉環反饋系統的輸出特性滿足不等式

證明 將圖1所示的反饋系統輸出描述為

對式(43)左右兩端同時取范數可得到不等式

考慮殘差函數

將式(46)代入至式(44)的第三個等式中可得

將式(47)代入至式(45)中可得

因式(48)對所有的都成立,即有

對上式整理要得到式(43)的充分條件是

考慮圖1所示的兩自由度控制器的閉環反饋控制系統結構框圖。非線性系統對象描述為

非線性函數f定義為

前饋非線性控制器Knl定義為

線性控制器Klin定義為

兩自由度控制器的設計問題轉化為前饋非線性控制器Knl中的分段函數的辨識和線性控制器Klin中的5個未知參數估計值的辨識。ε(t)為白噪聲,采集觀測數據集,系統利用N=1 000個白色偽隨機二元輸入序列來激勵,激勵的初始條件取為0值。參數化前饋非線性控制器為:unl(t)=η1φ1T(r(t))+η2r(t-1)。
其中函數φ1(y(t))顯式地定義為y(t)的函數形式。特征映射φ1先驗未知,采用徑向基函數核來代表非線性。因仿真的作用是表征核函數下非線性系統的辨識精度,對于參數化的前饋非線性控制器,采用步1到步8的辨識算法。在算法的實施過程中,徑向基函數與其中的兩參數σ2可用于估計基函數φ1。此時可令參數為:σ2=1.5。
仿真過程中,因基函數φ1是顯式地固定的,參數η2可直接辨識,而參數η1卻無法直接估計,且僅函數Knl=η1φ1T可計算出來。利用徑向基函數和由步7得到的對偶矢量直接將非線性函數表示成核函數加權和形式。其中核函數加權和形式與其實際形式間的比較如圖3所示。由此圖可知,辨識曲線可近似地逼近于原實際曲線。此即表明,辨識估計的核函數加權和形式可無限地逼近原非線性函數。
線性控制器Klin為常見PID控制器,其共含有5個未知參數值需要辨識估計出來。對于由虛擬參考反饋校正控制下的優化問題式(34),利用文中遞推辨識估計算法來不斷地進行迭代求解。在迭代算法的初始化時,選取初始值都為0。5個未知參數估計值隨著迭代步驟次數的變化過程見圖4所示,從圖4可知:當迭代次數增大到45次迭代時,各個具體的參數值將無限地趨近于它們各自對應的真實值。

圖3 非線性函數的辨識估計Fig.3 The identification estimation of nonlinear function

圖4 5個未知參數估計的收斂曲線Fig.4 Convergence curves of five unknown parameter estimations
將非線性控制器和線性控制器同時存在于非線性閉環系統中,為避免對非線性系統的建模,考慮兩自由度控制器的直接數據驅動辨識。通過采集觀測數據采用基函數法和最小二乘法來設計兩控制器,并分析非線性閉環系統滿足有限增益穩定性的充分條件。因線性控制器的施加是保證閉環跟蹤誤差始終為零,因此可深入分析閉環跟蹤誤差的誤差邊界。
[1]王建宏.故障估計下子空間預測控制的快速梯度算法[J].上海交通大學學報:自然科學版,2013,47(7):1015-1021.
[2]王建宏.基于先進辨識的控制策略研究及其應用[D].南京:南京航空航天大學,2011.
[3]孟新宇,王道波.頻域響應函數估計的非參數辨識法[J].振動與沖擊,2013,46(1):81-93.
[4]王建宏.閉環系統的虛擬參考反饋校正控制及迭代最小辨識[J].系統工程理論與實踐,2014,34(5):1256-1266.
[5]FAGIANO L.Optimization of airbome wind energy generators[J].Interntional Journal of Robust and Nonlinear Control,2012,22(8):2055-2083.
[6]FAGIANO L.Hign altitude wind energy for sustainable marine transportation[J].IEEE Transactions on Intelligent Transportation,2012,13(2):781-791.
[7]MILANESE M.Set membership identification of nonlinear systems[J].Automatica,2004,40(6):957-975.
[8]MILANESE M.Model quality in identification of nonlinear systems[J].IEEE Transactions of Automatic Control,2006,50(10): 1606-1611.
[9]MILANESE M.Set membership prediction of nonlinear time series[J].IEEE Transactions of Automatic Control,2006,50(11): 1655-1669.
[10]MILANESE M.The filter design from data problem:nonlinear set membership approach[J].Automatica,2009,45(10):2350-2357.
[11]NOVARA C.Sparse identification of nonlinear functions and parametric set membership optimality analysis[J].IEEE Transactio ns of Automatic Control,2012,57(12):3236-3241.
[12]NOVARA C.Direct filtering:a new approach to optimal filter design for nonlinear systems[J].IEEE Transactions of Automatic Control,2013,58(1):86-99.
[13]PILLONETTO G.A new kernel based approach for linear system identification[J].Automatica,2010,46(1):81-93.
[14]PILLONETTO G.Kernal methods in system identification,machine learnning and function estimation:a survey[J].Automatica,2014,50(3):657-682.
[15]BAI ER WEI.Kernal based approaches to local nonlinear nonparametric variable selectionl[J].Automatica,2014,50(1):100-113.
[16]MULDERS ANNE VAN.Identification of systems with localised nonlinearity:from state space to block structured models[J]. Automatica,2013,49(5):1392-1396.
[17]NOVARA C.Direct feedback control for nonlinear system[J].Automatica,2013,49(4):849-860.
[18]CAMOI M.Direct nonlinear control design:the virtual reference feedback tuning approach[J].IEEE Transactions of Automatic Control,2006,51(1):14-127.
[19]DONOBO D.Recovery of space over complete representation in the presence of noise[J].IEEE Transactions on Information Theory,2006,52(1):6-19.
Direct Data-driven Identification for Controllers with Two Degrees of Freedom
Wang Jianhong,Zhu Yonghong
(School of Mechanical and Electronic Engineering,Jingdezhen Ceramic Institute,Jingdezhen 333403,China)
In closed loop structure,the problems of direct data driven identification about nonlinear controller and linear controller are studied when one nonlinear plant exists.Without identifying the nonlinear plant,the problem of designing the nonlinear controller is changed to the nonlinear system identification under one basis function expansion.For devising the closed loop linear conroller,this paper introduces the virtual feedback tuning idea to identify the parameters of linear controller by using recursive least squares method.In closed loop structure,one Lipschitz continuous assumption of the nonliear system is added and one finite gain stability notion is defined.Then some inequalities about Lipschitz constants are derived to guarantee that the nonliear system’s output is finite gain stable.Finally,it verifies the efficiency of the proposed strategy by the simulation example results.
two degrees of freedom;direct data driven identification;virtual reference feedback tuning;support vector machine
TP273
A
1005-0523(2016)05-0065-11
(責任編輯 姜紅貴)
2016-02-23
國家自然科學基金(61563022);江西省重大科技項目(20152ACB20009)
王建宏(1980—),男,副教授,博士后,研究方向為系統辨識與隨機預測控制。