程艷青 朱紀洪
自上世紀80 年代起,控制界開始采用非線性動態逆(Nonlinear dynamic inversion,NDI,后面都簡稱動態逆)方法來設計多變量非線性系統的控制律,這是一種利用非線性狀態反饋的方式將一個非線性系統變成線性系統,然后再利用我們熟知的線性系統設計方法對變換后的線性系統進行設計,因此動態逆方法又稱為反饋線性化方法.動態逆最先應用在飛行控制律設計方面,尤其是戰斗機大迎角超機動控制律設計[1?4],該方法可以通過逆模型來對消掉大迎角氣動非線性和動力學非線性,從而將一個強非線性系統變成幾個獨立線性系統(最常見的為一階慣性系統),在線性化的同時實現了多通道的解耦,此外動態逆方法還可應用于航天飛行器的再入制導和控制[5?6],機械臂控制[7]和倒立擺控制[8?9](垂直起降火箭和平衡車).動態逆方法采用非線性逆系統理論來設計控制律,在對系統進行線性化的同時實現多變量系統解耦控制,用動態逆方法設計的控制器可以對被控對象的控制變量在全過程進行動態特性處理,以達到期望的特性[10].動態逆設計方法在設計過程中避免了大量的調參工作,設計出來的控制律具有較強的適應性和通用性,不像基于特征點的線性系統設計方法,需要依據特征點的不同來調整控制律參數.傳統的動態逆方法都是采用逆模型來對消系統非線性,當逆模型有較大不確定性時,不僅系統非線性不能完全對消,閉環系統穩定性也會受到影響,因此陸續提出了一系列的具有較好魯棒性的動態逆控制方法,比如采用L1自適應方法與動態逆方法相結合[11?12],用動態逆方法設計初步控制律,在此基礎上引入自適應律和一個低通濾波器來保證系統的魯棒性,文獻[13]則采用滑模變結構方法和動態逆方法相結合,實際控制輸入由兩部分組成:動態逆控制律和滑模變結構控制律,其中滑模變結構控制律可有效抑制模型的不確定性影響.上述方法都是采用傳統的動態逆與魯棒控制方法相結合來增強控制系統的魯棒性,本質上還是以動態逆方法為基礎.文獻[14?16]中的增量非線性動態逆(Incremental nonlinear dynamic inversion,INDI,后面簡稱增量動態逆)方法則是以狀態變化率作為反饋項,由于模型不確定性可通過狀態變化率直接體現,因此增量動態逆與傳統動態逆方法相比,魯棒性得到較大的提升.然而不管是傳統的動態逆方法(包括與魯棒控制相結合)還是增量動態逆方法,在設計非線性系統控制律時并不能有效考慮執行機構的動態特性,尤其是當執行機構帶寬與閉環等效系統帶寬較為接近時,執行機構對最后的閉環動態特性影響較大.在動態逆控制律當中,執行機構作為一個子系統處在逆系統和對象非線性系統之間,通過對非線性補償后的偽線性系統進行再設計的方式并不能有效消除執行機構動態特性影響,最為有效的方式是直接對執行機構子系統的動態特性進行補償,使補償后的子系統動態遠高于閉環系統動態,從而消除因執行機構帶寬較低給非線性系統控制帶來的不利影響.文獻[17?18]中在執行機構模型已知的情況下,通過對執行機構子系統設計線性補償器提高補償后子系統的期望動態特性,本文則通過引入模型參考自適應系統,在執行機構模型未知的情況下,將補償后的子系統帶寬提高到合適值,此外本文還給出了一種通過修正非線性反饋項的方法來消除執行機構動態特性的影響,并將這種方法與前面單方面提高執行機構等效帶寬的方法進行了對比.
存在如下仿射非線性動力學系統:
式中:x為系統狀態;u為控制輸入;y為期望的控制系統輸出.若系統相對階為r,對系統測量方程進行r次微分,由系統相對階的定義,有下列條件成立:
因此通過r次微分后,可得到包含顯式系統控制輸入的方程:
若取如下控制規律:
其中v為虛擬控制量,符號 (·)?R表示廣義右逆,若系統滿足條件相對階r=1 且 dim(x)=dim(u),比如常見飛行器姿態動力學系統,則動力學系統動態逆控制律可以表示為如下簡易形式:
具體結構如圖1 所示:
圖1 典型動態逆的原理圖Fig.1 Schematic diagram of typical dynamic inversion
對于如圖1 所示的典型非線性動態逆控制問題,若執行機構輸入uc的頻率(取決于控制律的指令動態)遠小于執行機構帶寬ωa,則執行機構輸入uc近似等于執行機構輸出u,控制器、執行機構以及被控對象的組合系統等價于單位陣,以此單位陣為基礎,合理設計滿足品質要求的狀態變化率指令,形成最終的動態逆控制律.但是實際控制過程中,往往由于執行機構本身物理特性限制,控制輸入uc的頻率與執行機構帶寬ωa較為接近,此時輸入uc與輸出u在幅值和相位上都有較大的差異,控制輸入的頻率與執行機構帶寬越接近,幅值和相位上的差異越大.
假定執行機構動態特性為一階慣性環節,則有下式成立:
經過變形后上式可以表示成:
顯然從上式可以看出,若非線性反饋項f(x)頻率與執行機構帶寬ωa相近或超出,式(7)中的非線性項無法忽略掉.
為解決常規動態逆方法魯棒性較差的問題,Smith 博士將增量思想引入到動態逆方法當中[14],用于完整的飛行控制律設計,具體思想是將狀態方程在某個鄰域內泰勒展開,得到非線性系統的增量模型,仍然以上節相對階為1 的非線性系統為例,則控制機構增量與系統狀態之間的關系如下[15]:
其中:
若執行機構帶寬和控制頻率足夠高,則上式中的f′(x)(x ?x0)項可以忽略,增量動態逆控制結構如下圖所示:
圖2 增量動態逆的原理圖Fig.2 Schematic diagram of incremental dynamic inversion
依據上面的增量動態逆原理圖,有下式成立:
將式(9)代入上式,可以得到
若控制頻率足夠高,有x0≈x,u0≈u成立,上式可以等價為:
顯然此式與常規動態逆一樣,說明在滿足控制頻率足夠高這一條件的情況下,執行機構動態特性對最終閉環系統的影響是一樣的,都存在一個非線性干擾項.式(12)也從另外一個側面說明了增量動態逆方法雖然對系統本體模型不確定性或擾動有一定的抑制能力,但是對于高于執行機構帶寬的部分并不能有效抑制.
依據上一節的分析,不管是常規動態逆方法還是增量動態逆方法,執行結構的低帶寬特性(這是相對的概念)都會導致經非線性反饋后的閉環系統不能等價于一個理想的線性系統,而是有一個非線性干擾項的差異.動態逆方法(包括增量動態逆)的基本思想就是通過非線性反饋形成一個理想的偽線性系統,再在此基礎上進行線性系統設計,非線性干擾項的存在使動態逆方法無法獲得理想的偽線性系統,因此要使用動態逆方法進行控制律設計,必須消除非線性干擾項.從第1 節的分析結果看,消除非線性項的影響,可以從兩個方向入手,一個是通過模型參考自適應方法設計補償器提高執行機構子系統的帶寬,即保證補償器和執行機構混合系統的等效帶寬遠高于非線性反饋項f(x)頻率,這個與文獻[17?18]中的思想類似,另一個思路則是直接在非線性反饋項中引入補償項,直接對消掉非線性干擾項,下面就這兩類方法展開討論.
參照第1 節的推導結果,若將補償器和執行機構混合系統的等效帶寬設定為遠高于非線性反饋項f(x)頻率,則采用動態逆控制律(包括增量動態逆)的閉環系統可以表示成:
進一步狀態變化率指令相對執行機構帶寬而言也是低頻量,則上述動態逆控制系統等效為單位陣.補償器采用一階模型參考自適應系統實現,如圖3所示:
圖3 執行機構動態補償框圖Fig.3 Dynamic compensation block diagram of actuator
執行機構的補償器分為兩種形式,一種是執行機構模型已知,另一種是執行機構模型結構已知但參數未知.對于模型已知的情況,和Ku可通過下式得到:
對于模型未知的情況,則需要采用模型參考自適應的方式在線調整參數和Ku,為設計兩控制參數的自適應更新律,引入如下引理:
引理 1.考慮兩個信號α和φ,它們之間有如下動態關系:
其中,α(t)為標量輸出信號,H(p)是嚴格正實的傳遞函數,k是符號已知的未知常數,φ(t)是關于時間t的m×1維向量,v(t)是可測量的m×1 維向量.如果向量φ(t)服從如下規律:
γ是正常數.α(t)和φ(t)全局有界,而且,如果v(t)有界,那么當t→∞時,α(t)→0.引理的具體證明過程見文獻[19].
記跟蹤誤差為:
參數誤差定義為控制器參數與理想參數的差:
其中理想參數可以表示為如下形式:
根據上圖中的補償原理,umi和ui的動態特性可用下式表示:
將式(18)和式(19)代入上式中,可得到跟蹤誤差e滿足如下微分方程:
上式寫成頻域形式為:
下面就上述執行機構動態補償規律,證明整個自適應系統穩定性(包含外面的動態逆環節),具體證明思路是先利用李亞普洛夫方法證明跟蹤誤差ei有界全局漸近收斂,然后再證明整個閉環動態逆非線性系統的穩定性.在證明之前先做兩項假設:
假設 1.函數矩陣G(x)各元素全局有界;
假設 2.設定等效帶寬遠高于非線性系統頻率.
對于假設1,大多數物理系統都能夠滿足假設1,比如飛行控制系統、機器人系統,對于假設2 則直接與等效帶寬方法的思想吻合.
選取如下李亞普洛夫函數:
對李亞普洛夫函數沿系統軌線求導:
將式(22)和式(24)代入上式可以得到:
因此執行機構動態補償子系統是全局穩定的,即信號ei、都有界,依據Barbalat 引理,可知跟蹤誤差ei全局漸近收斂.
下面以跟蹤誤差e有界且全局漸近收斂為基礎來證明整個自適應系統的穩定性,根據跟蹤誤差的定義有下式成立:
參照動態逆控制律有:
參照圖3,有下式成立:
將式(30)和式(31)代入式(28)中可得:
參照文中等效帶寬思想,即假設2,則上式可以簡化為:
根據上面的證明結果可知,跟蹤誤差e有界且全局漸近收斂,且函數矩陣G(x)各元素全局有界(假設1):
其中D為一正實數,參照上式顯然有下列條件成立:
由上式可以得出
因此系統狀態x有界,且當e→0時,有x→xc成立.
若采用增量動態逆控制律,則式(16)變為:
式(19)則變為:
由假設2,上式變為:
若增量動態逆控制頻率一般都足夠高,因此有x0≈x,u0≈u成立,上式可變為:
上式與式(20)相同,因此同樣可以證明在增量動態逆控制律的作用下,系統狀態x有界,且當e→0時,有x→xc成立.
對于動態逆控制方法,若將非線性反饋項由f(x)改為下式:
即在原來的非線性反饋項之外再補償一個微分項,再代入式(6),原動態逆閉環系統等效為如下的一階慣性環節:
對于增量動態逆控制方法,將狀態速率反饋項變為:
同樣在原來的反饋項之外再補償一個微分項,代入式(10),則增量動態逆閉環系統同樣等效為如式(42)所示的一階慣性環節.
這種直接補償方法需要用到微分信號,擬采用韓京清提出的非線性跟蹤微分器來實現[20],這種微分器利用二階最速開關系統跟蹤連續輸入信號并提取近似微分信號.存在如下形式的二階系統:
取如下最速控制:
x1可以最快速地跟蹤信號v,當x1充分接近v時,x2可以作為信號v的近似微分,形成如下的最速跟蹤微分器:
上述的跟蹤微分器在進入穩態時容易產生高頻顫振,將符號函數 sgn 改為飽和線性函數 sat 也不能完全避免,因此本文中采用如下改進形式的跟蹤微分器(為便于實際應用直接給出離散形式):
其中U=fst(x1(k)?v(k),x2(k),r,T),fst最速控制綜合函數,具體描述如下:
其中
上式中T為時間間隔,參數r與信號本身頻率和噪聲頻率相關,可依據實際情況選取.
采用如下的單入單出的非線性系統為研究對象:
若動態逆的動態指令信號由下式生成:
則對于方法1 (提高等效帶寬),補償后的理想動態特性由如下傳遞函數表示:
對于方法2 (直接補償),補償后的理想動態特性由如下傳遞函數表示:
首先我們來對采用動態逆控制方法時,因執行機構低帶寬導致的非線性干擾項進行仿真驗證,具體干擾機理見式(7)和式(12),分別對應常規動態逆方法和增量動態逆方法.仿真時動態逆控制參數和執行機構模型參數分別取為ωc=2 rad/s 和ωa=20 rad/s.對ωn分別取 1 rad/s,10 rad/s ,20 rad/s,由低到高三個值,采用常規的動態逆控制方法進行仿真,圖4 是三種情況下f(x)的功率譜密度,圖5是不同干擾項的仿真結果,可見當f(x)含有越多高頻能量時,實際控制響應與預期的控制響應相差越大.
圖4 非線性干擾項 f(x)功率譜密度Fig.4 Power spectral density of nonlinear interference term f(x)
圖5 不同干擾影響的仿真結果Fig.5 Simulation results of different interference effects
參照前面的分析,增量動態逆與常規動態逆在不考慮狀態速率測量誤差和控制頻率足夠高的情況下,式(7)和式(12)的形式完全一樣,即最終的閉環系統是一致的(線性項和非線性干擾項都一樣),仿真結果如圖6 所示,因此本節不再做增量動態逆控制方法的非線性干擾分析,后面章節中關于非線性干擾項的消除仿真中,只給出常規動態逆的仿真結果.
圖6 常規和增量動態逆仿真結果Fig.6 Conventional and incremental dynamic inverse simulation results
本節主要通過仿真對第2.1 節中所提出的非線性干擾抑制方法進行驗證,即提高等效帶寬方法,首先考慮如下三種情況的仿真:Case1、Case2和Case3 對應的等效帶寬 (ωam)為20 rad/s、40 rad/s 和100 rad/s,其他仿真參數為ωc=2 rad/s、ωn=20 rad/s、ωa=20 rad/s.
從圖7 的仿真結果看,當等效帶寬取為20 rad/s時,非線性干擾項的影響完全無抑制,40 rad/s 時,跟蹤誤差減小,而等效帶寬為 100 rad/s 時,系統狀態與預期響應 ?Expect基本一致,可以認為非線性干擾項的影響得到了很好的抑制.
圖7 等效帶寬方法仿真結果(ωa 已知)Fig.7 Simulation results of equivalent bandwidth method (ωa Known)
對于ωa未知的情況,考慮如下四種情況的仿真:Case4、Case5、Case6和Case7,其中Case4和Case6對應的ωa=10 rad/s,Case5和Case7 對應的ωa=30 rad/s,Case4和Case5 沒有引入等效帶寬方法,Case6和Case7則是在ωa未知的情況下,引入模型參考自適應控制(Model reference adaptive control,MRAC)方法來提高執行機構的帶寬,其他仿真參數為ωc=2 rad/s、ωn= 20 rad/s、ωam=100 rad/s.
從圖8 的仿真結果看,對于相同的ωn,未實施提高等效帶寬措施的情況下,越小的ωa的非線性干擾影響越大,而引入模型參考自適應方法后,Case6和Case7的系統狀態與預期響應?Expect基本一致.
圖8 等效帶寬方法仿真結果(ωa 未知)Fig.8 Simulation results of equivalent bandwidth method (ωa unknown)
本節主要通過仿真對第2.2 節中所提出的非線性干擾抑制方法進行驗證.通過修正非線性反饋項(Modified nonlinear feedback,MNF)的方式,對非線性干擾項直接進行補償,補償過程需要用到f(x)項的微分信號,鑒于微分過程對噪聲有放大效應,因此除考慮各反饋信號無測量誤差的情況外,還考慮了測量噪聲對非線性干擾項補償效果的影響.首先考慮無噪聲,狀態速率和f(x)項的微分信號都采用實際值,采用兩種仿真狀態進行對比,Case1和Case2 ,仿真參數為ωc=2 rad/s、ωn=20 rad/s、ωa=20 rad/s,其中Case1 沒有對非線性干擾項進行補償,Case2 則采用修正非線性反饋項的方式對非線性干擾性進行補償.從圖9 的仿真結果看,修正非線性反饋項方式可以很好地消除非線性干擾項影響.
圖9 直接補償方法仿真結果(不考慮噪聲)Fig.9 Simulation results of direct compensation method (Without consideration of noise)
上述方法雖然可以較好地消除非線性干擾項,但是由于狀態變化率通常不能直接測得,在獲取f(x)項微分信號過程中需要用到的狀態變化率是通過狀態測量信號微分得到,具體方法是第2.2 節中的非線性跟蹤微分器,依據文獻[20],在采樣頻率足夠高的情況下,跟蹤微分器的帶寬與速度因子r的關系如下:
因此在反饋信號有用信息盡可能保留的同時,濾掉更多高頻噪聲,確保微分信號相對平滑.仿真分四種情況,Case3、Case4、Case5和Case6,仿真參數為ωc=2 rad/s、ωn=20 rad/s 、ωa=20 rad/s,不同的是Case3和Case5 雖然引入了跟蹤濾波器,但信號無噪聲,Case4和Case6則引入了標準差σ=0.01、均值μ=0的高斯白噪聲,Case3和Case4 跟蹤濾波器的速度因子r=30,而Case5和Case6 則取為r=100.
從圖10 的仿真結果看,基于跟蹤微分器的直接補償方法很好地消除了非線性干擾項的影響,測量噪聲的存在只是略微增加了控制誤差,較低的跟蹤濾波器帶寬 (r=30)由于濾掉了部分有用信息,控制誤差相對較大,較大的r則完全保留了反饋信號的有用信息,補償效果較好,但是會使過多測量噪聲進入到反饋信號中,增加執行機構負擔,所以實際使用過程中依據情況選擇一個居中合理值.
圖10 直接補償方法仿真結果(考慮噪聲)Fig.10 Simulation results of direct compensation method (With consieration of noise)
本文針對非線性動態逆控制中較低執行機構帶寬導致的非線性干擾項,從非線性干擾項的影響機理出發,提出了兩類消除非線性干擾項的方法,并通過仿真進行了驗證.不管是提高等效帶寬方法還是直接補償方法,都能較好地消除非線性干擾,兩者不同之處在于,直接補償方法是精確的消除了上面的非線性影響,而提高等效帶寬方法則是一個近似方法.直接補償方法需要用到f(x)項的微分信號,可通過非線性跟蹤微分器得到,只是這類方法嚴格依賴于系統模型和執行機構模型.提高等效帶寬的方法則在執行機構模型未知的情況,可引入模型參考自適應方法來克服模型不確定性.