劉曉東 馬 飛 張 玉 杜立夫
1.北京航天自動控制研究所, 北京 100854 2.北京航空航天大學自動化科學與電氣工程學院, 北京 100191
模型參考自適應控制系統是包含有理想系統模型并能以模型的工作狀態為標準自行調整參數的自適應控制系統。模型參考適應控制系統最初是為設計飛機自動駕駛儀而提出的,初期階段由于技術上的困難而未能得到廣泛應用。然而,隨著計算機技術的發展,模型參考自適應控制已在飛機自動駕駛儀、船艦自動駕駛系統、光電跟蹤望遠鏡隨動系統和機械手控制系統等方面得到較廣泛應用,目前已成為比較流行的自適應控制方式之一[1-3]。
自上世紀40年代提出單神經元模型構建的神經網絡計算模型起,神經網絡在感知學習、模式識別、建模技術和系統控制方面取得了巨大的發展和應用[4-7]。神經網絡具有強大的學習能力和容錯能力,能夠很好地逼近連續非線性函數,這種優良特性進一步促進了神經網絡技術在非線性系統辨識和系統控制方面的應用[8]。1986年,Rumelhart等人在Nature上首次提出了這種多層前向反饋網絡,目前已經稱為一種十分成熟的神經網絡技術,一般簡稱為BP神經網絡或BP算法[9]。BP神經網絡是一種前向網絡,由一個輸入層、一個或者多個隱含層和一個輸出層構成,同一層的神經元之間無關聯,不同層的神經元依次向前連接。
PID控制以其結構簡單、可靠性高、易于工程實現等優點至今仍被廣泛采用。但是,想要PID控制取得很好的控制能力,就需要調整好比例、積分和微分3種控制量,而這3個控制量的組合之間必然有一種最優的組合。此時,可以結合BP神經網絡的任意逼近能量,通過選取系統指標學習實現對PID參數的自整定[10-11]。
因此,針對飛行器對象,本文將采用模型參考自適應控制的基本設計框架,采用PID控制,并引入BP神經網絡對PID控制器參數進行自主調節,從而實現飛行器姿態控制系統設計的智能化,提高其自適應控制能力,這也是本文研究的主要出發點。
對于增量式PID控制律,其PID算法設計為如下形式:
u(k)=u(k-1)+Δu(k)
(1)
Δu(k)=kp[e(k)-e(k-1)]+kie(k)+
kd[e(k)-2e(k-1)+e(k-2)]
(2)
式中,u(k-1)和u(k)分別表示上一拍和當前拍控制量,Δu(k)表示當前拍控制增量,e(k)、e(k-1)和e(k-2)表示當前拍和前兩拍的跟蹤誤差,對于飛行器而言則表示姿態角跟蹤誤差;kp,ki和kd分別表示比例系數、積分系數和微分系數。
對于傳統的設計過程,通常采用試湊法對kp,ki和kd三個控制參數進行人工調整,此種方法會大大增加設計工作量,不利于控制系統的快速設計。因此,本文將設計一種通過訓練獲取如上三個控制參數的智能方法,提高設計效率,達到優化系統性能的作用。
1)基本框架設計
設計神經網絡為3層BP神經網絡模型,其對應的神經網絡結構如圖 1所示。

圖1 BP神經網絡結構
BP網絡輸入層的輸入與輸出為:
(3)
式中,M為輸入變量的個數,取決于所選取的被控系統的復雜程度,上角標(1), (2), (3)分別代表輸入層、隱含層和輸出層。
網絡隱含層的輸入、輸出分別為:
(4)
(5)

(6)
網絡輸出層的輸入、輸出分別為:
(7)
(8)
此時,取3個輸出分別為:
(9)
(10)
2)權值更新律設計
基于模型參考自適應控制的設計理念,為了確保實際對象輸出與參考模型輸出保持一致,可選取實際系統性能指標為:
(11)
式中,yd(k)為參考模型的輸出,即期望的輸出,y(k)為實際系統的輸出。此時,問題將轉化為J(k)關于權值系數的極小值求解問題。按照梯度下降原則修正網絡的權系數可得,輸出層權重系數的增量為:
(12)

可以根據鏈式求導法則得出:

(13)
根據式(7)可得:
(14)

基于增量式PID控制律(2),可以得到如下關系:
(15)
(16)
(17)
根據如上推導,可以得出網絡輸出層權系數的學習算法為:
(18)

(19)
類似的,此時根據鏈式求導法則逐層剝離,先算輸出層到隱藏層網絡可得如下:

(20)
再進一步計算對于權值的變化量:

(21)
可以求出隱含層權系數的學習算法為:
(22)
式中,η2>0為學習速率,α2>0為慣性系數,
(23)
式中,g′(x)=2g(x)[1-g(x)],f′(x)=1-f2(x)。
以某飛行器俯仰通道為例,其小擾動線性化模型如下所示:
(24)
式中,各小偏差系數的具體形式此處不再給出。
針對如上對象,采用增量式PID控制律,其PID算法設計為如下形式:
Δδφ(k)=Δδφ(k-1)+Δδφ(k)
(25)
Δδφ(k)=kp[eα(k)-eα(k-1)]+kieα(k)+
kd[eα(k)-2eα(k-1)+eα(k-2)]
(26)
其中,eα=αd-α表示參考模型輸出攻角與飛行器實際對象輸出攻角之間的誤差量。
采用基于如1.2節所示的BP神經網絡進行姿態控制律參數的自整定,從而實現飛行器姿控系統的自適應控制。飛行器參考模型自適應控制方案如圖2所示。

圖2 飛行器參考模型自適應控制方案框圖
仿真中,選取飛行器對象的相關參數為:
m=1000kg,S=0.4m2,L=1.0m,Jz=4000kg·m2
并且,在某特征點(馬赫數Ma=3.5,高度h=15km)處開展控制方案的仿真驗證與分析。
基于飛行器姿控系統的性能指標要求,參考模型設計如下:
BP神經網絡的相關參數設計如下:
關于網絡初始權重值的選取,可以先開展一次基本的網絡訓練,得到穩定收斂后的一組網絡權重,然后將此作為BP網絡在線工作的初始權重系數。最后,將此網絡載入到飛行器自適應姿控系統中。將攻角指令設置為20°的階躍信號,進行仿真驗證,攻角跟蹤曲線如圖3所示。

圖3 攻角跟蹤曲線
由圖3可以看出,飛行器對象的攻角輸出曲線與參考模型的輸出曲線一致性較好,從而確保了飛行器實際攻角對指令的跟蹤效果,同時也體現出實際飛控系統對參考模型的逼近效果。
對于BP網絡,其輸出初值設置為0,即PID控制參數初始為0,經過參數自整定處理,最終收斂到一個穩定值,進而呈現出PID控制參數的智能調節過程,該過程中控制參數的變化曲線如圖4所示。

圖4 控制參數自適應調整曲線
最后,給出本文控制方案下的升降舵控制量曲線,如圖5所示。

圖5 升降舵控制量曲線
至此,本文所提出的基于BP神經網絡的模型參考自適應姿態控制方案的仿真驗證完畢。
針對飛行器姿態控制的智能設計問題,本文提出的基于BP神經網絡的模型參考自適應姿態控制方案,可確保飛行器攻角與參考模型輸出保持一致,實現了實際飛控系統向理想系統的性能逼近。仿真結果表明,所設計的BP網絡可實現PID控制器參數的快速整定,使其由初始零值快速收斂至某穩定狀態,并滿足飛行器攻角跟蹤的性能指標要求。此外,基于BP網絡進行參數的智能調整,可以從一定程度上避免人工調參造成的工作量較大的問題。