王炳萱,李國勇,王艷暉
(太原理工大學 信息工程學院,太原 030024)
?
基于LM-PSO算法和BP神經網絡的非線性預測控制
王炳萱,李國勇,王艷暉
(太原理工大學 信息工程學院,太原 030024)
摘要:針對非線性系統,提出了一種基于BP神經網絡的預測控制方法。以BP神經網絡建立多步預測模型并預測系統輸出值,用LM (Levenberg-Marquardt)算法和PSO(Particle Swarm Optimization)算法組合的混合算法對目標性能指標函數進行滾動優化求解,得到非線性系統的最優控制量;利用誤差修正參考輸入法實現反饋矯正。通過將粒子群算法引入LM算法,克服了LM算法依賴初值和粒子群算法過早收斂于局部極值的問題,提高了求解的運行速度和精確度。通過對單變量非線性系統仿真實驗,證明了該控制系統具有良好的穩定性、自適應性和魯棒性。該方法可在數學模型不確定的情況下設計出有效的預測控制器。
關鍵詞:非線性系統;預測控制;LM算法;粒子群算法;BP神經網絡
模型預測控制(Model Predictive Control,MPC)最初提出時針對的是線性系統,用線性模型對對象進行預測,而用線性模型優化處理具有強非線性的對象時會使得輸出預測與實際結果存在較大偏差,從而失去最佳的控制效果[1-2]。近年來,國內外許多專家學者針對非線性系統的本質特點,提出許多預測模型,文獻[3-4]提出了Wiener模型,文獻[5-6]提出了Hammerstein模型,但上述模型只適用于某些特定場合,辨識難度較大,并具有一定的約束性。本文選用BP神經網絡(Back Propagation neural network)作為預測模型。BP神經網絡實質功能為輸入到輸出的映射,具有良好的泛化能力,在選取合適的隱含層和隱節點時可以實現任何復雜的非線性映射關系[7]。
滾動優化是預測控制的重要組成部分,其通過反復優化目標函數從而求取最優控制量[8]。文獻[9-10]采用LM算法求解控制量。LM算法收斂速度快、穩定性強,且避免陷入局部極值,可有效地求解優化目標函數,但其也存在過于依賴初值的問題[11-12]。
針對上述問題,筆者利用粒子群算法的簡單易行且可調參數較少等優點,將其引入LM算法,解決了LM算法對初值的依賴問題,提高了算法的精確度。該非線性系統預測控制方法以BP神經網絡對非線性系統進行建模,LM-PSO算法對目標性能函數進行滾動優化求解最優控制量。仿真結果表明,LM-PSO-BP預測控制方法具有良好的控制性能。
1神經網絡預測模型
將如下單輸入單輸出(SISO)非線性離散系統作為被控系統[13]:



(1)
式中:n為系統輸出y(t) 的階次;m為系統輸入u(t)的階次;d+1為系統的時滯;f為非線性函數。
選用3層BP神經網絡來建立非線性系統預測模型,可表示為:

(2)
式中:ym為預測模型輸出值;wi為隱含層神經元與輸入層神經元之間的連接權值;wij為輸出層神經元與隱含層神經元之間的連接權值;p為輸入層節點數;1為輸出層節點數;q為隱含層神經元個數;g(·)為激活函數,選取Sigmoid型激活函數
為得到對未來的多步預測輸出,對式(2)中的預測模型的基礎上建立多個簡單的BP神經網絡,第l個BP神經網絡可表示為:
(3)
2反饋校正
由于對象和環境等因素存在隨機性和不確定性,在t時刻實施控制后,被控對象的實際輸出y(t)與預測模型輸出ym(t)之間可能存在一定偏差,因此形成預測誤差:
(4)
此誤差經過加權后對系統未來的輸出進行預測,表示為:
(5)
式中,h=[h1,h2,…,hp]T為反饋校正矢量,h1=1.
3滾動優化
構造目標性能函數如下:
(6)
(7)
式中:簡化加權系數λ(j)為λ(常數);α為柔化系數,0<α<1;yn為實測模型輸出值;yr為系統給定值;ye(k+j)為期望輸出序列。
通過求解Jmin來確定最優控制增量,使系統在未來n(p≥n≥m)個時刻系統實際輸出值盡可能接近系統期望值。
3.1LM算法
LM算法是梯度下降法與Gauss-Newton法的結合。當μ增大時,算法與梯度下降法相似,發揮其全局特性;當μ減小時,算法接近Gauss-Newton法,發揮其局部收斂特性[14]。LM算法采用近似的二階導數信息,所需迭代時間較少,收斂非常迅速,算法穩定性較好,避免陷入局部最小值。其迭代公式為
(8)
式中:uk為第k次迭代時控制輸入序列;uk+1為新一時刻的控制輸入序列;μ是阻尼因子;ek為誤差;E(u)為誤差函數;A(uk)是Jacobian矩陣。
(9)
(10)
3.2粒子群算法
通過模擬研究鳥群捕食的過程,KENNEDY和EBERHART提出了粒子群(PSO)優化算法。由于PSO算法操作簡單易行,需調參數較少,尤其適用于求解復雜非線性問題[15]。
粒子速度和位置的更新公式如下:
(11)
(12)
式中:i=1,2,…,N;d=1,2,…,D;c1,c2為加速因子,通常取c1=c2;r1和r2為[0,1]區間內的隨機數;w為慣性權重,w=w1-(w1-w2)k/kmax,w1為初始慣性權重,w2為終止慣性權重,kmax為最大迭代次數;l為速度約束因子。
為防止粒子在搜索過程中因搜索空間范圍過大而導致粒子發散,將限制粒子的速度、位置在區間[vmin,vmax],[xmin,xmax]之內。
3.3LM-PSO算法
將LM算法和PSO算法組合提出了LM-PSO算法。LM-PSO算法利用了LM算法在接近局部極小值時收斂速度快、搜索精度高等優點,和PSO算法的全局快速收斂能力,并克服了LM算法過于依賴初值和PSO算法易陷入局部極值的缺點。
先利用PSO算法對目標性能函數進行求解得到一個優化控制量結果即群體最優解,將該結果作為LM算法的初始值,反復迭代得到符合條件的最優解即最優控制量。算法步驟如下:
1) 初始化粒子群中的參數,將待優化控制量uk設為初始粒子。設置每個粒子當前最優位置為pi,當前全體粒子中的最優位置為pg,即pg=pimin.
2) 根據式(11)、式(12)更新粒子的速度和位置,計算各粒子的適應度值,記錄個體極值pi和群體極值pg.
3) 將每個粒子的當前位置與pi相比較,若優于pi,則對pi進行更新;否則,pi保持不變。
4) 將每個粒子的當前pi與pg相比較,若優于pg,則對pg進行更新;否則,pg保持不變。
5) 若滿足終止條件達到最大迭代次數,則終止迭代,pg為群體最優解,即當前最優控制量;否則,返回步驟2) .
6) 給出訓練誤差允許值e,β,μ0,令k=0,μ=μ0.將由PSO算法得到的群體最優解pg作為LM算法的初值u0.
7) 由式(8)計算k+1時刻控制量uk+1,由式(3)和式(4)計算目標函數值Jk+1.
8) 按式(9)計算Jacobian矩陣A(u) .
9) 若E(uk)<ε,uk為最優控制量,轉至步驟11);否則,以uk+1為新的初值計算誤差指標函數E(uk+1)=uk+1E(uk) .
10) 若E(uk+1) 11) 停止。 4預測控制結構圖 預測控制結構圖如圖1所示。針對非線性被控對象,以BP神經網絡建立多步預測模型并預測系統輸出值ym,通過反饋校正減小預測誤差e,利用LM-PSO算法對目標性能函數J進行滾動優化,求解出最優控制量uk,從而實現對非線性系統的預測控制。 圖1預測控制結構圖Fig.1 Block diagram of predictive control 5仿真分析 非線性對象數學模型描述如下: (13) 產生一組均勻分布的隨機序列作為輸入,將300組數據用于離線建模,前200組數據用于訓練神經網絡,后100數據用于測試。 圖2 BP神經網絡預測結果Fig.2 Prediction results of BP neural network 從圖2所示的預測結果計算得到,其平均絕對誤差為0.010 4,最大絕對誤差為0.032 2,表明該模型預測精確度較高。 以方波信號作為輸入進行仿真,頻率為10Hz.在進行預測控制時,BP神經網絡參數選擇為:學習速率θ=0.5,慣性系數α=0.05;LM算法的參數選擇為:e=10-6,β=10,μ0=0.001;PSO算法參數選擇為:c1=1.5,c2=1.5,w1=0.9,w2=0.4.同時采用如下3個性能指數來評價控制方法的跟蹤性能:均方根誤差(ERMS),平均絕對誤差(EAA),最大絕對誤差(EMA): (14) (15) (16) 式中:N為步長;yi為第i步的實際輸出值;yri為第i步的系統給定值。 為驗證本文提出的預測控制方法的有效性,并檢驗該方法在模型失配情況下的控制效果,在k=120時改變非線性對象模型為: (17) 其控制結果如圖3所示,模型失配前后性能指標對比結果分別如如表1、表2所示。 圖3 系統輸出曲線Fig.3 Curves of system outputs 方法ERMSEAAEMALM-PSO-BP0.00750.00200.0590LM-BP0.05710.01490.4695PSO-BP0.05230.01650.2929 表2 模型失配下3種控制方法跟蹤性能 從圖3和表1中看出,在模型失配前,3種優化方法均能使控制系統到達穩態;但LM-PSO-BP比LM-BP和PSO-BP表現出更快的響應速度、更少的超調時間和更準確的控制精度,且與其他兩種方法相比,LM-PSO-BP的實際輸出值與預測輸出值之間的誤差更小。證明LM-PSO-BP具有更好的目標函數優化能力。 由表2可知,在k=120時,系統模型失配后,LM-PSO-BP的控制量迅速發生改變并達到狀態,其所需調整步數明顯優于LM-BP和PSO-BP,且性能指標ERMA,EAE和EMA均低于其他兩種方法。實驗證明,基于LM-PSO-BP的預測控制方法能夠很快消除干擾帶來的影響,使系統更快更好地達到穩定狀態。 為驗證本文方法的抗噪聲干擾能力,在k=120時給系統施加一個干擾信號,即d(120)=0.2,控制結果和誤差如圖4所示,性能指標對比結果如表3所示。 圖4 加入干擾信號的系統輸出曲線Fig.4 Curves of system outputs under interference signal 方法ERMSEAAEMALM-PSO-BP0.04630.01110.3857LM-BP0.07530.01950.5510PSO-BP0.11770.02930.9481 從圖4和表3可以看出,系統在加入干擾信號后,LM-PSO-BP的響應速度、超調時間、與系統預測輸出值之間的訓練誤差等均優于LM-BP和PSO-BP,證明LM-PSO-BP具有更好的抗干擾能力。 仿真結果表明,在系統模型失配或加入干擾信號的情況下,本文提出的LM-PSO-BP預測控制方法表現出良好的抗干擾性,具有較好的綜合性能。 6結論 針對非線性系統,提出了一種基于BP神經網絡和LM-PSO算法的新型預測控制方法。該方法中,以BP神經網絡建立非線性對象預測模型,利用LM-PSO算法進行滾動優化求解目標性能函數,得出最優控制量后進行反饋校正。利用PSO算法操作簡單,需調參數較少等優點,先得出一個最優解,并以此作為LM算法的初始值,解決了LM算法依賴初值的問題;并結合LM算法的快速收斂性,提高了全局尋優能力。通過對非線性系統的仿真研究,驗證了該預測控制方法具有較好的控制性能,可有效應用于非線性系統中。 參考文獻: [1]席裕庚.預測控制:第2版[M].北京:國防工業出版社,2013:130-134. [2]LEEJH.Modelpredictivecontrol:reviewofthethreedecadesofdevelopment[J].InternationalJournalofControl,AutomationandSystems,2011,9(3):415-424. [3]李妍,毛志忠,王琰,等.基于多面體終端域的Hammerstein-Wiener非線性預測控制[J].自動化學報,2011,37(5):629-638. [4]吳德會.非線性動態西東的Wiener神經網絡辨識法[J].控制理論與應用,2009,26(11):1192-1196. [5]靳起兵,楊瑞賡,王珠,等.一類統一非線性的Hammerstein模型辨識方法研究[J].系統仿真學報,2011,26(12):2887-2891. [6]LUCH.Waveletfuzzyneuralnetworksforidentificationandpredictivecontrolofdynamicsystems[J].IEEETransIndElectron,2011,58(7):3046-3058. [7]李松,劉力軍,解永樂.遺傳算法優化BP神經網絡的短時交通流混沌預測[J].控制與決策,2011,26(10):1581-1585. [8]ZHENGPengyuan,XIYugeng,LIDewei.Closed-looprobustmodelpredictivecontrolfortime-delaysystemswithstructureduncertaines[J].ControlTheory&Applications,2013,30(6):683-692. [9]NANDK,SINGHSP.SimulatedresponseofNNbasedidentificationandpredictivecontrolofhydroplant[J].ExpertsystemswithApplication,2007,32(1):233-244. [10]王鈺,郭其一,李維剛.基于改進BP神經網絡的預測模型及其應用[J].計算機測量與控制,2005,13(1):39-42. [11]韓敏,穆大蕓.回聲狀態網絡LM算法及其混沌時間序列預測[J].控制與決策,2011,26(10):1469-1478. [12]KALLAPURAG,BOYSONTK,PETERSENIR,etal.Nonlinearestimationofring-downtimeforaFabry-Perotopticalcavity[J].OpticalSocietyofAmerica,2011,19(7):6377-6386. [13]樊兆峰,馬小平,邵曉根.非線性系統RBF神經網絡多步預測控制[J].控制與決策,2014,29(7):1274-1278. [14]HOSSEINM.Long-termpredivtionofchaotictimeserieswithmulti-steppredictionhorizonsbyaneuralnetworkwithLevenberg-Marquardtlearningalgorithm[J].Chaos,SolitonsandFractals,2009,41(2009):1975-1979. [15]HASHEMISM,REZAPOURM,MORADIA.AneffectivehybridPSO-basedalgorithmforplanningUMTSterrestrialaccessnetworks[J].TaylorandFrancisLtd,2010,42(3):241-251. (編輯:劉笑達) Nonlinear Predictive Control Based on LM-PSO Algorithm and BP Neural Network WANG Bingxuan,LI Guoyong,WANG Yanhui (CollegeofInformationEngineering,TaiyuanUniversityofTechnology,Taiyuan030024,China) Abstract:In this paper, a multistep predictive control method for nonlinear systems was proposed, which uses a Back Propagation(BP) neural network as a model. First,a multi-step predictive model based on BP neural network was constructed and applied to predict the output of the system. Then the optimal control values were obtained by the rolling LM-PSO optimization algorithm, which was combined with Levenberg-Marquardt(LM) algorithm and Particle Swarm Optimization(PSO) algorithm. Feedback correction was achieved by modifying reference input according to the error. The PSO algorithm was introduced into the LM algorithm to overcome the limitation of initial value, enhance the ability of escaping from local optima and improve the speed and precision of the solution. This method can be used to design effective predictive controllers for univariate nonlinear systems with uncertain mathematical models. The simulation results demonstrated the self-adaptive ability, robustness and efficiency of the proposed method. Key words:nonlinear system;predictive control;Levenberg-Marquardt algorithm;particle swarm optimization algorithm;back propagation neural network 文章編號:1007-9432(2016)02-0207-05 *收稿日期:2015-09-30 基金項目:國家自然科學基金資助項目:改善電液伺服系統動態特性的雙自由度回路原理及控制方法(51075291) 作者簡介:王炳萱(1990-),女,太原人,碩士生,主要從事預測控制、智能控制理論及其應用研究,(E-mail)wangbingxuan0503@163.com通訊作者:李國勇,教授,主要從事預測控制、故障診斷和智能控制理論與應用等研究,(E-mail)tygdlgy@163.com 中圖分類號:TP273 文獻標識碼:A DOI:10.16355/j.cnki.issn1007-9432tyut.2016.02.016





