徐夢 史豪斌 李繼超



摘要:PID控制是一種根據系統的誤差,使用比例、積分、微分計算出控制量調節系統誤差的控制方法,PID控制器由于不需要建立精確的系統數學模型而廣泛應用于工業控制的各個領域。但是經典的PID控制方法的三個參數值通常是人工賦值,而人工賦值往往依賴于經驗,因此控制效率較低。B尸神經網絡具有很強的泛化能力,可以逼近任意的非線性函數,本文使用BP神經網絡調節PID控制器的參數。但是經典BP神經網絡需要不斷地調節權值,因此收斂速度很慢,本文利用動量常數加速神經網絡的訓練。仿真試驗驗證了本文提出的使用加速B尸神經網絡調節PID控制器參數的方法具有更快的收斂能力,能夠實現系統的快速逼近功能。
關鍵詞:BP神經網絡;動量常數;PID控制;仿真試驗
中圖分類號:TP13 文獻標識碼:A
PID控制器[1]又稱為比例一積分一微分控制器,其結構簡單,控制效果良好,是一種在航空航天控制及工業過程控制中常見的反饋回路部件,經典的PID控制器是由比例、積分、微分三個單元的控制器組成。比例控制是PID控制器的基礎,積分控制可消除穩態誤差,微分控制可加快大慣性系統響應速度以及減弱超調趨勢。合理地調節比例、積分、微分控制參數是PID控制器取得良好效果的基礎,但是在實際應用中參數的調節往往依賴經驗,而經驗的獲取需要通過大量的嘗試,因此,PID控制器參數的整定成為PID性能提高的瓶頸。人工神經網絡[2]一直是人工智能領域的研究熱點,它從信息處理的角度對人腦神經元網絡進行抽象,建立神經元模型,按不同的連接方式構成不同的網絡。人工神經網絡作為連接主義的典范,它使用廣泛互聯的結構和有效的學習機制來模仿人類大腦的信息處理過程,不僅是人工智能研究的重要方法,也是當今類腦智能研究的重要工具[3]。BP神經網絡是一種按照誤差反向傳播算法訓練的多層前饋神經網絡,是目前應用最廣泛的神經網絡,因為其具有很強的泛化能力,可以逼近任意的非線性函數,因此,本文使用BP神經網絡實現PID控制參數的整定,實現控制參數的自行調節。
PID控制器廣泛應用于工業控制領域,也一直是國內外學者的研究熱點。
參考文獻[4]將PID控制方法應用在四旋翼無人機的飛行控制上,首先對四旋翼無人機進行動力學建模,并在動力學建模的基礎上設計了PID控制器,但是經典的PID控制器的增益調節需要耗費大量的時間,因此效率不高。參考文獻[5]提出了一種使用BP神經網絡的PID控制器參數自整定方法,通過仿真試驗驗證了所提出方法的效果,但是經典的BP神經網絡容易陷人局部最小值,收斂速度較慢。參考文獻[6]將Smith補償控制原理與BP神經網絡在線自整定PID控制器結合,可以改善經典BP神經網絡(BPNN)的不足,但是在實際生產實踐中,這種方法仍然存在收斂速度慢等問題。針對經典BP神經網絡收斂速度慢、學習效率不高的問題,本文在BP神經網絡反向傳播過程中引入動量常數,動量常數使得在垂直向下的方向上具有加速下降的趨勢,當學習曲面產生峰和谷時,才減緩這種趨勢,使用動量常數可以使得神經網絡的訓練產生穩定的效果[8]。
1 神經網絡加速算法
1.1 BP神經網絡
經典BP神經網絡是由輸入層、隱含層、輸出層三部分組成,每一層可以為一層或是多層,BP神經網絡中權值的調整采用的是反向傳播算法[7],圖1展示了BP神經網絡的基本結構。反向傳播算法由兩部分組成:信息的正向傳播與誤差的反向傳播。在信息的正向傳播過程中,輸入信息從輸入層到隱含層逐層傳遞直到輸出層,每一層神經元的狀態只影響下一層神經元的狀態。如果在輸出層沒有得到期望的輸出,則計算輸出層的誤差變化值,然后反向傳播,通過BP神經網絡將誤差信號沿原來的連接通路反向傳遞回來更新各層神經元的權值直至達到期望值。
為提高BP神經網絡的訓練速度,本文使用一種在反向傳播過程中加人動量常數[8]的BP神經網絡加速算法。在學習率為常數情況下,使用雙曲線正切函數表示S型激活函數,并且在隱含層到輸出層之間加人動量常數來加速訓練[9]在神經網絡的反向傳播算法中包含動量常數會對訓練產生穩定的效果,通過與經典BP神經網絡算法進行分類試驗對比,證明了本文提出方法具有更快的收斂速度與學習能力[10,11]。
1.2 BP神經網絡加速算法
圖1展示了BP神經網絡的基本結構,在BP神經網絡中,輸出層的輸入等于隱含層的輸出,其余各層中,設某一層中任一神經元j的輸入為netj,輸出為yj,與這一層相鄰的低一層的神經元i的輸出yj則計算輸出為:式中:a=1.716,b=0.667,θj為神經元j的閾值。設定輸出層的第k個神經元的實際輸出是yk,輸入為netk,當與輸出層相鄰的隱含層中第j個神經元的輸出為yj,則yk和netk分別為:
BP神經網絡的權值通過反向傳播的方式進行更新,在權值的第t次迭代過程中,對于一個輸入模式xpt,若輸出層中第k個神經元的期望輸出為Opkt,實際輸出為ypkt,則輸出層的輸出方差為:
若有N個輸入樣本,則神經網絡系統的方差為:
因為連接權值ωkjt的修正應該使得方差Ept最小,因此ωkjt應該沿著Ept的梯度方向變化,當輸入xpt時,ωkjt的修正量成正比,可以表示為:式中:k為學習率,0<}刀<1為動量常數,在本文中,動量常數取值為0.95。因此,可以得到:
對于與輸出層相鄰的隱含層中神經元j和比該隱含層更低的神經元i,權值ωji的修正量為:
其中:
因此:
所以可以得到隱含層連接權值的修正量為:
2 加速BP神經網絡的PID參數調節模型
圖2展示了使用加速BP神經網絡調節PID參數的基本結構,加速BP神經網絡采用三層結構:輸入層、隱含層、輸出層。輸入層與輸出層神經元的個數為3,隱含層神經元的個數為m,使用i表示輸入層的神經元節點,使用j表示隱含層的神經元節點,使用p表示輸出層的神經元節點。加速BP神經網絡的輸入層輸入的是系統的狀態量,即系統在某一時刻的輸入量、輸出量、輸入與輸出的差,BP神經網絡的輸出為PID控制的參數Kp,Ki,Kd。
BP神經網絡的輸入層輸出為:Oi(1)=x(i),i=1,2,3,隱含層輸入為:
隱含層輸出為:式中,ωji(2)為輸入層到隱含層的權值,f(x)為雙曲線正切激活函數,上標(1)、(2)、(3)分別代表輸入層、隱含層、輸出層,使用雙曲線正切函數作為激活函數,神經網絡的學習速率會加快,激活函數為:式中,a與b都是常數,兩者的取值為a=1.716,b=0.667。隱含層的輸出作為輸出層的輸入,輸出層的輸入為:輸出層的三個輸出為:
輸出層的三個輸出為:
輸出層輸出的是PID控制器的三個參數,可以表示為:
BP神經網絡的方向傳播過程使用梯度下降的方法更新權值,如1.2節所述,在反向傳播過程中引入動量常數,隱含層到輸出層的權值更新公式如式(17)所示:式中e(k)= r(k)-y(k)。本文使用u(k),y(k)的相對變化量估計,如式(18)所示:
PID控制器的輸出為:
權值更新公式可以表示為:
3 試驗分析
3.1 加速BP神經網絡調節PID控制器的實現步驟
使用加速BP神經網絡調節PID控制器的具體實現步驟如下:
(1)初始化神經網絡的輸入層節點、隱含層節點,給出各個層的權值初始值、初始化學習率、迭代次數等。
(2)通過實時采樣得到rin(k),y(k),并計算兩者的誤差error(k)=rin(k)-y(k)。
(3)計算加速BP神經網絡的輸出,神經網絡的輸出就是PID控制器的三個增益值。
(4)神經網絡通過反向傳播算法更新權值,神經網絡不同的輸出使得PID控制器參數不斷調整。
(5)如果達到迭代次數則停止迭代。
3.2 加速B戶神經網絡調節PID參數對比試驗
試驗對比了加速BP神經網絡與經典BP神經網絡調節PID控制參數的效果,首先設置試驗參數,設置神經網絡的學習率為0.3,動量常數為0.25,神經網絡的輸入層神經元個數為4,隱含層神經元的個數為5,輸出層神經元個數為3。圖3~圖8分別為使用經典BP神經網絡與加速BP神經網絡(JBPNN)進行系統逼近的試驗結果,系統的輸入為:rin(x)=1,系統的輸出為:
圖6~圖8分別為使用經典BP神經網絡與加速BP神經網絡調節PID控制器的輸入輸出變化曲線與PID控制器的三個參數的輸出變化曲線。圖5與圖8分別展示了使用經典BP神經網絡與加速BP神經網絡調節PID控制器的輸入與輸出曲線圖,由于PID控制是一種基于誤差的閉環反饋控制,當輸出等于輸入時,完成系統逼近的功能。圖3展示了使用經典BP神經網絡與加速BP神經網絡在學習率為0.3時的誤差收斂曲線,誤差通過系統的輸入與輸出做差得到,試驗結果表明了使用加速BP神經網絡的收斂速度高于經典BP神經網絡。為了進一步說明試驗效果,本文分別設置學習率從0.05到0.35之間,觀察經典 BP神經網絡與加速BP神經網絡的誤差收斂時間隨學習率變化曲線,如圖4所示,加速BP神經網絡的收斂時間總是少于經典BP神經網絡,因此,加速BP神經網絡收斂效果優于經典BP神經網絡。
4 結論
本文對PID控制方法進行了研究,通過分析,可以得出以下結論:
(1)針對經典的PID控制器固定增益、收斂速度慢的問題,設計了一種使用BP神經網絡調節控制器增益的智能控制方法,通過訓練神經網絡可以自適應地調節控制器的增益。
(2)針對經典BP神經網絡的不足,使用了一種改進BP神經網絡調節PHD控制器參數,該改進BP神經網絡在反向傳播過程中加人動量常數,并使用雙曲正切函數作為激活函數。本文最后設計了使用神經網絡調節PID控制器參數的試驗,試驗結果表明了改進BP神經網絡具有比經典BP神經網絡更快的收斂速度,能夠更快地實現系統逼近的效果,這也驗證了本文所提出方法的有效性。
參考文獻
[1]Bouabdallah S,Noth A,Siegwart R.PID VS LQ controltechniques applied to an indoor micro quadrotor[C]//IEEE/RSJInternational Conference on Intelligent Robots and Systems,2014.
[2]Afram A,Janabi-Sharifi F,Fung A S,et al.Artificial NeuralNetwork(ANN)based Model Predictive Control(MPC)and optimization of HVAC systems:A state of the art reviewand case study of a residential HVAC system[J].Energy&Buildings,2017,141:96-113.
[3]焦李成,楊淑媛,劉芳,等.神經網絡七十年:回顧與展望[J].計算機學報,2016,39(8):1697-1716.
[4]李俊,李運堂.四旋翼飛行器的動力學建模及PID控制叨.遼寧工程技術大學學報,2012,31(1):114-117.
[5]廖芳芳,肖建.基于BP神經網絡PID參數自整定的研究叨,系統仿真學報,2005,17(7):1711-1713.
[6]季春光,王朋,李士勇,等.基于神經網絡的時變大滯后系統的Smith預估控制[J].哈爾濱工業大學學報,2003,35(3):303-306.
[7]Khadse C B,Chaudhari M A,Borghate V B.Conjugate gradientback-propagation based artificial neural network for real timepower quality assessment[J].International Journal of ElectricalPower&Energy Systems,2016,82:197-206.
[8]Rumelhart D E,Hinton G E,Williams R J.Learningrepresentations by back-propagating errors[J].Readings inCognitive Science,1986,323(6088):399-421.
[9]Guyon I,Albrecht P,Cun Y L,et al.Design of a neuralnetwork character recognizer for a touch terminal[J].PatternRecognition,1991,24(2):105-119.
[10]Watrous R.Learning algorithms for connectionist networks:Applied gradient methods of nonlinear optimization[R].Proc.ICNN-87,1988:619-628.
[11] Jacobs RA.Increased rates of convergence through learning rateadaptation[M].University of Massachusetts,1987.