王長正,向鳳紅,毛劍琳
(昆明理工大學信息工程與自動化學院,云南 昆明 650500)
板球系統是一個典型的兩輸入兩輸出系統,其作為控制領域驗證各種控制算法的基本對象,引起了很多學者的關注[1-5]。文獻[6]將滑模控制與自適應模糊控制結合,利用蟻群算法優化系統參數,提高了板球系統的軌跡跟蹤精度。文獻[7]將自適應補償、監督和間接模糊自適應3種控制算法相結合,提出了間接模糊自適應控制算法,減少小球誤差至零鄰域內。文獻[8]在球桿系統上證明了粒子群算法對比例、積分 、微分(proportion integration differentiation,PID)參數優化的高效性。
PID控制器結構簡單、易于操作,被廣泛應用于自動化工業控制中[9]。本文提出徑向基函數(radial basis funation,RBF)神經網絡和遺傳算法,結合PID控制器在GPB2001型板球系統上完成定位控制和軌跡跟蹤試驗。在震蕩度、穩定時間和軌跡完成度等方面與RBF-PID控制算法作對比,以證明所提算法的優越性。
選取固高科技公司研發的GBP2001型板球系統作為本文試驗平臺。板球系統實物模型如圖1所示。表1為板球系統參數。

圖1 板球系統實物模型Fig.1 Physical model of ball and plate system

表1 板球系統參數Tab.1 Parameters of ball and plate system
由于板球系統的復雜性,對模型進行簡化和線性化,在建模過程中作以下4點假設。
①小球在平板上沒有滑動和繞小球垂直中心軸旋轉的運動[10]。
②不考慮板的角度和面積的限制。
③小球和平板始終接觸。
④忽略小球和平板間所有摩擦。
板球系統動力學模型圖2所示。

圖2 板球系統動力學模型Fig.2 Kinetic model of ball and plate system
利用牛頓定律或拉格朗日方程對其完成分析,可得板球系統x軸和y軸的動力學方程分別如式(1)和式(2)所示:
(1)

(2)
式(1)、式(2)所建立的非線性模型在實際操作中難以實現。因此,我們需要用線性理論來實現模型的線性化,可得線性方程如式(3)、式(4)所示:
(3)
(4)
對PID控制器三個參數,即比例(proportion)、積分 (integration) 、微分(differentiation),進行整定,可使系統達到穩定的控制效果。由于實際應用中系統的耦合性、非線性時變性,數學模型難以確立,傳統的PID控制無法在板球系統中達到理想的控制效果[11]。設計的遺傳神經網絡PID控制器工作原理如下。
①利用遺傳算法完成PID參數的經驗積累過程。
②將PID參數送至神經網絡訓練,以實現PID參數的最優化。
③RBF神經網絡對被控對象在線辨識,得到被控對象的靈敏度參數,提高控制器精度。
控制器由三部分組成。
①由單神經元PID控制器在閉環控制內控制被控對象,對Kp、Ki、Kd在線調整。
②遺傳算法優化PID初始參數,利用RBF神經網絡的逼近能力得到一組優化的PID參數值。
③被控對象由RBF神經網絡完成在線辨識,同時RBF神經網絡對控制對象持續監測,獲得輸出對輸入的靈敏度信息。
遺傳神經網絡自適應PID控制系統結構如圖3所示。

圖3 遺傳神經網絡自適應PID控制系統結構圖Fig.3 Structure diagram of genetic neural adaptive PID control system
單神經元結合PID,不僅結構簡單,而且學習算法速度快。采用數字控制時:
(5)
式中:T為采樣周期;u(k)為kT時刻的輸入值;e(k)為kT時刻的誤差。
單神經元作為構成神經網絡的基本單位,是多輸入單輸出的非線性處理單元。神經元和PID相結合的控制方式,具有自適應性、結構簡單、計算量小、權值學習速度快等優點。設:
(6)
(7)
(8)
式(8)與式(5)形式上一致,即神經元與PID結合。f(z)是輸入變量x1、x2、x3和權重w1、w2、w3的非線性轉移函數,f(z)取為Sigmoid 函數:
(9)
u(k)=Kp(k)f
(10)
在常規PID控制中:
u(k)=Kpz(k)
(11)
Kp、Ki、Kd通過在線學習的方式完成調整。神經網絡學習算法選用梯度下降法這一無約束優化算法。梯度下降法沿著梯度負方向前進,權值的調整方向為目標函數梯度變化的反方向,實際輸出與期望之間的誤差呈減小趨勢,即可實現控制的優化目的。
二次型的目標函數為:
(12)
Kp、Ki、Kd的學習算法:
Kx(k+1)=Kx(k)+ΔKx(k)
(13)
(14)
X=P、I、D,η為學習步長,描述如下:
(15)
(16)

(17)
遺傳算法是一類針對優化問題編碼空間的、具有導向的隨機化優化搜索方法[12-13]。遺傳算法在把握整體局勢、優化系統性能方面具有優勢,是一種全局搜索能力較強的自適應算法,其收斂性由交叉概率Pc和變異概率Pm的值共同決定。
首先,遺傳算法中種群的個體為Kp、Ki和Kd這3個參數,利用適應度函數計算每一組參數的適應度值;然后,在群體中進行選擇、交叉和變異操作并不斷地進化,直至發現群體中的最優目標,得到PID控制器的最優參數。
基于遺傳算法的PID參數初始值優化步驟如下。
①參數用10位二進制編碼來表示,確定參數范圍,3個參數串接即成為個體,設定種群數量為30,迭代次數為20,交叉概率Pc=0.6,變異概率:
②隨機產生初始狀態的群體,并計算各個體的適應度值。
③若不需重新生成個體,直接執行步驟④,反之則保留最優個體的同時生成其余個體,并且對重新生成個體的適應度值完成計算,再執行步驟④。
④選擇最優個體并存檔,在其余個體中選擇將要配對的個體。
⑤采用兩點交叉和基本變異的方法,對配對完成的個體計算新一代解群中各個體的適應度值。
⑥完成以上步驟后檢查解群是否達到終止條件,不滿足則重新執行步驟③,滿足則跳轉至步驟⑦。
⑦最終的Kp、Ki、Kd值送至神經網絡學習訓練。
RBF神經網絡模擬了人腦中局部調整、相互覆蓋接受域的神經網絡結構,已證明它能以任意精度逼近任意非線性函數[13]。控制系統的輸入量有2個,分別為誤差e(k)與誤差變化率ec(k)、Kp(k)、Ki(k)、Kd(k)為系統輸出量。RBF神經網絡中:X=[x1,x2,…,xn]T為輸入向量;hj為高斯基函數;H=[h1,h2,…,hm]T為RBF神經網絡的徑向基向量,即:
(18)
式中:Cj=[cj1,cj2,…,cjm]T為RBF神經網絡的第j個節點的中心值向量。
RBF神經網絡的寬度向量為:
B=[b1,b2,…,bm]T
(19)
式中:bj為節點j的寬度,bj>0。
W代表權值向量:
W=[w1,w2,…,wm]T
(20)
整個網絡輸出:
ym(k)=w1h1+w2h2+…+wmhm
(21)
性能指標函數為:
(22)
RBF神經網絡可通過訓練減小實際與模型期望之間誤差,網絡的權值學習方法、基寬參數優化算法和中心矢量迭代方法均采用梯度下降法,如式(23)~式(28):
(23)
ω(k)=ω(k-1)+ω(k)+α[ω(k-1)-ω(k-2)]
(24)

(25)
bj(k)=bj(k-1)+ηΔbj+α[bj(k-1)+bj(k-2)]
(26)
(27)
cij(k)=cij(k-1)+ηΔbij+α[cij(k-1)+cij(k-2)]
(28)
式中:η為學習速率;η∈[0,1];α為動量因子;α∈[0,1]。
(29)
式中:x1=u(k)。
Jacobian矩陣用來描述被控對象輸出量和輸入量之間的變化關系,RBF神經網絡通過辨識Jacobian矩陣獲取所需值。
本文試驗基于深圳固高科技公司研發的GBP2001型板球試驗平臺,按照圖3所示的結構搭建控制系統,RBF神經網絡的隱含層節點為數目為6。設定以上參數,利用本文設計的PID控制器對GBP2001型板球系統進行仿真試驗。遺傳算法優化PID參數迭代曲線如圖4所示,系統階躍響應變化曲線如圖5所示。

圖4 遺傳算法優化PID參數迭代曲線Fig.4 Iteration curve of PID parameter optimized by genetic algorithm

圖5 系統階躍響應變化曲線Fig.5 System step response curve
以定位小球于板的中心(0,0)為控制目標,RBF-PID控制輸出誤差和小球運動軌跡分別如圖6和圖7所示。可以看出小球在運動控制中已經觸碰板的邊緣且震蕩誤差較大,運動軌跡較為復雜,小球經過10 s運動后穩定于板的中心位置。

圖6 RBF-PID控制器輸出誤差圖Fig.6 RBF-PID controller output error

圖7 RBF-PID控制小球運動軌跡Fig.7 Ball’s trajectory of RBF-PID control
設計GA_RBF-PID控制器,選擇控制較優的試驗并導出小球運行數據,在MATLAB中完成圖形繪制。GA_RBF-PID控制器輸出誤差如圖8所示。GA_RBF-PID控制為小球運動軌跡如圖9所示。由圖8和圖9可知,小球在板上的位移偏差減小很多,小球整體的運動軌跡與RBF-PID控制的運動軌跡相比更加簡潔,小球達到穩定狀態(球板中心)的時間也縮短至約6.5 s。以上試驗證明,GA_RBF-PID控制在板球系統定位試驗中的控制效果優于RBF-PID控制。

圖8 GA_RBF-PID控制器輸出誤差圖Fig.8 GA_RBF-PID controller output error

圖9 GA_RBF-PID控制小球運動軌跡Fig.9 Ball’s trajectory of GA_RBF-PID control
RBF-PID控制結果與GA_RBF-PID控制結果具體數據對比見表2。從表2可以看出,GA_RBF-PID控制在精確度和時效性上都有一定的提高,并且使小球的穩定位置更接近于控制位置,有效減小了位置控制試驗中的誤差。

表2 控制結果對比Tab.2 Comparison of control results
采用RBF-PID和GA_RBF-PID控制完成GBP2001板球系統的軌跡跟蹤控制試驗。小球方形軌跡跟蹤如圖10所示。

圖10 小球方形軌跡跟蹤Fig.10 Square trajectory tracking of ball
由圖10可知,小球在球盤上運動過程中,在正方形四個頂點處小球的目標位置和小球的運動方向均要發生變化。由于小球的慣性產生系統響應延遲,在四個頂點位置后的一段軌跡波動較大。在RBF-PID控制過程中,小球的誤差較大,運動曲線不夠穩定,對于設定的方形軌跡不能精確復現。在GA_RBF-PID控制過程中,隨著小球運動時間的增加,誤差越來越小,軌跡跟蹤精度越來越高,能夠完成方形軌跡的精確跟蹤。軌跡跟蹤控制實際上可看成是連續的位置控制運動。試驗結果證明,本文提出的GA_RBF-PID控制算法對板球系統的軌跡跟蹤在誤差允許的范圍內可行、有效。
由于板球系統是一個多變量、不穩定、非線性耦合的開環控制系統,在高等院校、科研院所中應用廣泛,定位控制和軌跡跟蹤控制對于驗證控制算法有效性有著重要意義。本文采用遺傳神經自適應PID控制方法對板球系統進行定位控制和軌跡跟蹤。試驗結果表明,RBF-PID和GA_RBF-PID控制算法均完成了板球系統的定位跟蹤和方形軌跡跟蹤控制,GA_RBF-PID 控制算法在軌跡跟蹤試驗中軌跡的相似度較高,控制精度優于RBF-PID控制,加強了板球系統控制的實時性。下一步計劃完善板球系統的數學模型,并在視覺檢測方面,能夠更快更準確地檢測小球位置標信息,從而完成板球系統的高精度軌跡跟蹤。