摘 要:在機器人足球比賽中,底層運動控制作為重要的一個部分,其控制器的設計,對機器人能否平穩、快速的到達指定點有著很大的意義。BP神經網絡算法,能以任意精度逼近任意非線性函數,且結構簡單、逼近性能良好。通過運用BP神經網絡整定PID控制參數,介紹了其對中型組兩輪驅動的足球機器人的底層運動控制器的算法進行設計并優化后達到的對機器人良好的運動控制效果。
關鍵詞:足球機器人;神經網絡;PID;運動控制
中圖分類號:TP
文獻標識碼:A
文章編號:1672-3198(2010)12-0292-01
1 基于BP神經網絡參數整定的PID控制器仿真
仿真的一項重要內容就是神經網絡初始權值的確定。我們可知隱含層節點的輸入為ui=∑4wijxj在計算中常用兩個矩陣來表示。輸入矩陣,輸出矩陣,輸入層至隱含層和隱含層至輸出層權值矩陣。初始權值矩陣選取是關鍵之一,其決定最終優化效果,但是權值初始化非常困難,一般采用的方法是隨機生成初始權值矩陣,進行仿真,取仿真效果較好的幾組隨機初始矩陣值。此法隨機性較大,需要通過輸入不同目標點進行檢測,取得仿真效果較好(多數樣本有效)的一組作為初始矩陣。但此法還是有一定缺陷,只能局部目標點可以采用。為了獲得良好控制效果,這里對PID控制器進行簡單改進。將PID控制器的偏差量error(k),error(k-1)(上次誤差),error(k-2)(前次誤差)全部進行預處理,即同時除以第一次誤差d1。然后按神經網絡輸出的PID參數原值進行計算,得到輸出。
2 基于BP神經網絡參數整定的PID控制器設計改進
通過研究,在能到達目標點的前提下,機器人的速度曲線理想情況下應該要使啟動平穩,在增量PID中若初始壓低輸出(即經過一段距離后,控制器輸出才到達最大值,距離長短由角度控制器決定),隨時間累積到達一定值時被控對象輸入為最大值,最大值持續輸出一段距離后,被控對象輸入開始下降,使被控對象輸出下降到一定的可控范圍內。此時,PID控制器中隨時間累積的項就是積分項。但積分作用初始很強,所以初始速度過猛,這就需要減弱微分作用的靈敏度,于是本文就采用不完全微分控制算法,來達到此改進目的。不完全微分控制算法的作用就是減弱初始一段時間的積分作用,將其作用延后,即如上圖所示,中間段速度持續最大值。
這里改進后控制器輸出為:u(k)=a×u(k-1)+(1-a)×du(k)。
3 PID控制器與基于BP神經網絡整定的控制器的仿真對比
下面,通過與P控制比較來分析基于神經網絡整定的PID調節的優點。為了便于設計和調節,在此簡化PID控制器為P控制器,即v=k1×Ed,w=k2×Er。進行仿真對比,這里針對一般目標點(1000,5000),兩個特殊目標點(10000,50)、(50,10000)三個點進行檢測。對比例系數調節過程遵循兩個原則:
(1)末端可控(即末態速度在下一階段開始時的速度可控范圍內);
(2)在規定時間內到達目標點。接下來就是根據快速性和平穩性優化參數。在此我們不妨觀察目標點為(10000,50)時兩者的對比圖。其中(k1=0.67,k2=15),
圖1 目標點為(10000,50)的PID控制器仿真
圖2 目標點為(10000,50)改進后的神經網絡控制器仿真
圖1 目標點為(10000,50)改進后的神經網絡控制器仿真(the simulation of improved neural network controller on target point(10000,50))
通過上面P控制器和基于BP神經網絡的PID控制的仿真的比較,可以看出,改進后的控制效果明顯優化了很多,初始速度有一段上升時間,可見控制器的輸出被壓低取得明顯效果,并且能保證大的輸出持續一段時間(積分作用有效),最后輸出下降,有利于下一階段控制。這是控制器進行不完全積分后取得的好效果。本次設計的控制器PID參數是實時在線進行優化的,所以每次PID參數都在改變,有利于實時跟蹤輸入信號,達到優化控制的目的。
參考文獻
[1]謝富強,唐耀庚.多層前向神經網絡權值初始化的研究進展[J].南華大學學報,2006,(9).
[2]王建華,黃河清.計算機控制技術[M].北京:高等教育出版社.