韓軍政 馬軍 桑和成


摘 要
針對傳統PID控制不能實現移動機器人在避障中參數的自整定、響應慢等問題,本文提出一種BP神經網絡PID控制方法,利用BP神經網絡學習算法實現了PID三個參數的在線自整定。仿真實驗表明,BP神經網絡PID控制具有更快的響應速度、無明顯超調、控制精度高,能滿足機器人避障運動的控制要求。
關鍵詞
避障;自整定;BP神經網絡
中圖分類號: TP183;TP242 文獻標識碼: A
DOI:10.19694/j.cnki.issn2095-2457.2020.03.014
0 引言
隨著智能機器人技術的快速發展,移動機器人得到了廣泛的應用。移動機器人在進行避障時選擇的算法不同,文獻[1]提出了一種神經網絡控制的機器人避障運動方法,用于障礙物識別和避障;文獻[2]提出了一種BP神經網絡 PID 控制器設計的方法,可以實現參數的在線自我調整,控制效果優于傳統方法。根據移動機器人在避障過程中的實際需求,傳統控制算法很難達到精確控制,本文給出了一種BP神經網絡PID的控制方法,為移動機器人實時避障提供了一種新的控制方法。
1 BP神經網絡PID控制器設計
PID控制器是使用最廣泛的控制器,它操作簡單方便,控制精度較高。而移動機器人避障系統是一個復雜的控制對象,無法建立精確的數學模型,傳統PID控制就不能滿足實際需要。針對移動機器人避障運動復雜性特點,將神經網絡與傳統PID控制相結合,既能體現神經網絡的靈活性強和自適應學習能力好的一面,又具有PID控制器精度高的優勢,在一定程度上能增強避障運動系統的自適應能力。BP神經網絡PID控制器由兩部分構成:(1)傳統PID控制器,它是一個閉環控制系統,根據被控對象反饋的信息逐步減小誤差,使輸出量滿足期望值;(2)BP神經網絡:有著很好的自學習能力,能實時調整PID控制器的輸出參數,不斷地學習、減小誤差,可以實現輸出量的最優化,即PID控制器的三個參數Kp,Ki,Kd。神經網絡經過自身的在線學習、權值系數不斷地修正,使得運動控制系統能在很短的時間內達到穩定狀態。
2 移動機器人避障運動控制策略
移動機器人按一定的速度直線行走,當位于前端的傳感器檢測到正前方有障礙物時,路況信息會反饋給機器人,其控制模塊的微處理器會產生新的PWM信號,通過電動機驅動模塊來控制電動機的速度和轉向。電機轉動后,霍爾傳感器將會檢測到電機的脈沖數并將其重新傳輸到控制模塊,控制模塊計算出車輪的實際轉速,再把實際轉速與預定轉速的差值輸入到神經網絡PID控制器中,經神經網絡PID算法學習后,給控制器輸出新的PWM占空比再次控制電機,使輸出的實際轉速與預定轉速一致。神經網絡PID控制的基本思想是將閉環系統反饋回來的實際運動速度與預定速度進行比較,并將其速度偏差作為輸入量送入BP神經網絡PID控制器中,經過神經網絡的學習算法訓練后,系統會快速的響應達到穩定狀態,在此狀態下輸出最優的控制參數,從而實現參數的在線自我整定。這種模型控制方法大大提高了機器人避障的靈活性和精確性,對移動機器人直線運動的精度有了很大的改善。
3 仿真與分析
仿真實驗時,初始化每個參數,對神經網絡的輸入、輸出權值進行賦值。在多次訓練后,選取慣性系數α=0.1,學習速率η=0.25;設置采樣周期ts=0.001s,步長k=1000。根據達到設置誤差的時間長短來判斷神經網絡的訓練步數。本文以無刷直流電機的二階傳遞函數為被控對象,電機的傳遞函數為:
G(s)=
對PID控制器的各個參數系數賦值,kp=0.05、ki=0.03、kd=0.01。Matlab仿真結果如圖1-2所示。對比圖1和圖2,可以得出BP神經網絡PID的控制效果好于傳統的PID控制。根據系統達到穩定的時間判斷訓練步數可知,BP神經網絡PID控制在第50步時響應值為1,無明顯超調;傳統PID控制的系統振蕩了兩次,最大超調量為21%,并在第100步時達到響應值為1。從誤差曲線中可以看出,系統達到穩定時,BP神經網絡控制器響應較快,誤差變化率較小。因此得出結果,BP神經網絡PID控制算法具有較高的響應速度和較強的在線學習適應能力。
4 結論
文中提出的基于BP神經網絡PID控制方法克服了傳統PID控制效果不良及參數整定困難等缺陷,實現了BP神經網絡PID控制的快速高效、參數實時整定和最優的控制輸出;能滿足移動機器人避障運動的控制要求,具有一定的現實應用價值。
參考文獻
[1]張素芹.機器人BP神經網絡避障控制模型構建及仿真[J].西安工業大學學報,2015,35(08):678-682.
[2]張永振,蘇寒松,劉高華,廖澤龍.基于BP神經網絡的PID控制器參數調整[J].南開大學學報(自然科學版),2018,51(03):26-30.