孟 宇 汪 鈺 顧 青 白國星
(北京科技大學機械工程學院, 北京 100083)
鉸接式車輛具有中央鉸接點連接,前后車體可相對轉動的結構特點,在低矮巷道和復雜工況行駛,具有靈活、機動、高效等突出優(yōu)點。鉸接式車輛的路徑跟蹤是智能礦山領域的研究熱點。針對鉸接車的路徑跟蹤控制,趙翾等[1]針對鉸接式車輛使用Ackermann公式與指數(shù)趨近律設計滑??刂七M行路徑跟蹤,HEMAMI等[2]設計了一種基于誤差動力學的路徑跟蹤控制器,PETROV等[3]在鉸接式車輛中應用了線性反饋控制,BIGRAS等[4]提出一種基于線性矩陣不等式的控制框架,RIDLEY等[5]將極點配置方法應用于鉸接車中,NAYL等[6]設計了一種采用切換模型的預測控制方案,邵俊愷等[7]提出一種基于強化學習的控制算法。其中文獻[2-3]沒有給出具體的誤差分析,文獻[1,4-7]的研究結果中位置偏差有較大超調,最大偏差大于0.5 m。過大的位置偏差可能會導致車輛在狹長、低矮巷道行駛時碰撞巷道壁,且最終穩(wěn)定跟蹤精度也有待提高。實現(xiàn)高精度的穩(wěn)定路徑跟蹤控制是保證無人駕駛鉸接車安全自主行駛的關鍵,有必要對其開展深入研究。
線性二次型最優(yōu)控制(LQR)是一種穩(wěn)定的控制方法,可利用較小的控制能量使系統(tǒng)狀態(tài)變量維持在零值附近[8],且同時可以對不穩(wěn)定系統(tǒng)進行整定,對于鉸接車多自由度運動、且行駛環(huán)境噪聲信號復雜的情況具有突出優(yōu)勢。為提高鉸接式車輛路徑跟蹤的跟蹤精度,本文結合鉸接式車輛的運動學和動力學特點,基于其誤差動力學模型提出一種基于預見信息的線性二次型最優(yōu)控制(LQR)方法。擬利用航跡推算方法對鉸接車的下一采樣時刻進行位姿估計,將預見位姿信息作為控制器的部分輸入可有效提高控制對象的反應速度。同時,將利用全局優(yōu)化算法遺傳算法對Q、R矩陣進行優(yōu)化,獲得最優(yōu)反饋控制率,實現(xiàn)鉸接車的精確路徑跟蹤,并利用Simulink和ADAMS聯(lián)合仿真驗證控制策略的有效性,且在模型樣機中進行試驗驗證。

γ=θf-θr

圖1 鉸接式車輛模型Fig.1 Articulated vehicle model
由于鉸接式車輛行駛速度較低,一般小于28 km/h[10],輪胎變形對行駛影響可忽略不計,假設α=β=0[11],可得鉸接式車輛運動幾何關系
(1)

選取前橋中點Pf(Xf,Yf)為整車狀態(tài)參考點,可以得到整車運動學模型為
(2)
由式(2)可知,通過控制車速和鉸接角可以實現(xiàn)對鉸接式車輛位姿狀態(tài)的實時控制。本文所用35 t鉸接式車輛模型部分結構參數(shù)如表1所示。

表1 鉸接式車輛模型基本參數(shù)Tab.1 Main parameters of articulated vehicle model
在控制中根據車輛當前行駛的位姿狀態(tài)信息,利用航跡推算技術建立預見位姿狀態(tài)模型,進行下一時刻采樣點位置的位姿估計,在車輛路徑跟蹤中加入預見信息,可提高路徑跟蹤控制的反應速度[12]。
鉸接式車輛行駛曲線和參數(shù)定義示意圖如圖2所示,曲線A為車輛行駛曲線;前車體中點為P,預見車輛位置點為P′;前后車體轉向中心分別為Or、Of;前后車體的航向角分別為θf、θr,轉向半徑分別為Rf、Rr[13]。

圖2 鉸接式車輛行駛曲線和參數(shù)定義Fig.2 Articulated vehicle modeling configuration
通過鉸接車的運動學模型分析,得到前車體航向角變化速度為
(3)
假定采樣間隔為Δt,前車體的預見航向角為
(4)
假定車輛逆時針轉動為正方向,計算可得前車體的轉向半徑為
(5)
為區(qū)分車輛轉動和直線行駛狀態(tài),設置車體轉動狀態(tài)量ts,且滿足以下條件
(6)
其中,設置的閾值ε通常取值較小,當鉸接角γ處在該閾值范圍內,認為車體沒有轉動。如圖2所示,車體由P(x,y)點移動到P′(x′,y′)所用時間為Δt,前車體的轉向角速度為ωf,則前車體轉過角度為
λ=|ωf|Δt
(7)
且由幾何關系可得車體移動距離
(8)
可推算下一時刻車輛前車體中點坐標P′(x′,y′)為[13]
(9)
(10)
(11)
式中δ——預見航向角與當前航向角偏差
鉸接角和車速是路徑跟蹤控制的控制變量,本文重點是實現(xiàn)鉸接角的實時控制。需要建立合適的偏差量作為控制輸入,并能夠完整地反映跟蹤控制精度。車輛勻速行駛速度為v,根據車輛行駛中的實際路徑和理想路徑的偏差情況建立的行駛示意圖如圖3所示[5]。

圖3 鉸接式車輛行駛示意圖Fig.3 Graphical representation of driving of articulated vehicle
偏差定義與分析如下[3]:
(1)位置偏差εd:鉸接車參考定位點p與參考軌跡上對應點P(與參考軌跡距離最近)的橫向位置差值
(12)
(2)行駛方向偏差εθ:鉸接車定位參考點p的航向角(速度方向與車輛坐標系x軸之間的夾角)與參考軌跡上對應點P的航向角(對應點的切線與車輛坐標系x軸之間的夾角)的差值
(13)
(3)曲率偏差εc:鉸接車定位參考點p與參考軌跡上對應點P的曲率差值
(14)
整理式(12)~(14),根據L=Lf+Lr,可得
(15)
鉸接式車速較低,且鉸接角變化較小,對鉸接角速度的變化率通??梢院雎?,對式(15)簡化,得到鉸接車誤差動力學方程為
(16)
在恒速運動情況下,鉸接車誤差動力學模型為單輸入的線性時不變模型,通過控制偏差量可實現(xiàn)對車輛鉸接角的實時控制。
鉸接車的ADAMS模型僅能反映車輛的運動學和動力學特性,為了使仿真過程符合鉸接車的實際轉向過程,對鉸接車的轉向機構進行運動分析和建模。鉸接車的轉向機構為電機驅動的液壓轉向系統(tǒng),將轉向系統(tǒng)分為4個環(huán)節(jié),并分別針對各個環(huán)節(jié)建立了比例電磁閥模型、閥芯受力平衡模型、閥控液壓缸-負載模型及轉向系統(tǒng)運動學摸型,分別推導了電磁閥控制壓力與占空比關系、液控力與閥芯位移關系、活塞輸出位移與閥芯輸入位移關系以及活塞輸出位移與車輛鉸接角關系,最終確定了電信號即占空比與輸出鉸接角的關系,并最終獲得勻速轉向的轉向機構數(shù)學模型。鉸接車轉向系統(tǒng)數(shù)學仿真模型如圖4所示,仿真結果如圖5所示,鉸接角速度為0.14 rad/s,完全符合實車的轉向特性。

圖4 轉向系統(tǒng)仿真模型Fig.4 Steering system simulation model

圖5 轉向模型仿真結果Fig.5 Steering model response in simulation

圖6 路徑跟蹤控制系統(tǒng)Fig.6 Path tracking control system
針對以上分析,建立路徑跟蹤控制系統(tǒng)如圖6所示。根據鉸接式車輛的運動學模型分析進行速度和鉸接角控制來實時控制車輛的行駛位姿狀態(tài)。由式(16)可看出,在恒速情況下,鉸接車的誤差動力學模型為線性時不變模型,而鉸接車在地下巷道行駛過程中車速較低且很少出現(xiàn)較大幅度的加減速情況,因此本研究中車輛以3 m/s的速度勻速行駛,采用PID速度控制建立速度控制器,使車速維持恒穩(wěn),再以恒速條件下的線性時不變的誤差動力學模型作為鉸接角控制模型。對于鉸接角的控制,根據車輛的當前行駛位姿信息進行下一采樣點的位姿估計可以得到預見位姿信息,且通過當前行駛狀態(tài)和預見行駛狀態(tài)與理想路徑的偏差可獲得車輛的當前狀態(tài)跟蹤偏差和預見狀態(tài)跟蹤偏差,建立線性時不變的單輸入偏差狀態(tài)方程進行LQR-GA控制,實現(xiàn)理想鉸接角輸入。通過PID速度控制和LQR-GA鉸接角控制實現(xiàn)鉸接式車輛車的實時路徑跟蹤。
LQR最優(yōu)控制可利用較低成本使系統(tǒng)達到預期性能指標,且也可以同時對不穩(wěn)定系統(tǒng)進行整定,對線性時不變系統(tǒng)的狀態(tài)反饋控制問題中,往往可取得良好控制效果,已被應用于許多工程和科學領域[14-16],同時也被運用于眾多復雜系統(tǒng)[17-20]。建立線性系統(tǒng)模型為

(17)
式中A——系統(tǒng)狀態(tài)矩陣,A∈Rn×n
B——輸入矩陣,B∈Rn×n
C——輸出矩陣,C∈Rp×n
D——狀態(tài)反饋矩陣,D∈Rp×m
u(t)、X(t)、Y(t)——系統(tǒng)輸入量、狀態(tài)量以及輸出量
根據式(17)以及表1中鉸接式車輛模型參數(shù)可得鉸接式車輛的矩陣為

由此,可控可觀性分析為
(18)
矩陣均滿秩證明該系統(tǒng)具有可控可觀性,結合式(16)、(17),鉸接式車輛的LQR控制器模型為線性時不變單輸入系統(tǒng)模型為

(19)
(20)
式中Q——系統(tǒng)狀態(tài)量權陣
R——系統(tǒng)控制量權陣
J1反映鉸接車偏離平衡狀態(tài)的程度,J2反映控制能量大小??刂颇繕耸鞘棺顑?yōu)性能指標取得最小值,即以最小的控制能量使路徑跟蹤偏差達到最小,建立反饋控制率u=-KX(t),滿足K=R-1BTP,建立Riccati方程
ATP+PA+Q-PBR-1BTP=0
(21)
式中P——對稱正定矩陣
通過求解最優(yōu)Q、R矩陣可求得最優(yōu)反饋控制率,實現(xiàn)理想鉸接角輸入。路徑跟蹤控制器的設計如圖7所示。

圖7 鉸接式車輛路徑跟蹤控制器Fig.7 Articulated vehicle path tracking controller
其中,當前偏差量為當前時刻車輛位姿與理想路徑中位姿的偏差,預見偏差量為下一時刻的預見位姿與理想路徑位姿的偏差,為避免引入的預見信息量值過大,導致控制過度引起車輛抖振,在控制器中加入柔化操作環(huán)節(jié),綜合考慮當前偏差量信息和預見的偏差量信息,以提高控制器的穩(wěn)定性和反應速度,即LQR控制器的最終輸入為
ε(t)=aε1(t)+bε2(t)
(22)
其中
式中ε1(t)——當前跟蹤偏差矩陣
ε2(t)——預見信息偏差矩陣
a、b——柔化系數(shù)
ε(t)——LQR控制器輸入
遺傳算法(GA)是一種用于解決最優(yōu)化的一種搜索啟發(fā)式算法,具有良好的全局搜索能力,并且利用其內在并行性,可以方便地進行分布式計算,加快求解速度。
在LQR控制中存在狀態(tài)量權重矩陣Q和控制能量權重矩陣R的選取兩個重要問題,不同的選取結果將直接影響控制效果,在傳統(tǒng)優(yōu)化方法中,Q、R的計算通常會耗費較長時間且多依賴于專家經驗[21]。遺傳算法作為一種全局優(yōu)化算法,可對Q、R矩陣進行優(yōu)化,克服傳統(tǒng)LQR控制的缺點,LQR-GA控制在倒立擺控制、復合電力系統(tǒng)和飛行器俯仰控制等[22-24]問題中已取得較大進展。


圖8 遺傳算法流程Fig.8 Block diagram of genetic algorithm scheme
評價函數(shù)選擇為LQR控制的最優(yōu)性能指標,當最優(yōu)性能指標取得最小值時,即可達到最優(yōu)控制效果。且設置約束條件為
(23)
(1)編碼方式
因為二進制編碼通常會在目標函數(shù)中引入附加的多峰性,使得編碼后的目標函數(shù)比原始問題更復雜,并且在函數(shù)優(yōu)化和約束優(yōu)化領域,實數(shù)編碼比二進制和Gray編碼更為有效,實數(shù)編碼在基因型空間和表現(xiàn)型空間中是一致的,在本文中采用實數(shù)編碼。

(2)群體取值范圍


(24)
由于采用無限時間狀態(tài)調節(jié)器的控制系統(tǒng),其閉環(huán)系統(tǒng)是漸進穩(wěn)定的,n變化范圍為1~100,變化間隔為10,系統(tǒng)的閉環(huán)極點位置。
表2顯示了系統(tǒng)的閉環(huán)極點位置與狀態(tài)反饋增益矩陣K隨著n變化的趨勢。由閉環(huán)極點位置變化可以判斷,n>30后繼續(xù)增大對于主導極點的影響甚微,僅對于系統(tǒng)的輔助極點有一定影響,使其遠離虛軸原點,對系統(tǒng)的性能影響不大,因此,n應取較小值,即取n≤30。狀態(tài)反饋增益矩陣K的變化如表2所示,隨著n增大而增大,對于狀態(tài)變量的變化約束加強。

表2 閉環(huán)極點位置及狀態(tài)反饋矩陣K隨n的變化Tab.2 Change of K with n in closed-loop pole position and state feedback matrix
綜合以上分析,取n≤30,即群體中個體最大值為30。
(3)交叉方式
采用離散交叉的方式,即選定一個基因位,如選定q1,然后將選定的2個染色體在這個位置之后的基因進行交換。
(4)變異
在任意一個基因位,如選定q1,隨機產生2個整數(shù)相交換等來進行變異。
(5)參數(shù)選取
設定種群數(shù)為100,精英數(shù)為10,交叉概率為0.4,連續(xù)進化代數(shù)限制為20,遺傳算法迭代終止代數(shù)為50,采用隨機一致選擇、順序排序。
建立適應度函數(shù)為
(25)
自適應函數(shù)值偏差預設為0.01,為避免搜索陷入局部最小值點,設置自適應函數(shù)值L1=L′+10,遺傳算法具體的迭代過程如圖9所示。

圖9 遺傳算法迭代過程Fig.9 Genetic algorithm iterative process
從圖9遺傳算法迭代過程可看出,在迭代8代以后的適應度函數(shù)值等于平均適應度函數(shù)值,評價函數(shù)值已無明顯變化,即至少迭代8代即可求出最優(yōu)解,即最優(yōu)反饋控制率。

圖12 鉸接車路徑跟蹤仿真結果Fig.12 Articulated vehicle path tracking based circular path
利用ADAMS與Simulink的聯(lián)合仿真來初步驗證提出的控制策略的有效性。在Solidworks中建立包括鉸接車、左右轉向液壓缸、前后車體、左右轉向推桿等的鉸接車三維模型,為了彌補實體模型導入后丟失的原有屬性,在導入ADAMS模型后,定義各個零部件的質量,并為其添加約束。在ADAMS模型中,考慮鉸接式車輛運行的巷道環(huán)境,采用二維隨機不平路面,并參考E級路面修改路面譜系數(shù),建立約束和驅動,基于ADAMS的鉸接式車輛模型如圖10所示。

圖10 基于ADAMS的35 t鉸接式車輛模型Fig.10 35 t articulated vehicle model based on ADAMS
搭建ADAMS和Simulink的聯(lián)合仿真模型,本研究中的聯(lián)合仿真路線如圖11所示。

圖11 聯(lián)合仿真流程Fig.11 Block diagram of unity simulation scheme
根據圖6所示的鉸接式車輛路徑跟蹤控制策略進行聯(lián)合仿真。在聯(lián)合仿真中,對于鉸接角的控制,根據地下巷道鉸接車的安全行駛要求,車輛一側與巷道壁間距最小為10 cm,且由于鉸接車的結構限制,其前車體轉角范圍為[-45°,45°],結合車身尺寸信息和規(guī)劃理想路徑信息,計算得maxεd=10 cm,maxεθ=12 rad,maxεc=0.038 4 m-1。
車輛跟蹤的理想路徑為圓心在全局坐標系原點,半徑為25 m的圓形路徑,車輛起點坐標為(35,10) m,車速選擇3 m/s,仿真時長設為100 s,仿真結果如圖12~16所示。圖12a為鉸接車跟蹤理想路徑效果圖,在仿真時間100 s中,行駛路徑與理想路徑基本吻合且路徑平滑,圖12b為路徑跟蹤局部放大圖,可看出,當預見路徑的偏差為負,行駛路徑偏差為正時,行駛的路徑偏差有明顯的減小趨勢。反映了加入預見信息可補償固有反應,加快反應速度。圖13中車輛速度能在較短時間內達到并維持在3 m/s,表明速度控制有效;圖14~16為路徑跟蹤偏差情況。
圖14所示為鉸接車路徑跟蹤控制中加入預見信息和未加入預見信息的跟蹤位置偏差效果圖,通過對比可看出基于預見信息的路徑跟蹤可以有效減小位置偏差的超調,提高反應速度,橫向位置偏差最大偏差量不到0.2 m,最終偏差控制在0.03 m,相對于輪距2.3 m,誤差僅為1.3%,對于最終穩(wěn)態(tài)誤差雖然仍處于工作允許范圍內,但仍有提高空間。

圖13 車速控制結果Fig.13 Speed control results

圖14 鉸接車路徑跟蹤位置偏差Fig.14 Position error of articulated vehicle

圖15 行駛方向偏差Fig.15 Deviation of driving direction
圖15所示為鉸接車路徑跟蹤控制中加入預見信息和未加入預見信息的跟蹤行駛方向偏差效果圖,行駛方向偏差最終穩(wěn)定在1.5×10-4rad,相比于鉸接車轉向角極值45°,誤差為0.19%,通過對比可看出基于預見信息的路徑跟蹤對于行駛方向偏差的校正十分明顯,加快了調節(jié)速度也減小了穩(wěn)態(tài)誤差,提高了車輛行駛的穩(wěn)定性。

圖17 USTB CYV-Ⅱ試驗平臺尺寸明細(單位:mm)Fig.17 Test platform dimension details of USTB CYV-Ⅱ
圖16所示為鉸接車路徑跟蹤控制中加入預見信息和未加入預見信息的跟蹤曲率偏差效果圖,通過對比可看出基于預見信息的路徑跟蹤減小了曲率偏差的最大超調,且同樣快速將曲率偏差調節(jié)至0,波動范圍小于0.003 m-1。仿真結果證明了提出的控制策略的有效性,試驗中將進一步驗證。

圖16 曲率偏差Fig.16 Curvature deviation
為進一步驗證本文中鉸接車路徑跟蹤控制策略的有效性,采用USTB CYV-Ⅱ作為試驗平臺進行試驗分析,車體結構和尺寸明細如圖17所示。USTB CYV-Ⅱ試驗平臺的車體結構與尺寸效仿鉸接式車輛結構設計,運動學和動力學特性與鉸接式車輛相符,可作為鉸接式車輛路徑跟蹤控制策略的試驗平臺進行試驗分析,試驗場地選為樓道的部分區(qū)域,平面圖如圖18所示,跟蹤路徑選為有2個轉彎的路徑以充分驗證控制系統(tǒng)性能。
USTB CYV-Ⅱ的行駛過程如圖19所示,由于地面過于光滑且轉彎半徑較小,為保證車輛良好跟蹤理想路徑,車速選為1 m/s勻速行駛。

圖18 試驗區(qū)平面示意圖Fig.18 Test area plane

圖19 USTB CYV-Ⅱ的行駛過程Fig.19 Driving process of USTB CYV-Ⅱ

圖20 USTB CYV-Ⅱ跟蹤路徑Fig.20 Path tracking of USTB CYV-Ⅱ

圖21 跟蹤速度與鉸接角變化Fig.21 Change of tracking speed and articulation angle

圖22 跟蹤偏差Fig.22 Tracking error
跟蹤結果及跟蹤誤差如圖20所示,行駛路徑與理想路徑能夠較好的貼合,且行駛路徑較為平滑,車輛能夠很好地沿著理想路徑行駛,由局部放大圖可知,預見位姿往往會呈現(xiàn)與理想路徑間有更大的誤差,從而使車輛能夠得到一個更大的糾偏信號加快糾偏時間,使鉸接車沿著理想路徑行駛。圖21為行駛速度和鉸接角變化曲線,速度數(shù)據為控制器的輸出數(shù)據,停車時由于車輛慣性導致了車輛滑行;鉸接角變化平穩(wěn),兩個彎道路段鉸接角變化趨勢相同,車輛具有較好的轉彎特性。圖22a為加入預見信息的位置偏差、行駛方向偏差和曲率偏差的變化情況,3個偏差均在直線行駛和曲線行駛時出現(xiàn)抖振,是由于車輛響應速度較慢以及樓道地面較為光滑,車輛出現(xiàn)側滑導致,但仍符合鉸接車的實際運行要求,在其他路段偏差均較小,其中,位置偏差基本維持在零值上下,波動約±0.03 m,與仿真結果一致,行駛方向偏差基本收斂于零值上下,波動約為±0.004 rad,曲率偏差基本在零值上下,最大值不超過0.003 m-1。試驗中起始偏差量均較小是因為車輛在理想路徑起點開始行駛,而仿真中車輛起點不在理想路徑上。圖22b為未加入預見信息的跟蹤偏差結果,由圖22a和圖22b的對比可看出,加入預見信息減小了位置偏差和行駛方向偏差的超調,對于行駛方向偏差的改善效果十分明顯,對于曲率偏差的調節(jié)作用較小,與仿真結果吻合,加入預見信息對于路徑跟蹤控制有一定的調節(jié)作用。試驗結果表明了本研究中的鉸接式車輛的路徑跟蹤控制策略的有效性,可用于鉸接車的路徑跟蹤。
提出了一種基于預見信息的鉸接式車輛LQR-GA路徑跟蹤控制方法,通過引入預見信息提高控制系統(tǒng)的反應速度,加入柔化以防止控制量過大。同時,提出了一種基于跟蹤偏差的LQR-GA路徑跟蹤控制方法,GA算法對LQR中的狀態(tài)量權重矩陣進行優(yōu)化且達到了最優(yōu)的控制效果。所提出的控制策略在仿真和試驗中均取得了較好的控制效果,路徑的跟蹤位置偏差的誤差為1.3%,行駛方位偏差誤差為0.19%,曲率偏差基本維持在零值,極大地改善了鉸接車路徑跟蹤精度,試驗結果符合車輛巷道行駛要求,可用于鉸接式車輛路徑跟蹤控制。
1 趙翾, 楊玨, 張文明,等. 農用輪式鉸接車輛滑模軌跡跟蹤控制算法[J/OL]. 農業(yè)工程學報, 2015, 31(10):198-203.http:∥www.tcsae.org/nygcxb/ch/reader/view_abstract.aspx?file_no=20151026&flag=1. DOI:10.11975/j.issn.1002-6819.2015.10.026.
ZHAO Xuan, YANG Jue, ZHANG Wenming, et al. Sliding mode control algorithm for path tracking of articulated dump truck[J/OL]. Transactions of the CSAE, 2015, 31(10):198-203.(in Chinese)
2 HEMAMI A, POLOTSKI V. Path tracking control problem formulation of an LHD loader[J]. The International Journal of Robotics Research, 1998, 17(2): 193-199.
3 PETROV P, BIGRAS P. A practical approach to feedback path control for an articulated mining vehicle[C]∥2001 IEEE/RSJ International Conference on Intelligent Robots and Systems, 2001, 4: 2258-2263.
4 BIGRAS P, PETROV P, WONG T. A LMI approach to feedback path control for an articulated mining vehicle[C]∥7th International Conference on Modeling and Simulation of Electric Machines, Converters and Systems (Electrimacs), 2002:1-6.
5 RIDLEY P, CORKE P. Load haul dump vehicle kinematics and control[J]. Journal of Dynamic Systems, Measurement, and Control, 2003, 125(1): 54-59.
6 NAYL T, NIKOLAKOPOULOS G, GUSTFSSON T. Switching model predictive control for an articulated vehicle under varying slip angle[C]∥2012 20th Mediterranean Conference on Control & Automation (MED), 2012: 890-895.
7 邵俊愷, 趙翾, 楊玨,等. 無人駕駛鉸接式車輛強化學習路徑跟蹤控制算法[J/OL]. 農業(yè)機械學報, 2017,48(3):376-382.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20170348&journal_id=jcsam. DOI: 10.6041/j.issn.1000-1298.2017.03.048.
SHAO Junkai,ZHAO Xuan,YANG Jue,et al.Reinforcement learning algorithm for path following control of articulated vehicle[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2017,48(3):376-382.(in Chinese)
8 OGATA K, YANG Y. Modern control engineering[M]. 4th ed. Upper Saddle River, NJ:Prentice Hall, 2002: 826-910.
9 SHIROMA N, ISHIKAWA S. Nonlinear straight path tracking control for an articulated steering type vehicle[C]∥ICCAS-SICE, 2009: 2206-2211.
10 POLOTSKI V, HEMAMI A. Control of articulated vehicle for mining applications: modeling and laboratory experiments[C]∥Proceedings of the 1997 IEEE International Conference on Control Applications, 1997: 318-323.
11 DRAGT B J, CRAIG I K, CAMISANI-CALZOLARI F R. Navigation of autonomous underground mine vehicles[C]∥1st African. Control Conference, 2003: 3-5.
12 王亮, 盧永錦. 引用預見信息的人機耦合優(yōu)化方法[J]. 北京航空航天大學學報, 2008, 34(4):361-364.
WANG Liang, LU Yongjin. Optimal method of human-machine coupling with preview information[J].Journal of Beijing University of Aeronautics and Astronautics, 2008, 34(4):361-364.(in Chinese)
13 石峰, 戰(zhàn)凱, 顧洪樞,等. 地下鏟運機跟蹤軌跡推算模型研究[J]. 有色金屬:礦山部分, 2010, 62(6):66-69.
SHI Feng, ZHAN Kai, GU Hongshu, et al. A study on underground loader tracking track calculation model[J].Nonferrous Metals: Mining Section, 2010, 62(6):66-69.(in Chinese)
14 DA FONSECA NETO J V, ABREU I S, DA SILVA F N. Neural-Genetic synthesis for state-space controllers based on linear quadratic regulator design for eigenstructure assignment[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2010, 40(2): 266-285.
15 GARGOURI L, ZAAFOURI A, KOCHBATI A, et al. LQG/LTR control of a direct current motor[C]∥ IEEE International Conference on Systems, Man and Cybernetics, 2002.
16 KO H S, LEE K Y, KIM H C. An intelligent based LQR controller design to power system stabilization[J]. Electric Power Systems Research, 2004, 71(1): 1-9.
17 WANG L, NI H, ZHOU W, et al. MBPOA-based LQR controller and its application to the double-parallel inverted pendulum system[J]. Engineering Applications of Artificial Intelligence, 2014, 36: 262-268.
18 NIKNEZHADI A, ALLUéFANTOVA M, KUNUSCH C, et al. Design and implementation of LQR/LQG strategies for oxygen stoichiometry control in PEM fuel cells based systems[J]. Journal of Power Sources, 2011, 196(9): 4277-4282.
19 HASANZADEH A, EDRINGTON C S, LIU Y, et al. An LQR based optimal tuning method for IMP-based VSI controller for electric vehicle traction drives[C]∥ Vehicle Power and Propulsion Conference (VPPC), 2011 IEEE, 2011: 1-7.
20 USTA M A, AKYAZI ?, AKPINAR A S. Aircraft roll control system using LQR and fuzzy logic controller[C]∥ 2011 International Symposium on Innovations in Intelligent Systems and Applications (INISTA), IEEE, 2011: 223-227.
21 TSAI S J, HUO C L, YANG Y K, et al. Variable feedback gain control design based on particle swarm optimizer for automatic fighter tracking problems[J]. Applied Soft Computing, 2013, 13(1): 58-75.
22 OHRI J. GA tuned LQR and PID controller for aircraft pitch control[C]∥ 2014 IEEE 6th India International Conference on Power Electronics (IICPE), 2014: 1-6.
23 GHAZI R, KHAJEH A. GA-based optimal LQR controller to improve LVRT capability of DFIG wind turbines[J]. Iranian Journal of Electrical and Electronic Engineering, 2013, 9(3): 167-176.
24 WONGSATHAN C, SIRIMA C. Application of GA to design LQR controller for an inverted pendulum system[C]∥ IEEE International Conference on Robotics and Biomimetics, ROBIO 2008. IEEE, 2009: 951-954.