陸柯偉,徐曉美,秦勇杰,張 涌
(南京林業大學 汽車與交通工程學院, 南京 210037)
半掛汽車列車因具有裝載量大、運輸成本低等特點,已成為公路運輸的主要車型[1]。由于半掛汽車列車的牽引車與掛車通過牽引銷鉸接連接,因此整車縱向剛性較差。同時,由于掛車車輪不可轉向,導致車輛在低速轉彎時車輪軌跡與牽引車前軸車輪軌跡總存在偏差,增加了半掛汽車列車低速轉彎的事故率。對此,國內外學者展開了關于半掛汽車列車低速轉彎時掛車與牽引車前軸車輪軌跡偏差問題的研究。現有的解決方案主要包括主動改變掛車車輪轉動方向和角度的主動轉向系統[2-3]以及根據幾何關系或力平衡控制掛車車輪轉動的被動轉向系統[4-5]。
近年來,隨著控制技術的發展,掛車主動轉向的研究得到了越來越多的關注。基于不同控制算法的主動轉向控制系統陸續被提出,常用的控制算法包括PID控制、模糊控制、模型預測控制、線性二次調節理論(linear quadratic regulator,LQR)控制等。邵俊愷等[6]針對無人駕駛鉸接式車輛設計了一種基于強化學習的自適應PID路徑跟蹤控制器,通過強化學習算法對PID參數進行在線自適應整定。鄧召文等[7]設計了某重型半掛汽車列車牽引車的后輪主動轉向模糊控制器和掛車車輪主動轉向PID控制器,并仿真驗證了控制器的有效性。Abroshan等[8]設計了模糊控制器和PID控制器控制車輪轉向,以減小鉸接車輛低速行駛的軌跡偏差。Guan等[9]基于模型預測控制為鉸接車輛提出了一種綜合路徑和姿態控制的策略,以提高其橫向穩定性。
比較而言,由于線性二次型最優控制LQR自身的優勢,如能夠利用較小的控制能量使系統狀態變量維持在零值附近,可以對不穩定系統進行整定等[10],其在具有多自由度運動的汽車列車運動控制領域得到了更多的關注。Ni 等[11]設計了基于LQR的主動掛車轉向系統,以提高多掛鉸接重型車輛的低速機動性與高速穩定性。Kim等[12]基于LQR設計了半掛汽車列車的主動轉向控制器,以最小化牽引車與掛車之間的質心側偏角。Deng等[13]為提高鉸接式重型車輛的方向性能,研究了三點預瞄駕駛員模型和LQR主動掛車轉向控制策略。Deng等[14]基于LQR控制算法研究了牽引車和掛車后橋多軸轉向的主動控制問題。顯然,在LQR控制中狀態量權重矩陣Q和控制能量權重矩陣R的選取直接影響控制效果。傳統的依賴于專家經驗的人為整定方式通常比較耗時,無法得到最優結果。對于此,近年來,研究人員開始采用一些進化算法對權重矩陣進行優化取值。孟宇等[15]提出一種基于預見信息的LQR控制策略,并應用遺傳算法對狀態量權重矩陣進行優化求解,從而實現了對鉸接式車輛精確路徑的跟蹤控制。Qureshi等[16]設計了基于LQR的掛車主動轉向控制器,并使用廣義微分進化優化算法確定LQR控制器的加權矩陣。
鑒于上述研究現狀,擬設計一種基于粒子群優化(particle swarm optimization,PSO)算法的掛車主動轉向LQR控制器(簡稱為PSO-LQR控制器),基于PSO算法對狀態量權重矩陣進行優化求解,以提高半掛汽車列車掛車車輪的軌跡跟蹤精度。同時,探討不同權重矩陣獲取方式對掛車轉向控制效果的影響程度。
半掛汽車列車行駛時,牽引座承擔半掛車的前部載荷,并且鎖住牽引銷帶動半掛車移動。圖1為牽引車以δ1f的前輪轉角轉向時牽引車與掛車各輪的運動關系。圖1中,(X,Y)表示車輛位置的笛卡爾坐標系,X軸表示期望直線軌跡,Y軸表示距直線軌跡的偏差,稱為軸線偏移距;P1為牽引車與掛車間的鉸接點,其坐標為(x1,y1),P2為半掛車后軸的中點,其坐標為(x2,y2);x1和x2分別為鉸接點和半掛車后軸中點對應于直線軌跡X軸上的坐標點;y1、y2分別為鉸接點和半掛車后軸中點與X軸之間的偏差;O為牽引車轉向圓的圓心,Q為牽引車轉向軸中心點,OP1⊥P1Q;L1為牽引車前軸與鉸接處的距離,L2為鉸接處與掛車后軸間的距離;θ1為牽引車與半掛車間的鉸接角度,θ2為半掛車相對于X軸的夾角,稱之為半掛車位姿角;z1和z2分別為P1點和P2點的實際軌跡曲線。

圖1 半掛汽車列車的轉向運動關系
為簡化所要分析的半掛汽車列車模型,作如下假設:① 所述半掛汽車列車始終行駛在平坦路面上;② 牽引車以較低速度勻速行駛,驅動輪沒有打滑;③ 連接牽引車和半掛車的鞍式牽引座位于P1處。基于上述假設,以及阿克曼原理可以得到半掛汽車列車低速轉向運動的微分方程[17]:
d(θ1+θ2)/dz1=tanδ1f/L1
(1)
dθ2/dz1=tanθ1/L2
(2)
dy2/dz2=sinθ2
(3)
dx2/dz2=cosθ2
(4)
dz2/dz1=cosθ1
(5)
式(1)表示牽引車的運動規律;式(2)—式(4)表示半掛車的運動規律;式(5)表示牽引車與半掛車實際運動軌跡間的關系。
以x2表征上述牽引車與掛車的運動規律,坐標變換后的微分方程如式(6)所示。

(6)
式中,l1wy為牽引車前輪輪距。
上述坐標變換關系可以寫作:

(7)

為驗證所構建的車輛模型的可靠性,利用TruckSim軟件中的車輛模型對所建車輛模型進行運動關系驗證。在TruckSim軟件中選取3A Cab Over w/3A Euro Trailer 六軸半掛汽車列車作為標準參考模型,模型精度通過在穩態圓周路徑下2種模型輸出的掛車路徑的一致性來體現。
國標GB1589—2016[18]對半掛汽車列車必須通過的通道圓作了定義,該通道圓外圓直徑和內圓直徑分別為25 m和10.6 m。考慮到半掛汽車列車的車寬為2.438 m,因此選擇半徑為11.5 m的穩態圓形路徑作為模型驗證的仿真路徑。
在模型驗證試驗中,設置路面附著系數為0.85,半掛汽車列車以20 km/h的速度先沿直線路徑行駛一段距離,然后逐漸進入圓形路徑。2種車輛模型在圓形路徑下的軌跡跟蹤效果如圖2所示。圖2中,Tractor T和Trailer T分別表示TruckSim軟件輸出的牽引車和掛車運動軌跡,Tractor L和Trailer L分別表示由數學模型得到的牽引車和掛車運動軌跡。

圖2 2種模型輸出的運動軌跡比較
由圖2可以看出,當掛車達到穩定跟蹤狀態時,由數學模型輸出的掛車軌跡與TruckSim軟件中的掛車軌跡幾乎完全重合,可見所建半掛汽車列車低速轉向運動學模型具有較高的可靠度,可用于后續低速轉向軌跡跟蹤控制器的設計研究。
定義關于狀態向量和控制向量的二次型性能指標為

(8)
式中:Q為n×n維半正定(或正定)對稱矩陣,R為m×m維正定矩陣,tf為系統運行時間。
最優控制規律中的反饋矩陣K需要求解黎卡提(Riccati)矩陣微分方程。Riccati方程描述為
ATP+PA-PBR-1BTP+Q=0
(9)
式中:P為待求解的未知矩陣;A、B為系統狀態方程中的狀態傳遞矩陣和控制系數矩陣,Q、R為二次型性能指標中的損失函數權重矩陣。
求解 Riccati方程中的P矩陣,反饋矩陣K可表示為
K=-R-1BTP
(10)
在低速工況下,選擇牽引車與掛車軌跡的橫向偏差和航向角偏差作為評價半掛汽車列車低速軌跡跟蹤的性能指標,構建如式(11)所示的優化目標函數。

(11)
式中:ye和θe分別為牽引車與掛車間的橫向偏差和航向角偏差;δ2r為掛車后軸車輪的轉角控制輸入;W1、W2、W3分別為半掛車的橫向偏差、航向角偏差以及掛車后軸車輪轉角輸入的加權因子。
由式(8)可知,Q、R矩陣可表示為

(12)
式中:q1、q2分別為橫向偏差ye和航向角偏差θe的權重系數,r為掛車后軸車輪轉角的權重系數。
通過設定合適的Q、R矩陣,求解Racctita方程可以得到反饋矩陣K。LQR軌跡跟蹤控制器的最優控制律u*(t)可表示為
u*(t)=-Kx(t)=-k1*ye-k2*θe
(13)
LQR軌跡跟蹤控制器的跟蹤效果受權重矩陣參數影響,確定其值通常需要通過人工設定參數并進行大量的試驗分析。PSO算法可以通過設定合適的適應度函數,更好地搜索參數定義域范圍之內的最優解。通過PSO算法可以對LQR軌跡跟蹤控制器的權重矩陣參數進行批量化搜索[19]。
基于PSO設計的LQR控制器需要事先確定權重矩陣參數值的范圍,在參數范圍內搜索最佳個體。由于此系統是能控線性定常系統,當參考速度、預瞄距離不發生變化時,依據Matlab中的LQR求解器求解出的反饋矩陣K由Q、R矩陣參數決定。其中,Q矩陣中權重系數越大時,表示該狀態變量在性能函數中越重要,對應的反饋矩陣K參數絕對值越大;R矩陣中的r表示對掛車后輪轉角的約束系數,其值越大,控制約束越大,反饋矩陣K參數絕對值越小,δ2r的絕對值越小。因此,分析反饋矩陣K的參數隨權重矩陣變化趨勢,可以大致確定權重矩陣參數值的范圍。在Matlab程序中通過設置不同Q、R矩陣及其參數值的變化,得到對應的反饋矩陣K的參數值,其結果如圖3和圖4所示。

圖3 K矩陣隨R矩陣變化趨勢

圖4 K矩陣隨Q矩陣變化趨勢
由圖3可知,k1、k2初始值的絕對值和穩定值的絕對值都隨著Q矩陣參數增大而增大,當Q矩陣參數固定時,隨著R增大反饋矩陣參數k1、k2的絕對值迅速減小并趨于穩定值。
圖4顯示,當R矩陣參數不變時,隨著Q矩陣參數增大,反饋矩陣參數k1、k2絕對值逐漸增大,其中k1的變化速率大于k2。隨著R對系統的約束能力增強,k1、k2絕對值整體呈現減小趨勢,同時變化速率減小。
保持R不變,通過分析Q矩陣中q1、q2對反饋矩陣參數變化的影響可以發現,q1不變時,增大q2,k1的絕對值保持穩定基本不變,k2的絕對值變大;q2不變時,增大q1,k2的絕對值保持穩定基本不變,q1的絕對值變大。
根據式(13)可知,當反饋矩陣K參數絕對值較大時,將導致最優控制律u*(t)過大,半掛車出現陡轉,因此反饋矩陣K參數值不能過大。經過權重參數對反饋矩陣參數的影響分析可知:當R∈[0.1,1]時,約束適當,能夠較明顯地體現出權重矩陣Q參數q1、q2變化對反饋矩陣K參數k1、k2值的影響;當q1∈[0.1,5.6],q2∈[0.1,10]時,k1、k2的值較為合適,掛車跟蹤過程較為平穩。
在利用PSO對權重矩陣參數進行批量優化時,需要構建LQR軌跡跟蹤控制器的Simulink模型和衡量控制效果的適應度函數。定義二次型性能指標為:

(14)
式中:s1為橫向偏差,s2為航向角偏差,J為被控系統的綜合指標。
通過判斷二次性能指標值可以看出控制效果的好壞,J值越小表示控制效果越好,J值越大表示控制效果越差。ts表示達到穩定跟蹤狀態所需時間,即掛車與牽引車間的橫向誤差達到穩定所需的時間。半掛汽車列車的路徑跟蹤控制性能不僅由性能指標J體現,達到穩定跟蹤狀態所需時間ts的長短也是決定路徑跟蹤控制性能好壞的重要指標。所以綜合考慮J和ts的值設計適應度函數。由于J和ts單位不同,因此需要對適應度函數進行相關處理。定義適應度函數為

(15)

半掛車低速軌跡跟蹤LQR控制器中的權重矩陣R表示對掛車后輪轉角的約束,為了減小PSO的尋優難度,將R設置為固定值,只要確保所設定的值能表現出對控制動作的約束性能即可[19]。
為實現Matlab中所搭建的車輛模型的閉環仿真,引入單點預瞄駕駛員模型[20],使半掛汽車列車牽引車前軸中心點沿著給定的路徑行駛。利用PSO算法迭代尋優方法,得到權重矩陣Q參數定義域內的最優值q1與q2,進而求得反饋矩陣K的參數k1、k2。設置仿真步長Ts=0.1 s,預瞄距離為3 m,車輛行駛速度為20 km/h。PSO算法的初始化參數如表1所示。

表1 初始化參數
為驗證所設計的LQR軌跡跟蹤控制器的有效性,在Matlab中對掛車具有轉向控制功能的半掛汽車列車開展仿真試驗。同時,為了驗證基于PSO算法優化LQR控制器權重參數的有效性,選擇基于PSO算法優化權重矩陣和人為整定的權重矩陣作為LQR控制器的Q權重矩陣,利用適應度函數計算出人為整定權重矩陣Q的適應度值,并根據適應度值的大小初步評估不同控制器的控制效果。基于上述對權重矩陣的分析,設定約束矩陣R分別為0.1和1,權重矩陣Q參數范圍設置為q1∈[0.1,5.6]、q2∈[0.1,10],q1、q2為PSO算法中粒子群個體中的粒子。
將控制約束矩陣R設為0.1,人為整定的權重矩陣Q=[2.569 0; 0 7.426],通過適應度函數可以求得權重矩陣適應度S=1.387。
PSO算法首先進行粒子初始化,并計算初始化粒子的適應度值,隨后進行迭代尋優,尋找全局最優個體。優化結果顯示,在30次迭代結束后,全局最優個體適應度值為0.996,對應的權重矩陣為[5.615 0; 0 2.305]。將人為整定的權重矩陣和適應度值,以及基于PSO初始化和最終搜索的結果進行比較,如表2所示。為方便表述,表中將全局最優個體簡稱為全局最優,將粒子初始化結果中適應度值最小的粒子簡稱為初始最佳,將粒子初始化結果中適應度值最大的粒子簡稱為初始最差。

表2 R=0.1時不同權重矩陣確定方式的結果對比
分析表2中各個適應度值可以預知:當R=0.1時,基于不同方式得到的權重矩陣Q優化后的掛車路徑跟蹤效果由好到差依次應為:全局最優>初始最佳>人為整定>初始最差。
為進一步驗證基于PSO搜索最優權重矩陣的準確性,將表2中4組不同權重矩陣得到的反饋矩陣K作為LQR控制器的反饋矩陣,在單U形和匝道螺旋2種參考路徑下開展仿真試驗。
單U形參考路徑由三段組成,剛開始是一段20 m長的直線路徑,然后是半徑為15 m的半圓彎道,最后依然是一段20 m長的直線路徑。單U形路徑的仿真結果如圖5所示。圖5(a)為不同Q矩陣下車輛跟蹤單U形路徑時,掛車運動軌跡與單U形參考路徑的比較。圖5(b)和圖5(c)分別為不同Q矩陣下,掛車運動軌跡與參考路徑間的跟蹤誤差與航向角誤差。

圖5 R=0.1時單U形路徑仿真結果
由圖5可知,當R=0.1時,全局最優、初始最佳、人為整定和初始最差4種情況對應的掛車跟蹤給定單U形路徑的誤差分別為0.325、0.340、0.440和0.495 m。全局最優個體對應的權重矩陣Q優化后的掛車路徑跟蹤誤差相較于初始最差個體對應的優化權重矩陣Q的誤差0.495減小了34.3%,相較于人為整定跟蹤誤差減小了26.1%,同時在全局最優矩陣條件下,掛車能夠更快地進入穩定的跟蹤狀態。此外,相比于其他3種權重矩陣確定方式,全局最優個體對應的權重矩陣Q優化后的航向角能以最快的速度趨于穩定。
匝道螺旋路徑由一段半徑逐漸減小的曲線構成,最小處的半徑為11.5 m。其仿真結果如圖6所示。圖6(a)為不同Q矩陣下車輛跟蹤匝道螺旋路徑時,掛車運動軌跡與匝道螺旋參考路徑的比較。圖6(b)為不同Q矩陣下,掛車運動軌跡與參考路徑間的跟蹤誤差。

圖6 R=0.1時匝道螺旋路徑仿真結果
由圖6可知,當R=0.1時,全局最優、初始最佳、人為整定和初始最差4種情況對應的掛車跟蹤給定匝道螺旋路徑的跟蹤誤差分別為0.239、0.329、0.405和0.68 m。全局最優個體對應的權重矩陣Q優化后的掛車路徑跟蹤誤差相較于初始最差個體對應的優化權重矩陣Q的誤差0.68減小了64.8%,相較于人為整定跟蹤誤差減小了40.9%,同時在全局最優矩陣條件下,掛車能夠更快地進入穩定的跟蹤狀態。
將控制約束矩陣R的值設為1,人為整定的權重矩陣Q=[2.569 0; 0 7.426],通過適應度函數可以求得權重矩陣適應度s=1.390。優化結果表明,在30次迭代結束后,全局最優個體適應度值為1.008,對應的權重矩陣為[5.601 0; 0 0.700]。將人為整定的權重矩陣和適應度值,以及基于PSO初始化和最終搜索的結果進行比較,如表3所示。分析表3中各個適應度值可以預知:當R=1時,基于不同方式得到的權重矩陣Q優化后的掛車路徑跟蹤效果,由好到差依次應為:全局最優>初始最佳>人為整定>初始最差。

表3 R=1時不同權重矩陣確定方式的結果對比
將表3中4組不同權重矩陣得到的反饋矩陣K作為LQR控制器的反饋矩陣,在單U形和匝道螺旋2種參考路徑下開展仿真試驗。
單U形路徑下的仿真結果如圖7所示。圖7(a)為不同Q矩陣下掛車跟蹤單U形路徑時的運動軌跡與單U形參考路徑的比較。圖7(b)為不同Q矩陣下掛車運動軌跡與參考路徑間的跟蹤誤差。

圖7 R=1時單U形路徑仿真結果
由圖7可知,當R=1時,全局最優、初始最佳、人為整定和初始最差4種情況對應的掛車跟蹤給定單U形路徑的跟蹤誤差分別為0.319、0.339、0.396和0.473 m。全局最優個體對應的權重矩陣Q優化后的掛車路徑跟蹤誤差相較于初始最差個體對應的優化權重矩陣Q的誤差0.495減小了32.5%,相較于人為整定跟蹤誤差減小了19.4%,在全局最優矩陣條件下,掛車能夠更快進入穩定跟蹤狀態。
匝道螺旋路徑仿真結果如圖8所示。圖8(a)為車輛在不同權重矩陣Q下跟蹤給定匝道螺旋參考路徑時參考路徑與掛車運動軌跡的比較,圖8(b)為不同Q矩陣下參考路徑與掛車軌跡間的跟蹤誤差。

圖8 R=1時匝道螺旋路徑仿真結果
由圖8可知,當R=1時,全局最優、初始最佳、人為整定和初始最差4種情況對應的掛車跟蹤匝道螺旋路徑的誤差分別為0.224、0.315、0.396和0.497 m。全局最優個體對應的權重矩陣Q優化后的掛車路徑跟蹤誤差相較于初始最差個體對應的優化權重矩陣Q的誤差0.497減小54.9%,相較于人為整定跟蹤誤差減小43.4%,在全局最優矩陣條件下,掛車能夠更快達到穩定的跟蹤狀態。
結合上述2種路徑下的仿真試驗結果可知,控制權重矩陣R分別為0.1和1時,全局最優個體對應的權重矩陣優化后的掛車跟蹤誤差最小,因此基于PSO-LQR設計的控制器可使掛車具有最佳的路徑跟蹤效果。權重矩陣R的增大使得掛車在2種路徑下的跟蹤誤差都略有減小。相比于人為整定權重矩陣,基于PSO優化LQR權重矩陣可以顯著提升工作效率,縮短車輛進入穩態跟蹤的時間。
針對半掛汽車列車低速轉向掛車跟蹤牽引車軌跡性能較差的問題,設計了一種基于粒子群優化算法的掛車主動轉向LQR控制器,通過一系列仿真分析,得出以下主要研究結論:
1) 在權重矩陣R確定時,基于不同方式得到的權重矩陣Q優化后的掛車路徑跟蹤效果,由好到差依次為:全局最優>初始最佳>人為整定>初始最差,同時經PSO優化后的LQR控制器能使掛車更快地進入穩定跟蹤狀態,提高半掛汽車列車的低速轉向安全性。
2) 當R取作0.1和1時,相較于人為整定方式得到的權重矩陣Q優化后的掛車路徑跟蹤誤差,全局最優對應的掛車路徑跟蹤誤差在U形路徑下分別減小了26.1%和19.4%,在匝道螺旋路徑下分別減小了40.9%和43.4%。也即,基于PSO優化LQR權重矩陣可以獲得更為精確的掛車路徑跟蹤效果。此外,權重矩陣R增大,掛車在U形和匝道螺旋2種路徑下的跟蹤誤差都略有減小。