黃 樞,謝 輝,宋 康,陳 韜,強 威
(天津大學 機械工程學院,天津 300072)
道路壓實工作是筑路、筑壩工程建設中的關鍵環節,主要依靠人工操作振動碾壓機完成。該過程存在作業時間長、振動強度大的問題,嚴重危害操作人員的身心健康且無法長時間保證作業精度。無人駕駛碾壓機具備高精度作業能力,能有效降低操作人員的勞動強度、大幅度提高施工質量和效率、降低運行成本[1-2],應用前景十分廣闊。
對于無人駕駛系統而言,由傳感器、控制器、執行器構成的硬件系統是其精準、安全運行的基礎[3]。而各類硬件受到自身特性、運行環境、運行時長等因素的影響,在車輛運行過程中可能發生故障,影響整個系統的穩定性與安全性。國內外學者針對硬件故障問題提出了容錯控制理論。
在容錯控制領域,早期的解決方案主要基于硬件冗余技術,并行安裝多個具有相同功能的組件以完成相同的任務,實現系統在部分組件故障后的正常運行。但該方案極大地增加了系統結構的復雜度和成本,因此基于解析冗余的容錯控制方案被提出和廣泛使用。解析冗余的容錯控制主要分為主動與被動容錯技術,其核心思想是在系統存在一定的硬件冗余基礎上輔以軟件冗余技術,在不過分增加系統復雜度的情況下實現容錯控制[4]。Gadda等[5-6]基于傳統的卡爾曼濾波對汽車線控轉向系統進行了容錯控制研究。Chamseddine等[7]基于滑模控制技術對汽車液壓主動懸架傳感器故障展開了容錯控制研究。Fekih等[8]提出一種基于觀測器的故障檢測方案和線性二次調整器優化設計相結合的容錯控制方法,實現地面車輛的轉向容錯控制。田承偉[9]基于自適應漸消卡爾曼濾波構建了四倍冗余體系來實現汽車線控轉向系統傳感器的容錯控制。何磊等[10]基于多維高斯隱式馬爾可夫模型展開了線控轉向汽車轉向盤轉角傳感器的容錯控制策略研究。在車輛的容錯控制方面,國內外研究的焦點多為乘用車或商用車,而對碾壓機這類具有特殊車體結構與復雜運動規律的工程車輛卻鮮有研究。
筆者搭建的無人駕駛碾壓機平臺主要依靠全球定位系統(GPS,global positioning system)進行車體定位,但GPS存在信號易丟失、不穩定等缺點[11],極有可能導致車輛失控進而發生難以挽回的安全事故,如圖1所示。針對該問題,若僅采取常規的緊急停車手段勢必會降低工程施工效率,增加車輛磨損與油耗,而相應的容錯機制設計有望改善這一問題。

圖1 無人駕駛碾壓機事故現場Fig. 1 The accident caused by unmanned roller
筆者主要從信號代償角度對無人駕駛碾壓機的容錯控制展開研究,其中代償即代替、補償的簡稱。基于無人駕駛碾壓機運行特性構造了帶流量損耗參數的線性轉向模型,并結合帶遺忘因子的最小二乘自學習方法揭示了碾壓機方向盤與鉸接角的實時對應關系。當單組GPS設備發生故障時利用自學習模型與冗余硬件信息協同重構無人駕駛碾壓機位置與航向,實現車輛在傳感器短時失效場景下的容錯控制。
無人駕駛碾壓機平臺主要由單鋼輪振動碾壓機改裝而成,其核心硬件布置方案如下:前、后車體分別橫向布置2個定位天線構成4天線GPS測量系統,用于準確測量前、后車體的位置與航向信息;前、后車體分別安裝一個航姿參考系統(AHRS,attitude and heading reference system)以測量車體姿態信息;平臺主要依靠自主研發設計的域控制器進行信號處理與控制輸出,借助自主改造的轉向與速度控制機構實現車輛行駛控制。筆者所設計的轉向控制機構主要包含轉向電機、角度傳感器、電機控制器與連接支撐部件,通過硬連接方式植入原車轉向柱中。在無人駕駛碾壓機自動化作業過程中,轉向電機帶動原車轉向柱轉動進而控制全液壓轉向器的流量輸出,角度傳感器會實時記錄電機轉角作為方向盤轉動反饋。由于該轉向控制機構安裝在駕駛室內,能有效減少因振動、揚塵等情況引起的傳感器失效故障,與直接改造液壓轉向系統的方案相比,改裝、維護更簡單,可靠性更強。整車硬件布置示意圖如圖2所示。

圖2 無人駕駛碾壓機硬件布置Fig. 2 Hardware layout of unmanned roller
作為鉸接式車輛,碾壓機具有特殊的車體結構與運動規律,而信號重構策略與路徑跟蹤控制器的設計依賴于其幾何結構關系與運動學特性,因此構建碾壓機的運動學模型[12],如圖3所示。

圖3 碾壓機運動學模型Fig. 3 Kinematic model of unmanned roller
定義大地東向為x方向,大地北向為y方向;前車身中心位置為O1(xF,yF),距離鉸接點A的距離為lF,前車身運行速度為vF,航向角θF;后車身中心位置為O2(xR,yR),距離鉸接點A的距離為lR,后車身運行速度為vR,航向角θR;前后車身的航向偏差為φ,將其定義為鉸接角。下面給出碾壓機在運動過程中的相關運動學方程。
前車位置、航向、速度之間的關系表達為
(1)
前、后車身中心位置坐標以及兩者航向之間的關系表達為
(2)
由式(1)和式(2)可以得出前車的航向變化率,表達為
(3)
無人駕駛碾壓機轉向系統采用全液壓轉向結構[13-14],通過方向盤帶動全液壓轉向器轉動,進而使油泵供出的液壓油進入到轉向油缸中推動活塞伸縮,最終實現前、后車體的相對偏轉。碾壓機液壓轉向系統零件眾多、結構復雜,難以建立精確的數學模型。構建的碾壓機液壓轉向系統模型主要考慮液壓油在轉向器、油管、轉向油缸、活塞等核心元件中的傳輸過程。轉向器的線性化流量方程表達為
(4)
式中:Kq為轉向器流量放大系數;KJ為轉向器流量壓力系數;xi為閥芯和閥套相對轉角在閥套內圓上所對應的弧長;pJ為液壓缸高壓腔與低壓腔壓力差。
方向盤與轉向器運動的對應關系表達為
(5)
式中:dq為轉向器閥套的內圓直徑;θsteer為方向盤反饋角度。
液壓轉向過程中,存在相對運動的零部件主要為液壓油缸與活塞。長期的相對運動過程會導致兩者之間的密封性由于摩擦而發生改變,進而產生內泄漏。泄漏原理如圖4所示。

圖4 液壓缸內泄漏示意圖Fig. 4 Schematic diagram of leakage in hydraulic cylinder
泄漏量表示為
(6)
式中:d為活塞外徑,h為縫隙高度,η為液壓油動力粘度,l為縫隙高度,ε為相對偏心率。根據液壓缸流量連續方程可得活塞位移量,為
(7)
式中:xp為液壓缸活塞的移動量,Vt為液壓缸有效容積,β為油液的體積彈性模量。將鉸接角φ與液壓缸活塞移動量xp的關系以線性方式表達為
φ=Kφxp,
(8)
式中:Kφ為鉸接角與油缸活塞移動量的比例系數。
對式(4)~式(8)進行整理可得鉸接角與方向盤轉角的動態關系為
(9)
無人駕駛碾壓機的作業是一個長時間、高強度、多變化的過程,需要長時間以強振動模式工作在非結構化道路上,在這個過程中無人駕駛系統以及車輛自身的特性都有可能發生顯著的變化。通過對無人駕駛碾壓機的運行數據分析可以發現其轉向系統的變化,如圖5所示。

圖5 方向盤反饋角度曲線Fig. 5 Feedback angle of steering wheel
圖5是轉向控制機構角度傳感器在車輛自動化運行過程中測量的方向盤反饋角。無人駕駛碾壓機的作業主要是一種直線往復運行的過程,其方向盤反饋角理論上應該在定值附近上下波動,但從圖5可以看出,隨著時間的推移,轉向系統中位呈現出不斷漂移的現象,在300 s的時間內漂移量達到了約300°。由此可以看出,中位漂移是無人駕駛碾壓機轉向系統的重要特性,是傳感器失效后的信號代償所要考慮的關鍵要素。從式(9)可以發現,漂移產生的內在原因主要是液壓系統的油液在輸送過程中存在流量損失。因此,作為代償容錯控制的核心信息來源,液壓轉向系統模型應具備反映與預測油液流量損耗的能力。但轉向系統模型存在參數眾多且難以直接獲取的問題,因此按照下述流程對模型進行了簡化。
由于信號的微分會引入大量噪聲,對式(9)進行積分,并對部分復雜參數進行簡化處理得到鉸接角與方向盤轉角的最終關系式為
(10)

所設計的無人駕駛碾壓機容錯控制框架如圖6所示。信號代償模塊主要包含液壓系統自學習與信號決策模塊,其中液壓系統自學習模塊主要用于學習轉向系統特性,信號決策模塊主要進行信號篩選與輸出;車輛控制主要由串聯抗擾控制器完成。

圖6 無人駕駛碾壓機代償容錯控制架構Fig. 6 Frame work of fault-tolerant control of unmanned roller
無人駕駛碾壓機的信號代償主要依據式(2),即當單組GPS設備失效后利用另外一組GPS設備提供的航向與定位信息,結合轉向模型估計的鉸接角重構出控制器所需要的車體位置與航向信息。
遞推最小二乘(RLS,recursive least squares)是系統參數學習常用的方法[15],其主要利用實時運行系統所提供的數據來對參數進行估計,估計的核心思想是使誤差的平方和最小來獲得數據的最佳匹配參數。但針對于慢時變參數系統,RLS存在“數據飽和”現象,即隨著數據量的增長,新采集數據對于估計參數的更新作用將越來越弱,導致系統無法準確跟蹤參數的變化。筆者采用帶遺忘因子的遞推最小二乘算法(FFRLS,forgetting factor recursive least squares)來克服這種現象,設計的轉向模型參數迭代公式如式(11)所示。待辨識參數包含方向盤與鉸接角的比例系數K,參數b,流量損耗參數c,辨識輸入包含方向盤轉角θsteer,辨識輸出為鉸接角φ:
(11)
式中:k為迭代次數;P為協方差矩陣;Z為誤差修正增益;λ為遺忘因子(0<λ<1)。


圖7 橫向和航向偏差示意圖Fig. 7 Horizontal and heading error
無人駕駛碾壓機的控制需要考慮系統的動態過程,因此針對液壓轉向系統引入時間常數將轉向模型轉化為一階慣性環節為
(12)

將式(12)代入到式(3)中,得到航向角對時間的導數

(13)

(14)


前車體距離目標軌跡的距離誤差為
(15)

(16)

(17)

(18)
針對式(17),利用內環控制器的控制率求解方法,可以得到外環控制器的控制率為
(19)

(20)
筆者利用33 t無人駕駛碾壓機實車運行數據,在Matlab/Simulink仿真軟件中對線性液壓轉向模型參數進行離線辨識,效果如圖8所示。

圖8 模型參數離線辨識效果Fig. 8 Off-line identification of model parameters
如圖8所示,參數K、b、c的辨識值在約30 s趨于相對穩定的狀態,在后續辨識中僅存在小幅度波動。將辨識出的參數與系統輸入相結合對鉸接角進行估計并與實際測量鉸接角進行對比,效果如圖9所示。

圖9 鉸接角擬合效果Fig. 9 Result of joint angle fitting
從圖9中可以看出,在參數辨識作用下模型可以有效估計出實際鉸接角,其殘差分布如圖10所示。根據分布統計可以看出擬合殘差均值為-0.014°,以正態分布擬合殘差曲線則有95.5%的殘差分布在[-1.487,1.203]范圍內,其中大部分殘差分布在±1°以內。從離線辨識結果看,帶流量損耗參數的線性液壓轉向模型能夠有效表達無人駕駛碾壓機的轉向系統特性。

圖10 模型離線辨識下鉸接角估計殘差分布Fig. 10 Residual distribution of joint angle estimation
在系統運行過程中若停止模型的參數學習過程勢必會產生估計偏差,為探究該偏差分別對車輛前進、后退過程的定位代償產生的影響,現利用圖11所示的幾何原理圖展開分析。
圖11描述的是鉸接角偏差對車輛橫向定位的影響,其對應關系為

圖11 鉸接角偏差對橫向定位的影響Fig. 11 Effect of joint angle bias on horizontal location
Δx=Lfsin(Δφ),
(21)
式中:Δx為產生的橫向定位偏差;Δφ為鉸接角偏差;Lf為定位點與鉸接點之間的距離。根據式(21)可以看出,橫向定位偏差的大小不僅僅取決于鉸接角偏差,還受到定位點與鉸接角之間距離的影響。通常情況下,碾壓機后車體長于前車體,因此在鉸接角存在相同偏差的情況下后退過程的代償受到該偏差的影響更大。所以文中主要針對無人駕駛碾壓機后退過程展開實車代償效果驗證。
4.2.1 無代償情況下的失效控制分析
為了充分驗證文中所設計代償方法的有效性,無人駕駛碾壓機在GPS設備典型故障下的路徑跟蹤控制效果如圖12所示。

圖12 GPS信號不更新情況下的路徑跟蹤控制效果Fig. 12 Path tracking control effect without GPS’s updating
圖12為GPS設備信號不更新情況下的路徑跟蹤控制效果圖。從圖12中可以看出,在GPS設備出現故障后,若以0.1 m作為高精度運行失效閾值車輛僅能正常運行約2.2 s,即系統在無代償情況下無法應對GPS設備的失效。
4.2.2 模型無學習情況下的代償效果驗證
為了驗證模型自學習的必要性,現做如下實驗:使無人駕駛碾壓機分別進行正常作業與代償作業,記錄二者的路徑跟蹤效果。代償過程采用的模型參數均使用經驗估值,轉向系統比例系數K設定為0.025,參數b設定為0,系統流量損耗參數c設定為-0.025,并且在開始運行約30 s后進行代償。效果如圖13所示:黑線代表正常路徑跟蹤控制效果;藍線代表模型無學習情況下,GPS故障前的路徑跟蹤控制效果;紅線代表模型無學習情況下,GPS故障后的路徑跟蹤控制效果。

圖13 正常路徑跟蹤控制與模型無自學習代償情況下的距離誤差對比Fig. 13 Comparison of horizontal error between normal and fault-tolerant control without self-learning
從圖13可以看出,若以0.1 m作為高精度運行失效閾值系統能夠穩定運行約15.4 s,具備一定的定位失效容錯能力。
4.2.3 不同倉面下的代償效果驗證
文中基于4個平整度相近但位于不同位置的倉面進行代償實驗,構成4組實驗案例來驗證代償效果。實驗過程如下:在后退開始運行約20~30 s時停止對模型參數的學習,之后的模型參數均保持學習最后時刻的值,如表1所示。

表1 模型參數辨識值
4組案例的參數辨識過程如圖14~圖16所示,分別給出了方向盤與鉸接角的比例系數K,參數b,流量損耗參數c的辨識情況。

圖14 轉向系統比例系數K辨識Fig. 14 Identification of steering system’s proportionality coefficient

圖15 參數b辨識Fig. 15 Identification of steering system’s initial-value

圖16 轉向系統流量損耗參數c辨識Fig. 16 Identification of steering system’s flow loss
車輛控制效果對比如圖17和圖18所示,圖17為4組案例故障后的代償距離誤差時域圖,圖18表達的是以10 s作為統計間隔對比4組案例的代償距離誤差絕對值均值變化情況。

圖17 各倉面代償運行距離誤差Fig. 17 Distance error of fault-tolerance control on different roads

圖18 各倉面代償運行距離誤差絕對值均值Fig. 18 Mean absolute value of distance error of fault-tolerance control on different roads
從圖17可以看出,若以0.1 m作為高精度運行失效閾值,4組案例的高精度運行時間基本分布在40~50 s區間。從圖18可以更直觀地看出,4組案例的距離誤差均值在40 s的時間內均可以維持在0.1 m以內,因此將完整代償場景下的有效運行時長定義為40 s。
將無代償、代償無學習、完整代償3種場景下,車輛故障后高精度運行時長進行匯總,如圖19所示:紅色扇形為無代償場景的運行時長,黃色扇形為代償無學習場景的運行時長,藍色扇形為完整代償場景的運行時長。

圖19 3種場景故障后高精度運行時長對比Fig. 19 Comparison of high-precision running time after failure in three scenarios
圖19以40 s作為標準,呈現了3種運行時長的相對大小關系。從圖19中的扇形大小可以直觀地看出:代償無學習、完整代償相對于無代償場景,運行時長均有大幅度提升。從量化的角度分析:以40 s作為標準的情況下,無代償情況的運行時長2.2 s僅能達到0.055%,代償無學習情況的運行時長15.4 s僅能達到38.5%。完整代償情況的40 s運行時長相較于前二者分別提高了18.7倍和2.7倍,極大地提高了系統運行的安全性、穩定性,提升了系統運行效率。
筆者針對無人駕駛碾壓機在惡劣工況下的定位失準問題,提出了將自學習模型與冗余硬件信息相結合的信號代償容錯控制方法。基于大壩填筑現場的車輛運行數據對模型進行了仿真分析,并利用現場車輛進行了代償策略的實車試驗。研究方法與驗證效果如下:
1)基于無人駕駛碾壓機在實際運行過程中呈現的轉向系統中位漂移現象,構建了帶流量損耗參數的線性液壓轉向模型以充分體現轉向系統特性,結合鉸接式車輛的運動規律與幾何特性設計了基于模型信息與冗余硬件的信號代償策略。
2)基于帶遺忘因子的最小二乘方法,在Matlab/Simulink仿真軟件中利用實車運行數據對模型進行了辨識,結果表明:95.5%的鉸接角估計殘差能夠分布在±1.5°以內。
3)利用4組案例對比驗證了33 t無人駕駛碾壓機的實車代償效果,并且對比了無代償、代償無學習、完整代償3種場景的故障運行情況。結果表明:完整代償情況下,車輛能夠在傳感器失效后約40 s的時間內繼續進行高精度作業,相較于無代償情況延長了近18.7倍的運行時間,相較于代償無學習情況延長了近2.7倍的運行時間,有效避免系統在單組GPS設備短時失效后的控制失控,提高了無人駕駛碾壓機系統運行的穩定性和系統作業的安全性與效率。