劉 志
(蘇交科集團股份有限公司 南京 210017)
近年來無人駕駛系統在乘用車上已得到初步應用,但在客運公交車上的應用較少。現有研究多針對單車智能相關控制技術展開,未能綜合應用車路協同環境,缺乏對車路協同條件下綜合交通信息的利用,對多路口、多交通約束條件的考慮不足;此外,所設計的控制方法難以直接移植到公交車上。因此,完成智慧公交自動駕駛及車路協同的目標還需要更加深化的研究。本文從風險感知、駕駛決策、速度優化、公交編隊的角度出發,對智慧公交車輛進行深入研究,以期實現安全、節能、高效的智慧公交自動駕駛與編隊控制系統,開展車路協同自動駕駛智慧公交技術實踐探索,可促進自動駕駛技術在城市公交運營場景下的快速落地,為城市交通出行提供便捷、安全、高效的出行服務。
在公共路權的復雜交通環境下,為實現公交系統風險識別,建立智慧公交潛在風險的辨識提取模型,設計智慧公交風險辨識及預警子系統。該子系統可實現:①利用深度學習算法實現多源信息(包括車載傳感器信息如,攝像頭、GPS、雷達等,V2X數據信息如,天氣信息、道路狀況、人流量等)的深度融合;②建立行人-車輛多智能體的狀態空間動力學模型,采用長短期記憶遞歸神經網絡與高階容積卡爾曼濾波結合實現對行人-車輛運動狀態的精準估計,基于貝葉斯網絡實現智慧公交潛在風險分類機制。系統的行人-車輛群集運動狀態感知與風險辨識的技術路線見圖1。

圖1 行人-車輛群集運動狀態感知與風險辨識技術路線
為全方位準確感知智慧公交周圍環境,考慮車載傳感器提取周圍信息的不完備性,結合V2X獲取的行人、車輛等道路全局信息,采用分層深度融合算法,將傳統的依賴高成本多傳感器的感知方法轉變為依賴高關聯多源信息。采用超像素分割和立體光流法實時構建行人-車輛的三維形態與動態特征,提出一種基于Mask R-CNN與多源信息特征融合的深度學習模型,構建多層卷積層對車載傳感器信息進行特征提取,并構建1×1的卷積網絡用于對車載傳感器和V2X信息的特征融合,實現復雜城市環境下的多源信息融合。
為精確估計行人-車輛多智能體的狀態信息,考慮行人-車輛系統的非線性、不確定性和時滯性等特性,分析系統在時間維度上的時空關聯性,利用LSTM的數據記憶特征,本文提出長短期記憶遞歸神經網絡與高階容積卡爾曼濾波結合的運動狀態估計方法,將多源融合信息輸入到深度長短期記憶神經網絡,建立行人-車輛非線性系統狀態空間動力學模型。使用高階容積卡爾曼濾波對神經網絡的輸出和系統的狀態變量進行實時更新,實現對行人-車輛多智能體非線性系統模型的真實逼近,以及對運動狀態值的精確估計。
針對智慧公交在公共路權環境下的安全運行問題,借助融合的多源信息[1],考慮環境感知與狀態估計之間的互聯關系,建立智慧公交運行潛在風險的辨識提取模型,提出基于貝葉斯網絡的智慧公交運行潛在風險分類推理機制,結合時空配準法,設計智慧公交的風險辨識及預警系統,實時預測智慧公交多維風險態勢。
智慧公交安全駕駛決策系統,借助單車智能感知與車路協同技術獲取動態交通環境中的行人、車輛異構多智能體信息,揭示智慧公交與動態或靜態障礙物沖突消解機制,采用強化學習方法設計多智能體協同避撞駕駛決策算法,以及人工勢場法設計面向動態交通環境場景的局部路徑快速規劃方法,基于強魯棒模型預測控制設計城區不確定環境下智慧公交路徑跟蹤控制器。智慧公交自適應路徑規劃及駕駛決策系統研發技術路線見圖2。

圖2 智慧公交自適應路徑規劃及駕駛決策系統技術路線
根據統計分析交通數據顯示,大部分的交通事故均是由于車輛避障不及時,車輛碰撞導致的,城市交通環境中的障礙物主要有行人、車輛等,由于分析行人、駕駛員行為需要考慮心理學、交通環境、自我控制能力等[2]。因此,基于強化學習的多智能體協同避撞駕駛決策見圖3。

圖3 基于強化學習的多智能體協同避撞駕駛決策
根據多智能體一致性控制理論將行人-車輛看作是具有高度智慧與行為能力的智能體,研究異構多智能體避撞行為心理與行為機理,基于計劃行為理論并采用統計方法量化環境因素對車輛避障行為的影響,構建基于強化學習的智慧公交駕駛決策模型,使用局部馬爾可夫決策及分布式馬爾可夫決策聯合優化決策的方法使得強化學習回報函數最大化,分析得出智慧公交避障駕駛決策的最優結構路徑圖。
智慧公交在做避障決策時,還要實時做出合理高效節能的局部路徑規劃。考慮到局部路徑規劃的實時性及車載處理器的計算能力,本項目基于車載傳感器獲取的局部環境信息及V2X通信得到全局環境信息,再對多源信息進行深度融合,提出一種基于人工勢場的局部路徑規劃方法,對智慧公交周圍環境構建包含引力場(車輛向目標點運動)和斥力場(車輛能夠避開各種障礙物)的勢場模型,并對2種勢場疊加,規劃出合理高效的局部路徑,智慧公交由當前點逐漸向目標點駛去。
智慧公交在得到規劃路徑后,周圍環境具有動態變化特性,針對交通要素、局部期望路徑、周邊實時駕駛態勢及公交駕駛模式切換的不確定性,本項目基于群集動力學理論設計車輛動力學、車聯網信息交互的強魯棒MPC容錯循跡控制策略,使得智慧公交擺脫參數變化和環境干擾因子的影響,獲得更快的控制響應速度、更高的系統魯棒性和更好的路徑跟蹤性能。
首先,需完成智慧公交縱向動力學建模,主要包括驅動電機、動力電池、液壓制動系統等。電機是動力系統核心,驅動時將電能轉化為車輛動能,制動時將汽車動能轉化成電能,基于電機試驗數據,采用查表法建立包含功率-轉矩-效率的驅動電機模型。動力電池模型采用等效電路Rint模型,忽略溫度等對內阻的影響,電池荷電狀態采用安時累積法計算。另外延長電池使用壽命是智慧公交控制的目標之一,采用基于實驗數據的半經驗模型來估計電池壽命的衰減情況,利用電池容量損失Qloss表示電池壽命衰減情況。液壓制動過程中受油液壓力、摩擦系數、溫度等影響,所以建立一階慣性環節模型,表示液壓制動系統延遲特性。
城市道路環境中智慧公交準時高效通行速度優化問題需要處理的約束條件較多,如道路附著、交通限速、車輛性能等,上述約束還存在時變特性。另外需要達成的優化目標也較多,如能量最優、高效通行、安全行駛等。所以,最優運動速度優化屬于復雜的協同優化問題。基于車載傳感器采集的車輛運動狀態、V2X獲取的交通和道路環境信息作為控制參考或約束,并考慮到動態規劃算法在處理多約束條件和多目標優化問題方面的優勢,以驅動消耗和制動回收能量之和Qe為能量優化評價指標,以電池容量損失Qloss為電池壽命評價指標,設計多約束條件下的,兼顧能耗、電池壽命特性、車輛行駛平順性與通行效率的純電動汽車運行狀態下安全節能最優運動速度多目標優化方法,采用動態規劃算法(DP)計算最優的車速軌跡。定義車速、距離和時間為系統狀態x={v,d,t},系統控制量定義為驅動/制動力u=F將狀態量偏差(實際軌跡和參考軌跡之差)Δx、驅動/制動力變化量Δu、通行時間t設置為軟約束,路面附著系數、車輛穩定性、驅動/制動平順性等決定的最大驅動/制動力及變化率定義為硬約束,道路限速、電池工作狀態、電機工作狀態等設置為硬約束。定義的優化目標函數為
約束條件為:vmin(k)≤v(k)≤vmax(k)、Fmin(k)≤abs[F(k)]≤Fφ(k)、Fmin(k)≤abs[F(k)]≤Fs(k)、Fmin(k)≤Fd(k)≤Fmax(k)、SOCmin(k)≤SOC(k)≤SOCmax(k)。其中:R、E為能量和電池損耗權重因子;vmin和vmax分別為交通限制的最低和最高車速;Fmin為由行駛阻力限制的最小制動力/驅動力;Fφ為由道路附著限制產生的最大制動力/驅動力;Fd為電動汽車驅動力;Fmax為由電機決定的最大驅動/制動力;SOCmin和SOCmax分別電池工作時最小和最大荷電狀態約束。
智慧公交在多交叉口處的通行節能與高效通行問題可轉化為單車與多信號燈協同優化問題。設計基于V2X獲取信息、智慧公交模型,多采用Agent智慧公交和信號燈協同控制架構,基于動態博弈算法的車輛-多交通信號燈協同控制方法[3],多Agent的智慧公交和信號燈協同控制,架構見圖4。該系統框架分為外部信息層、決策規劃層、底層協調控制層和執行層4個層級。依據網聯車輛與信號燈控制特點,底層控制層設計為網聯車輛Agent、信號燈Agent等子系統Agent,利用V2X實現各Agent主體的信息交互共享。網聯車輛在道路交叉口行駛時,多Agent框架能夠根據車輛信息、道路環境和交通信號等外部信息,通過上層決策規劃機制(智慧公交和信號燈協同控制優化),提高車輛能量效率和交通效率。動態博弈算法在處理多約束條件、多目標優化協調等方面的優勢顯著,用來協調決策滿足控制需求的多路口通行方法。

圖4 多Agent的智慧公交和信號燈協同控制架構
車路協同環境下,異質交通要素之間可以通過車-車、車-路及車-云通訊組成多車編隊系統,實現多車間感知、決策和控制的群智協同。首先在成員車端搭建車載無線通訊系統,將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊;其次擬采用仿真模擬、隊列微縮平臺開發及實車實驗的方式,建立智慧公交虛擬編隊的通用型數學模型,采用李雅普諾夫-克拉索夫斯基穩定理論和魯棒控制研究異質隊列中穩定性、魯棒性和可擴展性,基于自適應動態規劃和分布式模型預測控制,優化面向敏捷節能高效的交叉口異質隊列速度譜,實現非線性異質公交隊列的分布式協同優化[4],智慧公交虛擬編隊及群智控制系統研發技術路線見圖5。

圖5 智慧公交虛擬編隊及群智控制系統研發技術路線
為了將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊,在每一成員車端搭建車載5G無線通訊系統,主要由上位系統、下位系統、傳感系統及無線通訊設備組成[5]。無線通訊設備主要負責在保證通訊實時性和魯棒性的同時,將上位系統提供的感知信息發送給隊列中的其他成員車,并接收其他成員車傳遞的狀態信息。下位系統包括下位控制器和執行器,依據傳來的控制期望實時改變行車狀態。傳感系統主要包括GPS/慣導設備和自主式傳感器,實時感知自車狀態和周圍環境信息。
為了實現隊列信息拓撲結構、隊列幾何結構對智慧公交隊列的影響,首先建立了表征公交隊列信息交互和動力學特性的分層式協同控制模型,解析車節點動力學、隊列信息拓撲結構、隊列幾何結構耦合機理。車輛隊列是由車輛節點通過信息拓撲結構相互連接起來形成的復雜非線性系統,而隊列的期望幾何結構作為隊列穩定性控制的強約束條件,在系統中起到至關重要的作用。為此可以將車輛隊列的信息拓撲結構抽象為分層式協同控制模型的結構,采用虛擬編隊及群智控制系統表示跟隨車輛之間的信息傳遞、鄰接矩陣表示可獲取車輛的狀態信息、牽引矩陣表述車輛隊列中跟隨車輛是否能夠獲取領航車輛信息的矩陣,進而采用拉普拉斯有向路徑序列集表征多車編隊行駛軌跡。
為了保證公交隊列在多時滯及多干擾下的隊列穩定和內穩定,基于車輛非線性動力學模型,將車輛的控制分為上、下兩層,下層采用反饋線性化技術將車輛模型簡化為線性積分器模型,上層控制器基于此線性化車輛模型,采用李雅普諾夫-克拉索夫斯基穩定理論和魯棒控制方法,分析多車隊列系統在多時滯及多干擾下保持內穩定的條件判據,設計一種弱保守性多車隊列分布式魯棒控制器;在內穩定的基礎上,借助多輸入系統H∞范數(魯棒性控制方法)的幾何含義,提出在多參數攝動及通信時滯情況下的隊列穩定性條件,進而得到控制器魯棒增益的穩定性區域。
針對車路協同環境下智慧公交多交叉口群體通行效率低下的問題,借助多交叉口信號配時信息,探究智慧公交隊列通行速度軌跡與能量消耗的高維耦合互聯關系,建立公交隊列群體通行與能量模型。基于自適應動態規劃和分布式模型預測控制,優化面向敏捷節能高效的交叉口隊列同步起步與高效通行統一速度譜,通過公交隊列縱、橫耦合動力學模型,將統一速度譜轉化為多車隊列最優位置軌線和最優車速譜,實現全局意義上的隊列閉環穩定性、交通流通行效率和能量消耗率的自平衡最優。
車路協同自動駕駛智慧公交系統通過上述4個子系統,在公共路權環境下全方位實施車-車、車-路和人-車動態實時信息交互;在全時空動態交通信息采集與融合的基礎上,實現智慧公交自動駕駛風險感知與編隊控制系統,開展智慧公交安全與高效運行控制,充分實現人車路的有效協同,實現自動駕駛公交安全、高效和環保運營。本文研究提出的系統方案可提升城市公交系統乘坐體驗及行駛安全性,有助于優化公交車在復雜環境中的適應性,提高公交車輛的準時到達率,并最終實現公共交通安全、效率的大幅提高推動我國汽車智能化與網聯化進程。