石蕊 張輝 王霽宇 端帥



摘要 隨著信息技術及汽車產業的快速融合,促進了自動駕駛技術迅猛發展。目前,許多主流車企陸續加快L3及以上自動駕駛功能產品的研發及試驗進程。而多數L3及以上級別智能汽車的設計運行范圍中會聲明其具備自主超車及變道功能,因此對L3以上級別的換道行為進行研究、提升自動駕駛功能下換道安全性就顯得十分重要。研究通過解析影響高速公路環境下自動駕駛車輛主動換道決策的多重信息,之后具體解析直接對換道行為產生影響的車輛間的博弈交互機理,建立了基于博弈論的自動駕駛車高速公路換道行為的決策機制,將為自動駕駛車換道行為仿真以及后續的自動駕駛換道行為評價提供支撐。
關鍵詞 換道決策;博弈論;高速公路;自動駕駛;主動換道
中圖分類號 U463.6文獻標識碼 A文章編號 2096-8949(2022)04-0004-04
0 引言
近年來,我國鼓勵推動汽車網聯化、智能化與電動化協同發展,智能汽車呈現強勁發展勢頭。隨著關鍵技術的不斷突破,車載激光雷達等真值設備達到國際先進水平,L2級別乘用車新車市場滲透率達到20%。截止2021年9月,我國已有3 500多千米的道路實現智能化升級,搭載聯網終端車輛超過500萬輛[1]。
然而自動駕駛車的普及率及技術成熟度逐步提升的同時也給交通管理帶來了新的挑戰,尤其是在未來混行環境下給交通安全帶來的挑戰。跟馳及換道作為車輛在路上行駛的兩種基本形態,L3及以上級別的智能汽車能夠自動化地完成這兩個形態。相比于跟馳狀態,換道行為涉及與本車道及目標車道車輛的復雜交互。智能汽車相較于完全手動駕駛汽車具有感知時間更短、感知范圍更廣的優勢,可以進行交互的信息也有不同,因此不能用傳統的換道理論來解釋自動駕駛車的換道行為。
換道行為的自動化作為自動駕駛車輛行駛過程的關鍵環節,對于指導自動駕駛車輛的安全高效行駛有著重要意義。當前對于自動駕駛車輛在高速公路上的換道研究尚處于起步階段,相關的現有研究和基礎理論尚不夠完善,且研究中所述換道情境及驗證中應用的場景與實際的高速公路通行環境存在一定程度的差別。
當前研究通常將換道全過程拆解為產生換道意圖、換道決策和換道執行三個階段。最原始的換道決策模型是由Gipps提出的Gipps 換道模型[2]。Motohiro[3]等以換道車輛與周圍車輛的速度差、間隙等為參數,建立神經網絡模型,利用大規模的軌跡數據進行標定,用于預測車輛的換道決策。Wang[4]等以駕駛安全性、舒適性和效率為多重目標,考慮了不同駕駛決策對周圍車輛加速度的影響,從而對駕駛決策機制進行優化。近幾年來,國內外學者開始嘗試基于博弈論思想解析車輛的換道行為。Kita[5]提出將博弈論中信息交互博弈的思想策略帶入換道決策中。Talebpour[6]提出混流環境下的換道行為是非合作博弈行為,并基于此建立換道模型。Be11[7]應用博弈論理論對考慮高速公路交通流來研究車輛換道對交通流運行的影響程度。
根據上述研究,可以看出博弈論為含有多重信息且具備競爭傾向的問題提供了解決方法和分析手段,適用于該研究期望的高速公路自動駕駛車主動換道的場景。因此,研究對高速通行環境下影響自動駕駛車換道的多重交互信息進行分析,界定博弈類型建立換道決策機制并通過實際通行數據完成驗證。
1 基于博弈論的自動駕駛車輛換道策略機制建立
傳統交通流理論中根據車輛換道的動機將車輛的換道行為劃分為自由換道和強制換道。該文主要研究自動駕駛車的主觀自動換道行為,場景如圖1所示,Lane1上行駛的AV車產生換道至目標車道Lane2的意圖,假定AV車為可以自動完成主動換道全過程的L3級別自動駕駛車輛,Lane1的前車RV1及Lane 2的后車RV2均為完全人工駕駛的非網聯車輛。車輛AV做出從Lane1換道Lane2的決策過程可以視為其與其他車輛交互博弈的過程。AV為了尋求更大的行駛空間產生了換道意圖,而周圍受到影響的其他車輛需考慮自身所處的環境決定是否進行讓行,周圍車輛采取的策略的不同都會影響AV最終的決策結果。該文主要研究有換道意圖的自動駕駛車AV與目標車道后車RV2間的博弈,下面將確定兩者間的博弈類型及作用機理。
1.1 博弈類型界定及博弈機理解析
每一個博弈的主要構成要素包括參與者、每個參與者所采取的策略以及參與者采取相應的策略所帶來的收益函數。根據博弈雙方的期望收益,通??梢詫⒉┺膭澐譃楹献鞑┺呐c非合作博弈。非合作博弈下根據參與者行動順序的可見性和參與者信息的完整性又可分為完全信息動態博弈、完全信息靜態博弈、不完全信息動態博弈和不完全信息靜態博弈四種類型。
上述兩車在博弈過程中知曉對方的坐標、所處車道等信息,為完全信息博弈,區別在于AV作為配備真值測試設備的自動駕駛車在感應時間、感應范圍上具備一定優勢;研究假定兩車同時采取是否換道/是否讓行的決策,因此為靜態博弈;在博弈中,兩車的預期目標均為自身的收益達到最佳,因此為非合作博弈。故AV與RV2間的博弈類別界定為完全信息下的非合作靜態博弈。這個博弈對應的基本要素為[8]:
(1)參與者:為AV和RV2;
(2)決策:可供AV選擇的決策有換道/原車道繼續行駛,可供RV2選擇的決策有減速讓行/加速阻止;
(3)收益函數:兩車不論采取何種決策都會產生一定的收益,將建立兩車的收益函數對收益程度進行量化表達。
1.2 換道決策機制建立
依據上述博弈要素分析,可以得到兩車博弈的收益矩陣,如表1所示。其中m1、m2為AV采取的換道、不換道策略,u1為AV的收益函數;n1、n2為RV2采取的讓行、不讓行策略,u2為RV2的收益函數。
假定此非合作博弈存在策略(mi,ni),滿足納什均衡,即使式(1)成立:
而策略(mi,ni)也將作為該研究對博弈換道的預測策略。
1.2.1 收益函數確定
在進行換道過程的收益評估時,學者們通常從安全(距離)收益[9]或速度收益(時間)的維度[10]來建立效益函數。研究將結合兩個維度建立收益函數,AV及RV2采取何種策略所得到的收益計算方式如下:
式中:-AV未決策前的最優行駛速度;
-AV采取決策后的穩定跟車速度;
-AV采取決策后穩定跟車的距離;
-RV2未決策前的最優行駛速度;
-RV2采取決策后的穩定跟車速度;
-RV2采取決策后穩定跟車的距離。
1.2.2 換道決策機制
根據式(2)提出的博弈收益函數,從AV視角進行博弈決策機制,換道決策流程為:換道意圖產生—信息收集整合—博弈分析—收益計算—執行決策(換道、不換道)。
2 實際數據驗證
為驗證機制的有效性,選擇使用自動駕駛車進行高速公路測試時的數據進行決策預測。試驗車是蔚來ES6,在高速公路上可以完成自動變道。
該車配備了由GPS定位、慣性測量單元、激光雷達等組成的測試系統,能夠準確識別車輛周圍的車道信息、車輛等目標物,計算之間的距離、速度和位置,并在數采內,實現數據分析與評價。此次道路測試選定的測試路線為天津市某段繞城高速公路,總長248.8 km。于每天不同時間段對此路線進行測試采集。
提取測試過程中發生的自由變道成功及失敗場景,并對數據進行清洗,獲得72個主動換道成功場景、31個失敗場景,本驗證將對這些場景進行換道拆解,根據換道決策前的跟車間隙、周邊車速、車流密度等信息進行綜合收益評估,對其是否換道展開預測。后續將預測后結果與實際場景比對計算準確率。
2.1 自動換道成功場景驗證
提取測試過程中的換道場景,在換道意圖產生后根據試驗車采集的自車與周邊數據進行換道決策預測,如圖2所示,試驗車根據環境,產生換道意圖,此時對試驗車及目標車道后車進行收益計算,表2為試驗車與目標后車的博弈收益矩陣。
納什均衡后,不論RV2是否讓行,AV的最佳策略都是換道,但該次的最佳策略是RV2讓行,AV換道,這也與實際情況相符。依次測算所有換道成功場景,準確率達90.2%。
2.2 自動換道失敗場景驗證
提取的自動換道失敗場景是指試驗車在自動駕駛功能開啟的工況下進行換道,但由于自車或周圍的因素請求人工接管,由安全員決定是否繼續換道,如圖3樣例所示,計算試驗車及目標車道后車的收益函數值,如表3所示。
納什均衡后,該次博弈的最佳策略是RV2不讓行,AV換道。實際情況是AV在選擇換道后,RV2采取加速策略,AV自動駕駛功能退出,人工接管換道,與預測決策相符。依次測算所有提取的有效場景,預測準確率為82.7%。
2.3 驗證結果分析
研究采用實際自動駕駛數據分析了自動換道執行成功和失敗兩種工況下的共103個場景進行換道決策預測。結果顯示該研究的換道決策機制具備一定程度的可靠性,尤其在成功工況下準確率較高。
相較于成功工況,自動換道失敗工況預測準確率較低,經場景回放分析,自動換道失敗原因大部分是由于試驗車沒有充分考慮目標車道后車加速的可能性,在后車突然加速后退出了自動駕駛功能,存在決策失誤的可能,也體現了博弈思想在車輛策略決策方面具有一定的積極意義。
3 結語
該文應用博弈論理論從安全及效率維度建立了換道決策機制,通過實際數據進行高速自動駕駛換道決策預測,準確率證明了機制的有效性,也體現了博弈思想對于自動駕駛汽車決策的積極意義。
參考文獻
[1]北京日報. 全國新能源車保有量超600萬輛!網聯汽車測試里程突破500萬公里[EB/OL] . (2021-9-25). https://baijiahao.baidu.com/s?id=1711869964531068507&wfr=spider&for=pc.
[2]Gipps P G. A Model for the Structure of Lane-Changing Decision[J]. Transportation Research Part B Methodological, ?1986(5): 403-414.?
[3]Motohiro, Fujita, Koji, et al. Predicting driver's lane-changing decisions using a neural network model. Simulation Modelling Practice & Theory International Journal of the Federation of European Simulation Societies, 2014.
[4]Wang D, Hu M, Wang Y. Model predictive control-based cooperative lane change strategy for improving traffic flow[J]. Advances in Mechanical Engineering, 2016(2): 1-17.
[5]Kita H. A merging–giveway interaction model of cars in a merging section: ?a game theoretic analysis[J]. Transportation Research, Part A (Policy and Practice), 1999(3-4): 305-312.
[6]Talebpour A, Mahmassani H S, Hamdar S H. Modeling lane-changing behavior in a connected environment: A game theory approach[J]. transportation research procedia, 2015(59): 216-232.
[7]Bell M. A game theory approach to measuring the performance reliability of transport networks[J]. Transportation Research Part B, 2000(6): ?533-545.
[8]Mckelvey R, Mclennan A, Turocy T, et al. Gambit: ?Software Tools for Game Theory[J]. Modern Healthcare, 2005(5).
[9] 薛春銘. 基于博弈的車輛協作換道策略研究[D]. 大連:大連理工大學, 2017.
[10]楊曉芳, 張盛, 付強. ?基于博弈論的完全信息下的駕駛行為研究[J]. 公路交通科技, 2015(7): 105-111.