999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶畫像與Stackelberg 博弈的交通環島通行策略

2023-09-18 04:35:56曹棟發胡創業
計算機工程 2023年9期

曹棟發,李 勇,胡創業,丁 男,2

(1.新疆師范大學 計算機科學技術學院,烏魯木齊 830054;2.大連理工大學 工業裝備智能控制與優化教育部重點實驗室,遼寧 大連 116024)

0 概述

交通環島是城市交通中必不可少的交通場景之一,其目的是替代交通信號燈,讓不同行駛方向的車輛安全通行[1],以提升交通通行效率。然而,隨著路網中車輛數量不斷增加,環島通行效率降低[2],擁堵現象頻發。受環島道路場景限制[3],交通環島入口與出口處的通行壓力日益增大,車輛駛入環島與駛出環島的沖突加大,甚至出現交通事故。因此,交通環島的通行已逐漸成為城市交通亟待解決的問題。智能網聯汽車[4]利用網絡以及人工智能,實現車-路-環境協同,輔助駕駛進而提升車輛行駛安全性與舒適性,已成為新一代智能交通系統中有效解決交通擁堵方案之一。基于交通環島通行規則以及場景特點,結合智能網聯汽車人-車-路-環境協同[5],車輛在駛入環島和駛出環島時換道策略以及通行策略的研究能有效提升交通環島通行效率與安全,逐漸成為一種有效的解決途徑。

研究人員結合交通環島通行場景,利用智能網聯汽車協同提升車輛通行效率,設計相鄰車輛間通行策略。目前,相關研究主要集中在車輛跟馳決策控制、車輛換道研究以及車隊編隊控制。例如,通過基于聯盟博弈論的協同編隊[6]、主動車輛和被動車輛之間的馬爾可夫博弈[7]、基于合作博弈的全局最優合并模型等方法優化協同策略性能[8]。同時,對于環島中的車輛博弈,研究人員采用Stackelberg 博弈(STG)和大聯盟博弈相結合的方法[9],構建車輛之間相互作用與駕駛員類型的博弈模型[10],還有基于重復博弈論和子博弈中求解納什均衡解的方法生成有效且高效的路線規劃[11]。然而,協同策略設計主要基于車輛行駛的速度、距離等基礎數據[12]并假定車輛可以實時通信。因此,在實際應用中通信受限情況下,結合交通環島特點,利用智能網聯汽車系統中其他輔助信息[13-14]設計的協同策略還需進一步研究。

隨著智能網聯汽車中感知技術以及網絡技術的不斷發展,其系統中數據混雜多樣已成為趨勢。雖然相關行業標準與白皮書已對系統中車、路、環境等相關數據進行描述和定義,但是數據類型的多態混雜是不可避免的,例如,離散數據與連續數據混雜、周期性數據與非周期性數據采集混合等。用戶畫像作為一種能夠統籌異構數據、表征動作傾向和意圖的行為模型,逐漸應用于智能網聯汽車的相關研究。研究人員利用用戶畫像對智能網聯汽車系統中異構多維數據進行組織與表征[15-16],進一步提升交通環島中車輛換道以及通行策略的性能。同時,結合預測技術,彌補系統中小樣本數據或者無法直接采集的信息缺失,進一步完善用戶畫像對協同策略的知識表征和數據支撐。

在智能網聯汽車系統中實時通信受限的條件下,本文提出交通環島中車輛換道以及車輛駛入和駛出時車輛協同通行策略。在環島中心設置路側單元(Road Side Unit,RSU),車輛可以獲取到自身以及周圍車輛、環境等歷史信息。基于時空特征的車輛預測方法AP-LSTM,通過關聯規則對智能網聯汽車中的多維異構數據進行分析,以提高預測精度。同時,結合車輛畫像,在車輛軌跡預測的基礎上設計強制換道策略。

1 基于車輛畫像的場景數據處理

在智能網聯汽車的發展階段,車輛上擁有眾多車載智能設備來獲取車輛數據,包括傳感器、處理器、通信設備等。因此,本文以車輛作為邊緣節點,通過車輛進行數據感知,并通過地理位置更靠近邊緣節點的RSU 協作處理車聯網感知數據,以提高多車協同的車聯網整體計算效率,提升多車協同感知的信息融合性能。環島場景示意圖如圖1 所示。本文在環島路口處設立4 個RSU,通過RSU 對路口處車輛感知數據進行統籌處理后,由RSU 將數據分發至各邊緣節點進行存儲和計算。

圖1 環島場景示意圖Fig.1 Schematic diagram of roundabout scene

車聯網數據不僅包含其本身的實時位置、速度等連續數據,還存在控制車輛的制動程度、轉向程度等駕駛動作的離散數據。同時,車聯網數據在從傳統車聯網狹義概念到智能網聯汽車廣義概念的發展過程中,不再局限于少量的終端數據。在自動駕駛白皮書中所提到智能網聯汽車的車輛數據不僅包括汽車基礎數據,也包括基礎設施、外界環境、交通數據(道路車道規模、周圍車輛的具體位置、行駛和運動方向、天氣狀況、車流密集程度),以及車主的身份數據(駕齡、年齡)、狀態數據(手勢、眼球位置變化等)、行為數據(異常變道頻率、駕駛風格等)。

由于智能網聯汽車融合了來自汽車、道路、天氣、用戶等多方面的海量數據,因此導致智能網聯汽車數據呈現多維度、規模大的特點。同時數據的多維度決定了不同來源的數據格式不同,使得數據存在非結構性和非標準性問題。因此,本文引入車輛畫像對多維度的智能網聯汽車異構數據進行表征。

本文收集不同區域環境下駕駛員信息、車輛信息、車輛運行狀態、駕駛行為、外界環境5 個維度的經驗數據。圖2 所示為在這5 維數據中包含駕齡、車輛類型、車間距、速度、加速度變化、異常變道次數、交通流狀況等特征的車輛畫像。按照相關交規以及其他劃分標準,將這5 維數據中包含的特征劃分成不同的特征類型。其中,駕駛員信息和車輛信息為固有信息,車輛運行狀態可通過車載傳感器獲取,外界環境數據經由RSU 采集后分發給各節點,而駕駛行為可以通過視覺協同分析等方法得到,以構建出的車輛畫像能夠準確捕捉駕駛過程中的動態特征,從而解決智能網聯汽車傳輸數據混雜、數據維度多的問題,提升數據分析效用。

圖2 車輛畫像示意圖Fig.2 Schematic diagram of the vehicle portrait

2 軌跡預測

本文基于構建的車輛畫像捕捉車輛在不同區域環境下的潛在特征,優化在駕駛過程中受場景的時變和多樣性因素導致小樣本數據預測難度增大,以提高車輛軌跡預測的準確性和實時性。

為實現基于小樣本特性的車輛軌跡預測,本文在車輛畫像的基礎上,開發了AP-LSTM 算法,挖掘不同時空狀態下最具代表性的車輛畫像標簽,降低數據維度,用于車輛軌跡預測,以此作為后續車輛協同博弈的基礎。同時,由于長短時記憶(Long Short-Term Memory,LSTM)網絡在車輛軌跡預測方面很難兼顧數據量、算法實時性和預測準確性,無法實現長時且實時預測,因此在預測結果基礎上,通過卡爾曼濾波算法對超過3 s 的長時預測結果進行降噪優化。

2.1 基于Apriori 的關聯規則分析

Apriori 算法[17]是研究關聯規則的經典方法,用于掃描數據集中滿足最小支持度minsup 的頻繁項集和提取頻繁項集中滿足最小置信度minconf 的關聯規則,可以獨立挖掘數據集中的關聯規則,適用于小數據集的關聯規則分析。本文通過Apriori 算法實現如下應用。

假定車輛駕駛特征集為A,如式(1)所示:

其中:行式為特征在不同時間下的特征類型;列式為在同一時間下的不同特征。環島場景為B,B=(b1,b2,b3)為環島出入口等的不同場景。

關聯規則的支持度Support 為項集中所有項同時發生的概率,A和B的支持度如式(2)所示:

式(2)表明在環島場景中各項車輛駕駛特征同時出現的概率。置信度Confidence 表明各項駕駛特征在不同場景下產生的條件概率,A和B的置信度如式(3)所示:

提升度Lift 用于表明不同駕駛特征與不同場景之間的傾向性,A和B的提升度如式(4)所示:

若LAB>1,表 明A和B正相關,A、B關聯規 則有效。

定義1(強關聯時空特征)強關聯規則X?Y表示要挖掘的關聯規則,同時滿足以下2 個條件:

2.2 AP-LSTM 預測

長短時記憶是遞歸神經網絡(Recursive Neural Network,RNN)的一個變種,構建了專門的記憶存儲單元,通過時間反向傳播算法訓練數據,以解決RNN 網絡存在的梯度消失及無長期依賴的問題[18]。LSTM 網絡包括遺忘門、輸入門和輸出門3個控制門,3類門共同控制信息的輸入和輸出,具體結構如圖3 所示。LSTM 的門結構使得時間序列上的信息形成一個平衡的長短期依賴關系,適用于交通流時間序列的信息提取。

圖3 長短時記憶網絡結構Fig.3 Structure of long short-term memory network

對于車輛軌跡預測,智能網聯汽車的多維異構數據維度的增加意味著預測實時性降低,數據維度的減少在一定程度上表示預測準確性降低。為此,本文結合車輛畫像,通過AP-LSTM 算法來捕捉車輛行駛特征,實現預測實時性和預測準確性的平衡。

因此,本文選取由Apriori 算法組合的具有強關聯性的多類型駕駛數據作為輸入序列[x1,x2,…,xt],W、b分別為每個計算值的權重矩陣和偏置項,C^t為當前輸入作用下的單元狀態,ht-1為上一時刻的隱藏層輸入,⊙表示兩向量按元素的乘積,tanh 為非線性激活函數。LSTM 的單元經過這樣處理后就得到了更新后當前時刻的單元狀態Ct和隱藏層值ht,最后根據實際需求設置隱藏層與輸出層的連接即可。

為了降低長時預測的誤差,本文通過卡爾曼濾波算法對超出3 s 的LSTM 長時預測結果進行優化。

卡爾曼濾波器分為預測階段和更新階段。在預測階段,卡爾曼濾波器使用上一狀態的估計對當前狀態進行估計。在更新階段,濾波器通過預測出的狀態值對系統進行更新。卡爾曼濾波器預測階段和更新階段的狀態方程如式(7)和式(8)所示:

基于以上內容和定義,AP-LSTM 算法主要由3 個部分組成,即強關聯性特征的生成、LSTM 軌跡預測、長時輸出的卡爾曼濾波優化,具體結構如圖4所示。有關詳細信息見算法1。

圖4 AP-LSTM 框架Fig.4 AP-LSTM framework

算法1AP-LSTM 算法

步驟1獲取當前車輛歷史行駛數據,構建車輛畫像。

步驟2基于車輛畫像計算候選集支持度,并根據指定的最小支持度構建頻繁項集。

步驟3提取頻繁項集中滿足最小置信度的關聯規則。

步驟4根據獲取的關聯規則,基于相關特征進行數據輸入,實現LSTM 軌跡預測。

電網電壓驟降恢復對雙饋風電機組連鎖脫網的影響//周步祥,董申,林楠,劉舒暢,張冰,趙磊//(17):34

步驟5基于LSTM 的軌跡預測序列,通過卡爾曼濾波算法對其中超出3 s 的長時部分生成最終輸出序列。

步驟6重復步驟1,直至所有車輛運行完畢。

3 換道博弈策略

為解決在通信受限情況下的換道感知和決策問題,同時為了降低數據誤差對換道決策性能的影響,本文結合車輛歷史數據,通過AP-LSTM 算法對車輛狀態進行估計和預測,基于預測軌跡對處于環島出口處的車輛進行換道博弈。首先定義了領導者和跟隨者收益函數,然后基于收益函數給出Stackelberg 博弈策略,最后對Stackelberg 均衡點進行驗證。

3.1 換道場景

一般情況下,車輛的換道行為只涉及換道車輛與其周邊車輛。因此,本文將換道問題簡化為圖5所示的場景。SV 和SRV 分別作為目標車輛和鄰居車輛,LV 和PV 作為SV 和SRV 的前車。因此,車輛換道問題可以抽象為在保證安全性和平穩性的前提下,結合AP-LSTM 算法預測的SV 和SRV 車輛軌跡,確定SV 的后續駕駛行為,使得SV 在到達出口前換道至外側車道。

圖5 換道場景示意圖Fig.5 Schematic diagram of the lane-changing scene

3.2 Stackelberg 博弈

Stackelberg 博弈是經濟學中的一種戰略博弈,領導者先行動,追隨者后行動,追隨者按領導者的策略行動。因此,領導者需要考慮追隨者在選擇策略時的最優響應[19]。由于車輛換道過程是以換道車輛SV 首先開啟轉向動作為開端,鄰居車輛SRV 才根據周圍狀況確定下一步動作,兩者之間存在一定的順序,因此本文將車輛換道問題建模為SV 與SRV 之間的Stackelberg 博弈。

文獻[20]通過對博弈雙方車輛距離變化來衡量駕駛員的駕駛風格,大于安全距離表明駕駛風格保守,而距離越小,表明駕駛風格越激進。結合此方法,本文設定如下駕駛行為識別參數來表述駕駛風格。

定義2駕駛行為識別參數如式(10)所示:

領導者收益函數如式(11)所示:

收益函數主要由3 部分組成:第1 部分PvUv(sv)和Uv(srv)描述了車輛SV 和SRV 的安全性收益,考慮到兩輛車相對速度差越大,其駕駛距離差會隨之增大,則安全收益越高;第2 部分Uacc(sv)和Uacc(srv)描述了SV和SRV 的舒適性收益,在駕駛過程中加速度變化越小,駕駛越平穩,舒適性收益越高;第3 部分Upos(sv)和Usp(k)描述了車輛的激進性收益,對于車輛SV,隨著距離出口越近,越急于換道,其駕駛的激進性越高,對于SRV,基于前后車距的駕駛行為識別系數表明了其激進性收益。

換道車輛SV 基于Stackelberg 博弈求解采取換道動作的時刻N′以及換道時刻車輛需要采取的速度,鄰居車輛SRV 求解針對SV 換道行為所需的速度。其中,vsv(k)、vsrv(k)為車輛SV 和SRV在未來N步預測軌跡中獲取到k時刻的速度,asv(k)、asrv(k)為車輛SV 和SRV 在未來N步預測軌跡中獲取到的k時刻加速度。具體的求解過程如算法2所示。

算法2STG 算法

3.3 PMC 算法

3.3.1 算法設計

算法3 給出PMC 算法運行的整體框架,通過車聯網獲取行駛至環島出口前的車輛數據,由此構建車輛畫像來提取關聯規則,實現基于關聯規則的軌跡預測,最終通過軌跡預測結果進行Stackelberg 博弈,求解車輛在環島出口處所需采取的動作。

算法3PMC 算法

步驟1獲取當前車輛歷史行駛數據,構建車輛畫像。

步驟2基于車輛畫像構建頻繁項集并提取滿足minconf 的關聯規則。

步驟3根據獲取的關聯規則,基于相關特征進行數據輸入,實現LSTM 軌跡預測。

步驟4

步驟5重復步驟1,直至所有車輛運行完畢。

3.3.2 Stackelberg 均衡點分析

Stackelberg 均衡點分析見引理1。

引理1若是Stackelberg 博弈的Stackelberg 均衡點,則需滿足以下條件[21]:

令式(23)等于0,可解得:

4 實驗分析

4.1 實驗場景描述

本文實驗通過SUMO 平臺進行性能驗證。環島整體場景的參數設定如表1 所示,其中,車輛的路徑規劃部分由SUMO 內置功能處理,PMC 僅在車輛到達換道位置(距出口150 m)時才接管。

表1 相關實驗參數 Table 1 Relevant experimental parameters

為充分分析本文所提算法和策略的性能,本文從以下3 個方面進行性能分析:1)針對車輛畫像中軌跡預測性能分析,將本文所提AP-LSTM 與主流的LSTM[22]和GPR[23]進行對比分析;2)針對交通環島中稀疏、中度擁堵、嚴重擁堵等不同交通流密度場景,將本文所提PMC 與No-Predict[24]和SUMO原有算法[25]進行對比;3)針對交通環島中車輛行駛沖突的關鍵出口處車輛通行性能分析,將本文所提PMC與Stackelberg、Nash[26]和SUMO 原有策 略進行對比分析。

4.2 軌跡預測分析

結合車輛畫像,基于AP-LSTM 算法中滿足minsup 和minconf 頻繁項集的強相關特征如表2 所示,以E2、G3 作為LSTM 軌跡預測的輸入特征,完成車輛的軌跡預測。

表2 頻繁項集的強相關特征 Table 2 Strong correlation characteristics of frequent itemsets

為驗證不同時空狀態下車輛長時軌跡預測效果,以當前車輛為例,本文將車輛軌跡預測時長分別設為3 s、4 s、5 s 和6 s。采用均方根誤差(Root Mean Square Error,RMSE)計算預測模型的誤差。RMSE如式(27)所示:

圖6 不同算法的均方根誤差對比Fig.6 Root mean square error comparison among different algorithms

4.3 預測機制的協同性能優化分析

為分析在通信受限場景下PMC 算法中軌跡預測機制產生的優化效果,本文對PMC 算法、No-Predict 算法、SUMO 算法進行性能分析。不同算法在各場景下的車輛平均速度如表3 所示。不同算法在各場景下的速度和加速度標準差的優化表現如圖7 所示。

表3 不同算法的車輛平均速度對比 Table 3 Average speed of vehicle comparison among different algorithms 單位:(m·s-1)

圖7 車輛在不同預測機制下的平均速度和加速度對比Fig.7 Comparison of vehicle average speeds and vehicle accelerations under different prediction mechanisms

從圖7(a)和表3 可以看出:在稀疏和中度擁堵交通場景下,雖然No-Predict 算法相較于SUMO 算法的平均速度有一定的提升,但是PMC 算法中基于預測狀態的協同策略能夠獲得更快的平均速度。

在不同場景下,不同算法的加速度對比如表4所示。從圖7(b)和表4 可以看出:在稀疏場景下,雖然PMC 算法的加速度標準差與No-Predict 算法相比降低的不明顯,但是在其他場景下PMC 算法的加速度標準差均明顯降低。圖7 中加速度標準差越低,意味著車輛駕駛越平穩。因此,PMC 算法的駕駛平穩性效果在不同場景中均最優。

表4 不同算法的車輛加速度標準差對比 Table 4 Standard deviations of vehicle acceleration comparison among different algorithms 單位:(m·s-2)

在不同場景下,車輛在各預測機制下的加速度趨勢如圖8 所示。從圖8(a)可以看出:PMC 算法在整體運行過程中雖然存在某一時刻的變化,但是其大部分時間相較于SUMO 和No-Predict 算法更加平穩。從圖8(b)和圖8(c)可以看出:PMC 算法的加速度波動均低于SUMO 和No-Predict 算法。

圖8 車輛在各預測機制下的加速度趨勢Fig.8 Acceleration trend of vehicles under various prediction mechanisms

因此,在通信場景受限的情況下,基于預測機制的協同策略(PMC 算法)相較于無預測機制的協同策略SUMO,在不同場景中均能夠有效優化車輛通行效率與駕駛平穩性。

4.4 出口處實驗分析

由于本文所提的基于預測機制的協同策略相較于無預測機制的協同策略性能優化效果已得到驗證,因此本實驗主要在通信受限場景下通過PMC 與SUMO、Nash、Stackelberg 算法進一步對比車輛通行效率和駕駛平穩性。其中,Nash 算法是對換道車輛及其周邊車輛直接進行納什均衡求解,Stackelberg算法則是以恒定加速度模型(即假定車輛速度)作為受限情況下的車輛狀態估計,求解Stackelberg 博弈結果。出口處車輛的速度分布與加速度標準差分布情況如圖9 所示。

圖9 出口處不同算法性能分析Fig.9 Performance analysis among different algorithms at exit

從圖9(a)可以看出:SUMO 算法存在某輛車的平均速度均快于PMC 和Nash 算法,但PMC 算法的最小值點、25%和50%分位點均高于SUMO、Nash和Stackelberg 算法,由此說明PMC 算法車輛通行效率的優化效果優于SUMO、Nash 和Stackelberg 算法。從圖9(b)可以看出:PMC 算法加速度標準差的分布區間小于SUMO 算法,大于Nash 算法,并且PMC 算法的最小值點、25%和50%分位點、最大值點均低于SUMO 和Nash 算法,而Stackelberg 算法的最小值點、25%和75%的分位點以及最大值點均高于PMC 算法,由此說明PMC 算法具有較優的車輛平穩性。

5 結束語

本文提出一種基于用戶畫像與Stackelberg 博弈的交通環島通行策略。通過構建車輛畫像,在一定程度上解決智能網聯汽車領域中多維異構數據的處理問題,有效表征車輛的時空狀態。同時,結合構建的車輛畫像,設計基于時空特征的車輛預測方法AP-LSTM,通過關聯規則對智能網聯汽車中的多維異構數據進行分析,以提高預測精度。在此基礎上,結合Stackelberg 博弈對交通環島路口處的車輛進行協同控制。實驗結果表明,該策略能夠有效提高環島車輛的通行速度并確保駕駛安全性。下一步將結合真實車輛的協同控制,利用車輛傳感器整合數據,以達到在現實場景下應用的目的。

主站蜘蛛池模板: 精品国产成人av免费| 国产精品人莉莉成在线播放| 91网红精品在线观看| 欧美日韩成人| 日韩精品成人网页视频在线| 精品福利网| 国产不卡在线看| 国产av无码日韩av无码网站| 亚洲天堂色色人体| 国产福利免费视频| 久久久久久久97| 中文字幕亚洲第一| 亚洲综合第一页| 国产91导航| 91久久天天躁狠狠躁夜夜| 99久久成人国产精品免费| 亚洲欧美一区在线| 国产色网站| 中文字幕精品一区二区三区视频| 日韩一级毛一欧美一国产 | 国产精品99久久久久久董美香| 九九热这里只有国产精品| 少妇被粗大的猛烈进出免费视频| 老司机午夜精品网站在线观看| 久久黄色影院| 亚洲日本www| 午夜国产不卡在线观看视频| 亚洲首页在线观看| 一区二区三区在线不卡免费| 乱人伦视频中文字幕在线| 中文天堂在线视频| 亚洲成人播放| 91精品专区| 成人国产小视频| 全裸无码专区| 91精品伊人久久大香线蕉| 亚洲欧洲日产国码无码av喷潮| 日韩123欧美字幕| 999国内精品久久免费视频| 亚洲人成网址| 亚洲AⅤ无码国产精品| 欧美色视频网站| 午夜国产理论| 亚洲aaa视频| 国产精品女熟高潮视频| 香蕉在线视频网站| 欧美日韩一区二区在线播放| 四虎永久在线精品影院| 波多野结衣在线se| 欧美日韩在线第一页| 美女被操91视频| 国产国语一级毛片| 亚洲一区无码在线| 国产精品成人免费视频99| 久久久黄色片| 久久人与动人物A级毛片| 国产精品香蕉在线观看不卡| 欧美成人在线免费| 成人韩免费网站| 特级毛片免费视频| 97在线免费视频| 99热免费在线| 日本高清在线看免费观看| 久久精品国产999大香线焦| 色综合成人| 四虎精品黑人视频| 午夜性刺激在线观看免费| 亚洲a级毛片| 国产小视频在线高清播放| 美女无遮挡免费网站| 久久久国产精品免费视频| 在线播放真实国产乱子伦| 日韩精品无码不卡无码| 国产青榴视频在线观看网站| 波多野结衣视频网站| 欧美色综合久久| 五月天丁香婷婷综合久久| 欧美激情网址| 视频一区视频二区中文精品| 在线日本国产成人免费的| 成年女人a毛片免费视频| 欧美高清三区|