柳 蓓 劉鵬飛 崔琦璇 楊 馳 秦夢圓
(武漢理工大學交通與物流工程學院1) 武漢 430063) (武漢理工大學計算機與人工智能學院2) 武漢 430063)
高速公路改擴建工程在“邊通車-邊施工”的模式下,交通事故頻繁發生,通行效率低下[1].據《道路交通事故統計年報》數據顯示,2019年交通事故中萬車死亡人數為1.8人,道路施工期間發生的事故率為非施工期間的2.7倍[2].因此亟須對高速公路改擴建施工區進行有效的交通管控.Avrenli等[3]發現真人交通引導員多元化的引導手勢相較于傳統靜態單一的交通管控措施,可以有效改善高速公路施工區的交通運行狀況,但危險性和成本高.元會杰等[4]發現在改擴建期間,現有設施無法實現實時管控,提高施工路段通行能力需要進行主動管控.
基于此,文中設計了以引導機器人為功能集成的硬件載體,通過GCNN進行時空預測得到短時交通流數據以及交通狀態貢獻度最大的節點,輸入至仿真平臺得到優化的主動控制決策,以期提高改擴建施工區的交通通行效率和安全水平.
圖卷積神經網絡預測模型[5]主要由三個部分組成:
1) S-GNN層 目的是通過交通網絡捕捉道路節點之間的空間關系.
在交通網絡G上對道路之間的關系進行編碼.交通網絡中連通的道路更有可能具有相似的屬性,可表示為:
(1)
式中:波浪線為矩陣的增廣矩陣;A為鄰接矩陣;D為精細度矩陣;W為可學習的參數.Xout為交通特征在位置上的輸出矩陣;Xin為交通特征在位置上的輸入矩陣.
由于可能還有一些沒有意識到的其他因素影響節點之間的關系,故采取對每個節點vi學習一個潛在位置表示pi,于是得到任意倆個節點的相似性公式.
(2)
2) GRU層 即按順序捕獲時間關系(或局部時間依賴).
為了在處理序列時包含空間關系,在方程式中應用了修改后的GCN運算的輸入和隱藏的表示.時間t中的每個節點vi,GRU的操作可表示為
(3)
式中:Wz,WrWh,Uz,Ur,Uh為需要學習的參數xt;Ht-1為經過S-GNN層GCN操作后的輸出矩陣;Ht為當前時間步長的輸出矩陣,也作為下一步時間步長的輸入矩陣.
3)transformer層 旨在直接捕獲序列中的長期時間依賴(或全局時間依賴).
S-GNN層同時還應用于GRU單元的輸入和隱藏表示,GRU層和transformer層都用于分別捕獲每個節點的時間依賴關系,同時從不同的角度捕獲依賴關系.
prediction layer為利用多層前饋網絡預測未來時期的交通流.該模型訓練過程中的損失函數為
(Yt+T+1,…,Yt+T+T′))
(4)
d(f(Yt+1,…,Yt+T),(Yt+T+1,…,Yt+T+T′))=
f(YT+1,…,Yt+T)
(5)
式中:f(·)為預測的模型.
當Shapley理論用于解釋機器學習模型的時候,將輸入特征視為參與成員x∈X,視為模型輸出的概率分布,f(x)視為聯盟總目標,通過衡量各特征的貢獻度來挖掘重要特征,從而提供可解釋性判別依據,引入特征函數被來判別輸入特征子集S對于某一類的重要性分數,即[6]:
(6)
式中:Em[·|x]為模型輸出的期望,該特征函數具有編碼理論解釋,它對應于基于子向量xs對模型輸出進行編碼所需的預期位數的負數,當模型基于xs進行確定性預測時或在輸出空間上接近均勻的分布時,該期望值的數值將為零.
對于包含特征i的給定特征子集S,一種評估特征i在子集S中與其他特征相互作用的方式是通過計算有特征i和無特征i時子集^中所有特征的重要性之間的差異,這種差異稱為特征i對子集S的邊際貢獻,其定義為
mx(S,i)=vx(S)-v(S
(7)
最終特征i的Shapley value是通過對所有子集情況下特征i的邊際貢獻求平均值而獲得的,該值可被視為特征i的重要性分數并作為貢獻度,定義為
(8)
參考SHAP模型計算微觀路網中每個路段節點對預測結果的貢獻度Shapley值,通過仿真實驗統計出施工區路段導致擁堵發生可能性最大的三個節點,如圖1路網中進行標記.
圖1 圖卷積神經網絡算法結構
基于元胞自動機模型開發了高速公路改擴建施工區“二合一”路段交通管控策略設計平臺.采用7條元胞鏈表示一條車道,每個元胞空間精度:長度為1 m、寬度為0.25 m,模型時間精度為1 s,仿真車型包括小型車和大型車.其中,車型尺寸依據小型車長度6 m、寬度 2 m,大型車長度12 m、寬度2.5 m進行設置,見圖2.
圖2 元胞劃分及車型尺寸
1) 跟馳規則 為了更加契合高速公路改擴建施工期交通流特性,本實驗將考慮不同車型的跟馳行為,反映車輛在跟馳過程的實際跟馳情況,采用期望跟馳間距建立車輛的跟馳規則.
NaSch模型[7]被用于描述模擬施工區場景中的跟馳行為,在每個離散時間步t到t+1時,根據以下規則并行更新系統.
dn(t+1)≥Dmin
(9)
式中:dn(t+1)為t+1時刻第n輛車與前車的間距;Dmin為期望跟馳間距.
跟馳車輛在行駛時情景見圖3.
圖3 跟馳情景
由圖3可得:
dn(t)+Vn-1(t)=Vn(t)+dn(t+1)
(10)
結合式(1)~(2)可得第n輛車在t時刻與前車的最小跟馳間距dn(t)滿足下列條件.
dn(t)≥Vn(t)-Vn-1(t)+Dmin
(11)
引入駕駛員差異參數ψ對駕駛員速度感知以及不同車型加速度an進行修正,則此時交通流的跟馳模型如下.
加速:
Vn(t+1)=min(Vn(t)+an,Vmax)
(12)
隨機慢化:
Vn(t+1)=max(Vn(t)-an,0)
(13)
位置更新:
Xn(t+1)=Xn(t)+Vn(t)
(14)
式中;Vn(t+1),Vn-1(t+1)為第n輛車和前一車輛第n-1輛車在t+1時刻的速度;an為第n輛車的加速度;Xn(t),Xn(t+1)為第n輛車在t和t+1時刻的位置;dn(t)為第n輛車距離前方車輛的距離;Vmax為第n輛車可能的期望速度.
在原始CA模型中,隨機慢化概率一般為固定值,而在實際中,其與道路的交通密度有關,當道路中交通密度的不斷增加,車輛隨機慢化的概率也將增加,因此,隨機慢化概率可設定為.
(15)
綜上,駕駛員在行駛過程中不與其它車輛發生沖突,將按照加速規則加速到可能的期望速度,當駕駛員估計當前車輛與前方車輛的間距小于期望間距時,將按照減速規則減速至安全速度,其中Vn(t)-ψVn-1(t)+Dmin為駕駛員對期望車距的預估,其次,車輛會以概率Pn(t)隨機減速,最后,車輛按位置更新規則行駛.
2) 換道規則 采用模糊控制規則生成車輛換道動機[8],采用換道增益ΔB以及換道安全間距L衡量換道動機P.
P∈{0,1}
(16)
當換道動機P為0時,駕駛員不選擇換道,反之,駕駛員產生換道動機.
換道增益ΔB為當前車道與目標車道的行駛效益之差,其中,當前車道行駛效益Bnow按下式計算.
Bnow=Vn-2(t)-Vn(t)+Ln(n-2)
(17)
同理,目標車道行駛效益Bobj如下.
Bobj=Vn-1(t)-Vn(t)+Ln(n-1)
(18)
因此,換道增益ΔB定義為
ΔB=Bobj-Bnow
(19)
當換道增益ΔB越大,說明車輛跟馳目標車道前車運行條件越好或者當前車道的交通密度較目標車道交通密度越大.
綜上所述,換道動機P由換道增益ΔB與換道安全間距L共同決定,當換道增益ΔB越大,車輛與目標車道后車距離L越大,駕駛員的換道動機越強烈;相反,當換道增益ΔB越小,車輛與目標車道后車距離L越小時,駕駛員不選擇換道.
搭建基于元胞自動機的高速公路改擴建施工區“二合一”路段交通管控策略設計平臺,選取限速標志個數、限速標志位置、限速速度以及合流點位置作為輸入參數,給定范圍及步長后隨機排列組合進行仿真,并選取交通沖突嚴重率(基于TDTC的沖突次數和碰撞能量)[9]、李雅普諾夫指數和延誤作為評價指標,根據比選評價指標的優劣得到基本控制決策.若仿真過程中算法運行時間超過5 s,則選擇當前仿真運行得到方案中的最優方案.
在基本控制決策的基礎上進一步優化:輸入由算法預測得到的短時交通量和交通狀態貢獻度最大的節點,結合基本決策中的限速標志位置、限速速度以及合流點位置,繼續組合仿真,比選評價指標的優劣得到在不同的交通量的情況下的最優控制策略,完成控制策略的優化設計.
仿生引導機器人系統作為整個交通引導機器人系統實現功能的載體,由仿生引導機器人、LED可變信息板、路欄、監控設施、毫米波雷達、LoRa通信模組,系統中各硬件設施布設見圖4[10].
由于施工區是一直在前進移動的,所以本項目的硬件系統的可變信息板等交通設施都具有可移動性,可以重復使用.
圖4 改擴建施工區“二合一”路段的硬件設施布設
本實驗通過駕駛模擬技術構建被試者駕駛汽車在高速公路改擴建施工區“二合一”路段場景,實驗過程中測量被試者在有引導機器人系統情況下的駕駛行為,基于駕駛行為指標、駕駛員視覺指標、心率和皮膚電進行綜合分析,設置對應交通量下的空白對照組,進行仿真實驗并比較兩組的評價指標,驗證該控制系統的有效性.
1) 掃視頻率 有無系統掃視頻率對比見圖5.由圖5可知:有系統時被試者的掃視頻率明顯大于無系統時,掃視頻率平均降低了30.1%,由此說明系統中的機器人和可變信息板提供的信息對駕駛員的吸引程度大,系統布設有效可靠.
圖5 有無系統掃視頻率對比
有無系統的眼動結果見圖6.由圖6可知:對比顯示被試者更多關注仿生引導機器人系統中的機器人和可變信息板而非前方道路,本系統得到駕駛員更多的關注度.
圖6 有無系統的眼動結果
2) 駕駛員橫向操控行為(轉向燈使用頻率) 有無系統時轉向燈使用頻率見圖7.由圖7可知:被試者在有機器人系統場景行駛時,使用轉向燈的頻率明顯低于無機器人系統時,頻率平均降低了27.3%.
圖7 有無系統的轉向燈使用頻率
通過計算,相較于靜態單一的管控措施,本系統控制下交通流的延誤減少了15.4%,交通沖突嚴重率降低了22.6%,交通穩定性提高了19.8%.
1) 采用圖卷積神經算法采用特征融合對交通流進行預測,有效提取所構建路網在宏觀上的時間序列特征和微觀上的空間關聯特征,使得預測的精準度得到了大大的提升.同時,本模型引入Transformer機制,對于宏觀全局特征進行把控,防止算法在預測過程中陷入局部最優解.
2) 基于元胞自動機搭建了高速公路改擴建施工區“二合一”路段交通管控策略設計平臺,通過數次的仿真得到基本控制策略及優化,有大量的數據支撐使得控制策略具有可靠性和有效性.
3) 構建的仿生引導機器人系統,通過基于微觀路網的構建的GCNN算法模型,對未來短時期內的交通流和交通狀態進行預測,利用圖神經網絡可解釋性得到對交通狀態貢獻度最大的節點.將該數據代入高速公路改擴建施工區“二合一”路段交通流仿真平臺中對基礎控制策略進行修正得到當前狀態下的最優控制策略.