王晶
(北京城建設計發展集團有限公司 濟南分院,山東 濟南 250101)
一般來說,系統最優是交通管理者希望達到的一種均衡狀態,交通管理者制定誘導策略往往是基于系統最優準則[1-3]。在不考慮誘導的情形下,城市交通車輛在大多數情況下都處于非合作博弈的境地[4-6],每個“博弈者”為了自身收益最大化,不惜做出一些違反秩序的事情,從而達到納什均衡[7],而非社會總收益最大化(交通流高效運行,社會交通總等待時間最小)。出于對社會總收益的考慮,應使交通流更高效率地運行,節省駕駛人的駕駛時間[8-9],首要措施是完善與強行變道相關的交通法律法規。目前,由于與強行變道相關的交通法規比較模糊,導致實際交通執法過程中沒有明確的處罰標準[10]。本文運用博弈論的方法分析強行變道對交叉口交通的影響,引入強行變道經濟處罰與舉報獎勵,對車輛強行變道的經濟處罰措施對交叉口交通的改善進行效果分析。
路網車輛可以分為兩類:一類是參與強行變道過程的車輛,包括強行變道車輛和目標車道后車,為了分析和描述的方便,定義強行變道車輛(車輛C)與其目標車道后車(車輛D1)這一組合為強行變道“基本單位”(以下簡稱“基本單位”);另一類是未參與強行變道博弈的車輛,稱為普通車輛。實際的交通運行過程參與者可以理解為由若干強行變道車輛和若干普通車輛組成。在該情境下,由于普通車輛按照秩序排隊等待,可以認為其對交通的影響忽略不計,只選擇強行變道車輛進行分析。
強行變道車輛強行變道失敗時,其表征現象僅僅為在本車道停留時間較長[11-12],若對此時的強行變道車輛進行經濟處罰,一方面難以制定處罰標準,另一方面也給交管部門帶來管理上的困難。而強行變道成功時,強行變道車輛的行為可以通過交通監控設備發現和記錄。
所以,強行變道經濟處罰的具體描述為:當強行變道車輛采取強行變道并成功施行時,交管部門即對其采取強行變道處罰。
由于各種原因,車輛未能在具備良好變道條件的可變道區域換道至目標車道,而只能選擇在臨近交叉口處的可變道區域,采取強行變道措施進入其他方向車道或同方向其他車道[13-16]。因而,強行變道車輛會在運行空間上對目標車輛后車及周邊部分車輛進行擠壓,迫使目標車輛后車及周邊車輛減速或者選擇在可變道區域轉向其他車道,進而使交通流趨于無序,降低交叉口的通行能力。在強行變道的過程中,由于駕駛人對安全性更為看重,故此時目標車輛后車會采取一定措施來保障自身的安全和行駛權益[17-19]。故本博弈的博弈者(博弈車輛)和策略集為:
1)博弈車輛。強行變道車輛C、目標車道后車D1、強行變道車輛后車D2。
2)策略集。C在有變道需求時,可以選擇強行變道、排隊等待變道和繼續直行3種策略;D1有減速讓行和不減速讓行2種策略可供選擇;D2可以選擇繞開C行駛和不繞開C行駛2種策略。
考慮到強行變道車輛的變道需求是不能被忽視的因素,故各博弈車輛在該過程中的交通收益可以從安全性、時間性和變道需求3方面進行考慮[20]。為簡化分析,用S、T、R分別代表該地區車輛安全性收益、時間性收益和變道需求收益的平均水平[21],用權重β1、β2、β3分別表示C、D1和D2對S的重要程度,用權重α1、α2、α3表示C、D1和D2對于T的重要程度,在該過程中僅C有變道需求,用權重γ1表示C對于R的重要程度。
在實際生活中:由于發生交通事故除了給駕駛人造成人身傷害與財產損失外,還會給駕駛人帶來因事故處理等原因造成的時間延誤[22-23],則S>T,C、D1、D2分配給安全性的權重明顯大于時間性權重,即βi>αi(i=1,2,3),故βiS>αiT,在同一地區,每個駕駛人分別給予安全性和時間性的權重比相對固定,即βi/αi=d(d為常數)。
無強行變道處罰情況下,“基本單位”與D2博弈收益矩陣見表1,每個矩陣內的3項收益分別為C、D1、D2的收益。

表1 無強行變道處罰時“基本單位”與D2博弈收益矩陣
由表1可知:對于C而言,α1T+γ1R>γ1R>-β1S;對于D1而言,α2T>0>-β2S+α2T;對于D2而言,α3T>0>α3T-β3S。因此,為使自身收益最大化,C強行變道、D1讓行、D2不繞開D1策略與C排隊等待變道、D1不讓行、D2不繞開D1策略(表中帶陰影部分)是本博弈的納什均衡點。即:當C采取強行變道策略時,D1會選擇讓行策略,D2選擇不繞開D1;當C采取排隊等待變道策略時,D1會選擇不讓行策略,D2選擇不繞開D1。即無論C與D1采取何種策略,車輛D2相較于繞開前車策略會更傾向于選擇在C后等待,而D2后的車輛也會面臨選擇等待或者繞開前車。按照實際情況而言,D2后的車輛若選擇繞開C前行,則其面臨著要繞開至少兩輛車(C、D2)輛的情況,這使得駕駛難度增大,交通收益期望降低,故D2后的車輛更傾向于選擇等待。
加入強行變道處罰后,設處罰為Y(Y>0),“基本單位”與D2博弈收益矩陣如表2所示。
由表2可以看出,對于D2而言,α3T>0>α3T-β3S,故D2為追求自身最大收益α3T,當C強行變道時,D2選擇不繞開D1的策略優于選擇繞開D1的策略,即該情境下D2會選擇不繞開D1的策略。

表2 加入強行變道處罰后“基本單位”與D2博弈收益矩陣
加入強行變道經濟處罰Y,且Y≥α1T時,結合表2中C的收益,γ1R>α1T+γ1R-Y>-β1S,則C為實現收益最大化,會選擇排隊等候變道措施,即相較于強行變道策略,C會主動選擇排隊變道,從而抑制了車輛強行變道行為的發生,降低了交通延誤,增大了交通總收益。
實際生活中,為了更好地記錄車輛和鄰近車輛的交通行為,車輛一般配備行車記錄儀。因此,交通管理部門在制定管理辦法時,可以加入對舉報強行變道行為的鼓勵,由交管部門進行鑒定和處罰,必要時可給予舉報人一定的經濟獎勵。由于行車記錄儀具有一定的記錄范圍,假設只有D1與D2具備記錄的能力。在表2所示博弈模型的基礎上加入對舉報人的獎勵,博弈收益矩陣如表3所示,表3中Z為交管部門給予舉報人的總獎勵,且有Z≤Y,ρ1、ρ2為D1、D2的獎勵分配比例。對于ρi(i=1,2)有:當D1、D2均進行舉報時,ρ1=0.5;當只有D1舉報時,ρ1=1,ρ2=0;當只有D2舉報時,ρ1=0,ρ2=1;當D1、D2均不舉報時,ρi=0。

表3 加入強行變道處罰和舉報獎勵后“基本單位”與D2博弈收益矩陣
由表3可以看出:
1)因α3T+ρ2Z>α3T-β3S+ρ2Z,α3T-β3S<0,無論C與D1采取何種策略,D2選擇不繞開D1的策略優于繞開D1,即D2會選擇不繞開D1的策略。
2)結合表3中C的收益,當Y≥α1T時,有γ1R>α1T+γ1R-Y>-β1S。此時,相較于強行變道策略,C會主動選擇排隊變道,從而限制了車輛強行變道行為。由于ρ2與C無關,故無論ρ2取何值,C的行為均會受到限制,從而限制了車輛強行變道行為,降低了交通延誤,增大了交通總收益。
3)部分地區出于某些原因,其強行變道經濟處罰Y<α1T,此時α1T+γ1R-Y>γ1R。由于C與D1均會考慮使自身收益最大化,故需對Z進行進一步討論:
①當ρ1Z≥α2T時,博弈納什均衡點唯一,即C強行變道,D1讓行,D2不繞開D1,即C會堅定采取強行變道行為,此種情況不符合預期要求;
②當ρ1Z<α2T時,有α2T>ρ1Z>0>-β2S+α2T。此時納什均衡變為C強行變道,D1讓行,D2不繞開D1和C排隊變道,D1不讓行,D2不繞開D1,即相較于ρ1Z≥α2T的情況,ρ1Z<α2T的情況可以使C強行變道的概率減小。
當設定Z使得ρ1Z遠小于α2T時:D1為獲取遠大于ρ1Z的收益α2T,會更堅定地采取跟馳前車的措施(不讓行),不給C變道的空間,此時由于無變道空間,相較于強行變道策略,C會主動選擇排隊變道,進一步減小了C強行變道概率,從而限制了車輛強行變道行為,降低了交通延誤,增大了交通總收益,符合預期的要求。
本文運用博弈論的方法分析強行變道對交叉口交通的影響。研究表明:僅加入強行變道處罰,且處罰大于變道車輛的時間性收益時,會有效抑制強行變道行為的發生;同時加入強行變道處罰與舉報獎勵時,可以在處罰難以達到車輛采取強行變道行為的時間性收益時抑制強行變道行為的發生,從而使交通流運行更加平穩。因此,建議交管部門選擇試點進行實施,得出合適的處罰力度,進而規范所在地區交叉口車輛行為,使交通流運行更加平穩有序。