顧金剛,蒲科辰,楊 達,,呂 蒙,朱自博
(1. 公安部交通管理科學研究所 交通控制技術研究部 ,江蘇 無錫 214151; 2. 西南交通大學 交通運輸與物流學院, 四川 成都 610031)
車輛換道行為是常見的駕駛行為,換道行為往往會干擾其它車道車輛的運行,影響交通流的穩定性,所以研究車輛換道行為十分重要。在換道決策階段,駕駛員以自身特性為基礎,接受周圍車輛的速度、間隙、加速度等諸多因素的刺激,做出是否換道、車道選擇的決策。
現有的換道模型可分為4類:基于規則的模型、基于效用理論的模型、基于機器學習的模型和基于動機的模型[1]?;谝巹t的模型假設駕駛員服從若干規則來做出其車道改變的決策,例如優選的目標車道、改變車道的必要性、改變車道的可行性等,這一類別的代表性模型是Gipps換道模型[2]?;谝巹t的模型比較靈活,但沒有考慮駕駛員行為的變化?;谛в美碚摰哪P兔枋鲴{駛員通過比較車道之間效用的大小來決定是否換道以及換往哪一條車道的過程,這一類模型首先由K.I.AHMED[3]提出,D.SUN等[4]建立了多種換道情景下的效用選擇換道模型?;跈C器學習的換道模型通過訓練大量的換道數據,挖掘出影響駕駛員做換道決策的潛在因素,這一類模型一般具有更高的精度,但所需的數據量較大。常用的機器學習算法包括人工神經網絡、模糊邏輯、決策樹、隨機森林等[5-7]?;趧訖C的換道模型中,駕駛員通過評估改變車道能否獲得更大的效益來決定是否換道,這類模型的代表是A.KESTING等[8]提出的MOBIL模型。
其中,基于效用理論的換道模型[9-10]從駕駛員的角度入手,分析駕駛員作為決策者產生換道意圖并選擇目標車道的決策過程,可以較好的反映駕駛員的異質性特征和決策機制。然而,以往的離散選擇換道模型以隨機效用理論為基礎,并假設駕駛員是完全理性的,沒有考慮駕駛員在換道過程中的有限理性特征對換道決策的影響,模型與實際情況不符。前景理論最初由D.KAHNEMAN等[11]提出,K.V.KATSIKOPOULOS等[12]最先將前景理論應用于交通領域的研究,證明了前景理論在不確定條件下出行選擇行為研究中的適用性。在前景理論框架下,駕駛員在做決策時,并不總是按照“概率法則”來估計未來不確定的事件,而是以一定時間內的所有屬性值為基礎,綜合考慮這些指標的變化,從而對未來的速度或間距等做出預測。而且,同樣是分析不確定性因素對換道決策的影響,前景理論通過設立“參考點”劃分收益與損失,據此來計算價值函數,并通過駕駛員的心理概率函數計算收益和損失的權重,最終得到每個方案的前景值。這個過程體現了駕駛員評價車道效用的有限理性,也體現了駕駛員在換道決策過程中潛在的非理性行為。所以,基于前景理論的換道決策模型更符合駕駛員的真實換道過程。
前景理論將決策者的決策行為劃分為前后2個階段:編輯階段和評價階段。在編輯階段,決策者設定參照點,將選擇枝屬性的各種可能結果編輯為相對于參照點的收益和損失值,計算選擇枝相對于各屬性的價值,并根據結果發生的客觀概率計算主觀概率。在評價階段,決策者以上述資料為基礎計算各方案的前景值,選擇前景值最大的方案作為最終結果。
價值函數和決策權重函數的形式由D.KAHNEMAN等[11]提出,函數形式為:
(1)
(2)
(3)

筆者采取前景理論提出者A.TVERSKY等[13]的標定值,根據其標定結果,α與β取值0.88,表示風險態度系數,α與β越大表示駕駛員越傾向于冒險,α與β最大取1,此時為風險中立。λ取值2.25,表示損失規避系數,λ>1說明此時決策者對損失狀況更加的敏感。γ,δ的標定值分別為0.61和0.69。綜合以上,計算方案i針對屬性j的前景值計算公式為:
(4)
前景理論是否適用,取決于它考慮的影響決策的因素是否為確定性的。在換道決策過程中,駕駛員需要考慮本車道以及相鄰車道的狀態,在主動換道決策的情況下,只有某個車道的狀態讓駕駛員感到滿意,駕駛員才會選擇該車道。在感知范圍內,駕駛員評價車道狀態的指標主要為在此車道上可以達到的行駛速度和可以享受到行駛空間,這些狀態都具有不確定性,速度和間距的變化受到前方諸多車輛以及交通環境的限制,前方車輛的狀態也在一定范圍內波動。同時,前方車輛處于某個狀態的客觀概率未必存在,即使存在也難以得到。因此,可通過前景理論描述駕駛員利用有限信息進行推理選擇的真實過程。
1.2.1 模型框架
前景理論模型的編輯階段首先設定各評價指標的參照點,并將車道的評價屬性分為收益和損失值兩類,利用實際的客觀概率獲取主觀概率。評價階段依據上一階段的結果,計算各車道的前景值并選其最大,建模流程如圖1。

圖1 模型框架Fig. 1 Model frame
1.2.2 編輯階段
主動換道決策過程是二項選擇情況下駕駛員的決策過程,駕駛員在感知并評價本車道和相鄰車道的相關屬性后,主動選擇更滿意的車道。設換道車開始產生橫向位移的時刻為t0,在t0時刻之前的時間段是換道決策和換道準備的時間段。由于每位駕駛員具體的決策時間難以估量,為了研究方便,根據實際數據取t0時刻之前的一段時間,這段時間必定包含了駕駛員思考并做出決策的時間,換道場景如圖2。

圖2 換道場景示意Fig. 2 Schematic diagram of lane changing scene
換道決策過程中,駕駛員對目標車道的某些指標可能更加關注。但為了滿足用前景值來評價比選不同車道的要求,應選取本車道和目標車道同等的屬性作為評價指標。這些屬性包括速度,速度差,車頭間距,加速度,是否有重型車輛等。如駕駛員會思考換道之后在目標車道上,是否會擁有比原車道更大的速度和車頭間距。因為車輛在兩條車道上行駛的速度不同,每個速度值或者是速度區間出現的概率也不相同,所以這些評價指標都是不確定性的指標。更大的速度和車頭間距意味著更好的舒適性和更高的效率,這正是決策者所追求的東西,可能影響駕駛員做決策的評價指標有:①本車道前車的速度Vcl,本車道后車的速度Vcf,主車與本車道前車的車頭間距Xs-cl,主車與后車的車頭間距Xs-cf;②目標車道前車的速度Vtl,目標車道后車的速度Vtf,主車與目標車道前車的車頭間距Xs-tl,主車與后車的車頭間距Xs-tf。
因為在實際駕駛過程中,駕駛員的主要注意力放在前方車輛上,所以筆者先選取與前車有關的因素作為評價指標。通過查閱大量有關換道決策過程的文獻,駕駛員主要關注前方車輛速度和間距兩個因素[14-15]。所研究的換道決策問題是一個風險型雙屬性的決策問題,在決策時,駕駛員對這兩個因素的敏感性不同,因此為不同屬性設立權重。
確定了評價指標后,需要確定不同指標的參照點才能計算損益值。參照點選取是前景理論中的重要內容。最初,前景理論運用于股票投資領域時,參照點設立為最初買入股票時的價格,之后的價格漲跌以此為基礎。而后,又有觀點認為參考點應該是購買者對股票未來的預期價格。第3種觀點認為參考點應該設立在初始價格和預期價格之間。目前,人們對參照點的形成機理并不清晰,參照點的選取往往是主觀設定。在換道領域,比較適合的做法是選取駕駛員在具體交通條件下期望的速度和間距作為參照點。速度指標的參照點應根據實際情況設立,也應滿足道路限速條件的要求。城市道路和公路的速度參照點存在差異,在不同的交通情況下,比如擁堵和暢行兩種交通情況下,駕駛員心中期望的速度也明顯不同。所以,針對具體場景,選取正常條件下換道車前車的平均車速作為參照點。間距指標參照點的特性和速度指標相似,所以選取實際交通條件下,駕駛員在換道決策時間段與前車的平均車頭間距作為參照點。相關變量的定義如表1。

表1 變量定義Table 1 Variable definition
Xij為車道i對屬性j的結果,代表Vcl、Xs-cl、Vtl、Xs-tl的值。目前所選取的評價指標都是效益型指標,即駕駛員希望車速越高越好,車與車之間距越大越好。參考點Rj已經確定,車道屬性值相對于參考點Rj的收益Gij和損失Lij的計算公式為:
(5)
(6)
將求得的收益和損失代入價值函數式(1)可求得價值。
收益Gij的價值為:
(7)
損失Lij的價值為:
(8)
計算出價值后,需要計算決策權重。根據前景理論中關于決策權重函數的定義,計算決策權重的基礎是方案出現各種狀態的客觀概率p。在換道問題上,概率p表示車道上的速度值和間距值出現各種狀態的客觀概率,由于前車速度變化的隨機性較大,這個客觀概率的獲取比較困難。為了研究方便,繪制決策時間段內每間隔0.1 s時速度值和間距值的頻率分布直方圖,以某個速度或間距區間出現的頻率來評判該區間出現可能性的大小,并將該頻率值作為客觀概率代入式(2)和式(3)計算。同時,將該速度或間距區間集中為中間值,用中間值代表此區間,將連續的評價指標離散化,更方便計算損益值。
直觀上來看,影響本車速度的主要原因包括前面若干車輛的速度,駕駛員會思考并預估下一時刻前車將出現怎樣的速度,預估的基礎就是決策時間段內前車出現的各種速度狀態,用速度頻率分布直方圖來描述各種速度值出現的可能性比較合理。在判斷該車道對于某個屬性的結果時,決策者為所有可能的出現結果概率賦予一個權重,從而將該結果發生的客觀概率轉變為決策者的主觀概率,這就是決策權重函數的意義。
以上面的計算結果為基礎,利用前景值計算式(4)可以計算出方案i針對屬性j的前景值。
1.2.3 評價階段
為消除不同物理量綱的影響,需要將前景值V規范化為V*,規范化公式為:
(9)
其中:
(10)
最終,每個方案的綜合前景值ui為:
(11)
Wj為評價指標的權重,表示決策者對不同屬性的敏感程度。兩個車道的綜合前景值都計算出來后,比較實際數值的大小,決策者傾向于選取前景值更大的車道。
1.2.4 Logit模型
離散選擇模型是以建模者對不確定因素的抽象為基礎?;陔S機效用的離散選擇模型無法更加細致的描述決策者真實的決策過程,因此許多學者嘗試實現前景理論和離散選擇模型的結合。事實上,在影響車道前景值的很多因素中,有一些因素難以測量,比如車道的路面狀況、氣候、地形等等,這部分隨機變量也將影響車道的前景值。假設個人在每次選擇中總選擇前景值最大的車道,以此假設為基礎來推導基于前景理論的Logit模型。二項Logit模型中假定隨機變量ε1和ε2服從二重指數分布(Gumbel分布),推導出選擇(目標車道)的概率為:
(12)
式中:u1、u2可以通過式(11)計算得到。將式(11)中的未知參數Wj和Gumbel分布中的參數b相乘,設為新的參數xj,采用極大似然估計法來標定,并進行精度檢驗。
使用的數據是美國聯邦公路局NGSIM(next generation simulation)研究計劃所獲得的數據。該數據采用航測的方法,用高空照相機以每秒10幀的頻率對交通路況進行拍攝,獲得的車輛位置、車長、速度、加速度等信息,時間精確到0.1 s。從處理后的NGSIM中抽取換道和不換道2種情形下的速度和間距數據,并對數據進行進一步篩選。
駕駛員在換道決策的時間段中關注的因素包括本車道前車的速度值和目標車道前車速度值。駕駛員也會考慮換道動作是否能夠帶來速度值的收益,這就需要考量前車速度的變化趨勢。由于換道前后影響路段車速的因素太多,很難預測出前車速度將處于怎樣的狀態,更難得到產生結果的客觀概率。事實上,駕駛員在做換道決策時,能接收的信息只是大約的速度分布情況,由此判斷兩車道的“好壞”。因此,采用決策時間段內前車速度位于某個速度區間的頻數作為駕駛員決策的依據,由此得出駕駛員的心理概率。駕駛員對速度的感知不會特別精確,比如速度值變化較小時,駕駛員難以察覺,在抽取的NGSIM數據中,換道決策階段車輛速度的波動性不會太大,所以將速度值分組繪制頻率分布直方圖,組距大部分在5 km/h以下。取速度值每組內的中間值作為屬性值,通過這種方式將連續的速度值離散化,按同樣的思路對間距值進行處理。
從橫向位移產生時刻往前取20 s作為決策階段的數據,足夠包含駕駛員的主動換道決策時間。分析20 s時間內的速度和間距值頻率分布情況,以此作為研究車道上速度和間距變化趨勢的基礎,并借助前景理論中的決策權重函數計算駕駛員的心理概率。從NGSIM的US-101數據庫中提取ID-1069號車的本車道前車速度,20 s內的速度頻率分布直方圖,如圖3。

圖3 速度頻率分布直方圖Fig. 3 Histogram of velocity frequency distribution
將速度離散化為15.5、20.5、25.5 km/h等,對應的頻率值為30%、20%、21%等。按照這種方式處理數據,用于模型的運算。篩選數據后得到的結果用途見表2,從US-101中共提取向左換道數據148組,不換道數據410組。

表2 數據篩選結果Table 2 Data filtering results
利用python的statsmodels模塊進行Logit模型參數標定。由于模塊中的Logit模型和Logit模型在形式上有一定的區別,所以轉化式(12),使之成為stats-models 模塊中標準的Logit形式以方便使用該模塊。
(13)
p1/p0是事件發生的概率和事件不發生的概率之比,稱之為Odds,對Odds取對數得到Logit模型,所以該二項選擇的具體Logit模型為:
(14)
將b與W1,W2結合成為新的參數x1,x2,以式(14)化簡為:
(15)
使用python3.0編程標定未知參數x1和x2,該參數包含了Gumbel分布中的參數b和換道決策不同影響因素的權重參數Wj。
使用數據Ⅰ進行標定,共279組數據,參數估計結果如表3。

表3 前景理論Logit模型標定結果Table 3 Calibration results of Logit model based on prospect theory
使用極大似然函數估計法進行參數標定得到模型為:
(16)
為驗證模型的適用性,需要對模型的精度進行驗證。通過模型可以計算出p1/p0(Odds),從而得到駕駛員選擇目標車道的概率p1。由于模型得出的是一個換道概率的結果,所以為駕駛員是否換道界定一個分界概率,當預測的換道概率大于等于該值時,判定駕駛員換道,否則不換道。一般選取0.5作為分界值,即預測概率大于該分界值則駕駛員傾向于換道,否則保持原車道行駛。使用從US-101中提取的數據Ⅱ(279組)驗證模型,總的正確率達到67%,其中換道行為預測的正確率約為74.8%,不換道行為的預測率約為67.5%。
將1.2.2節中的所有評價指標都考慮在內(后車的相關指標),即Xij包括本車道前車的速度Vcl,后車的速度Vcf;主車與本車道前車的車頭間距Xs-cl,與后車的車頭間距Xs-cf;目標車道前車的速度Vtl,后車的速度Vtf;主車與目標車道前車的車頭間距Xs-tl,與后車的車頭間距Xs-tf。同樣取平均值作為參照點,利用2.1節中相同的數據進行模型的標定與驗證,得到的模型預測正確率約為72%。這表明駕駛員實際決策的過程中,容易忽略本車道后車與目標車道后車的一些因素,駕駛員接收的信息有限,自身認知也有限。本車道后車和目標車道后車對駕駛員主動換道決策的影響不大,僅選取前車速度和本車與前車車頭間距兩種屬性來計算前景值比較合理。
建立基于隨機效用理論的主動換道模型來比較兩種模型的精度,同樣采用前車速度和車頭間距作為評價車道的指標,隨機效用理論直接采用實際的車速和間距數據來表示車道效用,設本車道效用為V1,目標車道效用為V2:
V1=a0+a1Vcl+a2Xs-cl
(17)
V2=a0+a1Vtl+a2Xs-tl
(18)
根據隨機效用理論,駕駛員選擇2條車道的決策是獨立的。車道的效用包括固定效用(V1,V2)和隨機效用兩項,假設隨機效用服從二重指數分布,可以得到基于隨機效用理論的二項Logit模型:
(19)
從2.1節的數據中抽取200組數據標定基于隨機效用理論的換道模型,標定結果如表4 。

表4 隨機效用理論Logit模型標定結果Table 4 Calibration results of Logit model of stochastic utility theory
得到的結果為:
(X12-X22)+0.303 8
(20)
用原200組數據驗證以上隨機效用模型,正確率為62.5%。從2.1節的數據中抽取新的148組數據驗證模型,正確率為56.8%。其中換道行為預測的正確率為64.6%,不換道行為預測的正確率為53%?;趦煞N理論的模型準確率結果如表5。

表5 模型準確率Table 5 Model accuracy
由于采用的相同的數據和相同的評價指標,兩類模型的驗證結果具有可比性?;陔S機效用理論的主動換道模型對于換道行為的預測準確率比基于前景理論的模型低約10%,對不換道行為的預測精度比前景理論模型少14.5%,預測不換道行為的失誤代表在隨機效用模型預測駕駛員本應換道的時候,駕駛員并沒有做出更換車道的決策。經由式(17)、式(18)計算出的車道效用值是車道的絕對屬性,并非駕駛員對車道的感知與評判,車道的前景值才是從駕駛員角度考慮的決策者對車道的滿意程度。在車道效用值足夠大時,駕駛員可能因為該車道前車速度或間距波動太大而放棄換道??梢钥闯鰮Q道動作實際上存在一定成本,對駕駛員來說,換道也意味著麻煩和一定的風險性,在做主動換道決策時,駕駛員不會太過隨意的換道,前景理論相比較于隨機效用理論可以更好的描述這一決策過程。
基于效用理論的換道模型無法反映駕駛員的有限理性特征,無法表現出駕駛員面對風險(收益和損失)的不同態度以及處理大小概率事件的不同態度,針對現有模型的不足,筆者將前景理論引入換道決策領域,以前景理論為基礎建立換道決策模型,并將一定時段內速度和車頭間距分布作為評價指標進行決策,更符合駕駛員真實的決策過程。得到以下結論:
1)相比較于效用理論換道模型,基于前景理論的換道模型預測精度更高,可以體現出換道動作存在一定成本,對不換道行為的預測也更準確,能更好的描述和預測換道決策行為。
2)在評價指標中,駕駛員對速度的敏感性更高,調整評價指標的數量,增加考慮后車相關因素,模型的準確度變化不大,可以看出駕駛員在主動換道決策中更加關注前車的相關因素。