楊曉光,張 楠
(同濟大學 道路與交通工程教育部重點實驗室,上海 201804)
交通流的解析與建模,不僅對于揭示其規律具有科學意義,還可為交通流控制和管理提供科學依據,因此,有關于此的研究由來已久.交通流運行過程是一個動態過程,因受到動態的交通需求和交通行為,以及靜態的道路及管理條件等的組合影響,所以交通流狀態具有不確定性特點.是否能夠準確地描述交通流真實特征和演變規律,是交通流控制和管理的關鍵基礎問題.由于交通流在時間和空間上分布特性的高度復雜性,很難通過觀測的方法在任意時間段內直接獲取任意范圍內的交通流狀態的動態演變過程,所以無論是在科學研究和工程應用方面,都需要利用實驗的方法對交通流進行建模和分析.包括交通系統在內,現實的科學和工程領域中,有諸多問題很難通過基于還原論的模型進行計算求解,所以需要通過對系統的狀態進行觀測和實驗方法闡明系統運行機理和規律,相對于基于還原論的方法,稱其為經驗模型法[1].所以,實驗交通工程學被提出,利用實驗的方法解決交通系統范疇中面臨的問題[2].
實驗交通工程學是基于復雜系統理論,將交通工程學與計算實驗理論和交通數據及信息結合,對交通系統的現象和機理進行模擬與解釋[2].童梅的研究從實驗交通工程學的起源和基本理論出發,將實驗交通工程學的基本問題歸納為:交通數據條件下的交通實驗系統的實驗建模、實驗計算以及應用實驗3個基本問題[3].面對交通流的實驗研究,楊曉光等利用交通仿真技術作為交通流模型,構建了交通需求、交通運行,以及管理評價的交通仿真實驗系統,率先對交通流的實驗方法進行了初步探索[4].更進一步, 時柏營建立了基于虛擬環境與現實環境通過離線和在線數據集成的平行系統的交通流實驗系統框架[5].在虛擬環境中,利用觀測數據還原現實環境交通流的“再現”過程,是虛擬環境與現實環境成為“平行系統”的關鍵,也是利用虛擬環境進行交通實驗及應用的基礎前提.
本研究研究重點是在交通流實驗系統框架基礎上,結合交通流的觀測數據,提出交通流再現問題的實驗建模和計算方法.
交通流實驗系統框架包括虛擬環境和現實環境,見圖1.交通流實驗系統框架又是交通戰略實驗室的核心組成部分[6].在交通系統的現實環境中,交通控制、管理措施和道路設施是交通流的限制條件.在虛擬環境中,利用信號控制模型和路網模型與現實環境相對應,作為交通流模型的約束條件,管理措施則可以通過變結構路網模型進一步作為交通流模型的約束條件[7].在交通流實驗系統框架下,虛擬環境與現實環境組成為平行系統的關鍵因素是利用現實交通流的觀測數據,通過實驗計算再現一個與現實交通流相似的交通流.這一過程是一個虛擬與現實交互的動態過程.從廣義上講,交通流實驗系統框架是交通戰略實驗室的一部分[6],再現的交通流可以作為信號控制與交通管理的分析基礎,進一步形成信號控制和交通管理方案對交通流進行控制和管理.這一過程形成了一個虛擬與現實交互的閉環過程.所以,本研究的重點問題在于構建“再現一個與可觀測的交通流現實環境相似或者等價的交通狀態的模擬系統”的方法.
大多數情況下,再現交通流的一般過程總結如下:首先根據現實環境的交通系統建立一個交通流模型,利用現實的交通流數據對交通流模型參數進行標定和檢驗.標定之后的交通流模型可以重復生成交通流的實驗數據.交通流模型可以劃分為宏觀交通流模型和微觀交通流模型.對于宏觀交通流模型主要是利用觀測數據對模型中的交通流參數進行估計[8-11],但是利用線性的交通流模型[8],或者存在較強的假設條件[10],限制了交通流模型對非線性交通流再現的適用性,特別是信號控制條件下的交通流.另一方面,宏觀交通流模型條件下,多種觀測數據存在難融合的問題[11].微觀交通流模型包括:跟車模型和換道模型.在應用該模型對交通流進行再現時需要對模型進行標定[12-13],但是由于駕駛行為等眾多不確定因素的影響,所以標定的跟車和換道模型不能適應于所有的車輛軌跡的再現[14],取而代之的則是廣義的標定[15].另外,微觀交通流模型的標定需要精度較高的車輛軌跡數據,如NGSIM數據集[16],對觀測數據的要求較為嚴格.
以上方法的特點均是在給定模型基礎上對參數進行標定和校正,該類模型可以被定義為參數模型[17].考慮到有限時間和空間特性的交通流觀測數據,同時在虛擬環境中,利用觀測數據再現現實中具有不確定性特征的交通流的要求,本研究提出利用非參數模型對交通流進行再現.非參數模型是將模型的參數定義在一個無限可能的數據空間或者是來自于一個不完全確定的形式[17].一方面,非參數模型對于觀測數據更具有包容性;另一方面,對于實驗方法而言,非參數模型可以被視作為一種經驗模型.所以,本研究建立交通流的非參數模型,結合觀測數據,利用實驗方法得到非參數模型的近似解,實現對交通流的再現.
一般地,描述交通流演變過程可以通過交通流狀態特征變量的模型實現.在實驗方法中,給定一個空間范圍和一定的時間段,交通流演變過程可以定義為交通狀態特征參數H的時間序列.定義交通狀態變量為隨機變量時,時間序列可以被定義為一個隨機過程模型M,該模型的參數為θ.對于虛擬空間中的狀態特征參數和模型參數,定義聯合概率分布函數為p(H,θ|M).對于非參數方法利用參數概率分布函數代替對特定參數的分析.該概率分布可以視作為參數模型中參數的一個數據空間.一定條件下,滿足同一個分布的交通流被視為相似或者等價的交通流.
(1)
為了求解優化問題(1),假設交通流特征參數與模型參數相互獨立,根據貝葉斯公式將式(1)中的概率分布p(H,θ|M,O)展開得到
p(H,θ|M,O)∝p(O|M,H,θ)p(H)p(θ)
(2)
式中:p(O|M,H,θ)為似然函數;p(H)、p(θ)為交通流特征參數與模型參數的先驗分布.
根據Jensen不等式(Jensen’s inequality),在給定隨機過程模型M條件下,觀測數據的似然概率的對數可以定義一個下限
(3)
式中:qH(H)、qθ(θ)為設定的交通流特征參數和模型參數的分布.令下限函數為L(q),且
(4)
在定義了下限函數之后,優化問題(1)可以通過最大化下限函數L(q)得到[18]
qH(H)qθ(θ)≈p(θ,H|O,M)
(5)
所以求解優化問題(1)的實驗計算過程可以被描述為:通過有限的迭代計算最大化下限函數L(q),使得特征參數和經驗參數的聯合分布qH(H)qθ(θ)不斷地接近分布p(H,θ|O,M),最終使qH(H)成為現實交通流的狀態參數分布的近似分布.最大化下限函數的算法可以采用變分貝葉斯學習(variational Bayesian learning)的EM算法[18]進行求解.但是該算法不適應于變量較多、結構較為復雜的隨機過程的計算.所以,本文選取更方便于計算的馬爾科夫-蒙特卡羅算法中的Gibbs分塊抽樣算法[19].該方法同樣適用于計算復雜隨機過程優化問題(1)的近似解[20].
交通密度、交通流量和交通流波動速度是交通流最基本的參數[21]。所以,在應用該實驗方法對交通流進行再現實驗時,首先選擇宏觀交通流特征參數作為實驗框架中虛擬環境的交通流模型參數,描述交通流的動態變化特征.宏觀交通流特征參數主要應用于連續交通流的建模和分析中[8-10].對于信號控制條件下的交通流比連續交通流更為復雜[22]. 所以本研究選擇信號控制交通流作為研究對象.
如圖2所示,城市信號控制條件下最基本的交通系統包括:道路設施、信號控制、檢測設備、交通流組成.相對應地,虛擬環境下的交通系統模型包括路網模型、控制模型和交通流模型.本研究結合以上的實驗場景設定,建立信號控制交通流再現實驗的實驗框架,并利用實際數據進行驗證.
本論文選用宏觀交通流特征參數作為分析的基礎變量,與之對應的路網模型選用CTM(cell transmission model)模型作為交通流路網模型[23-24].對應于圖2中的道路設施,該道路可以由若干個Cell組成的整體來表示,Cell(2)和Cell(3)代表檢測器之間的道路,其中Cell(2)表示交叉口范圍,Cell(3)表示路段范圍,每一個Cell設置通行能力的限制,根據實際的道路交通渠化設計計算其通行能力.陰影的Cell(1)和Cell(4)為虛擬Cell,代表檢測器和信號控制.
利用CTM模型時,交通控制可以表示為以下過程:當控制信號相位為綠燈時,虛擬Cell(1)作為一般的Cell,交通流按照其狀態從Cell(2)流入到Cell(1);當控制信號相位為紅燈時,從Cell(2)流入到Cell(1)的流量設置為0.
交通密度、交通流量和波動速度參數中,交通流量是最容易被觀測獲取的參數,所以,將交通流量作為觀測參數,交通密度和波動速度作為隱含參數.對應于非參數化定義,設定波動速度和交通密度服從高斯分布.


圖3 信號控制條件下交通流狀態劃分Fig.3 Traffic flow state division in the condition of signal control
在交通流觀測條件下,交通流密度和波動速度的演變過程可以建立一個隨機過程[26],表示為
p(zt|zt-1):πzt-1
(6)
(7)
fzt(ρ(t))=Aztρ(t)+BJ,ztρJ+BQ,ztqmax
(8)
y(t+Δt)=Cρ(t+Δt)+wt
(9)
式中:ρ為t時刻道路的交通密度向量,輛·m-1;y為t時刻道路的流進流出的交通流量的觀測向量,輛·s-1;ρJ為道路最大的容量,輛·m-1;qmax為道路最多能通過的車輛,輛·s-1;zt為交通狀態模式;πzt-1為狀態模式轉移矩陣;Azt、BJ,zt、BQ,zt、C均為系數矩陣,其中C為常數;令Θ(zt)={Azt,BJ,zt,BQ,zt},其中系數矩陣為波動速度[26];et、wt均為誤差,設定其滿足均值為0、方差為Σ、R的高斯分布;狀態轉移矩陣和誤差屬于模型的經驗參數,令θ={Σ,R,π};lx為第x個Cell的長度,m;Δt為時間段時長,s.
交通流的經驗模型將交通流的運行過程抽象成為一個多層的狀態轉換的隨機過程[20],見公式(6)~(9).該隨機過程可以表示為一個多層的隱馬爾科夫模型(hidden Markov Model,HMM)[27],見圖4.其中,第1層為交通狀態模式轉移矩陣為πzt-1的馬爾科夫過程;第2層為在交通狀態模式條件下,交通密度轉移矩陣為系數Θ(zt)的馬爾科夫過程;第3層為獨立同分布的交通流流量觀測變量.該模型中交通狀態模式和交通流密度為隱層狀態變量,交通流波動速度為未知的系數矩陣.交通狀態模式的轉移矩陣以及誤差為經驗模型的未知參數.

圖4 動態交通流的馬爾科夫過程圖形表示Fig.4 Graph of Markov process for dynamic traffic flow
建立模型之后,交通流再現的問題可以具體歸納為:通過交通流量的觀測數據,再現交通流密度和波動速度,利用再現的交通流特征參數描述現實交通流動態變化過程,該實驗框架見圖5.將信號控制道路上下游到達和離去的交通流量作為觀測數據集.在進行實驗計算時,利用再現實驗的變分貝葉斯學習算法求解問題(1).

圖5 交通流宏觀參數再現實驗框架Fig.5 Experimental framework for reproduced macroscopic parameters of traffic flow
本研究采用Gibbs抽樣算法獲得實驗計算目標的近似解[20].在觀測時間段[0,T]內,抽樣算法的迭代過程如下:
(1) 抽樣交通密度序列{ρt}1:T.在給定狀態模式序列{zt}1:T,系數矩陣Θ(zt),以及其他經驗參數的條件下,圖4中的模型,轉變為只含有第2層未知變量的HMM.當ρt服從高斯分布作為先驗分布,見公式(7)、(8).此時,交通密度序列{ρt}1:T的后驗概率計算公式為可以利用高斯HMM的前向-后向傳遞算法(forward-backward algorithm)進行計算[28], 該算法是利用馬爾科夫性質,將全部序列的邊緣概率密度的積分計算轉變為局部的積分計算.根據該算法狀態序列的后驗概率分布計算公式為
p(ρt|ρt-1,y1:T,z1:T)∝
(10)
式中:mt+1,t(ρt)為后向傳遞信息.
(11)

(2) 抽樣狀態模式序列{zt}1:T.在給定狀態模式序列{ρt}1:T,以及其他參數的條件下,圖4中的模型,轉變為只含有第1層未知變量的HMM.同理,交通流狀態模式的后驗概率計算公式為
(12)
式中:
p(y1:T|zt,Θ(zt))∝
(13)
交通流狀態模式的后驗概率可以應用后向信息傳遞與計算得到[27],并且抽樣得到狀態模式序列{zt}1:T.
(3) 抽樣系數矩陣Θ(zt).在給定狀態模式序列{zt}1:T和交通密度序列{ρt}1:T的條件下,系數矩陣的最優后驗分布可以應用變分貝葉斯學習進行計算[26],交通波動速度的后驗分布為
p(ω(k)|ρ(k),Σ(k),zt=k)∝
p(ρ(k)|ω(k),Σ(k),zt=k)p(ω(k),zt=k)
(14)
(4)抽樣轉移矩陣π.在有限狀態的HMM中,k個狀態之間的轉移矩陣為π的先驗分布為Dirichlet分布[29].
p(π|β,k)~Dir(β/k,…,β/k)
(15)
式中:Dir(·)表示Dirichlet分布;β為超參數.
在給定狀態模式序列{zt}1:T的條件下,序列中k個狀態模式出現次數表示為{n1,…,nk}.轉移矩陣π的Dirichlet分布的后驗分布為[19]
p(π|β,k,z1:T)∝p(z1:T|π)p(π|β,k)∝
Dir(β/k+n1,…,β/k+nk)
(16)

(17)
式中:δ(·)為Kronecker delta函數.
綜上所述,Gibbs分塊抽樣算法流程見圖6.

圖6 Gibbs分塊抽樣算法流程Fig.6 Gibbs block sampling algorithm
交通流再現實驗的Gibbs分塊抽樣算法流程如下:

(2) 分塊抽樣:設置n=1,…,N,計算





本論文采用NGSIM(NG)數據集[16]中的Peachtree Street的交通流數據. Peachtree Street的數據包括2個以15 min為1個時段的數據集合,分別是12:45~13:00和16:00~16:15.本文選取16:00~16:15時段的數據.如圖7所示,因為由北向南方向的路段上下游交叉口之間不存在與其他道路相交的路口,所以選取圖中路段和下游交叉口作為研究交叉口和路段.另外,根據選取時段的交通流特征,將交通狀態模式劃分為4個模式,見圖3.以5 s為1個時段統計交通流的狀態模式,交通流密度,上下游到達和離去的交通流量(去除交通流量為空的時段)隨著時段順序變化的結果見圖8.

圖7 實驗選取路段與離散化表示Fig.7 Selection and discrete representation of road section
同時可以統計得到4種交通狀態下的密度-流量關系圖,見圖9.在交通控制條件下,密度-流量的關系很難通過單一的波動速度的參數模型描述,如CTM模型[23-24].所以本文提出利用非參數模型,建立波動速度的分布.根據統計的交通流量和交通密度計算得到4種交通狀態波動速度,速度的累計頻率結果見圖10中柱狀圖.利用高斯分布對4種狀態的波動速度分布進行擬合,擬合結果見圖10中實線曲線.

a 交通狀態模式序列

b 交通流密度

c 到達離去交通流量圖8 NGSIM交通流數據統計結果(5 s記為1個時段)Fig.8 NGSIM traffic data statistics(Time interval 5 s)

圖9 交通密度-流量關系圖Fig.9 Flow versus density
將統計集合中的上下游到達離去的交通流量作為觀測數據,設置算法1最大計算次數為2 000步,進行實驗計算得到的結果,見圖10和圖11.因為本研究采用的是非參數的建模方法,所以實驗再現的計算結果為交通流密度和交通流波動速度的分布.其中,交通流密度分布為每個統計時段內交通流密度的高斯分布.交通流波動速度為數據集集合整個時段內的分布.
對比再現的交通流密度與現實統計數據可以得到以下結論:現實的交通流密度包含在每一個時段分布的95%置信區間組成的序列數據空間之內,見圖11b、d灰色區域.可以認為現實交通流是一系列分布的一個特殊的抽樣.因為滿足同一個分布,所以在序列分布的每一次抽樣結果都可以被認為是在該條件下的近似交通流.

a 模式Ⅰ

b 模式Ⅱ

c 模式Ⅲ

d 模式Ⅳ圖10 交通流波動速度實驗再現結果與統計值、擬合分布對比Fig.10 Comparison of experiment result of shockwave speed,statistic value, and fitting distribution

a Cell(2)交通流密度分布

b Cell(2)均值和置信區間與觀測值對比

c Cell(3)交通流密度分布

d Cell(3)均值和置信區間與觀測值對比圖11 交通密度實驗再現結果(5 s記為1個時段)Fig.11 Experiment result of traffic density
推斷得到交通流波動速度的分布見圖10中虛線曲線.對比推斷交通流波動速度分布與現實統計數據的擬合分布,可以得出以下結論:不同狀態模式下,交通流波動速度的均值較為接近,可以作為波動速度的再現近似分布.其中,由于該數據集合的狀態模式Ⅰ的數據量相對其他方式較大,所以,狀態模式Ⅰ下的分布最為接近.其他模式下的分布的均值較為接近,方差相對較大.本研究提出的實驗方法中的經驗模型還需要大數據樣本觀測提升精度.
利用實驗推斷的交通波動速度的高斯分布產生50組數據與NGSIM的數據進行對比,兩組數據的分位數對比分析見圖12.圖中絕大部分的點都分布在一條直線的兩側,所以認為兩組數據近似地來自于同一個分布,所以本文提出的實驗方法推斷的高斯分布可以作為交通波動速度分布的近似分布.

a 模式Ⅰ

b 模式Ⅱ

c 模式Ⅲ

d 模式Ⅳ圖12 交通波動速度實驗再現結果:推斷分布抽樣值與NG統計值的分位數對比分析Fig.12 Experiment result of shockwave speed: Normal quantile-quantile plot
本研究在交通流實驗系統的框架下,提出通過觀測數據,虛擬環境再現現實環境交通流的實驗方法.該實驗方法首先定義了非參數化的交通流模型,在此基礎上定義了現實交通流再現的優化問題,應用變分貝葉斯學習給出該問題的近似解作為交通流再現的近似解.隨后,選擇信號控制交通流為研究對象,建立了信號控制交通流宏觀特征參數再現的實驗框架,利用實際數據對本文提出的實驗方法進行驗證.其結果表明,在考慮特定的觀測條件下,本文提出的再現實驗方法可以近似地再現現實信號控制交通流的密度和波動速度;此外,該方法可以獲得參數的分布特征,該特征更適應于描述不確定性的動態交通流的特征.利用本研究實驗計算得到的交通流參數分布,可以進一步對交通流進行模擬、預測等.本研究提出的實驗方法,同樣適用于連續流的情況,建立的信號控制交通流再現的實驗框架模型,可以替換成連續流的模型.
本研究是對實驗交通工程學理論和方法的初步探索,提出的方法在未來的研究中需要在以下幾個方面進一步提升:①提出的交通流參數屬于宏觀特征參數,需要進一步選取微觀參數作為描述交通流的演變特征,同時考慮觀測數據的多樣性條件;②提出的交通流路網模型較為簡單,需要考慮建立不同管理條件下的路網可變結構模型;③計算結果為推斷交通流參數的近似分布,需要在此基礎上對數據的潛在影響進行進一步挖掘和分析,并且需要在“大數據”環境下進行測試,提升計算的精度和效率.