管星宇,潘義勇
(南京林業大學 汽車與交通工程學院,南京 210037)
交通流基本圖模型是交通流理論的基礎,表征了交通流3個基本參數之間的關系:交通流量(輛/h)、速度(km/h)和密度(輛/km)。交通流速度-密度關系基本圖模型包括確定基本圖模型和隨機基本圖模型,對交通流基本圖的深入挖掘有利于在交通狀態識別、交通擁堵分析等領域發揮重要的作用[1-3]。
針對速度-密度關系確定基本圖模型研究,Greenshields等[4]提出開創性的速度-密度線性模型,其缺點是在密度值較大或較小時,模型的效果變差。為了克服這個缺點,Greenberg對數模型[5]、Underwood指數模型[6]和Northwestern指數模型相繼被提出[7],這些模型都是單階段確定性模型。單階段確定性模型采用最小二乘法進行參數擬合,對數據集的分布特征要求較高;模型采用一條曲線表征速度-密度關系,忽略了交通流異質性對速度-密度關系的影響[8]。
針對速度-密度關系隨機基本圖模型的研究,Muralidharan等[9]、Jabari等[10]和Fan等[11]分別針對Triangular模型、Newell模型和Aw-Rascle-Zhang(ARZ)模型推導出速度概率分布函數和密度關系模型,但是該方法只適用于特定模型,不能推廣到其他交通流模型。Qu 等[12]提出基于不同分位點構建的交通流速度-密度關系基本圖模型,既解決了模型的適用性問題,又能反映交通流異質性對速度-密度關系的影響,但是不能獲得速度-密度關系的概率分布特征。
本文采用隨機參數線性回歸獲得速度-密度關系隨機基本圖模型,隨機參數線性回歸在交通領域已經有了很多的應用[13-14],該方法通過獲取變量系數的隨機概率分布特征,反映出交通流異質性對交通流速度-密度關系的影響,這是本文研究的出發點。首先,基于隨機參數線性回歸建立交通流速度-密度關系隨機基本圖模型;其次,利用隨機參數線性回歸對實際交通流數據進行速度-密度關系進行參數擬合;再次,對隨機參數進行假設檢驗和誤差分析,并對結果進行數值分析;最后,總結了本文的研究成果以及進一步研究的方向。
隨機參數線性回歸是計量經濟學中常見的數據分析方法[15],現已獲得了廣泛的應用,其基本的定義為:
yn=βn·xn+εn。
(1)
式中:yn、xn分別為連續型因變量和自變量數據;εn為服從正態分布N(0,σ2)誤差項;βn為解釋變量的隨機系數,隨著觀測值的不同而變化,函數形式為:
(2)

隨機參數的求解是基于Halton序列模擬極大似然估計[13],Halton序列是一種為數值方法產生頂點的系列生成算法。
將隨機參數線性回歸與傳統確定性交通流模型相結合構建隨機交通流速度-密度基本圖模型,以Greenshields線性模型為例,所建立的隨機交通流速度-密度模型可以表示為:
vn=an-bn·kn。
(3)
(4)
式中:n為觀測數據索引值;an=(vf)n為隨觀測值隨機變化的自由流速度;bn=(vf/kj)n為自由流速度與堵塞密度的比值,kn為第n個觀測數據的交通流密度值。
非線性兩參數模型的隨機建模思想是通過對速度、密度數據進行相應的對數、冪指數變換,將非線性模型轉換成線性模型進行參數求解。表1為基于隨機參數線性回歸的速度-密度關系隨機基本圖模型。

表1 隨機參數交通流速度-密度基本圖模型
TransGuide是德克薩斯州圣安東尼奧市的先進交通管理系統,是基于環形探測器和攝像機檢測每20 s所有通過車輛的信息[16],包括車輛的速度、20 s的交通流量以及每輛車通過檢測器的時間。通過TransGuide系統選取單向三車道I-10州際公路(中間車道,傳感器識別號:L2-0010E-562.581)的非開源交通流數據進行分析。
(5)
k=ο/(l+d)。
(6)

通過對數據的篩選,獲取3 256對速度-密度數據。表2為不同密度值對應的速度分布偏度(Skewness)系數值(Skewness=0表示對稱分布,Skewness<0表示左偏分布,Skewness>0表示右偏分布),結果表明:k=5.03輛/km,速度服從正態分布;k∈[7, 38],對應速度服從左偏分布;k∈[40, 91],對應速度主要服從右偏分布。圖1選取了3種不同的概率分布形式,隨著密度值的增加,概率最高點的速度值呈現遞減趨勢,速度概率分布逐漸由右偏向左偏過渡。表2和圖1的信息說明在實測的交通流數據中,由于交通流異質性的影響,不同密度值對應的速度是隨機的,采用隨機參數線性回歸方法可以反映出速度-密度的隨機特性。

圖1 不同密度下的速度分布圖

表2 密度分布Skewness系數
利用LIMDEP 11軟件對表1中交通流速度-密度基本圖模型進行固定/隨機參數擬合。固定參數模型擬合使用最大似然估計法來求解參數值,隨機參數模型通過模擬Halton序列最大似然估計法求解隨機參數值[11],考慮計算時長和計算精度,Halton draws值設置為200。表3為固定/隨機參數擬合結果,表3中a為常系數、b為自變量系數,4個模型的參數a、b含義與表1一致。隨機參數線性回歸假定選取的隨機參數符合正態分布,并從3個角度進行數值實驗:a隨機-b固定、a固定-b隨機、a隨機-b隨機。表3中小括號內數值表示隨機參數的標準差,方括號內數值表示參數假設檢驗的P值,從表3中P值結果表明,固定/隨機參數模型的擬合結果較好。表4為固定/隨機參數模型的赤池信息準則值(AIC),AIC值越小說明模型的擬合優良性越好。

表3 固定/隨機參數擬合結果
對擬合得到4個隨機參數交通流速度-密度基本圖模型(a隨機-b隨機)進行平均絕對誤差分析(MAE),圖2—圖5為隨機參數模型的擬合值和實測值的散點圖,圖中紅色圓點表示觀測值散點圖,藍色圓點表示隨機參數模型擬合值的散點圖,綠色曲線表示固定參數擬合曲線圖,FP_MAE表示固定參數得到的MAE值,RP_MAE表示隨機參數得到的MAE值。
(1)隨機參數交通流速度-密度基本圖模型較固定參數模型擬合效果好。從模型的擬合精度角度分析,表4的固定/隨機參數模型AIC值揭示了2種現象:第一,與傳統的固定參數回歸模型AIC值相比,a固定-b隨機、a隨機-b隨機所得到的隨機參數回歸模型AIC值較低,擬合精度較高;第二,a隨機-b固定得到的AIC值比固定參數回歸模型AIC值更高,擬合精度最低。從模型的誤差角度分析,隨機參數回歸模型(a隨機-b隨機)的MAE值低于固定參數回歸模型的MAE值,4個隨機模型的MAE值分別降低了57.04%、81.30%、74.48%和52.27%,由圖2—圖5可以看出,與固定參數回歸得到的確定性曲線不同,隨機參數回歸模型可以得到不同密度值下的隨機速度分布,在密度值大于20輛/km時,隨機參數模型的速度擬合值與真實觀測值基本一致。

表4 固定/隨機參數模型AIC值

圖2 隨機Greenshields模型擬合值

圖3 隨機Greenberg模型擬合值

圖4 隨機Underwood模型擬合值

圖5 隨機Northwestern模型擬合值
(2)隨機參數線性回歸方法通過參數標準差反映交通流異質性對速度的影響,以Greenshields模型為例,表1中固定參數Greenshields模型表達式為:v=71.493 2-0.633 06·k,固定參數模型得到一條擬合曲線來表征I-10數據集的速度-密度變化特征,反映了不同密度的速度均值變化,無法體現出交通流異質性對交通流的影響。而隨機參數模型將交通流中人、車、路和環境的異質性對交通流的影響用概率分布的形式體現出來,隨機參數Greenshields模型常系數vf服從均值為68.166 1,標準差為0.966 75的正態分布,自由流速度有95%的概率落在66.271 3~70.060 9;變量系數vf/kj服從均值為-0.432 60,標準差為0.222 72的正態分布,說明97.395%的變量系數值為負值,速度隨著密度的增大而降低,而2.605%的變量系數值為正值,表明在真實的交通流狀態下,由于交通流異質性的影響,速度有2.605%的概率會隨著密度的增大而增大。
(3)隨機參數線性回歸方法適用于不同的交通流速度-密度基本圖模型,不同的隨機參數交通流速度-密度基本圖模型對數據的擬合效果也不同。從擬合結果分析,通過對模型進行線性轉換,不同模型的常系數、變量系數結果完全不同,Underwood模型的常系數服從均值為4.227 41,標準差為0.002 70的正態分布,Northwestern模型的常系數服從均值為4.182 40,標準差為0.003 11的正態分布,相較于Underword模型,Northwestem模型對密度進行平方化處理后,得到的自由流速度降低,但是自由流速度變化的范圍增大。從擬合散點圖來分析,不同的模型得到了不同的速度擬合值,在密度值較高時,4個模型都表現出了良好的擬合精度,而受到模型自身特點的影響,4個模型在低密度狀態下表現出了不同的速度變化特點,Greenberg模型對密度進行了對數化處理,因此在低密度情況下,速度與密度對數化后的分布較為離散,低密度下得到的速度分布較為分散,比較貼近真實的數據分布;Northwestern模型在數據進行轉換后,低密度下的數據較為密集,因此其低密度下的速度值變化接近一條直線;而Underwood模型的數據經過轉換后的分布與Greenshields模型類似,因此,兩者之間隨機參數擬合得到的散點圖最為相似。
針對交通流速度-密度關系基本圖問題,引入隨機參數線性回歸建立隨機交通流速度-密度關系基本圖模型,數值實驗獲取隨機模型參數的概率分布函數,并進行了參數檢驗和誤差分析,數值實驗結果表明:與固定參數交通流速度-密度關系基本圖模型相比,隨機參數交通流速度-密度基本圖模型考慮了影響交通流的異質性因素,反映出交通流異質性對交通流速度-密度關系的影響;提出的方法為交通流基本圖隨機模型構建了一個方法論,可以與不同的交通流速度-密度關系基本圖模型相結合;隨機參數模型MAE值較低,擬合結果貼近于真實數據,可以考慮將隨機模型運用于交通流的建模和仿真中,提高仿真的維度和靈活性。本文提出的模型獲取的自由流速度變化范圍較小,無法反映低密度狀態異質性對交通流速度-密度關系的影響,進一步研究需要考慮數據不同分位區段的隨機交通流速度-密度關系分布特征。