朱海川,徐玉靜
(山東科技大學 測繪科學與工程學院,山東 青島 266590)
當人們在行駛過程中,多不會選擇信號燈多的路口通行,因為在信號燈控制下的路口所花費的時間基本上占整個行駛時間的30%以上[1],因此許多專家和學者把信號交叉口延誤作為通行效率高低和信號燈服務水平高低的重要評價指標,在某種程度上反映了資源消耗情況,也反映了信號控制設計是否合理,為城市規劃建設提供重要依據[2,3],因此對信號交叉口延誤的計算研究具有重要意義.
自Webster提出信號交叉口延誤以來[4],相關研究人員一直尋求更好的信號交叉口延誤計算方法或模型,主要歸納為點樣本調查法、參數公式法、模擬仿真法[5].對于點樣本調查法,Limanond等[6]通過對兩個物理條件相同的信號交叉口(信號燈是否有倒計時為不同條件)進行連續24 h監控,結果表明有倒計時的信號交叉口的延誤平均減少1.00~1.92 s;孫劍,等[7]提出以每個信號周期為計算單元的基于兩個檢測截面交通參數的“總體抽樣”車輛引道延誤方法.點樣本法是通過真實情況的實測,不受樣本錯誤或遺漏的影響,能夠比較真實地反應信號交叉口的延誤情況,但是獲取大樣本數據要耗費較多人力和財力,不適用于大樣本的信號交叉口延誤的獲取.對于參數公式法,HCM2010延誤模型[8]通過流率、暢行速度、綠信比等參數計算信號交叉口延誤,該模型是通過數學公式實現延誤;黃崇超等[9]在已知信號交叉口處的車輛排隊長度和車流到達率的情況下,利用信號周期、平均排隊長度和流率等參數獲取信號交叉口延誤值.參數公式法是在特定參數假設的基礎上完全通過數學公式計算信號交叉口延誤,面對更新較快的復雜混合交通情況和眾多隨機因素的影響,有時難以反映真實情況.信號交叉延誤模擬仿真主要有Vissim、Paramics和SimTraffic等,是通過軟件模擬車輛經過信號交叉口的全過程,調整交通參數分析不同的模擬方案從而得到接近真實的結果[10].模擬仿真方法能較真實地反映和重現信號交叉口的交通情況[11],但是必須通過設定交通和車輛特性參數才能保證延誤精度.
在信號交叉口延誤模型的發展過程中,車輛通過信號交叉口的延誤分析或延誤模型基本上都沒有大的變化,多為根據當時實際交通情況的需要對原有的方法或公式進行修正,讓使用的相應方法或公式獲取的結果更加接近現場實測的數據.隨著浮動車技術在智能交通系統中應用越來越廣泛,信號交叉口又是智能交通系統監控的主要對象,因此浮動車采集的數據可為信號交叉口延誤的計算提供真實可靠的數據源,利用大樣本浮動車數據計算信號交叉口延誤的研究正廣泛的深入[12,13].
浮動車數據具有全天候、高覆蓋率、低成本、實時性等優點[14],可以將浮動車數據作為大樣本數據應用到信號交叉口延誤計算中,但是在計算過程中牽扯到大規模矩陣計算,計算速度慢,執行效率低,因此在保證精度的前提下通過并行化的方式進行加速,以期縮短執行時間提高執行效率.
根據信號交叉口延誤定義,以浮動車作為信號交叉口延誤的數據源,信號交叉口的延誤的影響范圍和浮動車的暢行速度是獲取信號交叉口延誤值的決定因素.

圖1 信號交叉口影響范圍 Fig.1 The influence of Signalized intersection
根據信號交叉口檢測器的距離設定和城市道路的相關法律法則以及對信號交叉口影響范圍的調查,一般情況下,信號交叉口的影響范圍L的設定距離為140~180 m[15,16].
信號交叉口影響范圍的界定也要根據實際情況而定,本文以北京市的信號交叉口為研究對象,考慮到信號交叉口處的車輛實際排隊長度,結合信號交叉口影響區域范圍的標準,本文選取信號交叉口的影響范圍L=180 m,以信號交叉口轉角緣石曲線端點為始點,并以車輛行駛的方向為轉向,設定信號交叉口的影響范圍L=180 m,如圖1所示.
計算信號交叉口延誤值的另一個關鍵是獲得浮動車經過信號交叉口的暢行速度,雖然浮動車在不同類型道路上的暢行速度不同,根據我國城市交通規定[15],信號交叉口范圍內的暢行速度V暢如表1所示,信號交叉口范圍內的暢行速度V暢依據我國城市交通規定的速度設定.

表1 城市道路設計車速
當浮動車非右轉狀態下通過信號交叉口時,浮動車不僅要行駛L的距離,還有通過導流線包圍的區域l″,則在整個信號交叉口影響范圍內行駛的距離L″等于L+l″.在信號交叉口范圍的某個弧段的距離較小,其速度的變化率幾乎為零,認為車輛行駛的距離與速度呈線性正比關系,浮動車通過信號交叉口范圍的處理過程如圖2所示,浮動車在駛入信號交叉口和駛離信號交叉口時遵循公式(1)和公式(2).
(1)
(2)

圖2 信號交叉口范圍的起終點的浮動車數據處理流程 Fig.2 Signalized intersection range of the end point of the floating car data processing flow
由公式(1)、(2)可以推出的結果:
(3)
公式(1)、(2)、(3)中,Ts、Te為浮動車駛進、駛離信號交叉口影響范圍的時刻,Ts1、Ts2為浮動車駛進信號交叉口時的臨近上下游時刻,ls1為Ts1與Ts時間段內浮動車行駛的距離,ls2為Ts2與Ts時間段內浮動車行駛的距離,Te1、Te2為浮動車駛離信號交叉口時的臨近上下游時刻,le1為Te1與Te時間段內浮動車行駛的距離,le2為Te2與Te時間段內浮動車行駛的距離.
由公式(3)知,Ts1、Ts2、Te1、Te2可有浮動車數據獲得,ls1、ls2、le1、le2可有浮動車的經緯度坐標獲取.以(xs,ys)和(xe,ye)表示為Ts、Te時刻浮動車在信號交叉口弧段處經緯度坐標,(xs2,ys2)為Te2時刻浮動車的坐標,(xe2,ye2)為Te2時刻浮動車的坐標,則浮動車經過信號交叉口時的延誤值d計表示為:
d計
(4)
2012年03月01日的浮動車數據約有1561萬條軌跡,浮動車數據隨方位角、瞬時速度、時間分布和采集時間間隔變化分布如圖3、圖4、圖5、圖6所示.圖3中橫坐標為浮動車方向角,圖4中橫坐標為浮動車瞬時速度(m/s),圖5中橫坐標為時間,圖6中橫坐標為時間間隔(s),豎坐標均為浮動車數據軌跡數目.從圖3中看出,浮動車的行駛方向是相對均勻的,從圖4看出,浮動車速度多在10-15 m/s之間,從圖5看出,浮動車數據多在7∶00-9∶00和17∶30-19∶30時間段,從圖6看出,浮動車的數據采集時間間隔多在10-40 s之間.為了獲取更加準確的信號交叉口延誤值,要充分考慮數據的真實可靠性,因此,選用分布在8∶00-9∶00時間段內、采集時間間隔為10-40 s之間和浮動車瞬時速度為10-15 m/s的浮動車數據.

圖3 浮動車行駛方向分布圖 Fig.3 The direction of floating car

圖4 浮動車速度分布圖 Fig.4 The speed of floating car

圖5 浮動車數據的時間分布 Fig.5 The change of data volume of floating car with time

圖6 浮動車數據采樣時間間隔分布 Fig.6 Distribution of data sampling interval of floating car
Hama作為Hadoop項目的服務于大規模的矩陣、圖論和網絡計算的子項目,它是建立在Hadoop平臺之上的,利用Hadoop平臺的分布式存儲系統HDFS(Hadoop Distributed File System,Hadoop分布式文件系統)[12],提供基于BSP(Bulk Synchronous Parallel,整體同步并行)模型和graph模型的計算框架.
利用大樣本浮動車數據計算信號交叉口延誤的運行效率關鍵在于信號交叉口數據與浮動車數據矩陣的運算效率[17].在早期Hama框架中,矩陣數據主要存儲在建立在HDFS之上的HBase數據庫中,HBase中數據是面向列進行存儲的,HBase是以列的方式進行存儲,對其row-key的設計較為復雜.現如今,數據以二進制序列化的
理論上Vissim模擬仿真可以獲取任意時間的信號交叉口延誤值,而且結果更加接近實地調查值[20],由于受到數據和時間的限制,本文并未獲得實地交叉口延誤調查值,而是選用Vissim模擬仿真獲取的延誤值作為信號交叉口延誤實際值.隨機抽取20個以本文方法獲取的信號交叉口延誤的計算結果與Vissim模擬仿真獲取的信號交叉口延誤實際值對比,具體結果如表2所示,表2中T實、d實為浮動車通過信號交叉口的實際運行時間和實際延誤值.

表2 信號交叉口計算結果

續表2

圖7 信號交叉口延誤實際值與計算值對比 Fig.7 Comparison of actual value and calculated value of signalized intersection delay

圖8 信號交叉口延誤相對誤差 Fig.8 The ARE distribution of signal intersection delay
由圖7、圖8可知,以浮動車數據為數據源的基于Hama并行分布式平臺的信號交叉口延誤的計算值與信號交叉口延誤實際值十分接近,有些信號交叉口延誤的計算值與實際值基本吻合,計算值的相對誤差在15.6%以內,計算值的精度大于84.4%,使用浮動車數據獲取的信號交叉口延誤值精度較高,浮動車數據的信號交叉口延誤能真實反映延誤情況.
實驗運行環境:使用VMware Workstation 11設置7個虛擬機部署Hama環境,其中1個作為管理節點,6個作為計算節點;以16G內存、Intel(R)Core(TM)i5-2410M CPU @2.30GHZ的處理器作為宿主機;JDK-7u79的java環境;apache-hadoop-2.6.0版本的hadoop環境;apache-hama-0.7.0版本的hama環境.

圖9 實驗運行時間對比 Fig.9 comparison of running time

圖10 集群加速比 Fig.10 cluster speedup
以Hama集群實現大樣本浮動車數據的信號交叉口延誤計算,Hama集群中配置6個計算節點,數據容量分別為100 M、300 M、500 M、700 M、900 M、1100 M、1300 M、1500 M,運行結果如圖9、圖10所示.從圖10可知,當浮動車數據量較小時,計算節點的加速比并不理想,集群的加速比是隨著數據量的增加或計算節點的增多而增大,以6個計算節點為例,數據容量為1500 M時,集群的加速比是單機版的9.3倍,在一定Hama集群規模下,Hama集群實現大樣本浮動車數據的信號交叉口延誤計算具有良好的性能.在理想情況下,Hama集群的加速比與計算節點的數目呈現正比線性關系,但是在實際應用過程中,由于數據加載、數據分隔、網絡通信、數據信息傳輸等因素影響Hama性能[22].
本文在分析浮動車數據的信號交叉口延誤方法的基礎上,通過界定信號交叉口影響范圍和車輛經過信號交叉口的暢行速度等參數,在并行分布式Hama集群上對其進行并行化實現來提高處理效率,結合北京市主要信號交叉口的延誤值,以Vissim獲取的信號交叉口延誤的真實值與以浮動車數據進行計算而得到的計算值作對比,并分析信號交叉口延誤的精度和獲取的效率情況.Hama并行分布式實現的大樣本浮動車數據的信號交叉口延誤計算,計算結果的精度在84.4%以上,以6個計算節點為例,集群執行效率是單機版的9.3倍,延誤值不僅具有良好的精度,而且對其的計算效率具有顯著提高,對實際應用具有一定的意義.
參考文獻:
[1]劉巖.考慮車輛運動行為的信號交叉口延誤研究[D].吉林大學,2016:1-7.
[2]劉好德.城市道路交通狀態信息服務系統設計與實現[J].測繪科學,2012,37(6):169-171.
[3]賴元文,S EASA.信號交叉口通行能力隨機影響因素建模[J].中國公路學報,2016,29(11):130-138.
[4]Webster F V.Traffic signal settings[R].Road Research Technical Paper No.39,Road Research Laboratory,London,1958.
[5]陳紹寬,郭謹一,王璇,等.信號交叉口延誤計算方法的比較[J].北京交通大學學報,2005,29(3):77-80.
[6]Limanond T,Chookerd S,Roubtonglang N.Effects of countdown timers on queue discharge characteristics of through movement at a signalized intersection[J].Transportation Research Part C Emerging Technologies,2009,17(6):662-671.
[7]孫劍,潘斌,李克平,等.非飽和信號控制交叉口動態延誤測定方法[J].同濟大學學報(自然科學版),2011(7):1007-1012.
[8]Transportation Research Board.Highway Capacity Manual[M].Washington DC:National Research Council,2010.
[9]黃崇超,于剛.交叉口延誤函數與實時信號配時優化模型[J].武漢大學學報(工學版),2006,39(5):71-76.
[10]Essa M,Sayed T.A comparison between PARAMICS and VISSIM in estimating automated field‐measured traffic conflicts at signalized intersections[J].Journal of Advanced Transportation,2016,50(5):897-917.
[11]周志浩,葛歡.基于VISSIM仿真的信號交叉口優化方法研究[J].交通標準化,2013(2):134-137.
[12]王凱,曹建成,王乃生,等.Hadoop支持下的地理信息大數據處理技術初探[J].測繪通報,2015(10):114-117.
[13]張希瑞,方志祥,李清泉,等.基于浮動車數據的城市道路通行能力時空特征分析[J].地球信息科學學報,2015,17(3):336-343.
[14]余洋.云計算環境下的大樣本浮動車數據處理關鍵技術研究[D].武漢大學,2010:16-24.
[15]中華人民共和國建設部.GB 50220-95.城市道路交通規劃設計規范[S].中國計劃出版社,1995.
[16]Siddique K,Akhtar Z,Yoon E,et al.Apache Hama:An Emerging Bulk Synchronous Parallel Computing Framework for Big Data Applications[J].IEEE Access,2016,PP(99):1.
[17]李清泉,李德仁.大數據GIS[J].武漢大學學報(信息科學版),2014,39(6):641-644.
[18]蘇韋,李景文,劉華堯,等.基于MapReduce的時空數據模型設計方法[J].測繪與空間地理信息,2013,36(7):41-44.
[19]Essa M,Sayed T.A comparison between PARAMICS and VISSIM in estimating automated field‐measured traffic conflicts at signalized intersections[J].Journal of Advanced Transportation,2016,50(5):897-917.
[20]Lai S,Lai G,Lu F,et al.A BSP model graph processing system on many cores[J].Cluster Computing,2017:1-19.