段泓序



摘 要:通過實時采集交通數據,提取可以反映交通事故的特征,從而自動檢測交通事故加快相關部門采取措施,不但可以緩解由事故帶來的交通擁堵,也可以有效的減少環境污染和能源浪費。固定檢測器數據穩定、浮動車數據覆蓋率高,因此,結合兩種數據研究一種在城市道路上可以快速、及時有效檢測交通事故的方法是非常有必要的。本文首先針對人工播報的事故地點存在自然語言描述與空間地理信息系統描述的不一致性,設計了一種交通事故定位方法。然后在基礎維度、時間維度和空間維度對交通事故進行了屬性分析和提取,針對不同的道路交通運行情況選用不同的屬性集合,建立可以對異常點進行識別的孤立森林模型。最終設計了基于異常值得分的事故檢測算法。
關鍵詞:多源交通數據;交通事故檢測;孤立森林
中圖分類號:U491 文獻標識碼:A 文章編號:1671-2064(2019)09-0251-03
0 引言
城市道路交通事故不僅關系到人們的生命和財產安全,也關系到城市發展和社會長治久安,漸漸成為了政府和大眾關注的重點問題,世界各國對于交通事故檢測方法的研究投入了極大的精力。因此,將計算機技術應用在交通領域上,及時快速的檢測出城市道路上發生的交通事故,輔助相關部門及時啟動救援和交通疏導工作,成為了本文的研究內容。
浮動車數據覆蓋率高,上傳周期短,但是數據波動性大,固定檢測器數據雖然上傳周期沒有浮動車快,但是數據較穩定,而且測得的流量數據準確[1]。因此本文希望結合浮動車數據處理得到的路況數據、車輛行駛軌跡數據和由固定檢測器采集到的占有率數據,針對城市快速路研究并實現出一種基于多源交通數據的交通事故自動檢測方法。
1 相關工作
交通事故檢測的數據來源一般是各類固定檢測器和移動檢測器,通過對數據的處理分析,判斷是否發生事故。異常對象所具有的屬性值會明顯不同于數據集合的整體期望或其它數據的屬性值[2]。
常用的異常點檢測方法有基于統計、基于距離、基于密度和基于聚類的異常檢測方法等。基于統計的異常檢測算法在不同地點和不同時間分布的不一致,導致其使用存在局限性;基于距離和基于密度的異常點識別算法的時間復雜度在大數據量下較高;基于聚類的方法對于確定類別的個數和每個類之間數據量的大小確定比較困難[3]。通過對問題進行分析,本文確定了使用基于孤立森林的檢測模型來實時檢測交通事故。
2 方法
本文使用基于孤立森林模型的異常點檢測方法來檢測交通事故,需要對交通事故進行分析,確定事故檢測需要使用的屬性,通過歷史數據并結合提取出來的屬性集合,訓練好孤立森林模型并進行檢測,整體研究思路如圖1所示。
2.1 交通事故空間定位方法
首先根據事故文本播報信息中的地點信息對POI(point of interest)信息進行篩選,得到事故地點的中心坐標,對坐標進行地圖匹配,計算該坐標到路鏈的垂直距離,得到固定半徑范圍內的路鏈;對電子地圖內的所有單向行駛的路鏈,計算車流方向,獲取道路等級,組成POI索引表。
對于某一起播報信息,提取事故地點和車流方向;在構建的POI索引表中先查找事故地點,再根據車流方向和道路等級進行篩選,最終獲得匹配路鏈。
2.2 交通事故屬性分析
事故的發生會導致交通屬性指標產生變化,超過合理的波動范圍,本文從基礎屬性,時間屬性,空間屬性三個維度進行分析。
2.2.1 基礎屬性
當路鏈的歷史路況都是非擁堵狀態時,一旦發生交通事故,當前路鏈速度波動超過正常范圍,此時特征為當前路鏈速度vl,t。當路鏈的歷史數據都是擁堵狀態時,路鏈速度數據基本不產生波動,但由于當前路鏈發生事故,后繼路鏈由于車流量的減少速度呈現上升狀態,所以此時特征為后繼路鏈速度。
在交通流穩定的周期內,固定時間通過某條固定路鏈的出租車數目變化不大,屬性為nl,t。
未發生事故時,路鏈上下游占有率數據都保持穩定;發生事故后,路鏈上游因為車輛排隊造成擁堵使占有率變高,路鏈下游因為車流量的減少暢通使得占有率變低。當路況為非擁堵狀態時,提取屬性路鏈上游占有率和路鏈下游占有率;當路況為擁堵狀態時,路鏈上游占有率基本不會變化,但是下游占有率會因為車流量的減少而減小,所以只提取屬性。
2.2.2 時間屬性
在事故發生后,時間上表現為交通事故的持續時間。
測試選取了2017年6月的交通臺播報的事故數據共191條。將播報的事故定位到路鏈號,浮動車數據含有路鏈平均速度的路況數據,出租車軌跡數據和占有率數據。
模型會對每條交通數據計算異常值得分,圖2是一段道路100條數據的異常值得分情況,路鏈號以數字代替。
根據不同的異常值得分閾值判定部分FAR和DR對應關系如表1所示。在兼顧DR和FAR的值時,當異常值得分=0.5時,檢出率為86.3%,誤警率為1.3%。
4 結語
本文的方法不依賴數據的統計分布形式,且對于擁堵和非擁堵路況使用的屬性不同,最終得到檢測率87.3%,誤警率1.3%,因此可以認為本方法具有顯著的優越性與良好的適用性。未來若能考慮多方面因素設計出多道路類型的事故檢測方法,將進一步擴大事故檢測方法的使用范圍,同時可以考慮使用異質的交通數據,采用更深層次的融合來適應模型。
參考文獻
[1] 呂衛鋒,諸彤宇.給中國增一個驕傲——解析基于浮動車的動態交通信息服務系統[J].中國交通信息產業,2007(08):136-137.
[2] 余柳,于雷,戚懿,等.基于浮動車數據的城市快速路交通事件檢測算法研究[J].交通運輸系統工程與信息,2008,8(4):36-41.
[3] B.R.Preiss.Data Structures and Algorithms with Object-Oriented Design Patterns in Java[M]. Wiley,1999.