劉戎陽,郝妍熙,胡 華,劉志鋼,汪 濤
(1.上海工程技術大學 城市軌道交通學院,上海 201620;2.上海交通大學 船舶海洋與建筑工程學院,上海 200240)
交通事故多發點的識別方法主要分為數理統計和空間統計2類[1],早期應用廣泛的數理統計學方法有臨界事故率法、質量控制法[2]、經驗貝葉斯和全貝葉斯方法等[3],近些年空間統計方法如熱點分析[4]、核密度分析[5]、基于路網單元分析[6]等方法逐步流行。空間統計分析方法可視化效果較數理統計更好,并能從多角度挖掘交通事故的空間分布特征[7]。
黃鋼等[8]基于改進的密度聚類算法對無錫市交通事故多發點進行聚類,證明該算法的適用性;陸化普等[9]利用考慮路網的核密度分析方法和空間聚類分析方法,識別深圳市的事故多發點,并研究其分布特征;吳佩潔等[10]用時空立方體改進的熱點分析方法研究小樣本事故數據下中微觀尺度的事故多發點;Colak等[11]基于網絡空間權重的熱點分析識別土耳其里澤的事故黑點;蔣宏等[12]用非參數核密度估計的方法構建路網單元,并對路網單元進行基于空間自相關性的聚類分析;姜燕等[13]以核密度估計和計數數據模型為基礎,提出基于點模式和面模式的空間聚類分析模型。
然而,以上基于空間統計的事故多發點識別方法仍存在一些不足。其中,基于路網單元的事故多發點識別方法過于依賴城市路網數據,劃分路網單元沒有統一的合理標準[14],主觀性過強,單元內部的情況也無法識別;核密度分析方法識別結果較粗糙,只能模糊確定大致的事故地點;熱點分析、改進密度分析等空間聚類分析方法,受極值影響大,無法識別空間上相對獨立的事故多發點。
鑒于以上空間統計方法的不足,本文提出基于泰森多邊形的事故多發點識別方法,用泰森多邊形劃分空間統計單元,并補充相對獨立的事故多發點,最后對識別出的多邊形形狀進行修正,使其能更好地表示事故的實際區域位置。研究結果可為道路交通管理提供參考和借鑒。
本文數據來源于2018年江蘇省鹽城市122平臺的報警數據,數據總量為63 483起,包含報警時間、報警地點、報警類型、報警內容等13個字段信息,本文經過篩選后選取39 884起交警記錄為轉交通事故的報警數據。
本文選取百度API進行地理編碼,采用WGS84地理坐標系,經緯度保留小數點后6位,利用地理信息系統(GIS)進行二維可視化。由于部分事故點不在鹽城市行政區范圍內,因此用鹽城市行政區矢量圖對事故進行二次篩選,剔除非鹽城市行政區內的交通事故,得到39 824起數據,事故點分布如圖1(a)所示。統計各縣域行政區事故數量,結果如圖1(b)所示。從圖1中可看出,亭湖區事故數量最多,鹽都區其次,且事故主要集中在亭湖區和鹽都區交界處。
圖1 鹽城市事故分布情況Fig.1 Distribution of accidents in Yancheng
基于路網單元、滑動窗體的事故多發點識別方法主觀性強、適用性差,路網矢量數據較難獲取且處理過程復雜,因此熱點分析等空間聚類分析方法受更多學者的青睞。本文采用熱點分析方法識別事故多發點,距離法采用歐氏距離,空間關系概念化方法選擇反距離法,識別結果部分如圖2所示。
圖2 熱點分析結果Fig.2 Results of hot spot analysis
由于存在大量事故點重合,因此在進行熱點分析前需將重合點合并,轉換為加權點,權重為每個空間點的事故數量。加權后發現,存在極大值點,即部分點事故數量過大,相關參數如表1所示。由于部分極大值的存在,導致其它空間點的標準差偏小,最終致使熱點分析結果中的熱點數量偏少。同時,熱點分析在原理上存在一定缺陷,無法識別出相對獨立的高權重點,導致熱點數量進一步減少。本文所用數據中,存在部分權重大于100的空間點,沒有被識別為事故熱點,而部分靠近極大值的權重60左右的點卻被識別為事故熱點,這符合熱點分析原理,但顯然是不符合現實的。
此外,由于熱點分析識別出的結果為空間點,不是像基于路網單元、滑動窗體等方法結果為區域(面要素),而實際中的事故多發點應為熱點及其周圍的一小塊區域,因此熱點分析結果在實際中的應用效果不好,不能給出事故多發的區域。
表1 加權點相關參數Table 1 Related parameters of weighted points
由于上述熱點分析存在的固有問題,本文提出1種基于泰森多邊形的事故多發點識別方法。泰森多邊形是將離散事故點構成三角網,作三角形各邊的垂直平分線,將每個三角形的3條邊的垂直平分線的交點連接起來得到的多邊形。泰森多邊形可以表征離散點的數據,同時具有以下3個特性:
1)每個泰森多邊形內僅含有1個離散點數據。
2)泰森多邊形內的點到相應離散點的距離最近。
3)位于泰森多邊形邊上的點到其兩邊的離散點的距離相等。
由于以上特性,泰森多邊形可抽象理解為用離散點將空間平均劃分,且離散點越密集區域的多邊形面積越小,因此泰森多邊形的面積可一定程度表征離散點的密度[15]。同時,泰森多邊形能夠充分反映其內部點的特性。
傳統基于單元劃分的事故多發點識別方法,是將整個平面或者路網緩沖區按固定大小的單元(多為矩形)進行劃分,統計單元內的事故數量,以此來評價整個單元內部是否事故多發。泰森多邊形不同于傳統單元劃分方法,其形狀受離散點的分布而變化,每個多邊形內部僅含有1個空間點,其多邊形面積越小,則代表空間點分布越集中。交通事故往往在同一位置重復發生,同一空間點會存在多起事故,將同一空間點的事故數量轉換為權重之后,可用來識別事故是否多發,權重越大,面積越小,則事故越多發。由于引入權重,會出現權重大,面積也大的情況,因此還需對泰森多邊形進行形狀修正。圖3為本文所提出的基于泰森多邊形的事故多發點識別方法流程。
圖3 方法流程Fig.3 Method flow chart
將空間上重合點合并,并統計同一空間點上的事故數量,將其數量值賦值給空間點,由若干重合的事故事件點得到帶權重的空間點,對這些空間點構建泰森多邊形。計算構建的泰森多邊形的面積,并將空間點的事故數量賦值給多邊形。用多邊形內(包含邊界)的事故數量除以多邊形面積,即可表征事故的密度,但由于事故數量除以面積時,若面積取km2或m2為單位,會導致密度數值上非常小,不利于識別事故多發點。因此用多邊形面積除以事故數量來作為事故是否多發的評價指標,該值越大,即事故密度越低,事故發生越不頻繁,評價指標記為W。
存在部分空間點,此類點的權重值(事故數量)本身很大,即該地點發生大量交通事故,但是周圍沒有其他事故點,缺少約束從而導致構成的泰森多邊形面積過大,進而使W值過大,因此需要對此類點建立緩沖區來補充事故多發點。
篩選后仍存在多邊形面積過大的情況,為得到更精確的事故多發區域,需要對多邊形形狀進行修正。圖4為3種修正形狀的示意圖,其中多邊形為泰森多邊形,圓形為緩沖區,點為事故點。
在H2中剔除S2,剩余緩沖區生成后與多邊形集合相交,相交區域記為J,緩沖區面積為定值SH,多邊形面積為S0,相交區域J的面積為SJ,并對以下3種情況進行修正:
1)多邊形為細長條狀且不完全被緩沖區覆蓋,事故點周圍存在過近的相鄰點,從而導致多邊形面積過小的情況,可量化為SJ/S0 2)相交部分能覆蓋大部分多邊形,且緩沖區面積大于多邊形面積,意味著緩沖區能覆蓋大部分多邊形,可量化為SJ/S0≥k3且SH/S0≥k4,保留泰森多邊形作為事故多發點,如圖4(c)所示。 3)若均不滿足以上2種情況,則保留相交部分作為事故多發點。 以上3種修正后的圖形集合記為S3。 將H1,S2,S3合并,將其重合部分融合,得到最終的事故多發點S。 為方便進行分析,本文自制事故多發區域的主要道路矢量圖,最終得到的事故多發區域如圖5(a)所示,與熱點分析對比結果如圖5(b)所示。本文所提方法最終得到的區域形狀不一致且面積顯著較小,其他單元劃分方法結果的單元面積均較大,以路網單元劃分方法為例,路網單元的寬度往往在10 m左右,而長度往往取500,1 000 m等,其得到的事故多發區域相對粗糙,缺乏對比意義。熱點分析結果為點要素,能較好地體現事故點的空間分布規律,因此本文與熱點分析作為參考,對比事故多發點(區域)的空間分布,以證明本文所提方法的合理性和優勢。 根據圖5可得,基于泰森多邊形的事故多發點識別方法所識別出的事故多發點能較好地覆蓋熱點分析結果的熱點,同時能夠識別出熱點分析無法識別的事故多發點。圖6為熱點分析中存在問題的3種類型,其中點為事故點,區域為本文所鑒別出的事故多發點。類型1如圖6(a)所示,事故數量為1的點在熱點分析中由于接近極大值點,因此被判別為90%置信度熱點,顯然是不合理的,本文提出的基于泰森多邊形的事故多發點識別方法將2個點合并成1個區域,避免熱點分析因靠近極大值而誤判熱點的情況。類型2如圖6(b)所示,空間上相近的兩點,其單獨事故數量略少于其他熱點,但其總和遠大于部分熱點,由于在熱點分析原理上它們被單獨計算標準差從而不夠達到熱點標準,但本文所提出方法將其所在區域合并為1個事故多發區域,更符合實際情況。類型3如圖6(c)所示,該點事故數量大于部分熱點,但因為其周圍其他事故點較少,因此未被判為熱點。 單從熱點分析結果來看,由于北部存在較多高權重的事故點,中部點的權重值普遍沒有北部大,南部也存在少量高權重的點,因此導致北部熱點多,中部基本沒有熱點,南部少量熱點的情況。而基于泰森多邊形的識別方法補充中部地區相對獨立的事故多發點,同時因為權重最大值2 277的存在,使得其他點的標準差較小,此方法也補充了受極值影響而減少的事故多發點。 1)本文所提出的基于泰森多邊形的事故多發點識別方法能有效覆蓋熱點分析結果,能有效避免極值點的影響,充分體現事故多發點的空間分布特征。 圖5 最終事故多發點對比Fig.5 Comparison of final accident-prone locations 圖6 熱點分析存在問題的事故點Fig.6 Accident locations with problems in hot spot analysis 2)經修正后的多邊形面積較小,使事故多發范圍更為精確,能更有效地為道路交通安全管理提供依據。2.4 最終的事故多發點
3 方法應用與結果分析
4 結論