劉新月,謝文軍,尹成勝,陳金光,劉 璐,羅月童
城市交通事故的局部相關性可視分析方法
劉新月1,謝文軍1,尹成勝2,陳金光2,劉 璐1,羅月童1
(1. 合肥工業大學計算機與信息學院,安徽 合肥 230601;2.合肥市公安局交通警察支隊,安徽 合肥 230009)
交通事故數據蘊含有交通事故規律,如交通事故與天氣、時間、道路等因素的關聯規律,值得深入挖掘。雖然天氣、時間、道路等因素對交通事故均有影響,但對不同區域交通事故的影響不盡相同,即具有局部相關性。挖掘局部相關性能更好地揭示這些因素與交通事故之間的相關性。為此提出一套分析挖掘交通事故數據中所蘊含的局部相關性的方法。首先基于交通事故數據提取事故多發路段,每個事故多發路段包含有位置、時間以及相關的交通事故信息;然后提出一套聚類支持的局部相關性可視分析方法分析事故多發路段:①以待分析因素直方圖(如天氣直方圖、時間直方圖)刻畫事故多發路段;②基于直方圖相似性對事故多發路段進行聚類分析;③在多關聯視圖支持的交互環境中進一步觀察、分析聚類結果以挖掘待分析因素與交通事故之間的局部相關性。通過分析安徽省合肥市2015—2018年交通事故接警數據,取得了一些有意義的分析結果,驗證了該方法的有效性。
交通事故;可視分析;局部相關性;事故多發路段
隨著城市化進程的不斷推進,城市人口集聚度不斷增加,尤其是近年來汽車等交通工具的保有量的不斷增加,導致城市交通事故頻發。頻發的交通事故不僅造成巨額生命財產損失,也加劇城市交通擁堵程度,影響城市通行效率。因此如何預防和減少交通事故已成為城市管理者關心的重要問題之一。
隨著信息化及智能交通的普及,城市管理部門積累了大量基礎數據[1],其中包括各種交通事故數據,如安徽省合肥市一年的交通事故接警記錄數據約有60萬條。這些數據蘊含有交通事故的規律,通過深入分析和理解這些數據以掌握交通事故規律,進而對幫助城市管理者分析治理交通事故具有重要意義。
影響交通事故的可能因素眾多,如天氣、時間(是否周末、是否高峰期)、道路(車道數、岔路口數),準確掌握這些因素和交通事故的相關性是更深入分析交通事故的基礎。但很多因素和交通交通事故是局部相關的,簡單的全局統計分析難以揭示,圖1(a)是安徽省合肥市2015—2018年交通事故數據與天氣因素的統計結果,顯示天氣和交通事故無關,但對合肥市的部分路段進行統計卻得知雨天更易發生交通事故,如圖1(b)所示。揭示了局部相關性可對交通事故數據更深刻的理解、可給相關部門提供參考,因此本文研究發現交通事故數據中局部相關性的方法。

(a) 數據全集直方圖(b) 數據子集直方圖
局部相關性分析是數據挖掘中的重要問題[2],雖然學者已經提出很多自動方法,但主要還很依賴人的知識和經驗,如超參數選取等。可視分析通過交互將人的經驗、知識和判斷融入分析過程,能實現機器智能和人類智能有效互補[3],因此已經成為分析局部相關性的重要方法[4]。本文針對交通事故中的局部相關性問題,提出一套可視分析系統,在一系列自動分析功能的支持下,通過多個關聯視圖允許用戶快速發現交通事故數據中蘊含的局部相關性,從而回答諸如哪些路段雨天容易發生交通事故、哪些路段周末交通事故更頻發等具體問題,為相關部門進行更深入分析奠定基礎。
本文針對交通事故數據,研究基于可視分析方法揭示其內在局部相關性。可從交通事故可視分析和局部相關性分析2個方面介紹相關工作。
PACK等[5]設計了一組關聯視圖以可視化交通事故的空間、時間及高維屬性數據,主要提供交通事故數據的瀏覽功能;PIRINGER等[6]用可視化的方法直觀地展現所有時間的當前狀態、歷史狀態和預測的未來狀態,輔助用戶做決策,更好地處理交通事故;ANWAR等[7]提出一種可視化方法分析交通事故對交通擁堵的影響;FAN等[8]結合基于事件的可視分析和基于位置的可視分析方法,分析交通事故的發生情況和事故類型之間的關系,并試圖分析天氣和駕駛員特征的影響;ALOMAR等[9]評估不同可視化方法分析交通數據的效果。
上述工作證明可視化/可視分析可應用在交通事故數據瀏覽、輔助事故處理、多因素相關性分析等多個方面。本文采用可視分析并側重分析、挖掘交通事故中的局部相關性,有別于上述所有工作。
局部相關性在整個數據集中往往被掩蓋,只有在合適的數據子集上才能表現出來。子空間聚類方法常被用于自動分析局部相關性:常用子空間聚類方法包括PROCLUS[10],PreDeCon[11],CLIQUE[12],SUBCLU[13]等。但是,自動子空間聚類方法得到的結果往往高度冗余,并且難以解釋和理解。
可視分析通過可視交互界面將人類智能和機器智能相結合,有利于克服自動化方法的不足,已成為數據挖掘的重要方法,馬昱欣等[14]對相關工作做了詳細的綜述。在局部相關性分析方面:文獻[15]提出了對于自動子空間聚類結果的交互式可視化方案;TURKAY等[16-17]提出在數據空間與維度空間同時對高維數據進行探索;YUAN等[18]提出了層次化的交互式子空間可視分析方法;與文獻[14-18]缺乏引導、主要依賴用戶試錯探索不同,文獻[2]主動向用戶推薦可能存在局部相關性的內容,引導用戶分析,提高交互效率。本文方法也是交互局部相關性分析方法,但針對交通數據問題進行了專門設計。
本文所用交通事故數據為安徽省合肥市交通事故接警數據。所用數據已經去除人員信息、車輛信息等脫敏處理,主要用于交通事故方面的學術研究。
交通事故接警數據記錄車主的報案信息,如交通事故地點、時間、涉案車輛數、是否有人員傷亡等。本文選用2015—2018年的5 464 339條記錄,通過去除無效數據等數據清洗工作后,保留2 499 581條有效記錄。
原始數據包含事故發生的時間、地理位置、報警人性別、報警內容、車牌號等字段。因為本文主要關注交通事故的時空特性以及天氣影響,所以從原始數據中抽取時間、位置(文字描述、GPS)字段。交通事故接警數據中不包含天氣信息,從中國氣象網(http://lishi.tianqi.com/hefei/index.html)獲取氣候信息,并和交通事故接警數據相融合,見表1。

表1 本文所有交通事故數據的結構
基于事故發生率檢測事故多發路段是最常用方法之一,通常將事故發生率超過一定閾值的路段認定為事故多發路段[19]。本文亦采用基于事故發生率的閾值法檢測事故多發路段,其中事故發生率為

其中,(,)為路段在時間段內發生的交通事故數;||為路段的長度(單位為m);||為時間段的長度(單位為d)。

2.2.1 基于時空域掃描的事故多發路段檢測


圖2 時空域掃描過程示意圖

表2 事故多發路段的數據結構
經過和領域專家交流,本文所有實驗中各參數取值見表3。對安徽省合肥市512條主要道路的2015—2018年期間全部數據進行處理,共提取246 714條事故多發路段。由掃描算法可知,該數據有大量冗余,且所提取的很多事故多發路段會連接在一起,所以將對事故多發路段進行合并,消除冗余,盡量獲得距離更長的事故多發路段。

表3 事故多發路段掃描算法的參數取值
2.2.2 事故多發路段合并
事故多發路段合并遵循以下原則:
(1) 同一道路原則。只有屬于同1條道路的2個事故多發路段S和S才可以進行合并。
(2) 首尾相連原則。2個事故多發路段S和S的首尾間距小于給定閾值時,才對S和S進行合并。本文所有實驗中=10 (m)。
假設由1,2,···,S合并而得,且對應的時間段1,2,···,T并不一定總是相連的時域,所以將1,2,···,T合并成若干個不相連的時間段,即可能對應于多個時間段,如圖3所示。這種支持多時間段的表示方法有利于表示和發現交通事故周期性高發的路段,比如某個路段每年3月、6月、9月、12月4個月事故高發,但全年平均事故發生率并不高,則可用該表示法進行刻畫。

圖3 事故多發路段時間合并示意圖
用加權平均法計算的事故發生率,即

本文遵循KEIM[20]所提出的“Analyze First - Show the Important - Zoom, Filter and Analyze Further - Details on Demand”的分析范式。首先基于聚類技術初步分析用戶選定因素(比如天氣、時間)的局部相關性;然后在圖4所示多個關聯視圖中進一步交互分析。

圖4 系統整體界面圖((a) 地圖視圖;(b) 類簇視圖;(c) 統計視圖;(d) 詳細視圖)
整體界面如圖4所示,主要由4個關聯視圖組成:①地圖視圖基于地圖進行事故多發路段可視化,便于用戶直接觀察事故多發路段并與之交互(圖4(a));②類簇視圖提供矩陣布局和t-SNE投影布局2種方式對聚類結果進行可視化,用戶還可以通過一系列交互進一步操作和分析聚類結果(圖4(b));③統計視圖展示一組統計信息,并允許用戶用危險度等屬性過濾事故多發路段(圖4(c));④詳細視圖用表格展示事故多發路段的詳細屬性(圖4(d))。第4節的應用案例將展示圖4中4個視圖如何相互配合完成分析任務。本節介紹界面背后的相關方法和技術。
因為每個事故多發路段均對應一組交通事故數據()={1,2,···,a},每個變量a可代表事故多發路段在某條件下發生的一起事故,如分析事故多發路段與天氣的相關性時,()中各項可表示事故多發路段在各個天氣條件下發生的事故,且本文認為()={1,2,···,a}的分布能用于刻畫,所以當用戶分析某個因素(如天氣、時間)的局部相關性時,計算()={1,2,···,a}關于因素的直方圖((),),以此作為特征刻畫事故多發路段。如果因素是離散量,那么每個取值對應直方圖中的一個Bin,如果是連續量,則將的取值范圍劃分為若干個區間,每個區間對應一個Bin,則無論因素是離散量還是連續量,都可設={1,2,···,f}。因為不同事故多發路段對應交通事故的數目不盡相同,而本文主要關注的是交通事故的分布特性,所以通過對直方圖進行歸一化以消除交通事故數的影響,直方圖((),)的((),f)具體計算方法如式(3)。圖5(a),(b)分別表示安徽省合肥市徽州大道3 200~3 900 m路段關于天氣和時間周期的直方圖。

其中,(aj, fi)為判斷事故aj是否從屬于因素fi,從而對事故多發路段S中所有在因素fi下發生的事故累加求和,并最終進行歸一化處理得到S在因素fi下的直方圖Bin的值。
基于特征((),),本文采用層次凝聚聚類算法(hierarchical agglomerative clustering, HAC)[21]對事故多發路段進行聚類,初步分析因素和事故多發路段的局部相關性。選用分層聚類算法是因為無需指定類簇數目,且允許用戶在后續分析中交互地選擇合適的聚類粒度,能更好地發揮用戶善于進行探索分析能力的優勢。
聚類過程中,本文采用卡方法度量直方圖1和2之間的距離,如式(4)。也可采用任何其他合適的距離度量公式。

類簇是后續交互分析的主要對象,本文將從可視化、布局和交互方法介紹類簇。
3.2.1 類簇的可視化
和事故多發路段類似,本文采用直方圖(,)刻畫類簇,并用圖6雷達圖進行可視化表示:
(1) 直方圖特征編碼。雷達圖的軸對應直方圖的一個bin;
(2) 類簇大小的編碼。同時用雷達圖的大小編碼表示類簇的大小,用類簇包含的多發路段數表示其大小,即

其中,||為類簇包含的事故多發路段數;為基礎尺寸以防止||較小時雷達圖過小,本文設=1。
(3) 類簇事故發生率編碼。雷達圖的填充色表示類簇的事故發生率(),由式(6)表示。雷達圖采用半透明填充,以改進視覺效果,即

3.2.2 類簇的布局
本文支持2種布局方式:①行列整齊排列的矩陣布局法,如圖7(a)所示;②基于t-SNE投影的布局方法,如圖7(b)所示。

(a) 矩陣布局(b) 投影布局
2種布局方法各有優缺點:矩陣布局法整齊美觀,當類簇較少時,建議用戶采用;投影布局法能更好地表達類簇之間的相似性,適合類簇較多時采用。用戶根據需要可以在2種布局方式之間進行切換。
3.2.3 類簇的交互
本文主要支持以下4類交互:
(1) 粒度選擇。用戶通過滑動條調整聚類粒度,觀察聚類結果,選定合適的聚類粒度再深入分析。圖8展示了不同層次的聚類結果。

(a) 粒度7(b) 粒度12(c) 粒度16
(2) 選中操作。用戶雙擊類簇符號,則選中該類族,高亮顯示,同時圖4(a)和圖4(d)中只顯示該類族對應的事故多發路段。
(3) 合并操作。用戶按住鼠標將類簇′拖動至類簇的位置,則類簇′和將合并形成新的類簇。圖9(a)為合并操作的示意圖。
(4) 分裂操作。用戶用鼠標右鍵雙擊類簇的符號,類簇則分裂為′和。使用K-Means聚類方法將類簇所包含的所有事故多發路段分成2組,即′和。圖9(b)為分裂操作的示意圖。

(a) 合并(b) 分裂
本文基于地圖展示事故多發路段,提供基于線的可視化和基于符號2種可視化方式:
(1) 基于線的可視化。用沿道路的線段表示事故多發路段:線的起點、終點分別對應于事故多發路段的起點、終點;線條的寬度用于表征事故多發路段的時間跨度,具體映射關系如式(7);線段的顏色用于表示事故多發路段的事故發生率。該可視化方法能較好地展現事故路段的主要信息:時空信息和事故發生率。圖10(a)采用線可視化方式展示了2個事故多發路段。

其中,||為事故多發路段的時間跨度(天);為基礎尺寸以防止線段過細,本文所有實驗中=1。如圖10(a)中1比2的時間跨度大,則表示1的線段比較粗。
(2) 基于符號的可視化。本文采用和3.2.1介紹類簇的類似可視化策略可視化事故多發路段:用雷達圖表示事故多發路段的某個屬性(如天氣、周時間);雷達圖的大小表示事故多發路段的時間跨度,映射關系如式(8);顏色對應事故多發路段的事故發生率。用戶可指定符號放置在事故多發路段的起點、中點和終點處。圖10(b)采用符號可視化方式展示了2個事故多發路段。

其中,||為事故多發路段的時間跨度(天);為基礎尺寸以防止線段過細,本文所有實驗中=1。
(a) 線可視化

(b) 符號可視化
本文收集整理了安徽省合肥市的路網數據、2015—2018年交通事故接警記錄、氣象數據,利用本文方法分析了天氣和時間周期2個因素與交通事故的局部相關性。
一般認為雨、雪等惡劣天氣會引發更多交通事故,但事實上可能因為人們減少外出、小心駕駛,所以宏觀統計結果可能顯示惡劣天氣并未引發更多交通事故。是否不同路段的表現不一樣?本文試圖用系統挖掘出感興趣模式,然后對相關模式進一步分析。
因為需要分析天氣相關性,所以首先采用天氣直方圖刻畫事故多發路段,考慮“晴天、陰天、雨天、雪天”4種天氣,然后對所有事故多發路段進行層次聚類,完成初步分析,用戶在此基礎上進行交互分析。
用戶在圖4(b)中觀察聚類結果,此時采用矩陣排列法。首先交互選擇聚類層次(圖11),觀察到層次3時類簇數比較合理,且觀察到感興趣類簇,因此選定該層次,并進一步分析。觀察如圖12(a)所示感興趣類簇,發現其顯示雪天事故發生比例比較高,表明相應路段雪天易于發生事故。

(a) 層次1 (類簇數4)(b) 層次2 (類簇數8) (c) 層次3 (類簇數12)(d) 層次4 (類簇數16)

(a) 類簇A(b) 類簇A′
通過將圖4(b)切換到如圖13所示的投影布局模式,發現類簇周圍的幾個類簇,也是雪天占比很高,和比較類似;將,拖入A中進行合并,形成如圖12(b)所示的新類簇′。選中類簇′,在圖4(a)和圖4(c)中進一步觀察具體的事故多發路段。

圖13 投影模式類簇可視化
本文認為類簇'對應雪天易發事故路段,并將雪天事故比例最高的10條事故多發路段選擇出來(表4)。在圖4(a)中分別用2種方式可視化該10條路段,結果如圖14所示。

表4 雪天易發交通事故的路段
經領域專家觀察、分析結果發現:表4中路段的共同特點為南北走向。進而分析雪天當地風向多為北風,南北走向的路面更容易積雪結冰,且迎面的風雪更易影響司機的視線,所以該路段雪天更易發生交通事故。
在長期的生產實踐中,人類將時間按不同周期性方式進行組織,如一天24小時、一周7天、一年12個月。那么交通事故發生和時間周期是否相關? 和天氣類似,直接統計很難發現準確規律,所以本文以“周”為例,分析交通事故與時間周期的局部相關性。

(a) 線可視化
(b) 符號可視化
圖14 雪天易發交通事故的路段可視化
通過每周7天bin的直方圖刻畫事故多發路段。和4.1節中天氣相關性分析類似,本文獲得如圖15所示10個模式,其中模式顯示周六、周日事故高發,通過模式選中,系統將在圖4(b)和圖4(c)中展示相關事故多發路段,如圖16所示。觀察發現其中一條路為九華山路。九華山路是安徽省合肥市有名的美食一條街,本文推斷市民周末前往美食一條街消費,人流增加是引起交通事故增加的原因。

圖15 時間周期性模式

圖16 周六、周日易發交通事路段可視化
道路、車輛、天氣、時間等眾多因素均會影響交通事故的發生,但有些因素可能對不同區域/路段的影響不盡相同,即存在局部相關性。發現和理解這些局部相關性,有助于理解和掌握交通事故的規律,為交通事故防治工作提供依據。
本文試圖挖掘出交通事故數據中所蘊含的局部相關性,為此設計了一套可視分析方法,主要貢獻有:①提出基于事故多發路段的分析方法,和基于事故發生點分析方法相比,本文方法能從更高層次開展分析;②設計了一套聚類支持的多關聯視圖分析系統,在友好交互環境中半自動發掘局部相關性,充分發揮人類智能和機器智能的各自優勢;③對安徽省合肥市2015—2018年交通事故接警數據進行分析,取得了一些有意義的結論。
本文的分析方法考慮了交通事故的位置、時間和天氣,而交通事故還有事故類型、嚴重程度、道路情況等其他屬性,未來將更全面地考慮相關屬性,以便做出更深入、精細的分析;另外本文方法只支持單因素的局部相關性分析,而用戶可能需要聯合分析2個或多個因素,因此未來計劃研究支持多因素的聯合分析方法;本文目前采用“聚類+交互”的分析方法,雖然取得了不錯的效果,但學術界提出了很多其他局部相關性分析方法,未來將從中選擇更合適有效的方法來提升本文方法。
[1] ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: Concepts, methodologies, and applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2014, 5(3): 38.
[2] GüNNEMANN S, F?RBER I, VIROCHSIRI K, et al. Subspace correlation clustering: Finding locally correlated dimensions in subspace projections of the data [C]//Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. New York: ACM Press, 2012: 352-360.
[3] COOK K A, THOMAS J J. Illuminating the Path: The research and development agenda for visual analytics [M]. United States: National Visualization and Analytics Center, 2005: 4-5.
[4] 夏佳志, 張亞偉, 張健, 等. 一種基于子空間聚類的局部相關性可視分析方法[J]. 計算機輔助設計與圖形學學報, 2016, 28(11): 1855-1862.
[5] PACK M L, WONGSUPHASAWAT K, VANDANIKER M, et al. ICE-visual analytics for transportation incident datasets [C]//Proceedings of the 10th 2009 IEEE International Conference on Information Reuse and Integration. New York: IEEE Press, 2009: 200-205.
[6] PIRINGER H, BUCHETICS M, BENEDIK R. Alvis: Situation awareness in the surveillance of road tunnels [C]//Proceedings of the 2012 IEEE Conference on Visual Analytics Science and Technology (VAST). New York: IEEE Press, 2012: 153-162.
[7] ANWAR A, NAGEL T, RATTI C. Traffic origins: A simple visualization technique to support traffic incident analysis [C]//Proceedings of the 2014 IEEE Pacific Visualization Symposium.New York: IEEE Press, 2014: 316-319.
[8] FAN X, HE B, BRéZILLON P. Context-aware big data analytics and visualization for city-wide traffic accidents [C]//International and Interdisciplinary Conference on Modeling and Using Context. Heidelberg: Springer Press, 2017: 395-405.
[9] ALOMAR A, ALRASHED N, ALTURAIKI I, et al. How visual analytics unlock insights into traffic incidents in urban areas [C]//International Conference on Social Computing and Social Media. Heidelberg: Springer Press, 2017: 378-393.
[10] AGGARWAL C C, WOLF J L, YU P S, et al. Fast algorithms for projected clustering [C]//Proceedings of the ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 1999: 61-72.
[11] BOHM C, RAILING K, KRIEGEL H P, et al. Density connected clustering with local subspace preferences [C]// Proceedings of the 4th IEEE International Conference on Data Mining. Los Alamitos: IEEE Computer Society Press, 2004: 27-34.
[12] AGRAWAL R, GEHRKE J, GUNOPULOS D, et al. Automatic subspace clustering of high dimensional data [J]. Journal of Data Mining and Knowledge Discovery, 2005, 11(1): 5-33.
[13] KR?GER P, KRIEGEL H P, KAILING K. Density-connected subspace clustering for high- dimensional data [C]//Proceedings of the 4th SIAM International Conference on Data Mining. Los Alamito: IEEE Computer Society Press, 2004: 246-257.
[14] 馬昱欣, 曹震東, 陳為. 可視化驅動的交互式數據挖掘方法綜述[J]. 計算機輔助設計與圖形學學報, 2016, 28(1): 1-8.
[15] FARBER I, TATU A, KEIM D, et al. Subspace search and visualization to make sense of alternative clusterings in high-dimensional data [C]//Proceedings of the IEEE Conference on Visual Analytics Science and Technology. Los Alamito: IEEE Computer Society Press, 2012: 63-72.
[16] TURKAY C, FILZMOSER P, HAUSER H. Brushing dimensions-a dual visual analysis model for high-dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2591-2599.
[17] TURKAY C, LUNDERVOLD A, LUNDERVOLD A J, et al. Representative factor generation for the interactive visual analysis of high-dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2012, 18(12): 2621-2630.
[18] YUAN X R, REN D H, WANG Z C, et al. Dimension projection matrix/tree: Interactive subspace visual exploration and analysis of high dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19(12): 2625-2633.
[19] QIU C, XU H, BAO Y. Modified-DBSCAN clustering for identifying traffic accident prone locations [C]// International Conference on Intelligent Data Engineering and Automated Learning. Heidelberg: Springer Press, 2016: 99-105.
[20] KEIM D A. Information visualization and visual data mining [J]. IEEE Transactions on Visualization and Computer Graphics, 2002, 8(1): 1-8.
[21] ZEPEDA-MENDOZA M L, RESENDIS-ANTONIO O. Hierarchical agglomerative clustering [J]. Encyclopedia of Systems Biology, 2013, 43(1): 886-887.
Visual Analytics Method forLocal Correlation of Urban Traffic Accidents
LIU Xin-yue1, XIE Wen-jun1, YIN Cheng-sheng2, CHEN Jin-guang2, LIU Lu1, LUO Yue-tong1
(1. School of Computer Science and Information Technology, Hefei University of Technology, Hefei Anhui 230601, China; 2. Traffic Police Division, Public Security Bureau of Hefei Municipality, Hefei Anhui 230009, China)
Traffic accident data may contain meaningful patterns of traffic accident, such as correlations between traffic accident and weather, time, road, etc. It is worthy of in-depth study. In general, the traffic accidents are correlated with weather, time and road. However, the correlation effect is different among various regions, which means there are local correlations between those factors and traffic accidents. It is valuable to reveal the relation between these factors and traffic accidents by analyzing local correlations. The paper presents a method to discover local correlations in traffic accidents. Firstly, the method extracts accident-prone road segments, each of which contains location, time and some other related accident information. A cluster-supported local correlation visual analysis method is presented to analyze accident-prone road segments: some histograms of these factors (weather histogram, time histogram) are used to feature accident-prone road segments, and a cluster algorithm is applied to analyze accident-prone road segments based onthe similarity of histograms. The cluster results are further interactively analyzed in linked-views to discover local correlations. The method is used to analyze traffic accident data of Hefei by specialists, and some meaningful local correlations are found, which demonstrates the method’s effectiveness.
traffic accidents; visual analysis; local correlations; accident-prone road segments
TP 391
10.11996/JG.j.2095-302X.2019050843
A
2095-302X(2019)05-0843-09
2019-06-10;
2019-06-24
安徽省科技攻關計劃項目(1604d0802009);國家重點研發計劃項目(2017YFB1402200);國家自然科學基金項目(61602146);安徽省高等學校省級質量工程項目(2017jyxm0045);中央高校基本科研業務費專項(JZ2017HGBH0915)
劉新月(1995-),男,湖北潛江人,碩士研究生。主要研究方向為可視分析。E-mail:xinyue.hfut@qq.com
謝文軍(1984-),男,安徽合肥人,講師,博士后。主要研究方向為計算機圖形學。E-mail:wjxie@hfut.edu.cn