李金磊,慈諭瑤,鄭 坤,郭紹龍,燕繼紅,陳宇萍,吳艷民,李仕漪
(1. 中國石油化工股份有限公司勘探分公司,四川 成都 610041; 2. 中國地質大學(武漢)地理與信息工程學院,湖北 武漢 430074; 3. 北京創時空科技發展有限公司, 北京 100083)
地理信息大數據蘊含豐富的時空語義信息,利用可視化方法挖掘其中的時空關系模式可以直觀地表示時空關系特征,為智慧城市的發展提供幫助[1]。大量不同類型的地理信息大數據反映了相應事件的空間分布[2]。這些時空事件中隱藏的信息可以進一步探索事件之間的演變過程,反映城市的交通模式[3-4]。
由于移動數據的不斷增長,其數據集變得非常龐大,數據內容也變得尤其復雜[5]。傳統的方法在挖掘多尺度、多語義的數據關系上存在許多困難。盡管有許多研究提出了一些可視化方法或框架(如TrajGraph[6],TrajRank[7],以分析移動時空模式,但針對時空事件及其背景之間的時空關系可視化方法尚未提出,同時關于時空關系多尺度和多語義特性的數據集解釋也并不完整。
為解決上述問題,本文首先定義與分析問題相關的特定的時空事件;然后對時空關系進行抽象定義,并且設計一個可視化系統展現時空背景之間的多語義關系;最后實現交互式多視圖界面,結合用戶感興趣的區域與時間段展示時空事件間的關系。
時空事件可定義為一個或多個對象發生的具有時空特征的事件,如移動屬性(如速度、方向等)的變化、對象之間的相遇等。時空事件根據對象的多少可分為個體時空事件和群體時空事件[8-9]。
時空事件(E)由事件發生的空間位置(S)、時間間隔(T)、事件屬性(A)組成,可表示為
E→S×T×A
(1)
目前,大部分研究通過設定空間屬性的閾值提取時空事件。其中有通過選擇合適的參數進行移動對象相遇探測的研究,如空間窗口(ΔS)和時間窗口(ΔT),比較有代表性的有Flower diagram maps與Growth ring maps,利用環形的圖表表達事件在不同地方發生的周期模式。文獻[10]提出了一種可交互的過濾工具,幫助分析者提取移動事件并查看結果。文獻[11]描述了一種可視化查詢工具,根據一個或多個動態屬性的值計算和可視化移動特性與距離,以及選擇上下文元素和過濾軌跡段等進行分析操作。
然而,上述方法僅勝任提取一些屬性相關的事件,并不能提取和表達事件之間的時空關系,以及空間和時間的多尺度及多語義特性。載客事件作為停車事件中一種特殊事件,從基于速度值和載客狀態信息的車輛軌跡中提取而得,另外附加背景用于將有意義的載客事件從非有意義中分離,因而,可視化表達應與移動事件提取過程結合在一起,提供不同時空尺度時空關系可視化。
關系可視化是挖掘時空事件及其背景元素之間關系的重要手段。傳統方法大多采用玫瑰圖[10]與年輪圖[12]等可視化方式表達事件發生的周期性關系,但該方法無法顯現移動對象或移動事件與時空上下文之間的時空關系。一些常見的可視化技術對軌跡數據進行分析,諸如時空立方體和靜態圖,它可用于探索移動物體和時空上下文的元素之間存在的時空關系,但存在一定局限性,當時空關系沒有明顯聚集現象時,混亂、重疊的視覺元素使軌跡信息難以捕捉。為解決上述問題,文獻[6]提出了節點鏈接圖視圖,圖中存儲并展現了對象的移動軌跡,可以用來研究關鍵區域的時空關系。
受TrajGraph的啟發,本文認為節點鏈接圖是一個更好的表達關系的可視化形式。但由于時空關系的復雜性,節點鏈接圖在表示這些時空關系時會存在許多困難:為呈現空間特性,必須將關系圖連接到地圖中的真實位置或一些其他地理參考;為呈現時間特性,需要一個動態圖形來表示不同時刻或時空關系中不同的時間間隔。
在可視化探索的初始階段,首先需要定義從軌跡中想要發現的時空事件,接著找到時空事件之間的關系并分析其含義。
時空關系定義:一個或多個對象之間發生的特定時空關系,以及與其他時空背景元素(如空間對象和時空事件)發生的時空關系。此定義涉及物體在空間的位置及被選定對象在一個時間段內的相互關系[13]。本文主要從事件之間的時空關系、事件及背景之間的時空關系兩方面表達時空關系。
(1) 事件之間的時空關系。事件1(E1)和事件2(E2)時空關系的一般定義
R(E1,E2)={ΔS,ΔT,A}
(2)
式中,ΔS為E1與E2之間的空間關系;ΔT為E1與E2之間的時間關系;A為E1與E2的屬性信息。以乘客上、下車的時空事件為例,首先選擇一個事件集合,然后設置上車或下車的事件描述參數,事件E1與事件E2之間的關系如下
R(E1,E2)={{adjacency},{contemporary},{statuschange}}
通過R(E1,E2)可以規范化描述某塊區域內乘客上車與下車之間時空關系所需要的時空約束信息,即事件在空間上要相鄰,在時間上幾乎同時發生,并且車輛載客狀態發生變化。
(2) 事件及背景之間的時空關系。事件及其背景之間的關系會隨著空間位置或背景要素的改變而發生變化。
事件和時空要素之間時空關系的一般定義為
R(E1,C1)={ΔS,ΔT,A}
(3)
式中,ΔS為事件及其背景間的空間關系;ΔT為事件及其背景間的時間關系;A為事件的屬性信息。
本文設計了一種可視化框架。該框架包含時空事件提取階段和可視化階段,并設計視覺編碼高亮表示移動關系中的重要信息。時空事件提取階段主要包含:①定義需要提取的時空事件;②設置查詢約束從時空數據中提取事件;③通過交互探索,設置關系約束條件,使用動態聚集方法提取事件的時空關系。
在可視化階段,本文提出多視圖協同展示的可視化方法,構建的協同視圖可以促進更多具有創新性和有效性的分析,幫助分析者選擇感興趣的項目并關注分析的過程,而不會受到干擾[14]。該方法將軌跡與時空事件繪制在地圖上進行全局探索,通過圖表顯示事件間的關系,用戶可以通過篩選空間區域及時間范圍,提取感興趣的時空事件及其關系。其中,地圖視圖使用流型圖(flow map)技術,事件以點要素的形式分布,通過玫瑰圖表達事件的位置和周期性特征;在時間視圖中,分別利用線性圖與日歷圖表示移動事件的統計信息與相應的周期性特征;力導向圖可使用戶有效地探索重要區域中事件間的關系,在避免節點重疊的同時保持頂點的相對位置,根據實時狀態自動完成較好的聚類,方便看出事件之間的親疏關系。此外,由于事件數量龐大,配合矩陣圖可以清晰表達整體間的關系信息。
基于多視圖協同時空關系可視化框架,本文實現了一種可視化原型系統,如圖1所示。該系統包含地圖視圖、關系圖視圖及時間視圖,多視圖結合構成一個用戶友好的交互界面,用戶可以由此探索信息是如何相互關聯的。
本文試驗得到軌跡數據共計24 000萬條,達20 GB,覆蓋4000輛出租車,自2013年1月10日至2013年8月25日,時間跨度為83 d。軌跡數據中包含每個車輛唯一的ID號、時間戳信息、車輛位置、車輛的速度大小及車輛的載客信息。
提取時空事件中的時空關系,需要發現事件。通過計算對象的位置和時間背景要素之間的距離發現事件是常見的提取方法[11,15]。本文以載客事件為例,通過設置空間距離和時間距離參數提取時空關系。
如圖1中的②所示,首先選中需要分析的車輛車牌號碼,并設定時間范圍;然后,設置需要分析的時空拓撲關系參數,如將距離設置為100 m,時間間隔為1 min,點擊執行按鈕便會立刻查詢該時間段內3輛車之間的時空關系;最后提取車輛的載客事件,即搭載乘客的事件點。
本節以載客事件為例,結合地圖視圖、時間視圖、關系圖視圖,直觀地展示事件間聚集關系、時間關系,表達城市出租車運營狀況,反映城市出行需求密集區域的時空變化模式。
車輛ID號為32760、14285、09127發生的載客事件在時間上的分布情況,如圖2(a)所示,3輛出租車的分布情況相似,停車事件多集中在下午3點至晚上9點,軌跡間的時間關系可通過時間圖了解。結合地圖視圖分析,出租車32760主要分布在關山街道,出租車14285主要集中在漢口區,而出租車09127主要活動于武昌區。
通過可視化多個車輛載客事件之間的時空關系,可以發現城市熱點區域所需用車的時間段。如圖2(b)所示,連接圖中多數為2個節點相連,少有3個節點,說明3輛車之間載客事件發生相對分散。以探索出租車14285和32760的空間關系為例,結合圖2(b),在5月28號中午12點前后時間段內,出租車14285和32760幾乎同時搭載到乘客,并且發生在武昌火車站與廣州軍區醫院附近,從一定程度上可以反映該時刻火車站與醫院附近乘客較多。從時間分布圖中也可以看出在中午時間段內載客事件發生次數也多。依據用戶的知識背景,可以進一步選取更多的出租車進行分析。
至于事件及背景之間的時空關系,以珞喻路為例,使用流圖與玫瑰圖確定載客事件及空間背景要素之間的關系。如圖2(a)所示,大多數載客事件發生在早上和晚上,那時正是上下班時間。此外,十字路口附近的載客事件相比于其他路段較多。本文認為,載客事件不僅與街道、時間有關,而且與十字路口和主干道有關。通過研究交通燈的空間分布,可以探索這些事件與交通燈及其他交通設施之間的關系。
本文首先提出了一種新的方法來直觀地探索地理信息大數據下時空事件及背景之間的時空關系,給出了事件間時空關系的一般定義,并設計了一種可視化交互工具來提取事件。然后,通過3種相互關聯的視圖協同顯示界面,結合上下文和焦點的交互技術進行深入分析從而探索不同視角、不同尺度的信息,可視化不同維度的結果。最后,基于時空軌跡數據,完成了出租車載客事件的時空關系交互可視化與分析。證明了該方法在分析時空事件及背景間時空關系上的有效性與高效性。在后續研究中,可將該原型系統擴展到分布式計算環境,以適應大規模數據的分析計算,提升系統效率。