劉 黎,胡海波,楊 濤
(重慶大學大數據與軟件學院,重慶 400044)
隨著我國綜合經濟實力的不斷提高,會展業得到了飛速的發展,出現了各種類型的會展,促進了各行業領域的交流與發展。現代會展內容涵蓋多個組成部分,會場由多個不同功能的場館組成,參會人員數量龐大且有著不同類型。比如2019中國可視化與可視分析大會[1]內容涵蓋各種報告、海報、展覽、專題研討、挑戰賽,主要場館包含主會場(共3個廳)、兩個分會場、展廳、海報區,參會人員的類型包括國內外知名學術學者專家、普通會員、參展商、工作人員、媒體及志愿者等。因此,在會展環境下產生的時空數據具有數據量大、數據附加信息復雜等特點。而數據采集設備、系統誤差及采集方式也會對數據質量產生諸多影響。
一般情況下,用戶不僅關注整體的規律,也關注細節的變化;不僅關注軌跡,也關注軌跡的屬性。有效地處理這種需求對于傳統的數據分析系統來說是一項具有挑戰性的任務。可視化旨在以可理解的形式呈現復雜的數據,幫助用戶提高理解能力[2]。對于有效地分析時空數據,可視分析是一個有價值和經過驗證的方法[3-4]。我國重點專項2018年度申報指南提出“研究大數據的可視化技術,開發面向領域和大眾的可視化工具庫”[5]。因此,本文設計了一個可視分析系統(Visual Analysis system for Spatio-Temporal Exhibition Data,VASTED)來實現對會展時空數據的探索與分析。本文工作主要貢獻如下:
1)集成了一個可視分析系統,結合豐富的交互,幫助用戶從整體的角度分析參會人員的類型及移動規律,從細節層面發現可能的異常事件。
2)利用并改進了三維地圖和甘特圖。三維地圖用于表示參會人員空間位置分布及軌跡線,甘特圖用于表示時間、語義位置和速度屬性。
現代運動跟蹤技術,如GPS(Global Positioning System)、RFID(Radio Frequency IDentification)等,允許大規模的時空數據被采集。所采集的時空數據涉及到諸多領域,如運輸管理、軍事監視[6]、商業選址[7]等。近年來,在學界有很多關于時空數據可視分析應用與研究的工作。在具體應用方面,李致昊等[8]針對基站軌跡時空數據,設計了一個可視分析系統從時空的角度來探索城市區域功能和用戶行為的關系。Liu等[7]設計了一個交互式的可視化分析系統,用于處理大規模出租車軌跡數據,以解決廣告牌的選址問題,但該工作更多的注意力集中在了整體層面的分布、聚集,缺少對細節方面的探索。Orellana 等[9]結合時間、空間信息,可視化游客在公園的集體空間行為,顯示整體、局部以及個體層面的流動情況,為公園更好的管理提供決策支持。Bast等[10]提出了一種可擴展的實時公共交通數據可視化方法,顯示公共汽車、地鐵、火車和渡輪的實時移動,來對相關交通信息進行統計,對路線做出規劃。在研究方面,Wang 等[11]研究了用時間線(甘特圖技術的一種實現形式)及其擴展形式對軌跡進行可視分析,但重點是時間屬性。Murray等[12]提出一種基于星型坐標的交互式技術,專門用來探索多維時空軌跡數據。Tominski 等[13]設計軌跡墻整合了時間、空間和屬性,軌跡墻是一個三維視圖,由水平二維地圖和在垂直方向堆疊的軌跡帶組成。但軌跡墻比較適合可視化具有相似軌跡的軌跡群[14]。交互式時空立方體[15-16]經常被用來研究時空數據的三維可視化,但顯示多個軌跡時,容易出現遮擋及空間的扭曲。Cibulski等[17]的工作研究了從時間、空間、事件本身3 個不同層次分析時空數據的事件序列,并設計了一個多視圖關聯分析系統。
“網格型”數據是一種比較常見的移動數據。比如Shoval[18]將“迷你以色列”公園劃分為多個2 m×2 m 的網格,然后統計每個單元格的訪客數。IEEE VAST 2015 Challenge[19]將游樂場劃分為多個5 m×5 m 的網格,然后對每個網格的游客進行跟蹤。本文所使用的文獻[20]挑戰1(后文簡稱“挑戰1”)數據中,會場被看成由多個8 m×8 m 的網格組成的區域,記錄每個網格的參會人員時空信息。
針對“網格型”移動數據,本文利用“中心位置替代”的方法來處理網格內部的位置變化。假設人員M0在T0時刻進入網格S0(S0映射網格中心位置)范圍內的P0點,在T1時刻移動到P1點。由于移動是由時間和空間合成,網格內具體位置的變化可以轉移到時間的累積,并且網格的尺寸較小,人員在網格內的具體位置變化對網格人數統計、人員整體運動分析的影響可以忽略不計。因此將人員在網格內部的任意位置近似認為所處網格的中心位置,來對數據進行平滑處理,如圖1(a)所示。隨著記錄的增加,就可以根據時間T和網格中心位置S擬合出人員的近似軌跡,如圖1(b)所示。

圖1 通過網格中心位置模擬參會人員的移動軌跡Fig.1 Movement trajectory simulation of participants based on grid center
數據補全 根據挑戰1 數據的描述,每個網格中心安裝一個傳感器,可以接收其所處網格內參會人員佩戴信號發射器發出的信號。傳感器日志數據分3 d 給出,共計1 879 488行,未壓縮約32 MB,記錄了人員ID、人員進入傳感器所在網格的時間及傳感器編號(sid),sid映射該網格的中心位置。原始數據記錄不完整,記錄的人員具體位置信息比較模糊,具有不確定性;并且數據離散程度相對較高,數據質量低,無法利用此類數據進行有效的分析。因此,對傳感器日志數據進行補全:1)對原始數據按人員ID 升序排序。2)利用插值法補全數據。
假設人員M0某一天的軌跡有n個離散時空數據點TPk=(Tk,Pk),其中k=1,2,…,n,Tk為當前時間,Pk為當前位置(圖2(a))。對于TPK-1與TPk,某人在Tk-1時刻進入Pk-1位置,在Tk時刻離開Pk-1進入Pk位置。由于人員在該網格內任意位置點均可表示為該網格中心位置,因此在時間區間[Tk-1,Tk),TPi=(Ti,Pk-1),其中0≤i≤Tk-Tk-1,Tk-1≤Ti≤Tk。按此算法對每個人的數據進行插值補全(圖2(b)),補全后的數據約3.2 GB。

圖2 位置P與時間T的函數Fig.2 Function of position P and time T
數據采樣 補全后的數據量過大,存在一定冗余,考慮到性能及盡可能保留關鍵時空信息,設定一個基準時間,利用系統采樣的方式,每隔一段時間對每個人的數據進行采樣。正常情況下,人在會議場館中位置變化頻率較低,且相鄰網格之間距離較小,設定基準時間為25 200 s(07:00:00),每隔60 s,即1 min采樣一次,如圖3所示。

圖3 數據采樣后位置P與時間T的函數Fig.3 Function of position P and time T after data sampling
本文希望通過結合時間、空間、速度等屬性來分析參會人員的類型和行為模式,以及可能的異常事件,來幫助會展主辦方更輕松有效地回顧會展的整體狀況,洞察參會人員空間行為,發現相關不足,提升以后的管理水平。因此,本文在設計視圖時主要遵守以下兩個原則:
1)視圖準確展示數據所包含的復雜信息。
2)視圖表達清晰、直觀,減輕用戶對數據的理解負擔和認知負擔。
該系統主要由全局態勢地圖、軌跡回放地圖、軌跡甘特圖、速度甘特圖、時長甘特圖、控制面板以及人數變化折線圖組成。圖4 僅展示了系統部分視圖,其中(c)、(e)、(f)、(g)默認展示room6 第一天的數據。(a)為時間切換按鈕組,(b)為全局態勢地圖,(c)為速度甘特圖,(d)為控制面板,(e)為人數變化折線圖,(f)為時長甘特圖,(g)為軌跡甘特圖。

圖4 可視化界面Fig.4 Visual interfaces
3.1.1 三維地圖
對于時空數據的分析,地圖經常作為“視覺吸引”集中著用戶的注意力,給予用戶對環境最直觀的洞察,因此本文提供一個地圖視圖。根據挑戰1 中傳感器布置圖,本文場景為具有兩層高度的封閉式會議場館。利用Esmap 進行建模,三維還原會議場館,因為認為三維立體顯示兩層樓比二維平鋪顯示兩層樓更直觀,空間利用率更高。但三維場景也面臨著很多問題,例如可能造成空間的扭曲或遮擋,容易使人對高度和尺寸的感知產生誤差[21],給用戶帶來不必要的視覺干擾等。因此,給地圖增加平移、旋轉和縮放功能,利用鼠標右鍵和滾輪操作實現。這樣就可以從不同視角觀察地圖,降低三維地圖帶來的影響。
全局態勢地圖 全局態勢地圖在三維地圖上添加了兩個功能層,即網格坐標層和散點圖。
網格坐標可以把地圖網格化、坐標化,將地圖本身的墨卡托坐標系轉化為普通坐標系。這樣地圖上的標記點位置得以更精確、易懂地描繪。
散點圖由不同位置、不同顏色、形象具體的人形圖標組成。每個圖標的位置由x,y坐標確定,顏色由該點的人數N確定。本文中,設定4 個人數區間,(0,16],(16,32],(32,64],(64,+∞),并采用常用的預警級別顏色來編碼每個區間,即藍、黃、橙、紅。例如圖4(b)中,標注紅色圖標的區域人數N>64,說明這些8 m×8 m 的網格區域此刻出現了擁堵,應做好相關措施,預防擁堵帶來的相關影響。Buschmann 等[21]研究了動畫的有效性,他們的實驗結果表明動畫為表現、分析、理解時間和空間提供了有效的手段。因此,散點圖結合地圖并以動畫播放的形式呈現會場整體態勢,展示參會人員位置的動態變化情況。動畫播放的一種方式是為用戶提供一個交互式的時間滑塊[22],Amini 等[3]認為,用戶可以通過控制滑塊的滑動速度,選擇性地把注意力留在感興趣的時間段,從而更快地瀏覽數據并找到有價值的信息。但時間滑塊通常在跳轉到某一具體時刻上表現不佳,缺少一定的靈活性,本系統以另一種形式實現時間滑塊。利用模擬計時器的方式自動播放動畫,可在輸入框輸入時間跳轉到指定時間,也可點擊“前進”或者“后退”按鈕查看前一幀或后一幀(動畫地圖所綁定數據為采樣后的數據,一幀代表1 min)。
此外,視圖右上角設計一組功能按鈕,分別綁定“單層/雙層顯示”“聚焦樓層1”“聚焦樓層2”“2D/3D 切換”功能。“2D/3D 切換”可以充分利用二維地圖和三維地圖的優點,提高用戶體驗。
軌跡回放地圖 全局態勢地圖從全局的角度動態還原真實場景,幫助用戶實時感知會場態勢;軌跡甘特圖以靜態的方式展示了所選人員一天的移動規律,但用戶卻不能洞察位置之間的距離,也看不到位置之間的軌跡形狀[23],并且容易隱藏時間極短的細節。因此本文設計軌跡回放地圖,如圖5 所示,幫助用戶探索感興趣的少量人員的移動細節。軌跡回放地圖類似于全局態勢地圖,將散點圖替換為軌跡線,軌跡線上用白色的箭頭表示移動的方向。由于采樣之后的數據丟失了一部分信息,因此,面向細節的軌跡回放地圖采用補全之后的數據,每一幀動畫代表1 s。當用戶想忽略重疊交叉的軌跡線,只關注所選人員詳細的位置變化時,可以取消選擇“顯示軌跡”。

圖5 軌跡回放地圖Fig.5 Trajectory playback map
3.1.2 甘特圖
3.1.1 節中,全局態勢地圖結合時間和空間從全局的角度溯源場景,但沒有結合數據屬性對單個或者一組人員進行分析。對于屬性的表示,希望設計的視圖能夠滿足以下需求:
1)很容易地看到某種屬性隨時間的變化,因此視圖應該有一個時間軸。
2)以人為中心,可以對一組人員的該屬性進行比較,這就要求視圖簡單和能按某種方式排序對齊。
甘特圖橫軸自然表示時間,可以一次查看時間、對象ID和屬性3 個變量,具有按行顯示、可以對行進行排序對齊、易于發現和比較模式的變化等特點。Gupta 等[23]專門討論了甘特圖的多種形式,其中以人為中心的甘特圖具有兩種形式,如圖6所示,并選擇了最合適的一種用來表示人員ID、時間和位置3 個屬性。圖6(a)中位置不需要顏色編碼,但更占用垂直空間。圖6(b)位置雖然需要顏色編碼,但在必要時可以用文本標簽標識屬性。本文使用的數據集包含的人員遠多于位置,位置垂直排列不能很好地擴展,因此選擇圖6(b)作為視圖之一。同樣,位置可以被其他屬性(如速度、訪問頻率等)代替。

圖6 以人為中心的甘特圖Fig.6 Person-centric Gantt chart
軌跡甘特圖 軌跡甘特圖不同色條映射不同的區域,色條寬度代表在該位置的持續時間。每一行包含一個人員的移動信息,包括訪問過的離散位置、訪問它們的順序等。甘特圖通常適用于數據較少的情況,數據量變大就會出現雜亂和隱藏信息。但是,很難找到一種可視化技術既能完全地清晰地展示數據信息,又適應大數據量,又不損失空間上下文。所以,對甘特圖做出一些改進,如圖7所示。
1)一般情況下,要想知道某個色條對應的區域,需要將該色條顏色與“顏色-區域”對照表聯系起來,確定了對應的區域后,再將視覺移回該色條上。如果顏色變多,用戶的視覺在來回轉移之中容易產生疲勞,造成“顏色-區域”對應錯位。將空間位置轉換為語義位置,然后標注給寬度合適的色條,減少用戶的視覺轉移,降低用戶的視覺負擔,提升用戶對視圖的瀏覽質量。
2)空間位置轉變為語義位置或者顏色映射到甘特圖,會淡化真實的空間信息。當鼠標移入色條時,彈出一個文本框,文本框包含區域名稱、位置坐標、到達/離開時間。將坐標與時間映射到地圖,就可以在地圖中溯源該位置的相關場景。這類似于文獻[24]中使用的嵌入地圖。
3)會場的空間布局為兩層樓,每層樓可以看成是一個獨立的區域。而每層樓又包含多個場館,這些場館可以看成是由通道連接起來的獨立的子區域。增加表示二樓場館的色條高度,用戶就能輕松看出軌跡的樓層變化。同樣,根據經驗人為地忽略那些停留時間不超過1 min的過道位置,給其對應的色條設置為透明。這樣就可以降低多余顏色對用戶視覺的干擾,從而向用戶呈現“斷開”的、更為清晰的場館序列。
4)根據會場關鍵位置的訪問順序,以及人員進入會場時間的早晚對行進行排序,使行為特征相似的人員呈現聚類狀態,便于進行比較,發現相同模式。
5)由于視圖窗口的限制,給視圖橫軸和縱軸增加縮放功能。橫軸縮放可以查看因寬度太小而被隱藏的色條信息;縱軸縮放可以根據情況改變視圖窗口顯示的行數,改善空間上下文的損失;通過橫軸局部刷取功能放大某個時間段而不用拖動橫軸縮放條,這是對橫軸縮放的一個改進。

圖7 原始甘特圖與改進之后的甘特圖對比Fig.7 Original Gantt chart and improved Gantt chart
速度甘特圖 會展環境下,人的空間狀態只有兩種,要不靜止(開會、處于工作崗位、休息等),要不就是以不超過正常步行速度(通常認為成人的步行速度為60~100 m/min)的速度移動(海報區、展廳參觀,茶歇等),如果在某時刻出現速度偏大,那么就有可能是該人員發生了異常情況。因此,對速度的分析有助于探索隱藏的異常信息。
如圖4(c)所示,速度甘特圖從軌跡甘特圖移植過來,色條的顏色由速度大小speed決定。本文設定4個速度區間(單位:m/s),[0,0.5),[0.5,1),[1,1.67],(1.67,+∞),分別映射藍、黃、橙、紅四種預警級別顏色。當色條為紅色,即速度大于1.67 m/s 時,定義為異常速度。傳感器的位置記錄在空間上前后相鄰,相鄰兩點距離間隔較小,可以近似地認為相鄰點之間的運動為勻速直線運動,因此可以很容易地計算出相鄰點間的距離(distance)和時間間隔(duration),從而得到移動速度(speed)。
如圖8 所示,假設某人在T1時刻進入傳感器P1(x1,y1)檢測區域,在T2時刻進入傳感器P2(x2,y2)檢測區域,那么P1和P2之間的距離distance為:

從P1到P2所經歷的時間duration為:

則P1與P2兩點間的速度speed為:


圖8 P1與P2之間的距離Fig.8 Distance between P1 and P2
通過上述計算,可以得到某人一天的速度變化情況。當速度甘特圖的視圖窗口要顯示很多行速度時,用戶可能要通過縮放、移動縮放條等操作去發現隱藏的異常速度,這樣就比較耗時,會加重用戶視覺負擔。本視圖提供“只顯示異常”功能,勾選該選擇框,視圖窗口就只顯示具有異常速度的行,這樣用戶就可以更輕松地獲取細節的信息。
停留時長甘特圖 為了查看某區域一天的人員進出情況,本文設計了停留時長甘特圖(圖4(f))。停留時長甘特圖的每一行顯示了一天中何人在何時進入了該區域,何時離開該區域,進入該區域的次數,每次在該區域的持續時間。
3.1.3 控制面板
根據分析的目標,用戶可能會對某一場館一天的人員出入情況,或者人員一天的活動情況感興趣。為了支持用戶查詢需求,更靈活地更新局部視圖,本文結合數據背景,考慮了時空數據的不同組成部分——時間(when)、空間(where)、對象(who)以及隱性屬性速度(speed)、人數(count),提出了兩個查詢模型:
1)when+where →who+when+count。指定一個日期和一個位置,查詢將返回在該日期訪問過該位置的對象,這些對象何時進入該位置,何時離開該位置,以及每個時刻該位置對應的人數。
2)when+who →where+speed。指定一個日期和一組或一個對象,查詢將返回對象在該日期內的位置變化和速度變化。
如圖4(d)所示,通過下拉框選擇查詢條件,點擊“查詢”,執行查詢1);通過接收“甘特圖”選中的ID 或者“添加”感興趣的ID,點擊“確定”,執行查詢2)。
3.1.4 人數變化折線圖
場館每個時刻的人數及人數變化趨勢反映了場館相關活動的開展情況。本文利用標準視圖-折線圖(圖4(e)),來清晰展示各場館的人數變化,推測各場館的議程安排。折線圖橫軸縮放功能用于探索更細節的時刻。當鼠標在折線視圖上移動時,鼠標位置會出現一條豎線,豎線與折線的交點高亮顯示,交點旁會彈出一個文本框,用于標注該點對應的時刻及人數。另外,該視圖還提供一個下拉框,便于用戶選擇感興趣的場館,對比多個場館的人數變化趨勢。
由于數據的復雜性,單純依靠機器處理數據直接顯示結果很難滿足用戶需求,因此多視圖的關聯分析是有必要的,豐富的交互也可以讓用戶享受探索的樂趣。本節主要介紹系統的交互流程,如何利用系統去關聯分析。系統提供兩個交互入口,即全局態勢地圖和控制面板。
地圖:
1)點擊“播放”按鈕,幫助用戶動態感知全局態勢。
2)暫停動畫播放,在地圖上選擇感興趣的目標點,接著執行步驟3)~7)或步驟8)。
3)在“停留時長甘特圖”顯示該天進入目標點(一個或多個點,或者一個區域)的人員在該目標點的停留時長。
4)選擇“停留時長甘特圖”上感興趣的ID,控制面板將顯示這些選中的ID。
5)執行when+who →where+speed 查詢,在“速度甘特圖”與“軌跡甘特圖”顯示所選ID 的速度與軌跡,接著執行步驟6)或步驟7)。
6)反饋感興趣的坐標點及時間到地圖。
7)選擇“軌跡甘特圖”感興趣的ID,在“軌跡回放地圖”動態回放其軌跡。
8)控制面板顯示該目標點此刻的ID,接著執行步驟5)~7)。
控制面板:
9)執行when+where →who+when查詢。
10)在“人數變化折線圖”顯示所選場館人數與時間的變化關系。
11)重復步驟3)~7)。
12)在控制面板輸入感興趣的人員ID。
13)重復步驟5)~7)。
實驗平臺為一臺Intel Core i7-6700 3.4 GHz 的臺式機,配置16 GB 內存。本文的重點是VASTED 的可視分析及推理,因此主要演示部分案例。
本案例研究探索了如何分析參會人員的類型及移動規律。由于room1~room6 這6 個房間用途在數據描述中未詳細說明,因此在對參會人員進行分析之前,先對各房間的用途進行分析。圖9以第一天的數據及room2為例演示了分析過程。
1)對于一個不知用途的房間,首先關注房間內的人數如何變化,人數變化與其他場館有何關系。執行分析流程9)~10),查詢room2 的人數變化折線圖,并在折線圖下拉框選中幾個主要會場,對其人數變化情況進行對比,如圖9(a)所示。可以看出當各會場處于工作狀態時,room2 內人數較少;其余時間人數較多,峰值達到150人。
2)了解了人數變化情況之后,分析該房間人員對各個場館的訪問情況。執行分析流程3)~5),查看該房間人員的軌跡序列。從圖9(b)可以看出,這些人員上午主要在主會場活動,中午前往餐廳就餐,下午主要在4 個分會場活動,一天內多次前往room2等。
3)軌跡甘特圖展示了人員所訪問的場館序列,但對人員在某個場館內具體位置點的變化表現不佳。執行分析流程7)查看room2 人員的軌跡回放。圖9(c)顯示,在主會場處于工作狀態期間,room2 內人員大多處于主會場前排位置,也有人位于講席臺。可以推測room2 為講者嘉賓的休息室,其人員為講者嘉賓(VIP)。
4)確定room2人員類型為VIP之后,還可以分析出相關的報告嘉賓。根據圖9(a),選擇分會場A處于工作狀態(人數處于波峰狀態)的一個時刻,比如14:10。圖9(d)中,選中分會場A 講席區域的兩個網格(矩形框選處),得到講席區域的人員停留時長。圖9(e)矩形框選ID 顯示這5名人員在分會場A會議進行時分3 個時間段位于講席處。而這3 個時間段恰好與圖9(a)中分會場A 人數最多的3個時間段相符,故推測這5名人員為分會場A的報告嘉賓。圖9(f)顯示,這5名人員都多次前往room2,證實了推測結果。
5)對于VIP的移動規律,圖9(g)(h)是對圖9(b)的橫軸縮放。可以看出VIP 是從入口4 進入會場,且不需要簽到;進入會場后,首先進入room2 稍做準備,會議開始時進入主會場;并且只從出口4 離開會場。圖9(i)的動畫顯示了軌跡甘特圖不易發現的規律(矩形框選處),VIP 可以從主會場后面的專用通道離開會場,前往二樓也只經過扶梯2。
通過步驟1)~3)可以推測相關的人員類型及移動規律,步驟4)可以推測這類型人員中的具體角色人員,步驟5)可以總結每一類人員的大致移動規律。按此步驟,結合挑戰1 的題目背景,可以對剩余五個房間做如下推測。
room1 為下午的茶歇間,時間為16:10—16:30;room3 為上午的茶歇間,時間為10:30—10:50。
room4 為媒體室。媒體記者從普通入口(入口1~3)進入會場,簽到后進入room4 稍做準備。接著根據工作安排去相關區域進行采訪、直播等,并且不定時進入room4。工作結束后從普通出口(出口1~3)離開會場。
room5 為黑客大賽場地。參賽人員從普通入口進入會場后先簽到,9:00 左右進入賽場。中午12:00 集體前往食堂就餐,然后返回賽場。下午15:00 左右第一批人員被淘汰,16:15左右進行第二批淘汰。然后從普通出口離開會場。
room6 為工作人員休息室。工作人員從普通入口進入會場,前往room6 稍做準備后提前到各自的崗位就位,并且位置長期保持不變。部分崗位工作人員采取輪流午餐制,包括簽到處、出入口(1 樓通道)、服務臺、簽到處,room5 第一批工作人員就餐時間為11:40—12:10,第二批12:10—12:40,如圖7(b)所示。工作結束后從普通出口離開會場。

圖9 分析room2人員類型及移動規律Fig.9 Analyzing types and movement rules of people in room2
對于某些類型人員的分析,可能不需要以上那樣復雜的步驟。圖10(a)重現了第一天從普通入口進入會場的所有人的軌跡。可以發現有部分人在上午9:30 開始陸續進入會場,簽到后在會場自由活動,11:00 前后陸續離開會場。結合圖10(b)發現這類人主要在海報區和展廳活動,不去參加會議。在第一天下午15:00—16:00 及第二天相同時間段也出現類似情況,其移動規律相似。故推測為團體參觀人員。
本節案例以第一天數據為例,主要結合時間和空間屬性,利用三維地圖和甘特圖,關聯分析了參會人員的類型及行為模式,并可以細化某些人員類型中的具體角色。因此,該案例可以為類似場景的人員行為模式分析提供參考。

圖10 分析團體參觀人員移動規律Fig.10 Analyzing movement rules of group visitors
4.2.1 人員越權事件
4.1 節確定了room2 中的人員為VIP,其第一天的軌跡甘特圖顯示人員11201 和16473 在簽到處和room4 停留,而VIP不經過簽到處及room4。在后面兩天,兩人未出現在room2,卻都出現在了room4。將兩人3天的軌跡序列進行對比,結合媒體記者的移動規律,確認兩人為媒體記者。因此推測兩人在第1 天越權進入room2 違規采訪。人員11201 進入會場時首先在簽到處停留簽到,09:06:31—09:19:49 在room2 停留;人員16473 進入會場時同樣在簽到處簽到,10:30:03—10:50:59在room2停留。如圖11所示。

圖11 11201和16473三天的軌跡對比Fig.11 Trajectory comparison of three days of 11201 and 16473
4.2.2 電子胸牌同號事件
會議第一天,VIP 的速度甘特圖顯示ID 為16632 的人員速度序列中出現了比較明顯的紅色異常區間,對該區間進行局部縮放。如圖12(a)所示,在此區間,速度達到幾米、十幾米每秒,甚至更快。16632 的軌跡序列(圖12(b))顯示,在08:34:40該人員從入口4進入會場,隨后一直在主會場活動。但在09:44:40 該人員突然出現在入口4,然后停留在room2,并于10:48:24從出口4離開會場,訪問的位置出現明顯跳動。基于上述表現,推測人員P 復制了16632 的電子胸牌,在09:44:40 進入會場,隨后一直停留在room2,尋找合適時機盜取重要資料或者物品,行竊成功后于10:48:24 從出口4 離開會場。

圖12 第一天16632異常行為Fig.12 Abnormal behaviors of 16632 on day1
4.2.3 物品丟失事件
會議第一天,room2的“人員停留時長”圖顯示ID為11260的人員在12:28—14:00 期間頻繁進入room2,如圖13(a)所示。從圖13(b))可以看出,此期間該人員在room2、服務臺及其他公共區域之間頻繁往來,并短暫停留。結合4.2.2 節提到的可能的盜竊行為,推測人員P 盜取了11260 的相關物品,11260在10:44進入room2,人員P擔心暴露,于10:48:24從出口4 逃離會場。11260 在12:28 回到room2 時發現物品丟失,然后頻繁前往服務臺咨詢,并多次在room2、room3、展廳、海報區等區域尋找該物品。
4.2.4 人員異常會和事件
第一天黑客大賽人員的軌跡甘特圖顯示,參賽人員10409 在上午11:01:11—11:20:19 一直處于2 樓過道某位置(圖14(a)),而此時間段其他參賽人員均在賽場比賽,且周圍人員較少。將該位置坐標和時間段映射到“全局態勢地圖”(圖14(b)),發現從11:08分起,該位置有兩人,包括媒體人員13612(圖14(c))。兩人的軌跡回放清楚地呈現了異常會和的全過程(圖14(d))。媒體人員13612 從一樓到二樓,于11:08:08 在room5 門口(2 樓,10,06)位置與10409 會和,大約12 min之后,二人會和完畢,于11:20:19相繼離開。
結合上述,兩人異常會和可能涉及到比賽方面的不公開信息。推測兩人事先已經約定好時間和地點,并且10409 提前到約定地點等待,兩人會和交接完畢之后,10409 返回賽場,13612則回到媒體間整理相關信息。

圖13 第一天11260異常行為Fig.13 Abnormal behaviors of 11260 on day1

圖14 第一天13612與10409 異常會和Fig.14 Abnormal meeting of 13612 and 10409 on day1
通過本節案例,相對容易地從一組時間、空間或者速度屬性的序列中發現具有細節差異的離群個體,然后以此為基礎結合其他視圖,繼續向下發掘出可能的異常事件。
本節選取了文獻中兩個常見的時空數據可視化案例,進行差異對比。
如圖15(a)所示,文獻[13]利用軌跡墻在一個視圖中整合了空間、時間和速度屬性,軌跡沿著z軸垂直排列,速度屬性通過不同的顏色沿著軌跡編碼。此外可以過濾掉不關注的屬性范圍,來縮小顯示無關數據的位置的軌跡帶,突出了重點數據,減少了視覺遮擋。該方法比較適合沿著道路產生的具有相似形狀的軌跡。但對于本文,比如同為媒體人員,但他們分布在會場不同方向不同位置,空間軌跡雜亂,使用該方法很難避免軌跡的交叉和視覺的遮擋。
文獻[15]中通過對齊軌跡開始/結束的時間,來擴展時空立方體技術,從而優化時空立方體的視覺混亂問題,提高分析質量和分析效率。圖15(b)對齊了軌跡的開始時間,意思就是以某一軌跡開始時間為基準,其余軌跡全部垂直平移,使其開始時間與基準時間重合。該圖顯示了軌跡的開始一段時間,可以看出在該時間段內,所有軌跡明顯成一簇。但是如果要顯示所有時間段的軌跡,該方法就會失效。比如對于本文的VIP,使用該方法,在入口4到room2這段開始的時間會有比較好的軌跡聚類效果。但對于后面的時間,每位VIP的路線具有隨機性,因此該方法還是不能很好地解決軌跡雜亂遮擋問題。

圖15 不同的時空數據可視化案例Fig.15 Different visualization cases of spatio-temporal data
本文將空間位置轉換為語義位置,將軌跡沿著時間軸水平排列。語義位置可以將很多空間位置點聚類,使軌跡序列更為平整。比如主會場有一段空間軌跡,形狀彎折復雜,但轉為語義位置后就只有“主會場”這個標記。因此,利用甘特圖可視化時空數據可以很容易對齊,按行進行比較,減少不必要的視覺干擾。再結合其他視圖,就可以進行更深入的探索。
本文提出了VASTED,該系統結合具體案例,有效地探索會展環境下的時空數據,分析出了參會人員的類型和行為模式,以及可能的異常事件,可以在以后類似場景下為相關用戶提供決策支持、幫助管理人員合理調動資源、更好地管理會場、響應和處理各類突發事件。此外,利用該系統還可以進行很多有趣的細節探索。比如確定各場館的日程安排;通過日程安排找到相關人員可能的遲到、早退或者缺席現象;通過人員移動的軌跡線與場館墻體的交叉點確定各場館的出入口;通過全局態勢地圖發現相關擁堵情況等。
在數據預處理方面,原始數據未給出人員在每個網格內的具體位置信息,本文將每個人的實時位置近似處理為其所處網格的中心位置,因此在人物的精確移動分析方面還存在不足,這需要用更多數據集來進行實驗和探索。由于數據集的復雜性及視圖窗口的限制,在視圖設計方面,用甘特圖來表示軌跡,容易隱藏持續時間較短的移動信息和損失一部分空間上下文;軌跡訪問的區域過多,也會對色條的色彩搭配設計形成挑戰。
在未來的研究中,將對甘特圖的算法設計和視圖設計進行更加深入的探索,以期在保留甘特圖獨特優勢的前提下,更好地適應大而復雜的軌跡時空數據集,幫助用戶快速地洞察關鍵信息,發現問題。