999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時空數據的駐留行為特征可視分析

2023-02-20 09:38:34馬小東趙凡任芃錕
計算機工程 2023年2期
關鍵詞:可視化用戶分析

馬小東,趙凡,任芃錕

(1.中國科學院新疆理化技術研究所,烏魯木齊 830011;2.中國科學院大學,北京 100049;3.新疆民族語音語言信息處理實驗室,烏魯木齊 830011)

0 概述

時空數據是指具有空間和時間維度的數據,通常用來描述某一對象的空間信息隨時間變化的狀態。隨著城市數字化轉型,城市中大量商業性場所每天會產生海量的駐留行為數據[1-3]。駐留行為數據是一種特殊的時空數據,是指用戶在某時間點進入駐留場所,在駐留場所停留一段時間,在另一時間點離開駐留場所產生的行為記錄數據,常見場所如網吧、停車場、酒店等人員流動發生頻繁的場所,這類數據記錄了大量用戶在相同或不同的駐留場所及其駐留時間長短的信息,從中可以分析發現用戶發生駐留行為的模式,挖掘用戶間行為的相似性與相異性,判斷用戶間是否存在時空伴隨關系,從整體上分析駐留場所的流量來源及其分布。相關文獻[4-5]與研究成果在智慧城市建設與管理、營商環境改善、數字化經濟提升等方面均具有重要作用。

針對駐留行為數據的分析,現有方法采用數據統計分析、機器學習等技術對海量時空數據進行挖掘[6-7],如何用更靈活有效的方式發現駐留行為數據并挖掘用戶間潛在的時空伴隨關系是該領域的難點和重點。數據可視分析技術能有效分析駐留行為數據,根據用戶駐留行為數據的時空分布,總結用戶行為模式,簡化復雜的時空數據,直觀發現用戶伴隨關系,提高分析人員的效率和分析方法的正確性。本文以兩個真實數據集為基礎,使用可視分析技術對原始數據進行處理,提取相關的時空特征并發現用戶伴隨關系,同時以駐留場所不同時段的用戶來源及流量分析為目標,設計多種可視分析視圖,實現交互式的可視化系統。

1 相關工作

駐留行為數據與簽到日志數據較為相似,許多研究對簽到日志數據進行分析并優化資源分配,為相關行業提供支持[8-10]。文獻[11]使用社交媒體簽到數據,通過聚類方法對城市熱點區域進行探索,分析得出租車不同的需求區域。文獻[12]利用商場的WiFi 日志來分析用戶偏好,基于時間特征和偏好為用戶推薦商品。文獻[13]提出結合關聯聚類與社交模式聚類的分析模型,對社交網站的用戶活動進行分析,探索相似的用戶活動。針對日志類數據的稀疏性,文獻[14]采用動態子空間策略,在多個時間片上分析相似行為,減少參數設定對結果的影響。文獻[15]提出一種基于分布式的SimRank NMF 社區發現算法,解決大規模復雜網絡中社區發現質量低下的問題。文獻[16]對超市日志數據進行分析,了解客戶的消費偏好,從而改善經營情況。文獻[17]結合哈希迭代剪枝算法與摘要信息剪枝兩層算法,有效去除算法中間冗余結果。

可視分析技術越來越多地用于探索用戶行為模式,利用可視分析技術對海量復雜的時空數據進行分析成為可視化研究的熱點方向。文獻[18]提出一種基于隱喻的象形視圖結合熱圖的方案,通過多種視圖交互探索用戶的空間移動模式。文獻[19]使用基于像素的圍巾圖和時空立方體圖來可視化訪客記錄數據,分析人員移動模式,在會場、商場中有重要的應用。文獻[20]使用時間柱狀圖、平行坐標圖以及嵌套餅圖的空間分布熱力圖,分析犯罪數據的多維屬性。文獻[21]提出邊緣采樣方法,利用邊緣重疊度減少MSV 的視覺雜波影響,同時保留通信的時變特性。文獻[22]將地理熱力圖和打包圖相結合,探索公共交通系統中具有相似移動模式的人員,用兩個嵌套的環狀元素對比兩對象間多時段的移動模式。文獻[23]通過結合詞云圖、時間河流圖、地圖以及帶有釋義的立方體視圖等多視圖,探索社交媒體數據的時空模式。文獻[24]使用地理地圖發現移動人員的行為規律。文獻[25]使用多維數據可視化技術,對群體行為規律與模式采用模糊聚類算法,發現具有相似行為模式的用戶。

根據駐留數據產生的時間跨度長且稀疏的特點,綜合上述分析方法和可視化技術對駐留行為數據的分析,仍存在時間跨度上伴隨關系發現不完善、無法在多個時間片上對數據進行可視分析探索、數據的多維度可視化表達不明確等問題。因此,本文使用改進的可變滑動窗口算法并結合可視分析技術,設計多變量表達的示意性地圖、用戶關系圖、時間甘特圖、徑向條形圖、日歷熱力圖等多種視圖,通過多視圖交互分析駐留行為數據,展現數據的多個維度,支持探索不同時段的伴隨關系和流量統計分析,發現數據背后隱藏的行為模式。

2 駐留行為數據分析

駐留行為數據包含大量用戶出入不同場所的流動信息,從中能夠得到具有時空伴隨關系的用戶,并運用有效的可視分析技術挖掘用戶駐留行為規律,對營商管理者有著重要的意義。

2.1 數據描述

本文使用的數據集是2019 年9 月—2019 年11 月新疆維吾爾自治區網吧記錄以及停車場記錄數據集。在兩個數據集中對涉及個人及場所隱私信息的數據字段,均做脫敏處理。每條駐留行為記錄可以表示為用戶d(人員或者車輛)在開始時間戳t時進入某駐留場所s,在結束時間戳t′時離開,生成一條駐留記錄R。全部駐留行為記錄可以表示為Ri={di,ti,,si},i=1,2,…,N,其中:si={xi,yi,ni},x、y表示駐留場所的經緯度坐標,n表示駐留場所名稱編號信息,i表示該用戶的第i條駐留行為記錄;用戶d包含用戶的唯一標識等信息,如人員的ID、車牌號、籍貫等。

由于營商場所的日均人流量很大,因此通過產生的數據可以分析用戶的駐留行為模式,同時人員流量分析也是非常重要的,以便分析者更好地了解駐留場所的流量情況。本文的目標是使用可視分析技術發現具有相似行為模式的用戶和分析駐留場所流量變化,分析任務具體為:1)從大量的駐留數據中發現具有時空相似關系的用戶,結合可視分析技術驗證其合理性;2)通過駐留數據分析各個駐留場所的人員來源,為場所管理人員的管理和經營提供便利;3)基于駐留數據展示不同人群的流量變化,并從中分析人員的移動規律。

2.2 系統架構

根據駐留行為數據特征和分析任務,設計并實現時空伴隨關系發現及流量分析系統,該系統包括數據處理、數據分析、數據可視化3 個模塊,如圖1 所示。數據處理模塊是對原始數據進行處理,提取重要特征。數據分析模塊是對用戶行為模式進行挖掘,發現具有伴隨關系的人員。數據可視化模塊使用用戶關系圖結合時間甘特圖對用戶間的伴隨關系進行分析驗證,設計多種可視化視圖對駐留場所的流量分布、來源等特征進行多時段的可視分析。

圖1 系統流程Fig.1 System process

2.3 駐留行為數據

在駐留行為數據分析階段,以具有較為明顯的時空伴隨關系的網吧數據為基礎,采用改進的基于可變滑動窗口的數據挖掘算法。

首先,為了減少偶然因素,將上網記錄數量少于3次的用戶剔除(數據集中最大上網次數為22 次),將每條上網記錄的開始上網時間戳t、結束時間戳t′、網吧編號n、用戶ID 表示為Li=[di,ti,,ni],i=1,2,…,N。將這些數據按照上線時間升序排列。

其次,設置時間閾值為1 min,將初始滑動窗口大小設為第一條記錄上線時間到閾值時間區間內所包含的記錄個數,滑動窗口大小隨著數據分布變化,計算所有滑動窗口大小與位置。當窗口滑動時,記錄窗口內所有記錄的下線時間和駐留場所地點并分別進行對比,并記錄時間差在閾值時間區間內的次數,若兩次記錄在同一場所內發生,賦予權重為1。

最后,利用用戶之間的權重,構造用戶關系圖的節點信息和邊信息,為時空伴隨關系視圖的可視化進行數據準備。

3 可視分析系統設計

3.1 多變量表達的示意性地圖

在分析各個駐留場所的數據時,設計多變量表達的示意性地圖,通過對行為模式分布的可視化,得到該駐留場所多個維度的分析情況,對場所內的流量、人員的來源分布、平均駐留時長等基本情況進行展示。

基于地理視圖的流量統計可視化方法的不足之處主要為:1)由于地理地圖劃分不規整,存在一些區域或行政地區的形狀和輪廓不連續,在統計地區特征時,視覺元素會有遮擋,從而無法精準得出對比結果;2)可展示維度有限,對于統計型地圖,區域的屬性值才是重要的可視化要素。

因此,本文設計多變量表達的示意性地圖,如圖2 所示,示意性地圖是一種以對象的大小來表示地理對象特征的圖形表達方法,使用數學法則對地圖進行變換,使地理對象間的距離或者區域的面積與需要表達的某個特征值成比例關系,進而得到另一種地理視圖的表達。

圖2 多變量表達的示意性地圖設計過程Fig.2 Design process of the schematic map of multivariable representation

圖2(a)表示單個圖元的形成過程,其中:圓表示一個來源地點,圓的大小表示單數值特征,比如該地點的總人流量;圓內嵌套環狀元素表示分類數據特征,如該類流動人口的平均駐留時長等;環內嵌套折線圖展示了具有時序特征的數據,比如一個時間段(日、周、月)內流量隨時間的變化。在圖2(b)中,折線圖將一天24 h 分為12 個時間段,對各時段的流量進行可視化。在示意性地圖中加入了各類數據的表示圖例,以及對特定時間片的交互探索,鼠標懸停相應的元素顯示該數據的大小或比例。多種變量的表達將多個視圖結合成一個視圖,可以對數據的多個維度進行充分描述。

多變量表達的示意性地圖生成算法具體如下:

算法1多變量表達的示意性地圖生成算法

3.2 時空伴隨關系視圖

在探索用戶間時空伴隨關系時,設計基于力導向的關系視圖結合時間甘特圖表現具有時空伴隨關系的用戶,如圖3(a)所示。在用戶關系圖中:每一個圓形節點代表一個用戶;節點的大小代表用戶駐留行為發生的次數;兩個節點之間的連線表示時空伴隨關系,是指兩個用戶的駐留行為數據記錄中存在駐留場所一致,以及駐留開始與結束時間區域存在重合現象;圓的顏色表示該用戶伴隨關系發生的次數,對于伴隨關系發生不頻繁的節點在視圖的邊緣位置,對于有頻繁伴隨關系的節點加入交互操作,鼠標懸停相應的節點后會單獨顯示與該節點有伴隨關系的節點;左上角顯示節點ID、上網次數、籍貫、生日等信息,支持對感興趣的用戶進行搜索。

在進一步探索用戶間的時空伴隨關系時,系統使用時間甘特圖展示多個用戶間的時空伴隨關系。甘特圖展示了用戶間的駐留行為發生的時間區間和場所,從而判斷兩個用戶在時間和空間維度上是否有重合現象出現。在時間甘特圖中:橫坐標表示時間片上的各個時間點;縱坐標表示每次駐留行為發生的用戶ID。若該用戶在某個時間片上發生了駐留行為,則相應的橫縱坐標對應的區域會有條狀矩形顯示,坐標軸下方是數據的縮略圖,支持刷選框的滑動,靈活探索時間多尺度的駐留時長,如圖3(b)所示。當鼠標懸停在條狀元素上時,顯示駐留場所編號、開始時間及結束時間等信息,其中條狀元素的灰度顏色表示駐留行為發生的場所,若兩個用戶在同一時間片及同一駐留場所內有行為記錄,則被視為具有時空伴隨關系。

圖3 時空伴隨關系發現Fig.3 Discovery for spatio-temporal adjoint relations

3.3 統計特征視圖

系統使用空間特征視圖來展示駐留場所的空間特征分布,使用直觀的地理地圖展示用戶駐留行為數據的空間分布。在空間特征分布視圖中,每個點表示一個駐留場所,點的大小表示該駐留場所的流量大小,如圖4(a)所示。空間特征分布視圖支持縮放和點擊交互操作。通過縮放來查看數據集整體的人流量的空間分布以及場所周邊的地理信息。點擊操作可以聯動其他視圖以展示該駐留場所的人群來源、各時段流量分析等。鼠標懸停在相應的駐留場所(即黑色圓點),顯示場所地點、場所流量排名以及熱度等信息。

在對駐留場所不同來源的人群進行行為特征可視分析時,采用徑向條形圖來統計不同年齡階段的駐留行為模式,每個環表示一個類別的統計,環內是每個類別的數據占比,環的底部交互顯示駐留場所的名稱以及該駐留場所在此類場所中的熱度和排名,最下方顯示該駐留場所的本地人口與外來人口的占比。圖4(b)是徑向條形圖的初始狀態,交互選擇駐留場所時會填充相應數據。

系統使用日歷熱力圖來展示更大時間范圍內的駐留行為數據,目的是便于分析特定時間段內的駐留行為特征,如圖4(c)所示。每一個小矩形代表一個日期,該矩形顏色的深淺表示對應日期內的駐留行為發生的數量,該視圖聯動空間特征視圖,可以探索感興趣駐留場所的特定時間段的行為特征分布。圖例顯示每個流量區間所對應的顏色,支持篩選操作,選中圖例可以顯示對應區間的數據,點擊相應的日期會顯示當天的駐留行為記錄數據量。

圖4 統計特征視圖分析Fig.4 Analysis of statistical characteristic views

4 案例分析

本節通過分析兩個具體應用場景中的案例以驗證本文可視化系統的有效性,分別是使用網吧記錄數據進行用戶間時空伴隨關系的發現與使用停車場記錄數據進行人員流量的來源及其時空分布分析。

4.1 網吧記錄數據集分析

用戶在相同網吧和一定的時間間隔內開始上線或者下線,被視為具有時空伴隨行為的關系。當用戶間具有一次伴隨行為發生時,伴隨關系作為邊,連接兩個用戶節點。用戶關系圖中選擇感興趣的用戶節點進行該用戶的駐留行為特征分析,可以看出大量用戶的伴隨關系發生次數為1~3,少量用戶的伴隨關系比較復雜,與多名用戶的上網記錄均有時空伴隨的現象,如圖5(a)所示。為驗證時空伴隨發現算法的有效性,系統使用時間甘特圖來詳細展示用戶間的駐留行為模式,如圖5(b)所示。

圖5 時空伴隨關系發現及用戶行為特征展示Fig.5 Discovery for spatio-temporal adjoint relations and display of user behavior characteristics

由圖5 可以看出,在用戶關系圖中,選擇框中上網次數較多的節點,關系圖簡化為以該用戶為中心的伴隨關系圖,可以發現該用戶的上網記錄數量為7次,與8 名用戶有多次時空伴隨行為發生,通過觀察這8 名用戶(縱軸從上至下依次稱其為1~8 號用戶)的駐留記錄發生的時間和場所,1 號用戶共在3 個不同的網吧(不同灰度的條狀元素表示不同駐留場所)進行過駐留,部分用戶的駐留行為記錄數據均在一個網吧中產生。通過下方刷選區域可以拖動查看整個時間片上的駐留行為記錄分布,鼠標懸停在相應的時間記錄上,查看用戶具體記錄的開始時間和結束時間以及駐留場所。兩用戶的時空伴隨關系在視圖上體現為:在對應的時間片上若對應位置有相同顏色的條狀元素,則有伴隨行為發生,若對應位置空白,則不存在伴隨關系。

4.2 停車場記錄數據集分析

對數據集中所有停車場的記錄進行篩選,選取2019 年9 月—2019 年11 月新疆維吾爾自治區所有停車場記錄進行分析。數據集中的多個停車場分布在不同的地區,其中某些停車場位于人口密集的商圈,大量異地車牌進出停車場,因此采用多種視圖結合分析這些車輛的駐留行為模式及停車場流量,如圖6 所示。

圖6 特定場所的流量分析Fig.6 Traffic analysis of the specific sites

在空間分布視圖中,可以直觀地看到數據集整體的流量空間分布,利用百度地圖API 可以查看駐留場所周邊地理位置,分析車輛來源情況。如圖6(a)所示,由于部分停車場之間流量差異較大,空間分布視圖選擇顏色編碼,顏色越深表示流量越大。選中熱度排名第一位的停車場進行分析,可以看出該停車場3 個月內流量高達30 萬以上,放大地圖查看后發現該停車場位于昌吉市區商圈中,周邊有多個餐飲及商超,是市區內客流量最大的商場。

如圖6(b)所示,篩選該駐留點的多變量表達視圖中流量排名前兩位的場所,鼠標懸停在相應的圓上顯示來自該場所的車流量,流量變化的具體數量也會顯示。鼠標懸停在較大圓環上,交互顯示新B車牌流量為148 091輛,較小圓環則表示來自新A 的車牌流量(流量越大,表示該場所的圓環半徑越大),占該駐留點流量的很大一部分。

如圖6(c)所示,兩場所車輛的平均駐留時長有所區別,本地車牌的平均駐留時長要大于外地車牌。在一天內的流量變化中,多個時間段的流量變化基本符合一般認知和規律:在02:00 后車流量基本為零,白天車輛較多。但是在00:00—02:00 這個時段內本地車流量比白天工作時段車流量還大,經過對多個人員年齡段進行分析,可以得出其中青年人群數量高達90%,且多數為本地人口,這種情況可能是為了促進城市經濟發展,大力發展夜間經濟,吸引年輕人。

如圖6(d)所示,當前駐留場所記錄從2019 年9 月直至2019 年11月,可以發現客流量比較規律,周六周日流量明顯多于工作日,在十一期間流量達到高峰。對于方框中所有數據均為0 的日期,推斷可能是設備故障等原因,通過對2020 年數據進行分析后,發現該場所同時間段內數據依然為0,經過調查得知,該時間段為商場店慶,停車場免費開放,因此無數據記錄產生。

5 結束語

本文基于駐留行為數據,設計一種交互式的可視分析系統,使用可視化視圖發現具有時空伴隨關系的用戶,對駐留場所的流量分布、來源等特征進行多時段的可視分析。可視化視圖包含多變量表達的示意性地圖、空間特征視圖、時間甘特圖、熱力日歷圖等多種視圖,具有良好的可拓展性,適用于旅游數據分析、城市功能區分析等業務場景。通過網吧和停車場兩個真實數據集的案例分析驗證了該系統對于駐留行為數據的可視分析任務的有效性。下一步將對多視圖之間的交互聯動方式進行研究,運用人機交互技術增強可視化系統效率,提升用戶界面的交互體驗。

猜你喜歡
可視化用戶分析
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
隱蔽失效適航要求符合性驗證分析
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 中文字幕日韩丝袜一区| 国产97色在线| 精品成人免费自拍视频| 亚洲欧洲日韩久久狠狠爱| 中文字幕在线观| 中文字幕在线看| 欧美第一页在线| 欧美19综合中文字幕| 伊人久久福利中文字幕| 国产一区二区在线视频观看| 亚洲男人在线天堂| 丁香五月激情图片| 97超碰精品成人国产| 无码电影在线观看| 亚洲色图欧美视频| 97青草最新免费精品视频| 久久久久免费看成人影片| 久久不卡国产精品无码| 制服丝袜 91视频| 欧美在线免费| 日韩欧美视频第一区在线观看| 亚洲天堂视频在线播放| 亚洲精品va| 亚洲视频免费播放| 激情乱人伦| 欧美亚洲一二三区| 为你提供最新久久精品久久综合| 99精品免费欧美成人小视频| 日韩A级毛片一区二区三区| 一级毛片免费不卡在线| 久久精品女人天堂aaa| 精品久久人人爽人人玩人人妻| 一区二区午夜| 国产欧美在线视频免费| 国产二级毛片| 久久精品亚洲专区| 午夜在线不卡| 手机精品视频在线观看免费| 欧美一级在线| 久久99精品国产麻豆宅宅| av无码一区二区三区在线| 91精品国产91久无码网站| 在线日韩一区二区| 999精品视频在线| 国产精品太粉嫩高中在线观看| 成人中文在线| 国产全黄a一级毛片| 精品91视频| 综合色88| 毛片视频网址| 高清色本在线www| 亚洲中文字幕23页在线| 九色91在线视频| 国产欧美专区在线观看| 日韩123欧美字幕| 国产欧美日韩一区二区视频在线| 国内精品久久久久鸭| 一区二区午夜| 国产91透明丝袜美腿在线| 欧美一区二区自偷自拍视频| 亚洲h视频在线| 操操操综合网| 在线视频亚洲色图| 狠狠做深爱婷婷综合一区| 制服丝袜亚洲| 欧美在线国产| 色老头综合网| 亚洲天堂首页| 国产亚洲精品yxsp| 国产自在线拍| 暴力调教一区二区三区| 国产亚洲欧美日韩在线一区二区三区| 国产91视频免费| 欧美激情,国产精品| 国产精品 欧美激情 在线播放| 伊人91视频| 热久久国产| 亚洲AV免费一区二区三区| 亚洲欧美日韩另类在线一| 欧美性精品不卡在线观看| 一区二区三区成人| 亚洲伊人天堂|