999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于城市交通監控大數據的工作位置推理方法

2021-01-21 03:23:22于彥偉趙金東
計算機應用 2021年1期
關鍵詞:區域

陳 凱,于彥偉,趙金東,宋 鵬

(1.煙臺大學計算機與控制工程學院,山東煙臺 264005;2.中國海洋大學計算機科學與技術系,山東青島 266100)

0 引言

隨著各種智能設備(例如車載全球定位系統(Global Positioning System,GPS)、智能手機、攝像頭監控等)的快速發展以及移動社交網絡(例如微博、微信、Twitter 等)的廣泛普及,人們的時空軌跡數據能夠從越來越多的資源中獲取到。針對這些時空軌跡數據的挖掘與行為分析,已經在交通調度、醫療健康、城市計算、推薦系統等各方面得到了廣泛應用。推理用戶的工作位置在實際應用中也變得越來越重要,在產品推薦、精確營銷、交通管控以及城市規劃等方面都有著非常重要的應用前景。例如,如果能夠推理出用戶的工作位置,就可以為他們推薦工作區域附近商場或者娛樂場所的熱門活動。

目前,已存在很多基于不同時空數據源的位置推理研究,主要包括基于移動社交網絡數據的位置推理[1-2]、基于GPS 軌跡數據的位置推理[3-4]、基于智能手機的位置推理[5-6]以及基于智能乘車卡的位置推理[7-8]。

盡管已經存在大量基于時空數據的位置推理方法,但是這些方法在基于城市交通監控大數據的車輛位置推理方面仍存在問題。首先,移動社交媒體數據中并不包含用戶駕駛車輛的位置數據,所以不能用于車輛的位置推理;其次,雖然連續的GPS 軌跡數據在推理用戶位置方面有著很高的精度,但是由于存在隱私保護等原因,很難獲取到私家車大量的GPS軌跡數據進行科學研究。

近些年,在國內各大小城市,交通攝像頭被廣泛部署以監控城市的實時交通狀況,這些智能化的攝像頭能夠實時捕獲到交通車輛的各種信息,比如車牌號、速度以及行駛方向等。因此,無論車輛是否裝有GPS設備,都能夠通過城市的交通監控系統獲取到整個城市所有車輛的行駛軌跡信息。雖然城市交通監控系統的部署正在逐步完善,但是由于安裝和維護的成本問題,交通監控攝像頭的覆蓋范圍仍然有限。此外,交通監控數據是從固定部署的監控攝像頭獲得的,因此觀察到的車輛軌跡數據并不是完整的車輛行駛軌跡。

盡管工作位置推理在當前現代城市管理中非常重要,但是基于交通監控數據的工作位置推理還尚未被探索,這主要因為基于城市交通監控大數據的位置推理問題面臨著巨大挑戰:

1)稀疏性。交通監控攝像頭只部署在城市的部分路口和道路處,所以每輛車每天的行駛軌跡只能被很少的攝像頭記錄到。因此基于交通監控攝像頭的車輛軌跡在時間和空間上都是不完整且稀疏的。

2)噪聲。交通監控攝像頭收集到的信息充滿噪聲。例如,車輛在不同天的工作時間可能出現在多個區域,有些攝像頭因為故障原因可能有些時段并沒有抓拍到經過的車輛,都會導致數據的不一致問題。

3)固定性。由于部署攝像頭的位置是固定的,因此獲取到的車輛空間信息也是固定的。也就是說,車輛軌跡中的位置點僅由固定的攝像頭位置構成。

為了解決上述挑戰,本文提出了一種基于交通攝像頭監控大數據的車主工作位置推理方法。首先,收集了路網、興趣點等上下文數據,通過路網匹配預處理獲得了一個含有攝像頭、興趣點等豐富語義信息的真實路網;其次,通過聚類車輛軌跡中所提取到的起點-終點(Origin-Destination,O-D),獲得車輛重要的停留區域,即候選工作區域;之后,利用所提的訪問時間模式約束,從多個候選區域選擇出最大可能的工作區域;最后,利用所獲取的路網信息及周圍興趣點分布信息提取出車主可達興趣點(Reachable Point Of Interests,RPOI),進一步縮小車主的工作位置范圍。

綜上所述,本文主要工作如下:1)提出并正式定義了基于城市攝像頭交通監控大數據的工作位置推理問題;2)提出了一種基于城市交通監控大數據的工作區域推理方法,通過對車輛軌跡中提取出的O-D 點聚類獲取到可能的候選工作區域,之后利用訪問時間模式約束匹配出最大可能的工作區域。

1 相關工作

本章主要從不同數據源上的位置推理研究介紹相關工作。

1)基于社交網絡數據的位置推理。目前,已存在很多基于社交網絡媒體數據的位置推理方法研究。其中一類工作是基于用戶的推文內容來推理用戶的位置[9-12];但是這些方法只能實現城市級的位置推理。另外一類研究使用用戶的簽到數據或文本信息來推理用戶的位置[2,13-15]。文獻[2]提出了一種利用帶有地理標記的推文數據推理工作位置和家庭位置的方法,準確率達到80%時,誤差范圍在10 km。這類方法主要利用用戶簽到數據的時間、頻率等信息推理用戶的重要位置(例如:家庭和工作地點),由于用戶更喜歡在新到達的興趣點簽到,這類方法推理的準確率往往比較低。還有很多工作利用移動社交網絡中用戶的好友位置信息來推理用戶的位置[1,16-19]。這類研究主要基于半監督學習的框架,利用好友的位置以及社交網絡中好友關系影響傳播模型推理用戶的家庭位置等信息。最近,還有一些研究[20-21]基于社交媒體數據對時空軌跡數據進行語義探索。Yuan 等[20]提出W4(Who+Where+When+What)概率模型,利用地理標記的推文數據,從時間、空間和參與的活動方面標注用戶的移動行為;Wu 等[21]使用高斯混合模型和核密度估計獲取移動記錄在社交媒體數據上相關的語義詞為用戶的移動記錄進行語義標注。

2)基于密集GPS數據的位置推理。當前也存在很多基于密集GPS 軌跡進行位置推理和軌跡理解的研究工作[3-4,22-26]。Krumm 等[3]使用4 種啟發式算法從GPS 軌跡中推理用戶的重要位置,誤差范圍大約60 m。Xiao 等[25]提出了一個通過停留點檢測來為用戶的GPS軌跡進行語義位置建模的方法,例如,為用戶的GPS 軌跡建模成:購物中心→餐館→電影院。Wan等[4]提出了一種基于車輛GPS 數據和興趣點(Point Of Interest,POI)數據從私家車軌跡中挖掘時空語義移動模式的方法,他們設計了一個基于潛在變量的概率生成模型來描述車輛的語義移動性。由于GPS 軌跡數據遠比交通監控點密集,且采樣點任意,因此,這些方法都不適用于交通監控數據中的位置推理研究。

3)基于手機數據的位置推理。一類方法利用手機呼叫詳細記錄(Call Detail Record,CDR)來推理用戶的重要位置[5,27]。Isaacman 等[5]通過聚類的方法將用戶的CDR 數據進行聚類獲得多個簇,之后通過分析數據的多種因素并使用邏輯回歸模型來推理哪些簇是重要的,這些重要的簇就代表用戶的一些重要位置。Alhasoun 等[27]利用CDR 來發現人們在城市范圍內的移動模式,通過識別用戶在白天和晚上花費時間最多的位置來推理用戶的工作位置和家庭位置。另外一類研究工作基于智能手機的各類傳感器數據進行用戶的位置推理[6,28-29]。Do 等[28]利用手機多種傳感器數據(地理坐標、APP日志、藍牙記錄等)對用戶日常訪問的場所進行自動標注。Zhao 等[6]提出了一個基于手機WiFi 掃描列表數據的位置推理方法,具體來說,首先從移動軌跡數據中檢測出活動區域并引入活躍度和多樣性度量來衡量個人的移動性,其次結合用戶在家中的停留時間、晚上外出活動以及工作日和休息日的工作時間等特征來識別用戶的家庭位置和工作位置。

4)基于智能乘車卡數據的位置推理。還有一類相關研究工作就是基于智能乘車卡數據的用戶位置推理方法研究[7-8,30-33]。龍瀛等[7]使用智能乘車卡數據、居民出行調查數據和土地利用圖來識別公交持卡人的居住地、工作地以及通勤出行模式。Munizaga等[31]通過將智能乘車卡數據和GPS數據結合起來,推理乘客在不同情景下的一個起點-終點(上車位置和下車位置)位置矩陣。Ma等[32]使用北京智能卡數據生成用戶的旅行鏈(trip chains),基于構建的旅行鏈,應用聚類算法提取乘客的旅行模式和旅行規律。Tian 等[8]提出了一種從智能乘車卡數據中識別住宅和工作場所位置的方法。該方法首先識別數據中的停車點,其次識別出停車點的路口,接下來考慮停車點附近有沒有其他停車點,最后利用地塊級土地利用地圖進一步細化住宅和工作場所位置的識別。上述方法都是基于公共通勤車數據的重要位置推理研究,公共通勤車在時間和空間上都具有很強的規律性,并且停靠的站點位置固定,而私家車相對來說行車線路不固定,出行的時間也相對隨意,因此這些方法也不能直接應用于基于交通監控數據的工作位置推理問題。

2 問題定義

本章首先給出本文重要的概念定義,其次對基于交通監控大數據的工作位置推理問題進行了定義。

定義1攝像頭記錄。一個攝像頭記錄被定義為一個三元組(vehid,camj,ts),它表示車輛vehid在時間ts時刻經過了攝像頭camj。

定義2車輛軌跡。車輛vehid的軌跡是一個根據時間排序的攝像頭記錄序列,表示為其中每個記錄表示車輛vehid在tsi時刻經過了軌跡中的第i個攝像頭cami。

由定義2 可知,車輛軌跡由經過的所有攝像頭的時間序列構成,考慮車輛的周期性特點,將每一天的數據記為車輛的一條車輛軌跡。一輛車vehid所有的車輛軌跡集合記作TRid。所有車輛的軌跡集合記作TRs。

定義3路網。一個路網表示為G=(N,E),其中:N={n1,n2,…,nm}表示所有路口的集合,E表示路口之間所有路段的集合,ei,j∈E表示從路口ni到路口nj的一條路段。需要注意的是,每個路段都是有方向的,例如路段是不同于路段的,因為它們的方向不同。

定義4興趣點(poi)。每個興趣點表示為(poiid,loc,cat),其中:poiid是興趣點的名稱,loc表示興趣點的地理位置信息(例如經度和緯度),cat表示興趣點的類別。

所有的興趣點構成了興趣點集合POI。本文將基于交通監控大數據的工作位置推理問題定義如下:

問題定義工作位置推理。給定路網G、興趣點集合POI以及車輛的軌跡集合TRs,本文的目標是推理出每位車主最大可能的工作區域位置,并通過對可達興趣點的提取進一步縮小車主的工作位置范圍。

3 基于交通監控數據的工作位置推理方法

3.1 工作位置推理總體框架

圖1 給出了本文提出的工作位置推理方法的總體框架,該框架主要包括3 部分:數據預處理、工作區域推理以及基于外圍信息的可達興趣點提取。數據預處理主要從交通監控數據中提取車輛軌跡,以及將攝像頭和poi映射到路網上;工作區域推理首先提取車輛軌跡中的停留點(例如起點攝像頭和終點攝像頭)進行聚類,獲得候選工作區域,其次使用訪問時間模式約束推理出車主最大可能的工作區域;可達興趣點提取則結合外圍信息將車輛不能達到的興趣點剪枝掉,進一步縮小工作位置范圍。

圖1 本文方法總體框架Fig.1 Overall framework of the proposed method

3.2 數據預處理

3.2.1 提取車輛軌跡

在交通監控數據中,每個攝像頭監控記錄表示為一輛車在某個時間經過某個攝像頭。由定義2 可知,通過車輛的車牌號并根據時間排序的攝像頭記錄可得到車輛軌跡。一般來說,人們的活動往往是遵循以天為周期的,很多研究也驗證了這一點[34-35]。因此本文將每輛車每天經過的攝像頭作為一條車輛軌跡,從原始數據庫提取車輛軌跡,所有的車輛軌跡形成軌跡集合。

3.2.2 路網匹配

路網匹配包括攝像頭與路網的匹配以及poi與路網的匹配。首先,從開源的地圖平臺OpenStreetMap[36]上獲取真實路網。如定義3 所示,一個路網包括路口集合以及路口之間的路段集合。通常來說,監控攝像頭被部署在鄰近路口處的位置,用來獲得所有經過此路段的車輛信息。因此,通過使用攝像頭的位置信息(例如經度和緯度)將攝像頭匹配到相應路段上,就能夠獲得車輛在路網上的不完整軌跡以及行駛方向。

其次,本文從百度地圖上爬取到poi信息,利用經緯度信息將poi匹配到路網中距離它最近的路段上。最終,通過路網匹配獲取得到了一個含有poi和攝像頭等豐富語義信息的真實路網,以方便后續的工作區域推理與可達興趣點的提取。

3.3 工作區域推理

本節將介紹如何為每位車主推理出最大可能的工作區域。推理方法主要包括3 個步驟:1)提取出車輛軌跡中的O-D 對;2)使用密度聚類算法對提取到的O-D點聚類;3)使用訪問時間模式約束推理出車主的最大可能工作區域。

3.3.1 提取O-D對

上班工作是人們每天中最重要的活動之一,通常情況下,人們每天早上從家里出發去工作地點上班,下班后離開工作地點。因此,車主的工作區域往往就隱含在車輛軌跡中的起點和終點附近。雖然基于攝像頭監控的車輛軌跡在時間和空間上都非常稀疏,但可以根據車輛軌跡中的停留點來將整個軌跡劃分成多個子軌跡,這樣可以最大化地利用整個車輛軌跡。具體方法為:判斷車輛軌跡中兩個相鄰攝像頭的時間間隔是否超出了給定的閾值τ,來將整個軌跡劃分成多個子軌跡。其中每個子軌跡中的起點和終點稱為一個O-D對。需要注意的是,O-D 對中的起點和終點其實是監控攝像頭的固定位置。

為了確定時間閾值τ的合理取值,本文統計分析了車輛軌跡中相鄰攝像頭間的時間間隔分布情況。從圖2 可以看出,時間間隔在1 min 以內情況僅占了21%,時間間隔占比最高的區間為1~5 min,占38%左右,可能的原因是相鄰攝像頭之間的距離較遠或者是車輛需要等紅綠燈或堵車等情況。時間間隔在1~2 h 和大于2 h 占比較小,長時間間隔表示車輛在此處有較長時間停留,此位置可能為工作位置或其他重要位置等。

圖2 車輛經過相鄰攝像頭的時間間隔分布Fig.2 Time interval distribution of a vehicle of passing adjacent cameras

3.3.2 聚類O-D點

如前面所述,交通監控攝像頭數據是稀疏的并且存在很多噪聲。為了減少數據稀疏以及噪聲的影響,本文使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法為每輛車提取的O-D 點進行聚類,通過聚類能夠將車輛不經常去的一些地點以及一些因為攝像頭故障原因產生的異常O-D 點排除掉,從而獲得車主經常去的一些重要區域。將所有O-D 點的位置(經緯度)作為輸入數據,通過聚類獲得的包含攝像頭信息的每個簇就代表車主經常訪問的一個區域,工作區域作為最重要的區域之一就隱含在這些簇中。接下來將討論如何從這些簇中選擇最大可能的工作區域。

3.3.3 訪問時間模式約束推理工作區域

通過聚類O-D 點能夠找出車主常去的一些重要區域,例如工作區域、家庭區域、常去的購物商場等。為了進一步從這些區域中找到最大可能的工作區域,本文將利用訪問時間模式約束來推理車主最大可能的工作區域。

通常來講,絕大部分的人都是早上從家里去上班,下午或晚上下班離開工作地點,有時人們也可能中午離開工作地點去吃午飯,下午繼續返回工作地點上班。因此本文提出了一個in/out 訪問時間模式分別表示車主訪問每個區域(簇)中終點攝像頭和起點攝像頭的時間模式,其中,in時間模式記錄著車主進入該區域的時間模式(對應訪問該區域內終點攝像頭的時間),out 時間模式相應地表示離開該區域時的時間模式(對應訪問該區域內起點攝像頭的時間)。如果一個簇中in時間模式中大部分時間是在上午(5:00~11:00),并且out時間模式中大部分的時間是在下午(16:00~22:00),那么這個簇相比于其他的簇來說,更可能是車主的工作區域。

由于不同職業會存在不同的上下班時間的情況,為了最大限度地適應更多職業的上下班時間,本文設置了兩個較長的上下班時間段,上班時間段設為5:00~11:00,下班時間段設為16:00~22:00。

本文采用了基于高斯核的核密度估計(Kernel Density Estimation,KDE)方法去估計每個簇中in和out時間模式中訪問時間的分布情況。將經過攝像頭的時間作為輸入,KDE 可統計出車輛訪問每個簇的時間分布。利用KDE 時間分布,可進一步找出每個簇中in 時間模式中峰值對應的時間ti以及在out時間模式中峰值對應的時間to。通過峰值對應的時間可估算出車輛進入這個區域以及離開這個區域的大概時間區間。根據國家統計局[37]數據統計可知,各類企業就業人員的周平均工作時間約為46 h,平均每天為9 h左右。本文設置了一個日工作時長閾值tw,也就是說,如果to-ti≥tw時,則認為滿足日平均工作時長,可推理出這個區域是車主的一個可能工作區域。由于9 h是各類企業就業人員的平均日工作時長,本文設定日工作時長閾值為tw=7 h。

如果有多個簇符合該時間約束條件,則選擇車輛訪問攝像頭次數最多的簇作為車主最大可能的工作區域。

圖3 展示了對一輛車O-D 點聚類所獲得的三個最大簇的in/out 時間模式分布情況。圖中第一行為三個簇中所有攝像頭的總體訪問時間分布,第二行和第三行分別是in和out時間模式的訪問時間分布。從總體訪問時間分布來看,簇1和簇3在早晚都各有一個時間峰值,簇2 的訪問時間較為分散,沒有明顯峰值;而從in 和out 時間模式分布來看,簇1(真正的工作區域)的in 時間模式在9:00 左右出現了一個明顯峰值,而out時間模式在19:00 左右也出現了明顯峰值,日工作時長為10 h 左右。盡管簇3 的總體時間分布與簇1 相似,但是in 和out 時間模式中訪問時間峰值是完全相反的。根據本文所提的時間模式約束,簇1 更可能是車主的工作區域,而簇3 更可能是車主的家庭區域。

圖3 in/out時間模式的例子Fig.3 Examples of in/out time pattern

3.4 提取可達興趣點

車輛軌跡中存在兩種重要的攝像頭:起點攝像頭(O)和終點攝像頭(D)。設定Ω=為工作區域內的起點攝像頭集合,Φ=為工作區域內的終點攝像頭集合,需要注意的是,有些雙向攝像頭既是起點攝像頭又是終點攝像頭。結合路網中攝像頭以及各興趣點在路網中的位置,獲得車輛經過Φ中攝像頭之后能夠到達哪些興趣點,以及車輛在離開工作區域時從哪些興趣點出發會經過Ω中攝像頭。下面結合起點攝像頭和終點攝像頭,給出車主在工作區域內可達興趣點的定義。

定義5可達興趣點。給定工作區域內的一個興趣點pi,如果車輛經過Φ中攝像頭進入這個區域后,不需要經過其他攝像頭可直接到達pi,同時車輛離開這個區域時從pi出發可直接到達Ω中的攝像頭,則pi被稱作該車主的一個可達興趣點。

下面給出在工作區域內提取可達興趣點的算法。

算法1 提取可達興趣點算法。

如算法1 所示,首先,找出工作區域內距離Ω和Φ中攝像頭r范圍內的所有興趣點作為候選可達興趣點集合,記為P;其次,從集合P中篩選出能直達起點Ω攝像頭的興趣點集合Po,如6)~11)行所示。RoadNet(poi,camo)表示在路網中獲取興趣點poi到攝像頭camo的最短路徑;之后,再篩選出從終點Φ攝像頭出發能直達的興趣點集合Pd,如12)~16)行;最后求出Po與Pd的交集,獲得該車輛的可達興趣點集合RP。

4 實驗與結果分析

本章將在真實數據集上的實驗評估驗證本文所提工作區域推理方法WorkInf(Work Inference)的有效性。

4.1 實驗數據集

本文實驗數據集采用了一個省會城市上的交通監控數據集,以及從多個數據源收集的外圍數據。

1)交通監控數據。該數據集包括2016 年8 月1 號到8 月31 號總共31 d 的從1 704 個監控攝像頭抓拍的4 億多條數據記錄。

2)路網。路網是從開源地圖OpenStreetMap[36]上采集的,選取的路網包括1 034個路口和4 350個路段。

3)興趣點。在百度地圖API(Application Programming Interface)上爬取了相應路網區域內的興趣點集合,包括17 個大類、120個小類。

4.2 實驗設置

4.2.1 真實數據標注

評估實驗需要知道車主真實的工作位置來評估本文方法的有效性,然而在原始交通監控數據中并不包含這部分信息。因此,利用人工標注方法,邀請了實驗室10 名研究生,標注了570 個車主的工作區域位置。人工標記的過程主要分為兩部分:首先將聚類O-D點獲得的簇映射到百度地圖上,并將車輛訪問每個簇的時間進行可視化處理;其次采用投票的方式,讓邀請的同學投票,將票數最多的簇作為該車主真實的工作區域,用以評估本文方法的有效性。

據統計,在交通監控數據中,車輛出現21~31 d 的數據是最多的,因此重點評估該數據區間的車輛,共選取240 輛。為了評估數據稀疏性對方法的影響,又分別在僅出現5~10 d、11~15 d、16~20 d三個數據區間的車輛中各標注了110輛車的工作區域位置。最后,獲得了車輛數據區間為5~31 d 總計570輛車的工作位置區域。

4.2.2 對比算法

根據文獻檢索,目前尚未有使用城市交通監控數據推理重要位置的相關工作。因此本文使用了基本統計方法StatInf(Statistic Inference)作為對比算法。

StatInf方法將車輛的每次停留的位置記為D-O對,D為該停留的最后經過的攝像頭,O 為該停留結束離開時經過的攝像頭,因此,每個D-O對可以認為是車主去往的一個區域。其次,根據訪問頻率,對每個D-O 對進行統計,頻率越高的D-O對表示該車主更頻繁訪問該區域,所以將該D-O 對所在區域作為車主的工作區域。

StatInf+time 方法在StatInf 算法的基礎上,考慮了本文所提的in/out訪問時間模式約束推理最大可能的工作區域。

4.2.3 實驗設置

實驗默認參數設置:停留點時間間隔閾值r=120 min,KDE 模型帶寬設為h=2,DBSCAN 算法參數設置MinPts=20,Eps=1000 m。

4.2.4 評估指標

本文采用準確率評估方法的有效性,定義如下:

其中:N為車輛的總數;若第i輛車的推理工作位置與標注的工作位置區域一致,則ri=1;否則,ri=0。

4.3 性能評估

本節首先評估了所提工作區域推理方法以及對比算法的總體性能,其次評估了數據稀疏性對本文方法的影響。

從表1 中的實驗結果來看,本文所提的WorkInf 方法在不同稀疏的數據以及總的5~31 d數據上的表現都要優于對比算法。在總的5~31 d 數據上,WorkInf 方法準確率達到了89.8%,相比StatInf 算法和StatInf+time 算法分別提升了17 個百分點和6 個百分點,這說明本文所提WorkInf 方法在推理車主工作區域問題上具有較好的性能。主要的原因是因為本文方法通過提取車輛軌跡中所有的停留點,最大限度地利用了整個車輛軌跡,并且使用聚類算法對提取的停留點進行聚類有效獲取到了車輛常去的一些區域,相較于簡單的統計方法來說能夠更好地利用數據的空間信息。另一方面,城市中絕大多數人們的工作都是早出晚歸的,本文提出的in/out訪問時間模式方法充分考慮了工作時間的規律特性,考慮了in/out時間模式的StatInf+time算法的準確率比StatInf算法有明顯的提升(在5~31 d 數據上提升了11 個百分點)也驗證了這一點。通過對車輛軌跡數據時間和空間信息的充分利用,使得本文所提的WorkInf方法達到了較好的性能。

表1 各方法在不同區間的車輛數據上正確推理出工作位置的準確率對比Tab.1 Accuracy comparison of different methods to infer correct work location on vehicle data with different intervals

表1中第2~4列數據展示了所提WorkInf方法和對比算法在不同稀疏的數據上的實驗結果。從實驗結果來看,本文方法在不同稀疏數據上的結果都要優于對比算法,并且WorkInf算法在5~10 d 數據上的結果相比于11~15 d 的結果只降低了1.8 個百分點,而兩個對比算法在5~10 d 數據上的結果相對于11~15 d 的結果有非常明顯的性能下降。這是因為盡管在5~10 d數據上獲取的停留點數量明顯減少,但是WorkInf算法使用的聚類算法對停留點進行聚類依然能夠有效獲取到一些重要區域。而StatInf 算法僅僅對D-O 對的統計次數作為每個區域的重要程度,當車主在多次進入/離開某個區域時,如果經過了該區域附近不同的攝像頭時,統計方法無法將這些不同的攝像頭歸結為同一區域,而是根據每個D-O 對將此區域劃分成多個區域;因此隨著車輛軌跡數量的減少,數據稀疏性的增加,噪聲對對比算法產生的影響越來越大。而本文所提出的WorkInf方法在稀疏的數據上依然表現出很好的性能。

通常來說,車輛的軌跡數據越少,提供的信息就越有限,但是從表1 的實驗結果中可以發現,WorkInf 方法在5~10 d 和11~15 d 的數據中性能并沒有明顯下降,反而比16~20 d 的數據有一定的提升,可能的原因有兩點:1)正如前面所提到的,本文方法最大限度地利用了稀疏數據的時間和空間信息,降低了稀疏數據對本文方法的影響;2)雖然車輛數據增加了,但是數據中的噪聲也會隨之增加。16~20 d 數據中可能還存在部分車輛經過的區域攝像頭覆蓋范圍有限,導致車輛軌跡更加稀疏,使得準確率有所下降。

4.4 參數敏感性評估

本節將評估參數變化對本文方法的影響。評估的參數包括時間間隔參數τ、聚類算法參數MinPts和Eps以及KDE算法帶寬參數h。

圖4是本文方法在參數τ從60 min變化到300 min的準確率曲線。從圖4 中可以看出,當120 ≤τ≤240 時達到最佳性能,而當τ=60 和τ=300 時,準確率有明顯的下降,這是因為:當τ=60時,可能會有很多間隔較短與工作位置不相關的停留點被提取出來,影響了結果的準確性;當τ=300 時準確率是最低的,這是因為時間間隔設置太長,很多重要停留點被丟失。比如,對于那些上午上班、中午回家休息、然后下午繼續工作的人來說,每次在工作地點停留時間一般不會超過300 min,因此工作區域的停留點會被丟棄掉,導致本文方法不能夠正確推理出工作區域。

圖5 展示了在21~31 d 數據集上變化聚類算法參數MinPts從5到40,Eps從500 m 到1 500 m 的準確率結果。如圖5 所示,隨著MinPts的增加,各個Eps結果的準確率均呈現先升后降趨勢。這可能是因為當MinPts數值較小時,聚類之后會獲得很多個不相關的簇,對實驗準確率產生一定影響;而當MinPts值(MinPts>20)太大時,使得很多重要的簇(包含工作區域)被合并,因此導致準確率急劇下降。

圖4 時間間隔τ與準確率的關系Fig.4 Relationship between time interval τ and accuracy

圖5 核心點數量MinPts和鄰域半徑Eps與準確率的關系Fig.5 Relationship between core point number MinPts and neighborhood radius Eps and accuracy

接下來分析當MinPts=20 時,Eps變化對準確率的影響。從實驗結果中可以看出,Eps=1000 時達到最佳性能。Eps=500 時,準確率最低,這是因為Eps=500 時范圍較小,通過聚類之后可能很多重要區域被劃分成了多個子區域,導致準確率降低;當Eps≥1250 時,相比于Eps=1000 來說準確率略有降低,這是因為聚類范圍較大,通過聚類獲得的簇中會包含很多不相關的停留點,這也會對本文方法性能產生一定影響。

圖6展示了本文方法在帶寬參數h從1~5 h變化時的準確率。從圖6 中可以看出,隨著橫坐標帶寬變化,準確率基本都保持平穩的狀態。這是因為帶寬變化對訪問時間分布中峰值影響不大,也就是說,峰值點對應的大體時間沒有變化,因此參數h的變化對本文方法準確率影響不大。

圖6 帶寬h與準確率的關系Fig.6 Relationship between bandwidth h and accuracy

4.5 案例分析

本節以案例分析的方式展示所提可達興趣點提取方法的有效性。首先,利用所提的工作區域推理方法可獲取到車主的最大可能工作區域,如圖7 所示為獲取某車輛的工作區域,其中起點攝像頭集合和終點攝像頭集合分別為:Ω=圖中實線箭頭表示車輛在經過Φ中攝像頭之后可能去往的方向,虛線箭頭表示經過Ω中攝像頭離開工作區域的方向。表2 為該工作區域內各興趣點和可達興趣點的數量。設p1和p2表示圖中兩個興趣點的位置。當車輛經過Φ中攝像頭進入這個區域時,根據實線箭頭可以看出,車輛可以往三個方向行駛,因此車輛能夠到達興趣點p1和p2。而車輛在離開這個區域時,需經過Ω中攝像頭,根據圖中的路線能夠看出,車輛在離開p2時,是很難直接到達Ω中攝像頭,而需要繞過幾個其他攝像頭,因此p2不是可達興趣點,要被剪枝掉。最后獲取到的該車主在該區域各類別的可達興趣點如表2 所示。對比表2 中各類POI 數量可以看出,POI 總的數量從49 減少到24,POI 類別從7 類減少到6 類,驗證了可達興趣點提取方法在縮小車主工作位置范圍及興趣點類別方面是有效的。

圖7 提取可達興趣點案例Fig.7 Case of extracting RPOI

表2 各類興趣點和可達興趣點數量Tab.2 Number of POIs and RPOIs of different categories

5 結語

本文提出了一個基于城市交通監控大數據的車輛工作位置推理方法。該方法首先通過路網匹配的方法得到了一個含有攝像頭、興趣點等豐富語義信息的真實路網;其次,通過聚類方法獲取車輛一些重要的經常訪問的區域;之后,利用所提的in/out訪問時間模式約束,從多個候選區域選擇出最大可能的工作區域;最后利用所獲取的路網信息及周圍興趣點分布提取出工作區域中的可達興趣點,進一步縮小車主工作位置的范圍。在真實數據上的實驗評估和案例分析驗證了本文方法的有效性。

城市交通監控數據不僅包含車輛的工作位置信息,還包含其他有趣的活動信息,如購物活動和娛樂活動等,因此,在之后的工作中,將城市交通監控數據與上下文興趣點數據相結合來探索挖掘車輛的移動模式。

猜你喜歡
區域
分割區域
探尋區域創新的密碼
科學(2020年5期)2020-11-26 08:19:22
基于BM3D的復雜紋理區域圖像去噪
軟件(2020年3期)2020-04-20 01:45:18
小區域、大發展
商周刊(2018年15期)2018-07-27 01:41:20
論“戎”的活動區域
敦煌學輯刊(2018年1期)2018-07-09 05:46:42
區域發展篇
區域經濟
關于四色猜想
分區域
公司治理與技術創新:分區域比較
主站蜘蛛池模板: m男亚洲一区中文字幕| 中文字幕 日韩 欧美| 亚洲天堂色色人体| 日本精品视频一区二区| 亚洲成a∧人片在线观看无码| 日本午夜影院| 亚洲啪啪网| 国产精品手机在线观看你懂的| 中文字幕精品一区二区三区视频| 免费人成网站在线观看欧美| 亚洲码在线中文在线观看| 中文字幕人妻av一区二区| 婷婷亚洲综合五月天在线| 97精品久久久大香线焦| 亚洲精品视频网| 热99精品视频| 成人国产免费| 中文字幕亚洲专区第19页| 久综合日韩| 欧美69视频在线| 黄片一区二区三区| 激情无码字幕综合| 亚洲国产AV无码综合原创| 色天堂无毒不卡| 日韩av无码精品专区| 91福利国产成人精品导航| 在线精品自拍| 一本综合久久| 亚洲精品国产成人7777| 亚洲丝袜第一页| 成人无码一区二区三区视频在线观看| 91www在线观看| 欧美激情首页| 99在线视频免费| 青青操国产视频| 色偷偷av男人的天堂不卡| 国产精品成| 在线亚洲天堂| 亚洲欧美另类中文字幕| 小蝌蚪亚洲精品国产| 99久视频| 精品国产一二三区| 亚洲综合经典在线一区二区| 亚洲a免费| 欧洲成人在线观看| 2018日日摸夜夜添狠狠躁| www亚洲天堂| 亚洲一级色| 九色综合伊人久久富二代| 精品视频一区二区三区在线播| 色婷婷在线影院| 久久久久久久久久国产精品| 免费a在线观看播放| 国产成人调教在线视频| 免费无遮挡AV| 激情乱人伦| 黄色网在线免费观看| 国产毛片不卡| 国产欧美日韩专区发布| 蜜臀AV在线播放| 日韩欧美国产区| 美女国内精品自产拍在线播放 | 久久综合九九亚洲一区| 另类专区亚洲| 欧美性精品| 日韩精品久久久久久久电影蜜臀| 狼友av永久网站免费观看| 四虎亚洲精品| 丰满人妻一区二区三区视频| 精品福利视频网| 视频一本大道香蕉久在线播放 | 她的性爱视频| 成人福利一区二区视频在线| 青青操视频免费观看| 日韩人妻少妇一区二区| 国产成人凹凸视频在线| 国产成人久久综合777777麻豆| 久久精品人人做人人爽97| 久久国产成人精品国产成人亚洲| 成人在线观看一区| 无码综合天天久久综合网| 国产欧美日韩综合一区在线播放|