牟乃夏,徐玉靜,張恒才,陳 潔,張靈先,劉希亮
(1. 山東科技大學測繪科學與工程學院,山東 青島 266590; 2. 中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京100101)
人類的出行活動造就了城市的動態(tài)性。城市中移動對象(人或車輛)的位置變化感知了城市的韻律,是城市動態(tài)性的直接體現[1-2]。隨著城市的急劇擴張,以及人類活動空間頻度和廣度的不斷拓展,人類的出行活動引發(fā)了一系列的社會問題,如交通擁堵、能耗增加、空氣污染等,這些問題影響著人類的生活質量,也一直是城市管理亟待解決的問題。出行活動在帶來一系列問題的同時,出行所產生的軌跡數據也為解決這些問題提供了新的契機。出行軌跡的獲取隨著物聯網和智能移動設備的普及而更加便捷[3-4],由此從這些軌跡(出租車軌跡、公卡刷卡、手機定位、社交網站簽到等數據)數據中挖掘人類活動信息和活動規(guī)律從而探求深層次的移動模式的研究已經廣泛開展[5-6]。基于相似性的空間聚類是挖掘軌跡隱含的語義信息的重要方法[7],它通過分析軌跡數據的時間、空間和其他屬性信息,將相似的數據聚集在一個類簇中,從而發(fā)現一些有意義的信息。如發(fā)現人類的移動模式[8]、城市的不同功能分區(qū)[9]、興趣點和興趣區(qū)域的分布[10-11]等,從而為解決城市問題提供直接的、實時的數據與方法支持。
軌跡數據是一組帶有時間戳并按時間排序的離散點序列。對移動軌跡數據進行挖掘之前,必須要對其模型進行定義,根據軌跡模型的定義,來確定軌跡的相似性度量的衡量標準,從而基于軌跡的相似性對對象進行聚類,進一步挖掘數據的語義信息。本文將不同的移動軌跡數據總結為兩種模型:軌跡點模型與軌跡段模型。
移動對象經過事件觸發(fā)記錄下來的軌跡,或只能反映出行流的軌跡可以用軌跡點模型來表達。軌跡點模型可以表示為
TRa={(ID1,X1,Y1,Ti,v1),(ID2,X2,Y2,T2,v2),…}
(1)
TRb={(ID1,O1,D1,Ti,v1),(ID2,O2,D2,T2,v2),…}
(2)
式(1)表示常規(guī)的軌跡點模型。其中,IDi是軌跡點的唯一標識;(Xi,Yi)是軌跡點在二維平面上的坐標;Ti是軌跡點記錄的時刻;vi是移動對象的其他屬性。式(2)表示OD流模型,模型中的一些參數與式(1)中的相同,Oi和Di分別表示出行流的起始點與終點的坐標。
手機通話數據、WiFi熱點數據、社交網絡簽到數據和公共交通數據(公交卡刷卡、地鐵和公共自行車)等都可以看作是軌跡點模型。該類數據粒度較粗,不能直接反映人類活動的真實軌跡,但能反映人類頻繁活動或到訪的區(qū)域。其中,手機通話數據是基于基站產生的軌跡數據,該類數據的位置點是手機所在的基站位置,數據的精度取決于基站的密度;社交網絡簽到數據為簽到點的位置數據,往往包含著很強的語義信息;公交交通數據是上下車的位置數據,能很好地反映OD流。該類軌跡數據主要應用于城市職住地分析[12-13]、個體活動規(guī)律[14]、城市空間結構發(fā)現[15]等方面的研究。
軌跡段是指通過兩個軌跡點之間的線性插值得到的軌跡段,軌跡段模型可以表示為
TR={SubTr1,SubTr2,…,SubTrn}
(3)
SubTr=(IDsub,trP1,trP2)
(4)
式(3)表示移動對象的一條整軌跡,其由許多子軌跡SubTr組成。式(4)中trP1和trP2表示兩個相鄰的軌跡點。子軌跡段就是由兩個相鄰軌跡點之間進行線性插值得到的。
由GPS終端采集的頻率較高的定位數據得到的軌跡數據可以用軌跡段模型來表達。該類數據具有固定的時間間隔,定位精度較高,如出租車軌跡數據,該類軌跡數據通常受限于道路交通路網[16]。通過對該類數據的挖掘可以實時獲取城市交通狀況,如車速、車流量等反映交通擁堵狀態(tài)的信息[17];還可以發(fā)現城市熱點與預測未來的活動熱點等[18]。
相似性度量標準是對數據進行聚類的基礎,通過相似性度量來確定軌跡點或軌跡段之間的關系,再對軌跡進行聚類分析。最終得到的結果,是簇內相似度盡可能大,簇間相似度盡可能小。因此,需要定義一個軌跡間的相似度衡量標準。對于軌跡點模型,可以根據數據特點和具體分析的需求定義一種距離函數,然后再根據傳統(tǒng)的聚類方法進行聚類。對于軌跡段模型,相似度衡量標準較為復雜,需要判斷各軌跡段在時空上的相似性。下面從空間相似性、時間相似性和時空相似性來說明軌跡點模型和軌跡段模型的相似性衡量標準。
對于軌跡點模型而言,空間相似性就是指空間距離函數(歐氏距離和路網距離)。空間距離函數如下
(5)
式中,(1)表示軌跡點A、B之間的歐氏距離;(2)表示路網距離。
兩條軌跡的空間相似性,是由相同子軌跡段所占比例來確定的兩條軌跡TR1和TR2(如圖1所示),分別表示為[19]
TR1={SubTr1,SubTr2,SubTr3,SubTr4,SubTr5}
(6)
TR2={SubTr1,SubTr6,SubTr7,SubTr8,SubTr9,SubTr4}
(7)

圖1 軌跡段模型
兩條軌跡的空間相似性,可以用重疊部分的軌跡段的累加長度與整條軌跡長度的比值來表示
(8)
式中,lm(TRi,TRj)表示相似軌跡段的長度;ls(TRi)和ls(TRj)分別表示軌跡i和j的總長度。由式(8)可以看出D(TRi,TRj)的取值在[0,1],0表示兩條軌跡完全不相似,1表示兩條軌跡完全相似。
僅僅考慮空間距離對對象進行聚類劃分是不夠的,時間是影響聚類結果的另一個因素。如一個區(qū)域的聚集程度在上午和晚上肯定是不同的,其反映的真實語義也是不同的。因此,需要利用時間屬性來對聚類結果進行過濾。
對于軌跡段模型,時間相似性度量計算公式與式(8)一致,差別在于識別兩個軌跡段的重合依據是時間段。
兩條軌跡的時空相似性度量可以表示為
ST(TRi,TRj)=D(TRi,TRj)×T(TRi,TRj)
(9)
式中,ST(TRi,TRj)的取值在[0,1],0表示完全不相似,1表示完全相似。
聚類是一種非監(jiān)督式學習方法,基于相似性將對象聚集成不同的類簇或子集,使同一個類簇中的對象都具有相似的屬性[20]。可以通過聚類算法來識別用戶感興趣的地點和區(qū)域、發(fā)現異常事件、挖掘軌跡中的序列特征等[21]。
根據軌跡數據模型的不同,選擇相應相似度衡量標準,進而選用合適的聚類方法。對于軌跡點模型,以距離函數作為相似度衡量標準,聚類思想與傳統(tǒng)的聚類方法相同。軌跡段模型要以整條軌跡的時空相似性度量標準來進行聚類分析,具體的聚類方法要與傳統(tǒng)的方法有所不同。
常見的有4種方法:劃分方法、層次方法、基于密度的方法和基于網絡的方法[22]。
3.1.1 劃分方法
劃分方法是將對象集合劃分成k份,每一個劃分表示一個聚類[23]。一般的,以所得到的聚類使得客觀劃分標準(即相似函數,如幾何距離等)最優(yōu)化來達到較好的劃分效果,使結果滿足:①每個聚類簇至少包含一個數據對象(不能有空的簇);②每個數據對象只能屬于一個聚類簇(任意兩個聚類簇交集為空);③使準則函數(方差之和)達到最小值(式(5))。衡量劃分結果的準則為:盡可能地使同一類簇(劃分)之間的數據差異最小,不同類簇(劃分)之間的數據差異最大。
(10)
式中,k表示聚類簇的個數;q表示聚類簇Ci中的所包含的數據對象;mi表示聚類簇Ci的中心點(均值)。
常用的算法包括K-Means[24]、K-Medoids[25]和EM算法[26]等,這些啟發(fā)式算法適合于發(fā)現中小規(guī)模數據集中的球狀簇。Mohamed等提出了一種適用于移動對象軌跡數據聚類的新的K-Means算法,該算法根據移動對象的移動方向、加速度和時間間隔,來確定算法中的聚類數k值,克服了K-Means算法對初始值依賴的缺點[27]。Park等在K-Means基礎上進行了改進,提出了K-Medoids算法,該算法用各聚類的中心點作為參考點,克服了K-Means算法對異常值敏感的缺陷[28]。何彬彬等考慮空間聚類的隨機性和不確定性,基于EM算法和空間對象的Delaunay三角網的鄰近關系,提出了不確定性的空間聚類算法[29]。
3.1.2 層次方法
層次方法是將數據以樹的形式分成若干組,表現形式有兩種:一種是自下而上凝聚層次的聚類方法(AGNES),另一種是自頂而下分解層次的聚類方法(DIANA)[30],如圖2所示。層次聚類算法能產生高質量的聚類,但存在計算和存儲需求大,且缺乏全局目標函數等缺點。層次聚類方法的主要代表算法有BIRCH[31]、CURE[32]和ROCK[33]等。Tu等提出了一種基于BIRCH算法的在線分隔時間序列數據的方法,該方法很容易發(fā)現時間序列模式的變化,時間復雜度也較低,能夠取得更好的分割效果[34]。Shao等提出了一種基于改進的CURE算法的大規(guī)模網絡文本數據聚類算法,CURE算法在大數據集中有較好的伸縮性,因此在大型數據挖掘中應用廣泛[35]。

圖2 凝聚和分解層次聚類方法示意圖
3.1.3 基于密度的方法
基于密度聚類的思想主要是:對于樣本中的每個數據點,在一個給定范圍的區(qū)域(ε)中至少包含某個數量(MinPs)的點[36]。與基于層次聚類和劃分聚類的凸形聚類簇不同,該算法可以發(fā)現任意形狀的聚類簇,而且還可以過濾“噪聲”孤立點。基于密度聚類的方法主要有DBSCAN算法[37]和OPTICS算法[38]。DBSCAN算法在進行聚類時需要設置初始參數ε和MinPs,為了解決這一問題,Ankerst等提出了OPTICS算法,它是一個自動和交互式的聚類方法,該算法不產生明確的數據聚類,而是創(chuàng)建一個基于密度的聚類結構的數據庫,其中包含了很多滿足需求的簇序列[40]。Schoier等提出了一種改進的DBSCAN算法,該算法以Lagrange-Chebychev度量作為相似度指標,來發(fā)現較大空間數據集的單元簇,對于高維較大空間數據集的執(zhí)行效率也較高[39]。Huang等提出了一種基于網格和基于密度的混合聚類算法GRPDBSCAN,該算法可以有效處理噪聲點,運行效率比傳統(tǒng)基于密度的聚類算法要高,并且可以自動地生成ε和MinPs兩個參數[40]。
3.1.4 基于網格的方法
基于網格的方法把對象空間劃分為有限數量的單元,從而形成一個網絡布局,所有的聚類操作都在量化的空間結構上進行[41-42]。該方法的優(yōu)點在于處理速度比較快,而且它的處理時間獨立于數據對象的數量,只和量化空間中每一維的單元數量有關。基于網格的聚類方法的一個難點在于網格大小的選取,Edla等通過使用類簇的邊界來尋找最佳網格粒度的大小[40]。基于網格聚類的算法有STING和CLIQUE等。STING算法是一種基于網格的多分辨率聚類技術,該算法有利于并行化處理,處理效率很高[43]。CLIQUE算法是基于網絡和基于密度聚類方法的結合,適用于高維數據的聚類[44]。
3.1.5 其他聚類方法
鄧敏等為了改善傳統(tǒng)聚類算法對輸入參數的依賴,提出了一種基于場論的空間聚類方法(FTSC),該算法通過使用Delaunay三角網來表示實體間的鄰近程度,因此算法不涉及輸入參數的設置,并且可以發(fā)現任意形狀的簇,具有較強的魯棒性[45]。Izakian等提出了一種自動化模糊聚類粒子群優(yōu)化技術來發(fā)現移動軌跡數據的結構特征,粒子群優(yōu)化方法主要用來找到最優(yōu)聚類簇數量及最佳聚類中心,從而提高算法的性能[46]。Li等基于層次聚類的思想提出了一種移動微聚類算法(moving micro-clustering,MMC),并應用在移動軌跡數據的聚類中[47]。
表1給出了基于幾何聚類的幾種傳統(tǒng)算法各自的優(yōu)缺點。

表1 幾何聚類算法及其優(yōu)缺點
基于道路網絡空間的聚類,即道路約束下的聚類,屬于障礙空間下的聚類[49]。該類聚類方法適用于受限于道路網絡的連續(xù)型軌跡數據,如車輛軌跡數據等。Liu等提出了一種在道路網絡約束條件下的聚類對象模型,給出了約束聚類算法,并驗證了算法的效率[50]。廖律超等結合移動對象的方向信息提出了一種有向密度的快速聚類方法,來提取城市復雜路網的結構信息[51]。實際上,該類聚類方法是基于幾何空間聚類思想的擴展和細化,它更側重于通過交通流及流密度來反映移動對象的特性。基于道路網絡空間聚類,主要在于動態(tài)微觀現象的發(fā)現,以及城市細粒度現象的發(fā)現。
為了得到移動對象在某一聚集的時間段內高流量、強連續(xù)的運動軌跡,通常采用軌跡段模型。軌跡段模型聚類以時空相似性來衡量兩條軌跡段是否相似,需要考慮移動對象的速度、方向和位置[52]。軌跡段的聚類可以分為兩類:移動對象的軌跡段聚類和道路路段劃分聚類。
3.2.1 移動對象的軌跡段聚類
馬林兵等將時空軌跡數據進行離散化處理,利用CLIQUE算法對離散化后的軌跡段進行聚類分析[53]。Lee等提出了一種新的軌跡聚類的劃分-組合(partition-and-group)框架,通過把軌跡劃分成軌跡片段的集合,再把軌跡片段聚集到簇中,基于這種劃分組合框架提出了一個軌跡聚類的算法TRACLUS[54],如圖3所示。

圖3 軌跡段聚類劃分-組合框架
3.2.2 道路路段劃分聚類
道路路段劃分聚類的主要思想:①道路交叉口被看作初始劃分點,將道路劃分成道路片段;②對應于每個道路段的軌跡段可以看作是一個局部聚類簇;③軌跡段需要在道路交通流連續(xù)的基礎上聚類。Han等提出了一種道路網絡感知的方法(NEAT)進行軌跡數據聚類,來發(fā)現一組高密集、高度連續(xù)的移動對象的交通流子軌跡[55],如圖4所示。

圖4 道路路段劃分聚類框架
移動軌跡數據作為社會感知位置大數據的重要表現形式,蘊含了人類活動的時空規(guī)律,表征著城市的脈搏和動態(tài)。通過對這些數據的挖掘和分析,能及時有效地發(fā)現人群移動規(guī)律、探測城市熱點區(qū)域、感知實時交通狀態(tài)、挖掘城市功能分區(qū)等,能真實反映城市的韻律,是城市計算的主要數據源,為解決城市問題提供了科學的數據支撐。聚類是對這些數據進行挖掘和分析的重要方法,也是為進一步研究進行數據處理的基礎環(huán)節(jié)。本文根據不同的軌跡模型定義不同的相似度衡量標準,進一步對兩類軌跡模型的聚類方法進行了詳細的描述,得出聚類方法的關鍵在于相似度衡量標準的確定。
移動軌跡數據聚類方法盡管已經有廣泛的研究,但仍然存在一些挑戰(zhàn),具體體現在以下幾個方面:①對于不同結構的數據,如何準確判斷數據之間的相似性衡量指標,以使聚類方法適合于廣泛存在的異構數據;②對于需要設置初始參數的聚類算法,怎樣才能更準確地設置參數,或實現自適應的聚類方法;③聚類結果的有效性評價一直是時空聚類分析中的難點問題,移動軌跡數據聚類的有效性評價需要更加深入,如何使現有的聚類方法適應動態(tài)軌跡數據也需要進一步研究。
[1] 牟乃夏,張恒才,陳潔,等.軌跡數據挖掘城市應用研究綜述[J].地球信息科學學報,2015,17(10):1136-1142.
[2] 李石堅,齊觀德,張王晟.移動軌跡數據分析與智慧城市[J].中國計算機學會通訊,2012,8(5):31-37.
[3] 李清泉,李德仁.大數據GIS[J].武漢大學學報(信息科學版),2014,39(6):641-644.
[4] 鄭宇.城市計算概述[J].武漢大學學報(信息科學版),2015,40(1):1-13.
[5] YE Y,ZHENG Y,CHEN Y,et al.Mining Individual Life Pattern Based on Location History[C]∥Tenth International Conference on Mobile Data Management:Systems.Taipei:[s.n.],2009.
[6] 劉瑜,康朝貴,王法輝.大數據驅動的人類移動模式和模型研究[J].武漢大學學報(信息科學版),2014,39(6):660-666.
[7] 龔璽,裴韜,孫嘉,等.時空軌跡聚類方法研究進展[J].地理科學進展,2011,30(5):522-534.
[8] 劉瑜,肖昱,高松,等.基于位置感知設備的人類移動研究綜述[J].地理與地理信息科學,2011,27(4):8-13.
[9] YUAN J,ZHENG Y,XIE X.Discovering Regions of Different Functions in a City Using Human Mobility and POIs[C]∥ACM Sigkdd International Conference on Knowledge Discovery and Data Mining.[S.l.]:ACM,2012.
[10] MOUSAVI S M,HARWOOD A,KARUNASEKERA S,et al.Geometry of Interest (GOI):Spatio-temporal Destination Extraction and Partitioning in GPS Trajectory Data[J].Journal of Ambient Intelligence and Humanized Computing,2016:1-16.
[11] PANG L X,CHAWLA S,LIU W,et al.On Detection of Emerging Anomalous Traffic Patterns Using GPS Data[J].Data & Knowledge Engineering,2013,87(9):357-373.
[12] 龍瀛,張宇,崔承印.利用公交刷卡數據分析北京職住關系和通勤出行[J].地理學報,2012,67(10):1339-1352.
[13] 徐金壘,方志祥,蕭世倫,等.城市海量手機用戶停留時空分異分析——以深圳市為例[J].地球信息科學學報,2015,17(2):197-205.
[14] 陳佳,胡波,左小清,等.利用手機定位數據的用戶特征挖掘[J].武漢大學學報(信息科學版),2014,39(6):734-738.
[15] 常曉猛,樂陽,李清泉,等.利用位置的虛擬社交網絡地理骨干網提取[J].武漢大學學報(信息科學版),2014,39(6):706-710.
[16] 李婷,裴韜,袁燁城,等.人類活動軌跡的分類、模式和應用研究綜述[J].地理科學進展,2014,33(7):938-948.
[17] KOBAYASHI T,SHINAGAWA N,WATANABE Y.Vehicle Mobility Characterization Based on Measurements and Its Application to Cellular Communication Systems (Special Issue on Multimedia Mobile Communication Systems)[J].Ieice Transactions on Communications,1999,82(12):2055-2060.
[18] 許寧,尹凌,胡金星.從大規(guī)模短期規(guī)則采樣的手機定位數據中識別居民職住地[J].武漢大學學報(信息科學版),2014,39(6):750-756.
[19] WON J I,KIM S W,BAEK J H,et al.Trajectory Clustering in Road Network Environment[J].IEEE Symposium on Computational Intelligence and Data Mining,2009(3):299-305.
[20] 吳笛,杜云艷,易嘉偉,等.基于密度的軌跡時空聚類分析[J].地球信息科學學報,2015,17(10):1162-1171.
[21] 宋樂怡.海量出租車軌跡數據分析與位置推薦服務[D].上海:華東師范大學,2015.
[22] HAN J,KAMBER M.Data Mining:Concepts and Technique[M].[S.l.]:Morgan Kaufmann Publishers Inc.,2006.
[23] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學報,2008,19(1):48-61.
[24] MACQUEEN J.Some Methods for Classification and Analysis of Multivariate Observations[C]∥Proceedings of Berkeley Symposium on Mathematical Statistics and Probability.[S.l.]:University of California Press,1967.
[25] KAUFMAN L,ROUSSEEUW P J.Finding Groups in Data:An Introduction to Cluster Analysis[M].[S.l.]:John Wiley & Sons,Inc.,2008.
[26] DEMPSTER A,LAIRD N,RUBIN D. Maximum Likelihood Eitimation from Imcomplete Data via EM Algorithm [J].Journal of the Royal Statistical Society:Series B,1977,39:1-38.
[27] MOHAMED O O K,EL-SHARKAWI M E,MOKHTAR H,et al.Mining Moving Objects Trajectories[J].2012.
[28] PARK H S,JUN C H.A Simple and Fast Algorithm for K-medoids Clustering[J].Expert Systems with Applications,2009,36(2):3336-3341.
[29] 何彬彬,方濤,郭達志.基于不確定性的空間聚類[J].計算機科學,2004,31(11):196-198.
[30] ZHONG C,MIAO D,FRNTI P.Minimum Spanning Tree Based Split-and-merge:A Hierarchical Clustering Method[J].Information Sciences,2011,181(16):3397-3410.
[31] ZHANG T,RAMAKRISHNAN R,LINVY M.BIRCH:An Efficient Data Clustering Method for Very Large Databases[J].ACM Sigmod International Conference on Management of Data,1996,25(2):103-114.
[32] ROUSSEEUW P J,KAUFMAN L.Finding Groups in Data[J].Series in Probability & Mathematical Statistics,1990,34(1):111-112.
[33] GUHA S,RASTOGI R,SHIM K.ROCK:A Robust Clustering Algorithm for Categorical Attributes[J].Information Systems,1999,25(5):345-366.
[34] TU Y,LIU Y,LI Z.Online Segmentation Algorithm for Time Series Based on BIRCH Clustering Features[C]∥International Conference on Computational Intelligence and Security.Nanning:SCIS,2010.
[35] SHAO X,CHENG W.Improved CURE Algorithm and Application of Clustering for Large-scale Data[C]∥International Symposium on IT in Medicine and Education (ITME).Guangzhou:IEEE,2011.
[36] HINNEBURG A,KEIM D A.An Efficient Approach to Clustering in Large Multimedia Databases with Noise[C]∥Proceedings of the Fourth Data Mining.New York:AAAI Press,1998.
[37] ESTER M,KRIEGEL H P,SANDER J,et al.A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C]∥Proceeding of the Second International Conference on Knowledge Discovery and Data Mining. Portland:AAAI Press,1996.
[38] ANKERST M,BREUNIG M M,KRIEGEL H,et al.OPTICS:Ordering Points to Identify the Clustering Structure[J].ACM SIGMOD Record,1999,28(2):49-60.
[39] SCHOIER G.On the MDBSCAN Algorithm in a Spatial Data Mining Context[J].Data Mining Concepts Methodologies Tools & Applications,2013,7974:375-388.
[40] EDLA D R,JANA P K.A Grid Clustering Algorithm Using Cluster Boundaries[J].Information and Communication Technologies,2013,15(3):254-259.
[41] 周濤,陸惠玲.數據挖掘中聚類算法研究進展[J].計算機工程與應用,2012,48(12):100-111.
[42] 趙慧,劉希玉,崔海青.網格聚類算法[J].計算機技術與發(fā)展,2010,20(9):83-85.
[43] WANG W,YANG J,MUNTZ R R.STING:A Statistical Information Grid Approach to Spatial Data Mining[C]∥Proceedings of International Conference on Very Large Data Bases.Athens,Greece:Morgan Kaufmann Publishers Inc.,1997.
[44] AGRAWAL R,GEHRKE J,GUNOPULOS D,et al.Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications[J].ACM,1998,27(2):94-105.
[45] 鄧敏,劉啟亮,李光強,等.基于場論的空間聚類算法[J].遙感學報,2010,14(4):694-709.
[46] IZAKIAN Z,MESGARI M S,ABRAHAM A.Automated Clustering of Trajectory Data Using a Particle Swarm Optimization[J].Computers,Environment and Urban Systems,2016,55:55-65.
[47] LI Y,HAN J,YANG J.Clustering Moving Objects[C]∥Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Seattle:ACM,2004.
[48] 賀玲,吳玲達,蔡益朝.數據挖掘中的聚類算法綜述[J].計算機應用研究,2007,24(1):10-13.
[49] TUNG A K H,HOU J,HAN J,et al.Spatial Clustering in the Presence of Obstacles[C]∥2013 IEEE 29th International Conference on Data Engineering.Herdelberg:ICDE,2001:359-367.
[50] LIU W,FENG J,WANG Z.Constrained Clustering Objects on a Spatial Network[C]∥2009 WRI World Congress on Computer Science and Information Engineering.Los Angeles:IEEE,2009.
[51] 廖律超,蔣新華,鄒復民,等.浮動車軌跡數據聚類的有向密度方法[J].地球信息科學學報,2015,17(10):1152-1161.
[52] 王金鳳,邢長征.基于道路網絡的移動對象聚類[J].計算機工程與應用,2016,52(7):74-78.
[53] 馬林兵,李鵬.基于子空間聚類算法的時空軌跡聚類[J].地理與地理信息科學,2014,30(4):7-11.
[54] LEE J G,HAN J,WHANG K Y.Trajectory Clustering:A Partition-and-group Framework[C]∥ACM SIGMOD International Conference on Management of Data.Beijing:ACM,2007.
[55] HAN B,LIU L,OMIECINSKI E.NEAT:Road Network Aware Trajectory Clustering[C]∥IEEE International Conference on Distributed Computing Systems.[S.l.]: IEEE,2012.