999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分布式3D R-Tree索引的軌跡查詢方法研究

2022-02-16 12:10:08王麗明
無線互聯(lián)科技 2022年23期

王麗明,熊 文

(云南師范大學(xué) 信息學(xué)院,云南 昆明 650000)

0 引言

隨著現(xiàn)代城市公共交通系統(tǒng)的發(fā)展,數(shù)以十萬計(jì)的出租車、網(wǎng)約車和公共汽車每天為城市居民提供日常出行服務(wù)。這些車輛均部署了GPS終端設(shè)備,時(shí)刻采集并上報(bào)車輛的GPS軌跡數(shù)據(jù)。如何管理和分析這些軌跡數(shù)據(jù),用來提升運(yùn)營(yíng)水平和服務(wù)質(zhì)量是管理部門面臨的首要問題。如何對(duì)數(shù)以億計(jì)的GPS軌跡進(jìn)行索引和快速響應(yīng)是一個(gè)極具挑戰(zhàn)的難題。

對(duì)于GPS軌跡的存儲(chǔ)和查詢,通常采用構(gòu)建索引等方法來提高查詢效率。Ding[1]利用時(shí)空索引(ST-Index)和連接索引(Con-Index)減少軌跡數(shù)據(jù)冗余的訪問操作。Hanan[2]使用遞歸分解的四叉樹建立索引,當(dāng)節(jié)點(diǎn)達(dá)到最大容量時(shí),可以進(jìn)行分裂,缺點(diǎn)是如果對(duì)象分布不均勻,將會(huì)形成不平衡四叉樹,導(dǎo)致查詢效率急劇下降。此外,還有一些R-Tree的改進(jìn)版本,如IR2-Tree[3],利用疊加文本和R-Tree相結(jié)合來處理指定位置和關(guān)鍵字的查詢。

這些方法都在單節(jié)點(diǎn)實(shí)現(xiàn),在數(shù)據(jù)規(guī)模較小時(shí)可以較好地解決查詢效率的問題。但是,當(dāng)數(shù)據(jù)規(guī)模上升以后,這些方法性能會(huì)持續(xù)下降。因此,本研究嘗試借助大數(shù)據(jù)和分布式索引來解決該問題。本文借助大數(shù)據(jù)計(jì)算引擎的Spark的核心組件RDD,對(duì)3D R-tree[4]進(jìn)行分布式的實(shí)現(xiàn),并使用3個(gè)經(jīng)典查詢,包括軌跡點(diǎn)、子串和區(qū)域查詢,分析運(yùn)行時(shí)間并對(duì)比了空間網(wǎng)格分區(qū)和時(shí)空網(wǎng)格分區(qū)方法下3種查詢類型的性能。

1 背景與動(dòng)機(jī)

以深圳市為例,截至2019年12月,該市擁有公交車1.9萬輛,巡游出租車3萬輛,網(wǎng)約車8萬輛。假設(shè)每輛車每30 s產(chǎn)生一條GPS記錄。這些車輛每天可以產(chǎn)生3.7億條GPS記錄。傳統(tǒng)的索引方式在單機(jī)環(huán)境下顯然沒有能力處理如此規(guī)模的GPS軌跡數(shù)據(jù)。因此,本研究嘗試借助Spark的RDD組件構(gòu)建分布式的時(shí)空索引來應(yīng)對(duì)大規(guī)模軌跡查詢需求。

經(jīng)典軌跡查詢有軌跡點(diǎn)、子串和區(qū)域查詢。本文對(duì)軌跡點(diǎn)查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一個(gè)查詢點(diǎn)q。點(diǎn)查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個(gè)GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T內(nèi)且等于q。如式(1)所示:

Point_query(S,T,q)={tri∈S|?pk∈tri^

pk=q,timemin≤pk.t≤timemax}

(1)

本文對(duì)子串查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一條查詢軌跡q。子串查詢返回所有滿足以下條件的軌跡tri∈S:對(duì)于每一個(gè)pk∈q,均有pk∈tri,且GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T內(nèi)。如式(2)所示:

Substring_query(S,T,q)={tri∈S|q?tri^

pk∈q,timemin≤pk.t≤timemax}

(2)

本文對(duì)區(qū)域查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一個(gè)經(jīng)緯度范圍q=。區(qū)域查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個(gè)GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T和經(jīng)緯度范圍q內(nèi)。如式(3)所示:

Range_query(S,T,q)={tri∈S|?pk∈tri,

timemin≤pk.t≤timemax^latmin≤pk.lat≤

latmax^lngmin≤pk.lng≤lngmax}

(3)

2 數(shù)據(jù)預(yù)處理

車輛所處的位置例如隧道、高樓對(duì)信號(hào)傳輸影響,以及由GPS設(shè)備自身測(cè)量精度導(dǎo)致的局限,導(dǎo)致GPS軌跡數(shù)據(jù)質(zhì)量存在一定的偏差。具體表現(xiàn)是車輛軌跡中部分GPS點(diǎn)不在對(duì)應(yīng)的路網(wǎng)上。因此,需要對(duì)GPS軌跡進(jìn)行校準(zhǔn),本文使用FMM[5]方法對(duì)GPS數(shù)據(jù)進(jìn)行地圖匹配。

3 索引的建立

3.1 數(shù)據(jù)分區(qū)

RDD是一個(gè)分布式的數(shù)據(jù)結(jié)構(gòu),以一個(gè)分區(qū)規(guī)則將數(shù)據(jù)集合劃分為多個(gè)分區(qū)。本研究建立分布式索引,以實(shí)現(xiàn)大規(guī)模軌跡數(shù)據(jù)查詢。本研究使用空間網(wǎng)格和時(shí)空網(wǎng)格兩種分區(qū)方法。

3.2 空間索引

空間索引是指將空間對(duì)象按一定的規(guī)則進(jìn)行排列組織,在查詢時(shí)可以篩選掉大量與特定對(duì)象無關(guān)的空間對(duì)象,提高查詢的速度。本文建立全局索引和局部索引,劃分全局索引的依據(jù)是軌跡所在的網(wǎng)格編號(hào),每個(gè)RDD分區(qū)存儲(chǔ)軌跡的部分片段。在每個(gè)分區(qū)內(nèi)部對(duì)軌跡數(shù)據(jù)構(gòu)建3D R-tree為局部索引。查詢時(shí),通過全局索引定位局部索引,在局部索引樹中執(zhí)行具體查詢。

4 實(shí)驗(yàn)結(jié)果與分析

4.1 數(shù)據(jù)集

本次實(shí)驗(yàn)的數(shù)據(jù)集是以深圳市30 747輛出租車?yán)塾?jì)一周的GPS軌跡數(shù)據(jù),約2.97億條數(shù)據(jù),來建立索引和進(jìn)行查詢。

4.2 實(shí)驗(yàn)對(duì)比

測(cè)試在兩種分區(qū)方法下,位于大鵬區(qū)、坪山區(qū)、龍華區(qū)、龍崗區(qū)和南山區(qū)的軌跡點(diǎn)查詢時(shí)延。查詢時(shí)延是指從提交查詢請(qǐng)求到返回查詢結(jié)果所消耗的時(shí)間。結(jié)果如圖1所示,在不同位置查詢,時(shí)延不同。在空間網(wǎng)格分區(qū)方式下,綜合平均時(shí)延為2.79 s。在時(shí)空網(wǎng)格分區(qū)方式下,綜合平均時(shí)延為2.33 s。

圖1 軌跡點(diǎn)查詢

測(cè)試在兩種分區(qū)方式下,子串查詢長(zhǎng)度分別為5,10,15,20,25個(gè)軌跡點(diǎn)時(shí),子串查詢所需的查詢時(shí)延。結(jié)果如圖2所示,在空間網(wǎng)格方法下,查詢分別需要1.42 s、4.32 s、4.48 s、4.75 s、4.81 s,綜合平均時(shí)延為3.96 s。在時(shí)空網(wǎng)格分區(qū)方式下,查詢分別需要1.35 s、3.73 s、3.80 s、3.84 s、3.96 s,綜合平均時(shí)延為3.33 s。查詢時(shí)延都隨著查詢子串長(zhǎng)度變長(zhǎng)而變長(zhǎng)。

圖2 子串查詢

測(cè)試在兩種分區(qū)方式下,區(qū)域查詢范圍分別為1×1 km2、2×2 km2、3×3 km2、4×4 km2、5×5 km2時(shí),統(tǒng)計(jì)查詢所需時(shí)間。結(jié)果如圖3所示,空間網(wǎng)格方法查詢,分別需要13.79 s、14.04 s、14.36 s、14.93 s、15.33 s,綜合平均時(shí)延為14.49 s。在時(shí)空網(wǎng)格分區(qū)方式下,查詢分別需要2.90 s、4.89 s、6.43 s、8.62 s、11.57 s,綜合平均時(shí)延為6.88 s。查詢時(shí)延都隨著查詢范圍的擴(kuò)大而變長(zhǎng)。

圖3 區(qū)域查詢

5 結(jié)語

本文利用Spark平臺(tái)實(shí)現(xiàn)了基于3D R-Tree的出租車軌跡數(shù)據(jù)查詢,對(duì)比了空間網(wǎng)格和時(shí)空網(wǎng)格兩種分區(qū)方式。實(shí)驗(yàn)表明,在軌跡點(diǎn)查詢下,不同的位置查詢時(shí)延不同;在子串查詢下,查詢軌跡長(zhǎng)度越長(zhǎng),查詢時(shí)延越長(zhǎng);在區(qū)域查詢下,查詢的范圍越大,查詢時(shí)延越長(zhǎng);用時(shí)空網(wǎng)格分區(qū)方法比用空間網(wǎng)格分區(qū)方法的查詢時(shí)延短。在下一步的工作中,本研究計(jì)劃在Spark streaming流式處理框架實(shí)現(xiàn)基于3D R-tree的流式軌跡數(shù)據(jù)查詢。

主站蜘蛛池模板: 91人人妻人人做人人爽男同| 日韩精品一区二区三区大桥未久| 国产午夜人做人免费视频| 欧美中文字幕在线二区| 免费国产不卡午夜福在线观看| 大香伊人久久| 欧美中文一区| 日日噜噜夜夜狠狠视频| 波多野结衣无码AV在线| 中文无码精品a∨在线观看| 国产精品不卡永久免费| 日本成人不卡视频| 国产噜噜噜| 综合久久五月天| 欧美性精品| 色噜噜综合网| 久久久久青草大香线综合精品| 色男人的天堂久久综合| 在线看片免费人成视久网下载| 日韩一区二区在线电影| 亚洲日韩精品欧美中文字幕| 一本色道久久88亚洲综合| 婷婷99视频精品全部在线观看 | 色综合婷婷| 久久综合伊人 六十路| 综合色区亚洲熟妇在线| 色妞永久免费视频| 欧美人与牲动交a欧美精品| аⅴ资源中文在线天堂| 中文字幕一区二区人妻电影| 欧美福利在线观看| 久视频免费精品6| 欧美午夜性视频| 国产熟睡乱子伦视频网站| 国产精品香蕉在线| 在线精品视频成人网| 色综合天天综合中文网| 在线看免费无码av天堂的| 亚洲天堂2014| 国产三级韩国三级理| 国产aⅴ无码专区亚洲av综合网| 国产97色在线| 国产精品无码在线看| 国产91熟女高潮一区二区| 国产成人无码AV在线播放动漫| 香蕉久久国产超碰青草| 国产午夜一级毛片| 亚洲欧洲自拍拍偷午夜色| 啪啪啪亚洲无码| 欧美亚洲日韩不卡在线在线观看| 狠狠操夜夜爽| 国产日韩av在线播放| 99精品国产高清一区二区| 国产成人精品一区二区三区| 国产在线八区| 成年人视频一区二区| 91精品人妻一区二区| 欧美不卡视频在线观看| 精品福利视频导航| 91免费国产在线观看尤物| 日本不卡视频在线| 欧美a级完整在线观看| 狠狠躁天天躁夜夜躁婷婷| 国产农村妇女精品一二区| 色欲不卡无码一区二区| 日本在线免费网站| 91青青草视频在线观看的| 亚洲成人精品| 久久精品亚洲专区| 天天爽免费视频| 国产欧美在线视频免费| 中文字幕在线日韩91| 四虎亚洲精品| a毛片在线| 国产人成午夜免费看| 欧美视频免费一区二区三区| 欧美国产日产一区二区| 亚洲国产精品美女| 国产香蕉国产精品偷在线观看| 亚洲天堂精品视频| 久草青青在线视频| 99热免费在线|