999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分布式3D R-Tree索引的軌跡查詢方法研究

2022-02-16 12:10:08王麗明
無線互聯(lián)科技 2022年23期

王麗明,熊 文

(云南師范大學(xué) 信息學(xué)院,云南 昆明 650000)

0 引言

隨著現(xiàn)代城市公共交通系統(tǒng)的發(fā)展,數(shù)以十萬計(jì)的出租車、網(wǎng)約車和公共汽車每天為城市居民提供日常出行服務(wù)。這些車輛均部署了GPS終端設(shè)備,時(shí)刻采集并上報(bào)車輛的GPS軌跡數(shù)據(jù)。如何管理和分析這些軌跡數(shù)據(jù),用來提升運(yùn)營(yíng)水平和服務(wù)質(zhì)量是管理部門面臨的首要問題。如何對(duì)數(shù)以億計(jì)的GPS軌跡進(jìn)行索引和快速響應(yīng)是一個(gè)極具挑戰(zhàn)的難題。

對(duì)于GPS軌跡的存儲(chǔ)和查詢,通常采用構(gòu)建索引等方法來提高查詢效率。Ding[1]利用時(shí)空索引(ST-Index)和連接索引(Con-Index)減少軌跡數(shù)據(jù)冗余的訪問操作。Hanan[2]使用遞歸分解的四叉樹建立索引,當(dāng)節(jié)點(diǎn)達(dá)到最大容量時(shí),可以進(jìn)行分裂,缺點(diǎn)是如果對(duì)象分布不均勻,將會(huì)形成不平衡四叉樹,導(dǎo)致查詢效率急劇下降。此外,還有一些R-Tree的改進(jìn)版本,如IR2-Tree[3],利用疊加文本和R-Tree相結(jié)合來處理指定位置和關(guān)鍵字的查詢。

這些方法都在單節(jié)點(diǎn)實(shí)現(xiàn),在數(shù)據(jù)規(guī)模較小時(shí)可以較好地解決查詢效率的問題。但是,當(dāng)數(shù)據(jù)規(guī)模上升以后,這些方法性能會(huì)持續(xù)下降。因此,本研究嘗試借助大數(shù)據(jù)和分布式索引來解決該問題。本文借助大數(shù)據(jù)計(jì)算引擎的Spark的核心組件RDD,對(duì)3D R-tree[4]進(jìn)行分布式的實(shí)現(xiàn),并使用3個(gè)經(jīng)典查詢,包括軌跡點(diǎn)、子串和區(qū)域查詢,分析運(yùn)行時(shí)間并對(duì)比了空間網(wǎng)格分區(qū)和時(shí)空網(wǎng)格分區(qū)方法下3種查詢類型的性能。

1 背景與動(dòng)機(jī)

以深圳市為例,截至2019年12月,該市擁有公交車1.9萬輛,巡游出租車3萬輛,網(wǎng)約車8萬輛。假設(shè)每輛車每30 s產(chǎn)生一條GPS記錄。這些車輛每天可以產(chǎn)生3.7億條GPS記錄。傳統(tǒng)的索引方式在單機(jī)環(huán)境下顯然沒有能力處理如此規(guī)模的GPS軌跡數(shù)據(jù)。因此,本研究嘗試借助Spark的RDD組件構(gòu)建分布式的時(shí)空索引來應(yīng)對(duì)大規(guī)模軌跡查詢需求。

經(jīng)典軌跡查詢有軌跡點(diǎn)、子串和區(qū)域查詢。本文對(duì)軌跡點(diǎn)查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一個(gè)查詢點(diǎn)q。點(diǎn)查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個(gè)GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T內(nèi)且等于q。如式(1)所示:

Point_query(S,T,q)={tri∈S|?pk∈tri^

pk=q,timemin≤pk.t≤timemax}

(1)

本文對(duì)子串查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一條查詢軌跡q。子串查詢返回所有滿足以下條件的軌跡tri∈S:對(duì)于每一個(gè)pk∈q,均有pk∈tri,且GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T內(nèi)。如式(2)所示:

Substring_query(S,T,q)={tri∈S|q?tri^

pk∈q,timemin≤pk.t≤timemax}

(2)

本文對(duì)區(qū)域查詢形式化定義如下:給定一個(gè)軌跡集合S,一個(gè)查詢時(shí)間范圍T=,一個(gè)經(jīng)緯度范圍q=。區(qū)域查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個(gè)GPS點(diǎn)pk產(chǎn)生于時(shí)間范圍T和經(jīng)緯度范圍q內(nèi)。如式(3)所示:

Range_query(S,T,q)={tri∈S|?pk∈tri,

timemin≤pk.t≤timemax^latmin≤pk.lat≤

latmax^lngmin≤pk.lng≤lngmax}

(3)

2 數(shù)據(jù)預(yù)處理

車輛所處的位置例如隧道、高樓對(duì)信號(hào)傳輸影響,以及由GPS設(shè)備自身測(cè)量精度導(dǎo)致的局限,導(dǎo)致GPS軌跡數(shù)據(jù)質(zhì)量存在一定的偏差。具體表現(xiàn)是車輛軌跡中部分GPS點(diǎn)不在對(duì)應(yīng)的路網(wǎng)上。因此,需要對(duì)GPS軌跡進(jìn)行校準(zhǔn),本文使用FMM[5]方法對(duì)GPS數(shù)據(jù)進(jìn)行地圖匹配。

3 索引的建立

3.1 數(shù)據(jù)分區(qū)

RDD是一個(gè)分布式的數(shù)據(jù)結(jié)構(gòu),以一個(gè)分區(qū)規(guī)則將數(shù)據(jù)集合劃分為多個(gè)分區(qū)。本研究建立分布式索引,以實(shí)現(xiàn)大規(guī)模軌跡數(shù)據(jù)查詢。本研究使用空間網(wǎng)格和時(shí)空網(wǎng)格兩種分區(qū)方法。

3.2 空間索引

空間索引是指將空間對(duì)象按一定的規(guī)則進(jìn)行排列組織,在查詢時(shí)可以篩選掉大量與特定對(duì)象無關(guān)的空間對(duì)象,提高查詢的速度。本文建立全局索引和局部索引,劃分全局索引的依據(jù)是軌跡所在的網(wǎng)格編號(hào),每個(gè)RDD分區(qū)存儲(chǔ)軌跡的部分片段。在每個(gè)分區(qū)內(nèi)部對(duì)軌跡數(shù)據(jù)構(gòu)建3D R-tree為局部索引。查詢時(shí),通過全局索引定位局部索引,在局部索引樹中執(zhí)行具體查詢。

4 實(shí)驗(yàn)結(jié)果與分析

4.1 數(shù)據(jù)集

本次實(shí)驗(yàn)的數(shù)據(jù)集是以深圳市30 747輛出租車?yán)塾?jì)一周的GPS軌跡數(shù)據(jù),約2.97億條數(shù)據(jù),來建立索引和進(jìn)行查詢。

4.2 實(shí)驗(yàn)對(duì)比

測(cè)試在兩種分區(qū)方法下,位于大鵬區(qū)、坪山區(qū)、龍華區(qū)、龍崗區(qū)和南山區(qū)的軌跡點(diǎn)查詢時(shí)延。查詢時(shí)延是指從提交查詢請(qǐng)求到返回查詢結(jié)果所消耗的時(shí)間。結(jié)果如圖1所示,在不同位置查詢,時(shí)延不同。在空間網(wǎng)格分區(qū)方式下,綜合平均時(shí)延為2.79 s。在時(shí)空網(wǎng)格分區(qū)方式下,綜合平均時(shí)延為2.33 s。

圖1 軌跡點(diǎn)查詢

測(cè)試在兩種分區(qū)方式下,子串查詢長(zhǎng)度分別為5,10,15,20,25個(gè)軌跡點(diǎn)時(shí),子串查詢所需的查詢時(shí)延。結(jié)果如圖2所示,在空間網(wǎng)格方法下,查詢分別需要1.42 s、4.32 s、4.48 s、4.75 s、4.81 s,綜合平均時(shí)延為3.96 s。在時(shí)空網(wǎng)格分區(qū)方式下,查詢分別需要1.35 s、3.73 s、3.80 s、3.84 s、3.96 s,綜合平均時(shí)延為3.33 s。查詢時(shí)延都隨著查詢子串長(zhǎng)度變長(zhǎng)而變長(zhǎng)。

圖2 子串查詢

測(cè)試在兩種分區(qū)方式下,區(qū)域查詢范圍分別為1×1 km2、2×2 km2、3×3 km2、4×4 km2、5×5 km2時(shí),統(tǒng)計(jì)查詢所需時(shí)間。結(jié)果如圖3所示,空間網(wǎng)格方法查詢,分別需要13.79 s、14.04 s、14.36 s、14.93 s、15.33 s,綜合平均時(shí)延為14.49 s。在時(shí)空網(wǎng)格分區(qū)方式下,查詢分別需要2.90 s、4.89 s、6.43 s、8.62 s、11.57 s,綜合平均時(shí)延為6.88 s。查詢時(shí)延都隨著查詢范圍的擴(kuò)大而變長(zhǎng)。

圖3 區(qū)域查詢

5 結(jié)語

本文利用Spark平臺(tái)實(shí)現(xiàn)了基于3D R-Tree的出租車軌跡數(shù)據(jù)查詢,對(duì)比了空間網(wǎng)格和時(shí)空網(wǎng)格兩種分區(qū)方式。實(shí)驗(yàn)表明,在軌跡點(diǎn)查詢下,不同的位置查詢時(shí)延不同;在子串查詢下,查詢軌跡長(zhǎng)度越長(zhǎng),查詢時(shí)延越長(zhǎng);在區(qū)域查詢下,查詢的范圍越大,查詢時(shí)延越長(zhǎng);用時(shí)空網(wǎng)格分區(qū)方法比用空間網(wǎng)格分區(qū)方法的查詢時(shí)延短。在下一步的工作中,本研究計(jì)劃在Spark streaming流式處理框架實(shí)現(xiàn)基于3D R-tree的流式軌跡數(shù)據(jù)查詢。

主站蜘蛛池模板: 亚洲欧洲日韩国产综合在线二区| 日韩经典精品无码一区二区| 欧美日韩精品一区二区视频| 国产偷倩视频| 日韩大片免费观看视频播放| 亚洲激情区| 欧美成人A视频| 亚洲精品视频在线观看视频| 久久精品人人做人人综合试看| 久久免费看片| 天天做天天爱夜夜爽毛片毛片| 国产在线精品人成导航| 国产极品嫩模在线观看91| 亚洲男人天堂2020| 国产精品久久久久久久久| 色天天综合久久久久综合片| 久久久久免费精品国产| 黄色网页在线观看| 国产欧美在线观看一区| 国产成年无码AⅤ片在线 | 中字无码av在线电影| 久久久久亚洲精品成人网| 国产高潮流白浆视频| 一级黄色网站在线免费看| 国产美女无遮挡免费视频网站| 国产精品黄色片| 亚洲大尺度在线| 国产成人h在线观看网站站| 亚洲欧美成人网| 激情视频综合网| 欧美在线黄| 日本免费高清一区| 国产精品亚洲天堂| 国产尤物jk自慰制服喷水| 国产精品刺激对白在线| 成人午夜天| 午夜精品久久久久久久99热下载| 亚洲最大福利视频网| 精品黑人一区二区三区| 久久伊人操| 免费观看亚洲人成网站| 日韩精品无码一级毛片免费| 日韩第一页在线| 一级毛片不卡片免费观看| 女同久久精品国产99国| 无码人中文字幕| 亚洲无码视频一区二区三区| 欧美www在线观看| 天天躁日日躁狠狠躁中文字幕| 久久99国产综合精品1| 四虎精品国产永久在线观看| 在线精品亚洲一区二区古装| 色哟哟国产精品| 国产精品久久精品| 国产真实乱了在线播放| 黄色网站在线观看无码| 免费人欧美成又黄又爽的视频| 色亚洲成人| 青青操视频在线| 色有码无码视频| 国模沟沟一区二区三区| 三上悠亚精品二区在线观看| 久草中文网| 久久综合伊人 六十路| 亚洲视频欧美不卡| 国产精品流白浆在线观看| 亚洲福利网址| 狼友视频一区二区三区| 黄色网页在线播放| 99re在线视频观看| 国产黄色爱视频| 国产无码网站在线观看| 成人欧美在线观看| 久久精品国产999大香线焦| 尤物国产在线| 国产一级毛片高清完整视频版| 国产三级韩国三级理| 亚洲美女高潮久久久久久久| 制服无码网站| 9966国产精品视频| 亚洲欧美另类色图| 99r在线精品视频在线播放|