999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HDFS的海量激光點云數據分塊存儲方法研究

2014-08-16 03:09:52李廣云李明磊
測繪通報 2014年3期
關鍵詞:方法

張 蕊,李廣云,王 力,李明磊

(1. 信息工程大學,河南 鄭州 450052; 2. 華北水利水電大學,河南 鄭州 450045)

一、引 言

海量激光點云數據的存儲和處理技術是目前地理信息系統和測量系統的一個重要研究方向。由車載系統所獲取的建筑物坐標數據或三維激光掃描系統所獲取的實測場景數據一般為全離散矢量距離點構成的“點云”數據[1],為給后期點云數據的高效處理做準備,目前傳統的技術是預先基于內存對點云構建索引以實現數據的有效存儲[2-3],當每個數據文件只有KB或MB時,該技術效果顯著。

然而對于海量離散點云數據,數量級達到了GB或甚至為TB,并由于單機內存的限制,無法再根據傳統的基于全內存的方法對數據進行處理。文獻[4—7]中提出了幾種基于外存或數據庫的數據存儲方法,無法滿足點云數據后期處理過程中的交互需求[8]。為達到在現有計算機硬件水平下進行海量點云數據快速處理的效果,近年來計算機領域延伸和發展了許多新技術,其中以Google的GFS和Hadoop的HDFS(hadoop distributed file system)最為著名,本文基于HDFS對海量點云數據文件的分塊策略提出了新的方法。

二、基于Hadoop的HDFS存儲系統

大數據技術包括大數據的存儲、計算、管理到恢復等多個方面。其中大數據的存儲策略是大數據高效處理過程中需要解決的首要關鍵問題。Hadoop/MapReduce在大數據存儲與數據處理方面扮演著重要的角色。Hadoop是一個基于云計算平臺的分布式系統基礎架構,是一個用來處理大規模數據的軟件平臺,能可靠地存儲和處理PB級數據,且可通過普通機器組成的服務集群來存儲和處理數據,服務集群可達數千個節點[8]。

Hadoop是一種典型的主從式結構,主要由HDFS和MapReduce組成,其結構如圖1所示。其中HDFS負責對海量數據進行分布式存儲,具有可靠性高、擴展性強、成本低等優勢,它的開源性、高容錯性及可以部署在廉價的硬件設備上的特點是其成為云存儲研究的熱點之一[9]。

圖1 Hadoop基礎架構

文件系統是支持上層應用的基礎。Hadoop由于有HDFS在底層作支撐,可以方便地實現“計算向存儲的遷移”,這與傳統的并行處理技術MPI(message passing interface)有本質區別,處理TB或PB級的海量數據具有很大的優勢。HDFS分布式文件系統體系結構如圖2所示,HDFS由一個名字節點(Namenode)和多個數據節點(Datanode)組成。Namenode是集群中的中心服務器,負責管理文件系統的命名空間(Namespace)以及客戶端對文件的訪問。數據節點通常是多個,一個節點運行一個數據節點進程,負責管理它所在節點上的數據存儲[10]。

圖2 HDFS體系結構

三、海量激光點云數據的數據結構

為描述由激光掃描儀所測量的各個掃描點的詳細信息,本文把點云數據的數據結構設計為

(ID,ρ,θ,α,x,y,z,I,nx,ny,nz,R,G,B)

如圖3所示,由此可獲得掃描點極坐標(ρ,θ,α),根據極坐標原理即可得掃描點P的三維坐標

(1)

I表示回光強度;nx、ny、nz表示由點P的KNN擬合出曲面獲取的法向三分量,如圖4所示;R、G、B表示相機采集照片貼圖后每點的色彩信息。

圖3 激光掃描儀三維坐標系

圖4 法向三分量示意圖

基于激光點云數據的特點,并結合海量數據的存儲技術,本文提出底層采用基于Hadoop的分布式文件系統HDFS存儲數據,在存儲文件之前需要對文件進行分塊處理,采用的分塊方法直接影響對數據的處理和檢索效率。

四、文件分塊策略

在文件分布式存儲過程中,文件分割是其中一個關鍵步驟。HDFS采用了 64 MB的固定文件分塊大小,這個尺寸遠遠大于傳統文件系統的分塊甚至是文件的大小,每個塊及其副本都以普通Linux文件的形式保存在塊服務器上。如何在文件分布式存儲時對文件進行分割,將文件以最優分塊大小進行存儲,是海量數據存儲的一項核心技術,本文對此提出了3種解決方案。

1. 定長分塊(fixed-size partition,FSP)

FSP是通過HDFS配置好的塊大小對文件進行切分,對文件中的激光點云數據進行順序掃描,將點云數據按水平方向均勻分割為若干個大小的數據塊,然后將每個數據塊分別存儲在HDFS系統中的各個數據節點上,把對一個文件的訪問請求轉變為對多個文件分塊的訪問請求,從而達到系統負載均衡,提高數據的高吞吐率。

FSP算法的優點是簡單、性能高,但它對數據插入和刪除非常敏感,處理十分低效,不能根據內容變化作調整和優化。

2. 變長分塊(content-defined partition,CDP)

CDP是將文件分割成長度大小不等的分塊策略。文獻[11]提出制定一個分組因子向量,當需要存儲文件時,先得到該文件的大小,通過將文件大小與分組因子進行比較,得到最優分塊大小。

本文考慮基于文件內容對文件進行數據切分,對不同物體掃描的數據存放在不同的數據塊中。CDP最大的好處為對同一物體掃描得到的數據被分割到一個數據塊中,對數據進行讀取時只需訪問當前塊,無需訪問多個數據塊。但此方法有可能會引起有的數據塊過大,而有的數據塊過小。

春天就要來臨了,這群地球上有名的長途旅行家也要開始為每年的春季大遷徙做準備了。每年春季的3—4月,夏季的7—8月,是馴鹿家族的遷徙時間。那時候,家族中的老老少少齊動身,憑著驚人的耐受力開始路途遙遠的大遷徙。

3. 混合分塊法

如果變長分塊方法可行,能否把定長分塊和變長分塊結合起來,充分發揮二者的優勢,彌補各自的缺陷,是需要研究的另一個難點。

五、試驗結果與分析

本文采用的測試環境為具有6個節點的服務集群,其中一臺為NameNode,五臺為DataNode,硬件環境CPU為Intel core i5-3230M 2.6 GHz,3級緩存,內存8 GB,網絡100 Mbps LAN。數據文件大小375.274 MB,存儲了4個模型的三維點云數據,點數為9 854 757。然后,先后采用傳統方法(即不分塊)、定長分塊和變長分塊方法分別對測試數據進行處理,試驗結果如下所述。

1.傳統方法試驗

4個模型的三維點云放在一個文件中,不分塊,處理過程為:

1) 讀取第一個模型的數據;

2) 按八叉樹進行劃分;

3) 每個點在八叉樹中尋找KNN,按最小二乘平面擬合計算點法向;

4) 按步驟1)—3)依次處理其余三部分數據,處理結果見表1。

表1 用傳統方法對點云數據進行處理

2. FSP試驗

4個模型的三維點云按每塊64 MB進行切分,共分為6塊,最后一塊大小為54.849 MB,處理過程為:

1) 6個數據塊存儲在一組DataNode中;

2) 每個節點進程需要判斷是否從相鄰數據塊中讀取數據(本塊中的當前塊數據是否完全),然后將完整的數據塊按八叉樹進行劃分;

3) 各個進程中數據塊中的各點在相應八叉樹中尋找KNN,計算點法向;

4) 一個節點可能包含多個塊的部分數據,依次執行步驟1)—3),處理結果見表2。

3. CDP試驗

4個模型的三維點云按內容進行切分,共分為4個數據塊,對點云數據進行讀取時只需訪問當前塊,處理過程為:

1) 4個數據塊分別存儲在一組DataNode中;

2) 每個節點進程都將所處理數據按八叉樹進行劃分;

3) 各個數據塊中各點在相應八叉樹中尋找KNN,計算點法向,處理結果見表3。

表2 用FSP法對點云數據進行處理

表3 用CDP法對點云數據進行處理

由試驗結果可以看出,對點云數據進行分塊存儲的效果明顯優于傳統方法。

六、后續工作

對海量數據的存儲是大數據處理的第一步,存儲策略的選擇直接影響到對海量數據的計算和處理效率。對其他數據存儲技術,如數據復制、數據壓縮、重復數據刪除及存儲虛擬化技術等是后續需要研究的工作。

其次,原始的數據存放在HDFS分布式文件系統中,而用戶習慣通過某種DBMS(database management system)來存取數據。因為這樣能夠隱藏文件系統底層技術,方便對數據的管理和用戶操作,可采用分布式數據庫系統HBase存取數據,對數據表中數據進行分區處理的海量數據管理技術是后續需要研究的一個重點。

七、結束語

HDFS文件系統對海量數據進行分布式存儲,具有可靠性高、擴展性強、成本低等優勢,正好滿足當前海量激光點云數據的存儲需求。本文首先構建了海量激光點云數據的數據結構,在此基礎上提出了3種海量點云數據文件的分塊方法,并通過仿真試驗驗證了定長分塊和按內容分塊的有效性,對于混合分塊方法的有效性需進一步研究和驗證。

參考文獻:

[1] 李婕,鐘若飛,趙文吉. 車載激光點云海量數據的管理與快速顯示[J].系統仿真學報,2008,20(S1):33-39.

[2] 謝洪.基于地面三維激光掃描技術的海量點云模型重建關鍵算法研究[D].鄭州:信息工程大學,2013.

[3] 黃先鋒,陶闖,江萬壽,等.機載激光雷達點云數據的實時渲染[J]. 武漢大學學報:信息科學版,2005,30(11):975-978.

[4] KlEIN J, KROKOWSKI J, FISCHER M. The Randomized Sample Tree: a Data Structure for Interactive Walkthroughs in Externally Stored Virtual Environments[C]∥Proceedings of the ACM Symposium on Virtual Reality Software and Technology.[S.l.]:VRST,2002:137-146.

[5] 王晏民,郭明.大規模點云數據的二維與三維混合索引方法[J]. 測繪學報,2012,41(4):605-612.

[6] BOUBEKEUR T, SCHLICK C. Interactive Out-of-core Texturing with Point-sampled Textures[C]∥Proceedings of the 3rd Eurographics.[S.l.]:IEEE,2006:67-73.

[7] PAJAROLA R. Stream-processing Points[C]∥Proc. VIS’05.[S.l.]:IEEE,2005:239-246.

[8] 邰建華. Hadoop平臺下的海量數據存儲技術研究[D]. 大慶:東北石油大學,2012:1-8.

[9] 王永洲.基于HDFS的存儲技術的研究[D]. 南京:南京郵電大學, 2013:13-44.

[10] 張為民,唐劍鋒,羅治國,等. 云計算深刻改變未來[M]. 北京:科學出版社,2009.

[11] 李暉, 樊凱, 王康,等. 云存儲系統中可變分塊大小的塊數據分塊方法:中國,201110350575 [P]. 2012-06-20.

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产日韩精品欧美一区灰| 亚洲欧美自拍一区| 国产精品开放后亚洲| 国产女人爽到高潮的免费视频| AV不卡国产在线观看| 亚洲欧美日韩中文字幕在线一区| 日韩欧美色综合| 在线国产你懂的| 久久久久久国产精品mv| 99久久精品免费观看国产| 亚洲精品少妇熟女| 日本亚洲国产一区二区三区| 成人国产精品一级毛片天堂| 亚洲综合欧美在线一区在线播放| 国产精品无码一二三视频| 色哟哟国产成人精品| 亚洲精品天堂在线观看| 中文字幕伦视频| 精品伊人久久久香线蕉 | 国产视频入口| 久久久久久久久18禁秘| 97免费在线观看视频| 国产精品毛片一区| 国产天天射| 97久久精品人人| 亚洲高清中文字幕| 人人妻人人澡人人爽欧美一区| 久久精品国产亚洲麻豆| 亚洲av无码专区久久蜜芽| 国产在线自乱拍播放| 无码精品一区二区久久久| 欧美国产日韩在线| 国产美女自慰在线观看| 91色爱欧美精品www| 国产综合亚洲欧洲区精品无码| 一级在线毛片| 国产91成人| 亚洲欧美在线综合图区| 欧美人与性动交a欧美精品| 久久超级碰| 在线播放91| 日韩成人在线网站| 国产福利拍拍拍| 日韩精品无码不卡无码| 92午夜福利影院一区二区三区| 亚洲精品国产乱码不卡| 欧美第二区| yjizz国产在线视频网| 日本爱爱精品一区二区| 亚洲免费三区| 一本一道波多野结衣av黑人在线| 亚洲最猛黑人xxxx黑人猛交 | 日韩欧美国产成人| 亚洲天堂区| 午夜视频日本| 亚洲欧洲日产国产无码AV| 99热线精品大全在线观看| 国产拍在线| 色综合久久88色综合天天提莫| 99久久亚洲综合精品TS| 91精品国产91久无码网站| 67194在线午夜亚洲| 在线观看视频99| 久久黄色视频影| 亚洲欧美一级一级a| 怡红院美国分院一区二区| 日韩国产综合精选| 日韩精品一区二区深田咏美| 亚洲第一天堂无码专区| 亚洲欧美一区二区三区麻豆| 欧美日本在线观看| 色妞www精品视频一级下载| 欧美在线黄| 日本免费新一区视频| 亚洲中文无码h在线观看| 日韩欧美国产三级| 国产成人精品无码一区二| 国产网站免费观看| 中日韩一区二区三区中文免费视频| 九色在线视频导航91| 99精品高清在线播放| 日韩大片免费观看视频播放|