封孝生,張 翀,陳曉瑩,唐九陽,葛 斌
(國防科技大學 信息系統工程重點實驗室, 湖南 長沙 410073)
?
HBase中半結構化時空數據存儲與查詢處理*
封孝生,張翀,陳曉瑩,唐九陽,葛斌
(國防科技大學 信息系統工程重點實驗室, 湖南 長沙410073)
摘要:針對在HBase中如何進行有效的半結構化時空數據存儲和查詢問題展開研究,對該問題進行形式化描述,并利用半結構化處理方法TwigStack提出HBase的半結構化時空數據存儲模型,在此基礎上開展了半結構化的時空范圍查詢和kNN查詢。在真實數據集中進行實驗,與需要硬件配置較高的MongoDB進行了對比,結果表明在普通配置的機器上,所提出的半結構化時空查詢算法與MongoDB性能相近,在實際中具有優勢。
關鍵詞:時空數據;半結構化;HBase;時空范圍查詢;kNN查詢
隨著遙感、通信等技術不斷深入發展與應用,遙感數據規模呈幾何級增長,海量遙感數據的高效的面向時空屬性的檢索對數據庫時空查詢處理技術提出了挑戰。前序工作中大部分都是考慮如何索引和檢索時空屬性,而包含了檢索關鍵字的工作又僅僅是考慮結構化的情況,然而對于檢索遙感數據,問題背景發生了變化。通常,遙感數據本身并不是文字直接表現的數據,如衛星遙感圖像、氣象云圖等,因此檢索遙感數據實際上是對描述遙感數據的元數據(也稱編目)進行檢索,而元數據是用半結構化樹形結構,如可擴展標記語言(eXtensive Markup Language,XML)文件進行描述,那么問題背景就變成了如何針對海量的半結構化數據進行時空+半結構化查詢語言(如XPath)的檢索。……