祝官文, 周連科, 王念濱, 劉丹
(哈爾濱工程大學 計算機科學與技術學院,黑龍江 哈爾濱 150001)
?
基于查詢意圖的數據空間預取方法
祝官文, 周連科, 王念濱, 劉丹
(哈爾濱工程大學 計算機科學與技術學院,黑龍江 哈爾濱 150001)
摘要:為在查詢前預取用戶可能訪問的數據,提出了一種利用查詢日志的數據空間預取方法。該方法從查詢日志中提取意圖特征,并采用聚類技術對其進行聚類,識別用戶查詢意圖,并基于該意圖預取查詢結果。實驗結果表明:該方法在預取準確率和查詢效率方面均顯著優于已有方法。
關鍵詞:數據空間;預取;查詢意圖;聚類;查詢日志;查詢結果;預取準確率;查詢效率
在大數據時代,數據呈現海量、多樣等特點,面對這些新的數據管理特點,傳統的數據管理系統已無法滿足當今用戶的需求,為此,Michael Franklin等[1]提出了一種嶄新的數據管理思想——數據空間。而正是因為數據空間的特點[2],導致了用戶對數據空間的查詢訪問產生較大延遲,從而影響了數據空間的服務質量。因此研究如何降低數據空間的訪問延遲,提高數據空間管理系統性能具有重大價值。目前解決網絡延遲、提高查詢效率的有效方法之一是預取技術[3-4]。
目前已有的預取方法總體上可以分為兩類:一種是對用戶歷史訪問序列進行分類總結,判斷用戶當前訪問類型,預測該用戶最可能訪問的數據序列,如基于數據挖掘的預取方法(mining-prefetching,MI)、基于Markov模型的預取方法(Markov-prefetching,MA)等[5-6];另一種是通過……