999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于決策樹的選擇查詢算法

2012-11-15 22:25:34鄧冬梅譚鍵龍
中國科技信息 2012年3期
關鍵詞:關聯

鄧冬梅 譚鍵龍

1. 湖南師范大學計算機教學部,湖南 長沙 410081 2. 中國科學院計算技術研究所,北京 100190

一種基于決策樹的選擇查詢算法

鄧冬梅1譚鍵龍2

1. 湖南師范大學計算機教學部,湖南 長沙 410081 2. 中國科學院計算技術研究所,北京 100190

本文提出了一種基于決策樹的查詢索引結構,筆者稱之為查詢決策樹。查詢決策樹不僅利用了查詢內各個謂詞間的合取關系,還充分利用了單個屬性上的謂詞索引。

數據流管理系統;查詢決策樹

引言

流動數據處理長期以來沒有受到足夠重視,目前并不存在像數據庫管理系統一樣的成熟的、通用的數據流處理平臺。但隨著互聯網技術的發展和廣泛應用,國際、國內對數據流的研究已逐步得到重視。

1.選擇多查詢處理及其分類

數據流管理系統和傳統的數據庫管理系統最重要的區別之一是持續查詢在數據流管理系統中的重要地位,而選擇查詢是數據流持續查詢中最基本、也是最重要和使用得最廣泛的一類查詢。

直觀的說,一個選擇查詢就是一個過濾條件,當流數據到達時,數據流管理系統查詢處理引擎在選擇查詢上進行條件測試,如果條件測試的結果為真,我們說這個選擇查詢得到滿足(或者說這個選擇查詢得到匹配)。

數據流管理系統中一般都注冊有大量的選擇查詢。數據流S上的選擇多查詢處理是指:給定S上的選擇查詢集合Qset{Q1,Q2,…,Qn},當S的一個數據元組t到達時,返回查詢集合中所有取值為真的查詢的編號。

Qset也可用表1直觀地表示,其中謂詞P[i, j]是查詢Qi在屬性aj上的謂詞。

表1 選擇多查詢的表格表示

一個流數據元組到達后,按照多查詢處理算法在表1中的處理順序,已有的多查詢處理算法可分為3類:

1.1 行順序處理方法:當一個數據流元組到達后,多查詢處理引擎逐行(逐查詢)處理表1中各查詢;

相對于傳統的人際互動、書信來往等交往方式,新媒體環境下人們之間的交往更加多樣化。除了傳統交往方式外,QQ、BBS、微博、微信等使大學生人際之間的交往更加多樣和便捷。

1.2 列順序處理方法:當一個數據流元組到達后,多查詢處理引擎逐列(逐屬性)處理表1中的查詢;

1.3 行列交錯處理方法:當一個數據流元組到達后,多查詢處理引擎按照行(查詢)、列(屬性)交錯的順序處理表1中的查詢。

2.基于決策樹的選擇查詢算法

本文提出一種新的數據流選擇多查詢的處理算法,這種多查詢的索引具有決策樹形式的結構,筆者稱之為數據流多查詢的決策樹索引算法。多查詢的決策樹索引同時利用了單個屬性上的謂詞索引和單個查詢內各屬性謂詞間的合取關系,因而能更大程度減少冗余計算。各種單屬性上的謂詞索引能很容易集成到多查詢的決策樹索引中。這種多查詢的決策樹處理算法被歸入到行列交錯處理算法類別。

2.1 查詢決策樹的構造

設數據流S用模式R(a1:Ω 1, a2: Ω 2, …, am: Ω m)描述,Qset{Q1,Q2,…,Qn}是在S上定義的查詢集合,下面討論如何在Qset上建立基于決策樹的查詢索引。

查詢決策樹是以自上向下的方式構造的,在構造的過程當中,每個結點關聯一個查詢集合和一個屬性集合,查詢集合是以當前結點為根結點的子樹所索引的查詢子集,屬性集合是當前結點可選的劃分屬性集合。構造從決策樹的根結點開始,根結點關聯的查詢集合包含了原始查詢集合Qset中的所有查詢,根結點關聯的屬性集合包含了數據流模式S的所有屬性。利用一個先進后出的棧(stack)來保存將要被擴展的結點,及其關聯的查詢集合和屬性集合。初始化棧時,把根結點及其關聯的查詢集合和屬性集合壓入棧,然后每次從棧的頭部彈出一個待擴展結點,將這個結點擴展,再將擴展得到的新結點壓入棧,重復這個過程直到棧變為空為止。使用棧來保存待擴展結點,按照先進后出的順序依次擴展每個結點,是一種深度優先的樹構造策略。

假設當前從棧頂彈出的待擴展結點關聯的查詢集合為Qset{Q1,Q2,…,Qn},屬性集合為Aset{a1, a2, …, am}。從Aset中選擇一個屬性做為劃分屬性。預先對數據流的各屬性賦以一個序號,結點擴展時總是選擇Aset中序號最小的屬性做為劃分屬性。

條件(I)和(II)保證了,aj的任何一個可能取值落入且僅僅落入某一個值域子集σ k(1≤k≤s)。條件(III)保證了,對于任意值域子集σk,任意查詢在劃分屬性上的謂詞P[i,j]確定的值域子集ωi要么完全包含σk,要么σk和不相交。等價的描述是,對于σk(1≤k≤s)中的任意兩個不同值x和y,P[i,j](x)=P[i,j](y) (" 1≤i≤n, 1≤j≤m)。在滿足上面三個條件的前提下,應使s盡量的小。

圖1 查詢決策樹結點擴展示意圖

在給定屬性aj的值域Ω上,定義關系R:對于任意的x, y,xRy當切僅當對所有的1≤i≤n有P[i,j](x)=P[i,j](y)。容易證明R是Ω上的一個等價關系,而σ1,σ 2,……,σs則是由這個等價關系劃分出的一族等價類。

接下來,為當前結點創建s個子結點,每個子結點分別對應于一個值域子集。每個子結點都和屬性集合Aset{aj}關聯,其中aj是當前結點的劃分屬性。每個子結點初始時都和一個空的查詢集合關聯,然后對于Qset中的每個查詢Qi和每個值域子集σk,如果P[i, j]完全包含了σk,則將Qi插入到第k個子結點關聯的查詢集合中。后面用Qset’[k]表示當前結點第k個子結點關聯的查詢集合。注意,一個查詢可能被插入到多個子結點所關聯的查詢集合中。然后,這新建立的s個子結點及其關聯的屬性集合和查詢集合被壓入棧頂。每個子結點關聯的屬性集合為Aset{aj},也就是說,每個子結點所關聯的屬性集合大小至少比其父結點關聯的屬性集合少1,因此,構造的查詢決策樹的最大深度為M,這里M是數據流屬性的個數。

最后,為當前結點關聯的查詢集合Qset在劃分屬性aj的謂詞上建立匹配器matcher,matcher是劃分屬性上的謂詞索引。利用matcher,對于給定的劃分屬性值,能快速計算它落入了哪個值域子集。各種單屬性上的謂詞索引都可以用來建立matcher。

給一個查詢決策樹結點擴展的簡單例子。假設當前結點關聯的查詢集合為:Q1:(50

2.2 查詢決策樹的匹配算法

利用查詢決策樹,搜索給定的數據流元組T滿足了哪些查詢的匹配算法,是一個從樹的根結點往下遍歷直到某個葉結點的過程。初始化時將匹配結果查詢ID集合Rset置為空,結點指針P指向查詢決策樹的根結點,那么遞歸的匹配算法可以描述如下:

match (P, Rset, T) //P為指向當前訪問結點的指針,Rset為存放匹配結果查詢ID的集合, T為待匹配的數據流元組

匹配算法中,訪問每個非葉結點時,用數據元組的劃分屬性值搜索當前結點的謂詞索引,如果元組的劃分屬性值落入了第k個值域子集,那么將搜索以第k個子結點為根的子樹,而直接跳過了其它的子結點及其子樹。因此,查詢內各屬性謂詞間的合取關系得到了充分利用。

匹配算法最多需要搜索M個結點的謂詞索引,這里M是查詢決策樹的最大深度,即數據流屬性的個數。如果每個結點中的謂詞索引的搜索時間不大于O(f(N)),其中N是查詢的個數,f(N)為單屬性謂詞索引的搜索時間復雜度上界,那么上述匹配算法的最壞情況時間復雜度為O(Mf(N))。一般情況下,常用的單屬性上的謂詞索引能滿足f(N) = O(log(N))。多查詢行順序處理算法、列順序處理算法和行列交錯處理算法最壞情況下的時間復雜度都為O(MN),而查詢決策樹O(Mlog(N))的最壞情況時間復雜度顯然更適合實時數據流應用。

3.結語

查詢決策樹不僅使用了單個屬性上的謂詞索引,各種單屬性上的謂詞很容易集成到查詢決策樹結構中,而且還充分利用了查詢內各謂詞間的合取關系,相對于以前的各種多查詢處理算法,能更有效減少冗余計算。

最后在一個模擬的網絡入侵檢測環境下測試了查詢決策樹的匹配時間效率和存儲使用量,并將其和改進的行順序處理算法及列順序處理算法進行對比,驗證了查詢決策樹在匹配時間效率上的巨大優勢。

[1]徐恪,徐明偉,吳建平,吳劍.路由查找算法研究綜述.軟件學報,Vol.13(1),pp42~50

[2]陳有祺.形式語言與自動機.南開大學出版社,1999,pp.45~78

[3]王曉東.計算機算法設計與分析.電子工業出版社,pp210~216, 2001

10.3969/j.issn.1001-8972.2012.03.033

猜你喜歡
關聯
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
船山與宋學關聯的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
新制度關聯、組織控制與社會組織的倡導行為
奇趣搭配
基于廣義關聯聚類圖的分層關聯多目標跟蹤
自動化學報(2017年1期)2017-03-11 17:31:17
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫學與因明學之間的關聯
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監測數據的關聯負選擇分步識別算法
主站蜘蛛池模板: 国产91麻豆免费观看| 国产精品三级av及在线观看| 欧洲极品无码一区二区三区| 欧美五月婷婷| 亚洲视频在线青青| 成人看片欧美一区二区| 久久五月天综合| 狼友av永久网站免费观看| 精品欧美一区二区三区久久久| 午夜日b视频| 91精品aⅴ无码中文字字幕蜜桃| 中文字幕1区2区| 亚洲精品亚洲人成在线| 婷婷综合色| 热99精品视频| 亚洲国产黄色| 欧美午夜在线观看| 一本色道久久88| 色婷婷色丁香| 成人va亚洲va欧美天堂| 欧美曰批视频免费播放免费| 亚洲三级色| 免费A级毛片无码免费视频| 欧美日在线观看| 免费日韩在线视频| 国产欧美日韩18| 久久国产乱子伦视频无卡顿| 伦精品一区二区三区视频| 手机成人午夜在线视频| a级毛片毛片免费观看久潮| 亚洲视频无码| 亚洲天堂福利视频| 人妻丰满熟妇啪啪| 亚洲天堂福利视频| 亚洲第一国产综合| 九月婷婷亚洲综合在线| 国产一级在线观看www色| 亚洲精品第一在线观看视频| 四虎成人免费毛片| 成人福利在线视频免费观看| 国产成人综合久久| 亚洲精品老司机| 欧美色亚洲| 国产精品成人啪精品视频| 国产精品免费福利久久播放| 久久精品国产电影| 97se亚洲综合不卡 | 深爱婷婷激情网| 香蕉eeww99国产在线观看| 国产精品尹人在线观看| 东京热av无码电影一区二区| 国产农村精品一级毛片视频| 久久精品无码一区二区日韩免费| 国产精品久久久久鬼色| 香蕉国产精品视频| 欧美成一级| 国产一区二区三区视频| 蜜桃视频一区二区| 天天躁夜夜躁狠狠躁躁88| 国产激情无码一区二区免费| 91久草视频| 伊大人香蕉久久网欧美| 亚卅精品无码久久毛片乌克兰| 国产18页| 国产欧美日韩va另类在线播放| 国产永久在线观看| 亚洲永久色| a毛片在线| 国产福利小视频高清在线观看| 思思99热精品在线| 国产一级裸网站| 国产精女同一区二区三区久| 久久久亚洲色| 亚洲精品动漫| 日本在线亚洲| 国产爽妇精品| 日本a级免费| 国产精品林美惠子在线观看| 国产69精品久久久久妇女| 69精品在线观看| 五月婷婷亚洲综合| 天天综合网色中文字幕|