999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

P2P數(shù)據(jù)管理研究趨勢(shì)

2006-12-31 00:00:00李戰(zhàn)懷張龍波

(西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 陜西 西安 710072)

摘 要:Peer-to-Peer模型是一種新型的體系結(jié)構(gòu)模型,許多優(yōu)勢(shì)有待于進(jìn)一步發(fā)掘,擁有廣闊的應(yīng)用前景。首先指出基于模式的高可擴(kuò)展的P2P系統(tǒng)可以滿足P2P研究領(lǐng)域中對(duì)語義支持的需求以及對(duì)高可擴(kuò)展性的需求,是P2P數(shù)據(jù)管理的發(fā)展趨勢(shì);通過綜述基于模式P2P系統(tǒng)和高可擴(kuò)展性P2P系統(tǒng)的研究現(xiàn)狀,指出現(xiàn)有P2P數(shù)據(jù)管理研究項(xiàng)目分別從P2P網(wǎng)絡(luò)的語義重疊網(wǎng)絡(luò)和重疊網(wǎng)絡(luò)兩個(gè)方面改善P2P網(wǎng)絡(luò)的性能和服務(wù)質(zhì)量,兩者之間缺乏銜接,各自的研究成果無法直接結(jié)合產(chǎn)生基于模式的高可擴(kuò)展的P2P系統(tǒng);給出基于模式的高可擴(kuò)展P2P系統(tǒng)的研究目標(biāo),分析該方面的初步研究成果;最后指出未來需要進(jìn)一步研究的問題。

關(guān)鍵詞: Peer-to-Peer; 基于模式; 高可擴(kuò)展

中圖法分類號(hào): TP311.13文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1001-3695(2006)08-0004-04

Trend of P2P Data Management

YU Min, LI Zhan-h(huán)uai, ZHANG Long-bo

(School of Computer Science, Northwestern Polytechnical University, Xi’an Shanxi 710072, China)

Abstract: Peer-to-Peer is a new model of architecture, which has a lot of advantages to be further discovered and has a cheerful application future. Firstly, the paper points out that the schema-based highly scalable P2P system can satisfy the needs for both semantic support and high scalability in P2P research area, and so it is the trend of P2P data management. Then, through the survey on the current schema-based P2P systems and the highly scalable P2P systems, the paper points out that the current P2P data management research projects improve the efficiency and quality of service of the existing P2P network from two facets: the semantic overlay and the overlay, and the lack of connection between them makes it too difficult to generate the schema-based highly scalable P2P system from them. After that, the goals of the schema-based highly scalable P2P system are given, and the initial result of this research area is analyzed. Finally the issues which need to be further studied are pointed out.

Key words: Peer-to-Peer; Schema-based; Highly Scalable

1引言

隨著計(jì)算機(jī)技術(shù)的發(fā)展,在當(dāng)今軟硬件技術(shù)環(huán)境下,客戶/服務(wù)器模型已不能滿足需求,其單點(diǎn)故障和熱點(diǎn)問題已經(jīng)變得越來越不可接受。Peer-to-Peer模型(又稱P2P模型或?qū)Φ扔?jì)算模型)是一種新型的體系結(jié)構(gòu)模型,具有許多優(yōu)勢(shì)有待進(jìn)一步發(fā)掘[1]:①P2P系統(tǒng)的每個(gè)成員均可貢獻(xiàn)數(shù)據(jù)和計(jì)算資源(如未用的CPU周期和存儲(chǔ)資源),新成員的加入可能引入系統(tǒng)中原來缺乏的特殊數(shù)據(jù)或資源,因此隨著系統(tǒng)成員增加,系統(tǒng)的豐富性、多樣性等各種有益的特性得以擴(kuò)大;②P2P系統(tǒng)具有分散性,因此系統(tǒng)的健壯性、可用性和性能可能隨著Peer數(shù)量的增加而擴(kuò)展;③通過在許多Peer間路由請(qǐng)求和復(fù)制內(nèi)容,系統(tǒng)可以隱藏?cái)?shù)據(jù)提供者和消費(fèi)者的身份,使個(gè)人的隱私得到保護(hù)[1]。因此P2P被認(rèn)為是未來重構(gòu)分布式體系結(jié)構(gòu)的關(guān)鍵技術(shù)[2]。P2P在搜索引擎、數(shù)據(jù)流管理、語義Web、協(xié)作信息過濾等領(lǐng)域具有廣闊的應(yīng)用前景。

目前,P2P模型已經(jīng)成功地用于交換音樂文件,出現(xiàn)了Napster,Gnutella,KaZaA等一批成功的文件共享系統(tǒng)。然而,當(dāng)前的P2P系統(tǒng)具有局限性:僅支持無語義或弱語義的、大粒度(文件級(jí))的數(shù)據(jù)共享;用戶通過文件的標(biāo)識(shí)符進(jìn)行查找(通常按名檢索)[1],但很難準(zhǔn)確地選擇表達(dá)信息需求的文件標(biāo)識(shí)符,因此難以找到真正需要的文件;并且,許多標(biāo)識(shí)符相近、但語義不相干的答案被返回給用戶,浪費(fèi)了大量的帶寬與計(jì)算資源,極大地限制了P2P潛能的發(fā)揮。顯然,這種缺乏語義的共享既不能很好地滿足用戶的需求,也不能有效地利用系統(tǒng)的資源[3]。

P2P系統(tǒng)的大多數(shù)問題都可歸結(jié)為數(shù)據(jù)放置和檢索問題[4],但P2P網(wǎng)絡(luò)本身缺乏對(duì)語義、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)聯(lián)系的支持,而處理這類問題是數(shù)據(jù)庫研究團(tuán)體的強(qiáng)項(xiàng),因此有必要在P2P系統(tǒng)中引入數(shù)據(jù)管理技術(shù)。Gribble等人[1]最先注意到這一點(diǎn),于2001年提出使用數(shù)據(jù)管理技術(shù)(如用查詢、視圖、完整性約束表達(dá)對(duì)象間聯(lián)系,用已有對(duì)象定義新對(duì)象,在多個(gè)數(shù)據(jù)源上提出復(fù)雜查詢以及物化查詢結(jié)果以備將來使用等)更好地解決P2P系統(tǒng)的數(shù)據(jù)放置問題。另一方面,由于數(shù)據(jù)庫系統(tǒng)已經(jīng)向更高度分布的方向發(fā)展,使得高可擴(kuò)展性已經(jīng)成為數(shù)據(jù)庫領(lǐng)域和P2P系統(tǒng)追求的共同目標(biāo)。基于模式的高可擴(kuò)展P2P系統(tǒng)可以解決P2P研究領(lǐng)域中對(duì)語義支持的需求以及數(shù)據(jù)庫領(lǐng)域中提高可擴(kuò)展性的需求,是P2P上數(shù)據(jù)管理的發(fā)展趨勢(shì)。

本文首先綜述基于模式的P2P系統(tǒng)和高可擴(kuò)展性的P2P系統(tǒng)的研究現(xiàn)狀,然后指出基于模式的高可擴(kuò)展性P2P系統(tǒng)的研究目標(biāo),分析其取得的初步成果,指出基于模式的高可擴(kuò)展P2P數(shù)據(jù)管理需要進(jìn)一步研究的問題。

2基于模式的P2P系統(tǒng)

數(shù)據(jù)庫團(tuán)體對(duì)P2P系統(tǒng)的主要貢獻(xiàn)是引入了模式的概念[4],產(chǎn)生了基于模式的P2P系統(tǒng)。在這樣的系統(tǒng)中,每個(gè)Peer使用顯式的模式描述其內(nèi)容,這些模式可能是異構(gòu)的,系統(tǒng)不依賴于全局模式和對(duì)應(yīng)關(guān)系,通過局部翻譯機(jī)制和規(guī)則,使用Peer各自的模式檢索需要的數(shù)據(jù)。這樣,與簡(jiǎn)單的P2P網(wǎng)絡(luò)相比,基于模式的P2P網(wǎng)絡(luò)具有許多優(yōu)點(diǎn):支持任意元數(shù)據(jù)模式和本體;允許對(duì)資源復(fù)雜的可擴(kuò)展描述;在原本固定有限的描述中引入了動(dòng)態(tài)性;可以支持復(fù)雜的查詢而不只是簡(jiǎn)單的基于關(guān)鍵字的搜索,為現(xiàn)存信息源增值留下了廣闊的空間[5];是充當(dāng)鏈接異構(gòu)信息源的基礎(chǔ)設(shè)施的理想之選[6]。從功能上看,基于模式的P2P系統(tǒng)至少由四個(gè)部分組成[6]:①指定P2P網(wǎng)絡(luò)中可用數(shù)據(jù)的類型的模式語言;②檢索存儲(chǔ)在P2P網(wǎng)絡(luò)中數(shù)據(jù)的查詢語言;③支持高效查詢的網(wǎng)絡(luò)拓?fù)浜妥赃m應(yīng)查詢路由算法;④集成存儲(chǔ)在P2P網(wǎng)絡(luò)中異構(gòu)信息的機(jī)制。各部分分別影響整個(gè)網(wǎng)絡(luò)查詢異構(gòu)信息的能力和可擴(kuò)展性。

由于基于模式的P2P系統(tǒng)具有許多優(yōu)勢(shì),在語義Web,P2P關(guān)系查詢等領(lǐng)域具有潛在的應(yīng)用前景,國內(nèi)外許多大學(xué)和研究機(jī)構(gòu)對(duì)基于模式的P2P系統(tǒng)相關(guān)技術(shù)問題進(jìn)行了研究。為便于實(shí)驗(yàn)驗(yàn)證,各研究團(tuán)體都以原型系統(tǒng)的形式提供側(cè)重于某個(gè)方面的問題的解決方案。

德國漢諾威(Hannover)大學(xué)的Edutella[6~8]為語義Web提供基礎(chǔ)設(shè)施,該項(xiàng)目通過采用RDFS(RDF Schema),實(shí)現(xiàn)了基于類、特性或者特性約束來表示模式,定義了描述資源所使用的詞匯表[6]。它假定系統(tǒng)中所有的資源都可以使用RDF描述,進(jìn)而所有的Edutella功能都可以通過RDF陳述來體現(xiàn),可以對(duì)這些RDF陳述提出查詢。Edutella以基于Datalog語義的RDF-QEL作為查詢語言,文獻(xiàn)[8,9]稱,它與所有現(xiàn)存查詢語言兼容,支持?jǐn)U展了關(guān)系完備查詢語言的查詢能力。最初Edutella采用類似Gnutella的無結(jié)構(gòu)網(wǎng)絡(luò)[8],每個(gè)RDF查詢都淹沒整個(gè)網(wǎng)絡(luò),每個(gè)節(jié)點(diǎn)都處理每個(gè)查詢,由于可擴(kuò)展性很差且不能保證找到查詢結(jié)果(即使所需的數(shù)據(jù)在網(wǎng)絡(luò)中),Edutella便轉(zhuǎn)而使用具有超立方體結(jié)構(gòu)的Super-peer網(wǎng)絡(luò)充當(dāng)網(wǎng)絡(luò)拓?fù)洌鱏uper-peer維護(hù)Super-peer/Peer和Super-peer/Super-peer索引,均包括模式索引和Property/Property Set索引、Pro-perty Value Range索引和Property Value索引三種實(shí)例級(jí)索引。Super-peer/Peer索引描述Peer上存儲(chǔ)的內(nèi)容,由Peer注冊(cè)時(shí)提供給Super-peer;Super-peer/Super-peer索引由Super-peer/Peer索引抽取和概括而成,用于指導(dǎo)Super-peer骨架內(nèi)查詢路由,避免廣播。它采用基于模式的查詢路由策略,可以推出攜帶代碼的查詢求值計(jì)劃[7],查詢求值計(jì)劃和用戶定義的代碼被從客戶推到執(zhí)行它們的Super-peer,由Super-peer提供查詢優(yōu)化器產(chǎn)生好的查詢計(jì)劃,在數(shù)據(jù)源附近進(jìn)行標(biāo)準(zhǔn)查詢處理和用戶定義的操作。采用自頂向下和自底向上兩種優(yōu)化策略[7],查詢效率、可擴(kuò)展性和查全率都有所提高。Edutella經(jīng)過基于本體、基于規(guī)則、基于查詢的Peer聚簇策略,限制各Super-peer的模式和屬性的數(shù)量,減少信息集成的工作量,在各Super-peer引入全局模式,將Peer模式映射到這個(gè)全局模式[9]。Peer聚簇和RDF三元組固定的維數(shù)使這種Super-peer上的全局模式策略成為可能。Edutella仍有局限性:使用Super-peer雖然不會(huì)造成單點(diǎn)故障,但是限制了網(wǎng)絡(luò)的動(dòng)態(tài)性,Super-peer會(huì)成為連接到Super-peer上客戶Peer們的瓶頸(特別是為了使索引更新高效,Edutella要求Super-peer數(shù)比Peer總數(shù)少得多),局部指定Peer聚簇規(guī)則會(huì)造成某些Peer無Super-peer接收而不能加入網(wǎng)絡(luò),而一些非常流行的模式將可能使有些Super-peer連接大量的Peer,造成負(fù)載不平衡,因此可擴(kuò)展性有限。

加拿大多倫多大學(xué)Hyperion項(xiàng)目[10]研究P2P上的S+J代數(shù)(查詢語言)查詢,一個(gè)S+J查詢使用選擇和連接操作符,選擇公式中不含否定,且由形如A=B和A=a的原子公式的合取和析取組成,其中A和B是屬性,a是一個(gè)常量。這樣,它的查詢處理能力是關(guān)系運(yùn)算的子集。它使用關(guān)系語言表達(dá)模式,受到局部關(guān)系模型(LRM)的啟發(fā),Hyperion使用三種控制數(shù)據(jù)交換的機(jī)制解決語義異構(gòu)問題:①映射表。它是提供熟人Peer的數(shù)值間對(duì)應(yīng)關(guān)系的二元表,不僅提供數(shù)據(jù)級(jí)映射,且隱含地提供根本的模式級(jí)映射。②映射表達(dá)式。使用類Datalog語法表達(dá)兩個(gè)不同模式的關(guān)聯(lián),實(shí)現(xiàn)兩個(gè)不同Peer間的模式級(jí)對(duì)應(yīng)關(guān)系。目前,Hyperion在建立Peer間熟人關(guān)系時(shí)半自動(dòng)創(chuàng)建映射,然后通過人工干預(yù)來確保產(chǎn)生映射的正確性。③SQL3觸發(fā)器(或ECA規(guī)則)用于確保Peer間的一致性。通過映射表和映射表達(dá)式,用單個(gè)數(shù)據(jù)源的模式提出的查詢被翻譯成一組可在相關(guān)數(shù)據(jù)源上執(zhí)行的查詢,從而獲得網(wǎng)絡(luò)中其他Peer上的數(shù)據(jù),但是它沒有考慮可擴(kuò)展性[11]。

美國華盛頓大學(xué)的Piazza項(xiàng)目[12]研究支持XQuery子集的查詢處理能力。在Piazza中,用XML建模數(shù)據(jù),Peer使用XML模式表達(dá)自己的模式,采用Peer描述和存儲(chǔ)描述兩級(jí)映射解決語義異構(gòu),其中,Peer描述是各Peer的“世界的視圖”之間的映射,用于路由查詢;存儲(chǔ)描述將Peer的“世界的視圖”映射到這個(gè)Peer上特定存儲(chǔ)的數(shù)據(jù)。Piazza關(guān)心XML和RDF之間的關(guān)系,提出在XML和RDF節(jié)點(diǎn)(Node)間建立映射的算法。Piazza首先通過模式匹配產(chǎn)生基礎(chǔ)映射,再經(jīng)過人工干預(yù)或者自動(dòng)技術(shù)糾正產(chǎn)生的映射,Piazza現(xiàn)在的索引實(shí)現(xiàn)是集中式的,類似于Web上的搜索引擎,因此可擴(kuò)展性和健壯性較差。

新加坡國立大學(xué)和我國復(fù)旦大學(xué)合作項(xiàng)目PeerDB[13]研究P2P網(wǎng)絡(luò)中的關(guān)系查詢處理,采用全自治的方式描述元數(shù)據(jù),各Peer持有兩個(gè)元數(shù)據(jù)集合——本地字典(Local Dictionary)和導(dǎo)出字典(Export Dictionary),分別描述本地可訪問的數(shù)據(jù)和能被網(wǎng)絡(luò)中其他Peer訪問的數(shù)據(jù);它使用關(guān)系語言描述模式,用戶在創(chuàng)建表時(shí)為表和屬性指定一些關(guān)鍵字,充當(dāng)同義辭典,利用基于信息檢索的關(guān)鍵字匹配途徑實(shí)現(xiàn)模式級(jí)映射。由于它假定在整個(gè)Peer網(wǎng)絡(luò)中一致地使用關(guān)鍵字,因此不能處理Peer的數(shù)據(jù)值中使用不同字匯表的情況[10]。并且,關(guān)鍵字匹配可能會(huì)產(chǎn)生不相關(guān)的查詢?cè)傩问交?Reformulation)結(jié)果,需要用戶決定執(zhí)行哪個(gè)查詢[11]。PeerDB建立在無結(jié)構(gòu)的重疊網(wǎng)絡(luò)之上,利用移動(dòng)代理,采用受TTL(Time-To-Life)限制的淹沒查詢策略,通過用棧維護(hù)K個(gè)最近返回結(jié)果的節(jié)點(diǎn),動(dòng)態(tài)改變鄰居,逐漸改善查全率,但可擴(kuò)展性受到了無結(jié)構(gòu)重疊網(wǎng)絡(luò)固有缺陷的限制。

這些基于模式的P2P系統(tǒng)都研究語義互操作性的方案,只提供有限的擴(kuò)展性和查詢處理能力。

3高可擴(kuò)展P2P系統(tǒng)

在高可擴(kuò)展性P2P網(wǎng)絡(luò)研究方面,由于基于無結(jié)構(gòu)重疊網(wǎng)絡(luò)(Gnutella等)的系統(tǒng)對(duì)網(wǎng)絡(luò)拓?fù)浜途W(wǎng)絡(luò)中文件的放置方式?jīng)]有約束,且使用基于洪泛(Flooding)的查詢路由算法,因此不能保證在有限的跳步內(nèi)找到存在的數(shù)據(jù),每個(gè)Peer的負(fù)載隨網(wǎng)絡(luò)中的整體查詢數(shù)線性增長(zhǎng),可擴(kuò)展性差。所以研究人員提出了若干種結(jié)構(gòu)化的重疊網(wǎng)絡(luò)(CAN[14], Chord[15]等),通過對(duì)數(shù)據(jù)放置的嚴(yán)格要求提供對(duì)路由跳步和消息數(shù)的強(qiáng)大約束,具有高可擴(kuò)展性,然而由于它使用散列函數(shù),破壞了數(shù)據(jù)的順序,因此通常只支持確切的Key匹配查詢。為了支持更豐富的查詢,美國加州大學(xué)伯克利分校的PIER項(xiàng)目[16]研究建立在分布式哈希表(DHT)之上的數(shù)據(jù)庫風(fēng)格的查詢引擎,主要關(guān)注在廣泛分布式環(huán)境中提供數(shù)據(jù)庫查詢能力的問題,目前提出了基于DHT的連接和聚集算法:將對(duì)稱哈希連接算法擴(kuò)展到DHT上,交替地在每個(gè)輸入關(guān)系上建造和探測(cè)哈希表,處理相等連接。在參加連接的一個(gè)表已用連接屬性散列存儲(chǔ)時(shí),只需掃描另一個(gè)表,此時(shí)稱為Fetch Matches算法。PIER采用層次聚集的方法,它不顯示分組節(jié)點(diǎn),而是按照查詢廣播中的方法將節(jié)點(diǎn)組織成樹,各節(jié)點(diǎn)計(jì)算它的本地聚集,并將結(jié)果發(fā)送到查詢中指定的根,消除了接收所有數(shù)據(jù)進(jìn)行聚集的節(jié)點(diǎn)的瓶頸問題。設(shè)計(jì)者也指出此法的局限性:為使各節(jié)點(diǎn)恰好只發(fā)送一個(gè)部分聚集,各節(jié)點(diǎn)必須知道何時(shí)已從每個(gè)孩子處接收了數(shù)據(jù),對(duì)可分配的和算術(shù)聚集,算法工作良好,但并不能改善整體聚集。美國USC信息科學(xué)學(xué)院的RDFPeers項(xiàng)目[17]建立在多屬性尋址網(wǎng)絡(luò)(MAAN)之上,MAAN擴(kuò)展了Chord[15]技術(shù),RDFPeers通過為RDF三元組的Subject, Predicate和Object分別產(chǎn)生Key發(fā)布到MAAN中支持對(duì)三元組數(shù)據(jù)庫的范圍查詢和多屬性查詢。這些研究項(xiàng)目都是建立在重疊網(wǎng)絡(luò)的研究成果之上,利用結(jié)構(gòu)化重疊網(wǎng)絡(luò)提供的高可擴(kuò)展性,實(shí)現(xiàn)高可擴(kuò)展的查詢能力。然而這些項(xiàng)目不提供模式支持,不處理用戶定義的模式,不解決語義互操作問題。由于P2P系統(tǒng)的動(dòng)態(tài)性和自治性,使用全局模式描述P2P系統(tǒng)中的數(shù)據(jù)是不可能的,而重疊網(wǎng)絡(luò)本身沒有語義,不能直接應(yīng)用在語義互操作性研究中取得的成果。所以,不能滿足P2P網(wǎng)絡(luò)異構(gòu)信息源上復(fù)雜查詢的需求。

4 研究目標(biāo)及展望

綜上所述,現(xiàn)有基于模式的P2P系統(tǒng)主要解決P2P系統(tǒng)中語義互操作的問題,而僅提供有限的可擴(kuò)展性;高可擴(kuò)展的P2P系統(tǒng)主要解決P2P系統(tǒng)的可擴(kuò)展性問題,而不考慮語義互操作性。基于模式的P2P研究和高可擴(kuò)展的P2P研究本質(zhì)在于分別從P2P網(wǎng)絡(luò)的語義重疊網(wǎng)絡(luò)和重疊網(wǎng)絡(luò)兩個(gè)方面改善現(xiàn)有P2P網(wǎng)絡(luò)的性能和服務(wù)質(zhì)量,然而兩者之間缺乏銜接,各自的研究成果無法直接結(jié)合產(chǎn)生基于模式的高可擴(kuò)展的P2P系統(tǒng),因此,需要研究將兩者融合起來的技術(shù)。

P2P系統(tǒng)的價(jià)值在于能夠從中獲取數(shù)據(jù),必須支持查詢處理,因此基于模式的高可擴(kuò)展的P2P系統(tǒng)應(yīng)該提供如下支持:

(1)可擴(kuò)展性。查詢處理的性能和服務(wù)質(zhì)量不因網(wǎng)絡(luò)規(guī)模擴(kuò)大而顯著下降。

(2)自治性。這是P2P的特點(diǎn),查詢處理算法應(yīng)在一定程度上尊重Peer的自治性。

(3)效率。以消耗的絕對(duì)資源(帶寬、處理能力、存儲(chǔ)等)度量效率,為了保證高吞吐量,必須有效地使用資源,降低系統(tǒng)開銷。

(4)服務(wù)質(zhì)量。它是用戶可感知的質(zhì)量,可以用不同的指標(biāo)(結(jié)果的數(shù)量、響應(yīng)時(shí)間等)度量[18]。

(5)健壯性。包括對(duì)故障的健壯和對(duì)攻擊的健壯,前者要求系統(tǒng)在Peer故障或者離開時(shí)保持服務(wù)質(zhì)量和效率[18]。

(6)支持語義異構(gòu)Peer。語義異構(gòu)是Peer自治的結(jié)果,各Peer用自己的模式組織和呈現(xiàn)數(shù)據(jù),為了互操作,需要適應(yīng)P2P動(dòng)態(tài)即興環(huán)境的解決方案。

(7)查詢處理能力。它可以從其支持的被查詢的數(shù)據(jù)類型和查詢算子類型體現(xiàn),文獻(xiàn)[19]指出所有的數(shù)據(jù)都可以視為關(guān)系數(shù)據(jù),因此支持對(duì)關(guān)系數(shù)據(jù)的關(guān)系完備查詢具有普遍性,同時(shí)適用于數(shù)據(jù)庫查詢和文本搜索[19]。

目前,GridVine[11]是唯一將語義互操作性和高可擴(kuò)展性聯(lián)合研究的項(xiàng)目,并初步取得了一些成果。它應(yīng)用數(shù)據(jù)獨(dú)立性原理在可擴(kuò)展的、高效的、完全分散的重疊網(wǎng)絡(luò)上構(gòu)建語義重疊網(wǎng)絡(luò),支持創(chuàng)建本地模式而促進(jìn)全局語義互操作。但是在查詢語言的表達(dá)能力方面存在不足。由于其目的是為語義Web提供基礎(chǔ)設(shè)施,因此假定語義Web中的資源使用基于類的RDF描述,目前明確說明支持對(duì)RDF三元組的Native Query查詢,通過為三元組的各元素分別生成Key。在P-Grid[20]重疊網(wǎng)絡(luò)中將同一個(gè)三元組存儲(chǔ)三次來實(shí)現(xiàn),然而對(duì)于非常流行的URI或文字會(huì)產(chǎn)生大量的三元組存儲(chǔ),消耗存儲(chǔ)這些元組的Peer上的大量存儲(chǔ)資源,造成負(fù)載不平衡,產(chǎn)生熱點(diǎn)。P-Grid是基于Trie的重疊網(wǎng)絡(luò),因此不能支持對(duì)任意數(shù)據(jù)類型(如浮點(diǎn)數(shù))的范圍查詢[21]。RDF描述維度固定,因此較關(guān)系數(shù)據(jù)簡(jiǎn)單,對(duì)于以關(guān)系形式呈現(xiàn)的數(shù)據(jù)使用RDF描述需要耗費(fèi)大量的資源(對(duì)每個(gè)關(guān)系元組,產(chǎn)生和存儲(chǔ)RDF三元),并且雖然文獻(xiàn)[11]稱GridVine能夠通過組合Native Query來支持RDQL的表達(dá)能力且實(shí)現(xiàn)策略類似于RDFPeers[17],然而,RDFPeers目前還沒有實(shí)現(xiàn)從RDQL到Native Query的翻譯器,并沒有真正實(shí)現(xiàn)對(duì)RDQL的支持[17],所以,GridVine是否實(shí)現(xiàn)了RDQL查詢存在疑點(diǎn)。由于關(guān)系數(shù)據(jù)具有普遍性,而GridVine還不能支持任意屬性數(shù)的關(guān)系數(shù)據(jù)上的查詢,所以研究支持關(guān)系數(shù)據(jù)查詢的基于模式的高可擴(kuò)展P2P系統(tǒng)還在開始階段。

基于模式的高可擴(kuò)展P2P系統(tǒng)還需在以下幾個(gè)方面進(jìn)一步研究:

(1)元數(shù)據(jù)管理和模式映射方法

需要研究采用結(jié)構(gòu)靈活的語言描述元數(shù)據(jù)的方法,允許各Peer定義自己的模式并支持遺產(chǎn)數(shù)據(jù)庫的加入;需要研究減少模式調(diào)解過程的人工干預(yù)、提高語義映射準(zhǔn)確性的新途徑;隨著網(wǎng)絡(luò)進(jìn)化,會(huì)產(chǎn)生大量的語義映射,需要研究管理這些語義映射的技術(shù),包括找出應(yīng)該建立而尚未建立映射的節(jié)點(diǎn)集,發(fā)現(xiàn)P2P局部交互產(chǎn)生的矛盾映射,解決矛盾映射的方法;尋求處理不同質(zhì)量的映射的途徑,逐步改善映射,從而改進(jìn)節(jié)點(diǎn)從其他節(jié)點(diǎn)獲得數(shù)據(jù)的能力。

(2)高可擴(kuò)展性語義索引構(gòu)造和維護(hù)方法

為了對(duì)查詢優(yōu)化算法提供信息,需研究在索引中動(dòng)態(tài)維護(hù)統(tǒng)計(jì)信息、網(wǎng)絡(luò)拓?fù)鋮?shù)等額外信息的方法。

(3)基于模式的高可擴(kuò)展的查詢處理方法

研究如何利用基于模式的高可擴(kuò)展索引,實(shí)現(xiàn)如下關(guān)系完備的查詢能力,包括:①一元運(yùn)算的基于模式路由策略,包括更名、賦值、選擇(等值選擇和范圍選擇)、投影、廣義投影、聚集函數(shù)等運(yùn)算。其中,由于數(shù)據(jù)量和計(jì)算量較大,需要著重研究聚集函數(shù)(特別是用戶自定義聚集函數(shù))的計(jì)算策略。②在基于模式的可擴(kuò)展索引上擴(kuò)展多元運(yùn)算的分布式算法,以很小的通信代價(jià)(消息數(shù)和數(shù)據(jù)傳輸量)實(shí)現(xiàn)集合并、交、差、笛卡兒積、自然連接、除、外連接等二元運(yùn)算,研究在上述運(yùn)算中Null值的處理策略。③包含否定的、跨數(shù)據(jù)源、多操作符的查詢處理方法。

(4)基于模式的自適應(yīng)查詢優(yōu)化策略研究

由于大的P2P網(wǎng)絡(luò)特性相當(dāng)易變,需要運(yùn)行時(shí)再優(yōu)化,提交的查詢不太可能在整個(gè)查詢處理過程中都保持原來的性質(zhì),因此傳統(tǒng)的靜態(tài)查詢優(yōu)化和執(zhí)行技術(shù)在這種環(huán)境中無效,每個(gè)節(jié)點(diǎn)的查詢執(zhí)行引擎和優(yōu)化器只能看到路由到達(dá)或經(jīng)過該節(jié)點(diǎn)的數(shù)據(jù),很難作出全局決策,因此動(dòng)態(tài)環(huán)境下的自適應(yīng)查詢優(yōu)化極具挑戰(zhàn)性。

5結(jié)論

本文綜述了基于模式的P2P系統(tǒng)和高可擴(kuò)展的P2P系統(tǒng)的研究現(xiàn)狀,指出基于模式的高可擴(kuò)展性P2P系統(tǒng)是P2P數(shù)據(jù)管理研究的趨勢(shì)。它可以提供在大規(guī)模語義異構(gòu)網(wǎng)絡(luò)中高效、健壯地共享信息的手段,從而充分發(fā)掘分布在網(wǎng)絡(luò)邊緣的信息源的價(jià)值、支持個(gè)性化的信息終端,促進(jìn)P2P技術(shù)在語義Web、CQ系統(tǒng)(包括流數(shù)據(jù)管理系統(tǒng))、移動(dòng)代理、電子商務(wù)、數(shù)字圖書館、數(shù)據(jù)挖掘、信息集成、OLAP和信息檢索等領(lǐng)域的應(yīng)用,對(duì)提升組織內(nèi)部信息交流的質(zhì)量和改善公眾網(wǎng)絡(luò)信息服務(wù)能力都有十分重要的意義。

參考文獻(xiàn):

[1] Steven D Gribble, Alon Y Halevy, Zachary G Ives, et al. What Can Databases Do for Peer-to-Peer? [C]. Mecca: Proc.of the 4th International Workshop on the Web and Databases, 2001.31-36.

[2]Ng WS, Ooi BC, Tan KL. BestPeer: A Self-Configurable Peer-to-Peer System[C]. Proc. of the 18th ICDE, San Jose: IEEE Computer Society Press, 2002.272.

[3]凌波,陸志國,黃維維,等. PeerIS:基于Peer-to-Peer的信息檢索系統(tǒng)[J]. 軟件學(xué)報(bào), 2004,15(9):1375-1384.

[4]Karl Aberer. Guest Editor’s Introduction[J]. ACM SIGMOD Record, 2003,32(3):21-22.

[5]Aberer K P, Cudre-Maroux, M Hauswirth, et al. Start Making Sense: The Chatty Web Approach for Global Semantic Agreements[J]. Journal of Web Semantics, 2004,1(1):72-86.

[6]WolfgangNejdl, Wolf SIberski, Michael Sintek. Design Issues and Challenges for RDF and Schema-based Peer-to-Peer Systems[J]. ACM SIGMOD Record, 2003,32(3):41-46.

[7]Ingo Brunkhorst, Hadhami Dhraief, Alfons Kemper,et al. Distributed Queries and Query Optimization in Schema-based P2P Systems[C]. Berlin: Proc. of the 29th VLDB Conference, 2003.184-199.

[8]W Nejdl, B Wolf, C Qu, et al. Edutella: A P2P Network Infrastructure Based on RDF[C]. Proc. of the 11th World Wide WebConfere-nce, Honolulu: ACM Press, 2002.604-615.

[9]A Loser, W Nejdl, M Wolpers, et al. Information Integration in Schema-based Peer-to-Peer Networks[C]. Proc. of the 15th Confe-rence on Advanced Information Systems Engineering(CAISE03), Klagenfurt/Velden: Springer-Verlag, 2003.258-272.

[10]Anastasios Kementsietsidis, Marcelo Arenas. Data Sharing through Query Translation in Autonomous Sources[C]. Proc. of the 30th International Conference on Very Large Data Bases, San Fransisco: Morgan Kaufmann, 2004.468-479.

[11]Karl Aberer, Phiippe Cudre-Mauroux, M Hauswirth, et al. GridVine: Building Internet-Scale Semantic Overlay Networks[C]. Proc. of the 3rd International Semantic Web Conference, London: Springer-Verlag, 2004.107-121.

[12]Alon Y Halevy, Zachary G Ives, Jayant Madhavan, et al. The Piazza Peer Data Management System[J]. IEEE Transactions on Knowledge and Data Engineering, 2004,17(7):787-798.

[13]Wee Siong Ng, Beng Chin Qoi, Kian-Lee Tan, et al. PeerDB: A P2P-based System for Distributed Data Sharing[C]. Proc. of the 19th ICDE, Bangalore: IEEE Computer Society Press, 2003.633-644.

[14]Sylvia Ratnasamy, Paul Francis, Mark Handley, et al. A Scalable Content-Addressable Network[C]. Proc. of ACM SIGCOMM’01, San Diego: ACM, 2001.161-172.

[15]Ion Stoica, Robert Morris, David Karger, et al. Chord: A Scalable Peer-to-Peer Lookup Service for Internet Applications[C].San Diego: Proc. of ACM SIGCOMM’01, 2001.149-160.

[16]Ryan Huebsch, Brent Chun, Joseph Hellerstein, et al. The Architecture of PIER: An Internet-Scale Query Processor[C]. Asilomar: Proc.of the Conference on Innovative Data Systems Research,VLDB, 2005.28-43.

[17]Min Cai, Martin Frank. RDFPeers: A Scalable Distributed RDF Repository Based on a Structured Peer-to-Peer Network[C]. Proc. of the 13th International World Wide Web Conference, New York:Sheridan Printing, 2004.650-657.

[18]Neil Daswani, Hector Garcia-Molina, Beverly Yang. Open Problems in Data-Sharing Peer-to-Peer Systems[C]. Proc. of the 9th International Conference on Database Theory(ICDT2003), Siena: Springer-Verlag, 2003.1-15.

[19]Matthew Harren, Joseph M Hellerstein, Ryan Huebsch, et al. Complex Queries in DHT-based Peer-to-Peer Networks[C]. Proc. of the 1st International Workshop on Peer-to-Peer Systems(IPTPS02), London: Springer-Verlag, 2002.242-259.

[20]K Aberer, P Cudre-Mauroux, A Datta, et al. P-Grid: A Self-organizing Structured P2P System[J]. ACM SIGMOD Record, 2003,32(3):29-33.

[21]Adina Crainiceanu, Prakash Linga, Ashwin Machanavjjhala, et al. P-Ring: An Index Structure for Peer-to-Peer Systems[EB/OL]. http://www.cs.cornell.edu/database/pepper/PRing.pdf, 2004.

作者簡(jiǎn)介:余敏(1980-),女,江西人,博士研究生,主要研究方向?yàn)閿?shù)據(jù)庫理論與技術(shù)、P2P數(shù)據(jù)管理;李戰(zhàn)懷(1961-),男,教授,博導(dǎo),博士,主要研究方向?yàn)閿?shù)據(jù)庫理論與技術(shù);張龍波(1968-),男,博士研究生,主要研究方向?yàn)閿?shù)據(jù)流管理技術(shù)。

主站蜘蛛池模板: 日韩少妇激情一区二区| 激情综合激情| 青青草原偷拍视频| 国产高潮流白浆视频| 欧美日韩国产精品va| 欧美曰批视频免费播放免费| 青青草a国产免费观看| 婷婷综合亚洲| 天天激情综合| 国产精品三级专区| 99re在线视频观看| 欧美精品成人一区二区视频一| 国产最爽的乱婬视频国语对白| 第九色区aⅴ天堂久久香| 免费无码一区二区| 精品少妇人妻一区二区| 亚洲三级色| 精品成人一区二区三区电影| 欧美日韩国产在线人成app| www.99在线观看| 国产色爱av资源综合区| 日韩二区三区无| а∨天堂一区中文字幕| 亚洲欧美在线精品一区二区| 国产国产人在线成免费视频狼人色| 国产欧美性爱网| 国产91透明丝袜美腿在线| 日韩免费中文字幕| 伊人91在线| 亚洲天堂网视频| 最新日韩AV网址在线观看| 亚洲精选高清无码| 亚洲国产一区在线观看| 伊人色综合久久天天| 人妻熟妇日韩AV在线播放| 美女无遮挡拍拍拍免费视频| 欧美在线一二区| 国产视频入口| 国产一级特黄aa级特黄裸毛片| 国产一区二区三区在线观看视频| 婷婷六月色| 毛片三级在线观看| 亚洲国产日韩一区| 综合五月天网| 国产亚洲精品自在久久不卡| 精品無碼一區在線觀看 | 欧美日本在线播放| 99视频在线精品免费观看6| 久久精品欧美一区二区| 国产一级妓女av网站| av在线手机播放| 91精品国产91欠久久久久| 91美女视频在线| 国产成人综合在线视频| 成人福利一区二区视频在线| 亚洲成a人片| 国产靠逼视频| 在线观看亚洲国产| 在线中文字幕网| 欧美一区二区啪啪| 热思思久久免费视频| 1769国产精品免费视频| 9966国产精品视频| 亚洲天堂日韩av电影| 欧美精品亚洲日韩a| 午夜日韩久久影院| 在线va视频| 熟妇无码人妻| 成人年鲁鲁在线观看视频| 中国国产一级毛片| 欧美五月婷婷| 中文一级毛片| 欧美日韩理论| 国产a v无码专区亚洲av| 无码国内精品人妻少妇蜜桃视频| AV老司机AV天堂| 九九九九热精品视频| 91视频99| 人人看人人鲁狠狠高清| 亚洲无线视频| 亚洲精品视频免费看| 亚洲天堂网在线播放|