[摘 要] 在分析國內(nèi)外在異構(gòu)信息資源的發(fā)現(xiàn)機(jī)制和管理方法研究現(xiàn)狀的基礎(chǔ)上,提出了云計(jì)算環(huán)境下的異構(gòu)信息資源的發(fā)現(xiàn)機(jī)制與管理方法,并對需要解決的問題進(jìn)行了闡述,提出了解決方案。
[關(guān)鍵詞] 云計(jì)算 異構(gòu)信息資源 信息發(fā)現(xiàn) 本體
一、引言
互聯(lián)網(wǎng)技術(shù)的發(fā)展使得目前的網(wǎng)絡(luò)上有各種各樣的信息資源可供訪問,而且這些信息資源正在成幾何級增長。但信息仍以不同的形式存儲在不同的系統(tǒng)中,分而不聚,聚而不合,呈分布異構(gòu)狀態(tài)。隨著應(yīng)用需求的不斷增加,越來越多的用戶希望能夠透明地獲取和處理來自這些海量信息源中的有用信息,實(shí)現(xiàn)多個(gè)軟硬件系統(tǒng),以及不同信息源之間的互操作。然而,這些信息源物理上可能分布在異構(gòu)環(huán)境的多個(gè)自治域(Autonomous Domain)中,有著不同的數(shù)據(jù)格式、存儲方式、訪問控制策略,邏輯上則可能在數(shù)據(jù)模型、操縱語言和數(shù)據(jù)語義等方面存在著很大差異。異構(gòu)信息服務(wù)系統(tǒng)可以屏蔽現(xiàn)在已有的各種異構(gòu)數(shù)據(jù)管理系統(tǒng)不同的訪問方法和用戶界面,給用戶呈現(xiàn)一個(gè)訪問多種異構(gòu)數(shù)據(jù)源的公共接口,提供一個(gè)集成處理多種數(shù)據(jù)源、整合多種數(shù)據(jù)查詢結(jié)果的信息交互處理平臺。
云計(jì)算(Cloud Computing)理念的提出,越來越受到計(jì)算機(jī)科學(xué)領(lǐng)域和管理科學(xué)領(lǐng)域的重視,并成為當(dāng)前和未來相當(dāng)長時(shí)間內(nèi)的研究熱點(diǎn)。云計(jì)算是指在互聯(lián)網(wǎng)上,信息提供者以服務(wù)的形式提供虛擬的信息資源,用戶通過互聯(lián)網(wǎng)按需獲取可伸縮的信息資源。它是一種全新的網(wǎng)絡(luò)服務(wù)方式,它將傳統(tǒng)的以桌面為核心的任務(wù)處理轉(zhuǎn)化為以網(wǎng)絡(luò)為核心的任務(wù)處理,利用互聯(lián)網(wǎng)中的計(jì)算系統(tǒng)來支持互聯(lián)網(wǎng)各類應(yīng)用。
二、云計(jì)算環(huán)境下異構(gòu)信息資源的管理
云計(jì)算環(huán)境下信息資源的發(fā)現(xiàn)機(jī)制是其管理的前提和基礎(chǔ),需要設(shè)計(jì)一個(gè)合理的基于語義的信息資源發(fā)現(xiàn)機(jī)制,主要是設(shè)置相關(guān)特征信息,比如信息資源的本體描述,信息資源的狀態(tài),信息資源的本體映射方法等。采用從信息資源全生命周期的角度研究的方法,結(jié)合基于本體的語義描述,解決這部分涉及到的相關(guān)問題。信息資源生命周期管理作為一種信息管理模型,認(rèn)為信息經(jīng)歷一個(gè)生命周期,對信息進(jìn)行貫穿其整個(gè)生命的管理需要相應(yīng)的策略和技術(shù)實(shí)現(xiàn)手段。如圖1所示,信息資源的全生命周期管理包括信息資源的發(fā)現(xiàn)、表達(dá)、組織、使用,變更和消亡。基于本體的語義描述是關(guān)鍵,通過基于領(lǐng)域的本體庫的建立解決信息的描述,這種語義描述是對信息資源在全生命周期各個(gè)階段的識別和分析的基礎(chǔ)。
在云計(jì)算環(huán)境下,領(lǐng)域本體庫中的本體是對信息資源的概念及概念間的關(guān)系提出的規(guī)范的、共享化的精確描述。構(gòu)建領(lǐng)域本體庫是擴(kuò)展 UDDI 支持語義信息的前提。對于本體構(gòu)建,主要包括領(lǐng)域、概念、關(guān)系、信息資源、操作、輸入及輸出參數(shù)、信息資源狀態(tài)。其中,信息資源是指與某個(gè)本體相關(guān)聯(lián)的信息資源;信息資源的狀態(tài)是指資源可用,不可用,運(yùn)行和停止。這些信息資源中的相關(guān)聯(lián)描述對于不同性質(zhì)的、不同來源的信息資源的反應(yīng)至關(guān)重要,可以在一定程度上解決。
異構(gòu)信息資源的規(guī)范化,即通過本體映射機(jī)制實(shí)現(xiàn)。本體和本體之間存在差異,這決定了本體映射存在的必要性,通過本體映射,可以解決語義異構(gòu)問題。其過程包括:范化,這一步把待映射的本體用同一種語言表示;相似度的計(jì)算,計(jì)算概念之間的語義相似度;根據(jù)概念間的相似度,按照一定的策略確定映射關(guān)系;根據(jù)領(lǐng)域約束領(lǐng)域?qū)<覍τ成浣Y(jié)果進(jìn)行修正。映射的方式有兩種:一種是靜態(tài)執(zhí)行方式,它通過一次映射就轉(zhuǎn)換源本體的所有相關(guān)實(shí)體到目標(biāo)本體;另一種是可視的執(zhí)行方式,它每次查詢目標(biāo)本體時(shí),都要轉(zhuǎn)換查詢內(nèi)容到對應(yīng)的源本體中,并進(jìn)行查詢。
三、云計(jì)算環(huán)境下異構(gòu)信息資源的管理方法
1.云計(jì)算環(huán)境下異構(gòu)信息的本體表達(dá)
首先從功能、領(lǐng)域、行業(yè)等角度對異構(gòu)信息進(jìn)行分類和聚類,區(qū)分每個(gè)類別信息的異構(gòu)類型。針對結(jié)構(gòu)級異構(gòu),主要采用XML中間件技術(shù)進(jìn)行標(biāo)準(zhǔn)化;針對語義級異構(gòu)主要采取如下方面進(jìn)行本體表達(dá):Class(類):具有某些屬性的個(gè)體的集合,對應(yīng)于描述邏輯中的概念;subClassOf(子類):通過該原語定義一個(gè)類是另一個(gè)類或多個(gè)類的子類來創(chuàng)建類之間的層次關(guān)系,對應(yīng)于描述邏輯中的概念包含;Property(屬性):用來表示個(gè)體與個(gè)體之間或者個(gè)體與數(shù)值之間的關(guān)系,對應(yīng)于描述邏輯中的角色;subPropertyOf(子屬性):可以通過該原語定義一個(gè)屬性是另一個(gè)屬性或多個(gè)屬性的子屬性來創(chuàng)建屬性之間的層次關(guān)系,對應(yīng)于描述邏輯中的;domain(定義域):一個(gè)屬性的定義域用來約束該屬性適用的個(gè)體;range(值域):一個(gè)屬性的值域用來限制哪些個(gè)體可以成為屬性的值;Individual(個(gè)體) :個(gè)體是類的實(shí)例,對應(yīng)于描述邏輯中的x∈C。
2.基于本體的異構(gòu)信息的融合
通過本體的方式描述每個(gè)信息源的語義,采用單本體作為一個(gè)全局本體為語義的形式化提供了一個(gè)共用的詞匯庫,所有的信息源都和這個(gè)全局域本體有關(guān);通過多本體方法來對域的不同表示,用本體間的映射來確定不同信息源本體在語義上對應(yīng)的術(shù)語,建立術(shù)語間的對應(yīng)關(guān)系;基于本體和聚類分析的方法如下步驟:
(1)從觀測信息中選擇一組樣本;
(2)定義特征變量集合以表征樣本中實(shí)體;
(3)通過本體之間關(guān)系來計(jì)算信息的相似性,并按照一個(gè)相似性準(zhǔn)則劃分信息集;
(4)檢驗(yàn)劃分成的類對子集應(yīng)用是否有意義;
(5)反復(fù)將產(chǎn)生的子集加以劃分,并對劃分結(jié)果使用第4步,直到再?zèng)]有進(jìn)一步的細(xì)分結(jié)果,或者直到滿足某種停止規(guī)則為止。
通過上述方法來來發(fā)現(xiàn)和處理冗余,發(fā)現(xiàn)沖突和消解沖突來對異構(gòu)信息進(jìn)行融合。
3.基于本體的異構(gòu)信息的集成
異構(gòu)信息集成模型如圖2所示。用戶提交一個(gè)全局查詢,首先需要對查詢語句進(jìn)行語法檢查。這里的語法檢查除了需要檢查查詢語句的正確性外,還要根據(jù)全局模式中的信息對其進(jìn)行語義上的檢查。檢驗(yàn)正確后,根據(jù)全局模式信息將該查詢分解成若干個(gè)子查詢,根據(jù)子查詢間的關(guān)聯(lián)關(guān)系,對查詢進(jìn)行需求集成,將集成的查詢轉(zhuǎn)換成局部查詢,每個(gè)局部查詢分別去調(diào)用局部數(shù)據(jù)源,對返回結(jié)果進(jìn)行本體映射,對映射的結(jié)果進(jìn)行集成處理,將處理的結(jié)果集動(dòng)態(tài)轉(zhuǎn)換為XML提供給用戶。
三、結(jié)束語
近幾年,云計(jì)算的發(fā)展越來越廣泛,已經(jīng)滲透的互聯(lián)網(wǎng)的各個(gè)領(lǐng)域,世界各知名企業(yè)也都提出了自己的云計(jì)算發(fā)展戰(zhàn)略,在異構(gòu)信息資源的發(fā)現(xiàn)與管理機(jī)制上,更多的是應(yīng)用在地理信息系統(tǒng)中,本文在分析國內(nèi)外在異構(gòu)信息資源的發(fā)現(xiàn)機(jī)制和管理方法研究現(xiàn)狀的基礎(chǔ)上,提出了云計(jì)算環(huán)境下的異構(gòu)信息資源的發(fā)現(xiàn)機(jī)制與管理方法,并對需要解決的問題進(jìn)行了闡述,提出了解決方案,旨在使得異構(gòu)信息資源的應(yīng)用能不斷的應(yīng)用到其他領(lǐng)域中。
參考文獻(xiàn):
[1] (美)Peter Fingar著, 王靈俊譯. 云計(jì)算21世紀(jì)的商業(yè)平臺[P], 北京:電子工業(yè)出版社. 2009.11
[2] Cloud computing. [EB/OL]. http://www.ibm.com/developerworks/cn/web/ar-cloudaws1/. 2009.4.13
[3] Anastasios Kementsietsidis,Marcelo Arenas.Data Sharing Through Query Translation in Autonomous Sources.In Proceedings of the 30th International Conference on Very Large Data Bases(VLDB 2004),Toronto,Canada,2004:468-479
[4] UDDI. [EB/OL]. http://baike.baidu.com/view/160665.htm. 2011.2.20
[5] [Kim Christensen, Thorbj m H jgaard olesen, Lone Leth Thomsen.Matching semantically described web services using ontologies[J]. Information Technology and Control, 2006,35(3A):267-275
[6] DAML Services Home Page. [EB/OL]. http://www.daml.org/index.html. 2011.2.20
[7]OWL.[EB/OL].http://www.w3.org/TR/#tr_OWL_Web_Ontology_Language. 2009.10.27
[8] Mark H. Burstein, Drew V. McDermott. Ontology Translation for Interoperability Among Semantic Web Services. Artificial Intelligence. 26(1) : 71-82, 2005.
[9] Atousa Pahlevan, Hausi A. Muller. Static-Discovery Dynamic-Selection (SDDS) Approach to Web Service Discovery[?]. 2009 IEEE DOI. 10.1109/SERVICES-I.2009.81
[10] 宋超榮,羅偉其. 基于JXTA 和OWL-S 上的Web Services 發(fā)現(xiàn)的研究[J]. 2006年第22 卷第1-3期