莊光磊,王 靜
(日照職業技術學院,日照 276800)
基于服務的信息集成與訪問模型研究
莊光磊,王 靜
(日照職業技術學院,日照 276800)
傳統的信息集成技術,主要有單個的聯邦系統和基于組件的分布式系統。單個的聯邦系統是指將各個數據源的數據集成到一個系統中,統一管理和維護,各集成系統間處于相對獨立狀態,系統維護和擴展比較困難。基于組件的分布式系統構建在分布式組件模型上,如CORBA、DCOM、RMI,這種方式克服了單個聯邦系統的主要特點,適合于分布式系統,便于維護和擴展,但是CORBA、DCOM、RMI對于服務器端和客戶端的耦合性要求非常高[1]。正是由于信息集成過程中動態、可擴展和松耦合性的要求,本文提出基于服務來構建信息集成與訪問模型。
Web Service是建立在開放的Internet基礎上的一種分布式網絡模型,是面向商業應用的一種框架,有關組織已經發布了一些實現Web Service所需要的協議和標準,如Soap, WSDL, UDDI等。Web Service的目的是將信息和服務在Internet上實現提供和訪問,實現跨平臺的互操作性。為了實現此目標,Web Service完全基于XML、XSD等獨立于平臺、獨立于軟件供應商、獨立于編程語言的標準,是創建可互操作的、分布式應用程序的一種平臺[2]。
Web Service的基本結構是基于服務提供者、請求者和中介者三個角色,以及服務的發布、發現和服務請求者與服務提供者之間的綁定三個動作而定義的。
提供者:提供服務功能的實體,等待為其他服務和用戶提供自己的功能。
請求者:服務功能的使用者,它向服務提供者發送服務請求消息,請求使用服務。
中介者:將服務請求者和合適的服務提供者聯系在一起的管理者,UDDI就是一個全球最大的服務中介者。
S O A P引擎采用的是目前比較流行的Tomcat+AXIS。

圖1 信息集成與訪問模型整體框架圖
在開發信息集成系統的過程中,如何解決信息的異構性是一個關鍵的問題。異構性是指信息集成系統中兩個信息源的不相似程度,而這種不相似發生在不同的級別,最底層指硬件平臺、操作系統等異構,而這種跨平臺跨操作系統的要求正可以用java+xml來解決。其次指信息自身類型的不同。在本系統中我們將異構信息分為三類:數據庫信息(如Oracle、SQL Server、Sybase、Access等)、文本信息(如現有的xml文檔)、其它信息(如傳感器的動態數據、遺留代碼等)。
reml(root-element xml),是異構信息包裝后的一種中間格式,嚴格遵守xml的語法規范,其格式如下:

其中,root為reml的根元素,element為root的子元素,element的個數是可以擴展的,可以是一個或多個且子元素的名稱不固定,element下面子元素的名稱是隨著數據庫表中欄位名稱的不同變化的,如
可以看出,reml信息就是一個有著更嚴格定義(有特定標簽)的xml信息。
包裝部分采用Java語言來實現,以滿足系統的可移植性和良好的跨平臺性能,開發平臺采用Eclipse, Eclipse是一個開放源碼的、可擴展的應用開發平臺,可以用于構建Web Service、J2EE等各種類型的應用。本系統使用JDBC訪問數據庫,JDBC(Java DataBase Connectivity)是Java與數據庫的接口規范,JDBC定義了一個支持標準SQL功能的通用底層的應用程序編程接口(API),它由Java語言編寫的類和接口組成。 JDBC API定義了若干Java中的類,表示數據庫鏈接、SQL指令、結果集、數據庫元數據等。它允許Java程序員發送SQL指令并處理結果。通過驅動程序管理器,JDBC API可以利用不同的驅動程序鏈接不同的數據庫系統。JDBC的DatabaseMetaData接口提供了一系列方法可以檢驗DBMS對特定特性的支持,從而能對特定數據庫的特性給予支持。
如圖2所示為一個包裝前的數據庫信息和一個包裝后的reml信息(圖中只截取了一部分)。

圖2 數據庫信息圖
對于信息請求方,當獲得信息提供方返回的S O A P消息后,實際上返回的是一個String字符串(其中包含reml中嚴格定義的元素
使用JDOM解析器需將jdom.jar和xerces.jar文件復制到Tomcat網絡應用程序的WEB-INFlib目錄中。Jdom.jar可以在jdom的官方網站上下載,解析過程中比較重要的幾個方法如下:

對于一個信息集成系統來說信息的安全非常重要,而安全訪問控制必須充分考慮認證和授權。目前,網絡通信中的安全認證技術有很多,如使用PKI,X.509認證以及SSL通信協議機制,提供單點登錄(Single Sign-On, SSO)等安全服務。目前主流的系統授權控制機制是基于角色的授權策略(Role-Based Authorization Control,RBAC),然后借助訪問控制列表(Access Control List,ACL)來實現。但是本系統是基于Web Service的,所以信息的動態增加或撤銷不可避免,這就增加了安全控制的復雜性,為了達到動態授權和控制信息訪問,本系統采用基于門限閉包的授權控制方案[3]。
門限閉包(用ε表示)是一組滿足如下三個條件的(t,S)門限方案(其中,S是一組用戶的集合且滿足
1)Redundant-free,即不存在兩個不同的(t1,S1),(t2, S2)∈ε使得

可以證明[4],在某個訪問結構T0與ε之間存在著一一對應的關系,即一致性,而正是這種一致性保證了門限閉包策略和安全控制結構是動態一致的,具有很好的可擴展性。
為解決信息集成系統中信息的異構、多樣、自治性,提出了一種擁有reml中間信息格式的信息集成與訪問模型,但是在系統的應用過程中,同時也發現了一些不足,下個階段將繼續研究如何在用戶層增加一個集成信息的遠程修改,并對修改過程中的信息定位和權限問題作進一步的研究。
[1]WebServices: NextGenerationApplicationIntegrationArchit ecture[EB/OL].http://www.webservices.ort/,2003.7.
[2]Kishore Channabasavaiah, Kerrie Holley,Edward M, et al.Migrating to a Service-Oriented Architecture Part 1,2[EB/OL].
[3]陳勇,趙曦濱,顧明.Web Services應用系統的多級授權研究及實現[J].計算機應用研究,2006,(07).
[4]Zhang C R,Lam K Y,Jajodia S.Scalable Threshold Closure[J].Theoretical Computer Science,1999,226(1-2):185-206.
Research on information integration and access models built on service
ZHUANG Guang-lei, WANG Jing
針對目前網絡中信息的異構性、多樣性、分布性等特點,基于Web Service架構構建了一個異構信息集成與訪問模型。在此模型中,對各種異構信息進行包裝并且提出了一種通用的reml信息中間格式,然后將信息注冊到信息注冊中心,信息請求方獲得reml 格式的信息后,使用reml解析器解析并基于瀏覽器顯示給用戶。此外,還針對模型中的安全問題進行了研究。
Web Service;reml;信息集成;門限閉包
王靜(1982 -),女,山東日照人,學士,研究方向為并行計算、網格計算。
TP393
A
1009-0134(2011)5(上)-0034-03
10.3969/j.issn.1009-0134.2011.5(上).13
2010-11-21