李春強,柴瑋巖,劉 健,陳立南
(1. 北京理工大學 計算機學院, 北京 100081; 2. 北京信息科技大學 信息管理學院, 北京 100101;3. 北京郵電大學 網絡信息中心, 北京 100876)
?
異構數據庫應用系統集成的簡化方法*
李春強1,2,柴瑋巖1,劉健2,陳立南3
(1. 北京理工大學 計算機學院, 北京100081; 2. 北京信息科技大學 信息管理學院, 北京100101;3. 北京郵電大學 網絡信息中心, 北京100876)
摘要:針對現有集成方法主要面向數據庫系統層面的不足,重點討論面向應用系統層面的集成方法。通過引入數據庫應用系統的訪問控制新視角,將訪問控制層從應用層中劃分出來,繼而提出融入式訪問控制技術,并基于該訪問控制技術提出一種新的異構數據庫應用系統簡化集成方法。通過實例展示了如何應用簡化集成方法實現異構數據庫應用系統的集成,并通過對比分析驗證了新方法的優勢。
關鍵詞:數據庫應用系統;異構數據庫;信息集成;訪問控制;簡化集成
自數據庫(尤其是關系數據庫)技術產生以來,數據管理技術取得了革命性進步。關系數據庫技術經歷了自20世紀70年代以來四十多年的發展,圍繞關系數據庫管理系統形成了一個完整的生態系統(廠家、技術、產品、服務等),提供了包括數據采集、數據管理、數據查詢和分析、數據展現(可視化)等技術和產品,創造了巨大的數據庫產業[1-2]。數據庫應用系統(Database Application System, DBAS)即為其中之一,它普遍地應用在大多數企業信息化建設之中。然而,由于企業的不斷發展及其組織內、外部的調整與變化,例如企業間的兼并或業務功能的擴展等,致使異構DBAS的集成問題出現。隨著企業信息化進程的進一步加速,每個業務系統數據庫的異構問題越來越突出,而這些已存在的業務系統通過多年的積累已產生了大量的業務數據,如何有效地利用這些數據,即集成異構的DBAS,成為集成領域的一個熱點[3]。
解決這一問題需要集成不同的數據管理系統,對存儲在不同系統中的信息提供統一訪問。DBAS是針對某個特定目標,建立在數據庫管理系統(Database Management System, DBMS)之上的計算機應用系統,它包含兩個核心的部分,即數據庫系統和應用系統。現有的集成方法主要面向數據庫系統層面,用戶在訪問數據源時,越過了應用的顯示層和業務邏輯層,直接對應用的數據結構或數據庫進行操作。此外,這種集成通常需要建立一些全局統一模式,如一個全局的數據庫模式,便于異構數據庫集成的公共數據模型,以及向用戶提供統一模式和訪問接口的全局應用。因此,這種集成方式通常比較復雜,其利用率低而成本高,且周期長,不能充分滿足當前異構DBAS集成需求的多樣性。這種集成方式通常針對需要全局聯合查詢數據來提供相關服務的情形(如決策支持),稱之為緊密集成。
正如文獻[4]指出的那樣,信息集成存在于不同的領域,每一領域有各自特定的需求,這些需求需要新方法進行信息集成。因此,李春強針對異構DBAS的集成問題,重點討論面向應用系統層面的集成,試圖尋求一種成本低而利用率高的快速集成解決方案,它主要針對系統功能擴展或業務集成之類的問題,稱之為松散集成。
DBAS是由數據庫系統、應用程序系統、用戶組成的,可以很容易地看出傳統的緊密集成和欲求解決的松散集成方式之間的區別:松散集成方式的各集成部分在數據庫模型、數據模式等方面還是同構的,僅僅是應用系統的功能不同而已,而緊密集成后各集成部分將具有統一的應用系統功能。
1相關工作
信息集成是利用若干數據庫或其他的信息來源[5],使得來自這些來源的數據協同工作的過程。集成的數據庫可能是物理的(如:倉庫)或虛擬的(mediator或中間件,即使不是物理上存在也可以被查詢到)。來源可能是常規的數據庫或者其他的信息類型,比如網頁的集合。一般有兩種最常用的使數據庫或其他分布式信息源協同工作的方法:一種是建立數據倉庫,將眾多遺留數據庫中的信息進行適當的翻譯,周期性地拷貝到一個中心數據庫中,如文獻[6];另一種是實現一個Mediator或中間件,它是一種軟件組織,不存儲任何自己的數據,它是支持各個不同數據庫中數據的一個集成模型,并在這個模型和每個數據庫所使用的實際模型之間進行翻譯,如文獻[3]和文獻[7]。
目前,絕大多數的研究都是基于后一種方法,且解決方案幾乎都是通過尋求一種通用的公共數據模型,即以局部數據庫模式為基礎,建立全局的數據模式或全局外視圖,如文獻[8-17]。其中,文獻[11]從本體的角度出發,認為基于本體語義集成異構信息來源的系統結構一般分為三層:底層是各個分布的異構數據源;中間層存在一個描述特定用戶群關心領域的全局本體,它對每個用戶具有統一的語義,同時它與底層的異構數據源有著特定的對應關系;上層是用戶查詢訪問層。在基于本體的信息集成中,如何表示用戶對本體概念實例的查詢、如何建立本體到異構數據源的映射關系、如何根據這些關系將全局查詢劃分為若干個局域查詢、如何集成局域查詢結果,這些問題都需要解決。文獻[16]提出了一種網格環境下模式復用的異構數據庫訪問和集成方法,該方法首先提出了一種模式復用的虛擬數據庫構建策略,定義了異構數據庫資源的全局統一視圖,在此基礎上給出了數據庫資源注冊方式和虛擬數據庫查詢映射方法,為資源使用者提供了訪問數據庫的一致訪問接口。還有一些研究則借助一些流行的架構(如CORBA,XML和Java等),如文獻[12-15]。
然而,現有研究存在著若干問題。第一,這種數據模型既要自然地描述各種數據源的數據,又要方便地表示來自各種異構數據源的異構數據,因而必須具有很強的描述能力[8]。第二,這些研究所針對的數據源不僅包含數據庫系統,還包含其他一些數據源,如文件系統、電子郵件、電子表格、WWW上的HTML文件等。實驗證明[9],簡單領域本體構建對于領域專家來說工作量比較小,一般很容易完成,而且對模式匹配成功率的提高有很大的作用。包含的功能越多,為了求同存異,實現的方式必然越復雜,尤其是在科學技術日新月異的今天,分支越來越細,大而全的集成方案可能會帶來諸如集成的高復雜度、高成本以及低效率等問題。第三,現有的集成方法主要是針對數據庫系統層面,幾乎摒棄了其上的應用系統。數據需要專門的業務邏輯處理才能成為有利用價值的信息,而應用系統正是為此目的開發的,它能充分發掘和應用數據庫中的數據。所以,數據庫系統之上的應用系統是很有利用價值的。第四,集成需求是有差別的。企業信息化建設是一項復雜的系統工程, 不同的行業、企業規模和建設階段都會帶來不同的建設需求,應該詳細分析、因地制宜和有針對性地選擇符合企業所能承載的資金成本以及技術含量的集成方案。第五,現有相關研究幾乎都將集成系統的訪問控制與集成方法分開考慮,如文獻[18]和文獻[19]。
綜合以上分析可以看出,雖然有大量的研究信息集成的文獻,但是信息集成所面臨的挑戰遠未解決,特別是對于企業環境,企業真正需要的系統應該允許以一種透明的方式集成信息,而不需要整個的結構化和非結構化的數據源的模式信息[4]。因此,李春強等針對應用系統層面的集成需求,尋求一種低復雜度、低成本以及高效率的集成解決方案。
2DBAS的訪問控制視角
DBAS是由數據庫系統、應用程序系統、用戶組成的,具體包括:數據庫、DBMS、數據庫管理員、硬件平臺、軟件平臺、應用軟件和應用界面。這幾部分以一定的邏輯層次結構方式組成一個有機的整體,它們之間的層次結構關系如圖1所示。

圖1 DBAS層次結構示意圖Fig.1 Schematic diagram of DBAS hierarchy
圖1中虛線框所示部分為組成DBAS的要素:數據庫系統(包括數據庫、DBMS和接口)和應用程序系統。此外,由于DBAS會有多個用戶使用,為了使數據能被任何有權使用的用戶合法使用,DBAS還有一個很重要的組成部分,即訪問控制。訪問控制技術就是為了限制訪問主體對訪問客體的訪問權限——能訪問系統的何種資源以及如何使用這些資源,阻止未經允許的用戶有意或無意地獲取數據的技術。訪問控制的手段包括用戶識別代碼、口令、登錄控制、資源授權(例如,用戶配置文件、資源配置文件和控制列表)、授權核查、日志和審計。從訪問控制的新視角重新分析DBAS,如圖2所示。

圖2 DBAS的訪問控制視角Fig.2 DBAS access control perspective
圖2中將訪問控制功能從應用系統中劃分出來,記為訪問控制層;劃分出訪問控制層后,原應用系統的保留部分記為系統功能層;用戶在訪問控制層的監控之下訪問DBAS。一般地,訪問控制所需要的信息(如用戶賬號、密碼和授予的權限等)被存儲在數據庫特定的一系列表中,如圖2中所示的“用戶管理”,用戶訪問DBAS時需首先通過訪問控制層從數據庫的“用戶管理”中檢索用戶信息,在通過身份驗證后用戶才能按所授予的權限來訪問DBAS。換而言之,在DBAS中數據是通過應用程序提取、組織和顯示的,這不僅需要一定的介質來對數據進行存儲、加工和整理,并進行開發和利用,還需要一定的訪問控制方式。因此,在信息集成時,需要綜合考慮信息的存儲、組織、管理和訪問控制。
基于上述,從DBAS的訪問控制視角,可以進行如下推導:
1)將DBAS形式化表示為R=(U,AC,AS,DB),其中:U表示用戶,AC表示訪問控制,AS表示應用管理系統,DB表示數據庫系統;
2)若設U為定義域,DB為值域,AS為映射函數,AC為限制定義域的取值以及整個函數映射關系的規則。則可將R=(U,AC,AS,DB)中各參數之間的關系表示為如圖3所示的函數關系,即DB=AS(U)(附加AC規則)。

圖3 DBAS的函數映射關系示意圖Fig.3 Function map of DBAS
對DBAS而言,只要擁有合法的用戶賬號,就可以在授權范圍內訪問它,這一點從訪問控制的視角能更清晰地看到。此外,從訪問控制的視角來看,可以說以往的大多數研究是通過尋求函數映射關系的方式來提供集成解決方案的;然而,找符合定義域的值比尋求函數映射關系要容易得多。在面向應用系統層面的異構DBAS集成中,正是通過各數據源的“定義域”來尋求解決方案的。
3融入式訪問控制
數據庫系統通常采用三級模式結構,并提供兩級映像功能,這是數據庫管理系統內部的系統結構,如圖4[20]所示。雖然實際的數據庫管理系統產品種類很多,它們支持不同的數據模型、使用不同的數據庫語言、建立在不同的操作系統之上、數據的存儲結構也各不相同,但它們在體系結構上通常都具有相同的特征。數據庫系統的三級模式是對數據的三個抽象級別,它把數據的具體組織留給DBMS管理,使用戶能邏輯地、抽象地處理數據,而不必關心數據在計算機中的具體表示方式與存儲方式。在這三級模式之間,數據庫管理系統提供了兩層映像,它保證了數據庫系統中的數據能夠具有較高的邏輯獨立性和物理獨立性。在加入集成系統之前,每個DBAS就已經存在,并擁有專屬的DBMS,即集成系統中的各數據源都享有各自獨立的自治性;在實現數據共享的同時,每個數據源仍保留有各自獨立的應用特性、完整性控制和安全性控制。

圖4 數據庫系統的三級模式結構Fig.4 Three levels pattern structure of database system
可以通過下述方式實現集成系統的訪問控制。
首先,將整個集成系統的訪問控制域(用D表示)劃分為以下三種類型(如圖5中虛線框所示):
1)本地域(用LD表示):本地訪問控制域。集成系統中,各數據源自身原有的訪問控制域。
2)協作域(用PD表示):協作源訪問控制域。對某一個數據源來說,集成系統中其他數據源的原有訪問控制域。
3)協調域(用RD表示):協調系統訪問控制域。集成系統中,用于集成各數據源的那部分系統(稱為協調系統)對應的訪問控制域。

圖5 集成系統的訪問控制區域劃分示意圖Fig.5 Schematic diagram of the access control area of integrated system
相應地,將系統中的用戶(用U表示)分為以下三種類型:
1)本地用戶(用LU表示):集成系統中,各數據源的用戶。
2)協作用戶(用PU表示):對某一個數據源來說,來自集成系統中其他數據源的用戶。
3)協調用戶(用RU表示):協調系統訪問控制域中的用戶。
最后,擬訂如下規則:
1)各數據源申請加入集成系統時,系統會給每一個數據源(包括協調系統在內)分配一個唯一的系統標識符(System Identifier, SID)。
2)各域中所建用戶的用戶名不允許以SID開頭。
3)各域采用各自的訪問控制機制,可以相同也可以不同,且互不干擾。在本地域LD(或協作域PD)中,訪問控制方式仍然保持各數據源系統原來的訪問控制機制。所以,在集成系統中,只需為協調域RD選用適宜的訪問控制機制即可。
4)各域管理本域的用戶,各用戶在其對應的域中活動,且只需在本域內保證用戶名唯一性約束即可。
5)通過增加一些功能機制,可實現各用戶跨域訪問。
本地用戶LU向協調系統申請,實現跨域訪問,有兩種方式:跨域到協作域,稱為用戶平移;跨域到協調域,稱為用戶升級(這種方式只有在協調系統有全局應用時才適用,且不提倡,可根據實際需要進行取舍)。跨域時,該用戶名前加其所在數據源的SID作為前綴,并以這個“新”用戶名作為所跨域的用戶,接受所跨域的管理,并按所跨域的授權在該域中活動。
協調用戶RU向協調系統申請,可以跨域到各數據源所在域中活動,稱為用戶降級。同樣地,跨域后該用戶名也要進行變更,即用戶名前加協調系統的SID作為前綴,其余同上種跨域訪問方式所述。
6)申請跨域的用戶僅限定為各域所建的用戶,而不包括“跨域”用戶(即以SID開頭的用戶)。
整個集成系統的訪問控制域可簡單地表示為:D=LD+PD+RD;用戶可表示為:U=LU+PU+RU。集成系統的訪問控制是以(域,域用戶)進行的,即:(LD,LU),(PD,PU),(RD,RU)。這樣劃分的好處在于, 將整個系統的訪問控制“封裝”到各數據源和集成部件中,使得原已實現的訪問控制功能在集成系統中還能繼續正常運轉而無須任何改變。同一個用戶,經協調系統進行跨域處理后,可以用“同一個”用戶名在各域中活動。對于用戶權限的授予,可以采用先默認授權,再根據需要進行調整的方式。對用戶而言,這一切都是透明的。這樣一來,可以大大降低集成系統訪問控制機制的復雜度,所需要的只是增加一些協調各數據源“定義域”的功能機制;另外,可能需要增加用于調用各DBAS的入口鏈接等,而這只需簡單的一個應用界面和一些后臺鏈接處理即可。所增加的功能機制有很多實現方式,特別是在數據庫系統中可通過一些簡單的方法來實現,下文實例部分將會介紹一種實現方式。
這種方法是在所要訪問的系統中生成一個真正的“本地”用戶,它完全融入被訪問系統的內部之中。因此,將其稱為融入式訪問控制技術。
4簡化集成方法
現有的集成方案幾乎都是將訪問控制與集成方法分離開來討論,即先定集成,再定訪問控制機制。簡化集成方法(Simplified Integration Method,SIM)是以融入式訪問控制為基礎的,即將訪問控制與集成方法結合起來實現集成的方法。
圖6為SIM方法的系統框架,各部件功能如下。
1)注冊中心:負責對集成系統中各數據源的注冊信息進行維護管理,包括各數據源的入口地址、系統功能簡介等,并分配標識SID。
2)用戶中心:負責對協調域中的用戶進行維護管理,包括用戶名和所授予的權限。這里的用戶包括協調域所建的用戶和來自各數據源申請跨域訪問的用戶。
3)申請/審批中心:負責用戶跨域訪問申請的提交和審批。
4)協調中心:負責用戶跨域訪問處理。
5)訪問控制:協調域的訪問控制機制。
6)全局應用系統:負責為用戶提供訪問集成系統的應用界面,主要包括各數據源名稱列表,并附有其所包含系統功能和數據資源的簡介以及各DBAS應用系統的入口地址鏈接等。

圖6 簡化集成的系統框架Fig.6 System framework for simplifying integration
一個新的數據源DBAS在注冊中心進行注冊,獲得自己的標識SID后,即可加入到集成系統中。集成系統中的各數據源,只要擁有合法的本地域用戶賬號,即可申請跨域訪問。在全局應用系統界面,用戶可以瀏覽到所有集成的數據源(附有所包含系統功能和數據資源的簡介),點擊欲訪問數據源的鏈接,即可申請跨域訪問該數據源。當有跨域訪問時,協調中心會首先驗證該用戶是否具有此訪問權限,如果有則為用戶進行跨域處理并提供轉接訪問資源的服務;否則,返回相應的提示信息給用戶,并引導用戶轉向申請/審批中心,請用戶先提交跨域申請,待審批通過后,再進行跨域訪問。
以上所述為簡化集成的通用框架。這種集成方式較適合于企業間的兼并、整合之類的情形,各數據源在集成系統中不僅能保留自己的系統(即在總部的授權下實現獨立自主運營),還能實現互相訪問(即各部門之間實現信息資源共享)。特別地,如果是作為一個子模塊以進行功能擴展的方式來集成,則上述框架可以更為簡化。
5實例與分析
5.1實例
實例描述:有一政府辦公自動化系統,它是基于瀏覽器/服務器(Browser/Server, B/S)結構的DBAS,并已投入運行了一段時間,現客戶要求增加一個“公文流轉”功能。目前,已有一個開發完成的具有唯一公文流轉功能的DBAS,它很符合客戶的要求。問題在于,這兩個DBAS是完全獨立的系統,雖然都是B/S結構,且后臺數據庫也均采用MS SQL Server 2005,但二者之間是異構的數據庫系統。
其實,這就是要在一個DBAS(稱為主方)中嵌入或擴展一個功能模塊(稱為客方)。但是,客方擁有自身獨立的應用系統和數據庫系統,它與主方之間是異構的。集成的需求在于客方的整個系統功能,包括數據庫系統和應用系統;因此,這是面向應用系統層面的松散集成。如圖7所示,為該實例的簡化集成示意圖。

圖7 實例的簡化集成示意圖Fig.7 Example of simplified integrated schematic diagram
實現方案步驟為:
1)由于主方(辦公自動化系統)和客方(公文流轉系統)的后臺數據庫均為MS SQL Server 2005,因此先將客方的數據庫導入主方的DBMS中。這樣,主方的DBMS中就有兩個數據庫。
2)編寫一個觸發器,對主方數據庫中的權限表進行監控。一旦授權某個用戶公文流轉功能,就觸發預先編寫好的代碼,即:在客方數據庫的用戶管理表中添加一條新記錄,將該用戶的用戶名及密碼等相關信息作為新記錄相應字段的值。
3)將主方應用系統的公文流轉功能鏈接到客方應用系統的入口地址,并進行后臺數據庫轉接處理。
4)進行一些完善工作:①對主方的權限表還需要編寫一個觸發器,用于當收回某個用戶的公文流轉權限時,刪除客方用戶管理表中相應的用戶信息;②主方中,具有公文流轉權限的用戶賬號被“停用”或“刪除”時,客方用戶管理表中相應的用戶信息也要做相應的處理,這也通過編寫觸發器的方式來實現;③系統界面相關信息的一致性,主要包括客方界面的一些標識信息要與主方保持一致,例如:系統名稱、使用單位、開發商等信息標識;④界面設計風格的調整,對于界面風格要盡量在視覺上給人一種很自然的、融為一體的感覺。
這樣一來,當具有公文流轉權限的用戶從主方系統點擊公文流轉功能時,就會自動地從主方系統跨域到客方系統,不僅前臺界面鏈接到了客方的應用系統,而且后臺也轉接到了客方的數據庫。此外,由于該用戶在被授予公文流轉權限時,其用戶賬號及密碼等相關信息已自動加入到客方數據庫的用戶管理表中,故而當該用戶跨域進入客方DBAS時,身份驗證通過,自然可以順利地在客方系統中進行相關操作。反之,不具有公文流轉權限的用戶,因其在客方系統中沒有相關身份信息,故身份驗證將不會通過,從而被拒絕訪問。這一切就好像是在同一個DBAS中發生的一樣,用戶完全感覺不到是在兩個DBAS之間進行切換操作。
5.2性能分析
這個實現方案只用了三個觸發器、一個入口地址鏈接、少量的后臺數據庫轉接處理和界面調整,就實現了兩個異構DBAS的集成。通常情況下,這種松散集成僅需數個工作日便可完成,而傳統的緊密集成方式通常需要數月才能完成。此外,新方法不僅在時間上具有絕對優勢,而且在其他很多方面也都具有明顯優勢,見表1。因此,與傳統方法相比,新方法要遠遠優于傳統的集成方法。

表1 對比分析表
上述集成案例是李春強等在實際工作當中遇到的真實案例,該集成系統已投入使用,且運轉良好。通過這個實例可以看到,在SIM方法的實際應用中,根據具體情況很多功能部件都可以簡化,從而最終可用比較簡單的方法來實現系統集成。
6結論
信息集成是一個充滿活力的領域,它不僅由工程創新所驅動著,而且還有問題本身的演變[21]。針對異構DBAS的集成,主要面向應用系統層面,尋求其低成本、高利用率的快速集成解決方案。所采用的簡化集成方法充分利用了DBAS的原有資源,并將訪問控制與集成方法結合考慮,無論是原數據源的應用系統,還是訪問控制機制,全部充分利用,減少了浪費,降低了集成成本,大大簡化了集成。這種集成方式可用于軟件復用、協作開發等。當然,還有很多不足的地方尚需完善,如跨域用戶的授權方式及其流程等方面。
參考文獻(References)
[1]Wild C, Erd?s J, Warmuth M, et al. Planned and ongoing projects (POP) database: development and results [J]. International Journal of Technology Assessment in Health Care, 2014, 30(5): 497-503.
[2]金澈清, 錢衛寧, 周敏奇, 等. 數據管理系統評測基準:從傳統數據庫到新興大數據[J]. 計算機學報, 2015, 38(1): 18-34.
JIN Cheqing, QIAN Weining, ZHOU Minqi, et al. Benchmarking data management systems:from traditional database to emergent big data[J]. Chinese Journal of Computers, 2015, 38(1): 18-34. (in Chinese)
[3]Wei X M. Heterogeneous database integration middleware based on web services[J]. Physics Procedia, 2012, 24(Part B): 877-882.
[4]Mohania M, Bhide M. New trends in information integration[C]//Proceedings of the 2nd International Conference on Ubiquitous Information Management and Communication,ACM, 2008: 74-81.
[5]Quix C, Jarke M. Information integration in research information systems[J]. Procedia Computer Science, 2014, 33(12): 18-24.
[6]Naoual M, Abderrafiaa E. Semantic technologies applying to data warehouses federation[J]. Journal of Emerging Technologies in Web Intelligence, 2014, 6(1): 15-19.
[7]Scott M, Boardman R P, Reed P A,et al. Managing heterogeneous datasets[J]. Information Systems, 2014, 44(8): 34-53.
[8]Timko I, Dyreson C, Pedersen T B. A probabilistic data model and algebra for location-based data warehouses and their implementation[J]. Geoinformatica, 2014, 18(2): 357-403.
[9]王博, 郭波. 自治異構數據源聚集模型與算法研究[J]. 計算機研究與發展, 2008, 45(9): 1546-1553.
WANG Bo,GUO Bo. Study of aggregation process model and algorithms of autonomy heterogeneous data sources [J]. Journal of Computer Research and Development, 2008, 45(9): 1546-1553. (in Chinese)
[10]Tomazela B, Hara C S, Ciferri R R, et al. Empowering integration processes with data provenance[J]. Data & Knowledge Engineering, 2013, 86(5): 102-123.
[11]李劍, 宋靖宇, 鐘華. 基于本體的異構信息集成查詢劃分及轉換[J]. 軟件學報, 2007, 18(10): 2495-2506.
LI Jian, SONG Jingyu, ZHONG Hua. Ontology-based query division and reformulation for heterogeneous information integration [J]. Journal of Software, 2007, 18(10): 2495-2506. (in Chinese)
[12]Wang Y P, Ge J H, Shao J P, et al. Research for data exchange technology of heterogeneous database based on XML[J]. Manufacturing Automation Technology, 2009, 392/394: 903-907.
[13]Zhang Z Y, Wang H H, Zhang H. Research of heterogeneous database integration based on XML and JAVA technology[C] // Proceedings of 2009 International Conference on E-Learning, E-Business, Enterprise Information Systems and E-Government, 2009: 275-278.
[14]Liu X H, Shi Y M, Xu Y B, et al. Heterogeneous database integration of EPR system based on OGSA-DAI[J]. High Performance Computing and Applications, 2010, 5938: 257-263.
[15]Zhang Z Y, Gu W, Cao Z. Research and implementation the system integration on distributed heterogeneous database based on the Hibernate[C]//Proceedings of 2011 International Conference on Computer Science and Network Technology (ICCSNT), 2012: 1537-1540.
[16]陳小武, 潘章晟, 趙沁平. 網格環境中模式復用的異構數據庫訪問和集成方法[J]. 軟件學報, 2006, 17(11): 2224-2233.
CHEN Xiaowu, PAN Zhangsheng, ZHAO Qinping. A schema-reusable method on heterogenous databases access and integration in grid environment [J]. Journal of Software, 2006, 17(11): 2224-2233. (in Chinese)
[17]Gao Z, Luo S W, Lin Y, et al. A grid-based integration model of heterogeneous database systems[C] //Proceedings of International Conference on Information Technology and Computer Science, 2009: 126-129.
[18]Borkar V, Carey M, Engovatov D, et al. Access control in the aqualogic data services platform[C] //Proceedings of ACM Sigmod/Pods Conference, 2009: 939-946.
[19]Leighton G,Barbosa D. Access control policy translation, verification, and minimization within heterogeneous data federations[J]. ACM Transactions on Information and System Security, 2011, 14(3): 25.
[20]王珊, 薩師煊. 數據庫系統概論[M]. 4版. 北京: 高等教育出版社, 2006. WANG Shan, SA Shixuan. Introduction to database system[M]. 4th ed.Beijing: Higher Education Press, 2006. (in Chinese)
[21]Bernstein P A, Haas L M. Information integration in the enterprise[J]. Communications of the ACM, 2008, 51(9): 72-79.
doi:10.11887/j.cn.201602011
*收稿日期:2015-03-18
基金項目:“核高基”國家科技重大專項基金資助項目(2012ZX01039-004-48)
作者簡介:李春強(1973—),男,吉林敦化人,副研究員,博士研究生,E-mail:tsiang@126.com
中圖分類號:TP311
文獻標志碼:A
文章編號:1001-2486(2016)02-061-07
Simplified method for integration of heterogeneous database application system
LI Chunqiang1,2, CHAI Weiyan1, LIU Jian2, CHEN Linan3
(1. School of Computer Science and Technology, Beijing Institute of Technology, Beijing 100081, China;2. School of Information Management, Beijing Information Science & Technology University, Beijing 100101, China;3. Network Information Center, Beijing University of Post and Telecommunications, Beijing 100876, China)
Abstract:The existing integrated methods are mainly aimed at the layer of database system. In view of the shortage of those methods, the integration method in the application layer was focused on. According to a new perspective of access control for the database application system, the access control layer was separated from the application layer. A new method called as “fusion” access control was put forward. Based on the method, a simplified integration method of heterogeneous database application system was proposed. An example was shown about how to apply the simplified integration method to achieve the integration of heterogeneous database application system, and the advantages of the new method were verified by a comparison analysis.
Key words:database application system; heterogeneous database; information integration; access control; simplified integration
http://journal.nudt.edu.cn