張 敏,王艷麗,王振輝
(西安翻譯學院,西安,710105)
分布式計算機數據庫系統設計與探究
張 敏,王艷麗,王振輝
(西安翻譯學院,西安,710105)
文章主要分析了分布式數據庫設計的特點、方法與技術,綜述了自頂向下和自底向上分布設計方法的理論和技術,主要論述了DATAID-D 自頂向下設計方法,并分析了分布式計算機數據庫系統功能的實現。
分布式;數據庫系統;技術方法
1.1 分布式數據庫系統的定義
分布式數據庫是由一組分布在計算機網絡中不同計算機上的數據組成的,該條件下的網絡中各個結點可以實現獨立處理功能,在網絡通信子系統的作用下,便能夠對全局應用進行操作。實際上,分布式數據庫系統物理上的每個場地都是獨立的數據庫系統,它運行其局部DBMS,有其自身的數據庫、一組終端、中央處理器,具有高度的自治性,可以執行局部的應用程序。
1.2 分布式數據庫的特點
從邏輯上來看,分布式數據庫的數據具有整體性特點,就好比是一個大的集中是數據庫,而在物理上卻在不同的場地分散。因此,在分布式系統中存在著兩種概念,一是從系統角度出發進行研究的全局數據庫概念,全局應用可以涉及兩個或多個場地的數據庫,二是從不同場地的角度出發研究的局部數據庫概念,局部應用主要在某一具體場地的數據庫。因此,我們可以將分布式數據庫系統的特點總結為兩點,一是數據在物理上的“分布性”,二是邏輯上的“整體性”。
本研究中主要指出兩種分布式數據庫系統的創建方法,一是自底向上分布設計方法,二是自頂向下分布設計方法,在實際的設計過程中,人們一般都是兩種方法結合使用的。
(1)組合法:自底向上的創建方法,該方法在進行數據庫設計時需要從頭開始設計,如圖1所示:

圖1 自底向上分布創建方法
(2)重構法:自頂向下的創建方法,該方法需要聚集現存數據庫。
該創建方法的在實際應用過程中需要注意以下三點問題:
一是該方法的實現步驟和內容:分布設計位于邏輯設計與物理設計之間,以一個全局的與站點無關的模式作為輸入,以產生分布式數據庫各站點的子模式為結果輸出,包括數據的分片設計和片段的位置分配設計,其中,分片是把全局對象細分成許多不同邏輯片段的過程;分配即將不同的片段一個或多個站點進行映射的過程,數據分配最佳單位就是片段。
二是數據的分片設計:分片方法包括水平分片、垂直分片、混合分片三種,在分片過程中設計出的劃分方案需要適合于全局數據。這種方案得到的片段作為分布式數據庫中數據的分配和存儲單位,既可以對應用具有最大可能的本地性,又可以使應用中的操作量減少,即使得各片段位于其使用最多的站點。
三是數據庫片段的位置分配設計:其設計方法包括非冗余分配、所有得益站點法與附加復制法三種。
DATAID-D方法是由意大利米蘭工業大學提出的自頂向下設計分布式數據庫的一個典型方法。DATAID-D方法下的分布式數據庫設計主要包括9個步驟,其中,需求分析主要是分析用戶的實際要求;概念設計主要是將需求分析得到的用戶需求抽象為信息結構,即概念結構設計,如畫E-R圖;邏輯設計就是將E-R圖轉換為相應的數據模型相符合的邏輯結構,如關系模型;分布設計主要研究產生全局數據的分片模式和片段的位置分配模式,分配模式描述了分配在各站點上的數據情況;物理設計主要是確定數據庫的物理結構,并對物理結構進行評價;分布要求分析主要是收集關于分布的信息,如水平分片的劃分謂詞、每一應用在各站點激活的頻率等,輸入用戶對分布的要求和全局數據概念模型與操作模式,輸出應用的頻率表,實體的劃分表和數據與應用的極化表。
4.1 系統功能的設計
在用戶開始登錄的過程中,系統會開始建立后臺數據庫連接,以用戶的不同類型為具體依據打開其所需要的數據表,并對數據表中的數據執行讀取命令。系統要求用戶只有在通過系統安全認證的基礎上才可以登錄,若用戶在登錄過程中經驗證為合法用戶,那么用戶姓名與其可以享有的功能會顯示在系統主頁面,系統會將其所讀取的數據直接在Application或session 對象中進行存儲,并傳遞到后面的頁面。
4.2 系統的安全性設置
在本系統中,WEB服務器可安裝session ID cookie配置帶有用戶特定會話信息的ASP應用程序,ASP通過session ID cookie實現對應用程序會話與訪問過程中的WEB瀏覽器信息的跟蹤,用戶漫游整個應用程序的過程都可以通過session ID實現跟蹤,我們可以將其理解為同一WEB瀏覽器中會不定時的出現cookie請求。從系統訪問的安全性角度出發,為能夠保障用戶的訪問安全,防止計算機黑客猜中session ID cookie并獲得合法用戶的訪問權限,WEB服務器為每個session ID都隨機生成一個號碼,在用戶WEB瀏覽器返回session ID cookie時,session ID和之前生成的號碼將會被 WEB 服務器取出,并對其與服務器上生成的號碼的一致性進行比對,如果兩個號碼是一樣的,則不會禁止用戶訪問會話變量,反之,則會禁止。這樣保障了計算機黑客幾乎猜不到session ID 并獲得用戶會話變量。
綜上所述,在當今的計算機技術迅速發展的時代,對于分布式數據庫系統的開發與研究還有待進一步的提升,其目前的優勢主要表現在更適合分布式的管理與控制,具備靈活的體系結構,可以實現數據共享,系統經濟、可靠性高,可用性與可擴充性好。
[1] 龐惠;翟正利.論分布式數據庫[J].電腦知識與技術.2011-01
張敏,女,1980-,內蒙古赤峰市,講師,主研方向:數據庫與知識庫、信息處理
王艷麗,女,1980-,山西省,講師,主研方向:操作系統
王振輝,男,1974-,北京,高級工程師,主研方向:軟件工程
Design and research of computer of distributed database system
Zhang Min,Wang Yanli,Wang Zhenhui
(Xi'an FanYi University,Xi'an,710105)
This article mainly analyzes the characteristics and technology,distributed database design method,theory and technical summary of top-down and bottom-up distribution design methods,mainly discusses the DATAID-D top-down design method,and analyzes the function realization of distributed database system of computer.
distributed;database system;technical method