來 羽
(鄭州廣播電視大學,鄭州 450007)
數據復制是指將數據庫中的數據拷貝到另外一個或多個不同的物理站點上,從而保持源數據庫與目標數據庫中指定數據的一致性。
按照數據復制的實時性,數據復制可分為同步數據復制和異步數據復制。同步數據復制是指將本地生產數據以完全同步的方式復制到異地,每一本地 IO交易均需等待遠程復制的完成方予以釋放。異步數據復制則是指將本地生產數據以后臺同步的方式復制到異地,每一本地 IO交易均正常釋放,無需等待遠程復制的完成。
數據復制通過在多個站點上建立備份,能夠提高數據的安全性,同時也提高了數據的可用性,這是因為如果一個站點出現了問題,用戶可以選擇其他站點繼續進行操作,應用系統還可繼續運行,從而數據復制提供了容錯保護機制。
然而數據復制最基本的功能是提高數據庫的性能。它通過將遠程數據庫中的數據復制到本地,使得應用能夠就近訪問數據,從而降低網絡傳輸負載,提高效率。而且在數據復制系統中,可以提供多個站點之間的負載平衡,讓這幾個用戶使用這個服務器,另外幾個用戶可以使用其他的服務器,以避免某些站點負載過重。
物化視圖還提供了按子集進行復制,這樣各站點就可只復制自己需要的數據,也能減輕網絡的傳輸量。
在具體的實現之前,需要做好設計與規劃。這就需要細致分析具體的業務情況,設計出一套能夠滿足業務需要的方案。通常在設計過程中,需要確定出要建立的數據庫站點,各站點的類型,需要復制的數據對象,以及同步方式、沖突解決方案等內容。
在設計完成之后,就可具體來實現數據復制,數據復制的實現主要包括以下幾步:
1.創建復制站點;
2.創建組對象;
3.配置沖突解決方案。
下面我們舉一個例子來說明各步具體需要完成的工作。在這個例子中我們采用多主控站點復制方式,設有兩個主控站點和兩個共享數據表。兩個主控站點分別為:處理站點(cl.world)和解釋站點 (js.wo rld);兩個數據表為測區 (survey)和測線 (line)。
STEP1創建復制站點
(1)首先以 SYSTEM身份登陸主站點數據庫 cl.world CONNECT system/manager@cl.world。
(2)創建用戶 -復制管理員,并為該用戶授權復制管理員負責復制站點的創建和管理,每個復制站點都必須創建復制管理員。
(3)為本站點指定傳播者
傳播者負責將本地最新更新的數據傳播到其他站點上:
BEG IN
DBMS_DEFER_SYS.REGISTER_PROPAGATOR(username= >‘repadmin’);
END。
(4)為本站點指定接收者
接收者負責接收其他站點上的傳播者傳送過來的數據:
BEG IN
username= >‘repadmin’,
privilege_type= >‘receiver’,
list_of_gnames=>NULL;
END。
(5)確定清除時間
為了使傳送過來事務隊列不致過大,需要將成功加載的事務從事物隊列里清除掉,這里設定每小時清除一次。
CONNECT repadmin/repadmin@cl.world
BEG IN
DBMS_DEFER_SYS.SCHEDULE_PURGE(
next_date=>SYSDATE,
interval= >‘SYSDATE+1/24’,
delay_seconds=>0);
END。
(6)創建各主控站點之間的調度鏈接
創建各主控站點之間的調度鏈接需要先在各主控站點間建立數據庫鏈接,之后為每個數據庫鏈接定義調度時間。
首先,在處理站點上建立與解釋站點的數據庫鏈接,這里需要先建立一個公用數據庫鏈接,供其他私有數據庫鏈接來使用。
同樣,在解釋站點上建立與處理站點的數據庫鏈接
以下為引用的內容:
CONNECT SYSTEM/MANAGER@js.world
CREATE PUBL IC DATABASEL INK cl.world US ING‘cl.world’;
CONNECT repadmin/repadmin@js.world
CREATE DATABASE L INK cl.world CONNECT TO repadmin
DENTIFIED BY repadmin。
在解釋站點上做相同的工作 STEP2創建主控組在復制環境中,Oracle用組來管理復制對象。通過將相關的復制對象放在一個組里,從而方便對大量數據對象的管理。
這里我們假設用戶模式 integr ation在處理站點和解釋站點都已存在,而且表測區 (survey)和測線 (line)也已經創建。
(1)創建主控組對象
CONNECT repadmin/repadmin@cl.world
BEG IN
DBMS_REPCAT.CREATE_MASTER_REPGROUP(
gname= >‘inte_repg’);
END。
(2)向主控組中添加數據對象,將測區表 survey加入到組inte_repg中
BEG IN
DBMS_REPCAT.CREATE_MASTER_REPOBJECT(
gname= >‘inte_repg’,
type= >‘TABLE’,
oname= >‘survey’,
sname= >‘integration’,
use_existing_object=>TRUE,
copy_rows=>FALSE);
END。
以同樣的方法將測線表 line加入到組 inte_repg中。
(3)在主控組中添加其他參與復制的站點,數據庫之間的同步方式在此指定
BEG IN
DBMS_REPCAT.ADD_MASTER_DATABASE(
gname= >‘inte_repg’,
master= >‘js.world’,
use_existing_objects=>TRUE,
copy_rows=>FALSE,
propagation_mode= >‘ASYNCHRONOUS’);
END。
(4)如果可能出現沖突,則需要配置沖突解決方案。沖突解決方案將在后面介紹。
(5)為每個對象生成復制支持
設置成功后,數據復制過程就宣告完畢,庫中的數據就可進行復制。
在復制環境中,盡管在數據庫和應用程序設計過程中,會盡量避免各站點間沖突的發生,但完全避免沖突的可能性還是比較小的,那么一旦沖突發生,就需要一個按照具體業務規則的沖突解決機制,來使得各站點的數據保持一致。首先需要分析哪些對象容易出現沖突。通常來說,靜態的數據變化少,沖突出現的可能性也小;而有些數據變化非常大,沖突出現的可能性也大。確定了沖突易發的對象后,需要確定怎樣解決沖突,比如在各站點之間建立優先次序,在數據不一致時,以某個站點上的為準;或以某個站點上最新的修改為準。Oracle提供了多種沖突解決方案,具體包括:針對更新沖突的方案、針對唯一性沖突的方案、針對刪除沖突的方案。除了這些方案以外,用戶還可以自定義沖突解決方法。每種方案都有自己的適用情況,那么我們需要根據具體的業務來選擇合適的沖突解決方案。
[1]王瑛.Oracle數據庫基礎教程 [M].北京:人民郵電出版社,2008.
[2]劉甫迎,王道學,黨晉蓉.數據庫原理及應用 [M].北京:清華大學出版社,2004.
[3]格里沃爾德.Oracle高級編程 [M].北京:清華大學出版社,2007.
[4]劉國.數據庫技術基礎及應用[M].2版.北京:電子工業出版社,2008.