王儒升
摘要:分布式數據庫是數據庫技術和網絡技術的結合產物,將其應用于信息化管理系統中,具有共享性和自治性雙重價值:前者降低了信息化管理系統的數據成本,提高了用戶的數據應用效率;后者在前者基礎上為信息化管理系統提供了選擇的機會,提升了分布式數據庫中的數據信息安全。文章通過分布式數據庫管理系統的搭建,開展管理系統相關路徑選取,實現信息化管理系統中分布式數據高效應用。該文對此進行了詳細論述,旨在為從業人員提升分布式數據庫應用能力提供借鑒。
關鍵詞:信息化管理系統;分布式數據庫;內涵;應用方向;應用策略
中圖分類號:TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2023)35-0083-03
開放科學(資源服務)標識碼(OSID)
0 引言
時至今日,信息技術應用領域日益增多,促進了新的信息化管理模式的發展,豐富了組織管理的可能性。在信息化管理系統的支持下,不僅在組織內以有效和實用的方式傳播信息,而且還為管理層提供了個人和團體溝通的工具,加強了組織內的管理行動和管理過程。由于信息化管理系統對數據量、種類和速度的需求不斷增加,傳統的關系數據庫不再適用,而分布式數據庫似乎是一個可行的解決方案。目前,大量的分布式數據庫廣泛應用于大型企業。而這些企業的分布式數據庫又為中小型企業經營數據庫提供了基礎設施。由于分布式數據庫越來越多地部署在不同的行業領域,如電子商務、生物技術、連鎖、社交網絡等,分布式數據庫層面的云爆炸不僅引起了研究的關注,而且從行業角度來看,論證分布式數據庫的應用也很重要[1]。在此背景下,本文通過對分布式數據庫的信息化管理應用價值、應用方向進行研究,希望為行業人員提供參考。
1 分布式數據庫的內涵
分布式數據庫被定義為多個數據庫的集合,以邏輯方式連接,物理分布在網絡中,并連接它們的不同節點。其中,每個節點都具有自主處理的能力。但是,需要每個節點也參與到某個全局應用程序中,也就是說,它需要訪問存儲在其他位置的數據。因此,在分布式數據庫中,每一個邏輯都依托小型計算機和互聯網,將數據存儲在不同的位置,通過網絡相互連接。在這樣的環境中,分布式數據庫安排了一組計算機,這些計算機能夠彼此相互操作,但也能夠自主開展工作。從另一個角度理解,分布式數據庫則為分布式系統中多個位置的數據組。由于分布式環境的興起,這種數據庫的采用日益增長。正因為如此,分布式數據庫能夠更好地適應分散式結構。事實上,大多數企業或者已經整合或者正在開始這樣做,分散數據庫的使用,以便在這個適應過程中實現簡單和經濟的數據庫改進。
通常,為了保證良好的性能,分布式數據庫必須易于擴展。具體來講分布式數據庫應有4個優勢:數據分片及復制管理、具有事務的可靠性存取、良好的性能、易于擴展[2],因此,在設計上,分布式數據需要體現出其數據分析片、分布式并發控制、目錄管理、分布式儲存等功能。關于分布式數據庫設計的流程可分為以下幾個步驟:概念模式設計;全局邏輯模式設計;本地物理模式設計;碎片化設計,也就是建立驅動碎片化的邏輯標準;片段分配設計,即決定數據的物理位置和可能的副本。所有這些細節都存儲在一個全局數據庫中,其中包括控制數據庫和提供數據庫自身的全局視圖所需的工具。為了實現數據的快速訪問,每個分布式數據庫受到其對應的分布式數據管理系統所管理,管理系統具有向用戶提供復制、碎片化與分發的透明度作用[3],其主要任務之一是將這些查詢轉換為僅匹配所涉及的片段的其他查詢。
2 分布式數據庫在信息化管理系統中的應用價值
當下的信息化管理系統受益于混合云的影響,除了系統性能的提升,同時還實現了系統管理業務速度的提升,避免系統數據鎖定,并能夠在公共云中保留數據。管理系統功能作用由數據庫類型所決定,各類型的數據庫在數據復制、讀寫操作、數據分叉和數據一致性方面存在一定差異。例如,關系數據庫具有預先定義的模式,并擁有一個成熟的市場,但是,查詢性能不如非關系數據庫。相比之下,NoSQL數據庫有一個無架構的數據模型,但為了獲取更好的性能而破壞了數據庫的強一致性。在這方面,信息化管理系統中應用分布式數據庫的價值更多地體現在其共享性與自治性之中。
一方面,在對分布式數據庫模塊進行設計的過程中,這種體系結構在新客戶端和附加服務器上都很容易擴展。分布式數據庫選擇了客戶機/服務器架構,并為用戶提供了 Web 界面。在分布式數據庫中的程序托管服務中,能夠保證用戶使用數據庫與集中式數據庫相同,用戶可在權限允許的情況下對各位置的數據進行查詢或修改。有站點上的數據都是共享的,這樣,就得到了一個開放的數據庫設計,只需要插入相應的信息就可以在任何管理系統中使用數據,這就是分布式數據庫的共享性。這種共享性能夠有效降低網絡通信的使用成本,提升用戶的數據操作效率,能夠實現分布式數據的多客戶端訪問,而不需要用戶在本地安裝任何額外的軟件。另一方面,用于實現分布式數據庫的軟件元素如下:Web瀏覽器,它是用于與系統交互的可視化界面,它可以用于任何能夠執行Java代碼的Web瀏覽器;Web服務器。通常信息化管理系統選擇ApacheTomcat服務器;數據庫管理系統。通常信息化管理系統使用Oracle 11g,而Java和Oracle之間的連接是通過JDBC控制器實現的[4]。這種軟件元素的組合由于其固有的可靠性和自主性,可以有效地用于具有節點連續連接和離開的動態對等網絡,以及由大量節點永久連接到廣域網的靜態分散系統。在這兩種情況下,一個重要的系統目標是限制分布式查詢處理生成的網絡流量。實現這一目標的關鍵是有效地定位相關數據源,以便只向存儲這些數據源的節點提交查詢。換句話說,各節點的數據庫系統管理工作人員能夠根據現實情況,決定數據是否進行全局共享。對于不可共享的數據,則將其保留于原節點數據庫,充分地體現出分布式數據庫的自治屬性。
3 分布式數據庫在信息化管理系統中的應用策略方法
3.1 分布式數據庫管理系統模塊構建
新時期下,科學信息技術快速發展,對于分布式數據庫與其信息化管理系統有著更高的要求。一方面,高質量的分布式數據庫能夠為信息化管理系統的設計構建提供有效保障,使其設計過程更加合理。在應用中,分布式數據庫在數據儲存與分發、相關管理系統控制中起到良好的作用;另一方面,高質量的分布式數據庫能夠對信息管理系統進行精簡。通過分布式數據庫的應用,信息化管理系統的每個級別都以緊湊的方式進行描述。這種情況下,所考慮的信息化管理系統包括三個級別。其中,第一級別的應用程序是該系統的最高級別,旨在修改分布數據庫中的數據;第二級別的主數據庫與本地數據庫通信,在具有后備通信通道的廣域網中,對監督級別的訪問起作用;第三級別的本地數據庫和控制器之間的通信是基于數據庫管理系統重構信息化管理系統邏輯控制器(RLC)的關鍵。
由此可見,作為信息化管理系統應用數據的核心,分布式數據庫管理系統不僅能夠實現分布式數據庫的構建、查詢與維護等功能,還可進行分布式的查詢優化、全區域事務執行,為數據庫的一致性與同步更新提供堅實保障。分布式數據庫管理系統如圖1所示。
如圖1所示,雖然分布式數據庫管理系統的組成較為復雜,但是總體功能模塊可分為以下幾塊:
1) 查詢處理模塊。此模塊包含查詢分析與優化處理兩項功能,前者針對系統使用者,后者針對系統管理者。該模塊的目標在于減少分布式數據庫中,查詢處理數據的代價。
2) 完整性處理模塊。此模塊由維護完整性與維護一致性兩類功能組成,能夠更好地實現多分布式數據庫的同步更新。
3) 調度處理模塊。此模塊由兩部分組成,一是發布命令,二是數據傳輸。其主要目的是通過對站點進行命令發布,采用相應的DBMS對局部開展處理,從而實現站點之間必要的數據傳輸。
4) 可靠性處理模塊。該模塊包括兩個功能,一是故障預警,二是故障修復。可靠性處理模塊能夠對系統內的各部分進行監測,及時發現故障,將故障維修后的部分重新接入系統中,從而實現數據庫的一致性。
3.2 分布式數據庫管理系統路徑選型
在信息化管理系統應用分布式數據庫的過程中,需要數據庫內的各節點明確全局數據查詢途徑的選擇性。如果事先不知道路徑選擇性值,可以使用估計路徑選擇性值的技術。為此,本文提出了一個緊湊的數據結構路徑選型路徑。數據查詢可在分布式數據庫信息化管理系統中分為兩個階段進行處理:第一階段,查詢DHP(Diffie Hellman Protocol,密鑰協商協議)以確定存儲數據匹配的所有節點;提交給上一階段所識別的每個節點,以獲取所有數據匹配[5]。在此工作中,查詢處理的第一階段目標是最小化生成的流量,以確定第二階段將要查詢的節點。為此,需要通過將一個鍵與數據庫路徑聯系起來,然后,負責與之關聯的鍵的節點保存一個指向存儲包含所有文檔的節點。例如,作為XPATE或XQQERY表達式,基本的選型策略包括將查詢分成若干子查詢,查詢中每個路徑一個子查詢[6]。由于每個子查詢被獨立解析,以找到存儲與相應路徑匹配的文檔的節點集。因此,來自不同子查詢的結果集在查詢節點交叉,然后使用原始查詢交集中的所有節點,以獲得與該查詢匹配的所有數據[7]。
在實際中,上述選型策略可能導致在由幾個子查詢組成的復雜查詢中系統效率低下,特別是在分布式數據庫存在許多并發請求的情況下。為了克服這一缺點,另一種選型策略是只解決與選擇性最強的路徑有關的子問題,即:匹配最低節點數的路徑,然后可以用原始查詢結果集中的所有節點,以獲取滿足所有查詢約束的文檔(包括與其他路徑關聯的文檔)。其中,路徑p的選擇性sp由下式表示:
[sp=np/n]? ? (1)
其中,np為存儲至少一個路徑p實例的節點數,n為DHT中的節點總數,0≤sp≤1。這表示選擇性sp值越低,則路徑p選擇性越強。換言之,最低選擇性值對應于選擇性最強的路徑。例如,在一個有10 000個節點的分布式數據庫中,存儲在50個節點中的路徑的選擇性為50/10 000=0.005;而存儲在5 000個節點中的路徑的選擇性為5 000/10 000=0.5。前者是高選擇性路徑(低選擇性值);后者是低選擇性路徑(高選擇性值)。
4 結束語
綜上所述,應用于信息化管理系統中的分布式數據庫可實現信息數據的冗余控制,例如需求、功能、行為和結構等。它是面向對象的、標準化的和廣泛適用的,并且能夠更有效地降低信息化管理系統的數據成本,提高了信息化管理系統用戶的數據應用效率,提升了信息化管理系統數據信息安全水平。在具體應用中,本文通過對系統與構建分析,對管理系統模塊搭建與數據庫管理系統路徑選型進行明確。研究顯示,信息化管理系統對分布式數據庫的應用是基于系統可用性和自主性需求,挑戰是如何在維護安全性和可用性的同時,發布數據和程序以獲得預期的性能。為此,研究建議以分布式數據庫管理系統實現分布式數據庫和信息化管理系統的對接。在許多并發請求的情況下,匹配最低節點數的路徑,然后可以用原始查詢結果集中的所有節點,以獲取滿足所有查詢約束的文檔(包括與其他路徑關聯的文檔)。
參考文獻:
[1] 水治禹,盧衛,趙展浩,等.分布式數據庫多級一致性統一建模理論研究[J].軟件學報,2023,34(5):2392-2412.
[2] 李峻屹.基于熱點訪問的分布式數據庫HBase負載均衡算法研究[J].微型電腦應用,2022,38(5):138-141.
[3] 包全磊.分布式數據庫系統的數據分布策略研究[J].信息與電腦(理論版),2022,34(24):196-198.
[4] 王華,王玲維,黃漢云.分布式數據庫隱私信息增量式更新方法仿真[J].計算機仿真,2022,39(4):268-272.
[5] 彭成輝.基于HBase分布式數據庫集群系統構建方法[J].信息技術與信息化,2022(7):95-98.
[6] 田銳,喻婧.分布式數據庫技術及應用分析[J].長江信息通信,2023,36(5):165-167.
[7] 段芳婷.基于分布式SOA架構的高性能MIS框架設計與應用[D].南昌:南昌大學,2021.
【通聯編輯:代影】