朱昱萌
摘 要:從數據庫體系構建角度分析,面向數據整合和共享功能實現,使用java語言和相關技術,構建數據庫架構,保障數據庫的性能實現。現基于提高數據庫利用率的目的,針對計算機軟件數據整合虛擬數據庫體系構建,做簡單論述,提出體系構建的策略,共享給相關人員參考。
關鍵詞:計算機軟件 數據整合 虛擬數據庫
中圖分類號:TP311.13文獻標識碼:A文章編號:1003-9082(2020)08-000-01
近年來,大數據概念和相關技術快速發展,人們對數據利用更加重視,尤其是交通領域和電力領域等,成為數據利用的先鋒板塊。采用數據挖掘和分析技術等,面向數據使用需求,根據數據信息進行預測分析,為決策和控制等提供高質量的數據,發揮著積極的作用。
一、數據庫的概述
構建的數據庫系統,通過在計算機內構建數據庫后形成的系統,主要功能模塊如下:1.數據庫;2.數據庫管理系統;3.應用系統;4.數據庫管理員;5.使用者。將海量化數據信息,整理到數據庫內,利用算法和檢索技術等,進行數據屬性的劃分和計算,實現對數據信息的利用,能夠為使用者提供所需的數據。
二、計算機軟件數據整合虛擬數據庫體系的設計分析
1.系統特點分析
數據數據庫運行時,將分散的數據源進行收集,實現集成處理,使得異質數據被轉化,全部成為同質數據,同時按照設計需求,為應用程序設計,提供關系數據庫接口。基于虛擬數據庫,實現應用系統的快速發展。搭建的數據庫系統,有著海量不同數據源。各類數據源之間,有著相互獨立的特點,且構成復雜,包括結構化數據與非結構化數據。數據整合則具有以下特征:第一,數據源很多,并且不斷更新。第二,不同數據源之間具有相互獨立的特點,來源于各類數據擁有著。第三,數據源的元數據構成,具有復雜性特點。第四,搭建的系統,實現數據邏輯共享以及物理分治。經典的虛擬數據庫,基于大量Web站點而構成,包括數據集成部分和數據發布部分。整個數據集成系統,開發的功能模塊,主要為包裹器、映射器與提取器,實際應用中能夠為系統上層提供關系數據庫接口。
2.系統設計思路
搭建數據整合體系,利用關系數據庫數據集,作為數據源;利用數據服務數據集,當作拓展數據源;依據虛擬數據庫工作機理開展設計。文中所述的系統,利用XML Schema技術,搭建主體知識全局模型以及數據集全局模型,形成異構數據源局部模式;利用XML文檔,實際應用中用于存儲異構數據源的元數據,也可以看為數據庫系統的數據字典。搭建時通過元數據定義,實現模式映射,消除數據異構性,根據數據源的特性,實現數據源參數化,使其不僅具備“即插即用”特點,還具有可拓展性。
3.系統的主要功能描述
構建的計算機軟件數據整合虛擬數據庫體系,主要功能模塊如下:第一,查詢解析功能模塊。使用者提出查詢申請后,根據系統的查詢模式文件構造查詢程序,請求XML文檔。利用此功能模塊,依據模式文件開展驗證,分析文檔的合法性,能夠得知查詢的數據以及數據源具體信息,例如是否已經注冊等,獲得的解析結果將會反饋給系統查詢分解模塊。第二,查詢分解模塊。此功能模塊依據自身的“權限”,構造針對各個數據源的子查詢請求,每個請求都含有針對此數據源使用者完整的請求信息。第三,調度功能模塊。系統運行中,調度模塊起到協調的作用,助力各個數據源工作。搭建的整合系統,其數據源屬于分布式數據源,依據數據源實際情況來調度整個查詢過程,進而提供快速準確的服務。第四,元數據管理模塊。操作時此功能模塊支持注冊和管理以及組織數據源相關數據,發揮重要的作用。基于知識主題,利用XML Schema工具,進行信息的元數據定義,形成全局模式。利用全局模式的元數據,按照映射機制,構建各個數據源的局部模型,最終發揮原數據信息的作用,解決數據源存在的結構沖突。第五,數據庫訪問模塊。開發的此功能模塊,依據數據源局部模式,利用統一接口,能夠為上層提供相應的數據訪問服務。實際應用中利用原數據信息,解決異構數據存在的異構性,比如本地SQL語言等。第六,異構數據處理模塊。利用此功能模塊處理數據訪問層所傳遞的異質數據,依據全局模式,進行XML格式同質數據的構造,滿足實際需求。
三、計算機軟件數據整合虛擬數據庫體系構建的關鍵技術
1.數據集元數據全局模式
從系統構建的角度分析,元數據全局模式的應用,主要是存儲各類數據集自身的基本屬性信息,包括數據集名稱和主題以及創建者等。搭建的計算機軟件數據整合虛擬數據庫體系,按照數據庫核心元數據標準V2.0,基于數據集元數據描述,做了相應的擴展。通過模式驗證的XML文檔,其根元素DBSet可以擁有很多DBSource子節點,同時文檔包括數據庫系統各類數據級元數據信息。利用數據集元數據全局模式,進行各數據集的局部模式構造以及驗證。DBSource字節點的數據,是數據庫系統統一的數據集連接接口存儲參數,同時也是實現數據集連接“即插即用”的重要支持信息。
2.局部模式中元數據的獲取
從構建的計算機軟件數據整合虛擬數據庫體系分析,各數據集的局部元數據,主要劃分為數據集類與主題知識類。其中,數據集元數據為數據集的連接信息;主題知識為結構信息。對于構建的關系數據庫,使用者注冊相關信息后,比如數據庫類型和位置等,剩余信息均可以從構建的數據庫內提取。基于數據共享的需求和要求,保障數據提供的便利性以及數據共享的正確性,系統能夠利用提取的元數據,為注冊用戶提供計算機軟件數據整合虛擬數據庫內的對應信息。實際運行中,采用Wrapper不同于傳統數據源包裝器,為向下的單向處理過程,利用參數形式向上層提供屏蔽異構性服務,同時將獲得的結果,遞交給異構數據處理模塊。
結語
綜上所述,計算機軟件數據整合虛擬數據庫體系,要面向數據庫的使用需求和功能要求,做好功能模塊的開發。合理運用數據庫構建工具和技術,把握系統的功能實現,為使用者提供所需的服務和數據支持,實現數據庫的價值與作用。
參考文獻
[1]朱建峰.數據庫基于計算機軟件工程的編程技術策略淺析[J].計算機產品與流通,2020(04):21+34.
[2]孫曉麗.基于計算機軟件工程的數據庫編程技術研究[J].信息與電腦(理論版),2020,32(07):101-103.
[3]程燦.計算機軟件工程的數據庫編程技術分析[J].數字通信世界,2020(04):119.
[4]賈斌,代云皓.試論在計算機軟件開發中數據庫安全設計的應用實踐[J].電腦知識與技術,2020,16(09):1-2.