陳倬
摘 要:隨著信息化領域的不斷深入及發展,電力企業已經積累了大量的異構數據源處理,而Web技術的成熟在一定程度上推動了異構數據整合可能性。因此,該文在對數據庫系統開發技術進行分析的基礎上,提出數據資源整合方法,從而有效地解決了資源整合問題。
關鍵詞:異構數據 資源整合 系統 方法
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2017)04(c)-0142-02
異構系統數據的整合也就是說利用現有的網絡以及計算機技術,對多個業務系統進行優化及調整,從而使業務與業務之間存在關聯,最終便能夠在無人干預的條件下,實時共享及自動同步不同業務系統之間的數據資源。而隨著我國信息化的進一步推進,相關單位及部門均要求將異構數據作為撰寫報告以及分析數據的基礎。但由于遠程沒有相同的數據庫系統及大量錯誤的存儲方式,并且還沒有統一的數據描述標準,從而導致對數字化進程以及主題信息化造成了一定阻礙。目前所采用的數據整合方式主要是基于C/S結構,在實際應用的過程中用戶需要在機器上安裝客戶端,因而對用戶機器具有較高的要求。加上在維護客戶端軟件的過程中具有較大的難度,沒有相關的工作流程作為支持,從而便導致數據使用以及整合在不同的系統中,在一定程度上阻礙了資料的檢索及共享。
1 系統架構
在整個電力系統中,系統框架作為其最為核心的部分,在系統架構層中主要的工作內容是負責與數據庫之間的交互,同時還需要對多個運行協調以及指揮處理平臺業務支撐層進行處理。在實際應用的過程中,為了能夠對電力企業現有網絡硬件環境進行充分地利用,就需要采用基于B/S模式以及J2EE標準規范。網絡數據庫管理系統是整個數據庫的核心,且客戶端之間的溝通交流平臺主要為IE瀏覽器與微軟平臺。根據此可以建立一個基于異構數據的整合技術,從而便能夠實現綜合系統,其中包括對異構資源的統一管理,結構化與非結構化數據的統一搜索等工作內容。
2 異構數據源整合
2.1 異構數據源
數據源異構主要指的是數據源具有多種不同的類型,并且在存儲方式上數據源包括不同模式及數據語義差異。在不同的存儲模式中,使用對象模式以及關系模式均具備較好的兼容性,但并不適用于每個系統。在某些特殊的系統中,盡管采用同一種類型的存儲模式,差異性的模式結構也會在一定程度上導致系統資源的異構性。而語義差異則主要指的是具有相同結構的數據形式,不同形式數據所具有的表示方式為解釋不同語義或同一語義。
異構數據根據數據的不同來源進行區分可以分為互聯網數據、自產及外購資源。獲得異構數據的途徑是各種數據源,而數據源能夠為數據的加工及處理提供相關的源數據,同時也能夠為電力系統中的跨庫檢索及異構數據之間的整合提供一定基礎。而電力企業自產資源的內容主要包括企業內部的各類簡報、報告、簡訊、文檔、交換資源以及視頻文件數據等。外購資源獲得數據資源的方式主要為從各個不同的資源商通過有償的方式購置的數據資源,購置的數據資源類型主要為專利庫、圖書、機構庫、標準庫、外文及中文論文庫等多種數據。異構數據中的互聯網數據資源則主要是從互聯網上通過網絡爬蟲對信息資源進行定點采集。
根據源數據不同的存儲方式可以包括數據庫數據存儲以及原文文件存儲。一般來說,數據庫的數據存儲獲得源數據的途徑很多,但最終都是通過排重及分類等多種形式對所收集到的數據進行加工處理,然后再將加工處理后的數據存儲到Web數據庫中。文件存儲的主要方式是通過一定分類規則,將系統中所獲得的所有資源文件統一地存放于Web數據庫中,并將數據進行存儲。
2.2 整合方法
對于異構數據資源的整合方式主要是通過數據倉庫、多個數據庫以及數據集構成,以此來實現不同數據庫與不同系統之間的透明訪問以及資源的共享。而對于異構數據庫中組合的不同數據庫及不同的數據集來說,因其在異構整合前均擁有各自的DSMS,所以在整合成異構數據庫后兩者在一定程度上均具有其自治性與應用特性。
2.3 數據庫整合方案
為了能夠實現數據庫全文檢索的功能,在異構數據整合的過程中應該將重點放在不同數據庫之間的整合中。自定義全文檢索數據庫作為資源數據的統一存儲數據庫,使用全文檢索能夠實現多種關系型數據庫的數據到全文檢索數據庫的轉換以及數據的同步共享。
3 異構數據源整合系統實現
在對電力企業異構數據資源共享以及透明訪問設計的過程中,所堅持的總體思路便是基于在服務器層的改進設計。換句話說,就是在各個不同數據源工作的區域設計一個服務器層,利用服務層來屏蔽數據庫底層的各不同資源的異構性。并且服務器層在對不同資源異構性進行屏蔽的同時還能為高層的訪問提供一個標準的接口,從而便于數據資源的統一查詢,在設計數據層接口的過程中可以將其封裝為標準的Web服務。當用戶在訪問數據庫的過程中,可以調用Web服務,Web服務能夠為用戶提供一個方便查詢的界面,而查詢界面能夠滿足用戶的各種需求。基于該思路設計的資源透明訪問機制所具有的優勢包括以下幾點:(1)該系統在實際應用的過程中并不需建立一個龐大的數據庫,并且還具有較高的界面集成度;(2)此種訪問機制的設計能夠便于日后對相關的數據進行維護及索引;(3)檢索方式及過程能夠符合用戶要求,使用過程及方法簡單快速,且較為精確。
4 結語
綜上所述,通過整合異構數據源的方式能夠屏蔽各種數據結構的異構性,并且在此過程中還能夠為訪問異構數據源提供相關的服務。但卻并不需要改變底層數據存儲與數據的管理方式,也就是說異構數據的整合能夠實現分布異構數據的互相操作,從而便能夠有效地解決資源整合問題。
參考文獻
[1] 孫偉.基于ETL的考試信息資源整合系統的設計與研究[J].中國輕工教育,2015(1):70-73.
[2] 何玉梅,肖嵐.基于元數據的區域數字圖書館數據資源整合[J].軍民兩用技術與產品,2014(11):25,32.
[3] 周文瓊.大數據環境下的電力客戶服務數據分析系統[J].計算機系統應用,2015(4):51-57.
[4] 羅艷,覃琳.基于異構數據源的云數據庫系統研究[J].企業科技與發展,2015(8):16-17.
[5] 李燕,范紅艷,許志輝,等.黃河信息資源共享服務系統設計與實現[J].人民黃河,2012,34(8):64-66.
[6] 祁峰.異構數據系統之間數據交換中間件的研究與實現[D].鄭州大學,2015.
[7] 袁爍峰,林小露.基于共性元數據規范的科技計劃項目數據資源整合[J].科技成果管理與研究,2012(4):19-21.