摘要:隨著社會信息自動化的發展,發展實施電子政務是一種必然趨勢。發展實施電子政務可以重組政府組織結構,并優化政府的工作流程,從而為建立一個高效、廉潔、公平、精簡的虛擬政府提供幫助。數據集成共享問題是政府各部門不同的業務處理系統和辦公系統之間急需解決的問題,同樣,這也是實現虛擬政府的重中之重。數據集成的地位在電子政務系統集成中的地位是相當關鍵的,它是電子政務系統集成的基礎。它有利于推動電子政務系統的標準化建設,同時對實現應用系統之間的協同工作有著重要的意義。本文對電子政務數據集成平臺中可能采用到的XML技術進行了探討。
關鍵詞:電子政務 數據集成 XML
1 什么是電子政務
電子政務,英文為E-Government。它是一種通過網絡技術和計算機這個平臺,將政府日常的工作網絡化、信息化并能標準化和服務化、公開化的,且能為社會公眾及自身提供一體化的優質、高效、廉潔的管理和服務的系統工程;它可以為政府日常辦公的管理和維持提供便利,并且不受時間、空間和部門的分制約。
2 數據集成在電子政務中的作用
數據集成是指通過一定的手段,將分散在各處的數據源加以整合,使其成為一個整體,給最終用戶提供一個統一視圖的過程。在我國,信息化系統建設在政府部門的表現通常有以下兩個方面的特點。
①階段性。它在技術上并不能一步到位。②分布性。因為受到其它經濟和人為因素的影響,政府部門構建的信息系統各自有著不同的處理對象,并且操作方法和專用客戶端也都不一樣,分散性很強。
硬件上面,它們采用的平臺往往都不是一樣的。操作系統和數據庫也都不盡相同。站在應用角度上,看它們就是一個互不聯系沒有任何牽連的異構數據源,這種狀況下,就構成了一個巨大的異構數據環境,而且這種環境相當復雜。
在異構數據環境下,存在著這么一種現象。有很多應用需求根本不需要自己去進行數據的轉換、結果匯總;這些需求也不必知道各數據源的分布,對數據源的結構組成也無需進行了解,但他們卻可以同時訪問和處理多個不同數據源中的數據。他們是怎樣屏蔽掉各個層次的異構特性呢?其實很簡單。他們只需要通過簡便的全局查詢,輕輕一按鼠標便可以得到一個令他們滿意的綜合結果。
這種方式,傳統的數據庫集成方法根本就無法做到,所以研制一種全新的數據集成系統是當下之急。這種集成方式在電子政務軟件系統中的作用是顯而易見的,如果上級政府需要下級政府或部門上報數據,運用這種集成方式是相當便利的,反之亦然;這種系統同時也為國家級分布式數據庫系統的使用、管理和維護提供了眾多便利;當然在地方在各級政府中,基層政府部門間如果需要協同辦公,使用到另一個或幾個部門的數據時,運用這種系統模式,可大大提高辦事效率;這種電子政務軟件平臺能有效支持數據集成,它的方便在于可以將不同部門的電子政務應用系統及數據庫有機的集成為一個整體。
3電子政務數據集成涉及到的問題
電子政務數據集成平臺需要解決的問題有很多,比如異構性,自治性、共享性、透明性、分布性等等。
異構性包括系統異構和數據異構。前者主要是計算機體系結構不同,操作系統會隨著計算機的不同而產生差異;后者的存儲模式有多個,對象模式、關系模式、XML文檔樹型模式等都包括在內。這種異構主要以模式間的異構為主,數據在主流的關系模式中也是有區別的。異構性是電子政務數據集成平臺面臨的最主要的問題也是電子政務數據集成平臺實現中的主要難點。
由于這種特性,再加上數據模型的差異,使得某個節點需要訪問其它節點的數據時,很難理解其它節點的共享數據,更別說處理了。
第二需要解決的問題是自治性。各節點雖然控制著本地的數據,看似無拘無束。但它也不是絕對自由的。要想使得集成系統與節點能正常的交互,節點要保證與集成系統間的協議正常。
第三需要解決的問題就是共享性。通過共享,供集成系統或其它節點來訪問時,只需提供共享數據的訪問接口就行。數據集成的根基就是共享。
第四就是透明性。全局數據模型的基礎上,集成平臺會對節點的位置,和節點數據的用戶以及訪問方法等細節進行自動解析,是十分透明的。
第五需要解決的問題是解決數據源的分布性。因為依賴網絡傳輸數據,并且異地分布,這就造成的性能和安全性問題上不能保證。
最后,數據集成平臺需要解決的問題就是節點間的分布性和自治性。
集成平臺現實應用中面臨很多挑戰,如為網絡傳輸帶來的性能和安全性問題找到保障方法;還有節點的擴展伸縮性,該采用什么方式去限制和適應。
4 異構數據庫的集成
電子政務數據庫集成目前主要有三個方面的解決方法和研究方向。
第一,多數據庫系統。這是一種能夠接受、容納多個異構數據庫的系統,對外和對外呈現不同的特性。前者呈現出一種集成的結構,后者則允許各個異構數據庫的自治性。這種方法的優點是比較成熟,不足之處是還有一定的局限性。
第二,數據庫遷移和轉換。遷移指的是將數據移到新的數據管理系統中來,并且集成為不同類型的數據;轉換是指利用數據轉換程序,通過對數據格式進行轉換,將一些非傳統的數據類型轉化成一種新的能被其它的DBMS接收數據類型。數據庫遷移和轉換運行時效率高,不但簡單,還十分經濟。數據的實時性要求不高的場合都可以運用,反之則不太適用,這是由于它數據更新時會帶來不同步的問題,即使人工定時運行轉換程序也只能達到短期同步這種缺憾性造成的。同樣,對于數據更新頻跌要求很高的場合也不太適用。
第三,用中間件。中間件系統主要集中為異構數據源提供一個高層次檢索服務,為解決異構數據庫的互操作性問題提供解決方案,是異構系統集成所需的粘接劑。在異構數據庫系統即數據層和應用程序即應用層之間就可以找到它。向下不但可以協調各數據庫系統,也為各數據庫系統向上訪問集成數據的應用提供統一數據模式和數據訪問的通用接口;中間件系統模式是實現異構數據集成較理想的解決方案。
與第二種方法相比,它為數據更新時不同步提供了解決方案。而且更重要一點是它在集成異構數據庫時,不需要改變原始數據的儲存方式還有管理方式,依舊能夠完成各數據庫的應用任務。
5 XML在異構數據庫集成方面的優勢
XML (Extensible Markup Language可擴展的標記語言),是一套定義語義標記的規則。
這種文本格式被廣泛接受,目前已經被應用于多領域中。
它是一種標準化的文本格式,可以在互聯網上表示結構化信息。并提供了獨立的運行程序的方法來共享數據,通過這種方法,可以使不同來源的數據很容易結合在一起,XML為數據的統一接口問題提供了解決方案。
它適合于表示各種信息,即能夠提供對資源內容的表示,同時也提供資源所具有的結構信息。不但具有良好的可伸縮性,而且還具有良好的靈活性。
在進行異構數據集成方面,XML具有鮮明的重要特征和優勢,它的主要設計目標是在Web上保存和傳遞信息,所以它可以直接用于互聯網;它支持以全球統一的標準來定義自描述數據、將不同來源的信息集成為統一的文檔和支持在各種分布應用程序之間傳遞信息;它是可擴展的,用戶可以根據需要定義自己的標記;并且具有靈活性,它提供了一種結構化的數據表示方式,使得用戶界面與結構化數據相分離;而且它的自描述性質能夠很好地表現許多復雜的數據關系,使得基于XML的應用程序可以在XML文件中準確高效的搜索相關的數據內容。
參考文獻:
[1]王長勝.電子政務藍皮書:中國電子政務發展報告.北京:社會科學文獻出版社,2003.1~137.
[2]Benefits of Transformational Data Integration. http://www.grcdi.nl/benefits.pdf,2001.
[3]齊艷珂,肖連,高潔.異構數據集成技術綜述[J].福建電腦,2007年06期.
[4]徐向榮,顧新建,葉作亮.基于Web服務的企業應用集成研究[J].制造技術與機床,2006年09期.
[5]顧天竺等.基于XML的異構數據集成模式的研究[J].計算機應用研究,2007年04期.