白榮妙


摘 要:本文淺析了集成數據環(huán)境的建設方案,探討了數據環(huán)境分類理論,指出第三類和第四類數據環(huán)境是高檔次的數據環(huán)境,提出了信息化校園數據層邏輯框架,指明第三類數據環(huán)境對應于數據共享層,第四類數據環(huán)境對應于數據倉庫層。比較分析了基于企業(yè)服務總線ESB和中間件技術數據集成方案的適用情景,探討了信息分類標準的內容和編制規(guī)則。
關鍵詞:共享數據庫設計;數據環(huán)境;數據集成方案;信息分類標準體系
1 共享數據庫設計
1.1 總體目標
共享數據庫是全域數據模型在物理數據庫中的反映,它通過數據集成工具收集、處理、存儲全校各類共享信息數據,并為全校各類應用系統(tǒng)提供信息共享訪問服務,它的總體目標是要做到以下幾點:
1.保證數據合理有效安全地存儲;
2.落實“誰生產、誰維護”原則,保證所有數據都只有單一的維護來源;
3.反映學校管理主要的業(yè)務主題信息;
4.保證數據的規(guī)范性、一致性、完整性;
5.存儲的數據能夠反映學校當前的運行狀況。
1.2 數據環(huán)境分類
美國管理與信息技術專家詹姆斯·馬丁(James Martin)在《信息工程》和《總體數據規(guī)劃方法論》中將計算機的數據環(huán)境分為四種類型,并認為清楚地了解它們之間的區(qū)別是很重要的,因為它們對不同的管理層次(包括高層管理)的作用是不同的[1]。
1.第一類數據環(huán)境:數據文件(Data Files)。這是一種數據組織技術簡單、相對容易實現的數據環(huán)境,系統(tǒng)分析員和程序員根據應用的需要,用程序語言分散地設計實現各種數據文件;
2.第二類數據環(huán)境:應用數據庫(Application Databases)。它使用了數據庫管理系統(tǒng),系統(tǒng)分析員和程序員沒有在數據分析和組織上下功夫,而是為分散的應用設計各自的數據庫,不能支持數據的共享;
3.第三類數據環(huán)境:主題數據庫(Subject Databases)。它經過科學的規(guī)劃與設計,其結構與使用它的處理過程是獨立的,各種面向業(yè)務主題的數據,通過一些共享數據庫被聯(lián)系和體現出來,其建模需要花費很多時間,但其后的維護成本很低;
第四類數據環(huán)境:信息檢索系統(tǒng)(Information Retrieval System)。這種數據環(huán)境的目的是保證信息檢索和快速查詢的需要,以支持高層管理和輔助決策,而不是大量的事務管理,又稱為數據倉庫,它是主題數據庫的集成,是深加工的信息。
以數據文件或應用數據庫為主體的數據環(huán)境,是低檔次的數據環(huán)境,一個現代化管理水平較高的企事業(yè)單位,應該具有第三類和第四類數據環(huán)境,這是高檔次的數據環(huán)境,能保證高效率、高質量地利用數據資源。
1.3 信息化校園數據層結構
信息化校園數據層結構可以看作是狹義集成數據環(huán)境所包含的內容,根據數據環(huán)境分類理論和整體校園數據規(guī)劃方案,信息化校園的文件型數據源和應用數據庫屬于第一類和第二類數據環(huán)境,而共享數據中心、歸檔庫和數據倉庫屬于第三類和第四類數據環(huán)境。根據數據應用的類型劃分,信息化校園數據層整體結構從邏輯上可以分為三層:應用數據層、共享數據層和數據倉庫層,如圖1所示。
1.應用數據層包含第一類數據環(huán)境(文件型數據源)和第二類數據環(huán)境(應用系統(tǒng)數據庫),無論是單獨的數據文件還是應用系統(tǒng)的后臺數據庫,它們都屬于局部數據存儲,它們?yōu)楣蚕頂祿犹峁祿碓矗瑫r又從共享數據層中獲取自己所需的數據。
2.共享數據層也稱為主題數據層,它是整體結構的核心層,它為應用數據層提供數據抽取、訂閱的服務,又為數據倉庫層提供數據的來源,起到承上啟下的作用,共享庫、標準庫和歸檔庫都屬于該層,歸檔庫的數據結構與共享庫一致,只是其中存儲的是已過時、不會發(fā)生變化的數據。
3.數據倉庫層顧名思義其主要內容是數據倉庫,前文已提到,數據倉庫是為決策支持系統(tǒng)DSS服務的,DSS一般由數據倉庫技術、OLAP和數據挖掘技術三部分組成,數據倉庫的數據源是共享庫和歸檔庫,數據倉庫也是通過ETL工具從來源庫中抽取出用于查詢、統(tǒng)計和分析的各種數據。
2 數據集成方案探析
當前主流的數據集成方案有兩種,分別是基于SOA架構的數據集成方案和基于中間件技術的數據集成方案,SOA是一種面向服務的架構,它在信息化校園資源整合方面將發(fā)揮重要的作用,ESB則是實現SOA架構最核心的部件,也是信息化校園框架中基礎服務平臺重要的組成部分,中間件位于數據源和目標存儲之間,它通過提供配套的工具實現從源端到目標端數據的抽取、轉換、加載等工作。
2.1 SOA架構與企業(yè)服務總線ESB
SOA是一種設計理念,為應對復雜企業(yè)應用面臨的柔性化、按需重構、異構系統(tǒng)集成和跨企業(yè)邊界集成等嚴峻挑戰(zhàn)提供了一種比較理想的解決方案[2]。SOA是一種應用程序體系結構,在這種體系結構中,所有功能都定義為獨立的服務,這些服務帶有定義良好的可調用接口,接口獨立于實現服務的硬件平臺、操作系統(tǒng)和編程語言,可以以定義好的順序調用這些服務來形成業(yè)務流程,如圖2所示[3]。ESB是SOA的基礎設施,它是傳統(tǒng)中間件技術與XML、Web服務等技術結合的產物,它是服務間的連接框架,其功能包括消息轉換、消息機制、基于內容的路由和服務容器四個部分,它是一種松耦合架構,實現了服務和通信相分離,使應用系統(tǒng)具有更好的開放性和可擴展性。
2.2 中間件技術
中間件泛指能夠屏蔽操作系統(tǒng)和網絡協(xié)議差異,為異構系統(tǒng)之間提供通訊服務的軟件。數據異構屏蔽可以由數據提供者處理,也可以由數據中間人在數據集成中間件中處理。根據數據異構屏蔽處理的位置不同,可將數據集成分為兩種模式:分散式和集中式[4]。分散式中間件通過標準的訪問接口提供數據的訪問,它返回標準的實體描述信息,屏蔽數據在存儲上的異構性,集中式模式需要數據提供者提供數據源的類型(如關系數據庫類型)、連接信息(如IP、用戶名、密碼)和數據字典等信息,然后中間件通過這些信息訪問數據源。
2.3 ESB與中間件方案比較
ESB松耦合的特性非常適合高校信息資源整合的需要,特別是業(yè)務流程的改造和整合,也有很多高校在進行數據資源整合時采用此方案,如上海交大、華南師大等,ESB除了能夠為數據整合提供方案外,借助ESB基礎設施平臺,還可以實現全校的流程整合、應用整合等,ESB采用標準XML規(guī)范的消息格式,支持Web Service、JMS、JCA等標準,支持同步/異步消息機制,支持服務間的消息通信等諸多優(yōu)點,但采用ESB架構有兩個前提,首先需要得到各個應用廠商的支持,即廠商愿意配合學校的信息化工作,并有能力實現所需的接口服務,其次整體數據規(guī)劃已涵蓋各個信息系統(tǒng)間數據交換的需求,即要求各個信息系統(tǒng)提供的接口服務必須明確,分散式中間件技術對廠商也有類似的要求。
3 信息分類標準體系建立
3.1 學校信息標準化的重要性
高校信息化建設是一個復雜的系統(tǒng)工程,如何規(guī)范建設管理是一個重要的課題。建設環(huán)境體系是信息化校園的重要組成部分,它為集成數據環(huán)境的建設提供支撐和保障,建設環(huán)境體系包括管理規(guī)范和信息標準體系和信息安全與運維保障體系,具體展開可以包括信息化管理規(guī)范、信息標準規(guī)范、應用系統(tǒng)規(guī)范、基礎設施規(guī)范等方面內容,信息標準規(guī)范是建設環(huán)境體系的基礎部分,也是學校信息化建設優(yōu)先重點建設的內容。
學校的數據表示需要按照一定的編碼標準,以方便學校內部數據的流通和統(tǒng)計上報工作的開展,可以參考的標準有國家標準、行業(yè)標準、各省市標準等,學校應該根據自身實際情況引用參考標準制定供全校使用的信息標準,還需要建立學校內部定義的標準,如單位編碼、專業(yè)編碼等,老系統(tǒng)可以通過改造或對照表的方式實現與全校信息標準的一致,新系統(tǒng)在構建初期就引入全校信息標準相關內容,以實現與整體信息化校園的無縫對接。
3.2 標準代碼集編制規(guī)則
1.涉及國家和教育部已頒發(fā)的標準時,可以按照相應的規(guī)范要求直接引用,對于找不到相關標準的代碼,學校可以根據自己的實際情況制定標準;
2.對于正在使用的各類代碼應逐一修訂,并且需得到相關管理部門的認可;
3.編寫制定基礎性代碼或編碼規(guī)則,如單位編碼、專業(yè)編碼、學號等;
4.保證學校各部門與教育行政管理各部門之間暢通的信息交流。
參考文獻
[1]高復先. 信息資源規(guī)劃—信息化建設基礎工程[M]. 北京: 清華大學出版社, 2002.
[2]張朝暉, 徐立臻, 董逸生 等. 一種基于SOA的企業(yè)集成平臺[J]. 計算機工程, 2011, 37(5): 258-260.
[3]管紅杰, 王珂, 江海峰 等. SOA架構的工作流管理系統(tǒng)的研究與應用[J]. 計算機工程與設計, 2011, 32(5): 1654-1657.
[4]裴玉玲, 龐佑兵 等. 基于中間件的異構數據集成系統(tǒng)設計[J]. 微電子學, 2010, (2): 260-264.