文/羅倩
數據共享平臺建設的最終目的是為了采集學校多年來積累的業務數據,通過清洗、轉換等操作,使其變成有價值的數字資產,并在此基礎上進行挖掘應用,從而服務師生以及學校的發展。
智慧校園為師生提供統一的平臺以及一站式服務,成為目前高校信息化建設的重點。高校的信息化建設經歷了三個階段:基礎設施初步建設階段、信息化建設全面鋪開階段、信息化服務提升階段。即高校的信息化建設從最初的投入硬件建設、網絡建設,到后期的各個業務應用系統建設越來越多,師生需要記住的密碼越來越多,注重提升服務質量的意識越來越強,高校的信息化發展到“一個平臺+N個應用”的階段。目前,大部分高校都處于第三階段。
在學校信息化建設第二階段期間,一些業務部門基于當時的業務需要分散建設了自己的業務系統,系統設計的標準和技術架構不統一,系統各自獨立運轉,大量的歷史數據分散地積累下來,形成了信息孤島。而且還有一些業務部門沒有業務系統,數據更是分散單機存儲,因此迫切需要數據共享平臺來解決全校范圍內的數據共享問題。
數據共享平臺是以學校的數據標準和業務體系為基礎建設,能提供數據管理、數據共享以及數據服務等功能。數據共享平臺是智慧校園的核心組成部分,是整個系統數據傳輸的中樞。通過數據共享平臺,可以很容易地實現數據共享而不影響原始業務系統。各業務系統數據庫中的數據通過數據共享平臺被抽取到數據中心庫,數據中心庫通過數據共享平臺將指定的數據推送給數據需求部門,從而解決了數據的重復錄入、數據標準不一致以及共享困難等問題,允許信息在學校各部門的業務系統之間流動,也為提供數據的綜合查詢、統計分析以及學校的業務流程的整理奠定了數據基礎。
數據共享平臺的結構如圖1所示,包括數據交換、數據存儲以及數據服務三部分。

中國政法大學
數據交換層:這一層是整個數據共享平臺的核心層,提供信息推送和信息的集成功能。數據交互層負責將從不同業務部門采集的數據存儲在數據中心,并根據預先約定好的規則將數據推送給相關的數據需求部門。這個過程包含數據抽取、轉換、清洗、裝載。
存儲層:參考學校的數據標準,可以合理地構建基礎數據庫和數據倉庫。在這個過程中,應該強調區分國家標準、行業標準以及學校標準的差異,并提高數據的讀寫效率,以滿足數據中心數據快速增長的需要。基礎數據庫需要嚴格按照已經正式發布的學校信息標準來建設,提供各業務數據的存儲以及一些基礎信息查詢和分析的數據基礎。數據倉庫則是為了做更多數據挖掘而建設的數據庫,一般以時間維度和主題對數據進行存儲和集成。
服務層:在存儲層的基礎上,數據共享平臺可以提供一些數據服務,包括一些學校基礎業務數據的查詢、數據統計、數據圖標展示、數據導出等功能。
運行和管理規范:數據共享平臺運行與管理規范貫通整個數據交換的應用過程,為平臺正常運行提供保證。

圖1 數據共享平臺結構
異構數據支持
由于業務系統前期是分散建設,其體系架構、采用的數據庫類型不盡相同,要集成各個業務系統的數據,平臺支持多種異構數據庫,如主流的關系型數據庫包括:Oracle、SQL Server等,非主流的關系型數據庫如Pgsql、Mysql;格式化文件如txt、xml、xls等文件的集成;能夠通過接口交互實現數據的存取,如Web Service。
數據集成配置
數據交換層將根據配置需求執行數據交換。數據交換配置包括:1.定義數據源、業務系統的數據庫配置功能,包括業務系統、數據庫、IP地址、端口號、數據庫SID、用戶名、密碼等業務系統的信;2.目標庫中創建表以接收業務中間庫中的數據;3.配置數據流信息;4.執行數據集成接口;5.檢測數據集成情況;6.設置數據自動同步周期。
數據轉換和清洗
源業務系統的數據標準、數據中心庫的數據標準和目標業務系統所需的數據內容可能存在差異。通過數據轉換、清理和加載,數據交換中心完成了不同數據標準的相互映射和轉換,實現了共享數據的跨應用交互。
數據共享的監控
能對元數據、代碼標準、數據庫、數據質量等進行健康檢查;可以監控系統異常、數據集成異常、API調用異常、數據質量檢測、數據備份;能對標準建設情況、業務系統集成情況、數據質量情況等進行查詢跟蹤;支持業務系統、主數據的外部關系跟蹤,接口的映射轉換關系的查詢;支持問題的預警機制,以郵件方式通知管理人員,以保證問題即時通知和處理;可以對數據集成平臺信息進行重新組織,以通俗易懂的展示方式,方便管理員和校領導查看。
數據質量管理
在基礎數據庫的基礎上全面地對數據質量進行自動化檢測,包括可對數據質量檢測規則進行設置,包括檢測規則、業務檢測項、檢測數據范圍。設置方式簡單、可視化、可配置;能夠自動檢測平臺內的數據質量,并自動生成質量概況圖表,供用戶分析、排查數據質量問題。
高校內部的各方積極因素,包括學校對信息化資金和政策的支持,學校領導的支持,所有校園師生用戶、學校各級管理職能部門以及各類信息化專業技術隊伍和人員的支持。
重視硬件基礎設施架構的規劃與設計,包括軟件和硬件兩方面,平臺的建設必須采用先進的性能穩定的、安全可靠的軟件和設備。
信息化建設積累的數據信息的質和量,積累的數據量越多,質越高,數據的利用價值越大,那么可供挖掘和提供的服務就越多,用途越廣,會刺激平臺得到更多的政策和人員支持,從而會開展得越順利。
智慧校園數據共享平臺的順利建設人才很重要,需要培養有針對性的人才梯隊,努力創造人才輩出、人盡其才的良好環境,為下一階段的智慧校園建設培養人才。
遵守數據中心建設規范以及運行和管理規范,使得平臺的建設和管理有章可循,是促進數據共享規范化、制度化,形成信息共享長效機制的保障。
數據共享平臺建設的最終目的是為了采集學校多年來積累的業務數據,通過清洗、轉換等操作,使其變成有價值的數字資產,并在此基礎上進行挖掘應用,從而服務師生以及學校的發展。因此數據的質和量很關鍵,在數據共享平臺建設完成的基礎上,下一步工作就是不斷擴大數據源范圍,以及歷史數據的積累,建立數據倉庫,在此基礎上挖掘有價值的應用和服務,如學業預警、領導決策分析等。