摘要:伴隨大數據的應用,高校在信息化建設方面對于多源異構的問題亟待解決。高校應用系統多,導致異構數據存放分散,缺點是側重具體業務、分散建設、集成性差及可用性低。基于以上問題,以及主數據建設關鍵性和長期有效的特征,提出建設主數據平臺,通過建設符合高校信息規范的數據管理體系和主數據平臺,提供標準化統一的數據管理,解決數據冗余和各個業務系統數據不一致問題,實現系統的集成及數據在系統之間的共享,以此促進大數據技術在教育行業的應用及研究。
關鍵詞:主數據;數據交換;數據集成;服務接口;編碼標準;數據庫注冊
中圖分類號:TN302.7文獻標志碼:A文章編號:1008-1739(2019)18-70-4

0引言
數據已經是企業的一種資產,主數據建設屬于數據治理的內容之一,國內數據治理方面先后印發了《政務信息資源共享管理暫行辦法》《政務信息系統整合共享實施方案》。數據是信息的載體,信息和數據互相依存,信息技術是新型高等學校的支撐。主數據管理概念于21世紀初在國外被提出,國外在ERP系統中提出主數據管理,旨在實現企業業務系統互聯互通[1],打破信息孤島[2-3]。文獻[4-6]在企業和高校主數據的建設及應用可以通過面向服務的架構(SoA)和企業服務總線(ESB)技術實現,主數據平臺建設是實現數據共享、規范化和流程化管理的基礎。為了確保系統數據正確、一致和可控,保證數據分析結果和質量,高校數據治理和主數據平臺建設方面的工作將大有可為[7]。
1編碼
1.1編碼原則、標準和集成方案
編碼是主數據平臺建設的一項基礎工作,編碼要具有唯一性、可擴展性、簡單性、規范性、實用性及合理性,結構、類型以及編寫格式必須統一,要盡可能地反映分類對象的特點,便于記憶。另外,編碼結構要與分類體系相適應。
數據標準管理是數據治理范疇的一個重要環節,依據標準及相應數據管理技術實現數據治理的過程。為了規范定義業務系統元數據,使高校在信息建模、信息加工采集、資源共享等信息化建設方面具有統一的標準,需研究信息標準編碼標準體系的建設。西安某高校在利用主數據平臺建設解決多源融合的問題,實現數據編碼規范化方面取得了良好成效[8]。
編碼標準總體維護方案及編碼標準集成共享方案如圖1所示,編碼規范體系如圖2所示。

1.2編碼集成
以學工系統為例闡述信息標準編碼規范,編碼規范分為2部分:第1部分是學工管理自定義編碼規范,為業務系統建設過程中應用到的自定義部分的編碼;第2部分是引用代碼規范,為學工系統建設過程中會引用到的國家標準編碼。此部分不需要編碼,后期在使用到相關編碼時作為標準直接引用。編碼標準集成及共享方案如圖3所示。

2主數據管理平臺設計
2.1數據拓撲設計
有文獻提及主數據建設支撐大數據分析,主數據標準化是行業展開大數據應用的基礎和前提[9-11]。主數據管理平臺建設以學校信息化建設業務和主數據編碼的需求為起點,遵循應用驅動原則,在學校解決具體教育教學管理的問題,實現信息化建設的低投入高產出。
主數據管理平臺對學校的學生、老師和組織機構等基礎數據及主數據的產生和發布進行管理。主數據管理平臺具體負責學校辦公系統、學工系統、人事系統、教務系統和科研系統等編碼的維護和管理,提供數據集成接口,實現各個業務系統的數據集成,為各業務系統提供高質量的主數據服務。提供定制功能實現主數據編碼規則及流程的支持。
主數據管理控制臺主要是校內管理員使用,不對外開放。主數據平臺建設對數據庫環境、服務器的軟硬件及數據集成服務器有一定要求。數據庫類型建設要求為Oracle RDBMS。依據實際需求,設計的系統數據拓撲如圖4所示。

2.2服務器資源規劃
基礎平臺是主數據建設的基礎[12],主數據管理平臺基于SOA實現和其他業務系統的數據共享,依據需求部分資源規劃如表1所示。

2.3 WebLogic Server構建
開發過程運用Web Service技術,依據Web Service技術規范實施開發,使應用之間的數據交換得以實現。構建WebLogic Server管理控制臺,實現對WebLogic Server域的管理。通過管理控制臺的Web應用程序執行的主要操作有8項:①配置、啟動和停止WebLogic Server實例;②配置WebLogic Server集群;③配置WebLogic Server服務;④如數據庫連接(JDBC)和消息傳送(JMS);⑤配置安全參數;⑥包括管理用戶、組和角色;⑦編輯選定的運行時應用程序;⑧描述符元素、配置和部署應用程序。
2.4數據源管理
主數據管理平臺數據源的管理需要實現業務系統的數據源注冊。注冊信息有:系統名、Oracle的數據集成類工具(ODI)數據源名稱、數據庫管理系統類型(SQL Server 2008,Sybase,Oracal,Infornix,DB2等)、數據庫驅動、數據庫連接字符串、數據庫連接用戶名、數據庫連接用戶密碼、數據庫對象所有者和注冊系統描述信息。
2.5數據采集樣表及表的設計
主數據平臺數據對象管理實現對數據對象基本信息、字段屬性、引用關系和實體關系ER圖的操作。數據對象基本信息包含的操作:數據對象命名、修改人、修改時間和數據對象描述等信息。字段屬性包含的操作:字段名、中文簡稱、字段類型、是否主鍵和是否唯一等操作。引用關系包含:引用對象、引用對象中文簡稱和引用代碼表字段等信息。ER圖實現實體之間的關系模型,實現一對一關系、一對多關系、多對多關系及無任何約束的表的關系。
依據實際對系統表和業務表設計,系統表設計為綜合服務提供相關的接口服務數據表,數據通過接口調用自動寫入。設計的系統表和業務表如表2和表3所示。

建成學工系統測試庫如圖5所示。
2.6數據庫注冊及注冊實例
開發Web Service服務接口通過搭建Web Service服務,獲取工廠實例,生成針對指定服務接口(URL)的客戶端,調用指定的方法實現。服務總線提供服務的注冊與申請授權流程、服務的查詢與分類功能、方便快捷的線上流量控制與緩存設置功能。將建好的數據庫注冊,注冊的主數據管理平臺信息如表4所示。

3應用及網絡安全
學工方面應用服務情況是解決對所有在籍在校學生基礎信息的收集,通過已掌握的學生基礎信息可進一步統計出有效數據,作為學校開展全校策略和規劃工作的依據。學校管理老師可以設置基礎信息批次,設置開放時間、學生范圍、修改范圍以及審核流程等。學生在修改時間的范圍內對個人基本信息進行完善或修改。按照審核流程,由班主任或輔導員進行學生基礎信息初審,再由院系負責人進行復審,最后由學校管理老師進行最終審核。班級信息與學生基礎信息從教務系統中獲取,并一起初始化到基礎信息中。接入應用程序(APP)時,云端通過HTTP協議調用校內應用管理平臺的接口寫入應用APP的注冊信息,同時生成應用APP的安裝包,安裝包只能在本校使用。
整個平臺只有相關應用服務器對公網開放某些端口,其他服務器公網都不能直接訪問,應用程序統一通過代理出去。每臺服務器都開啟防火墻并在防火墻上限制開放的端口及限定訪問的IP,所有軟件安裝采用非root用戶,并限制root用戶直接連接服務器。定期修改服務器密碼確保安全。應用程序安全采用Web應用防火墻,做安全防護數據庫安全采用數據庫防火墻。平臺上線運行前做漏洞安全掃描。在網絡安全方面,應用程序采用HTTPS。SSL VPN保證管理員遠程接入,出口采用核心防火墻。
4結束語
高校主數據平臺建設解決各個業務部門信息不一致問題,以主數據的編碼原則及其規范進行編碼設計。通過對服務器資源規劃部署,對WebLogic Server的構建,對基礎數據的采集、整理及清洗工作,對業務系統表的設計,對整個平臺應用安全的設置等工作,實現學校元數據管理、代碼標準管理、主數據管理和數據集成等。針對應用實現了教務系統、學工系統、一卡通系統和招就系統等異構數據源的整合。接下來將要完善各業務部門業務系統實時數據的采集及數據的深度融合,以此確保平臺建設的有效性和持續性,也為大數據應用打下良好基礎。
參考文獻
[1]楊現民,王榴卉,唐斯斯.教育大數據的應用模式與政策建議[J] .電化教育研究,2015,36(9):54-61.
[2] Singh S,Singh J.SSMDM: An Approach of Big Data for Semantically Master Data Management[C]// International ConferenceonComputingforSustainableGlobalDevelopment, IEEE,2015.
[3] Putro B L,Surendro K,Siregar H.Leadership and Culture of Data Governance for the Achievement of Higher Education Goals (Case study: Indonesia University of Education) [J].AIP Conference Proceedings,2016, 1708(1):1
[4]查永軍.大數據與高校院系治理[J].中國電化教育,2018,372(1):59-63.
[5] Druker D,Rich R.Master Data Management[J].DB2 Management,2015,10(3):33-36.
[6]張閃閃,顧立平,蓋曉良.國外信息服務機構的數據管理政策調研與分析[J].圖書情報知識,2015,167(5):99-109.
[7]宋姣姣.神東主數據平臺系統的設計與實現[J].陜西煤炭, 2018,37(S1):105-108,145.
[8]鎖志海.西安交通大學教育大數據分析驅動智慧教育[J].中國教育網絡,2017(10):20-21..
[9]陳君.主數據管理平臺建設研究[J].鐵道工程學報,2016,33(5):134-136.
[10]南旭光,張培.智能化時代我國高等教育治理變革研究[J].中國電教化教育,2018(6):1-7.
[11]李智蓉.數據管理信息系統接口集成設計方案[J].辦公自動化,2018,23(4):29-31.
[12]蔣遠輝,呂忠亭,任浩然.數據服務平臺在高校的建設與應用[J].信息通信,2018(12):187-190.