劉萍 張蕊 趙文廣

摘? 要:隨著信息技術的發展,高校信息資源和應用系統建設不斷豐富和完善,但也累積了眾多數據孤島,打破數據間的使用壁壘,建設一條信息高速公路勢在必行。文章對高校信息化數據資源管理現狀進行了分析,對數據共享中心構建的整體思路和解決方案、相關核心關鍵技術進行了研究,提出了數據共享中心在高校的應用模式,從而對數據孤島在智慧校園中的應用提出積極建議。
關鍵詞:數據共享;智慧校園;信息化
中圖分類號:TP311.1? ? ? 文獻標識碼:A 文章編號:2096-4706(2020)01-0104-03
Abstract:With the development of information technology,the construction of information resources and application systems in colleges and universities is constantly enriched and improved. However,a large number of data islands have been accumulated,breaking the barriers between the use of data,and it is imperative to build an information superhighway. This paper analyzes the current situation of information-based data resource management in colleges and universities,studies the overall idea and solution of data sharing center construction,and relevant key technologies,and puts forward the application mode of data sharing center in colleges and universities,so as to put forward positive suggestions for the application of data island in smart campus.
Keywords:data sharing;smart campus;informatization
0? 引? 言
中國人民大學從2004年開始建設數字校園,在過去十數年的建設過程中,學校的信息化建設和管理水平得到顯著提升,基于校園網的信息資源和應用系統建設不斷豐富和完善,初步探索出了一條具有人大特色的教育信息化發展之路。
隨著信息技術的演進和師生需求的不斷變化,學校信息化工作的定位也逐步從數字校園升級為智慧校園,為了體現信息化建設理念與文化的更新,在2012年,我校啟動“數字人大”三期建設工作,正式將“數字人大”更名為新一代的“微人大”智慧校園平臺,對信息系統的格局進行了橫向的重新界定,通過對各個業務系統的重新梳理,抽象和提取通用功能,將“數字人大”的應用群和其他第三方應用群融入其中,形成立體化的智慧校園平臺。同時,嘗試使用統一的框架體系和服務標準,力圖通過數據共享中心建設,解決系統間的功能互訪和業務集成等問題,推進新老系統的協同演進。
1? 高校信息化數據資源管理現狀
如何利用信息技術有效推動教學和科研模式的變革,已經成為學校信息化建設工作亟待研究的課題,對學校數據資源管理而言,存在管理數據分散、教育資源分散的現狀。
1.1? 管理數據分散
目前學校的各個管理機構掌握著各自業務領域的數據,雖然有些學校信息技術部門面向全校各業務系統建設了全局數據庫,但這并不是實質意義上的數據中心。因為這些全局數據庫是建立在同一個Oracle數據庫實例下的不同表空間,數據共享完全依靠視圖來解決。
隨著學校教育體制改革的快速推進,以及教職工和學生對于管理公共服務要求的持續提高,跨部門之間的協同辦公對管理信息共享提出了迫切要求。新的需求要求各業務部門不斷地更新自己原有的業務系統,但傳統全局數據庫模式由于安全性、開放性等問題,已不能滿足學校建設數據中心及大數據分析系統的需求。
1.2? 教育資源分散
自2012年MOOC等網上學習平臺在國內興起以來,高校普遍認識到,信息技術已經成為實現教學模式改革、提升學生學習自主性的重要手段,因此競相探索搭建適合本校特點的網上教學和科研平臺的方式,并把教學信息化和科研信息化建設提升到了戰略重要地位。但是,正如數據是管理信息化建設的根本,資源是教學信息化和科研信息化建設的根本,沒有資源的共建共享,就無法顯現網上學習平臺對教學模式改革、提升教學質量的重要支撐作用。
學校各管理機構不同程度地產生和積累了大量教育資源,例如黨校培訓課程、黨校考試考卷、干部培訓課程、教職工資格考試試題、教職工業務培訓課程、消防安全教育課程、教職工和學生活動照片和音頻視頻,以及學校的宣傳片和宣傳手冊等。這些資源均分散在各自負責的部門或單位中,已經在全校范圍內形成了大小不等的幾十個“資源孤島”,這在一定程度上制約了學校應用信息技術實現教學模式改革的發展步伐,也不利于學校整體提升所有教學單位的教學水平和教學質量,以及教職工的業務和技術水平。
2? 高校數據共享中心設計
2.1? 重新梳理學校現有的數據標準
遵循教育部2012年最新頒布的《教育管理信息高等學校管理信息》建設數據標準,對于沒有國家標準和行業標準的字段,參照省/市代碼標準規范。對于既沒有國家、又沒有省級行業標準的數據字段,建設學校信息標準。
2.2? 構建學校共享數據庫
建立學校管理服務全局數據庫,實現對人事、資產、學生、教學科研等信息數據以及感知數據的集中保存、開放共享。全局數據庫數據的存儲分為:數據緩沖區、基礎數據庫和數據倉庫。這樣的架構設計更能保證數據的安全和分布式存放需求。
2.3? 共享數據庫視圖建設
視圖在數據庫管理中舉足輕重。用視圖可以表示來自不同源的數據,可以用一種不同于數據存儲在基表中的形式來表示數據,也可以通過隱藏基表的實際結構來簡化數據的表示方式,只顯示基表的一個限制子集給用戶。用視圖管理共享數據庫,方便、簡單、安全,邏輯數據具有獨立性,訪問的數據僅可查詢,不能修改,不會影響正式表的數據。
2.4? 建設數據接口管理系統
數據接口管理主要是利用數據集成交換工具對各類數據源中的數據進行定時的數據抽取,基于信息標準進行相應的數據格式轉換,根據業務規則和約束借助數據質量檢測工具進行數據清洗,最終完成數據從數據源向共享數據庫裝載的全過程的管理,并利用數據接口管理,完成學校現有業務系統的應用集成,實現數據集成過程的高效管理。
2.5? 建設數據校驗系統
數據校驗包括質量檢測規則設定、規則執行引擎、數據質量報告、報告推送功能。規則設定是數據校驗的核心,建設較為全面的數據檢測規則庫,并提供圖形化的規則設定和管理功能;規則執行引擎可以定時批量執行檢測規則,及時發現數據質量問題,系統可以自動形成數據質量報告,推送給業務系統管理人員,有助于及時糾正問題數據。
3? 數據共享中心總體架構
結合高校的實際情況,高校數據共享中心分為四個層次,從下往上分別是數據源層、數據交換層、數據治理層和數據服務層,如圖1所示。
數據源層是各個業務系統的數據庫,這個層次主要使用各類DBMS進行管理。
數據交換層是將業務系統數據集中到數據共享緩沖區、數據標準區和數據倉庫區的中間層次,這個層次主要根據業務系統和數據需求的狀況采用實時視圖交換和定時ETL交換數據。
數據治理層含有一個數據共享緩沖區對外提供共享數據視圖服務和授權管理;一個數據標準區用于管理數據標準,進行數據治理,形成高質量的標準數據;一個數據倉庫區用于保存隨時間變化的、集成的、面向主題的數據,并提供各種分析工具,進行決策支持。
數據服務層是對外提供數據服務的層次,這個層次采用數據視圖方式和數據接口方式對外提供數據服務。主要包含數據服務申請的流程審批管理,數據視圖的管理發布以及數據接口的管理發布等。
3.1? 數據源層
數據源層的數據主要來自學校各業務部門建設的業務系統。因此,在進行共享數據中心建設的過程中,需要數據中心建設方、學校信息技術部門以及業務部門,按照教育部的數據標準,確定各個信息子集數據表的數據來源,以及每項數據的負責部門和負責人。在后面的數據服務申請流程中,數據的負責部門和負責人將對使用數據的請求申請進行審批。
確定數據中心每個數據表的數據來源后,建設方將根據業務系統的數據狀況,開發并綁定數據抓取SQL,然后在數據標準區生成相應的數據標準視圖。
3.2? 數據交換層
數據交換層主要由實時視圖交換和定時ETL交換兩部分組成。
3.2.1? 實時視圖交換
如果業務系統的數據庫在統一的全局數據庫中,就采用視圖方式進行數據交換。在同一個實例中以視圖的形式進行數據交換,不僅能靈活地進行數據定制,而且可以保證數據的實時性。但由于歷史原因,造成視圖管理困難、數據交換呈現網狀結構、耦合度過高等問題。通過重新規劃建設實時視圖數據交換層,可以達到對共享視圖的靈活管理,變網狀結構為星狀結構,實現數據解耦的目的。
3.2.2? 定時ETL交換
如果業務系統的數據庫不在統一的全局數據庫中,或存在一些非結構化的數據,就采用定時ETL的方式進行數據交換。
3.3? 數據治理層
數據治理層是數據中心進行共享數據管理、數據標準控制、數據質量管理的層次,主要分成三個部分:數據共享緩沖區、數據標準區和數據倉庫區。
3.3.1? 數據共享緩沖區
數據共享緩沖區是數據庫的一個共享區域,所有的共享視圖都建設在這個區域,這個區域的共享視圖管理主要通過數據服務層的共享視圖發布管理工具進行操作。
盡量保證共享視圖的數據源來自于數據標準區的視圖,如果數據標準區沒有相關數據,則可以考慮擴展數據標準區的標準定義,如果無法擴展標準,則由視圖生成工具在數據共享緩沖區生成直接訪問業務系統數據源的共享視圖。
數據共享緩沖區是對外提供視圖訪問服務的唯一區域,在這個區域對由數據服務請求的目標用戶進行授權。
3.3.2? 數據標準區
數據標準區由一組按照教育部2012《教育管理信息高等學校管理信息》標準定義的視圖組成,這組視圖根據所屬子集的不同,分別分散到不同的數據庫用戶下面。數據標準在項目建設中,需要完成標準梳理,確定數據源,進行數據集成的工作。
3.3.3? 數據倉庫區
數據倉庫區是一個面向主題的、集成的、隨時間變化的、相對穩定的數據集合,用于支持管理決策。通過數據倉庫的建立,職能部門可對現有系統的數據進行有效的集成并加以重組,建立面向聯機分析處理的系統,以滿足學校對數據準確掌握、統計分析上報的需求,并為數據挖掘和決策支持提供基礎數據。
數據倉庫區需要建設方參考教育部2012《教育管理信息高等學校管理信息》標準的子集進行構建,在系統部署時進行相關數據模型創建、主題生成和相關數據集成,同時需要提供相關的管理工具。
3.4? 數據服務層
任何業務系統如果需要從數據中心獲取共享數據,都需要通過數據中心的數據服務層。數據服務層主要由兩個部分組成:數據視圖服務和數據接口服務。
3.4.1? 數據視圖服務
數據視圖服務是通過使用視圖發布管理工具,針對通過流程審批的數據需求,進行數據選取、加工處理、視圖生成、視圖授權,進而得到數據需求方可以訪問的數據視圖。
3.4.2? 數據接口服務
數據接口服務是通過接口發布管理工具,針對通過流程審批的數據需求,進行數據選取、加工處理、接口生成、接口發布,進而得到數據需求方可以訪問的數據接口。
4? 結? 論
通過數據共享中心的建設,可以對學校多年信息化發展形成的數據進行整合,重新梳理學校現有的數據標準、構建學校共享數據庫,保證數據的安全和分布式存放需求。而在數據共享中心的建設過程中,如何制定數據校驗規則,讓系統及時發現數據質量問題并推送給業務系統管理人員,從而及時糾正問題數據還需要進一步探索和研究。
參考文獻:
[1] 唐連章,衛建安,楊玉寶.ESB在數字化校園共享數據中心建設中的應用 [J].廣州大學學報(自然科學版),2011,10(1):70-75.
[2] 俞春,袁芳,劉乃嘉,等.高校數據共享與交換技術的應用研究 [J].實驗技術與管理,2012,29(11):109-112.
[3] 羅雅過,趙寧社.高校數字化校園數據中心平臺的研究與設計 [J].計算機技術與發展,2014,24(9):217-221.
作者簡介:劉萍(1975-),女,漢族,福建莆田人,副高級工程師,碩士研究生,研究方向:數據挖掘、智慧校園、教育信息化。