張鵬高,喬燕峰
(教育部教育管理信息中心 教育預測與評價處,北京100816)
大數據時代教育數據倉庫與數據服務平臺建設思路
張鵬高,喬燕峰
(教育部教育管理信息中心 教育預測與評價處,北京100816)
在大數據時代,教育數據資源亦呈現出大數據的特征,通過大數據的分析支撐教育監管、決策更加意義非凡,那么在大數據時代,以何種思路、方式構建國家教育管理信息系統,來滿足大數據分析的需求,并將正確、準確的信息以更合理、及時、有效的方式提供給合適的管理、決策者,從而推動教育的發展和改革,是當前教育信息化工作迫切需要解決的問題。
大數據;數據倉庫;教育決策
在大數據的時代,各行各業都在談大數據,它的影響輻射各行各業,并且已經開始在信息產業、交通運輸、醫療衛生、食品安全等領域中發揮出重要作用。與此同時,作為面向社會公眾的教育行業,無論從教育數據資源的情況,還是對大數據的分析應用需求看,亦進入了大數據時代。
教育管理信息化是《國家中長期教育改革和發展規劃綱要(2010-2020年)》和《教育信息化十年發展規劃(2011-2020年)》所確定的教育信息化建設核心任務之一,對支持教育宏觀決策、加強教育監管、提高各級教育行政部門和學校的管理水平、全面提升教育公共服務能力具有不可或缺的重要作用。教育改革發展涉及面廣、難度大,越來越需要準確全面的數據分析和服務作為教育科學決策的支撐。建設國家教育管理信息系統,就是建立涵蓋學生、教師、學校資產及辦學條件的教育管理信息系統和基礎數據庫,并以此為基礎建立數據分析與科學預測的教育決策服務系統,已成為支持教育改革與宏觀決策的現實需求。國家教育管理信息系統的建設,也為教育大數據的積累奠定了基礎。
教育大數據倉庫與數據服務支撐平臺是基于教育服務與監管基本宗旨,統籌考慮教育事業全局,以適應大數據時代教育數據新特征和支撐教育監管和決策的數據分析為出發點,集成大數據思路和傳統數據倉庫架構,構建縱向覆蓋各級教育機構,橫向覆蓋教育各業務領域的、統一的教育數據信息資源中心,將合適的教育數據資源及時、有效地提供給合適的教育管理、決策者進行教育主題研究分析、評價和預測,促進教育監管與決策更加合理性、準確性、科學化以及智能化,服務于教育事業的改革創新,支撐教育事業智慧化的發展趨勢。
1.總體架構
平臺的總體架構以教育系統全局為視角,以應用為驅動,基于SOA的理念,運用柔性架構設計思想和分層體系架構,以“滿足當前應用、擴展未來需求”為目標,綜合考慮大數據時代下新的技術思路和傳統數據倉庫的優勢,采用組件化、服務化的方式,靈活適應功能、分析內容的動態追加和變更,滿足系統未來變化的需要。架構的主要內容以及相互之間的邏輯關系如圖1所示。

圖1 教育大數據倉庫與數據服務平臺總體架構
2.主要內容
(1)數據集成整合系統:是將各種數據源中的各種類型的數據按照教育數據資源中心的數據規范要求進行清洗、轉換等操作,將符合教育數據資源標準體系要求的數據整合、加載到教育數據資源中心,為后續的統計、分析、挖掘業務提供高質量、規范化的數據資源;
(2)數據管控系統:是對數據資源的集中管控,保證數據的準確性、完備性和安全性。主要建設元數據管理、數據質量管理和數據安全管理,從而達到對教育數據資源中心中數據的管控;
(3)數據治理體系:是對教育數據資產管理行使權力和控制的活動集合,是建立教育數據管理制度、指導教育系統執行數據規劃、數據環境建設、數據安全管理、元數據管理、數據質量管理等其他數據管理活動的持續改進過程和管控機制;
(4)數據服務調度管理系統:是整個平臺的“發動機”,以教育管理各級行政單位、各級各類學校、科研院所以及社會公眾等不同團體在監管、決策、研究分析以及公眾數據服務等應用為驅動,將教育數據資源中心數據按照一定的規則,運用合適的智能分析技術,以組件化、模塊化、服務性的方式及時、準確、合理地推送給數據分析應用中心,從而直觀、友好地展現給不同的監管者、決策者、研究分析人員以及社會公眾;
(5)智能分析系統:主要是利用教育數據資源中的數據,通過即席查詢、統計報表、多維查詢、數據挖掘等技術手段,進行多種教育主題的綜合分析以及通過大量數據信息挖掘潛在信息,實現教育的評價與預測等,然后以一種合適的、直觀可視化的、有好的方式及時、準確地提供給相關教育監管、決策、研究分析人員以及社會公眾,從而實現教育監管、決策以及研究分析的科學化、智能化。
3.預期目標
(1)匯集不同來源的各種教育數據資源,建立起統一、規范的教育數據信息視圖,形成覆蓋教育各領域的、綜合的、面向各種教育主題的教育數據資源中心,實現統一的教育數據管控、治理機制;
(2)形成面向不同主體的、特定領域的教育應用主題的數據集合,按照不同的教育主題進行組織、匯總、管理數據,滿足政府 (教育行政單位及國家其他行政單位)、學校、社會公眾、國際教育團體等不同教育數據應用主體對數據進行分析解讀、評價和預測的需求;
(3)建立柔性化的分析性數據應用服務的統一出口,通過靈活的組件化方式,將特定的數據集以合適的數據展示形式及時地、直觀地提供給各種不同的教育數據應用領域,滿足教育監管與決策的數據服務需求;
(4)建立國家、省兩級教育大數據倉庫與數據服務支撐平臺體系,既實現不同教育級別不同類型教育數據資源的整合與集成,同時又能夠滿足國家和省級不同的應用需求;
(5)構建一套全面的、標準化的、可操作性的教育數據資源服務保障體系,形成一種長久有效的教育數據資源服務保障機制,可持續性地為教育監管與決策服務。
總之,國家教育大數據倉庫和數據服務平臺的建設實施,將全面、有效地支撐各級各類教育數據資源的分析,并且使教育監管與決策智能化的能力得到逐步提升。

圖2 教育大數據倉庫與數據服務平臺支撐數據分析能力和決策能力關系圖
當今各行各業都在大談大數據的時代,大數據的開發應用已經被許多國家提到國家戰略的高度來進行研究。今年初李克強總理所做的政府工作報告中明確提出要設立新興產業創業創新平臺,在大數據等方面趕超先進,引領未來產業發展。作為國家公共管理部門,教育如何適應大數據時代,并利用大數據的開發應用推動教育事業的發展、改革與創新,支撐教育事業智慧化的發展趨勢,是當前所有教育同仁共同思考的話題。并且隨著國家教育信息化戰略的實施,大數據的開發應用需求更加迫切,所以我們應當適應大數據潮流,把握機遇,充分利用大數據,結合教育信息化建設現狀,構建教育大數據資源中心,有效支撐教育的監管和決策,推動教育的智慧化,從而實現教育的變革。
[1]張春艷.大數據時代的公共安全治理[J].國家行政學院學報,2014(9).
[2]沈菲飛.基于數據倉庫的高校學生管理預警與支持系統[J].巢湖學院學報,2007,9(5).
[3](英)Viktor,Kenneth著,盛楊艷,周濤譯.大數據時代-生活、工作與工作思維的大變革[M].浙江:浙江人民出版社,2013.
[4]韓蕊.大數據讓數據倉庫更具有價值[J].互聯網周刊,2014(3).
[5]俞燕萍,丁榮濤.基于數據倉庫技術的學生就業趨勢分析系統設計[J].中國科技信息,2008(7).
(編輯:王曉明)
TP393
A
1673-8454(2015)01-0014-02