

【摘 要】教育大數據價值的發揮,關鍵是教育數據的聚合和教育數據的應用,這兩個方向上的技術發展和模式創新,直接影響著教育大數據對教育數字化轉型工作的變革性作用。由于教育系統自身的獨特性,在區域層面整體推進教育大數據的建設和應用,普遍面臨分學段管理導致的數據分散、數據標準規范不一、數據質量不高、數據關聯關系不完整的問題以及教育大數據平臺和業務系統缺乏聯動機制的挑戰。針對上述問題,本文提出在教育大數據建設過程中,應建立基于數據產品理念的數據治理模式,使得數據質量從業務環節上得到保障,并構建了面向應用服務的“全息關聯”數據產品模型,以解決數據關聯程度不高的問題。針對大數據平臺和業務系統缺乏聯動的問題,本文還提出“基景聯動”系統架構,將教育大數據平臺和業務場景一體化設計,解決多部門協作問題。上述模型和設計在北京市教育大數據平臺建設中進行了應用,并取得了良好的效果。本文提出的教育大數據治理模式、方法和技術對區域教育大數據建設以及教育領域數字化轉型具有理論價值和實踐參考意義。
【關鍵詞】大數據;數據治理;數據產品;全息關聯;智慧教育
【中圖分類號】G434" "【文獻標識碼】A
【論文編號】1671-7384(2024)04-032-05
引" 言
教育大數據是指整個教育活動過程中所產生的以及根據教育需要采集到的,一切用于教育發展并可創造巨大潛在價值的數據集合。教育大數據已經成為推動教育變革的新型戰略資產以及發展智慧教育的基石。大量的教育大數據研究、建設工作已經展開,并積累了豐富的經驗,取得了顯著成效[1-6]。同時,從教育大數據領域的發展看,教育大數據價值的發揮,關鍵是教育數據的聚合和應用,這兩個方向上的技術發展和模式創新,直接影響著教育大數據對教育數字化轉型工作的變革性作用。但是,由于教育系統自身的獨特性,在區域層面整體推進教育大數據的聚合和應用,普遍面臨以下兩大問題。
一是在數據聚合方面,教育領域分學段管理的業務模式導致了數據的分散、數據標準規范不一、數據質量參差不齊、數據關聯關系不完整,而教育數據應用服務要求提供關于學生、教師、學校等教育主體對象的完整、統一、高質量的數據體系的問題。針對這一問題,本文提出在教育數據匯聚整合過程中,應建立以數據產品加工為牽引的源端和數據使用方聯合治理工作模式。首先,引入數據產品加工業務環節,明確數據產品加工的主責業務部門,厘清該部門同源端數據提供方和數據使用方的職責關系,為數據治理提供組織保障。其次,建立健全數據產品加工工作流程,為數據治理的常態化、規范化開展提供流程保障。此外,建立數據產品底層數據模型,該模型應以學校、學生、教師三類教育主體對象為中心對數據進行集成,為不同來源的數據集成整合提供模型指導。
二是在數據應用方面,教育大數據平臺普遍由信息部門牽頭建設,而業務系統往往由業務部門牽頭,信息部門和業務部門缺乏業務紐帶,教育大數據平臺和業務系統缺乏聯動機制,導致教育大數據平臺建設需求牽引不夠、應用程度不深、實際獲得感不高。針對大數據平臺和業務系統缺乏聯動的問題,本文提出了“基景聯動”系統架構,將教育大數據平臺定位為區域教育信息化的“數據地基”,將教育教學和教育管理服務的應用需求凝練為“數據場景”,圍繞數據場景,整合數據、系統功能、流程、人員,全方位支撐應用需求,解決傳統多部門協作中缺乏聯動的問題;并基于“全息關聯”數據產品模型,按照 “基景聯動”架構,提出了“1庫6系統N場景”的區域教育大數據平臺總體設計。
上述基于數據產品的治理模型和總體架構在北京市教育大數據平臺建設中進行了應用,支撐了體質健康、學位預測、加工能力評價、教育督導、“雙減”等應用場景,構建了以數據產品為牽引的數據治理模式、以主體對象為中心的“全息關聯”數據產品模型和以應用場景為牽引的“基景聯動”大數據平臺架構,有效支撐了教育系統數據聚合和數據應用。
“全息關聯”數據產品模型
1.數據產品加工流程
在傳統大數據平臺建設過程中,往往通過數據共享交換平臺將不同來源數據進行匯聚,然后將匯聚的數據對外服務,但由于教育系統的分學段管理現狀,直接將匯聚的數據對外服務,會由于數據缺乏關聯,導致應用效果受限,影響數據價值發揮。針對這一情況,本文提出在教育大數據建設過程中,應引入數據產品加工流程,通過產品加工流程,將多源數據的清洗、質檢、關聯、融合等工作進行規范化管理,并建立相關的業務流程和技術規范,從業務和技術上,保障教育數據融合的規范化和常態化開展。
2.數據產品基礎模型
業務系統數據的組織往往是圍繞業務工作進行的,如體質健康監測數據往往是以活動為基礎進行組織,督導工作是以年度督導任務和指標進行組織。但從數據利用的角度看,往往需要圍繞某個學校、學生、教師來獲取數據。綜合研究不同數據組織模式,本文提出圍繞學生、學校、教師等對象構建“全息關聯”數據產品模型。
“全息關聯”數據產品模型是圍繞學生、學校、教師,將不同來源的數據進行整合關聯,從而形成一個有機集成的數據體系。教育全息關聯數據模型包括主體自然屬性、主體社會屬性和主體業務活動信息三個層次(圖1)。
在每個層次內,教育數據分為多個數據集,其中的主體自然屬性層,包括了學生主體自然屬性數據集、學校主體自然屬性數據集、教師主體自然屬性數據集等。
在主體社會屬性層內,包含了不同主體不同學段的社會屬性數據集。其中對學生主體,包括了學前幼兒擴展信息數據集、中小學學生擴展信息數據集、中職學生擴展信息數據集、高校學生擴展信息數據集等;對學校主體,包括了幼兒園擴展信息數據集、中小學擴展信息數據集、中職學校擴展信息數據集、高校擴展信息數據集等;對教師主體,包括了幼兒園教職工擴展信息數據集、中小學教師擴展信息數據集、高校教職工擴展信息數據集。
在主體業務活動層內,包含了不同主體在不同學段、不同業務工作中產生的各類數據集,如學前幼兒的入園信息數據集、幼兒園畢業離園信息數據集等。
3.數據產品加工的重點問題
在教育數據產品加工過程中,基礎是建立學校、學生、教師三類主體數據,并實現持續更新。由于在實際工作中,分學段管理往往會導致學生、學校、教師數據的重復和沖突,因此在構建上述三類主體數據時,應遵循以下原則。
(1)“一數一源”原則。梳理明確每個學段、每類主體數據的來源,應梳理到數據要素(字段),確定每類數據的每個要素的權威來源系統,此過程為數據“確權”過程。
(2)建立每個主體數據全局唯一標識符。在教育數據體系內,核心是學校、學生、教師,為實現各類業務數據的全息關聯,必須建立上述三類主體的全局唯一標識符。
(3)建立主體數據的增量更新機制。由于在業務系統中,主體的數據是隨著業務工作動態變化的,因此要建立業務系統數據變化和產品數據動態更新的聯動機制。
(4)建立數據產品加工的質檢規則。數據產品的定位之一,是解決原始不同來源業務系統的質量問題。只有保障了產品數據的質量,才能讓使用者放心地使用數據產品。
基于“基景聯動”架構的教育大數據平臺總體框架設計
“全息關聯”數據產品模型為解決多源教育數據整合集成和一體化服務問題提供了底層模型,使得各類應用系統在使用數據時,一站式快速獲取成套高質量的數據資源,降低了業務系統使用教育數據的難度。但同時,教育大數據價值的發揮,并非單是數據問題,在整合數據基礎之上,需要多部門的配合,需要將數據要素、人員要素、系統要素、流程要素全部整合起來,才能真正發揮數據的價值。如果只是研發一個大數據平臺,而不能發揮業務部門積極性,不能將平臺功能和數據嵌入到業務工作中,大數據的價值往往難以充分發揮。這就要求在設計教育大數據平臺架構的時候,要從應用的角度進行設計,將各類應用場景納入考慮,并作為需求牽引。
1.設計原則
(1)以“全息關聯”數據為基礎。教育大數據平臺的建設,數據是基礎,必須要將數據產品作為其核心,建立原始業務庫、匯聚庫、產品庫、分析庫和服務庫,通過多庫并用,能夠保留不同來源不同數據的原貌,可以根據具體需求對產品數據進行溯源分析。
(2)以“數據賦能+工具賦能+通道賦能”為基本定位。教育大數據平臺的建立,不是要取代現有業務系統,而是要為業務系統進行賦能。通過數據賦能,解決業務系統獲取數據難、整合數據難的痛點問題;通過工具賦能,降低業務系統的建設成本;通過通道賦能,發揮大數據平臺同各個系統的數據和業務流程通道的作用,實現不同業務系統之間數據和流程的快速打通。
(3)以“數據場景”為需求牽引。教育大數據平臺的作用發揮,核心是要融入到教育教學和教育管理過程中。為更好地支撐場景應用,教育大數據平臺的設計和應用,應圍繞場景開展。
2.總體設計
根據上述原則,按照數據基礎、平臺基礎和應用場景聯動(基景聯動)的思路,本文提出了以下區域教育大數據平臺“1庫6系統N場景”的總體設計思路(圖2)。
(1)以“全息關聯”數據為基礎的大數據數據庫群(1庫)。“1庫”是教育大數據資源庫群,是以“全息關聯”產品數據為核心的數據庫群,其中包括了信息資源目錄、匯聚庫、成果庫、分析庫、服務庫五部分。
(2)支撐數據、工具、通道賦能的“6系統”。為提升數據賦能能力,大數據平臺應包含數據資源管理(包括治理)系統、數據資源服務系統;在工具賦能方面,應提供數據分析系統,集成各類數據治理工具、報表引擎、數據加解密工具、多維分析引擎、數據分析模型庫、數據可視化工具等;在通道賦能方面,應建立數據匯聚共享系統,快速打通不同業務系統的數據和業務流程。此外,為增強數據管理能力,應提供數據運維管理系統、安全管理系統,保障數據運維工作的規范開展和數據安全。
(3)以應用需求為牽引的“N場景”。在系統梳理教育領域應用需求的基礎上,本文提出了區域教育大數據建設應圍繞教(課堂教育)、學(在線學習)、管(教育管理)、研(教師研修)、育(全面育人)、評(教育評價)等六大工作構建應用場景,如可以開展學位預測、教學質量評估、學生流向分析、教師隊伍評價、體質健康監測等。
3.建設及應用實踐
基于上述“全息關聯”教育數據模型和“基景聯動”教育大數據平臺總體框架,我們建設了北京市教育大數據平臺。在建設過程中,圍繞定標準、匯數據、建系統、做產品、推應用五方面開展建設。在標準規范編制方面,先行編制了《北京市教育大數據匯聚技術規范》《教育數據資源管理辦法》;業務數據匯聚方面,分批次推進各個處室、各直屬單位、各區、各委辦局的數據匯聚共享,構建完整的教育大數據平臺,并建立數據動態交換和更新機制,確保了數據的鮮活性;在大數據平臺建設方面,完成1庫6系統建設;在數據產品加工方面,圍繞學生、學校、教師三大主體,開展產品加工,構建三套全息數據產品。
在上述工作基礎上,北京市教委積極推進場景應用,構建了學生流向分析、教師隊伍評價、中小學辦學質量評估、教育系統疫情防控、體質健康監測分析、教育督導、教育審計、“雙減”工作效果分析等應用場景。
(1)在學生流向分析場景中,北京市通過綜合調研,提取出跨業務處室的學生流向分析場景需求,圍繞場景需求,整合數據、系統、人員和流程要素,建立覆蓋幼兒園、小學、初中、高中、本科、研究生、就業后各個階段的全息檔案數據產品。基于此數據產品,開展了學生流向分析,可以對每個學校、每個學生的流向進行追蹤,支撐從宏觀和微觀層面分析學生的流動情況,為學校資源均衡配置、專業設置、就學政策調整效果評估提供全面客觀的數據支撐。
(2)在教師隊伍評價場景中,整合教師基本信息、教師培訓、職稱評審、教師獎勵、教師輪崗交流、教師聘任等各類信息,構建教師全息檔案;繼而整合學校辦學能力、學校教師隊伍編制配比、教育事業統計數據;開展北京市教師隊伍整體評價,從教師隊伍總量、年齡結構、學歷構成、教師流動、教師編制超標情況等方面開展分析,為北京市教師隊伍建設與優化提供數據支撐。
(3)在學校辦學質量評價場景中,整合學校基礎數據、學生學籍數據、學生中高考成績等各類數據。依托大數據平臺模型庫,構建學校辦學質量評價分析模型,設計學校加工能力指數算法,對不同分數段的學生在各個學校的提升情況進行量化分析,通過大數據量化評價學校對學生的加工能力,為學校辦學質量評價提供數據支撐。
(4)在教育系統疫情防控場景中,基于教育大數據平臺底層數據產品,為教育管理部門提供統一的基礎數據。通過教育大數據平臺快速建立同國家政務服務平臺、北京市大數據平臺、各高校的信息聯系通道,實現疫情防控數據的快速自動比對服務,并將比對結果關聯至學生和教師全息檔案,繼而基于比對數據和大數據分析模型,動態評估不同學校風險級別,根據評估結果,動態調整防控策略。
(5)在教育審計、教育督導等場景中,教育大數據平臺一方面為各個業務系統提供及時更新的學校、學生、教師基礎數據產品,另一方面,建立了業務數據同教育大數據平臺的動態更新機制。同時,教育審計、教育督導等業務系統共性功能由教育大數據平臺進行功能賦能,實現業務系統建設從傳統獨立建設的模式向基于大數據平臺底座的模式轉變。
基于“全息關聯”教育數據模型和“基景聯動”的北京教育大數據平臺的建設和應用,解決了底賬不清、“數據煙囪”、重復采集、口徑不一等系列痛點問題。這標志著北京教育信息化建設進入了一個新的階段。以“數據為基”的教育數字化建設模式得以確立,也標志著北京教育信息化具備了為教育管理和業務模式變革賦能的基礎技術能力。
下一步,北京市將繼續推動大數據在教育督導、校園安全管理、教師職稱評審等工作中的應用,以數據共享促進教育管理業務流程優化再造。推動大數據在學生體質健康監測、學生流向分析、政務服務監督、民辦教育綜合監管、“雙減”工作監測中的應用,以大數據分析推動教育監測模式變革。開展大數據在教育教學質量評價領域試點,探索建立以大數據模型評價為支撐的量化評價新模式。推動大數據在教育資源空間布局、學位預測、職業教育、高等教育和科研管理等領域的應用,以大數據支持教育決策模式創新。
總結與展望
本文針對區域層面整體推進教育大數據的建設和應用中面臨的教育領域分學段管理的業務模式導致的數據分散、數據標準規范不一、數據質量參差不齊等問題,以及教育大數據平臺和業務系統缺乏聯動機制的挑戰,提出在教育大數據建設過程中,應建立基于數據產品理念的數據治理模式,使數據質量從業務環節上得到保障;提出面向應用服務的“全息關聯”數據產品模型,以解決數據關聯程度不高的問題。針對大數據平臺和業務系統缺乏聯動的問題,提出了“基景聯動”系統架構,將教育大數據平臺和業務場景一體化設計,解決傳統的多部門協作面臨的問題。
本文提出的以數據產品為牽引的數據治理模式、以主體對象為中心的“全息關聯”數據產品模型和以應用場景為牽引的“基景聯動”大數據平臺架構可有效支撐教育系統數據聚合和數據應用,提升大數據在不同應用場景的服務能力,推動教育大數據的深入應用和數字化轉型工作的開展。
當前,各類基于大數據的分層教學、精準輔導、個性化診斷、“人工智能+作業”、教師隊伍評價、學位預測、教育評價改革等方面應用日益豐富。展望未來,教育大數據仍然將對教育教學和教育工作改革創新持續產生支撐和推動作用,未來的教育工作必定是以大數據為支撐的數字教育。
教育大數據工作是一個不斷深入的過程,在區域教育大數據平臺建設中,需要持續開展數據治理,不斷提升教育數據質量;需要深入挖掘需求,圍繞需求,反推數據匯聚和質檢及清洗工作。在教育大數據建設中,還涉及大量的學生和教師個人隱私數據,在后續工作中要重點關注數據分級分類管理和數據加密存儲,確保數據安全。
參考文獻
常桐善. 高等教育大數據建設路徑:美國的經驗及其對中國的啟示[J]. 重慶高教研究,2022(4).
宋丹,豐霞,何宏,王寧. 知識圖譜與教育大數據協同驅動的自適應學習模式研究[J]. 高等工程教育研究,2022(1).
柴喚友,劉三女牙,康令云,張雅嫻,李卿,劉智. 教育大數據采集機制與關鍵技術研究[J]. 大數據,2020(6).
毛剛,周躍良,何文濤. 教育大數據背景下教學評價理論發展的路向[J]. 電化教育研究,2020(10).
蔣鑫,洪明. 國際教育大數據研究的熱點、前沿和趨勢:基于WOS數據庫的量化分析[J]. 中國遠程教育,2019(2).
陳德鑫,占袁圓,楊兵. 深度學習技術在教育大數據挖掘領域的應用分析[J]. 電化教育研究,2019(2).
編" "輯:馮安華