

摘要:本文從高校大數據應用場景規劃出發,提出了以創新融合應用驅動高校大數據治理策略,構建了教育大數據治理平臺的整體框架,設計了六個跨業務、跨部門和跨層級的大數據融合應用場景,并通過建立跨部門協同的組織架構,探索數據治理建設路徑,以此來提升高校科學決策能力,推進教育現代化發展。
關鍵詞:教育大數據;數據治理;創新應用;治理框架;組織架構
近年來,國內很多高校已經開展了教育大數據治理工作,在促進教育數據共建共享、解決信息孤島問題等方面發揮了重要作用。[1]研究表明,數據治理不僅能夠提高教育數據質量,解決學校各業務系統的數據共享和融合發展等問題,更是全面提升協同育人、教師發展、學科建設、教學變革、領導決策等專題域的管理決策效能的基礎。[2-3]
高校數據治理是一個長期、復雜的系統工程[4],在實施過程中仍然存在諸多問題,如數據質量差、數據標準不統一、數據權責不清、數據缺乏全生命周期管理等。[5]解決此類問題需要從高校業務需求和管理體制機制上建設數據治理平臺。通過建立學校統一的數據湖及應用平臺,提供數據匯聚、存儲、治理、分析、服務、共享、應用和運管能力,夯實學校大數據智能化、運行管理智能化、業務作業智能化、教育管理智能化的應用基礎支撐能力,構建跨業務、跨部門和跨層級的融合應用場景,形成企業“數智化”運行的智能中樞,實現運行狀態的實時監測,運行數據的輔助決策、指標的智能預警預測,關鍵問題的智慧決策,打造學校運行管理閉環與智慧化決策能力。教育數據治理工作需要全景規劃大數據融合創新應用需求,堅持“以用促建”,以創新應用為驅動,促進數據治理建設,發揮數據資產價值,推動管理決策由經驗向科學的變革。
高校教育數據治理框架
高校教育數據來源于多個部門,屬于多源異構的數據場景。數據治理需要各部門多方協作才能進行。因此,需要深入挖掘業務部門的應用需求,激勵各業務部門深度參與數據治理工作,從數據的管控模式轉變為數據的共建共享模式。數據治理涉及數據標準、數據存儲、數據治理、數據安全、數據服務以及數據應用等多方面內容,建立符合高校現狀和需求的數據治理體系架構,能夠有效推動高校數據治理工作的開展。基于此,筆者構建了面向數據全生命周期的高校數據治理框架,如下頁圖1所示。
1.數據源
教育大數據平臺匯聚了來源多樣、類型繁雜、體量巨大的數據。按數據的來源可以將數據分為業務系統數據、物聯網數據、API數據、電子表格數據、日志數據、互聯網數據、文檔資料等數據類型。按照數據的結構化程度,可將數據分為結構化數據、半結構化數據和非結構化數據。結構化數據包括業務系統數據、電子表格數據、API數據及物聯網數據;半結構化數據包括文檔資料和部分互聯網數據;非結構化數據包括部分互聯網數據和日志文件數據。
2.數據存儲計算
數據存儲計算平臺主要包含數據倉儲的建設、數據檢索,以及數據融合計算等,以Hadoop數據倉庫作為存儲工具構建海量可擴展的存儲倉庫作為存儲介質,提供分布式、高并發性的海量存儲數據存儲、訪問、管理及檢索,并提供多種計算框架滿足實時計算、深度學習、圖計算分析等復雜數據處理場景。
3.數據治理
數據治理貫穿元數據管理、數據標準化、數據質量管理、主數據管理、數據資產、數據安全、數據生命周期等從源端到數據中心再到服務端的全過程管理,通過數據治理,實現對數據資產的梳理和數據質量的管控。數據治理平臺提供數據標準的統一管理,實現數據資源與標準的綁定。
4.AI中心
大數據應用依賴算法服務平臺,需要建立一套完整的算法研發和優化機制。AI中心將人工智能技術模塊化、組件化、可插拔化,實現人工智能能力的高效率生產和集中化管理,并向業務系統輸出服務,實現智能化應用。AI中心實現算法快速開發、共享復用和高效部署管理,為高校部門融合應用提供服務,通過算法賦能提供決策支撐。
5.數據服務
數據服務從數據資源中心獲取數據資產,依據各業務數據需求將數據資產封裝成為相應服務,通過API提供給上層應用。數據服務為教育數據向教育應用的轉變提供關鍵支撐,具體包括指標服務、標簽服務、知識圖譜服務、數據檢索服務以及數據沙箱服務等。
6.數據應用
數據治理采取“以用促建”方式,拉動數據供應鏈條各個節點參與。圍繞高校教學、科研、人事、學科、服務和監測等主要場景,規劃設計包括協同育人、師生畫像、教學評估、學科發展、師生服務、校情監測、風險預測、績效考核等跨部門融合創新應用,推動信息系統深度整合。
高校教育數據的創新應用需求
圍繞高校主要應用場景,筆者設計了六個跨業務、跨部門和跨層級的數據應用系統。通過瞄準教育大數據應用需求倒逼數據治理工作,可以先選擇一到兩個業務應用場景的閉環快速搭建起數據治理的各種能力,再按照全景規劃依次迭代,逐步實現全局大數據的治理。
1.拔尖創新人才與協同育人
針對學生精準分類、精準服務及協同精準育人等人才培養過程中的難點問題,筆者設計了面向學生培養的綜合服務系統(如下頁圖2)。其主要功能是匯聚學生在學校中的各類信息數據,提供統一化的數據匯集分析功能,如根據學生在校的行為數據分析學生的學習、生活等基本情況,實現學生畫像、學生分類、精準獎助貸、異常預警以及多維教育評價等功能,助力“三全育人”,驅動人才培養模式改革。
2.教師發展與高層次人才培育
高校普遍存在教師耗費大量時間重復填寫各類表格、教學科研以及相關成果數據收集困難等問題,因此,開發教師發展與高層次人才培育大數據應用系統,可完善教師發展與培育機制以及促進師資隊伍高質量發展。該應用提供教師畫像、教師教學學科科研成果匯總、教師個人發展數據統計分析等功能,能極大減輕教師工作負擔,完善教師發展與培育機制。同時,基于大數據技術分析出教師的發展趨勢以及未來走向,挖掘出相關學科領域的高層次創新人才,進行重點精準培育,促進師資隊伍高質量發展。
3.學科動態監測與評估
該應用實現學科動態發展監測和學科資源全局優化配置與管理,解決學科評估中實時跟蹤評估結果難,采集數據難,以評促建、以評促改難落地等問題。其主要功能是構建學科動態評估指標,數據填報線上化、自動化,自動生成學科評估報表,完成多維評估分析,實現學科規劃與發展分析、學科前沿熱點趨勢分析以及學科發展的實時動態監測。
4.教學動態監測與評估
教學發展動態監測與評估應用可以實現教學運行關鍵業務指標實時監測、關鍵業務指標達成度分析、關鍵指標數據的多維度分析、數據填報自動化、數據多維分析及預測等功能。該大數據應用是教學質量動態監測和精準預測,以及教學管理決策科學性的重要支撐。
5.師生一站式服務
多端統一是提高師生業務辦理效率、提升師生服務體驗的基本途徑。一站式服務系統可以實現一入口訪問、一賬號登錄,部門業務一鍵搜索、一鍵辦理、一鍵審批,一網多辦、一網通辦等功能集成,從而解決跨部門業務辦理煩瑣,服務周轉成本高,服務質量低、時效慢等問題。
6.學校校情綜合監測
校情監測主要面向學校管理決策,提高對教學質量、學科發展、科研成果、學院建設情況的主動式監管能力,加強對校情輿情的動態監管[6],解決各學院發展數據匯聚難、教學與科研數據時效性低、校情輿情被動式監管等難題。其主要功能包括教學質量統計分析、學院建設情況統計分析、科研發展匯總預測、校區動態監測一張圖、沙盤演練輔助決策圖等。
構建跨部門協同的校級數據治理組織結構
為了讓各部門積極參與到數據治理工作中,實現數據的共建共享與自治,筆者所在學校構建了跨部門協同建設的校級數據治理組織結構,該組織結構分為決策層、管理層和執行層,強化了數據的管理制度和流程,充分提高了各部門業務人員的參與度。通過建立健全的管理體制,保障數據治理得到長期穩定的發展。
①決策層。網絡安全和信息化領導小組是教育大數據建設的決策層,由分管信息化副校長負責。數據治理委員會建議由數據使用和數據分析相關的部門負責人組成。決策層負責領導和組織數據治理專項工作,確定指導思想、目標和任務,審議數據治理實施方案及總體規劃,協調解決數據管理中相關的重大問題。
②管理層。數據治理管理小組是教育數據治理的管理層,由數據管理辦公室和各業務部門管理小組組成。各業務部門管理小組由各部門負責信息化的領導組成。管理層負責建立學校數據治理的完整體系、實施計劃、管理細則、技術細則以及編制管理規范。管理層需要定期召開數據治理管理例會,提升數據能力建設和數據質量管理水平,建立起數據治理的長效機制。
③執行層。執行層主要由學校各二級部門組成,是數據治理的主體單位,執行層在管理層的統籌安排下,定期召開數據治理執行例會,具體執行各項數據治理工作,推動數據治理各項流程與日常工作相結合。執行層深度參與數據治理工作,極大地調動了二級部門工作積極性。
高校數據治理的建設路徑
高校教育數據治理按照“整體規劃、分步實施、標準引領、應用驅動、融合創新、體驗優先”的總體思路,統一全校信息的數據標準,以標準為引領實現數據收集治理,以創新融合應用為驅動,深度挖掘信息以促進教育發展,以提高師生服務體驗為先導,建立以師生為中心的服務管理模式。
1.設立專業化的數據治理管理團隊
設立專業的數據治理管理團隊,從數據標準、監管數據質量、保障數據安全、規范應用開發、共享交換秩序及系統的運行與維護方面加強教育數據管理工作,制訂數據管理制度,明確和規范數據管理組織體系和維護方法,保障數據標準的統一管理和應用。
2.建立統一數據標準
統一的數據標準是數據資源融合共享的前提和基礎。綜合各部門業務系統現狀,以國標、教育部標準及校標為依據,遵循唯一性、合理性、可擴展性、簡單性、規范性、適用性等原則,制訂符合高校需求的統一數據標準。
3.構建數據管控體系
落實數據標準和管理體系,實現數據統一和規范管理。建立健全數據管控體系,實現對數據從發布到應用、維護的全生命周期管控。加強對數據質量的管控,在制度、組織、管理流程、人力資源等各個方面給予支持。
4.制訂數據共享服務策略
數據共享服務是教育創新融合應用的關鍵支撐,可實現數據資產的價值。通過細化完善各部門數據共享制度(包括數據授權許可制度、數據安全保密管理制度、數據交換安全管理制度),規范數據實時共享的策略,以保證數據的安全性和有效性。
5.推進技術開發融合應用
建立大數據平臺的AI中心,支持算法和可視化建模與交互式環境代碼編寫,支持PyTorch、Python、LightGBM等多種大數據計算框架,可以幫助開發人員高效分析數據和算法訓練。AI中心促進了大數據與其他智能技術的融合,為大數據應用提供技術支持,提升業務系統的響應能力和速度,減少重復計算。
結語
數據作為學校的核心數據資產,是實現高校數字化轉型的重要基礎。教育大數據發展不僅需要從技術角度實現數據的采集、存儲、交換和應用,更需要面向高校應用需求驅動數據治理,促進大數據技術與高校教育改革深度融合創新。
參考文獻:
[1]張培,夏海鷹.教育領域數據治理的基本思路與實踐路徑[J].現代教育技術,2020,30(05):19-25.
[2]金玉梅,陳航.教育大數據挖掘的價值定位、現實限制與有效策略[J].教育理論與實踐,2021,41(19):3-8.
[3]孟冬冬,張毅巍,才亞楠.大數據對高等教育的影響及應對策略[J].黑龍江高教研究,2020,38(01):34-37.
[4]周煒.大數據視域下高校數據治理優化路徑研究[J].教育發展研究,2021,41(09):78-84.
[5]黃有福,黃中偉.基于業務驅動的高校數據治理應用研究[J].中國教育信息化,2022,28(02):111-116.
[6]沈霄,王秀成,杜忠鋒.網絡輿情監測與高校穩定對策建議——以云南為例[J].中國成人教育,2015(08):57-59.
作者簡介:徐玲(1975—),安徽廬江人,重慶大學副教授、博士,碩士生導師,主要從事智能化軟件工程研究;黃晟(1988—),浙江金華人,重慶大學副教授,博士生導師,主要從事計算機視覺研究。