吳 砥 饒景陽 吳 晨
[1. 華中師范大學 教育部教育信息化戰略研究基地(華中),武漢 430079;2. 華中師范大學 湖北教育信息化發展研究中心,武漢 430079;3. 華中師范大學 國家數字化學習工程技術研究中心,武漢 430079]
教育大數據作為大數據技術在教育領域深度融合應用的產物,具有體量大(Volume)、類型多(Variety)(Beyer,2011)、處理快(Velocity)的傳統 “3V”特性,以及得益于成熟教育管理體制和教育領域高準入門檻所獨具的數據高真實性(Veracity)(Goes, 2014)和高價值性(Value)的新型“2V”特性。作為教育創新的重要推手,教育大數據有助于實現教學過程分析支撐下的差異化教學、個性化學習、精準化管理、精細化科研和過程化評價,對于實現真正意義的因材施教,提高教育研究和決策水平具有重要作用。然而,教育大數據支撐下的新型教學模式的多元化發展,使得教育主客體關系、教育過程和教育數據結構更復雜,教育系統數據互通低效、協同困難和拓展受限等諸多問題亟待解決。教育大數據的標準化對于解決上述問題具有基礎性和引領性作用,對于規范教育信息化產業發展也具有現實意義。《教育信息化2.0行動計劃》明確要求“發布系列技術和功能標準規范,探索資源共享新機制,提升數字教育資源服務供給能力”“完善教育數據標準規范,促進政務數據分級分層有效共享”。因此,教育大數據標準體系的研制將進一步豐富各類教學模式中可采集教育數據的維度和種類,規范教育數據模型構建,打破教育平臺數據交換壁壘,加速數據共建共享,為推進我國教育大數據的標準化提供框架參考和內容規范。
世界各國都非常重視大數據技術在教育領域的應用,積極引導大數據技術與教育領域的深度融合,出臺了一批具有影響力的教育大數據政策和規劃。美國的教育大數據技術研究、標準建設、系統開發和實踐應用等處于領先地位。2012年10月,美國政府發布《通過教育數據挖掘和學習分析促進教與學》①報告,明確教育大數據的價值在于實現個性化教學和提升教育研究與決策水平,并基于教育數據挖掘與學習分析的典型案例提出實施建議,指導教育大數據驅動下的教學系統變革。2016年5月,美國政府發布《聯邦大數據研發戰略計劃》,提出構建數據驅動的戰略體系,為教育大數據的發展提供頂層規劃。歐洲和亞太地區的發達國家也積極建設教育大數據研究機構,發布了一系列相關政策。例如,2012年4月,英國成立全球首個開放式數據研究所(The Open Data Institute, 簡稱ODI);同年10月,英國發布《把握數據帶來的機遇:英國數據能力戰略》②,對英國數據能力進行系統研究,提出通過教育大數據優化課程和專業研究,助力高技術人才隊伍建設。2014年,德國在柏林和德累斯頓成立兩大數據研究中心,為教育大數據挖掘和信息安全提供技術支持。2015年8月,新加坡發布《2025年資訊通信媒體發展藍圖》③,提出基于大數據及學習分析技術推進教育教學改革的發展目標。
我國政府高度重視教育大數據發展。2015年8月,國務院印發《促進大數據發展行動綱要》,明確指出“完善教育管理公共服務平臺,推動教育基礎數據的伴隨式收集和全國互通共享”。2016年6月,教育部發布的《教育信息化“十三五”規劃》強調,要積極發揮教育大數據在教育管理平臺建設和學習空間等方面的重要作用,促進大數據與教育的深度融合。2017年1月,國家發展和改革委員會批復組建教育大數據應用技術國家工程實驗室。2018年2月,教育部頒發的《2018年教育信息化和網絡安全工作要點》明確提出,推動大數據技術在教育教學中的深入應用,提高教育大數據的收集、分析、研判能力。2018年4月,教育部發布的《教育信息化2.0行動計劃》明確提出,“利用大數據技術采集、匯聚互聯網上豐富的教學、科研、文化資源,為各級各類學校和全體學習者提供海量、適切的學習資源服務”“全面提高利用大數據支撐保障教育管理、決策和公共服務的能力,實現教育政務信息系統全面整合和政務信息資源開放共享”。在政策引導下,我國教育大數據產業迅速發展。2018年9月,工業和信息化部信息化和軟件服務業司公示“2018年大數據產業發展試點示范項目名單”,涵蓋面向智慧教育的大數據分析平臺建設與應用、江西省高考“選志愿”平臺等多項教育大數據相關的試點項目。2018年底,我國建成國家政府數據統一開放平臺,推動包括教育基礎數據的科學共享與開放。我國互聯網企業也爭相布局教育大數據產業,為教育場景打造了豐富的產品線,包括百度教育大腦3.0、K12云端一體教育大數據解決方案等,助力教育大數據生態建設。
1. ISO / IEC JTC 1 SC32 WG9標準
教育大數據相關技術規范和標準研究引起了廣泛的國際關注,成為國際標準化組織及研究機構的研究熱點。國際標準化組織和國際電工委員會第一聯合技術委員會(ISO/IEC JTC 1)下屬多個小組委員會(Sub-Committee,簡稱SC)參與了大數據相關工作,并圍繞各自重點開展了不同角度的研究項目,例如SC24重點關注大數據可視化新方法,SC27研究解決大數據安全和隱私問題等④。
2014年11月,JTC 1下屬數據管理與交換標準化小組委員會(SC32-Data Management and Interchange)成立第九工作組(WG9),致力于大數據基礎性國際標準研究(光亮等,2017)。截至2019年10月,JTC 1匯聚了16個參與國以及25個觀察國⑤,制定了包括定義大數據基本概念和重要術語的大數據概述和術語標準(ISO/IEC 20546),以及包括用戶視圖和功能視圖的大數據參考架構標準(ISO/IEC 20547-3),其大數據分析框架如圖 1所示⑥,為教育大數據的標準化工作提供了重要參考。

圖1 ISO/IEC JTC1/SC32/WG9工作組大數據分析框架
2. 國際電信聯盟ITU-T Y.3600標準
國際電信聯盟(International Telecommunication Union, 簡稱ITU)⑦2013年11月發布的關于大數據的技術報告⑧,重點關注高吞吐量、低延遲、安全、靈活和可擴展的網絡基礎設施、聚合數據集與匿名化、網絡數據分析、縱向平臺互操作、多媒體分析和開放數據等。在ITU范圍內,大數據標準主要由ITU電信標準化部門(ITU-T)發起和推進,有10個相關研究組。其中,最活躍的是第13學習研究組(Study Group 13),其研究主題聚焦包含移動和下一代網絡(NGN)在內的未來網絡。2015年11月,ITU-T發布《大數據——基于云計算的需求與能力標準》(ITU-T Y.3600),詳細規定了以云計算為基礎的大數據要求、能力和使用案例,并設計了大數據情境模式(見圖2)⑨。

圖2 ITU-T Y.3600標準的大數據情境模式
2018年5月,ITU-T學習研究組SG13發布《大數據——數據交換的框架和要求》標準(ITU-T Y.3601)⑩,基于交換數據源與數據目的之間多種不同類型和格式的數據,描述大數據生態系統的數據交換框架。此外,SG13還在研制《大數據——數據集成的概述和功能需求》和《大數據——元數據框架與概念模型》等大數據相關標準。除了SG13,關注多媒體編碼、系統和應用的ITU-T SG16 發布了《公共數據傳輸業務的服務和操作原則》(ITU-T F.600),并在2018年7月召開的全會上立項了《數據資產管理框架》(ITU-T F.FDAM)和《大數據基礎設施評測框架》(ITU-T F.AFBDI)。該標準主要定義了數據資產的基本概念,提出了數據資產管理和大數據基礎設施評測框架。同時,關注通信安全的ITU-T SG17發布了包括《移動互聯網服務中的大數據分析安全要求和框架》在內的多個大數據安全國際標準。
3. NBD-PWG 大數據互操作性框架標準
美國國家標準及技術研究所(National Institute of Standards and Technology, 簡稱NIST)為響應美國白宮提出的大數據研究國家戰略,同時為滿足市場需求,于2013年6月成立大數據工作組(NIST Big Data Public Working Group, 簡稱NBD-PWG)。NBD-PWG的重點是聯合工業界、學術界和政府,形成大數據的定義、術語、安全參考體系結構和技術路線圖,NIST大數據參考框架如圖3所示。

圖3 NIST大數據參考框架
NBD-PWG具體分為5個子工作組,包括用戶案例和需求組、定義和索引組、參考框架組、數據安全和隱私組以及技術路線組。NBD-PWG的主要成果是形成了基于共識的可擴展大數據互操作性框架(NIST Big Data Interoperability Framework, 簡稱NBDIF),該框架分三個層次:一是大數據參考架構關鍵組件層,內容包括大數據定義、大數據分類法、大數據安全和隱私要求、大數據架構白皮書調查、大數據參考架構、大數據安全和隱私參考架構等;二是大數據參考框架組件之間的通用接口層;三是利用通用接口,構建驗證大數據參考框架的應用層。
在通用大數據標準研制方面,我國一方面積極參與國際標準組織關于ISO/IEC 20546《大數據——概述和術語》和ISO/IEC 20547-3《大數據參考架構——第三部分:參考架構》兩項大數據標準的研制工作。另一方面,我國于2014年成立全國信息技術標準化技術委員會大數據標準工作組,開展包括《信息技術大數據技術參考模型》《信息技術大數據術語》等在內的十多項國家大數據相關技術標準的研制。
在教育大數據標準研制方面,全國信息技術標準化技術委員會教育技術分技術委員會(China E-Learning Technology Standardization Committee, 簡稱CELTSC)于2017年成立教育大數據標準工作組,推進教育大數據標準的研制,目前已有包括《教育大數據標準框架》《教育大數據接口服務規范》《教育行為數據框架、模型與元數據》《教育大數據存儲服務規范》《課堂教學行為編碼規范》《學習者畫像》《教師畫像》《學校畫像》等在內的13項教育大數據標準在研項目。
總體而言,國內外教育大數據相關標準的研制各有側重、相對獨立,均圍繞特定研究對象和研究目標展開,標準技術屬性強而教育屬性偏弱。隨著信息技術與教育的深度融合,教育大數據應用場景不斷豐富,教育物聯網環境下教育數據采集手段不斷增強,亟待重構對教育大數據標準體系的宏觀認識和頂層設計。
1. 國家教育信息化發展戰略需要
我國政府近年出臺了一系列教育大數據標準化相關政策文件,引領教育數據共建共享。2018年4月,教育部發布的《教育信息化2.0行動計劃》明確要求,規范教育資源數據和教育管理數據的數據采集和挖掘流程。2018年11月,教育部印發的《關于完善教育標準化工作的指導意見》明確提出,研制教育信息化數據標準,支撐我國教育現代化事業高質量發展。因此,教育大數據標準體系建設具有明確的國家教育信息化發展戰略需求和政策導向,契合了我國教育現代化發展的總體戰略目標。
2. 教育大數據平臺建設技術需要
信息化教學模式的多元化發展,使得教育過程中主客體關系復雜、數據結構多樣,為教育大數據平臺信息的規范管理帶來了諸多不便。教育大數據平臺信息管理涉及教育過程數據采集、清洗、存儲、處理、建模、分析等眾多關鍵技術環節,各技術環節間相互支持、相互影響并有機結合。然而,教育數據來源的異構性、數據交互的復雜性以及數據展示的多態性等,都對教育數據的過程管理形成挑戰。因此,統籌教育數據全生命周期管理的各項數據標準,統一不同技術環節間的數據交互規范和流程,形成教育大數據標準體系,是實現教育大數據平臺從采集到分析應用各環節無縫聯動的技術需要。
3. 教育主體智能化發展應用需要
教育主體智能化發展為教育大數據標準體系建設提出了多元化的應用需要。《中國教育現代化2035》提出“建設智能化校園,統籌建設一體化智能化教學、管理與服務平臺”。基于教育大數據標準體系,教師教學、學生學習、教育管理和教育服務等過程產生的海量數據將被匯聚到智能教育平臺,實現教育過程數據的伴隨式收集與標準化處理,進而支持面向教師的差異化教學,面向學生的個性化學習,面向教研員和教師的協作化教研,面向教育管理者的精細化管理和面向師生、家長及社會公眾的智能化服務,并有效助推教學、教研、管理和服務的過程化、精準化評價。
教育大數據標準體系框架定義了教育大數據標準體系的層次結構(見圖4),并明確各模塊及內容間的相互關系,使各項標準與規范有機結合。

圖4 教育大數據標準體系框架
1. 基礎類
教育大數據基礎類規范定義教育大數據標準的基礎性、通用性規范,以支持教育大數據標準體系其他標準的復用。其中,術語規范主要明確教育大數據標準體系涉及的術語定義、符號說明和術語解釋;架構規范旨在通過對標準體系整體結構及相互引用關系的描述,提供結構化、易于管理、便于實施且可擴展的標準框架;基礎接口規范旨在為教學、管理和服務平臺之間業務復用提供基礎接口調用與交互規則;綁定規范規定各類教育信息模型XML語言描述語法;實踐指南是指導如何構建和利用教育大數據標準的指導性文件,規定了教育大數據標準體系各項標準的應用領域、使用場景和使用方法。
2. 管理類
教育大數據管理類規范包括數據管理規范、平臺管理規范和過程管理規范。其中,數據管理規范規定了教育數據開放和共享的基本策略,定義開放共享數據的知識領域、敏感程度和開放權限,為數據開放程度定級和元數據結構設計提供參考;平臺管理規范規定了教育大數據平臺有形和無形的運營支撐環境,提高教育大數據平臺運行的兼容性;過程管理規范規定了對教學活動中各重要過程節點的管理,包括定義和管理不同時空尺度的教學過程信息及教學過程間的關聯關系。
3. 數據類
數據類標準是教育大數據標準體系的核心,主要包括教育教學活動的三類主要數據:資源數據、對象數據和行為數據的相關標準:
資源數據類規范定義了各類教育資源的組織方式,包括資源編列規范、資源元數據規范和資源封裝規范。其中,資源編列規范規定了各類教育資源的編碼規則,確保開放共享教育資源標識的唯一性,便于教育數據的大范圍分發和應用;資源元數據規范規定了各類教育資源的描述方法,包括資源數據的描述規則,提高不同教育平臺之間教育資源數據的語義互操作性;資源封裝規范定義了各類教育資源互操作所需要的數據結構以及教育資源統一的包裝規則,支持教育資源在教育平臺之間的傳輸、復制、買賣和分發。
對象數據類規范包括教師畫像、學生畫像和學校畫像。其中,教師畫像規定了教師對象的信息模型和要素,包括教師的基本信息、教學活動組織信息、教學資源創建信息、教學效果評價信息等;學生畫像規定了學生對象的信息模型和要素,包括學生的身份標識、學力定義、學習風格、學習能力、知識掌握程度、學習偏好等;學校畫像規定了學校對象的信息模型和要素,包括學校的基本信息、辦學條件信息、師資力量信息、學生結構信息、辦學水平信息等。
行為數據類規范包括教學行為、學習行為、管理行為和教研行為等數據規范。其中,教學行為數據規范規定有效教學行為的界定方法和特征,并定義各類教學行為的信息模型和數據結構;學習行為數據規范規定學習行為要素、分類和數據模型,定義了學習行為數據記錄框架;管理行為數據規范規定教育管理過程的維度和特征,并定義管理行為數據模型和數據結構;教研行為數據規范規定教研行為的行為要素和分類方法,定義教研行為的數據模型和數據結構。
4. 支撐技術類
教育大數據支撐技術類規范包括數據采集規范、數據建模規范、數據處理規范、數據存儲規范、數據分析規范、數據互操作規范、數據接口規范和數據可視化規范。其中,數據采集規范規定了教育數據的采集類別、采集指標、采集頻率和采集要求等信息;數據建模規范規定了各類教育數據的抽象組織結構,確定數據庫中數據的組織形式等;數據處理規范規定了教育數據錄入、審核、修改、提交和匯總的操作規范;數據存儲規范規定了教育大數據在存儲介質中的存儲與交換方法,對教育大數據存儲的需求及其定義方法、數據格式要求和存儲實現技術等進行了標準化定義;數據分析規范規定了對復雜教育過程逐漸拆分處理的判斷標準和分析范式,以實現對復雜教育過程的深入理解;數據互操作規范規定了不同教育平臺之間以及不同教育環節之間數據交互操作的語法與語義;數據接口規范規定了教育平臺之間業務數據傳輸格式,方便系統平臺之間業務數據的共享與交換;數據可視化規范規定了教育數據可視化的基礎圖形元素和表現形式等,以及定義教育數據可視化設計語言的語法與語義。
5. 應用類
教育大數據應用類規范涵蓋差異化教學、個性化學習、協作化教研、精細化管理、智能化服務和過程化評價六大類應用主題。其中,差異化教學主題類規范規定了教師將時間、精力和教學素材等資源差異化地分配給不同背景、基礎、技能水平和興趣的學生,以期促進學生成長的教學模式標準;個性化學習主題類規范規定了學生依據個體特征(如學習風格與偏好、能力水平和興趣等)、個體需求和個體差異,開展自主學習活動的學習行為標準;協作化教研主題類規范規定了校際間協作參與教學經驗總結、教學問題發現和教學方法研究的教研模式標準;精細化管理主題類規范規定了學校對教育教學各環節制定的制度、規程和評價指標的管理模式標準;智能化服務主題類規范規定了教育系統通過捕捉教育用戶的訪問信息,結合先驗知識,構建需求模型,主動推送優質教育資源的教育服務模式標準;過程化評價主題類規范規定了教學和管理效果的過程化評價模式標準,支撐教育過程的實證分析。
6. 安全類
教育大數據安全類規范包括隱私保護規范、權利保護規范和訪問控制規范。其中,隱私保護規范規定了對教育用戶隱私信息和教育領域敏感數據的保護措施;權利保護規范規定了教育主體擁有獲得與自身相關的全部教育信息和數據的合法權利,保護教育數據的分層分級合理利用;訪問控制規范規定了教育大數據的訪問控制機制,規范了教育主體對教育數據的訪問控制規則。
標準引用組譜作為教育大數據標準體系的研制基礎和重要參考,有助于細化教育大數據標準類別,促進教育大數據標準的全覆蓋。教育大數據是大數據技術在教育領域的賦能應用,因此教育大數據標準體系參考和引用了大數據技術和教育信息化領域的標準和規范,其中教育信息化領域相關標準主要來自ISO/IEC JTC1 SC36、IEEE/LTSC、ADL以及我國CELTSC等標準組織的標準內容,大數據技術相關標準主要包括《大數據互操作框架》《基于云計算的大數據需求與能力標準》《信息分類編碼標準的編寫規定》等標準文檔及白皮書。表一給出了教育大數據標準體系各類標準對應的參考和引用標準。

表一 教育大數據標準體系參考和引用標準
教育大數據標準體系為教育大數據開發利用提供了重要支撐,為促進教育平臺互聯互通和實現教育數據全生命周期管理提供了基礎保障。我們也應注意到,教育大數據的易獲取性滋生了一系列新的信息安全和倫理問題,加強教育大數據的隱私保護迫在眉睫,加快教育大數據安全類標準的制定將是教育大數據持續發展的重要保障。同時,教育大數據相關標準的研制離不開企業、教育機構和科研機構等多方的支持和參與,基于專業化分工的標準協作編制將成為未來標準研制的主流模式。目前,教育大數據標準工作組已經在CELTSC框架內成立,其對外銜接國際標準組織,對內適應國家標準建設需求的工作模式已經形成,將為我國教育大數據標準的深入研究和廣泛應用提供重要支撐。
[注釋]
① Office of educational technology. Enhancing teaching and learning through educational data mining and learning analytics. [EB/OL] (2014-03) [2018-08-28]. https://tech.ed.gov/learning-analytics/.
② Seizing the data opportunity: as trategy for UK data capability. [2020-1-18].https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/254136/bis-13-1250-strategy-for-uk-data-capability-v4.pdf.
③ Infocomn media 2025[EB/OL].[2020-1-18].https://www.mci.gov.sg/portfolios/infocomm-media/infocomm-media-2025.
④ ISO/IEC JTC1 inforamiton technology. Big data preliminary report 2014 https://www.iso.org/files/live/sites/isoorg/files/developing_standards/docs/en/big_data_report-jtc1.pdf.
⑤ ISO/IEC JTC 1/SC 32 PARTICIPATION [EB/OL]. [2020-2-10] https://www.iso.org/committee/45342.html?view=participation.
⑥ Standard big data architecture and infrastructure.http://www.picasso-project.eu/wp-content/uploads/2016/05/BDEG_Wo-Chang.pdf.
⑦ About international telecommunication union (ITU) .https://www.itu.int/en/about/Pages/default.aspx.
⑧ Big Data: Big today, normal tomorrow. ITU-T Technology Watch Report https://www.itu.int/dms_pub/itu-t/oth/23/01/T23010000220001PDFE.pdf.
⑨ ITU-T Recommendations. Big data-Cloud computing based requirements and capabilities. https://www.itu.int/ITU-T/recommendations/rec.aspx?rec=12584&lang=en.
⑩ Committed to connecting the world .ITU-T Recommendations .https://www.itu.int/itu-t/recommendations/rec.aspxrec=13469&lang=zh.