劉邦奇 張振超 王亞飛
?
區域教育大數據發展參考框架*
劉邦奇1,2張振超3王亞飛1[通訊作者]
(1.訊飛教育技術研究院,安徽合肥 230088; 2.首都師范大學 教育學院,北京 100048; 3.廣東省教育廳 規劃發展處,廣東廣州 510080)
如何規劃和發展區域教育大數據,是當前教育信息化2.0推進實踐與學術研究的熱點。文章首先從教育信息化深化發展中遇到的問題入手,指出教育大數據是信息化深入發展的必然結果,并指出區域發展教育大數據應進行系統規劃。隨后,文章提出了“區域教育大數據發展參考框架”,指出應在規劃教育大數據應用系統的同時,注重專家團隊協同與各項保障制度的建設。最后,文章以廣東省某市教育大數據規劃為例,分享了該參考框架的應用實踐,并討論了該參考框架的優點與不足。
教育大數據;區域教育大數據規劃;參考框架
國務院在2015年8月印發的《促進大數據發展行動綱要》中指出,要“完善教育管理公共服務平臺,推動教育基礎數據的伴隨式收集”[1]。此后,教育部在《2018年教育信息化和網絡安全工作要點》中提出:“出臺教育信息化2.0行動計劃”、“推動大數據、虛擬現實、人工智能等新技術在教育教學中的深度應用”。自此,發展教育大數據受到了全國各地的廣泛關注。本研究通過搜索引擎(包括百度搜索和Bing搜索)查找了全國31個省級行政區域(不包括港澳臺地區)的信息化規劃情況,發現所有區域都明確規定了本區域發展教育大數據的任務與目標。通過進一步檢索發現,全國多數省會城市和大量教育信息化基礎良好的城市,正在開展或籌劃本區域的教育大數據發展工作。區域教育大數據規劃研究已成為各地區籌劃教育信息化深化發展、推進教育信息化2.0實踐與研究的重點和熱點。
教育大數據之所以受到了區域的高度重視,一方面在于國家及本省(市、自治區)政策的支持;另一方面,當前我國教育信息化發展進入2.0時代,區域教育信息化也進入新的發展階段,需要借助創新技術持續推動教育信息化的進步。在眾多區域,教育信息化發展取得了巨大進步:教學環境越來越好、教育資源越來越豐富、信息化教學越來越普及、公共教育平臺的服務水平越來越高且覆蓋面越來越廣[2]。但由于教育信息化具有應用場景多樣、業務邏輯繁復、需求差異顯著等特點,不得不建設越來越多的應用系統進行應對;在全國各個區域都積累了大量的、建設于不同時期、針對不同目標、交由不同廠商、采用不同技術路線實現的教育信息化系統,這些系統在解決問題的同時也給用戶帶來了巨大的困擾與挑戰。本研究以2017年5月筆者在廣東東部某市的調研數據為依據,發現了如下問題:①縣區級教育局日常使用的信息化系統數量過多(總量多達30余個),熟悉、管理和使用全部的系統較為困難;②經常需要在多個系統之間導入、導出和轉化數據;③重要數據需要在多個系統中錄入;④同一個指標在不同系統中數據統計結果不一致,需承受大量的人工分析與處理工作等。
傳統信息技術應對上述問題時總是“按下葫蘆浮起瓢”,而大數據提供了系統性解決問題的手段。教育大數據實現了數據的統一采集,使所有的應用系統都成為數據采集端,彌補了特定數據只能由專門的信息化系統采集的不足,解決了系統重復冗余的問題;實現了數據的統一交換,使數據能夠在系統與中心之間非實時交換,極大地降低了數據交換技術的復雜度,解決了數據高效流轉的問題;實現了離線數據的統一加工,使數據能夠被全面清洗、集中規整并以統一的口徑進行統計,規避了相同指標在不同系統中含義不一致的現象,解決了數據沖突問題;實現了離線數據與在線數據的統一利用,使數據可以跨場景、多角度、全方位地呈現和發掘規律,擴大了數據應用場景,極大地提升了數據的內在價值。因此,區域發展教育大數據是教育信息化進一步深化發展的必然結果。
社會的進步總是從工具的革新開始的,正如蒸汽機的發明推動了工業革命。教育大數據技術也為教學、學習及管理決策等教育活動提供了全新的科學工具,并有力地推動了教育的變革。區域應基于教育大數據技術開展區域教育大數據發展的規劃與設計工作,一方面解決教育大數據工具如何打造的問題,即海量數據如何采集、加工、存儲和管理?如何通過數據統計、分析和挖掘,發現數據規律、構建數據模型?如何在信息化系統中運用數據規律、應用數據模型?另一方面解決教育大數據工具如何應用的問題,即如何培養運用教育大數據工具的意識與習慣?教育大數據工具的最佳使用模式是什么?如何持續推動教育大數據工具的創新與發展?因此,系統考慮區域教育大數據發展的問題而非僅僅關注信息化系統建設本身,是解決上述問題的關鍵。構建一個包含上述問題解決方案的參考框架,用以指導編制區域教育大數據發展規劃,成為必然選擇。
從2016年開始,本研究團隊在全國幾十個地市級區域開展了關于教育大數據規劃與建設的需求調研,與區域教育主管部門進行了廣泛溝通交流,并對規劃及建設方案在部分區域進行了試點驗證。結合各地共性需求,本研究提出了“區域教育大數據發展參考框架”(下文簡稱“參考框架”)。當前已有多個城市以該參考框架為藍本,編寫了本區域的教育大數據發展規劃。
參考框架認為,區域教育大數據離不開“大數據應用體系(簡稱‘應用體系’)建設”、“大數據專家團隊(簡稱‘專家團隊’)建設”和“大數據保障制度(簡稱‘保障制度’)建設”等三個關鍵要素的協同配合,每個要素又由多項關鍵內容組成,如圖1所示。“應用體系”建設是教育大數據規劃的主體內容,描述了應提供怎樣的大數據應用系統以服務于各類教育教學活動,同時也回答了“教育大數據工具如何打造”的問題。“專家團隊”建設為區域大數據與教育的融合創新應用提供了人才保障,使區域有多領域的專家隊伍,系統性規劃應用體系建設與各項制度建設問題,并重點研究與推廣大數據在教學、學習與管理中的應用問題。“保障制度”建設為區域大數據建設有序開展和持續發揮價值建立可靠的長效機制,使各項工作能夠安全、自主、有序地推進。可以說,“專家團隊”建設與“保障制度”建設為“應用體系”建設提供了重要的支撐,同時也回答了“教育大數據工具如何應用”的問題。

圖1 區域教育大數據發展三要素模型
大數據應用體系建設的核心內容可概括為“完成三項任務、構建一個體系”,即以技術標準為基礎,通過完成數據源管理、能力平臺搭建和應用系統研發三項任務,使數據的生產、匯聚與賦能實現閉環,最終完成區域教育大數據應用體系(如圖2所示)的構建。

圖2 區域教育大數據應用體系
技術標準是數據在不同系統之間流轉的規范,必須在應用體系構建之初優先做規劃。技術標準具體定義了基礎標準、平臺/支撐標準、關鍵技術標準、產品及服務標準、應用標準等方面的內容[3]。可通過遵循國家標準、借鑒國際標準和制定地方標準三種形式,構建區域教育大數據技術標準體系,具體包括四類技術標準:①研發技術標準,定義了需采用哪一類開源技術框架,如明確規定計算框架是采用Hadoop MapReduce、Spark、Storm中的一個還是多個;定義了在數據分析與數據挖掘過程中算法的標準實現版本、參數值的取值范圍等。②數據接口標準,定義了數據伴隨式上報服務的接口標準、上報內容的格式標準、用戶行為日志格式標準、數據交換服務接口標準等。③數據存儲標準,定義了各種教育統計指標的含義及計算方法,定義了教師、學生、學校、應用場景等教育大數據主要研究對象的數據模型結構。④應用服務標準,規范了對外輸出的數據統計與數據挖掘服務的接口定義與應用集成策略等。總之,區域應以遵循統一技術標準為前提,完成以下三項工作,最終實現區域教育大數據應用體系的構建。
(1)數據源管理
數據源管理實現了對區域教育相關數據系統性地調查、分析、整理和數據匯聚前的預處理等,它是教育大數據建設的基礎工作。按照數據的歸屬關系,數據源可分為兩大類:①區域教育領域數據,是指可由本地教育部門直接管理和使用的數據,數據來源于本地管理和使用的各類教育信息化系統,并物理存儲在業務數據庫、行為日志、文件系統、數據服務及消息隊列等系統模塊之中。②第三方數據,既包括上級區域、下級區域、兄弟區域所管理的教育領域數據,又包括其它行業數據(如智慧城市的數據)。當前,區域教育領域數據是教育大數據研究與分析的主體內容,但第三方數據也在越來越多的教育大數據應用中發揮價值,如“學區學位劃分”問題依賴于住房、戶籍等第三方數據。
根據數據的產生方式與使用目的的不同,教育領域數據可粗略分為四大類:①管理數據,指在各類教育管理信息化系統中生成、使用和管理的數據,如學籍、師籍系統中的學生和教師的個人信息,教育辦公系統中的業務流程數據,軟硬件統計數據,各項教育指標統計報表數據等;②測評數據,指在各類測評診斷系統中產生、使用和管理的數據,如作業系統中的作業數據,考試系統中的考試答卷數據與閱卷成績數據,綜合素質評價系統中的問卷調查數據、實踐活動數據、指標分析數據等;③行為數據,指用戶在使用各類教育信息化系統過程中產生的數據,如智慧課堂系統中記錄的教師教學行為數據、師生互動數據,在線作業系統中記錄的學生答題行為數據等;④資源數據,指在各類教育信息化系統中使用或產生的各類多媒體資源,如應用于智慧課堂系統中的課程資料、教學課件,應用于在線學習系統中的微課資源與試題資源,課堂分析系統中記錄的課堂實錄音視頻資源等。
(2)能力平臺搭建
能力平臺的搭建實現了大數據匯聚、存儲、加工及統計挖掘服務等技術能力的平臺化輸出,也是教育大數據建設的核心內容。能力平臺不僅提供了功能完備的數據倉庫,保障了區域教育數據資產的積累、管理和增值,還提供了功能強大的用戶工作臺,降低了面向教育領域的大數據研究與應用門檻。此外,能力平臺還實現了大數據與人工智能技術的深度融合,一方面人工智能引擎的集成增強了平臺的數據智能化處理能力,另一方面平臺的海量數據與計算框架又助推了人工智能引擎的改進與優化。
能力平臺可依據業務功能劃分為四大中心模塊:①數據匯聚中心,是平臺的數據入口,實現了從信息化系統中采集數據、支持平臺主動從數據源抽取數據、數據源主動向平臺上報數據、平臺與數據源之間實現數據庫自動同步等;實現了平臺與第三方數據源的數據交換;實現了數據的清洗、補齊、歸一化等預處理操作。②數據存儲中心,為各模塊輸出存儲能力,實現了數據的集中存儲;通過建立數據倉庫,不僅支持只經過預處理的原始數據的存儲,還支持經過加工與建模后的專題數據的存儲;實現了數據的統一管理,支持對數據的訪問控制。③數據加工中心,為各模塊輸出計算能力;基于開源技術建立分布式存儲與計算框架,支持任務監管與安全管理。④數據服務中心,實現了平臺大數據能力的對外輸出;集成人工智能技術,支持非結構化數據計算,對外提供數據統計服務和數據挖掘模型的計算服務。
(3)大數據應用研發
大數據的應用研發,實現了將大數據能力轉化為應用系統或集成到教育信息化系統之中。大數據應用是教育大數據價值的集中體現,實現了個性化學習、精準化教學和科學化管理等大數據智能服務在具體教育教學場景中的工具化和可視化。
依據大數據能力的應用模式,大數據應用可劃分為兩大類:①大數據專題應用,是將大數據能力直接進行工具化形成的應用系統。主要包括:數據統計類應用,如教育大數據統計服務、教學數據統計報表系統、區域/校園管理數據統計報表系統等;數據分析類應用,如教育大數據業務分析服務、學情分析系統、區域/校園教育管理分析大屏系統等;數據挖掘類應用,如教育大數據專題預測模型、個性化學習推薦引擎、決策支持系統等。②大數據集成應用,是將大數據能力引擎化并集成到教育信息化系統之中,如集成了學情分析服務的智慧課堂系統、用作指標分析服務的智慧校園系統、提供資源推薦服務的智慧學習系統等。
大數據專家團隊建設的核心工作可概括為“依靠三類專家、組建一支團隊”,即組建一支囊括業務專家、教育專家和技術專家的團隊,并實現三類專家各司其職、協同配合,系統推進教育大數據在區域的建設、應用與發展。
(1)業務專家
業務專家既是教育大數據需求的調研歸納者和分析管理者,也是大數據應用的推動者。一方面,業務專家對各級教育行政機構及各類學校的大數據業務需求進行系統調研,摸清需要建設哪些業務需求急迫、與大數據關系密切的管理系統;另一方面,業務專家以中立的視角,開展針對教師教學過程和學生學習過程的大規模觀察與記錄活動,探尋并明確教師與學生的痛點需求。業務專家通過對上述原始需求進行記錄、分析和研究,形成對本區域教育大數據建設詳實且可落地的規劃建設方案。在系統建設前期,著重解決區域教育具體的業務問題,因此,專家團隊成員主要來自于熟悉管理業務的教育主管部門;而在系統建設后期及持續運營階段,著重應用大數據技術與方法解決教與學過程中的實際問題,因此,專家團隊成員主要來自于教育信息化應用典型學校。
(2)教育專家
教育專家既是教育大數據理念的傳播者與推廣者,也是將大數據應用到教育教學過程中的實踐者與布道者。一方面,教育專家為區域發展教育大數據建言獻策、提供發展思路、建設方案和實施路線圖,同時幫助業務專家掌握面向教育領域用戶的需求調研技巧,熟悉教育大數據應用體系規劃與設計的方法論:另一方面,教育專家將針對典型的教育教學場景,深入到一線的教職員工之中,開展大數據應用技能培訓,同時開展聯合科研活動,以期在實踐中總結大數據教學、大數據管理的最佳應用模式與最佳應用案例,并進行示范和推廣。在系統建設及運營前期,教育專家主要來自于高校和教育大數據廠商,包括教育技術、教育評價、教育統計與測量以及教育大數據等相關領域的專家;而在持續運營期間,也會有大量參與教育大數據科研的教師成長為教育專家。
(3)技術專家
技術專家是教育大數據體系的建設者和運營者。一方面,技術專家將業務專家的規劃設計方案轉變為系統的技術設計方案,并開展具體的系統建設與實施活動;另一方面,技術專家持續關注系統的運營狀況和用戶的使用狀況,結合業務專家的需求調研報告和教育專家的模式研究成果,不斷統計、分析區域教育數據,探索、挖掘教育大數據規律,并將大數據研究成果產品化,提供產品技術服務。技術專家主要來自于兩大類:一類是教育大數據廠商和高校的外部專家,包括大數據挖掘、信息化系統架構等相關領域的專家,他們是團隊的骨干;另一類是本地引進和培養的技術專家,他們是團隊的主體。
大數據管理制度建設的核心工作可概括為“建立三維保障、形成一套制度”,即從安全機制、協作機制和管理規范三個維度,建立一整套制度,以保障區域教育大數據得到長期穩定的發展。
(1)安全機制
數據安全是區域教育大數據發展在制度方面應考慮的首要問題,應從三個方面構建安全機制:①制定并執行安全制度,應根據2017年6月1日正式實行的《中華人民共和國網絡安全法》的具體要求,結合區域特色和教育大數據的行業特點,全面建立并嚴格執行各項安全保密制度,包括數據收集與隱私保護規范、數據存儲與備份管理規范、數據分層分級授權訪問規范、數據保密制度、數據產權保護制度、數據模型知識產權保護制度以及數據安全的獎懲措施等。②樹立與強化安全意識,區域教育大數據的各類用戶應參加有關安全制度的學習與培訓,使數據生產者和數據使用者都牢牢樹立安全意識,并養成尊重用戶隱私和保守數據秘密的習慣。③測試與完善安全對策,一方面應建立“數據安全應急預案”,即先制定預案,再進行反復的測試與演練,最后豐富與完善預案;另一方面應參考國內外先進的網絡安全框架和數據安全提升機制[4],先評估當前安全狀況并制定期望達成的目標,再分析和確定兩者之間的差距并實施行動計劃,最后達成預期目標并實施完成標準化、程序化的數據安全風險應對的管理策略與技術方法。
(2)協作機制
建立教育大數據專家團隊協作機制,應明確規范專家團隊的組織歸屬、職責范圍、選聘辦法以及工作協作模式:①專家團隊應正式設置在相關管理部門(如教育局、大數據辦公室等),以專業的規劃設計單位(如“教育大數據規劃研究院”)的形式存在;②專家團隊應為區域教育大數據發展提供規劃設計方案和建設思路,并推動系統建設、系統實施和應用落地等相關事項;③專家團隊應從高校和教育信息化行業延聘外部專家,積極從外部引進專業技術人才并從本地教職員工中培養本地專家;④專家團隊應根據角色和任務分工合作,以年度為單位,將各項工作以項目的方式進行推動,同時明確首席專家負責制度。
(3)管理規范
區域制定的管理規范從政策、制度的角度為教育大數據的健康、有序發展保駕護航,具體包括:①地方政策與規劃,如制定本區域的“教育大數據五年發展規劃”、“教育大數據行動計劃”等;②系統運營與保障制度,如制定本區域的“數據平臺管理辦法”、“大數據開放服務管理辦法”等;③應用推廣與獎懲機制,如“教育大數據應用示范校評比管理辦法”、“基于大數據的教師評價指標體系”等。
參考框架的建設內容與設計思想,已在全國多個區域得到實踐與驗證。以廣東省某市教育大數據規劃為例,本研究團隊與該市教育行政規劃部門及教育信息中心合作,協助推動專家團隊組建和管理制度設計,并完成了該市《教育大數據發展規劃方案(建議稿)》的編寫。該市以此規劃方案為藍本,正在推動教育大數據應用體系(如圖3所示)一期建設,初步成果已得到該市教育部門及學校用戶的高度評價。

圖3 廣東省某市教育大數據應用體系
該市教育大數據發展規劃工作包括以下內容:①推動專家團隊的組建工作,一方面開辟外部合作及人才引進通道,與知名師范類高校中教育技術與教育測量方面的專家和知名技術廠商中大數據與人工智能方面的專家建立長期合作關系,聘任首席技術專家和首席教育專家,同時系統引入專業人才;另一方面制定需求調研計劃、制定教育大數據應用課題研究指南,從教育局和學校選拔、聘任業務專家,并建立教育專家培養計劃。②開展各項制度的設計工作,推動“市教育大數據技術標準體系”(通過選擇國家標準、借鑒國際標準和編寫地方標準三種方式組合完成)、“市教育大數據專家團隊管理辦法”和“市教育大數據管理辦法”等技術規范與管理制度的編寫、論證、審批與試點。③推動系統建設方案的規劃工作,與長期服務于該市教育領域的、某全國領先的技術咨詢公司展開合作,在業務專家團隊的協助下初步實現對教育局和典型學校需求的調研,在教育專家團隊的協助下初步實現教育大數據應用場景設計,并在技術專家團隊的協助下完成對大數據應用體系的架構設計及技術實現方案的規劃。
“區域教育大數據發展參考框架”為區域發展教育大數據提供了整體工作思路和系統性規劃框架,避免重蹈信息化系統建設中經常出現的“缺乏頂層設計”、“重建設輕使用”等覆轍[5],使區域在發展教育大數據的過程中不僅關注系統的建設與改進,更關注數據規律的探索與研究,以及系統在教育中的應用與反饋,把區域教育大數據真正打造成為教育變革的“利器”。目前的參考框架仍不夠完善,如只探討了影響教育大數據規劃的三個關鍵要素,并沒有對其它要素進行系統性總結與梳理,不夠全面和完善;只探討了區域的共性需求,對區域更多的個性化需求支持不夠,還需在應用時結合區域實際進行針對性的探討與分析。因此,在未來的理論研究與應用實踐中,參考框架還需要不斷地改進與發展,以期不僅能夠覆蓋更多的應用場景,滿足更多區域的個性需求,還要能夠提供更詳實的最佳實踐與案例研究報告,使框架更易于落地實踐。
[1]國務院.促進大數據發展行動綱要[OL].
[2]教育部.教育信息化“十三五”規劃[OL].
[3]中國電子技術標準化研究院.人工智能標準化白皮書(2018版)[OL].
[4]National Institute of Standards and Technology. Framework for improving critical infrastructure cybersecurity[OL].
[5]蔣東興.信息化頂層設計[M].北京:清華大學出版社,2015:14-16.
編輯:小西
Reference Framework for the Development of Big Data in Regional Education
LIU Bang-qi1,2ZHANG Zhen-chao3WANG Ya-fei1[Corresponding Author]
The plan and development of regional education big data are becoming hot topics in education informatization 2.0 supported activities and academic research. Firstly, the present article explores the problems encountered in the deepening development of educational informatization, and points out that big data in education is the inevitable result of the further development of informatization. Meanwhile, systematic planning is demanded in order to cope with the development of regional education big data. Then, the article puts forward the “reference framework for developing regional education big data”, and proposes that while planning the application system of big data in education, we should emphasize the construction of the collaborative experts team and various security systems. Finally, this article shares a real case with application of the framework, and discusses its advantages and disadvantages.
big data in education; big data planning in regional education; reference framework
G40-057
A
1009—8097(2018)04—0005—08
10.3969/j.issn.1009-8097.2018.04.001
本文為國家語委“十三五”重大課題“智能語音及人工智能技術在語言學習中的應用研究”(項目編號:ZDA135-4)的階段性研究成果。
劉邦奇,訊飛教育技術研究院執行院長,首都師范大學教育學院教授,碩士,研究方向為教育技術應用、教育大數據、智慧課堂,郵箱lbq-nj@163.com。
2018年2月25日