
摘要:教育信息化建設日新月異,產生的數據愈發龐大復雜,由此催生出教育大數據管理與應用方面的諸多問題,數據治理勢在必行。本文針對當前教育大數據普遍存在的問題,提出教育大數據治理的參考框架,以期能夠為教育數大據治理的研究者和實踐工作者提供參考。
關鍵詞:教育大數據;數據治理;構建框架
中圖分類號:TP309? 文獻標識碼:A? 論文編號:1674-2117(2022)06-0000-03
● 引言
2021年9月,習近平總書記在世界互聯網大會烏鎮峰會的賀信中強調“增強數字政府效能,優化數字社會環境,構建數字合作格局,筑牢數字安全屏障”。教育部《教育信息化2.0行動計劃》“智慧教育創新發展行動”的推進,明確了數字資源服務普及行動要引領智慧校園資源的建設、應用與共享。在充分運用云計算、數據挖掘、人工智能等計算機技術的基礎上,校園信息化應用更是趨向數據化、服務化、智慧化,全面助力提升教育信息化發展水平,真正實現“互聯網+信息技術”與教育創新發展的深度融合。教育信息化建設日新月異,產生的數據愈發龐大復雜,由此催生出教育大數據管理與應用方面的諸多問題,因此數據治理勢在必行。
● 科學內涵
何謂數據治理,國內外的研究機構或專家學者說法不一。國際數據管理協會(DMA)提出,數據治理是通過梳理、控制和應用數據以實現頂層設計目標并提供決策支持,是數據管理中最重要的部分;國際標準化組織IT服務管理與IT治理分技術委員會認為,數據治理是指建立在數據采集、存儲、交換和應用之上的一系列程序、標準、評估等,確保數據能夠被高效有序利用,實現其最大商業價值。國內對數據治理的概念也眾說紛紜,中國在2014年6月的ISO/IEC JTC1/SC40(IT治理和IT服務管理分技術委員會)第一次全會上首次提出“數據治理”的概念,引起國際同行很大興趣,在2015年5月召開的SC40/WG1(IT工作治理組)會議上提交了《數據治理白皮書》,這份標準研究報告認為,數據治理是數據在產生使用價值的活動中,對其進行清理、評估和控制的一系列過程。
● 治理目標
數據治理的目標是通過數據治理框架對教育大數據進行清洗過濾,為教育應用平臺應用提供合規完整、準確及時、正確唯一和風險可控的大數據,實現數據價值最大化。有效的大數據治理能夠實現大數據與應用的深入融合,提升服務效能,避免決策失誤,降低安全風險。
● 構建教育大數據治理框架
教育大數據治理要求數據應用的各個層面都具備治理意識,并根據校園數據應用的差異性逐漸形成個性化的數據治理氛圍和實踐。一般情況下,數據治理層框架主要包含數據標準化、數據管理、安全技術和治理保障四個方面(如下頁圖)。數據標準化是基礎部分,其他三個方面貫穿數據治理全程。
1.數據標準化
在數據治理的初期首先要建立一套依據學校實際的統一數據標準,在數據采集、傳輸和使用過程中必須遵循這個標準,才有可能建立開放共享的高質量數據倉庫。數據標準可分為基礎層標準和應用層標準兩種。基礎層標準主要是基礎性的數據約束規范,如在編制數據字典、數據編碼及數據分類等過程中必須嚴格遵守統一的基礎層標準,目的是要保證不同系統中對同一數據的理解無歧義,也為不同應用平臺之間數據交換打下良好基礎;應用層標準主要是作用于系統功能開發所涉及的全部數據的標準規范,如元數據標準、主數據標準和數據交換標準等,其目的是確保數據在其生命周期中的使用效率和質量,它也是保持數據完整性、規范性和一致性的基礎。
2.數據管理
(1)數據質量管理。教育大數據的數據質量管理對象是核心業務系統中的全部數據,包括結構化數據、非結構化和半結構化數據等,其內涵包含兩個層面:一是數據本身的質量管理;二是數據使用過程中的質量管理。數據治理能否有效推進很大程度上取決于高效的數據質量管理,完善的數據質量管理能為學校提供高效的增值服務。
(2)數據安全管理。教育大數據應用系統中匯集了大量重要且敏感的信息,對數據安全使用提出了很高的要求,尤其是數據信息的隱私性、訪問權限和安全審計等方面的管理是極其重要的。在大數據治理框架中,有必要通過完善安全策略、建立安全措施等多種手段保障數據在存儲、傳輸、使用過程中的安全性。要真正實現全方位的安全管控,必須做到事前預判、事中管控和事后溯源。
(3)數據生命周期管理。數據生命周期指的是數據從識別、采集、存儲到傳輸、整合、處理、應用、歸檔銷毀的整個過程。數據治理是基于數據全生命周期的持續的安全的優化管理,主要體現在高效使用數據、優化數據質量和實現數據應用自治三方面。
(4)交換接口管理。實現基于元數據、主數據和數據交換等數據標準的不同應用平臺之間的數據交換管理。良好的數據標準可以保證基礎數據和應用數據的統一管理,結合數據質量管理和數據安全管理較好地解決了目前應用平臺中普遍存在的數據重復分散、理解歧義、口徑模糊、安全隱患等問題,便于實現數據的開放共享。
3.數據安全技術
安全保障在數據治理框架中占有不可或缺的地位,從技術上做好防護是教育大數據開放共享、消除信息孤島的重要保證。需要重點關注的安全技術主要包括安全態勢感知、數據脫敏、訪問策略、溯源管理等,最終實現對生命周期內的數據安全感知、管控、追溯。
(1)安全態勢感知。鑒于教育大數據集中化程度高、數據量級龐大,在跨校園跨平臺的數據開放共享過程中,數據和服務平臺極易受到網絡黑客的攻擊,尤其是有些APT攻擊的潛伏期很長。因此,需要針對異構大數據的融合、存儲和運維構建安全態勢感知系統,實時監測網絡流量、安全日志等,采取有效的技術手段預測、評估當前網絡數據安全狀況,對安全事件和安全隱患進行預警與防御處置,提高對數據整體安全風險的感知和決策能力。
(2)數據脫敏。教育大數據中存在大量的敏感信息,如個人信息、資產數據等。對于這些敏感數據,數據治理過程中需要進行脫敏。建立數據脫敏的方法和標準需依據國家相關法律法規、數據分類分級標準和數據開放共享的安全級別。
(3)訪問策略。防止數據被非法訪問的關鍵是建立有效的統一認證系統和完善合理的訪問策略。所有用戶都必須通過統一賬號、唯一入口進入應用平臺,依據訪問策略實現分級訪問數據資源,并記錄用戶訪問情況。
(4)數據溯源。數據溯源是在結果發生后對歷史痕跡進行分析、溯源。例如,發生網絡安全攻擊后,可以對網絡流量、日志和警告信息等進行綜合分析,可以追溯攻擊行為類型,通過關聯的IP地址等信息,可以追溯到實施者所在地。在共享數據全生命周期中對數據的流轉過程要加強監控、記錄,全程透明可見。為提升對安全事故的追責能力,所有的留痕記錄必須具備唯一性并不可修改。
4.治理保障
在大數據治理實施的過程中,僅依賴數據標準化、數據管控以及安全技術等技術來支撐是不夠的,還必須通過組織、制度、優化流程等保障機制來提高數據治理的效率,降低數據治理運維成本,并保證數據治理風險可控。
(1)組織保障。立足學校的實際情況,建立合理的數據治理組織架構和責任體系,明確數據生命周期中所涉及的部門及人員的職權責。組織負責全面統籌協調,整體解決數據治理中出現的問題,是實現成功治理的重要保障。
(2)法規制度。數據治理從總體規劃到落地實施,內容覆蓋廣泛,涉及大量的人物財,為保障治理工程的順利推進,方方面面都需要制度加以規范和明確。治理的制度要基于國家法律法規制定,類型大致可分為章程(確立數據治理目標)、管控辦法(數據治理實施保障制度)、考核辦法(建立激勵機制)等。
(3)標準流程。流程是項目實施的落地步驟,大數據治理流程的建立需立足學校實際、依據規章制度建立可操作的標準流程。在數據實施的過程中結合數據治理的技術和管理工具,建立符合學校需求的標準流程管理系統。
● 結語
在數據即服務(DAAS)的時代,教育大數據應用系統是一項復雜龐大的工程,每天都有海量的大數據流動于各應用中,有效的大數據治理方案能夠優化和提升數據的質量、安全和價值等,從而高效驅動校園實踐應用,提高教育管理效率,增強決策科學性,達到提升社會教育質量的目的。本文針對當前教育大數據普遍存在的問題,提出教育大數據治理的參考框架,從技術層面、管理層面和保障層面闡述了教育大數據治理的可行性操作和實施步驟,旨在幫助教育數據治理研究者能夠更加客觀深入地分析和解決面臨的數據問題,使教育大數據在不同應用平臺間高效流轉、良性循環。
參考文獻:
[1]張紹華,潘蓉,宗宇偉.大數據治理與服務[M].上海:上海科學技術出版社,2016.
[2]王永顏.大數據時代教育治理能力現代化構建與路徑選擇[J].電化教育研究,2017(08):44-49.
[3]賈童舒,劉葉婷.數據治理——提升城市現代化治理能力的新視角[J].領導科學,2014(35):4-7.
作者簡介:陳迎春(1971.01—),女,漢族,四川省遂寧市人,高級工程師,學士,研究方向為大數據治理。