

摘要:針對智慧校園數據分散、標準不統一、質量差、安全風險高等問題,文章提出一種基于零信任和數據中臺的智慧校園數據治理體系。該體系實現了數據的統一采集、標準化、管理、發布和安全控制,并為上層應用提供數據融合分析服務。成都醫學院的實踐表明,該體系有效提升了數據質量和利用率,促進了教育大數據標準化和安全融合。
關鍵詞:數據治理;數據中臺;零信任;智慧校園;教育大數據
中圖分類號:TP311" " " 文獻標識碼:A
文章編號:1009-3044(2025)16-0063-04
開放科學(資源服務) 標識碼(OSID)
0 引言
隨著信息技術的高速發展,高校信息化數據激增,高等教育進入大數據時代?!督逃畔⒒?.0行動計劃》中提出“應全面推進各級各類學校智慧校園建設與應用”[1]。高校信息化建設從以基礎設施和業務信息化為中心的“數字校園”轉變為以數據驅動提升教育治理能力為中心的“智慧校園”。智慧校園中的各類軟硬件設備和業務系統采集并累積了大量的信息數據,推動高校進入教育治理階段[2]。2019年2月發布的《加快推進教育現代化實施方案(2018—2022) 》《中國教育現代化2035》也提出要將大數據支撐的“創新信息時代教育治理新模式”列為高等教育信息化建設的重點目標[3]。因此,智慧校園大數據治理是高校信息化必須完成的一項重大工程[4]。
隨著移動互聯網、大數據、軟件定義網絡、分布式計算、邊緣計算等新興網絡技術的發展,互聯網變得規模龐大、結構復雜,并向動態化、虛擬化演變,由此網絡邊界模糊以致難以界定[5]。傳統靜態的、依賴默認信任區的周界安全防護框架已經不再適應當前復雜的網絡形勢,急需構建全面、安全、可靠的網絡架構保障教育數據的安全融合。因此,本文以安全和治理為核心設計并實現了一套基于零信任框架的智慧校園數據治理體系,并探討其在成都醫學院的應用實踐。
1 現狀分析
以成都醫學院為例,通過實施“成都醫學院信息化建設2.0行動計劃”,學校信息化建設已經取得了階段性的成果。教育教學各業務系統都完成了信息化,開始無紙化辦公,基礎信息系統也實現了簡單互聯。各院系、職能部門開始對數據提升業務效率、準確性有較強的需求,尋求數據聯合利用的更多價值,迫切需要開展高校數據治理。學校數據治理工作主要面臨以下挑戰。
1) 數據雖已初步整合,但應用仍面臨挑戰。
2) 數據質量差異大。由于各系統的開發建設單位不同、數據更新頻率存在差異、使用頻率和維護要求都不一樣,因此數據常存在缺失、標準不統一等質量問題。例如,教工唯一標識碼在不同系統可能是工號、一卡通號、教學號;權威信息數據未實現“一數一源”等。
3) 數據安全面臨數據源系統保護不足、傳輸過程易受攻擊以及流通環節存在泄露風險等挑戰。
綜上所述,高校教育大數據具備來源多、類型雜、體量大、連接密切、交換頻繁等特點[5],要想在保證數據完備性的基礎上實現數據整合、清洗、交換、共享以及分析挖掘,發揮數據價值,助力教育決策,就需要構建一套完整的數據治理體系。目前有關高校數據治理的相關研究,學術界主要分為兩個方向,一是以強化技術實現為核心[5-7],二是以融合技術和管理為核心[8-10]。前者主要探索數據融合技術的提升,后者強化了管理因素,提出高校數據治理體系應集合管理機制、數據中臺、數據標準、人員建設等要素??傮w來看,有關數據治理體系中安全保障和質量監督方面的研究還比較少[11],整個數據治理體系尚未建立從制度到技術的全面框架。
鑒于以上背景和現狀,文章設計并實現了一套零信任框架下的智慧校園數據治理體系,體系以零信任技術加強數據安全,并基于數據中臺技術實現數據采集、存儲、標準化和共享,集合數據質量監督處理流程,構建從數據治理制度到技術的全面框架,實現校園數據的高效治理。
2 相關概念
2.1 零信任
“零信任/零信任安全”的概念是由弗雷斯特公司(Forrester) 的分析師約翰·金德維格(John Kindervag) 在2010年提出[12]。零信任安全架構的原理是對訪問資源的設備和用戶進行持續的身份驗證和監控,并控制其以最小權限訪問資源。它能解決傳統周界安全框架下,攻擊者繞過防火墻,橫掃內部資源的風險,更加適應當前不斷開放和復雜的網絡威脅形勢[13]。零信任安全架構是一種以保護數據安全為中心的網絡安全方法。
2.2 數據中臺
數據中臺是將一個機構的數據作為戰略資產進行管理,是從數據搜集到處理應用的一套管理機制,以期提高數據質量,實現數據資產化管理和服務共享,最終實現數據價值最大化[14]。數據中臺最早由阿里巴巴集團于2015年提出和建設,隨后廣泛應用于各互聯網和企事業單位,是現階段實現數據價值的有效解決方案[15]。
3 零信任框架下的數據治理體系設計
構建零信任框架下的數據治理服務體系,首先對學校現有數據情況進行現狀調研,對學校的數據共享,流通和安全現狀進行一個總體的評估,零信任框架下的數據治理服務體系主要由以下三部分構成。
1) 以數據中臺為基礎構建的數據融合共享平臺。
2) 全面、規范的數據管理體系。
3) 貫穿全網域、全數據生命周期的信息安全體系。
如圖1所示,治理服務體系主要采用數據中臺作為數據底座,實現數據匯聚、開發、數據資產管理、數據服務和數據挖掘可視化等功能。支撐學校各業務系統和智能設備的數據共享與交換,讓各部門的工作協同聯動,做到數據流通驅動應用互聯互通。在數據處理上,首先融合匯聚各部門數據,再對融合數據進行錯誤監督和標準化,然后將準確、干凈的數據分類存儲后分發給有關業務部門,實現數據應用??傮w框架上,除了增加零信任技術保障信息安全,還從制度上加強數據質量監督,數據供給應用,應用反過來推動數據準確度、數據更新頻率、數據標準化,形成良性的數據質量提升閉環,不斷提高數據質量。
4 體系實現
治理服務體系實現的核心主要是三個方面:構建完善的數據治理體系管理制度支持數據的生產、交換、質量監督、標準化以及安全;數據中臺建設支撐數據采集、清洗以及共享;信息安全體系保障數據存儲、流通和應用安全。
4.1 數據管理制度的制定與實施
從數據的產生、共享融合應用、質量控制和數據安全保障四個方面梳理數據管理制度,貫穿了數據生產、流通、集成、共享、應用的整個生命周期,如圖2所示。
4.2 數據中臺建設
數據中臺是智慧校園數據治理體系的核心,通過數據中臺建設,得以實現數據從匯聚、開發、資產管理、治理和服務的全流程管理,治理后的數據再用于數據分析和挖掘,是實現數據資產價值最大化和數據智能化的必要條件。數據中臺的框架如圖3所示,是一個層次化的5層模型。
1) 數據采集與集成。
數據采集與集成是數據中臺的接入口,匯聚來自學校的軟硬件平臺運行產生的業務、數據庫、日志、文件等數據,將離散的數據資源匯聚整合,形成一個打通了所有信息系統原始數據域的數據湖,繼而實現數據共享。該層使用分布式計算平臺Hadoop將平臺分布式部署在私有云上,安全性高且可以實現負載均衡。
2) 數據存儲與管理。
第一層匯聚得到的數據是多源異構的,包括結構化數據、非結構化數據、半結構化數據。需要按照數據的種類和結構進行適配存儲。如:關系型數據采用HIVE存儲,大數據集存儲在圖數據庫、日志和通用文件采用HDFS。數據管理主要是根據數據的不同標準、機構以及語義等信息,制定數據標準管理和元數據管理規范。數據中臺通過流程自動化工具加上數據規范、流程制度相結合實現數據標準化,達到對數據格式標準、數據命名標準、接入標準、安全標準等多維度管控,包括數據代碼規范、隱私規則、格式、表命名原則等進行標準化處理。
3) 數據質量與治理。
經過第一層和第二層匯聚和標準化過后,業務數據變得集中有序,但是數據質量達不到直接共享與應用。還需要進一步的治理。數據治理主要進行數據規范、數據清洗、數據轉換和數據編排。數據規范是將不符合數據中臺要求的數據進行統一處理,如數據庫校驗等;數據規范完成后需要對低質量數據(屬性錯誤、缺失數據、重復數據等) 進行清洗提高數據質量;數據轉換將不適宜集成和應用的原始數據轉換為符合特定模式的目標數據;數據編排通過數據復制、虛擬集成以及基于本體建模的數據集成等方式,將標準化的多源異構相關數據集成,使其易于為用戶理解與應用。在數據治理的過程中,遇到缺省數據等技術無法提升質量的低質量數據,根據《數據質量管理辦法》,啟動數據反饋改進模式以及質量監督流程,督促數據源系統對數據進行修正維護。
4) 數據服務與共享。
第三層治理后的數據資源呈現有序、標準、合規的形態,形成數據門戶,在數據門戶中建設數據目錄,形成學校數據的各類主題庫,如教職工一張表、學生信息一張表、固定資產一張表等。這些治理后的高質量的數據即可開展數據共享,建立數據的接口標準,對接不同的上層應用,實現數據的融合,為學校各業務賦能。數據服務采用可靠、高效和可擴展的API接口方式實現。
5) 數據挖掘和可視化。
數據挖掘和可視化是數據服務的最后一個環節,是實現數據價值的主要途徑,主要基于機器學習實現。通過BI工具平臺可以實現數據的自由組合和統計分析,數據大屏可以更直觀地呈現學校業務和決策需要的數據分析結果,通過數據分級分類系統可以實現數據安全的有效管理。通過機器學習算法,還可以實現全局大數據開發:如學生學業預警、教師畫像、學生畫像、學生心理健康狀態預警等。
4.3 零信任框架下的數據安全體系構建
隨著高校網絡規模擴大、內部威脅增加、網絡邊界模糊,傳統的周界安全架構難以適應數據開放融合的需求,因此為適應當前校園信息安全新形勢,將零信任安全技術和原有的安全架構相結合,構建零信任框架下的校園數據安全體系,如圖4所示。
lt;E:\飛翔打包文件目錄003\電腦2025年06月上第十六期打包文件\3.03xs202516\Image\image9.pnggt;
圖4" 零信任框架下的數據安全體系架構圖
在網絡出入口部署零信任安全網關和控制器,設立零信任安全防護區,通過身份控制、設備認證、應用訪問控制、數據訪問控制等實現零信任技術的多層次驗證和審批。并啟用網絡流量監控、安全日志監控以及實時響應等零信任實時監控技術。在數據儲存網域,部署局域網絡防火墻隔斷,按照數據的安全級別對數據進行分級和隔離,建設專用內網區,保障數據存儲和交換安全。為應對因災害、停電或者刪除等意外性事件造成的數據流失,對重要數據進行容災備份。
5 體系應用
體系通過對教育數據標準化治理和自助式共享,實現數據的統一,常態化治理和交換,解決了數據標準不統一、信息不一致、數據共享難等問題。使得教育數據可以在各系統之間,各業務部門之間安全的互相調用和流通,同時對數據進行了采集和整合,為后期數據挖掘和分析奠定了基礎,將體系在成都醫學院應用,應用取得了以下實際成效。
1) 學校33個信息系統實現了統一身份認證,實現了“一次登錄,隨處漫游”的應用效果。
2) 以數據中臺為基,聯通了學校12個業務部門的36個業務系統,實現數據共享應用。梳理完成代碼標準200余條,數據項標準6 000余條,輸出了數據治理體系相關管理辦法和信息標準文檔7本。共治理748張數據表,新建主題庫表93張,累計治理數據量超過7 500萬條。共計發布資源目錄88個,為36個業務系統提供數據資源服務,日均數據交換量232萬條,累計數交換量4.4億條,如圖5、圖6所示。
3) 構建了“所見即所得”的數據共享新模式,簡化了數據共享流程;構建了以人員為中心的一張表主題,包括教師一張表、學生一張表、單位一張表等。
4) 組織拉通上下游系統業務需求,解決人事處績效考評、職稱考核,學生處新生數據共享等核心業務的需求痛點。
5) 形成了信息化建設制度規范,要求新舊信息系統建設和運行均按照標準進行,為學校智慧校園長遠發展奠定了堅實的基礎。
6) 基于零信任的數據安全框架應用后,數據流通和訪問安全得到了保障,體系建成后未發生數據安全風險事項,學校各類信息化數據的安全評估達標國家等級保護測評要求。
6 結論
智慧校園大數據治理是衡量智慧校園發展質量的重要標準之一,也是實現高?,F代化治理的重要支撐。本文提出一種新的基于零信任的智慧校園數據治理體系,在傳統周界安全的基礎上引入零信任安全系統強化數據安全,由零信任安全策略控制中心實施持續身份驗證、動態信任評估、最小權限訪問控制、公鑰數據加密等技術,解決了數據共享融通過程中的信任區內部威脅及人員不合規操作安全風險,解決了內網威脅橫掃風險。同時采用擁有豐富數據計算和存儲能力的數據中臺作為核心底座,并建立匹配數據全生命流通域的數據管理規范制度并實施。體系實現了安全地將多源、異構的智慧校園數據匯聚、清洗、融合、分析與應用,為學校各業務賦能。在成都醫學院的實踐效果證明該體系能解決數據融合難問題,提升數據流通能力,提高數據質量,實現數據更安全地共享和應用,支撐了各業務管理系統的數據流通,實現了數據應用價值,為構建新醫科數據驅動型智慧高校打下堅實可靠的基礎。下一步工作將深入研究數據資產管理和數據分級分類方法;探索數據挖掘和分析技術在智慧校園中的應用。
參考文獻:
[1] 教育部.教育部關于印發《教育信息化2.0行動計劃》的通知[A/OL].[2023-10-20].http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[2] 李敏輝,李銘,曾冰然,等.后疫情時代發展中國家高等教育數字化轉型:內涵、困境與路徑[J].北京工業大學學報(社會科學版),2022,22(1):35-46.
[3] 中共中央、國務院.中共中央、國務院印發《中國教育現代化2035》[A/OL].https://www.gov.cn/zhengce/2019-02/23/content_5367987.htm.
[4] 鄭黎明,魏孔鵬,李樹波.大數據背景下高職院校網絡文化育人途徑探索:以盤錦職業技術學院為例[J].遼寧高職學報,2023,25(9):104-108.
[5] 張輝,李健明,楊強.大數據視角下高校數據治理體系研究與實踐[J].中國高等教育,2022(S2):16-18.
[6] 熊余,儲雯,蔡婷,等.高校教育大數據應用支撐體系的設計與實踐[J].現代教育技術,2020,30(11):91-97.
[7] 蔡三發,靳霄琪,劉雨萌.數據治理視域下院校研究的信息化創新路徑:以T大學為例[J].現代教育管理,2023(1):22-30.
[8] 宋蘇軒,楊現民,宋子強.高校數據治理統籌管理體系的構成與實踐路徑[J].中國遠程教育,2021(11):58-67.
[9] 周煒.大數據視域下高校數據治理優化路徑研究[J].教育發展研究,2021,41(9):78-84.
[10] 張芳.高校智慧校園的建設實踐及創新應用:以中央財經大學為例[J].現代教育技術,2022,32(4):113-125.
[11] 錢海紅,王茂異,熊贇.高等教育數字化轉型的現狀與發展研究[J].大數據,2023,9(3):56-70.
[12] KINDERVAG J.No More Chewy Centers: Introducing the Zero Trust Model of Information Security[R].Forrester Research, Inc.2010.
[13] 劉國柱.零信任戰略與美國網絡安全的現代化[J].國際安全研究,2023,41(6):3-28,152.
[14] 吳信東,應澤宇,盛紹靜,等.數據中臺框架與實踐[J].大數據,2023,9(6):137-159.
[15] 鄧中華.大數據大創新:阿里巴巴云上數據中臺之道[M].北京:電子工業出版社,2018.
【通聯編輯:王 力】