



摘" 要:當前,高校智慧校園建設存在各業務系統分散、頂層規劃缺乏、數據思維欠缺、系統無法有機融合等問題,一數一源建設成為高校智慧校園建設的重難點。針對高校智慧校園數據的現狀和問題,提出基于身份體系的一數一源數據治理建設路徑,從重新認識治理、建立身份體系和監控體系、引入數字底座三個方面深入探討,通過建立統一的組織架構、身份認證和數據庫,推動實現一數一源和多源校核,解決數據難以互通的痛點,為高校數字化轉型奠定理論和實踐基礎。
關鍵詞:高校;智慧校園;一數一源;數據治理;身份體系
文章編號:1671-489X(2025)04-00-07
DOI:10.3969/j.issn.1671-489X.2025.04.0
0" 引言
2021年3月發布的《教育部關于加強新時代教育管理信息化工作的通知》明確要求,到2025年,新時代教育管理信息化制度體系基本形成,信息系統實現優化整合,一體化水平大幅提升;數據實現“一數一源”,數據孤島得以打通,數據效能充分發揮;現代化的教育管理與監測體系基本形成,多元參與的應用生態基本建立;教育決策科學化、管理精準化、服務個性化水平全面提升,支撐構建高質量教育體系[1]。2021年7月發布的《教育部等六部門關于推進教育新型基礎設施建設 構建高質量教育支撐體系的指導意見》指出,加強智慧校園新型基礎設施建設,支持有條件的學校利用信息技術升級教學設施、科研設施和公共設施,促進學校物理空間與網絡空間一體化建設[2]。對高校智慧校園進行全面“體檢”,發現存在師生數據不一、系統關聯不強等問題。隨著智慧校園的持續建設,學校的數據量不斷增大,高校信息化部門逐漸從后臺走到前臺,數據治理成為一項亟待加強的工作。
1" 高校智慧校園數據治理現狀
1.1" 數據治理的定義
國際數據管理協會(DAMA國際)將數據治理定義為在數據資產管理過程中行使權力和管控的過程。中國電子技術標準化研究院聯合多家企業和高校提出的數據管理能力成熟度評估模型(DCMM)將數據治理概括為綜合數據管理過程、活動以及制度規范等多方面內容的模型[3]。該模型對數據能力進行分析、總結,提煉出組織數據管理的數據戰略、治理、架構、應用、安全、質量、標準和生命周期等8個領域、28個二級過程域、建設目標、發展等級等方面的描述,旨在提供一個全方位組織數據能力評估的模型,助力提升組織的數據管理實力。
高校的數據治理更傾向于對數據資源進行管理和控制,包括數據的收集、存儲、處理、分析和使用等方面,可以分為戰略層、組織層和技術層三個層次:戰略層關注數據治理的目標和策略;組織層關注數據治理的組織結構和流程;技術層關注數據治理的技術工具和平臺。治理過程中的項目實施和運作需要依賴數據治理組織、數據治理流程、數據治理策略和數據治理技術。
1.2" 數據治理的必要性
高校的數據質量直接影響數據的使用效果。數據準確性和完整性的提高,可以提升數據的流通性和交流效率,促進跨學科數據的整合和應用。數據治理成為高校智慧校園建設的必然要求。
1.2.1" 數據治理是智慧校園向智能校園轉變的必然要求
從高校建設來看,隨著大數據、人工智能等信息化技術手段的創新發展,高校可以通過數據挖掘實現數據資產價值最大化,為高校事業發展提供數據決策支撐。數字化轉型為高校內涵式發展提供了巨大可能,也對數據的規范性、數據治理能力提出更高要求[4]。
1.2.2" 數據治理是高校實現治理體系現代化的必然要求
從高校信息化建設目標來看,高校要進一步認識數據作為新型生產要素的重要作用,貫通學校各環節運行的數據,加快制定一套遵循高等教育發展規律、普適性和可操作性兼備的數據資源配置規則,保障數據治理工作有序開展,為高校治理體系和治理能力現代化奠定堅實基礎。
1.2.3" 數據治理是高校信息化與教育深度融合的必然要求
從高校信息化建設內容來看,數據治理是高校信息化與教育深度融合的必然要求。教育部印發的《教育信息化2.0行動計劃》把信息技術與教育深度融合作為主要任務之一。高水平的數據治理既能夠為高校提供科學決策依據,用數據優化教學、科研和管理,還能保障信息安全,促進資源共享等。但當前部分高校的不同部門或系統之間的數據無法有效共享和整合,存在數據孤島問題,無法對教學工作進行多維度、全方位的分析和研判。高校信息化建設內容應及時將工作重心調整到數據治理上,以數據為依托,實現信息化與學校核心工作的深度融合[4]。
1.2.4" 數據治理是高校信息技術部門有效發揮作用的必然要求
從高校信息化部門的定位來看,部分高校信息技術部門通常被定位為教輔部門,但隨著大數據技術的融入和用戶對信息化服務的新需求,數據資源已經成為學校重要的公共資源,學校對數據的需求也日益迫切。這一發展趨勢要求高校信息技術部門有效地進行數據治理,為學校提供全方位的數據服務和保障。同時,信息技術部門地位的提升,有助于其更好地發揮作用,切實有效地提高數據服務質量和數據治理水平[4]。
1.3" 高校智慧校園數據治理工作存在的問題
從數據治理工作的決策和執行方式來看,高校數據治理工作目前成熟度依然較低:在業務層面,由于沒有構建完善的數據標準體系,導致數據標準和數據應用場景模糊,治理工作推進緩慢;在管理層面,由于業務部門認知不深入,缺乏充分宣導,導致不同部門對數據的理解未在業務層面達成一致,且數據部門的管理處于相對弱勢地位,工作開展較為被動。
從數據治理工作開展情況來看,部分高校持續陷入發現問題和解決問題的低效循環中:在數據治理效果方面,目前治理工作主要從數據問題單方面入手,大多側重技術層面,主要為解決獨立業務問題,導致治理成果無法整合,也無法形成系統、科學、規范的體系框架[5];在數據治理工具方面,采用項目主導的碎片化形式,在頂層規劃不完善的情況下,數據治理的目標和任務尚待明確,部門間的溝通和協作有待優化,投資效率和建設質量亟待提升。如果不能有效解決這些問題,高校的數據治理會難以向更成熟的階段發展。
2" 高校智慧校園數據治理問題成因剖析
2.1" 頂層規劃缺失,統籌協調不足
在高校數據治理工作的決策和執行層面,校級領導對數據治理的宏觀認識與戰略眼光是核心與關鍵。頂層規劃應包括數據治理的目標、任務、責任、流程等方面的內容,頂層設計的缺失導致高校數據治理工作無法有效統籌協調、協同推進[5]。目前,基于頂層設計和全局思維的信息化建設在總體規劃方面尚待優化和提升,高校在實施數字化戰略行動的統籌謀劃和協調推進方面力度不足,尚未形成多部門協同聯動的局面。
2.2" 數據思維欠缺,價值認知不足
信息化在高校治理體系和治理能力現代化建設中發揮的作用不夠充分,主要是因為基于數據開展的應用(如學生生活管理、教學和學習評價等)仍處于較低水平,主要體現在以下幾個方面。
2.2.1" 系統建設思維陳舊
早期的信息系統建設以應用建設為主,主要解決特定場景的特定問題,由業務部門主導,信息化整體架構缺乏統一的規劃和數據標準。業務部門往往認為數據來源于本部門工作的積累,隱含著部門權利,在共享數據方面有所顧慮;有些部門擔心暴露原有數據的缺陷而引發問責,不敢共享[6]。近年來,各高校陸續將信息化部門劃歸為職能機構,希望由信息化部門系統性推進學校的整體信息規劃,進而推動本校信息化發展,但有些信息化部門的弱勢地位仍未完全得到改善,在工作中存在拖延和畏難情緒,影響數據治理工作推進。
2.2.2" 數據質量參差不齊
在早期的業務系統建設和運行過程中對數據質量考慮不足,在數據處理方面存在軟件設計不規范、數據結構設計不合理、關鍵數據缺乏校驗等技術缺陷[6]。業務數據維護往往由多個技術部門或業務部門合作完成,導致數據修改、備份、傳遞、共享、公開等權限不清晰,甚至存在隨意刪改結果數據的情況。同時,一些需要多部門相互協作的業務系統,由于協作機制不暢而導致過程性數據缺失,也嚴重影響了數據治理。
2.2.3" 數據服務和監管不足
數據創新服務是實現數據價值的重要過程,實現數據創新服務需要數據服務應用接口和數據開放系統規范兩個條件。前期的信息系統缺乏對可供檢索的數據接口的規劃,導致數據開放的需求無法得到滿足[6]。在數據的全生命周期中,隱私保護和數據安全需要持續更新技術,如加密、脫敏、日志跟蹤、數據審計、法律和規范化管理等。近年來,隨著大數據的興起,安全問題頻發,高校日益重視安全問題,但相關應用案例和研究仍很有限。
2.3" 系統融合困難,數據難以互通
高校信息化建設涉及對教學、科研、管理等方面進行信息化改造,并將各個子系統進行集成和融合,實現系統之間的數據互通和共享。但在實際情況中,由于高校信息系統的多樣性和復雜性,不同子系統之間的技術架構、數據格式、接口標準等存在差異,導致系統融合困難。不同系統的獨立開發和維護導致數據在不同系統之間無法無縫對接,造成數據孤島和重復錄入的問題。高校內部各個部門和單位之間信息化建設水平和需求差異較大,加之傳統的管理體制和文化等原因,部門之間缺乏有效的溝通和協作機制,導致數據流程不暢、信息沉淀等問題,數據難以互通。傳統的煙囪式IT建設方式讓高校外部數據和內部數據相互隔離、內部數據之間不能互通,極大影響了數據的價值創造[3]。
2.4" 治理技術有限,業務支撐困難
在數據治理技術的應用層面,Gartner技術成熟度曲線通過評估當前的采用水平和被主流采用的年數來衡量技術成熟度,可以從功能豐富性和主流性兩個維度量化新技術的成熟度。根據Gartner技術成熟度曲線,新技術從誕生到最終成熟商用,一般會經歷五個階段,其中,圖數據管理系統、主數據管理、數據工具集、數據分級分類等領域是工具發展的重要方向[7]。
國內主流的數據治理平臺廠商在數據集成、數據清洗、領域模型、數據輸出方面具備較強的支撐能力,屬于大而全的數據治理平臺,但在業務貼合程度、應用場景的匹配程度方面還有待深入研究。高校身份數據通常來源于多個系統和平臺,涵蓋學生管理、人力資源、財務等多個領域,且信息標準不統一,各類系統之間缺乏互通互聯,導致數據治理工具難以全面支持多源數據的集成與統一管理,也無法實現數據的完整整合、展示和開放。
3" 基于身份體系的數據治理路徑
3.1" 重新認識治理,從治標到治本
3.1.1" 重建對數據治理的認知
傳統的數據治理只關注數據本身,忽略了數據背后的本質問題,導致治標不治本。從解決方案角度出發,可以把數據治理方式通俗比喻成家政式和倉儲式:家政式是指請家政人員整理家里的物品
(數據),可過一段時間,物品(數據)還是亂的;倉儲式是指參照大型倉儲管理,依照標準、規范的進出庫操作原則,明確數據從哪里來、到哪里去、如何以統一形式流通等范式化要求。從以“人”為源的視角,將倉儲管理的概念類比至身份數據治理領域,從身份治理透視身份數據運轉規則,包括身份數據的生成、采集、運用、更新等全生命周期,并建立適用于這些過程的通用約束機制。
3.1.2" 明確高校范疇身份標準三要素
1)人員身份標準編制,包括組織身份類型劃分、ID標準、身份數據字段標準、身份狀態標準、人員和組織關系定義幾個方面。高校內人員類型復雜,應首先考慮從哪些維度、層面將人員的身份類型定義為權威、有邏輯、可擴展的層級分類。當賦予人員組織身份后,應對身份ID進行規范化、標準化定義。同時,除了自然人數據與身份類型數據外,應該以流程為單位,對因業務產生的數據制定相關標準。
2)身份數據質量,包括身份數據治理組織、身份數據質量摸底、身份數據治理、身份數據運維。身份數據標準建設不能靠某一個部門推動,而是應依據身份標準建設周期,讓身份質量摸底、治理、運維環環相扣,形成閉環。
3)身份數據使用。規范身份數據流向梳理、身份數據字典、身份數據映射方式等。
3.2" 采用身份治理成熟度模型進行全生命周期治理
3.2.1" 身份治理成熟度模型
身份標準建設強調從身份數據的全生命周期角度梳理業務流程,將流程中涉及的身份數據進行規范化處理。身份標準落地的本質是通過聚合身份數據和抽象身份業務來提供身份服務。采用身份治理成熟度模型全面評估身份數據標準建設效果,持續監督身份質量情況。身份治理成熟度模型包括三個維度。
1)個人維度。從個人維度評估治理的成熟度,需要明確人員是否具備正確的數據觀念和身份數據治理意識。此外,根據不同身份類型進行評估,體現在對不同對象(尤其是師生)個人畫像的延展能力上,評估治理工作的成效是否能使用戶畫像更加豐富、動態、多維,并且能夠支持畫像的成長性。
2)政策維度。通過政策視角評估以身份標準為核心的身份治理成效,包括是否形成完善且嚴格的層級管理組織,是否形成規范和標準的制度,以及是否在實踐落地層面實現流程化和標準化。
3)能力維度。能力評估集中在身份數據的建設能力上:一方面體現在身份數據標準的建設上,特別是身份主數據和元數據的標準化情況;另一方面體現在技術能力上,包括身份數據的采集、存儲、處理和運營。這些能力的發展與提升是身份治理成熟度的關鍵。
3.2.2nbsp; 身份數據的全生命周期治理
在全生涯服務中,精準性是核心要求。高校應重視和尊重用戶的生涯信息,并保留與每一個生涯階段相關的所有數據和痕跡。在生涯服務基礎上,要持續聚合和挖掘師生身份標簽,構建學業、職業生涯畫像,并與多個業務平臺聯動,建立精準身份橋梁,為師生的發展提供精準的教育、管理、服務、關懷、就業和招聘等數智化場景服務。通過全生命周期治理身份數據,高校可以實現更加智能化和個性化的校園管理與服務,提升整體運營效率和用戶體驗,助力數字化校園持續發展。
3.3" 引入數字底座,實現一數一源
3.3.1" 智慧校園數字底座建設目標
通過智慧校園數字底座,構建統一組織架構、統一身份認證、統一數據倉庫,更好地推進項目建設的規劃、設計、建設和實施。各業務系統不是獨立建設組織架構、人員角色和數據庫,而是遵循學校統一的技術要求范式。身份數據能夠給各個平臺賦能,確保數據統一,避免多庫、多人、多角色、多身份的問題。由統一的中心負責維護全校的人員身份、組織架構、數據倉庫,確保數據安全、有序。
3.3.2" 數據倉庫建設
數據倉庫建設應遵循安全性、一致性和反范式建設三個原則。數據倉庫將統一存放經過確權后的基礎數據表,各二級單位或廠商的系統應用開發過程中所有數據需求均由數據倉庫提供支撐。原則上不允許二級單位或廠商重復建設數據倉庫和數據表,只有權威部門擁有對數據的修改權限,其他數據參與者僅能進行數據的查看操作,無權對數據進行修改。
對數據進行清晰準確的分類管理,以便數據的查找和使用。按照一般校域數據的情況,可以將數據劃分為教職工管理數據集、學生管理數據集、學校概況數據集、教學管理數據集、科研管理數據集等主數據集,在每個數據集下創建數據子集,根據具體業務場景進行子集的創建。原則上,后續新產生的數據需要注冊到以上數據集中。如果無法歸檔到以上數據集中,要先申請,經充分交流、整體規劃后再創建。一數一源數據來源如圖1所示。
3.3.3" 身份認證體系建設
統一身份認證體系是關鍵。以法律身份(ID)為核心構建統一的身份認證體系底座,實現基于法律身份的賬戶(Account)、認證(Authentication)、授權(Authorization)、訪問過程記賬(Account)、審計(Audit)一體化一站式“身份保障、事前授權、事中管控、事后審計”全生命周期管理功能,如圖2所示。
1)基于身份認證體系底座,形成一體化身份目錄框架體系。面向全校IT資產中的三類人員和各類應用系統的系統層、應用層、數據層的賬號,構建統一的主賬號和從賬號映射關系,形成一體化身份目錄框架體系,確保全校身份—賬戶數據的完整性和不可否認性,以及數據源頭的唯一性和法律性。
2)基于身份認證體系底座,實現全校IT資產閉環管理。面向全校IT資產構建統一的訪問入口收斂、單點登錄(Single Sign-On)、特權賬號和指令管控、程序調用接口、各類安全的多因素認證(MFA)、強密碼自動修改、僵尸賬號智能發現與預警等技術。為全校IT資產中的三類人員和應用提供統一的主機、網絡設備、應用、數據庫、云等全棧資源訪問通道,實現“一個主賬戶—從賬戶”映射,打通、管控和服務全校IT資產,包括但不僅限于業務數據、應用、系統、設備和資源。基于零信任安全框架的高校IT資源閉環管理如圖3所示。
3)基于身份認證體系底座,構建全面日志監控分析體系,實現身份—賬戶訪問涉及的IP地址、MAC地址、硬件設備系列號、應用系統、數據庫或數據文件等網絡空間資源物理和邏輯屬性的可視化監控與智能分析;實現對任何用戶、任何應用、任何地方的數據產生、訪問和修改的全程跟蹤、記錄與審計。甄別數據的真正源頭,為一數一源、多源校核治理工作提供技術支撐和依據,真正實現高效的一數一源治理工作。面向一數一源、多源校核的數據底座如圖4所示。
明確了身份角色、組織機構,一數一源就有了保障,從而深入推進智慧校園3.0建設。數字底座的建立可以從更深層次解決數據、智慧校園建設,師生服務、大數據資產等問題。
3.4" 推進項目管理,統籌全校建設
數據治理項目是一個復雜而艱巨的任務,要在實踐中總結出一套適用于高校范疇的身份數據標準建設方式,可以按以下五大階段實施。
3.4.1" 摸透家底:身份數據標準分類規劃階段
高校的身份數據標準建設需要所有數據提供方和使用方的共同努力。通過項目啟動會,明確項目目標,并以結果為導向確定工作開展形式,如業務需求訪談等。高校主要涉及學生、教工和其他人員三類人員,對應的身份權威源部門包括教務處、研究生院、學工處、人事處、后勤處和校友會等。定義身份數據標準體系框架和分類,規劃身份數據標準建設的維度、關鍵要素及可能的產物,為身份數據標準建設的實施提供初步框架。基于身份類型維度,以權威資源部門為主,深入實際場景,調研身份類型劃分、歸口管理部門、現有身份數據業務含義和數據項屬性規則等,明確數據使用方的預期、訴求和對業務系統數據現狀的需求。
3.4.2" 厘清要素:身份數據標準體系建設階段
身份數據標準體系的建設需要先進行調研,深入分析調研結果,并按照從整體到局部的思路制定身份數據標準制度。同時,分析業務和數據的關系,明確身份數據在業務流程和協同管理中的作用與影響。身份數據標準包括身份數據元標準、身份數據代碼表等內容。身份數據元標準根據身份數據的三大分類(自然人數據、身份類型數據、身份業務數據)對身份主數據進行梳理和元數據定義。同時,根據業務流程的主線,梳理不同身份類型在其生命周期內所涉及的身份數據,并將可能產生的身份數據映射到身份數據元標準上。
3.4.3" 達成共識:身份數據標準評審發布階段
在身份數據標準正式發布之前,廣泛收集身份數據相關部門、業務部門等對標準初稿的意見,通過與各部門進行標準共創,與相關部門達成一致,確保后續落地實施過程的順暢。身份數據標準的落地,首先應通過試點建立共識,再逐步推廣,并在實施過程中不斷優化和更新身份數據標準;其次,在落地試運行過程中需要加強人員培訓工作,建立身份數據標準管理工具和閉環管理機制,推動數據生產、使用和維護等工作;再次,根據試運行落地執行效果,對身份數據標準進行修訂和完善,并與校方相關部門達成共識,逐步形成適用于本校的身份數據標準;最后,對身份數據標準進行最終審議決策,組織各相關業務單位對標準定稿進行會簽,并在全校發布。
3.4.4" 促進應用:身份數據標準落地執行階段
身份數據標準的落地執行分為方案準備、方案實施、方案驗收和跟蹤評估幾個階段,保證落地實施全鏈路的完整,增強標準落地的效果。
1)方案準備階段:開展身份數據標準落地各環節的人員培訓工作,建立身份數據標準管理工具與閉環管理機制,明確各相關部門承擔的建設任務,落實責任。
2)方案實施階段:各業務系統結合實際情況執行身份數據標準,通過解決各個業務部門實際遇到的身份問題,以用促治,推動數據權威源和各業務部門按照相關規范進行數據生產、使用與維護等。
3)方案驗收和跟蹤評估階段:開展多次階段性評估,邀請數據生產方、數據使用方、標準制定方參與評估,綜合評價身份數據標準落地的實施成效,跟蹤監督標準落地流程執行情況,收集標準修訂需求,根據實際情況適當調整標準。
3.4.5" 樹立循環:身份數據標準更新維護階段
在身份數據標準的實施過程中必須定期進行維護,確保標準的有效性,形成良性循環,讓身份標準持續為業務賦能和增效。這其中包括持續跟進和修正前期階段的重點與難點工作,并規范身份數據標準的需求管理工作,同時制定身份數據標準在中后期的管理組織結構和策略流程。身份數據標準維護應對身份治理成熟度進行評估,以此為基準確定身份數據標準的更新角度,并制定適合各業務部門和應用的落地方案與計劃。后期,可以建立一個常態化的身份數據標準管理工作組,負責日常的標準維護工作,確保身份數據標準的持續更新與優化。
4" 結束語
數據治理工作是一項復雜且艱巨的任務,需要全校范圍內的合作和協調。高校以教育數字化為目標,從智慧校園建設逐步邁向智能校園,以身份治理為主線的建設方式順應了業務的需求,從源頭上入手優化治理方式,明確了全生命周期的身份數據,讓身份精細可信。智慧校園建設的步伐不會停歇,以身份數據為抓手、頂層規劃為指導的數據治理理念抓住了治理的本質,助力高校信息化發展實現跨越式升級。
5" 參考文獻
[1] 教育部關于加強新時代教育管理信息化工作的通知[A/OL].(2021-03-22)[2024-04-30].http://www.moe.gov.cn/srcsite/A16/s3342/202103/t20210322_521669.html.
[2] 教育部等六部門關于推進教育新型基礎設施建設 構建高質量教育支撐體系的指導意見[A/OL].(2021-07-20)[2024-04-30].http://www.moe.gov.cn/srcsite/A16/s3342/202107/t20210720_545783.html.
[3] 周煒.大數據視域下高校數據治理優化路徑研究[J].教育發展研究,2021,41(9):78-84.
[4] 張巍,張鵬,郭曉明,等.數據治理挑戰與對策[J].中國教育網絡,2020(11):22-24.
[5] 宋蘇軒,楊現民,宋子強.高校數據治理統籌管理體系的構成與實踐路徑[J].中國遠程教育,2021(11):58-67.
[6] 董曉輝,鄭小斌,彭義平.高校教育大數據治理的框架設計與實施[J].中國電化教育,2019(8):63-71.
[7] RUSSOM P, FEINBERG D. Hype Cycle for Data Manage-ment[R/OL].(2021-07-27)[2024-05-12].https://www.gartner.com/en/documents/4004072.
*項目來源:2023年度浙江省“尖兵”“領雁”研發攻關計劃項目(2022C01SA131267)。
作者簡介:岳志強,福州大學網絡安全與信息化辦公室主任,副教授。