連淑娟

摘 ? 要:數據質量決定數據價值。在挖掘高校數據價值的過程中,我們發現各高校的數據質量普遍較差,所以如何提升數據質量,成為了目前各高校信息化建設過程中的核心工作。本文以北京外國語大學為例,對業務數據進行了一系列的數據治理和質量評估工作,實踐結果表明經過數據治理可以顯著提升數據質量;同時,我們在項目實施過程中發現,通過技術手段進行數據治理僅僅起到了輔助作用,高校管理問題才是數據治理的關鍵。數據治理是一個長期的過程,需要管理和技術雙管齊下,數據質量才能不斷的獲得提升。
關鍵詞:大數據 ?數據治理 ?數據質量 ?高校信息化 ?質量評估
中圖分類號:G647 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)02(c)-0208-02
1 ?數據治理現狀
我國高校信息化歷經10多年的發展,信息系統已經逐步完善。但是信息系統建設時,由于是各業務部門牽頭進行的,缺乏全校統一的系統規劃和建設標準,導致很多高校雖然積累了大量的業務數據,但是數據質量普遍不高,造成了數據可用性較差及各部門之間共享數據難度較大的問題,這些問題已經嚴重制約了高校教育教學和日常管理的提升。因此,必須建立一套全校級別的數據治理流程體系,來對業務數據的全生命周期進行管理。
目前,高校數據管理方面存在以下不足。
1.1 數據不一致性
同一份數據在多個業務系統之間重復存在,產生了不一致現象,影響了數據的流動和整合。
1.2 數據多頭管理
很多高校由于缺乏全局規劃,造成了數據多頭管理的問題,進而造成了數據共享難、統計難的問題。
1.3 數據全生命周期不完整
目前,高校產生的數據、使用、維護、備份、過期等數據生命周期管理不規范、流程不完整,導致數據只能在較低層面進行分析,不能在高層面進行建模、挖掘,發揮其數據價值。
1.4 缺乏校級的數據質量管理體系
目前,高校各業務系統的數據質量主要由各部門分散管理,跨部門的數據質量溝通機制不完善,同時存在需求不清晰、數據隨機性強、數據交換效率不高等問題。
1.5 數據質量管理人手不足
目前高校各部門都存在數據質量管理人員不足、知識與經驗不夠、監管方式不全面等問題,缺乏統一的數據質量管控流程和系統支撐能力。
2 ?數據治理建設思路
2.1 業務問題分析
在實施數據治理之前,首先要對學校的業務數據情況進行梳理,從而制定數據治理的目標。我校的業務系統較多,近幾年積累了大量的數據,包括人事數據、科研數據、資產數據、教務數據、財務數據、留學生數據等,存在著同一條數據分散于各個業務系統的情況,從而造成了數據的不一致性,數據的權威性和準確性難以判斷。
2.2 落實數據目標
我校的各類業務、日常管理、數據填報等急需大量的數據做支撐。但數據治理工作不能一蹴而就,需根據業務需求確定數據治理的短期目標和長期愿景。
2.3 制定成熟度評估
為保證數據治理效果,制定我校階段性的數據治理內容和成熟度模型。在不影響現有業務的前提下,逐步推進數據治理框架,使得各項業務逐漸過渡到新的業務框架中來。我校結合當前業務需求,從組織機構、角色職責、流程監管、技術職稱等多方位考慮,制定了我校的成熟度評估模型。
2.4 加強頂層設計
高校的數據治理工作不能僅僅靠信息技術部門去完成,需要學校自上而下進行推進,校領導、各業務部門、信息技術部門等多方協作才可順利進行。因此,需要加強各部門負責人的數據治理意識,讓其認識到數據治理的重要性,劃分好相關業務部門的職責,以確保數據治理達到預期效果。
2.5 元數據管理
元數據管理是整個數據治理規劃的關鍵,它決定了信息架構如何滿足各業務需求。因此,我們從字段信息、業務規則、數據使用、專業術語、數據權限等進行了梳理。
2.6 數據標準制定
數據標準制定的目標是為了實現高校數據的完整性、有效性、一致性、規范性、開放性和共享性管理,進一步提升數據治理水平。它是一種規范性約束,是高校數據治理的依據和根本。前期根據我校的數據情況,制定了一套符合校情的數據標準。
3 ?數據治理系統建設
3.1 數據治理規劃
我校在前期數字校園建設實施中,建立了基礎的共享數據信息標準,但是校標的內容比較少,如組織機構、班級、房屋等信息標準,所以造成部分業務數據無法共享數據中心存儲入庫,影響數據中心的全面性,所以要補充信息標準以達到業務全面的覆蓋。此外,還需補充數據治理項目的各類規范、政策制度、管理流程等,加強數據中心整體業務的支撐。
數據治理最關鍵的是要確定數據源與數據中心的共享流程架構圖。第一步,基于學校現有的業務系統進行數據采集,包括人事系統、教務系統、研究生系統、科研系統、財務系統、資產系統、留學生系統等;第二步,將采集到的業務數據存儲在數據中心,通過一系列的工具將數據進行清洗、轉換為各個數據標準子集;第三步,將清洗好的數據交換給其他需要的業務系統,以實現數據的雙向互通共享;第四步,清洗后的數據更好的支撐上層應用,比如移動端應用、一站式服務大廳等。在項目實施過程中,數據標準是一個不斷更新不斷完善的過程,數據治理工作完成后,最后向全校公布數據中心標準。