潘銀芳

摘要:隨著高校大數據技術的應用與推廣,數據治理的問題逐步凸顯:很多高校沒有整體數據標準,缺乏數據校驗,問題數據不斷沉積,造成大數據分析對領導決策的支持功能失靈甚至錯誤。同時,在智慧校園環境下應用系統微服務化、移動化增多,數據共享交換平臺中數據交換的壓力呈指數增長,數據管理部門對數據交換管理的難度和工作量迅速上升,利用傳統的數據交換共享平臺進行數據交換管理已經越來越不適應新的業務需求。該文作者對高?,F有業務系統大數據進行分析,通過構建恰當的數據治理模型,制定高校數據標準和工作規范,提出了高校數據治理委員會等機構的設立和功能建設,采用可視化設計方案設計數據治理平臺,提出全生命周期數據治理概念,覆蓋了數據對象動態發展的全過程,進而建立數據治理體系,在此過程中高校中信息化涵蓋的邊界得到重塑,信息化與高校核心業務實現進一步融合。
關鍵詞:數據治理;高校;全生命周期
中圖分類號:TP311.13? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)36-0029-03
Abstract: With the application and promotion of big data technology in colleges and universities, the problem of data governance has gradually emerged: many colleges lack a school-wide overall plan for data standards and implement them in accordance with the plan, lack a data verification mechanism, and continue to deposit problematic data, resulting in big data analysis for supporting leadership decision-making malfunctioned or even wrong. At the same time, in the smart campus environment, application systems have become more micro-services and mobile, and the pressure of data exchange in the data sharing and exchange platform has increased exponentially. The difficulty and workload of data exchange management by the data management department has increased rapidly, using traditional data exchange. The traditional sharing platform for data exchange management has become increasingly unsuitable for new business needs. The author of this article analyzes the big data of the existing business systems in colleges, and by constructing an appropriate data governance model, formulating university data standards and work specifications, proposing the establishment and functional construction of institutions such as the university data governance committee, and adopting a visual design plan to design data governance. The platform puts forward the concept of full life cycle data governance, covering the entire process of the dynamic development of data objects, and then establishing a data governance system. In this process, the boundaries covered by informatization in colleges and universities are reshaped, and informatization is further integrated with the core business of colleges and universities.
Key words: data governance; colleges and universities; full life cycle
1 引言
近年來,隨著大數據技術的推廣應用,高校信息化建設進一步發展,在原有業務系統信息化的基礎上,利用其產生的海量數據以及其他外部數據,進行挖掘和分析,通過建立分析模型,開發出了很多諸如行為畫像、與情監控預警、就業指導建設、消費分析等大數據應用。在這些應用的開發和使用過程中,數據治理的問題逐步凸顯:很多高校沒有整體數據標準,缺乏數據校驗,問題數據不斷沉積,造成大數據分析對領導決策的支持功能失靈甚至錯誤。同時,在智慧校園環境下應用系統微服務化、移動化增多,數據共享交換平臺中數據交換的壓力呈指數增長,數據管理部門對數據交換管理的難度和工作量迅速上升,利用傳統的數據交換共享平臺進行數據交換管理已經越來越不適應新的業務需求。
在這種情況下,通過高校數據治理平臺,對數據進行統一治理,將學?,F有分散、重疊、雜亂的數據,進行統一整理,制定全校性的數據標準,對數據進行全生命周期管理,使業務系統保持數據健康、業務穩定,進而為學校決策提供大數據支持。
1.1 研究意義
運用對高?,F有業務系統大數據進行分析,通過構建恰當的數據治理模型,制定高校數據標準和工作規范,提出了高校數據治理委員會等機構的設立和功能建設,從中觀層面上完善了數據治理管理體系建設的相關理論。數據治理平臺在設計過程中采用可視化設計方案,提出全生命周期數據治理概念,覆蓋了數據對象動態發展的全過程,具備較強的創新意義,本項目設計的數據治理平臺,是高校大數據應用建設中必不可少的前提條件,只有對經過有效治理的信息化業務數據進行挖掘、建模、分析才能產生正確、科學的決策支持;另一方面,通過數據治理體系的建立,高校中信息化涵蓋的邊界得到重塑,信息化與高校核心業務進一步融合,教育信息化在高校發展過程中的實際作用日益增強。
1.2 國內外同類研究工作現狀
數據治理的概念起源于信息(IT)治理,李維安等[1]認為IT治理概念的分析包含對諸多概念的理解。美國學者索尼爾.索雷斯[2]認為大數據治理是廣義信息治理計劃的一部分。鄭大慶[3]從大數據治理目標、權力層次、對象及范圍、解決的實際問題4個維度,闡述了大數據治理概念的內涵。Weber[4]從IT治理和組織理論的概念延伸到數據治理,他提出了一個包含數據質量角色、決策區域、責任的職責分配矩陣。
1)數據治理模型和框架:包冬梅等[5]提出包含促成因素、范圍和實施評估三個內容的數據治理框架;曾凱[6]提出包含數據各個層次的通用數據治理框架;趙安新[7]提出包含數據層、交換層、平臺層和展示層的數據治理框架;李林、錢丹丹[8]提出RACI模型矩陣,通過包含(R)負責執行活動的角色、(A)對活動負全責的角色、(C)擁有完成項目所需的信息或能力的人員和(I)應及時通知結果的角色構成模型矩陣 ;余鵬[9]提出基于“五元管理”的教育大數據治理系統功能框架。Otto[10]針對電信行業數據治理的組織架構設計進行了研究,他挑選了兩個具有代表性的架構設計:一種以BT公司為代表的項目驅動,自底向上的架構,另一種以德意志電信(Deutsche Telekom)為代表性的結構化,自頂向下的架構;Lai Kuan Cheong[11]通過調研發現:一旦缺乏清晰的角色定位和責任界定、缺乏對改進數據質量任務的授權,自適應數據治理模型的數據管理功能會受阻,他針對此種情況提出了一種強調IT和業務相協作的數據治理框架。
2)數據治理平臺設計:張寶國[12]提出了一種閉環數據治理體系架構。金釗[13]設計的數據治理平臺主要包括數據資產、數據安全以及數據質量管理三個應用功能和一個數據服務功能。
國內外文獻調研顯示,學術界針對大數據環境下高校數據治理進行了大量的研究,這為本研究提供了良好的現實基礎,但這些研究重點在于宏觀和中觀層次上探討大數據治理的體系內涵,對于大數據治理平臺的設計和實現還僅僅停留在理論階段,僅有部分研究者提出了傳統的針對數據管理的治理平臺實現方案。本項目提出將數據治理過程可視化,降低數據管理門檻,從而構建一個包含數據起源、清洗、開放的全生命周期數據治理平臺,更加符合高校信息化管理實際需求,具備可操作性和創新性。
2 數據治理平臺功能設計
2.1 數據治理規范制度建立
數據是學校重要資產,通過對學校各個業務系統數據資源進行充分調研,形成數據資源情況報告,以教育部信息標準為基礎,結合學?,F有數據情況和各管理業務標準,如人事處、教學處、學工處標準,然后再經過充分的實際調研工作之后,將根據學校的實際情況進行刪減,并形成最終的學校事實信息標準。
制定校園數據集成、更新管理辦法等制度和規范,以保證數據集成、更新、管理等活動正常運行,保證學校大數據系統的正常服務。
在學校數據治理建設的工作中,會基于學校的實施檢驗,最終出臺《學校數據標準》《數據管理辦法》《數據標準管理辦法》《元數據管理辦法》《數據質量管理辦法》等管理制度,將學校的數據治理工作形成體系化的建設
2.2 數據治理平臺功能模塊
2.2.1 元數據管理功能模塊
元數據是數據治理的基礎,元數據管理功能模塊包含元數據的采集、存儲、分析。
元數據管理基于OMG的CWM標準規范,形成整個校園信息系統的數據視圖,梳理業務系統數據之間的關系,以實現對各個業務系統數據運行的全面分析。
2.2.2 數據集成管理模塊
數據集成管理模塊主要包括數據清洗和數據集成兩部分。主要包含以下功能:
數據清洗列表,顯示數據清洗作業列表以及狀態,設置批量和個性化操作。數據清洗按照預處理、格式處理、邏輯處理、業務關聯性以及驗證的步驟進行。數據集成作業列表,展示了當前已設置的作業。支持作業的批量開啟和關閉,作業的調度時間設置。數據集成作業設置,在數據屬性維度上進行處理,即可以是多個表的屬性合并為一個表的屬性,也可以把一個表的部分屬性生成一個新表,可以設置表中字段之間的對應關系以及表與表直接的關聯關系。
2.2.3 數據質量管理模塊
我們設計的數據質量管理定位在多維度的全生命周期數據質量管理,通過量化數據質量指標對數據質量進行全生命周期監測,選擇通用數據質量標準,建立一個監測、評價、分析、改進的閉環過程。
2.2.4 系統管理模塊
包含賬戶管理、角色權限管理、數據權限管理、功能權限管理、角色用戶查詢、用戶訪問日志、系統數據備份等系統功能。
3 數據治理平臺實施
3.1 數據調研