張國寶
(河海大學,江蘇 南京210098)
2021年12月中央網絡安全和信息化委員會印發《“十四五”國家信息化規劃》,提出“建立高效利用的數據要素資源體系”“加強數據治理,提升數據資源開發利用水平”。這些政策都對高校的數據治理和管理的建設提出了明確要求。
數據管理和治理能力評估是數字校園建設水平的重要衡量方面。數據管理能力成熟度評估模型[1](Data Management Capability Maturity Assessment Model,DCMM)是我國首個數據管理領域國家標準,將組織內部數據治理管理能力劃分為八個能力域。
數據治理模型研究為數據治理實踐活動提供理論依據,高校數字校園建設在數據治理理論、框架與模型等方面的研究與實踐主要有:許曉東等人[2]從戰略高度提出對高等教育的數據治理,應且必將成為高等教育治理的一個重要組成部分;劉桂鋒等人[3]對國內外數據治理的要素、模型、框架等研究歸納,分析數據治理模型的類型、特點、問題、挑戰與機遇;余鵬等人[4]提出設計教育大數據平臺與數據治理框架;董曉輝等人[5]設計了一個高校教育大數據治理的參考框架,刻畫高校教育大數據治理的主要內容,并從活動視角提出高校教育數據治理體系構成要素[6];如孫嘉睿等人[7]對數據治理的體系架構、數據治理保障梳理分析基礎上分析具體業務領域的實踐。
除高校數據治理之外,還有其他行業基于DCMM或其他模型的治理評估研究,萬方等人[8]在警務領域依據DCMM進行了數據治理評估的研究探索;胡成等人[9]在電力行業基于“AHP+熵權”耦合構建供電企業數據治理成效評價模型。然而高校開展數據治理如何進行有效治理水平的量化評估,推動針對貫徹DCMM模型的數據治理,目前可獲知的研究還較少,構成本文研究的問題背景。
在已有的數據治理模型中,研究關注較多的是五種數據治理模型,即IBM數據治理委員會提出的四層要素(核心要素、促成要素、支撐要素、成效)治理能力成熟度模型、國際數據管理協會(DAMA)提出的DAMA-DMBOK2數據治理體系模型、國際數據治理研究所(DGI)提出的十大關鍵要素的ORF(組織、規則、流程)流程化模型、企業數據管理協會(EDM Council)發布的DCAM模型以及中國電子技術標準化研究院(CESI)牽頭制定的DCMM(數據管理能力成熟度評估)模型(GB/T 36073-2018),如表1所示。
根據表1所示,五種主流數據治理模型都有涉及對數據治理能力和水平的評估,其中具有量化評估評估參考性的模型中,以DCMM較為符合高校的特點。DCMM從制度設計、組織和人員、技術與服務、標準與規范的維度對數據管理能力進行解構,分解為具體的過程能力項,各個能力項對應劃分不同等級。DCMM能力成熟度模型對高校的數據治理水平評估更具參考性。文獻[12]在數據治理的成熟度模型比較方面進行了模型內容的差異比較研究。

表1 數據治理模型的評估內容比較
為了進行高校的數據治理水平的調查采樣,開展高校數據治理評估問卷設計。通過調查采樣把高校的數據管理和數據治理的實際現狀與數據治理評估模型相結合,以實現對高校的數據治理的建設水平予以量化評估。
DCMM(GB/T 36073-2018)是國家標準化管理委員會于2018年發布的現行國家標準,它給出了數據管理能力成熟度評估模型以及相應的成熟度等級,定義了數據戰略、數據治理、數據架構、數據應用、數據安全、數據質量、數據標準和數據生存周期8個能力域。它適用于組織和機構對數據管理能力成熟度進行評估。通過圖1所示的成熟度能力指標模型可更直觀地看到,8個不同的能力域可大致劃分為三類指標項,即從目標和職責、評估檢查、實施應用三個方面進行衡量。衡量數據管理成熟度水平通過指標項的建設實施情況對照評估,建設情況覆蓋指標項越多總體的成熟度水平越高,反之建設情況覆蓋能力指標項越少則總體的成熟度水平越低,總體可劃分為1至5個等級。

圖1 數據管理成熟度能力指標模型
問卷基于DCMM并參考全國DCMM符合性公共服務平臺(http://www.dcmm.org.cn/)的數據治理宣貫要求,設計面向高校數據治理水平的評估指標體系問卷,共8個方面28項能力指標。面向教育部直屬高校和江蘇省內高校進行問卷調研,并采用AHP方法進行調研數據分析。
依據DCMM設計數據治理水平調研問卷。按照DCMM分為8個一級指標、28個二級能力指標,對每個能力指標進行指標權重重要性(Weight)以及該指標的本校建設情況自評評估(Evaluation)兩個維度的調研。課題組選擇調研樣本為教育部直屬高校和省內高校共計116所,通過問卷星平臺進行問卷發布和調研,回收有效問卷并統計分析,結果如表2、表3所示。

表2 調研問卷結果——按學校統計

表3 調研問卷結果——按指標統計
為簡易比較分析,按照一級指標的維度初始化判斷矩陣M,如下。

把每個調研學校看作不同的評估方案,匯總每個學校評估方案的數據作如下分析:
利用和積法計算判斷矩陣M的最大特征向量為特征向量近似解:

矩陣的最大特征根為:

判斷矩陣的一致性指標和隨機一致性比率:

通過分析U1~U39的結果得分驗證可知,AHP方法分析結果和初始的治理水平評估得分(自評結果)存在差異,結果比較如式(5)所示。由于AHP的分析結果結合了其他學校建設情況的因素,學校U1較U39的數據管理和治理水平更高,結果更具相對合理性。

另外從調查收集的指標數據分析,在28項指標中數據戰略制定、數據管理職責明確、數據集成共享架構建設、制定數據服務的標準規范并實施、統一數據分析平臺建設分別獲得調查高校的更高權重,得分分別為170、173、170、170和167。從高校的自評估的數據分析,數據戰略制定、數據戰略目標實施、數據集成共享架構建設、統一數據分析平臺建設、制定數據服務的標準規范并實施的建設得分最高,分別為0.65、0.625、0.67、0.675、0.625。分析可知,被調查高校認為數據管理職責明確是數據治理最重要的方面,而在實際建設情況中未能很好地實現職責明確,數據集成平臺及數據分析實施普遍更好。
從調查評估數據看,高校的數據管理治理職責需進一步明確,如責任到人的數據管理機制、跨部門數據治理的協同機制等。從數據治理體系、治理實施工程的視角看,數據治理工作需要系統化和整體性的構建和實施,不僅包括治理的核心要素(質量管理、安全與隱私管理、生命周期管理)、支撐要素(數據架構、元數據與分類、數據日志和審計),還要包括外圍促進要素(組織架構、政策、數據權屬)等方面。文獻[13][14]對高校的數據治理的策略也在具體分析基礎上給出了數據治理的參考經驗。結合具體治理實踐,本文認為應堅持“流通為用,權責匹配,突出成效”的思路,加強以下3方面建設,不失為提高數據治理水平的策略選擇。
基于數據實現開放和規范化的共享方式,建立形成數據源頭部門、數據管理部門、數據使用部門三方協同參與的數據治理的機制,是實現數據“流通為用”“權責匹配”的重要保證。明確全生命周期下的數據權屬與責任匹配,實現數據提供者負責數據的質量、數據管理者負責數據的共享策略與安全、數據使用者明確數據的使用需求與反饋,三方協同使得數據的治理更加高效、數據的責任更為明確、數據的質量更有保證,從而實現更大程度數據挖掘和發揮數據效用。
數據列為與土地、勞動力、資本、技術同樣重要的第五生產要素。2019年4月國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》,提出加快培育數據要素市場,探索建立統一規范的數據管理制度。需要建立圍繞數據資產的管理規范制度體系,加強其權屬、流通、交易、銷毀等全生命周期的規范管理。從技術、制度、法理等不同層面落實數據安全責任、防范數據安全風險,形成權屬明確、安全規范的數據制度和管理規范并有效施行,保障數據治理成效的最大發揮。
場景化治理即圍繞數據應用的場景實現精細化數據治理。精細化過程是不斷地對數據提出“質疑”和需求確認的過程,最終能夠使得數據技術、管理與業務場景需求完全融合、無縫銜接,避免形式化的治理、概念上的治理,最終達到通過數據治理“精準”滿足業務需求。
從高校的實踐來看,更多呈現數據價值的業務場景需求按用戶對象可劃分為三類:一是直接面向師生個人的數據應用需求,如個人數據查詢、個人畫像等;二是面向各個業務部門維度的數據使用需求,如部門數據統計、部門數據共享等;三是面向學校全域的數據統計與決策分析需求,如數據統計報表、校情概覽、績效評價等。這些應用場景需要結合實際數據治理的實施深入實踐,通過數據應用的成效實現治理的目的。
本文基于DCMM進行高校數據治理水平的量化評估,具有較為明確的標準性、指導性和可操作性。對高校的數據治理進行了實踐探索與理論補充,為推進高校實施DCMM的標準,提升高校數據治理水平提供了一定借鑒與參考。不足之處在于:一是數據治理是一項長期的系統工程,因校因地差異較大,用一個具體標準衡量不同高校的水平高低,有“削足適履”之嫌;二是問卷采樣的樣本數量還較少,指標權重不能完全反映高校整體的數據治理的現狀水平,更科學合理地設定評價指標的權重是下一步需要研究的內容之一。