文|金海峰 董菊香 李春香
隨著電子政務(wù)各領(lǐng)域應(yīng)用不斷的深入,各地大數(shù)據(jù)中心的成立,電子政務(wù)數(shù)據(jù)資源開始聚集,數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源的地位日益凸顯。數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)應(yīng)用、跨機構(gòu)資源管控、共享開放與互操作等問題日益成為各地電子政務(wù)領(lǐng)域中突顯的問題。這一問題的解決之道,在于數(shù)據(jù)治理。
近年來,圍繞大數(shù)據(jù)治理相關(guān)的實踐和研究探索。取得一些成功經(jīng)驗,如華為將數(shù)據(jù)管理工作分為兩個階段:第一階段通過數(shù)據(jù)治理,實現(xiàn)數(shù)據(jù)清潔,提升財報準(zhǔn)確與業(yè)務(wù)流打通;第二階段通過建設(shè)數(shù)據(jù)底座,數(shù)據(jù)服務(wù)化,支撐數(shù)字化轉(zhuǎn)型。而銀行業(yè)自2018年5月,銀保監(jiān)會發(fā)布《銀行業(yè)金融機構(gòu)數(shù)據(jù)治理指引》以來,各行從數(shù)據(jù)治理架構(gòu)、數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)價值實現(xiàn)、監(jiān)督管理等方面規(guī)范銀行業(yè)金融機構(gòu)的數(shù)據(jù)管理活動。將數(shù)據(jù)治理提高到銀行常規(guī)管理的戰(zhàn)略高度,明確要將銀行數(shù)據(jù)治理工作常態(tài)化、持久化,標(biāo)志著我國銀行業(yè)數(shù)據(jù)治理新時代的正式啟幕。
然而,這些領(lǐng)域的數(shù)據(jù)治理與政府大數(shù)據(jù)中心的最大區(qū)別是:大數(shù)據(jù)中心面對的是各機構(gòu)、各系統(tǒng)歸集的數(shù)據(jù);同時,它既不是IT 公司,也無具體特定領(lǐng)域的行政業(yè)務(wù)的能力。對于這樣一個沒有具體業(yè)務(wù)驅(qū)動的機構(gòu),數(shù)據(jù)治理的概念是什么,邊界在哪里,開展的途徑與切入點在哪里,是全國大數(shù)據(jù)中心當(dāng)下面臨的一道深刻而又緊迫的難題。
江陰市大數(shù)據(jù)中心聯(lián)合北京國脈互聯(lián)信息顧問有限公司,以數(shù)據(jù)質(zhì)量測評入手,從跨系統(tǒng)數(shù)據(jù)整合,構(gòu)建業(yè)務(wù)應(yīng)用的角度出發(fā),突破組織邊界,設(shè)計相應(yīng)指標(biāo),摸清存量數(shù)據(jù)質(zhì)量水平,探索出面對增量數(shù)據(jù)及全局性資源質(zhì)量改進與進一步治理的方向,在全國范圍內(nèi)做了一次較為領(lǐng)先的嘗試。
數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制活動的活動集合(規(guī)劃、監(jiān)控和執(zhí)行等),其職能是指導(dǎo)其他數(shù)據(jù)管理職能如何執(zhí)行。其權(quán)威架構(gòu)以國際數(shù)據(jù)管理協(xié)會發(fā)布的DMBOK1.0中“管理屋頂圖式架構(gòu)”來描繪數(shù)據(jù)治理的內(nèi)容與體系架構(gòu),如圖1 所示。

圖1 數(shù)據(jù)治理的一般架構(gòu)
圖1 表明:數(shù)據(jù)治理包涵了從數(shù)據(jù)架構(gòu)管理到數(shù)據(jù)操作管理、參考數(shù)據(jù)和主數(shù)據(jù)管理及文檔和內(nèi)容管理等9 個領(lǐng)域,是個覆蓋領(lǐng)域廣泛、技術(shù)內(nèi)涵深入且管理要求頗高的“資源+技術(shù)+管理”的綜合體系。這對于剛成立不久且履行完數(shù)據(jù)集聚的大數(shù)據(jù)中心而言,要想按此架構(gòu)全面開展數(shù)據(jù)治理顯然是不實現(xiàn)的。于是,我們從實際出發(fā),本著先易后難、先局部后全面、先單一再復(fù)合治理的原則,選擇從數(shù)據(jù)質(zhì)量測評入手,先了解所聚集數(shù)據(jù)的實際質(zhì)量,通過相關(guān)指標(biāo)看其實用性、體量、重用性與資源貢獻率等,為后期的全面數(shù)據(jù)治理打下基礎(chǔ)。
1.數(shù)據(jù)質(zhì)量的內(nèi)涵
什么是質(zhì)量?依據(jù)ISO 8402,質(zhì)量是反映實體滿足明確或隱含需要能力的特性總和。而政務(wù)數(shù)據(jù)質(zhì)量,一指其必須滿足規(guī)定或潛在的單一政府機構(gòu)業(yè)務(wù)的需要,二指其要滿足“三融五跨”所需的數(shù)據(jù)共享、互操作與業(yè)務(wù)發(fā)展之進一步要求。所以,數(shù)據(jù)質(zhì)量可以是技術(shù)標(biāo)準(zhǔn)中規(guī)定的要求,也可是其中未注明,在使用中存在或發(fā)掘出的需要。但質(zhì)量首先應(yīng)是對技術(shù)規(guī)范的滿足,再在其基礎(chǔ)上隨應(yīng)用的拓展而變化。于是,對大數(shù)據(jù)中心而言,在研究數(shù)據(jù)資源的“適用性”之前,先要研究其對標(biāo)準(zhǔn)“符合性”的質(zhì)量。
2.數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)
中國標(biāo)準(zhǔn)化專家委員會委員錢七虎院士指出:“標(biāo)準(zhǔn)是質(zhì)量的核心內(nèi)涵”。高質(zhì)量發(fā)展就是高標(biāo)準(zhǔn)發(fā)展,因為數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)質(zhì)量的核心內(nèi)涵。判斷低水平、落后水平需要有依據(jù);改變低水平、落后水平,改到什么程度才算先進水平,均要有依據(jù)。這些依據(jù)可有多種,但最簡潔和權(quán)威的就是標(biāo)準(zhǔn)。
2017年,江陰作為江蘇省唯一的集成改革示范縣市,江陰市委、市政府提出構(gòu)建“1 中心+3 平臺”的智慧城市總體框架。“1 中心”即“江陰市大數(shù)據(jù)中心建設(shè)項目”,并將數(shù)據(jù)共享和應(yīng)用支撐列入集成改革重點項目。為此,2017年江陰市成立大數(shù)據(jù)管理專職機構(gòu)。
為響應(yīng)江陰市領(lǐng)導(dǎo)提出“共享全市大數(shù)據(jù)”的要求,江陰市大數(shù)據(jù)中心對納入江陰大數(shù)據(jù)中心平臺的數(shù)據(jù)開展質(zhì)量測評,以摸清其現(xiàn)存政務(wù)數(shù)據(jù)資源的總體質(zhì)量水平,分析典型機構(gòu)的質(zhì)量狀況及提升空間,指出全局性數(shù)據(jù)質(zhì)量改進及進一步治理的方向。
本次測評指標(biāo)的選取主要參考《GB/T 36344-2018 信息技術(shù) 數(shù)據(jù)質(zhì)量評價指標(biāo)》,其對數(shù)據(jù)質(zhì)量的定義為:“在指定條件下使用時,數(shù)據(jù)的特性滿足明確的和隱含的要求的程度。”分別從數(shù)據(jù)的規(guī)范性、完整性、準(zhǔn)確性、一致性、時效性、可訪問性六個方面對數(shù)據(jù)質(zhì)量進行綜合評價,指標(biāo)框架如圖2 所示。
此規(guī)范框架完全適用于政務(wù)數(shù)據(jù)。但其主要針對單位內(nèi)部,而本次江陰市的政務(wù)數(shù)據(jù)質(zhì)量測評主要針對跨單位、跨系統(tǒng)構(gòu)建業(yè)務(wù)的應(yīng)用環(huán)境,故對上述6 項指標(biāo)略作調(diào)整:仍以其中規(guī)范性、完整性、時效性為核心指標(biāo),同時從跨系統(tǒng)數(shù)據(jù)整合,構(gòu)建業(yè)務(wù)應(yīng)用的角度,將準(zhǔn)確性、一致性、可訪問性調(diào)整為實用性、冗余度、公共數(shù)據(jù)元采用度、空項率,以及各單位對全市政務(wù)資源支持性的貢獻度。這幾項指標(biāo)的調(diào)整,體現(xiàn)了本次測評主要偏向?qū)傮w數(shù)據(jù)質(zhì)量水平的測度。本次質(zhì)量測評的指標(biāo)框架如圖3。

圖2 GB/T 36344-2018 的數(shù)據(jù)質(zhì)量測評框架
本次質(zhì)量測評依標(biāo)治理,按照先數(shù)量,后質(zhì)量;先數(shù)據(jù)架構(gòu),后單項數(shù)據(jù);先數(shù)據(jù)項,后實體數(shù)據(jù)的測評原則,采用定量與定性結(jié)合、專項與關(guān)聯(lián)分析結(jié)合、現(xiàn)場觀察與后臺對標(biāo)相結(jié)合的方法,按提供數(shù)據(jù)的規(guī)范性、完整性和實用性為核心,綜合考慮其與外部資源的共享性與組合性作質(zhì)量測評分級。
根據(jù)設(shè)計的8 項測評指標(biāo),通過對全市61 個單位、632 個數(shù)據(jù)集、12102 個數(shù)據(jù)項、10.78 億實體數(shù)據(jù)的實地調(diào)研和梳理,形成《全面數(shù)據(jù)質(zhì)量測評等級評價表》。根據(jù)支撐全局?jǐn)?shù)據(jù)共享的力度,將評價結(jié)果分為極欠缺、不充分、基本充分、充分、充分且規(guī)范。其中,充分且規(guī)范的單位有16 個,占比26%。此區(qū)域的數(shù)據(jù)可考慮作為試點,重點分析其質(zhì)量。

圖3 江陰大數(shù)據(jù)中心的數(shù)據(jù)質(zhì)量測評框架

圖4 數(shù)據(jù)治理框架
試點選取具有行業(yè)代表性的教育局,以及機構(gòu)職能改革后變動較大的部門市場監(jiān)督管理局做為試點治理單位。依標(biāo)治理、形成元指標(biāo)庫;實體數(shù)據(jù)比對、清洗、轉(zhuǎn)換形成試點治理數(shù)據(jù)庫。
通過全面質(zhì)量測評和試點治理,達成以下成果:理清了各機構(gòu)提供數(shù)據(jù)的數(shù)量和質(zhì)量,為下一步對大數(shù)據(jù)中心掌握的政務(wù)數(shù)據(jù)資產(chǎn)怎樣進行評估,提供了定性和定量的指標(biāo)框架;對深入數(shù)據(jù)治理提供了指導(dǎo)性的意見;依照國家和相關(guān)委辦局、行業(yè)的標(biāo)準(zhǔn),比如:教育按照《GBT 35298-2017 信息技術(shù) 學(xué)習(xí)、教育和培訓(xùn)教育管理基礎(chǔ)信息》、《GBT 33782-2017 信息技術(shù) 學(xué)習(xí) 教育和培訓(xùn)教育管理基礎(chǔ)代碼》、《GBT36351.2-2018 信息技術(shù) 學(xué)習(xí)、教育和培訓(xùn)教育管理數(shù)據(jù)元素 第2 部分:公共數(shù)據(jù)元素》對數(shù)據(jù)項和實體數(shù)據(jù)對標(biāo),比較容易獲得被測評機構(gòu)對數(shù)據(jù)質(zhì)量欠缺和不足的一致認(rèn)可,為下一步更好的開展工作,提供一個良好的基礎(chǔ)。
本次測評已對各單位內(nèi)部系統(tǒng)整合、提升數(shù)據(jù)內(nèi)部共享交換、價值性與減少數(shù)據(jù)沖突等方面,提供初步評估結(jié)果。下一步應(yīng)通過數(shù)據(jù)治理具體解決資源沖突、共享創(chuàng)新等問題。
具體建議為:大數(shù)據(jù)中心統(tǒng)一建立與維護公共數(shù)據(jù)元,依標(biāo)準(zhǔn)格式與數(shù)據(jù)段組合,對各單位的公用實體數(shù)據(jù)資源進行統(tǒng)一轉(zhuǎn)換映射,提升資源總體標(biāo)準(zhǔn)化水平。
治理將分戰(zhàn)略與治理保障、大數(shù)據(jù)管理和大數(shù)據(jù)應(yīng)用與服務(wù)3 層級。具體框架如圖4。
建議數(shù)據(jù)治理的目標(biāo)為:
1.融匯國際數(shù)據(jù)治理的先進理論與實踐,集成國際、國家、行業(yè)、地方等數(shù)據(jù)標(biāo)準(zhǔn),形成標(biāo)準(zhǔn)公用數(shù)據(jù)元池。
2.動態(tài)跟蹤匯集各領(lǐng)域新資源、新理念,開展語義描述,構(gòu)建管理、關(guān)聯(lián)、代碼等層級的標(biāo)簽,實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化處理。
3.實現(xiàn)將各領(lǐng)域?qū)嶓w數(shù)據(jù)(主數(shù)據(jù)+參考數(shù)據(jù))、元數(shù)據(jù)/數(shù)據(jù)元、職能數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、管理數(shù)據(jù)等融合在一個標(biāo)準(zhǔn)資源平臺,開展跨機構(gòu)資源標(biāo)準(zhǔn)化與質(zhì)量管控。
4.針對具體業(yè)務(wù)需求,實現(xiàn)跨機構(gòu)數(shù)據(jù)比對與抽取、適匹與組合,構(gòu)建新資源、支持動態(tài)分析與服務(wù)創(chuàng)新。
數(shù)據(jù)治理項目不單單是搭建一個集團級數(shù)據(jù)治理管理平臺,而是一項長期而復(fù)雜的工程,涉及到數(shù)據(jù)管理體系、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理管理平臺、數(shù)據(jù)質(zhì)量和安全、相關(guān)系統(tǒng)升級改造、數(shù)據(jù)清洗等多個方面,項目建設(shè)依據(jù)快速見效、急用先建的思路,先整體規(guī)劃,以數(shù)據(jù)模型和數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ),以數(shù)據(jù)治理管理平臺為載體,并開展數(shù)據(jù)治理專項工作,確保數(shù)據(jù)治理項目的成功,為實現(xiàn)有效的數(shù)據(jù)資源整合夯實基礎(chǔ)。