文/馬躍飛
標準體系框架模型是對標準體系的范圍、基本內容、相互關系進行建模,是當前用來輔助相關人員構思、規劃、分析、描述標準體系的重要工具。隨著大數據技術的發展,數據工程研究與建設已經成為當前產、學、研各界關注的熱點。由于數據工程設計到計算機、數學、工程學等一系列技術,其標準體系內容較為復雜,建立合理的數據工程標準體系框架,進而指導體系的建設與發展已經成為當前數據工程領域急需研究和解決的關鍵性問題。本文從回顧標準體系框架建模的經典方法——標準體系表及其相關研究開始,著重從信息系統和大數據兩個不同角度梳理了數據工程標準體系框架的研究現狀,最終提出了后續開展相關研究的關鍵性建議,為未來繼續深入探索數據工程標準體系框架建設提供了基礎支撐。
當前,GB/T 13016-2009《標準體系表編制原則和要求》中提出的“標準體系表”是建立和描述標準體系框架的常用方法,2018年在原有標準基礎上進行修改完善,提出的GB/T 13016-2018《標準體系構建原則和要求》,修改了原有標準的范圍,術語,增加了標準體系構建的一般方法,但并未對核心的標準體系表進行修改,仍將標準體系表定義為:一定范圍內標準體系內的標準按其內在聯系排列起來的圖表,一般包括標準體系結構圖、標準明細表、標準統計表和編制說明等。其中,標準體系結構圖主要包括:層次關系、級別關系、序列關系等,標準明細表對標準的核心信息進行描述,一般包括:序號、體系編號、子體系名稱、標準名稱、標準狀態等;標準統計表一般用來從標準層次、標準級別等不同角度從體系內應用標準數量和現有標準數量進行統計描述;編制說明用來描述體系的編制背景、目的、原則、國內外相關標準化現狀等。
在此基礎上,國內一些學者對標準體系框架建模進行了拓展研究。例如,學者麥綠波歸納了標準體系的五個價值特性,并給出了包括:層次、專業、用途、分類、成分等標準屬性。學者潘建均總結了標準體系表的六大特性,提出了標準體系表的編制原則,歸納了標準體系表的格式及要求,提出了標準體系表的的編制流程,對于編制標準體系表具有參考價值。企業標準體系框架建設具有一定的特殊性,GB/T13017-2018《企業標準體系表編制指南》在GB/T13016《標準體系表編制原則和要求》的基礎上,進一步歸納給出了企業標準體系框架搭建的主要模式及方法。一些學者以此為基礎對企業標準體系建模進行了深入研究。例如:劉榮研究了體系表、內控標準和基礎標準在企業標準體系中的地位和作用。盧宏在明確公司信息化發展和規范化管理需求的基礎上,提出了標準體系構建的四個創新特點,即擴延對象范圍、重組體系架構、變革標準載體、提高開放程度,為公司標準化工作的開展提供了明確的技術途徑以及可行的技術方法。
隨著信息技術的迅猛發展,信息化標準體系建設日益成為研究熱點之一。以服務某一專門領域信息化建設為基本思路,一些學者開展了相關的數據、數據工程標準體系框架研究。以服務科學數據共享為主要目的,司莉等研究構建了包括:價值鑒定標準、數據質量規范、元數據標準、分類編碼標準、數據發布規范、引用標準,6部分的科學共享數據標準體系框架。以服務石油勘探信息系統建設為目的,趙豐年等從數據元、元數據和管理標準3個維度建立了石油勘探開發數據標準模型,進而構建了相應的標準體系框架。劉曉華等對天津工商信息系統的數據標準化問題進行了分析,提出構建包括分類編碼、數據元、數據組織服務等在內了數據標準體系框架。王薇等在研究我國政務信息系統標準化問題時,針對我國政務信息資源標準體系建設,提出了采用以業務驅動為核心的企業架構(ΕA)的頂層設計方法,同時兼顧政務信息資源全生命周期管理工作特點,進行政務信息資源標準體系框架設計的思路,構建了包括基礎標準、業務標準、數據標準、管理標準等在內的標準體系框架。
近些年,隨著大數據技術的提出,數據科學逐漸成為了一門獨立的學科,相應的,以數據為主導的標準體系框架研究也逐漸成為常態。2016、2017、2018年連續三年,由我國電子技術標準化研究院、全國信息技術標準化技術委員會(全國信標委)大數據標準工作組共同發布了《大數據標準化白皮書》,在分析當前我國大數據標準化現狀和問題的基礎上,給出了包括:基礎、數據、技術、平臺、管理、安全和隱私、業務應用等部分,104項標準在內的大數據標準體系框架。大數據標準體系框架打破了數據標準從屬于特定專業領域的固有模式,不再僅僅將數據標準體系控制在數據分類、組織、管理、共享、服務等領域內,而是將業務應用也囊括到標準體系的框架中。在此基礎上,一些學者進一步研究提出了一些專用大數據標準體系框架。例如:陳敏等在充分參考國家大數據參考架構的基礎上,提出了健康醫療大數據標準體系框架。高昂等根據人防大數據的發展現狀,對人民防空大數據標準體系層級結構進行了探討,并針對標準體系層次劃分制定出了人防大數據標準體系框架圖。
通過對數據工程相關標準體系框架研究現狀的梳理,綜合分析提出以下3點建設、研究建議。
基于以上研究現狀梳理可以發現,隨著大數據時代的到來,數據的地位和價值愈發凸顯,順應技術發展趨勢,數據工程標準體系框架的建設也由傳統數據分類、組織、表示、共享、服務等基本標準內容,逐步在向更多元,更多維、更廣泛的方向發展。因此,本文建議后續研究應在進一步厘清新時代數據工程研究、建設內涵范疇的基礎上,充分融合大數據技術,拓寬、深挖數據工程標準體系中關鍵內容及其相互關系,繼續明確包括:管理、技術平臺、數據模型及產品開發等在內的標準體系框架內涵,逐步建立完善、完備的數據工程標準體系框架。
標準體系框架構建的最終目標是輔助相關人員建立科學合理的標準體系,用于指導數據工程建設。建設大數據理念,拓寬數據工程標準體系框架組成不是漫無目的隨意添加。要堅持目標導向,針對不同階段、面對不同類別、不同層級的數據工程建設,要設計具體的目標體系。具體而言,要深入分析數據工程建設需求,提出數據工程各階段建設預期和基本能力,然后以能力實現為導引,通過逐層分解,關系分析等方式,逐步建立能夠全面支撐數據工程建設需求的目標體系結構,達到后續形成科學、可操、恰當、適用的標準體系框架提供保證。
通過以上研究可以發現,數據工程標準體系是一項涉及專業門類廣、新老技術交叉、構成要素多樣的復雜系統工程。傳統基于標準體系表的標準體系框架建模方法包含維度相對固化,體系內各標準要素間關系描述相對單一;雖然部分學者對維度進行了一定拓展,豐富了模型的表現力,但是并沒有具體給出較為規范、統一的維度、關系描述方法,難以應對切實起到輔助建模的作用,難以使數據工程的各類利益相關者清晰的了標準體系中的各關鍵要素及其關系。因此,在后續研究中針對數據工程特點,提出一套維度更為豐富,關系表達更為多樣的標準體系框架建模方法,是從理論方法層面保證數據標準框架有效建模的關鍵。