摘 要:對數(shù)據(jù)元素理論涉及的關(guān)鍵技術(shù)進行了研究,具體包括數(shù)據(jù)元素的相關(guān)概念、數(shù)據(jù)元素結(jié)構(gòu)模型、數(shù)據(jù)元素屬性等,并結(jié)合實際項目的研究、提出了數(shù)據(jù)元素的元模型。認(rèn)為數(shù)據(jù)元素方法論是指導(dǎo)企業(yè)進行數(shù)據(jù)標(biāo)準(zhǔn)化的重要的、科學(xué)的方法論,只有在這一方法論指導(dǎo)下規(guī)范的數(shù)據(jù),才具有穩(wěn)定性,才能為企業(yè)建立集成化的數(shù)據(jù)模型奠定堅實的基礎(chǔ),同時,也只有在這一方法論的指導(dǎo)下構(gòu)建的企業(yè)數(shù)據(jù)模型才能夠從根本上解決數(shù)據(jù)質(zhì)量問題、才能構(gòu)建出企業(yè)的真正字?jǐn)?shù)據(jù)字典與元數(shù)據(jù)。
關(guān)鍵詞:數(shù)據(jù)標(biāo)準(zhǔn)化;數(shù)據(jù)元素;數(shù)據(jù);信息分類與編碼
中圖分類號:F270.7文獻標(biāo)識碼:A文章編號:1672-3198(2008)02-0126-02
1 引言
從國際上關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化所經(jīng)歷的歷程可以看出:企業(yè)信息系統(tǒng)建設(shè)的核心是數(shù)據(jù)。按照J(rèn)ames Martin信息工程理論:數(shù)據(jù)是穩(wěn)定的、處理是多變的。所以從這一理論可以看出企業(yè)信息系統(tǒng)建設(shè)的核心之核心是數(shù)據(jù)資產(chǎn)。國際上的數(shù)據(jù)建設(shè)也是從一個無序向有序逐漸過渡的,一直將數(shù)據(jù)“孤島”向數(shù)據(jù)集成化發(fā)展。
2 數(shù)據(jù)元素基本理論
2.1 數(shù)據(jù)元素規(guī)范與標(biāo)準(zhǔn)化框架
(1)數(shù)據(jù)元素的組成。
數(shù)據(jù)元由對象類、特性和表示三部分組成,其中對象類用于收集和存儲數(shù)據(jù)的事物,例如,人、井、巖芯、管線、儲罐都是對象類等;特性是用來區(qū)別和描述對象的,例如,顏色、性別、年齡、收入、地址、價格等均為特性;數(shù)據(jù)的表示部分中最為重要的方面是值域,值域是數(shù)據(jù)元允許(或有效)值的集合。對于值域,數(shù)據(jù)元中存在兩種類型的值域,一種是所謂取值是固定的,即取值是可枚舉的,例如,人眼睛顏色這個數(shù)據(jù)元,其取值可能包括:Brown、Gray、Green、Hazel、Blue,另一種是概括的,即數(shù)據(jù)元取值是有定義域約束的,其取值可能是有限的,但是無法列出全部值,例如人的年齡,其取值范圍可能是1-200,并且每位要求是十進制表示。為便于理解,
(2)數(shù)據(jù)元結(jié)構(gòu)模型。
① 數(shù)據(jù)元概念(DEC):對象類與特性聯(lián)合在一起形成數(shù)據(jù)元概念,數(shù)據(jù)元概念在數(shù)據(jù)分類中是非常有用的,一般來講,數(shù)據(jù)元概念是一個抽象意義上的數(shù)據(jù)元,但這類數(shù)據(jù)元的對象類已經(jīng)限定,只有經(jīng)過對數(shù)據(jù)元概念中的各個要素再進一步的限定,才使數(shù)據(jù)元概念變成真成有意義的應(yīng)用數(shù)據(jù)元素。所以,數(shù)據(jù)元概念本身具有抽象性與分類性。
② 通配數(shù)據(jù)元:特性與表示聯(lián)合在一起形成通配數(shù)據(jù)元,通配數(shù)據(jù)元素也具有抽象意義,對于這類數(shù)據(jù)元來講,它的特性與表示已經(jīng)確定,所以它具有通配性,如果將這類數(shù)據(jù)元與具體的對象類聯(lián)系在一起,那么該類數(shù)據(jù)元就可以具體化為有意義的應(yīng)用數(shù)據(jù)元。
③ 數(shù)據(jù)元類型:數(shù)據(jù)元概念與通配數(shù)據(jù)元形成數(shù)據(jù)元類型。
數(shù)據(jù)元是由數(shù)據(jù)元概念和表示兩部分組成。當(dāng)一個表示被聯(lián)合到一個數(shù)據(jù)元概念上時,就能夠產(chǎn)生數(shù)據(jù)元。數(shù)據(jù)元和數(shù)據(jù)元概念間存在多對1的關(guān)系,也就是一個數(shù)據(jù)元必須對應(yīng)一個數(shù)據(jù)元概念,而一個數(shù)據(jù)元概念可以有多個數(shù)據(jù)元,換句話說,多個數(shù)據(jù)元可以共享一個數(shù)據(jù)元概念,數(shù)據(jù)元結(jié)構(gòu)模型見圖1。
數(shù)據(jù)元與表示之間的關(guān)系是一對一的關(guān)系,也就是一個數(shù)據(jù)元需要一個表示。當(dāng)數(shù)據(jù)元的概念模型相同而表示不同時就是兩個不同的數(shù)據(jù)元,數(shù)據(jù)元中的表示是描述數(shù)據(jù)元中的數(shù)據(jù)元概念中的特性,即數(shù)據(jù)元中的特性有且僅有一個表示。
在數(shù)據(jù)元概念中對象類和特性之間是一對一的關(guān)系,一個對象類需要只需要一個特性(或者特性類),一個特性(特性類)只描述一個對象類,當(dāng)一個特性和一個對象類建立關(guān)聯(lián)時就產(chǎn)生了一個數(shù)據(jù)元概念。
同實體關(guān)系類的數(shù)據(jù)模型相比,模型中的實體相當(dāng)于數(shù)據(jù)元中的對象類,而實體的屬性本當(dāng)于數(shù)據(jù)元中的特性和表示。
3 數(shù)據(jù)元的元模型
經(jīng)過對數(shù)據(jù)元理論與實際數(shù)據(jù)規(guī)范化應(yīng)用的研究,我們提出了數(shù)據(jù)元的元模型,見圖2。
圖2 數(shù)據(jù)元元模型
該框架模型是將對象類、特性類、分類模式由此演生的基本數(shù)據(jù)元和應(yīng)用數(shù)據(jù)元、值域以及數(shù)據(jù)標(biāo)準(zhǔn)值、實例標(biāo)準(zhǔn)值以及標(biāo)準(zhǔn)實體有機的關(guān)聯(lián)在一起。揭示了數(shù)據(jù)元與應(yīng)用的緊密關(guān)系。整個模型高度概括了數(shù)據(jù)標(biāo)準(zhǔn)化的核心工作。
4 數(shù)據(jù)元素與信息編碼間的關(guān)系
如何對企業(yè)的各種信息進行有效的分類,并對其進行編碼這是信息化過程中一個非常重要的過程。其實數(shù)據(jù)元素與信息分類及編碼有著密不可分的關(guān)系,在表2中給出了數(shù)據(jù)元素分析方法與信息分類與編碼的對應(yīng)關(guān)系。
5 數(shù)據(jù)元應(yīng)用的領(lǐng)域
數(shù)據(jù)元素理論屬于信息標(biāo)準(zhǔn)化的基礎(chǔ)理論,即是數(shù)據(jù)規(guī)范化理論基礎(chǔ)。數(shù)據(jù)元分析在信息分類、數(shù)據(jù)的集成參考模型、數(shù)據(jù)模型優(yōu)化設(shè)計、數(shù)據(jù)元字典以及制訂數(shù)據(jù)交換標(biāo)準(zhǔn)等方面得到應(yīng)用。
數(shù)據(jù)元的研究,目前在國際上相當(dāng)流行,而在國內(nèi)的研究還處于起步階段。通過幾年的研究,目前,我們已經(jīng)將這一方法論用于石油上游的數(shù)據(jù)規(guī)范化中,并取得了良好的效果,目前,正在將這一方法論用于中石油的ERP數(shù)據(jù)平臺中的數(shù)據(jù)規(guī)范化中。相信,隨著這一方法論的在石油石化領(lǐng)域的不斷應(yīng)用,必將為石油石化信息化建設(shè)起到科學(xué)的指導(dǎo)與推動作用。
參考文獻
[1]袁滿,高雪等,中國石油數(shù)據(jù)元設(shè)計指南(企業(yè)標(biāo)準(zhǔn))[M].北京:石油工業(yè)出版社,2005,(5).
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。