毛炳啟,汪先鋒
山東省環(huán)境信息與監(jiān)控中心,山東濟(jì)南250101
20世紀(jì)80年代以來(lái),中國(guó)的環(huán)保部門已經(jīng)積累了大量污染源數(shù)據(jù),然而多數(shù)污染源數(shù)據(jù)分散于各部門,大多以文檔、原始數(shù)據(jù)的方式存在,沒(méi)有統(tǒng)一的數(shù)據(jù)元標(biāo)準(zhǔn),也缺乏應(yīng)有的處理和加工,難以進(jìn)行共享和應(yīng)用。另一方面,環(huán)境管理業(yè)務(wù)涉及環(huán)境統(tǒng)計(jì)、排污申報(bào)、排污收費(fèi)、監(jiān)督性監(jiān)測(cè)、在線監(jiān)測(cè)等多個(gè)方面,導(dǎo)致有些不同的業(yè)務(wù)部門所管理的對(duì)象存在不同程度的重疊,但對(duì)應(yīng)的信息資源系統(tǒng)卻相互獨(dú)立,造成系統(tǒng)內(nèi)數(shù)出多門,一數(shù)多源或一源多數(shù),相互矛盾的事情時(shí)有發(fā)生。同時(shí),隨著全社會(huì)對(duì)環(huán)境問(wèn)題的日益關(guān)注,社會(huì)各部門和公眾對(duì)環(huán)境數(shù)據(jù)共享與服務(wù)的需求也越來(lái)越迫切,要求也越來(lái)越高。污染源監(jiān)督性監(jiān)測(cè)作為污染源數(shù)據(jù)資源的重要組成部分,不可避免地需與環(huán)境統(tǒng)計(jì)、排污申報(bào)、排污收費(fèi)、在線監(jiān)測(cè)等環(huán)境業(yè)務(wù)數(shù)據(jù)進(jìn)行數(shù)據(jù)交換和數(shù)據(jù)共享。因此,必須建立一套污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)標(biāo)準(zhǔn),一方面用于指導(dǎo)污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)系統(tǒng)的建立,另一方面確保系統(tǒng)之間的環(huán)境數(shù)據(jù)能夠順暢地交換與共享,以保證數(shù)據(jù)資源的充分利用,避免信息孤島的出現(xiàn)。
元數(shù)據(jù)被稱為關(guān)于數(shù)據(jù)的數(shù)據(jù),是對(duì)數(shù)據(jù)資源的規(guī)范化描述,不僅能起到描述數(shù)據(jù)的作用,而且起到管理數(shù)據(jù)的作用。鑒于此,使用元數(shù)據(jù)技術(shù)來(lái)統(tǒng)一管理分散的數(shù)據(jù)資源,并通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)的共享和服務(wù)這一模式得到了普遍的重視[1]。
中國(guó)在環(huán)境信息數(shù)據(jù)的研究與收集方面開(kāi)展得比國(guó)際稍晚,水平也存在一定的差距。但近年來(lái)也取得了比較大的進(jìn)步,環(huán)境保護(hù)部于2007年先后出臺(tái)了《環(huán)境信息分類與代碼》(HJ/T 417—2007)和《環(huán)境數(shù)據(jù)庫(kù)設(shè)計(jì)與運(yùn)行管理規(guī)范》(HJ/T 419—2007),這些標(biāo)準(zhǔn)對(duì)污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元的構(gòu)建研究提供了理論指導(dǎo)和研究框架。2009年以后,環(huán)境信息化建設(shè)和數(shù)據(jù)標(biāo)準(zhǔn)研究力度加大,在環(huán)境保護(hù)部出臺(tái)的《國(guó)家環(huán)境信息化2009—2015年規(guī)劃》中,國(guó)家環(huán)境信息標(biāo)準(zhǔn)規(guī)范體系建設(shè)被作為基礎(chǔ)保障體系建設(shè)的重點(diǎn)項(xiàng)目之一。2007年環(huán)境保護(hù)部根據(jù)國(guó)務(wù)院提出的建立和完善污染減排“三大體系”,提出了開(kāi)展國(guó)控重點(diǎn)污染源自動(dòng)監(jiān)控項(xiàng)目建設(shè)、污染源監(jiān)督性監(jiān)測(cè)項(xiàng)目建設(shè)、環(huán)境監(jiān)察執(zhí)法項(xiàng)目建設(shè)和環(huán)境信息與統(tǒng)計(jì)能力項(xiàng)目建設(shè)“四個(gè)能力”建設(shè)項(xiàng)目[2]。2009年國(guó)家環(huán)境信息與統(tǒng)計(jì)能力建設(shè)項(xiàng)目全面啟動(dòng),該項(xiàng)目包括制定27項(xiàng)與減排工作有關(guān)信息化標(biāo)準(zhǔn)與技術(shù)規(guī)范,其中,《污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)規(guī)定》是27項(xiàng)標(biāo)準(zhǔn)之一,是國(guó)家層面上的環(huán)境保護(hù)行業(yè)內(nèi)的數(shù)據(jù)規(guī)范。為此,該課題組承擔(dān)并開(kāi)展了《污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)規(guī)定》的前期研究和編制工作。課題組針對(duì)污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)需求的調(diào)研,查閱了大量的國(guó)際、國(guó)內(nèi)相關(guān)方面的最新研究成果和相關(guān)資料,對(duì)數(shù)據(jù)統(tǒng)一管理和環(huán)境管理對(duì)數(shù)據(jù)的應(yīng)用進(jìn)行了分析,在此基礎(chǔ)上,依據(jù)國(guó)家相關(guān)數(shù)據(jù)元的標(biāo)準(zhǔn)規(guī)范,對(duì)污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元構(gòu)建進(jìn)行了研究,確定了技術(shù)規(guī)定編制的原則、方法和技術(shù)路線,提出了污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元的目錄,規(guī)范了其表達(dá)格式和維護(hù)與管理要求,為《污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)規(guī)定》編制奠定了基礎(chǔ)。該技術(shù)規(guī)定適用于污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)庫(kù)和減排綜合數(shù)據(jù)庫(kù)的建庫(kù)、維護(hù)和更新。《污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)規(guī)定》遵從國(guó)家環(huán)境保護(hù)工作要求的先進(jìn)技術(shù)研究,符合國(guó)家標(biāo)準(zhǔn)規(guī)范體系建立的需求,能夠?yàn)橹袊?guó)的環(huán)境保護(hù)發(fā)展提供助力。
污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元是指污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)中涉及的所有數(shù)據(jù)單元,污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元的概念和結(jié)構(gòu)遵循一般數(shù)據(jù)元的概念和結(jié)構(gòu),是通用數(shù)據(jù)元的一個(gè)子集,但具有自身的特點(diǎn)。與其他數(shù)據(jù)元技術(shù)規(guī)定的區(qū)別主要在于它的業(yè)務(wù)特性和數(shù)據(jù)用途,因此其在數(shù)據(jù)集、標(biāo)識(shí)符、數(shù)據(jù)格式、值域等數(shù)據(jù)元的表達(dá)方式上有所不同。
污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元就是采用相關(guān)的元數(shù)據(jù)來(lái)描述數(shù)據(jù)元的屬性。這些元數(shù)據(jù)幫助用戶理解和使用污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元。污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元是一個(gè)通過(guò)業(yè)務(wù)調(diào)研、數(shù)據(jù)元提取、數(shù)據(jù)元分類、數(shù)據(jù)元的表達(dá),最終形成污染監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元的過(guò)程。
全面調(diào)研污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)情況,廣泛搜集與污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)相關(guān)的資料,包括已有的相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)、業(yè)務(wù)信息系統(tǒng)設(shè)計(jì)文檔、業(yè)務(wù)數(shù)據(jù)庫(kù)設(shè)計(jì)文檔(數(shù)據(jù)模型、數(shù)據(jù)字典)等,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析,建立數(shù)據(jù)實(shí)體-關(guān)系模型,明確該業(yè)務(wù)數(shù)據(jù)所包含的數(shù)據(jù)實(shí)體及其屬性。同時(shí),對(duì)調(diào)研資料進(jìn)行系統(tǒng)分析,結(jié)合污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)需求和環(huán)保能力建設(shè)項(xiàng)目管理要求,確定業(yè)務(wù)數(shù)據(jù)范圍。
通過(guò)對(duì)污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元進(jìn)行詳細(xì)調(diào)研后,按照污染源監(jiān)督性監(jiān)測(cè)的業(yè)務(wù)領(lǐng)域,得出了不同子業(yè)務(wù)信息劃分?jǐn)?shù)據(jù)集,詳見(jiàn)表1。

表1 污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)集列表
分析污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)數(shù)據(jù),梳理已有的數(shù)據(jù)標(biāo)準(zhǔn)或業(yè)務(wù)信息系統(tǒng)設(shè)計(jì)文檔、業(yè)務(wù)數(shù)據(jù)庫(kù)設(shè)計(jì)文檔、數(shù)據(jù)模型,提取數(shù)據(jù)字段,并進(jìn)行篩選、排重,分別整理形成數(shù)據(jù)元列表。
2.2.1 篩選
對(duì)數(shù)據(jù)字段進(jìn)行篩選,排除部分為數(shù)據(jù)庫(kù)設(shè)計(jì)和系統(tǒng)建設(shè)而增加的數(shù)據(jù)字段,保留屬于業(yè)務(wù)數(shù)據(jù)范疇的數(shù)據(jù)字段。
2.2.2 排重
對(duì)重復(fù)的數(shù)據(jù)字段進(jìn)行分析和判斷,名稱、語(yǔ)義完全一致的可作為一個(gè)數(shù)據(jù)元;名稱一致但語(yǔ)義不一致的則應(yīng)分別定義為不同的數(shù)據(jù)元。
對(duì)于污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)數(shù)據(jù),其較為復(fù)雜,可首先進(jìn)行分類,再進(jìn)一步劃分?jǐn)?shù)據(jù)類別,并按照此分類對(duì)數(shù)據(jù)元進(jìn)行分類;對(duì)于各類數(shù)據(jù)元再進(jìn)一步分析,可提煉出各類業(yè)務(wù)數(shù)據(jù)共同使用的數(shù)據(jù)元,即公共數(shù)據(jù)元[3]。
數(shù)據(jù)元的分類至少可以通過(guò)2種途徑實(shí)現(xiàn),較為理想但非常麻煩的方法是,首先形成一個(gè)包括所有可能數(shù)據(jù)元的完備分類,然后將數(shù)據(jù)元放入事先定義好的分類中[4]。然而,最為實(shí)用的方法是,先形成一個(gè)基本的而相對(duì)較為簡(jiǎn)單的分類,數(shù)據(jù)元根據(jù)分類放入事先定義好的分類中,對(duì)于新加的數(shù)據(jù)元,允許其在使用嚴(yán)格規(guī)則的情況下逐漸完善。
根據(jù)以上業(yè)務(wù)領(lǐng)域分析,實(shí)現(xiàn)污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元分類,詳見(jiàn)圖1。

圖1 污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元分類圖
根據(jù)以上對(duì)數(shù)據(jù)元的分類,污染源監(jiān)督性監(jiān) 測(cè)各類數(shù)據(jù)元的描述舉例如表2所示。

表2 污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元內(nèi)容列表(部分)
數(shù)據(jù)元是通過(guò)一系列的屬性進(jìn)行描述和定義的,這些屬性反映了數(shù)據(jù)元的基本特征。污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元采用下列屬性進(jìn)行描述。
2.4.1 中文名稱
數(shù)據(jù)元中文名稱是賦予數(shù)據(jù)元的單個(gè)或多個(gè)中文字詞的唯一指稱。數(shù)據(jù)元的中文名稱應(yīng)是唯一的,應(yīng)盡量采用環(huán)保業(yè)務(wù)已有名稱或環(huán)保行業(yè)習(xí)慣用語(yǔ),方便數(shù)據(jù)元的使用。
數(shù)據(jù)元命名一般使用一個(gè)詞語(yǔ),要求用詞精準(zhǔn),能夠準(zhǔn)確傳達(dá)要表示的含義。
2.4.2 短名
數(shù)據(jù)元的短名采用數(shù)據(jù)元中文名稱的首字母縮拼,當(dāng)遇到無(wú)法避免的重復(fù)短名時(shí),應(yīng)采用數(shù)據(jù)元中文名稱的首漢字全拼加剩余漢字首字母組合的附加規(guī)則,以此類推,直至短名無(wú)重復(fù)。若遇到數(shù)據(jù)元中文名稱中帶有阿拉伯?dāng)?shù)字的,其短名命名中直接采用該阿拉伯?dāng)?shù)字,短名長(zhǎng)度不得超過(guò)30個(gè)字符。
2.4.3 數(shù)據(jù)元定義
數(shù)據(jù)元定義為表達(dá)一個(gè)數(shù)據(jù)元的本質(zhì)特征并使其區(qū)別于所有其他數(shù)據(jù)元的陳述。
數(shù)據(jù)元的定義應(yīng)具有唯一性,定義中所表述的一個(gè)或多個(gè)特性必須使被定義的概念與其他概念相區(qū)別。數(shù)據(jù)元的定義要闡述其概念是什么,而不是闡述其概念不是什么。必須使用短語(yǔ)來(lái)形成包含概念的基本特性的準(zhǔn)確定義。不能簡(jiǎn)單地陳述一個(gè)或幾個(gè)同義詞,也不能以不同的順序簡(jiǎn)單地重復(fù)這些名稱。如果一個(gè)描述性短語(yǔ)不夠,則應(yīng)使用完整的、語(yǔ)法正確的句子。所有簡(jiǎn)稱在第一次出現(xiàn)時(shí),必須予以說(shuō)明。
2.4.4 數(shù)據(jù)格式
從業(yè)務(wù)的角度規(guī)定的數(shù)據(jù)元值的格式要求,包括所允許的最大和/或最小字符長(zhǎng)度、數(shù)據(jù)元值的表示格式等。數(shù)據(jù)元數(shù)據(jù)格式具體表示見(jiàn)表3。

表3 數(shù)據(jù)元數(shù)據(jù)格式
例1:a10表示定長(zhǎng)為10的字母字符;
例2:n5表示定長(zhǎng)為5的數(shù)字字符;
例3:n..20,2表示最長(zhǎng)20個(gè)數(shù)字字符,小數(shù)點(diǎn)后2位。
2.4.5 值域
數(shù)據(jù)元的值域是指數(shù)據(jù)元屬性的表示形式,數(shù)據(jù)元通常有一個(gè)允許值的集合,這個(gè)允許值的集合被稱之為值域。
數(shù)據(jù)元的值域定義存在以下3種情況:
1)描述數(shù)據(jù)格式
數(shù)據(jù)元值域取值可以用描述數(shù)據(jù)格式的形式表示,如:定長(zhǎng)為10的字母字符。
2)引用國(guó)標(biāo)
當(dāng)有國(guó)標(biāo)可以引用時(shí)則引用國(guó)標(biāo),如:《數(shù)據(jù)元和交換格式信息交換日期和時(shí)間表示法》(GB/T 7408—94)中對(duì)于時(shí)間表示法的規(guī)定。
3)代碼表
數(shù)據(jù)元的值域是一個(gè)由所有允許值組成的列表,即代碼表。用代碼表表示數(shù)據(jù)元的值域須遵照以下原則:已有國(guó)家、行業(yè)標(biāo)準(zhǔn)且完全滿足需求的,直接采標(biāo);已有國(guó)家、行業(yè)標(biāo)準(zhǔn)且不能完全滿足需求的,采標(biāo)并進(jìn)行修訂;沒(méi)有國(guó)家、行業(yè)標(biāo)準(zhǔn)的,需要按照國(guó)家分類編碼的相關(guān)規(guī)范,制定相應(yīng)的代碼標(biāo)準(zhǔn)。
2.4.6 計(jì)量單位
屬于數(shù)值型的數(shù)據(jù)元值的計(jì)量單位。例如:“監(jiān)測(cè)點(diǎn)溫度”數(shù)據(jù)元的計(jì)量單位就是“攝氏度”。
2.4.7 備注
數(shù)據(jù)元的附加注釋,描述在上述屬性未能描述的其他內(nèi)容。
污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元是根據(jù)污染源監(jiān)督性監(jiān)測(cè)業(yè)務(wù)數(shù)據(jù)情況制定的環(huán)境業(yè)務(wù)數(shù)據(jù)元,通過(guò)業(yè)務(wù)調(diào)研、資料分析,提取數(shù)據(jù)元,根據(jù)已分類的數(shù)據(jù)元,將數(shù)據(jù)元?dú)w入適當(dāng)?shù)姆诸愔校⒉捎脭?shù)據(jù)元的表達(dá)格式進(jìn)行描述,形成污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元。
例如,對(duì)于數(shù)據(jù)元“廢水類型代碼”,可劃分到廢水產(chǎn)生數(shù)據(jù)元分類中,其數(shù)據(jù)元表示如下:
中文名稱:廢水類型代碼
短名:fslxdm
定義:表示廢水類型的一組數(shù)字
數(shù)據(jù)格式:n..5
值域:見(jiàn)《廢水類別代碼(試行)》(HJ 520—2009)中的代碼
計(jì)量單位:無(wú)備注:無(wú)
構(gòu)建污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元,可以有效支持各級(jí)環(huán)境保護(hù)部門對(duì)污染源的監(jiān)督性監(jiān)測(cè)工作,也是建立污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)庫(kù)的重要基礎(chǔ)和依據(jù),并可用于指導(dǎo)數(shù)據(jù)庫(kù)的建設(shè)、更新和維護(hù),以發(fā)揮信息化建設(shè)的綜合效益。通過(guò)污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元的構(gòu)建,建立監(jiān)測(cè)數(shù)據(jù)共享和應(yīng)用的長(zhǎng)效機(jī)制,實(shí)現(xiàn)對(duì)污染源監(jiān)督性監(jiān)測(cè)信息統(tǒng)一、集中、規(guī)范的管理以及方便、快捷的交換共享,從而為各級(jí)環(huán)保部門加強(qiáng)污染源監(jiān)管和政府決策提供強(qiáng)有力的技術(shù)支持。
[1]周波,錢鵬.我國(guó)科學(xué)數(shù)據(jù)元數(shù)據(jù)研究綜述[J].圖書館學(xué)研究,2013(2):7-10.
[2]汪先鋒,張麗麗.《污染源監(jiān)督性監(jiān)測(cè)數(shù)據(jù)元技術(shù)規(guī)定》編制研究[C]∥中國(guó)環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(2011):第4卷.北京:中國(guó)環(huán)境科學(xué)出版社,2011:3 136-3 139.
[3]GB/T 19488.2—2008 公共數(shù)據(jù)元目錄[S].
[4]GB/T 19488.1—2004 設(shè)計(jì)和管理規(guī)范[S].
[5]GB/T 18391.1—2002 數(shù)據(jù)元的規(guī)范與標(biāo)準(zhǔn)化[S].
中國(guó)環(huán)境監(jiān)測(cè)2014年3期