杜蕾
(遼寧省基礎(chǔ)測(cè)繪院,遼寧錦州 121003)
元數(shù)據(jù)在自然資源中必不可少。無(wú)論是在4D產(chǎn)品的生產(chǎn)的生產(chǎn)建庫(kù)還是在國(guó)土工程中,元數(shù)據(jù)的使用特別廣泛。元數(shù)據(jù)(Metadate)又稱中介數(shù)據(jù)、用來(lái)描述數(shù)據(jù)的數(shù)據(jù)。主要是描述數(shù)據(jù)的屬性的信息,用來(lái)支持指示存儲(chǔ)位置、歷史數(shù)據(jù)、文件的生產(chǎn)時(shí)間,數(shù)據(jù)源、等功能。它是一種電子目錄,是一種應(yīng)用,是實(shí)際生產(chǎn)中必不要可少的一個(gè)成果,簡(jiǎn)單的說(shuō)元數(shù)據(jù)就是電子文件的“身份證”記錄地理信息數(shù)據(jù)的行動(dòng)軌跡。
隨著電子科技的進(jìn)步,數(shù)字產(chǎn)品在地理信息系統(tǒng)得到了廣泛應(yīng)用,這個(gè)以電子數(shù)據(jù)為主的數(shù)字時(shí)代,對(duì)于電子文件的存儲(chǔ)查找,要求越來(lái)越多,便用于計(jì)算機(jī)進(jìn)行分析和使用成為時(shí)代發(fā)展的一種趨勢(shì)。
事物雖然抽象但總是以各種方式可視,這種世界里的電子文件,給文件的管理工作提出了更高的要求。現(xiàn)在在計(jì)算機(jī)內(nèi),對(duì)文件進(jìn)行造假、修改、刪除、查找變得輕而易舉,因此電子文件的歸檔和檢索顯得尤為重要。
在地理信息系統(tǒng)里元數(shù)據(jù)主要是檢索、管理與維護(hù)分布在不同地方的地理信息(包括基礎(chǔ)地理信息數(shù)據(jù)、測(cè)繪檔案、地理信息服務(wù)、地理信息應(yīng)用系統(tǒng))的一項(xiàng)關(guān)鍵技術(shù)。采用一致的元數(shù)據(jù)接口,并基于統(tǒng)一的信息模型,即相同的元數(shù)據(jù)內(nèi)容和結(jié)構(gòu),采用各種客戶端應(yīng)用系統(tǒng),通過(guò)一致的方式對(duì)各種資源進(jìn)行搜索。
為了按照某種規(guī)范進(jìn)行信息交換,把規(guī)范的消息格式轉(zhuǎn)換為通用格式,實(shí)現(xiàn)信息交換是元數(shù)據(jù)的一個(gè)重要功能。元數(shù)據(jù)常見(jiàn)文件包括矢量文件和柵格數(shù)據(jù)文件等。比如在地理國(guó)情數(shù)據(jù)中外業(yè)調(diào)查軌跡,這一數(shù)據(jù)就記錄在元數(shù)據(jù)中,當(dāng)外業(yè)人員設(shè)定好調(diào)查路線,按既定路線行走時(shí),在拍照調(diào)查時(shí)就會(huì)有對(duì)應(yīng)的相片的時(shí)間和GPS定位,這樣就不便于后期造假。
元數(shù)據(jù)存放著有關(guān)的數(shù)源、數(shù)據(jù)分層、產(chǎn)品歸屬、空間參考系、生產(chǎn)日期、數(shù)據(jù)源、數(shù)據(jù)質(zhì)量、數(shù)據(jù)精度、數(shù)據(jù)評(píng)價(jià)、數(shù)據(jù)更新、圖幅接邊、使用單位等多方面的信息。元數(shù)據(jù)一般以圖幅、縣區(qū)為單位進(jìn)行記錄。元數(shù)據(jù)內(nèi)容中所列出的元數(shù)據(jù)項(xiàng),是元數(shù)據(jù)文件中都必須要提供的項(xiàng)目,不應(yīng)有空項(xiàng)。有值時(shí),必須如實(shí)記錄;無(wú)值時(shí),記為“無(wú)”;值未知時(shí),記為“未知”。其中某些無(wú)數(shù)據(jù)項(xiàng)的值可以根據(jù)不同的作業(yè)方法、產(chǎn)品需要或用戶要求進(jìn)行選擇和增加,允許有缺省。
元數(shù)據(jù)命名應(yīng)規(guī)范,方便使用者簡(jiǎn)單明了地知道是什么內(nèi)容的元數(shù)據(jù),起名時(shí)應(yīng)帶有與上下文有關(guān)的前綴名稱,如GF1202003081456.XML,可通過(guò)影像元數(shù)據(jù)查找影像的飛行時(shí)間,飛行高度等。也可通過(guò)建立查詢條件語(yǔ)句,檢索盡可能支持分類的內(nèi)容,元數(shù)據(jù)必須貫穿于生產(chǎn)過(guò)程的各個(gè)環(huán)節(jié)中與數(shù)據(jù)同步采集,以便保持原數(shù)據(jù)的真實(shí)性。
完整的元數(shù)據(jù)通常有一個(gè)數(shù)據(jù)集,數(shù)據(jù)集下面應(yīng)當(dāng)包含許多子集,以地理國(guó)情元數(shù)據(jù)為例,元數(shù)據(jù)為一個(gè)數(shù)據(jù)庫(kù)的形式存在,某某縣區(qū)的元數(shù)據(jù)中,除了有縣區(qū)代碼外還要出現(xiàn)作業(yè)員、檢查員、調(diào)查員、使用影像、調(diào)查人員、使用國(guó)情數(shù)據(jù)等,在制作時(shí)按照“必要、可行”的原則,重點(diǎn)選取地理國(guó)情監(jiān)測(cè)中各個(gè)生產(chǎn)環(huán)節(jié)需要記錄的內(nèi)容,結(jié)合實(shí)際生產(chǎn),去掉部分不必要的和生產(chǎn)過(guò)程中難以填寫的內(nèi)容,對(duì)每個(gè)數(shù)據(jù)集統(tǒng)一技術(shù)要求,信息不必重復(fù)采集。
地理國(guó)情元數(shù)據(jù)數(shù)據(jù)庫(kù)主要包括成果數(shù)據(jù)基本信息,數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)編輯整理、外業(yè)調(diào)繪核查、質(zhì)量檢查、成果驗(yàn)收、負(fù)責(zé)單位以及成果總體精度等方面,按照統(tǒng)一的技術(shù)要求和有關(guān)數(shù)據(jù)進(jìn)行生產(chǎn)。每個(gè)內(nèi)容里分別設(shè)置相關(guān)的數(shù)據(jù)項(xiàng),如補(bǔ)充影像數(shù)據(jù)情況包括補(bǔ)充影像資料類型、補(bǔ)充影像拍攝時(shí)間、補(bǔ)充影像分辨率、補(bǔ)充影像波段數(shù)、補(bǔ)充影像數(shù)據(jù)源標(biāo)識(shí),這樣在使用進(jìn)就可以了解到補(bǔ)影像的基本情況。
元數(shù)據(jù)相當(dāng)于數(shù)據(jù)的電子檔案,是通過(guò)計(jì)算機(jī)磁盤等設(shè)備進(jìn)行存儲(chǔ),與普通紙質(zhì)檔案相對(duì)應(yīng),相互關(guān)聯(lián),區(qū)別于一些客觀存在存放在電腦里的檔案實(shí)體。元數(shù)據(jù)是用來(lái)描述數(shù)據(jù)的數(shù)據(jù),相當(dāng)于文件檔案。
元數(shù)據(jù)電子檔案的優(yōu)勢(shì)具有方便人工識(shí)讀、存儲(chǔ)的密度高、信息與載體之間可以分離性、多種信息媒體的繼承性的特點(diǎn)。
元數(shù)據(jù)具有電子檔案的真實(shí)性和完整性,它可以確保長(zhǎng)期可讀,具有查詢、檢索、發(fā)現(xiàn)、管理描述等基本功能,使用起來(lái)快捷方便、直觀、一目了然。
可以通過(guò)元數(shù)據(jù)明確的定位到相關(guān)位置,了解電子數(shù)據(jù)的相關(guān)信息。在地理信息中1:10000基礎(chǔ)測(cè)繪中的元數(shù)據(jù)是以單幅圖的形式存在的,在上千幅圖中想要找到一幅圖,只能在元數(shù)據(jù)的圖號(hào)中搜索圖號(hào),就可以看到圖幅相關(guān)信息,如圖幅生產(chǎn)時(shí)間、坐標(biāo)系統(tǒng)、用何影像和何方法制作,存放地點(diǎn)及所想了解的相關(guān)信息等,這樣就可以方便使用者在一個(gè)MDB文件中找到單幅圖的相關(guān)信息。
通過(guò)元數(shù)據(jù)的信息做大數(shù)據(jù)分析,對(duì)數(shù)據(jù)的生產(chǎn)年代、格式、內(nèi)容等進(jìn)行分析、評(píng)估,查看數(shù)據(jù)存在的意義,是否應(yīng)該做更新處理。
根據(jù)提供的描述信息對(duì)一類的數(shù)據(jù)進(jìn)行提取方,這樣可以方使對(duì)基礎(chǔ)數(shù)據(jù)做橫向?qū)Ρ取?/p>
元數(shù)據(jù)中的某一數(shù)據(jù)信息發(fā)生變化可以通過(guò)檢索到指定位置立即更新。
元數(shù)據(jù)具有數(shù)字化屬性的特點(diǎn),決定了它可以采用不同格式、不同的內(nèi)容建立,為使用者提供嚴(yán)密的語(yǔ)法結(jié)構(gòu)和通用的擴(kuò)展機(jī)制。
元數(shù)據(jù)規(guī)范了數(shù)字化數(shù)據(jù)、信息的表達(dá)和使用,對(duì)電子檔案資源的共享做好了鋪墊,實(shí)現(xiàn)了共享互補(bǔ),不但能夠節(jié)約數(shù)據(jù)成本,而且提高了資源的利用效率,同時(shí)對(duì)電子文件進(jìn)行數(shù)據(jù)分類和歸并提供依據(jù)。
元數(shù)據(jù)在使用過(guò)程中應(yīng)規(guī)范管理,以免被人改動(dòng),造成不必要的損失。