楊婧 關鑫
摘 要:元數據是說明數據內容、質量、條件、查詢和其他有關特征的背景數據,在信息共享中有重要作用。本文重點介紹了地質礦產分析測試元數據標準和元數據庫管理系統的研究。
關鍵詞::元數據;數據庫;分析測試
實驗室信息管理系統(LIMS)、區域地球化學數據管理系統(PGD )和全國巖石數據庫的逐步建立和應用,使我國海量區域地球化學數據實現計算機化管理和信息共享,并能靈活、高效、方便地進行數據查詢和數據檢索處理及成果圖示成為現實。然而,由于分析測試領域寬大,數據項目繁多,國內外尚未制定出相應的元數據標準,各系統和部門的實驗室,大都依據本系統的傳統方法建立 LIMS 系統,或開發只局限于本部門的數據庫系統,本應從全局方位客觀地分析實驗室數據的需求關系,未能從全社會共享的思維設計開發分析測試實驗室的數據庫,由此阻礙了基礎數據庫的進一步應用和數據共享,使許多珍貴的數據資源難以有效地用于解決地質、礦產、環境及農業等方面問題。
因此,開展地質礦產實驗室分析測試元數據標準研究,建立分析測試數據元數據庫,它能為立足國內,加強地質勘查,解決礦產資源和能源供應以及相關領域的科學研究,提供分析數據的互操作和信息共享。本項工作為中國地質調查局研究項目的子課題之一,其研究目標是:為了指導和規范地礦實驗室數據庫建設工作,根據現行國土資源信息的有關法律、法規、技術標準,在制定的地質礦產分析測試元數據標準的基礎上,研究地質礦產分析測試元數據庫管理系統,為地質調查實驗室數據的組織維護、數據檢索和數據交換提供技術基礎。
一、 地質礦產分析測試元數據
元數據是使數據充分發揮作用的重要條件之一,可用于數據文檔的建立、數據發布、數據瀏覽、數據轉換等,對于促進數據的管理、使用和共享有重要的作用。如果沒有元數據,就不能有效地管理和使用原始數據。
新一輪地質大調查,對實驗測試工作提出了更新、更高、更快的要求。地質大調查不僅承擔區域化探、地質礦產預查與普查、大中比例尺區域地質及厚覆蓋區多目標地球化學調查任務,還要承擔海洋地質、環境地質、水資源環境的調查任務。因此,地質大調查與原來的地質工作相比較,已經從單純的找礦向多元化方向發展,測試技術領域亦從單一的元素分析擴大到多目標的無機、有機、形態分析,其數據之繁多、類型之復雜,前所未有。有機地球化學研究和海洋地質、生態環境地質、農業地質、災害地質等都對分析測試數據管理提出了新要求。特別是開展全球地球化學填圖,要完成70 多種元素分析,需要進行大批量樣品中的元素分析,并保證實驗測試質量。因此,地質礦產實驗室的分析測試元數據標準要適應多種數據集的要求,同時力求簡潔,便于操作和實施,主要數據元素被認為是那些重要的、值得長期記錄和保存在可存儲大量數據庫的計算機系統中的元素。為此,我們在詳細分析地質礦產實驗室分析數據的基礎上,參考國內已經制定的《國家基礎地理信息系統元數據標準》和《國土資源信息核心元數據標準》,研究制定地質礦產分析測試元數據標準。
本標準提供有關實驗測試數據標識、覆蓋范圍以及數據集的內容、質量、狀況和其他特性信息。它可用于分析數據采集、交換、處理和數據庫設計,以及數據集編目、數據交換網絡服務,并滿足新一輪地質大調查實驗數據管理和數據共享要求。根據地礦實驗室樣品的分析數據特征和需求進行分類、組合,既要考慮標準的通用性,又要考慮不同實驗室的專業化要求,在建立通用的一級元數據的基礎上,結合地質行業數據類型多、數據量大和用戶類型多的特點,建立二級元數據標準,以管理好這個數據庫群, 讓用戶更多、更快、更好、更容易地了解、掌握和使用這個數據庫,并和中國地質科學數據網站點WDC的欄目相結合,便于今后進行數據庫的運行維護。一級元數據的內容由6個不重復使用的主要子集和2個可重復使用的次要子集內容組成。
標識信息:用于唯一標識一個數據集,包括數據集名稱、版本、語種、出版日期、覆蓋范圍、采集資料等信息。
數據質量信息:關于數據集質量的評價。提供有關數據采集項目名稱、數據志說明、質量控制等方面信息。
描述信息:數據集的內容描述。提供數據集摘要、開發目的、進展情況、關鍵詞和參考文獻等信息。
發行信息:數據集的獲取信息。包括數據集發行單位、發行格式、網上發行地址等信息。
元數據參考信息:元數據的當前信息和負責部門信息。包括元數據負責單位、作者、地址、編寫日期、最后修改日期等信息。
二、 地質礦產分析測試元數據庫管理系統
元數據管理的主要目標是提高存取元數據和它所描述的數據集的能力。為了保證元數據的準確性、完備性,由數據集的生產者來擔負元數據的建立工作。在元數據信息管理系統的體系結構中,元數據的采集工作是由數據集生產者通過元數據管理系統子系統完成。當有新的數據集產生后,數據集生產者可以依據元數據標準,將數據集的各項特征信息逐個從數據集中總結提煉出來,輸入元數據管理系統。所有特征元素內容填寫完畢后,并且通過管理系統的邏輯檢查之后,就可以將該數據利用元數據庫管理系統添加入庫。元數據庫是為保存和處理元數據而設計和建立的數據庫。元數據庫的運行方式和正常數據庫相同。
1.運行環境。本系統的運行環境要求在網絡環境下運行,通過WEB 方式將數據集生產者手中的元數據集中到元數據庫管理系統進行管理,并且通過元數據發布系統為使用者提供查詢服務。使用者可以借助元數據深入的了解數據集的各項特征,最終通過元數據提供的獲取途徑取得該數據集。
2.系統結構。元數據管理系統用于編輯生成元數據信息,另外,元數據庫是元數據共享的信息源,元數據的管理工作還必須對元數據庫進行日常維護,以保證元數據庫成為數據集共享的有效信息源,所以必須包括數據提交、數據瀏覽、數據查詢 、數據維護等內容。
3.功能模塊
(1)數據提交。包括元數據\ 數據集\ 項目的提交。項目v的提交提供了批量數據導入數據庫的功能。
(2)數據瀏覽。包括分類瀏覽、數據查詢。查詢方式簡便,組合查詢形式靈活,可以按相同項目的結果值大小排序查詢,用戶只須輸入分析項目名稱和選擇排序方式,就可查詢庫中數據集中該分析項目的分析結果,并按用戶要求的排序方式顯示信息。
(3)數據維護。包括用戶管理、新聞管理、訪問日志、項目管理。項目管理建立靜態數據庫,如,針對各種分析測試類型,編輯常用的分析項目入庫,以此建立了不同分析類型與分析項目的關系數據庫,在進行數據提交時,只需選擇分析測試類型,相關的分析項目就可調出,能大大提高分析項目數據提交的效率。另外一種方式是數據代碼表,它用于描述一個數據項中可能取值的長列表,它是一個靈活的枚舉類。使用代碼表不要求表中的元素都是已知的,可以有其他可能的取值,如,使用數據代碼表描述分析測試類型,用戶只需選擇列表項,即可錄入參數。
三、 結 語
隨著網絡技術的發展,元數據已成為信息服務和信息資源管理不可缺少的組成部分,是信息共享的前提和基礎。地礦實驗室的網絡基礎設施建設已初具規模,利用地質礦產分析測試元數據標準和關系數據庫管理系統建立地質礦產分析測試元數據庫,同時,開發地質礦產分析測試元數據操作工具管理和利用元數據,在地礦行業推廣實施,搭建地礦分析測試數據共享平臺。
作者簡介:楊婧(1990-),女,助理工程師,現在遼寧省核工業地質局241大隊工作。