高學正,齊釩宇,賈麗瓊,孔昭煜
(1.中國地質調查局發展研究中心,北京 100037;2.全國地質資料館,北京 100037)
地質資料是地質工作的真實記錄與成果的結晶,切實關系到地質工作的長遠發展,對我國能源資源安全十分重要。同時,地質資料也是我國社會經濟發展以及基礎設施建設的重要參考[1-2]。地質資料目錄工作是地質資料館藏機構的基礎性、核心性工作之一[3],是對地質資料數據描述、組織和管理的核心手段[4]。
《地質資料管理條例》(國務院令第349號)以及《地質資料管理條例實施辦法》(原國國土資源部令第16號)的頒布為地質資料目錄公開與服務提供了法律依據,文件明確提出:地質資料館藏機構應當利用現代信息處理技術,提高地質資料的處理、保管水平,建立地質資料信息服務網絡系統,公布地質資料目錄,開展對地質資料的綜合研究工作,為政府決策提供依據,為社會提供公益性服務。
地質資料目錄與地質資料元數據是開展地質資料科學化管理與社會化服務的基礎。近些年,全國地質資料館十分重視地質資料目錄及元數據建設,不斷加大人員和資金力度,建立起了以地質資料數據目錄為抓手,案卷級地質資料元數據及文件級地質資料元數據為主線的地質資料目錄體系,為成果地質資料的科學化、精細化管理以及高效的社會化服務提供支撐。
截至2019年4月末,全國地質資料館已對外提供服務的資質資料目錄達14.9萬條,其中地質調查類資料目錄11 550條,非地質調查類資料目錄137 596條。平均每年增加目錄近5 000條,為申請服務、網絡服務和人工個性化定制等多種服務提供了保障。
館藏目錄中各專業目錄的占比情況為:區域調查資料10 913檔,占比7.32%;礦產勘查資料91 154檔,占比61.12 %;水工環勘查資料13 062檔,占比8.76%;物化遙勘查資料13 504檔,占比9.05%;地質科學研究資料18 014檔,占比12.08%;海洋地質調查資料336檔,占比0.22%;技術方法研究資料1 831檔,占比1.23%;其他資料332檔,占比0.22%。
近些年,全國地質資料館新進多種類型的地質資料及目錄,包括①片區總結資料及目錄。主要為東北、華東、華北及西北地區的基礎地質綜合調查與片區總結成果報告。除此以外,還包括河北、江蘇、陜西、廣西、貴州、山西、寧夏等省(區)的區域性片區總結報告。報告中匯總分析研究了各地區以往基礎地質成果資料,對提高各區域基礎地質調查研究程度、深化基礎地質背景認識、滿足國家和區域社會經濟發展需求、解決制約資源與環境地質調查評價的地質問題等具有重要意義(表1)。②關鍵地區區域地質調查資料成果及目錄。此項工作由中國地質調查局下達并開展,已陸續匯交到全國地質資料館,目前共接收到相關報告及目錄17份,包括秦嶺、南嶺、武夷山、大興安嶺南段、長江中下游等地區,范圍廣泛。成果資料中的系列圖件與建立的基礎地質數據庫,提高了各主要成礦帶的地質礦產調查評價研究水平,對區域內成礦地質背景、古生代構造格局、區內地球動力學機制研究取得了一系列新的認識。③地質志類資料及目錄。全國地質資料館分別接收了《北京市區域地質志上中下卷》和《湖北省區域地質志上中下冊》資料和目錄。除此以外,館藏中還有14檔有關地質志的資料,這些資料反映了我國16個省(區)的基礎性地質調查研究成果,對城市地質調查、地礦勘查規劃、礦山恢復、重大工程選址等工作具有重要意義。同時,可作為國民經濟建設、國土資源規劃及管理、礦產勘查部署決策的依據。④國情調查類資料及目錄。“全國礦產資源潛力評價”項目成果資料和“全國礦業權實地核查”項目成果資料已經全面提供社會化服務。“全國礦產資源利用現狀調查”項目部分成果資料已可提供資料服務,其余資料正在開展匯交及履行館內手續等工作。至此,我國三大國情地質調查項目成果資料均已對外提供社會化服務。

表1 館藏片區總結報告清單Table 1 Areas summary report list of collection
續表1

檔號資料名稱編寫單位120965河南省1∶5萬區調片區總結報告:小秦嶺-盧氏片、西峽-魯山片河南省地質調查院91082河南省小秦嶺-盧氏片、西峽-魯山片1∶5萬區調片區總結報告河南省地質調查院120795湖北省大別山地區1∶5萬區調片區總結湖北省地質調查院121064寧夏香山地區1∶5萬區調片區總結報告:1∶25萬寧夏地質調查院121544河北省太行山中-北段1∶5萬區調片區總結說明書:1∶25萬河北省地質礦產勘查開發局1208811∶5萬區域地質調查云開片區總結上冊、下冊廣西地質調查研究院106185貴州安龍地區1∶5萬區調片區總結報告:安龍幅G48C003003 1∶25萬地質圖說明書貴州省地質調查院104327山西省五臺山-恒山1∶5萬區調片區總結報告山西省地質調查院121394江蘇省東北部地區1∶5萬區調片區總結報告江蘇省地質調查研究院
除以上基于成果地質資料匯交整理完成的地質資料目錄以外,全國地質資料館還根據社會需求和進館項目成果資料情況,對重要的地質圖空間數據庫、地球化學數據庫、地質災害調查、全國礦產地等數據庫開展了數據的集成與處理工作,向社會提供一系列的數據庫目錄服務(表2)。

表2 全國地質資料館提供服務的數據庫列表Table 2 List of databases provided by National Geological Archives
元數據是數據共享交換的核心與基本形式之一[5],資料元數據的工作能力也是當代各大圖書館、檔案館和數據中心的核心業務能力之一。元數據是數據管理的必要手段,同時也是建立數據之間關聯關系的必要手段。通過元數據,可以有效建立本地數據集之間、數據庫與文本間的關聯,也可以建立網絡間數據集與資料文本間的關聯。
地質資料元數據編目工作是在統一的標準規范指導下,通過獲取匯交資料的元數據信息,并進行完善和豐富,建立全國范圍內的地質數據清單,形成國家地質資料元數據數據庫,使得各類用戶可以在一個計算機窗口之下,找到其所需的數據,對于提高地質資料社會化服務能力意義重大。
地質資料元數據庫的建設是全國地質資料館取得的重大成果之一,地質資料數字資源是一種復雜數字對象,具有多源、異構的特征[6],地質資料元數據庫的建設很好的解決了這一問題,對地質資料的管理、到館服務及網絡服務產生了巨大的促進作用。目前,全國地質資料館元數據采集信息到地質資料文件級,案卷集加文件級元數據項共138項,可提供對外服務的地質資料總件數4 503 039件,其中包含有正文報告、附圖、附表、附件、多媒體、數據庫、審批等多種文件類別(表3)。

表3 地質資料數據形態分類Table 3 Morphological classification of geological data
地質資料數據的元數據不止一種,而是隨著地質資料數據生命周期的發展,在共享一個核心元數據的基礎上,不同生命周期階段有不同的擴展(圖1)。因此,全國地質資料館根據地質資料元數據的特點,針對地質資料的管理、利用、數據內容與結構、以及各自的業務需求,編研形成了包括地質資料核心元數據模型、產品元數據模型、在線數據服務元數據模型、數字資源目錄元數據模型等在內的多種數據模型,以滿足多元化需求[7]。

圖1 地質資料數據的元數據應用模型Fig.1 Metadata application model of geological data
隨著計算機技術的發展,地質資料網絡服務已經逐漸成為了地質資料社會化服務的主要服務模式。全國地質資料館通過對資料數據進行包裝、組織、數據編排與模型重組,形成地質資料網絡服務產品,向閱覽用戶提供服務。產品主要包括查詢類產品(圖2)、空間數據服務產品、專題服務類產品、信息類產品以及互聯互查服務5大類。

圖2 地質資料查詢類服務產品示意圖Fig.2 Sketch map of geological data query service products
支撐這5大類服務產品的數據基礎正是全國地質資料館館藏的14萬檔、400萬件地質資料元數據,通過將其進行網絡發布,形成了包括國家地質圖數據庫、國家礦產資源數據庫在內的地質圖庫數據服務產品;發布形成了全國城鎮化地質資料專題、公開版城市環境地質報告專題、全國主要城市環境地質調查資料專題、地質關鍵詞大數據等專題服務產品;集成并發布了7個地質調查資料數據分布產品,內容包括全國1∶10萬縣市地災、全國1∶20萬區域調查、全國1∶25萬航磁調查資料等,實現了多專題大數據集的互聯網發布[8]。這些產品的發布提高了地質資料社會化服務水平,形成了在線地質圖服務(WMS服務、WFS服務)與地質資料文檔數據瀏覽的混合服務模式,同時與過去只能依靠傳統地質資料目錄題名進行檢索相比,現在用戶可以進行更為精準的地質資料檢索,可以通過報告名稱、地圖的圖幅名稱、圖幅號、數據表名稱等文件級題名進行搜索,地質資料元數據的為社會公眾提供了更加精準的地質資料服務。因此,可以說元數據已經從簡單的描述發展成為用于管理數據、發現數據、使用數據的一種重要的工具[9]。
地質資料共建共享是大數據時代地質資料工作發展的必由之路,也是落實《自然資源部關于進一步加強地質資料社會化服務的指導意見》(自然資發〔2018〕179號)文件的必然選擇,地質資料總索引庫的建設是實現各級地質資料館藏機構互聯互通的前提。對比研究國際、國內的地質資料界、檔案界、圖書界元數據標準的基礎上,在保持語義一致的前提下,對已有數據模型針對實際情況進行繼承性擴展與完善,確定形成國家地質資料總索引庫標準,提供網絡環境下可解析的、持久的、可語義互操作的標識機制。進而開展全國館-省館的地質資料元數據交換機制研究,實現彼此間資料目錄互通有無,共享元數據建設成果,擴大可服務的目錄和數據范圍,促進彼此間地質資料元數據編目、交換、查詢等工作的開展,提高地質資料館藏機構的管理和服務水平。
當前,全國地質資料館的元數據編目到了文件級,提高了用戶的使用體驗,服務水平和效率得到很大提升。但地質資料文件結構及其中的關系錯綜復雜,面對數以億計的地質資料數據,文件中的很多內容以及項目之間的結構和關系還不能被有效地揭示,為資料的獲取和利用帶來的障礙[10-11]。因此,對地質資料的知識服務及標引開展研究十分必要,通過對知識服務和標引的研究[12],將用戶所檢索的內容深入報告文檔的內部,通過機構知識庫、地質地名庫等相關知識庫進行語義擴展,加強對資料內部的知識資源進行揭示,增強知識的語義表達,幫助用戶快速、精準定位所需內容,節省查詢時間,提高信息資源的查全率,使用戶在面對海量資源時實現對相關知識的精確查詢。
信息系統是實現地質資料快速檢索,提高服務水平,發揮地質資料巨大作用的重要工具。在未來數據檢索系統的建設中應著重考慮靈活的邏輯結構。實現可持續發展,能夠實現與其他系統的借口對接;加快查詢檢索速度,實行分布式的數據快速索引機制;提高系統適應性,實現跨平臺的數據訪問。
地質資料目錄以及資料元數據對于描述地質資料具有十分重要的作用,是開展數字化時代下地質資料科學管理與高效服務的核心內容。在未來,更好地利用計算機和網絡技術,加快地質資料元數據的獲取速度。打破信息壁壘,建立地質資料目錄共享與數據交換機制,實現目錄數據的互聯互通,有效提升地質資料的管理和服務水平,更好地發揮對社會經濟建設的巨大作用。