趙 汀,王登紅,黃文斌,李曉妹,鄭國棟,孫 艷,于 揚(.中國地質科學院礦產資源研究所,國土資源部成礦作用與資源評價重點實驗室,北京 00037;.中國地質圖書館,北京 00083)
三稀戰略調查成果數據庫建設與應用
趙汀1,王登紅1,黃文斌2,李曉妹1,鄭國棟1,孫艷1,于揚1
(1.中國地質科學院礦產資源研究所,國土資源部成礦作用與資源評價重點實驗室,北京100037;2.中國地質圖書館,北京100083)
隨著GIS空間數據庫技術的發展,礦床學研究越來越離不開數據庫的支持。我國三稀礦床分布廣泛,長期以來積累了大量三稀礦產資源地質報告和數據,2012年起在“全國三稀資源戰略調查項目”支持下建設了“三稀戰略調查成果數據庫”,涵蓋了34種稀土稀有稀散礦產,集成了三稀戰略調查的成果數據資料。本文介紹了構建這個涵蓋全球的三稀資源分布、產業、市場、消費、貿易的大型空間數據庫的設計思路、技術路線、質量控制、主要成果。三稀戰略調查成果數據庫迄今為止已經開始在戰略性新興產業礦產地質調查評價項目工作部署、稀土礦遙感動態監測、三稀圖集編制等方面發揮了重要作用。
數據庫;稀土稀有稀散元素;礦產資源;GIS
“三稀”是稀土、稀有和稀散元素的簡稱,本次研究共涉及34種元素,包括17種稀土元素,鈮、鉭、鋰、鈹、鋯、鉿、鍶、銣、銫等9種稀有金屬元素以及鎵、鍺、銦、鉈、錸、鎘、硒、碲等8種分散元素[1-2],這些元素形成復雜的不同類型的礦物及礦床,三稀礦床是工業、農業、特別是尖端的電子信息等新興戰略產業必不可少的資源,隨著近些年高科技新材料的發展,這些三稀元素在高新技術材料領域起著不可替代的重要作用,對于建設這一領域里的數據庫已經獲得了廣泛重視。
我國三稀金屬礦分布廣泛,全國16個成礦省中均有稀有稀土金屬礦產資源的分布,在覆蓋全國陸地面積的90個Ⅲ級成礦區帶中有5個以稀土為主要礦種之一,有15個以稀有金屬為主要礦種之一。雖然我國對15個重點成礦區帶 (新疆阿爾泰-青河鋰、鈹、鈮鉭礦帶,新疆塔里木西北緣鈮鉭、稀土礦帶,新疆西準雪米斯坦山鈹礦帶,南嶺成礦帶,大興安嶺成礦帶等)進行了比較深入而全面的研究[3],但是研究程度高體現在個體,缺少系統化整合這些包括境內外的稀有稀散稀土資料的工具。
由于歐美國家對地質科學信息化有較早、較高的認識,在歐美國家,大多數建有成熟的礦床數據庫系統,如美國USGS的全球礦產資源數據庫,覆蓋絕大多數大宗礦產,但存在稀有稀散稀土儲量開發利用數據缺乏、儲量數據不實等問題。國內地調局系統在地學信息化建設工作中已取得了長足的進步,建立了礦產地數據庫、工作程度數據庫等一系列數據庫,但在三稀礦床領域,這些小礦種由于多為伴生礦產,經濟價值不明顯,側重于這些礦種的基礎信息化建設還需要加強。由此可以看出,在稀土稀有稀散礦床的系統研究、資源開發利用、資源信息整合、調查研究、科學評價等方方面面都對地質信息服務提出了廣泛需求。
2012年起在“全國三稀資源戰略調查項目”支持下建設了“三稀戰略調查成果數據庫”,涵蓋了34種稀土稀有稀散元素,全球三稀主要國家長時間周期的儲產銷貿數據,集成了三稀戰略調查的成果數據資料,向開展稀有稀散稀土礦床科學研究的地質學家、國家礦產資源管理部門以及國內外開展三稀找礦勘察投資企業提供高效、便捷、有效、智能的服務[4]。
1.1總體設計思路
三稀戰略調查成果數據庫基于我國三稀戰略調查項目成果,同時也集成三稀礦產地質勘查、科研多年的積累,數據信息來源于各種地質調查成果數據庫、商業數據庫、權威公開數據庫、地質報告以及公開發表的論文及著作,數據都需要加以甄別梳理,以確保本數據產品的可靠性和科學意義。
明確數據庫面向用戶群體就是科研工作者和國土資源管理者,基于一切在服務用戶的宗旨下選擇了用戶最熟悉的“三圖一庫”的數據服務形式,由于需要省級研究人員參與,所以專門制定了省級數據庫建設技術要求,供數據模型建庫人員遵循(圖1)。
1.2庫內容和結構設計
數據庫架構設計從內容上分為兩大部分 (圖2):一是全球三稀資源分布,其中包括國內三稀資源庫和國外三稀礦床庫,入庫了國內礦床的成礦區帶、礦種、規模、礦床地質基本特征等信息,國外礦床的基本信息、礦床類型、主要礦種等信息;二是三稀礦床相關文獻,包括國內外三稀礦床地質報告、國外三稀文獻數據庫、礦產品價格、貿易等資源經濟數據、相關法律政策等。第一大類是傳統的數據庫范疇,有規范的數據庫結構定義和完整性約束;而第二大類是非傳統的數據庫模式,格式五花八門,沒有統一的結構約束,本數據庫中通過內容標注實現檢索和查詢功能。
將數據類型分為空間數據和屬性數據兩大類,采用硬件成本較低的基于ACCESS和MapGIS的物理平臺,依靠大數據量的應用測試,循序漸進增加專題內容,逐步完善數據庫結構設計。
1.3空間數據庫設計
空間數據是基于MapGIS數據格式,分為省級和全國級兩大層級。省級三稀匯總空間數據庫主要內容簡單的說就是“三圖一庫”,即三大類省級GIS專題圖件:全省三稀資源分布圖,全省三稀資源成礦遠景區劃圖,全省三稀資源勘查工作部署圖;ACCESS庫:全省三稀調查成果ACCESS屬性數據庫。
全國三稀匯總空間庫也是三圖一庫的模式,即:全國單礦種三稀資源分布圖,全國三稀資源成礦遠景區劃圖,全國三稀資源勘查工作部署圖;ACCESS庫:全國三稀調查成果ACCESS屬性數據庫。

圖1 空間數據庫建設路線Fig.1 Outline of spatial database construction

圖2 三稀戰略調查數據庫空間數據與屬性數據內容Fig.2 Content of spatial data and attribute data of‘three rare minerals resources strategic survey results database’
1.4屬性數據庫設計
從各省和資料館收集上來的數據,格式是不統一的、有噪聲的初級數據,不能簡單地對這些數據進行錄入入庫,必須對其進行整理,查錯糾錯,匯總。在此基礎上分析確定三稀戰略調查成果數據庫應包含的信息,初步擬定數據庫包括39張數據表,包括稀有稀散礦區地質特征表、礦山資源經濟特征表、探礦權特征表、礦體指標表、礦山三率指標表、地質資料表等 (圖3)。

圖3 屬性數據庫表設計Fig.3 Attribute database design
本數據產品將以數據庫的形式存儲歸納整理的科學數據信息,具體研究內容初步設計應主要包括以下方面:
①礦種:本次建庫工作涉及的稀有稀散稀土礦床包括鋰、鈮鉭礦、鈮礦、鉭礦、銣、銫、鈹、鋯、鍶、17種稀土元素,以及鎵、鍺、銦、鉈、錸、鎘、硒、碲等8種分散元素礦床。
②礦床基本信息:包括礦床名稱、產地、礦種、礦床類型、大地構造位置、控礦地質因素、控礦構造、圍巖蝕變等與成礦有關的基本礦床地質信息(圖4)。
③礦產資源經濟信息:主要包括礦床的儲量參數、礦床規模、開采程度、交通條件等信息。
④資源儲量特征信息:包括礦體名稱、幾何形態、礦種名稱、品質、資源儲量等信息。
⑤礦山地質資料目錄:對列入數據庫的各種數據信息的出處要加以描述和儲存,以備用戶查找原始資料之需。這些信息包括資料原始編號、作者、資料名稱、編制單位、編制時間等。
⑥成礦區帶代碼庫:代碼庫是數據庫建設中數據標準化的關鍵代碼,成礦區帶屬性標明了本數據庫成礦區帶名稱和代碼,引用了全國礦產資源潛力評價數據模型所用的成礦區帶代碼[5]。
⑦礦床類型代碼庫:本數據庫成礦區帶名稱和代碼引用了全國礦產資源潛力評價數據模型所用的成礦區帶代碼。
⑧礦產名稱代碼庫:礦產名稱是資源儲量統計的關鍵,礦產名稱代碼引用了礦產資源儲量數據庫規范代碼庫。

圖4 屬性數據庫界面Fig.4 Attribute database interface
⑨其他相關代碼庫……
1.5邏輯錯誤控制設計
屬性數據庫還完善了錯誤控制,設置了完整性校驗,保障數據庫中數據在邏輯上的一致性、正確性、有效性和相容性。數據庫完整性由各種各樣的完整性約束來保證,因此可以說數據庫完整性設計就是數據庫完整性約束的設計。
三稀數據庫建庫分成三大步驟(圖5):第一,多源數據收集;第二,數據處理、查錯與匯總;第三,按數據庫設計要求開發集成大數據運行平臺。
2.1采取多源多渠道矩陣式收集資料
(1)理清了國內外三稀礦產地的分布,各礦種的品質信息的查詢,匯總最新的稀土、稀散、稀有礦產地空間分布和保有資源規模、品質等。
(2)以三稀各省項目組調查成果為信息源,匯總各工作項目提交的成果數據,包括報告、圖件等,按照三稀數據庫建設要求按省級→全國級兩級數據規范化裝入數據庫系統 (圖6)。
(3)以國際權威機構官方網站為信息源,Metal bulletin為數據源,建立全球三稀主要資源國家長時間周期的儲產銷貿數據,進行包括礦產品國際市場價格、海關進出口信息等重點定向情報跟蹤,及相關資料的檢索和搜集。
(4)以地質資料館國內外地學文獻數據庫以及館藏文獻為信息源,涵蓋書籍、期刊等主要文獻形式,通過中國地質圖書館館內渠道,進行相關文獻資料的檢索和搜集。
(5)以國內外三稀金屬專題會議或有關會議論文專輯、著作、研究報告等為信息源,密切關注并積極參與,盡可能第一時間獲得第一手會議情報與成果資料。
(6)利用遙感多時相、響應快速的特點,對國內外重點熱點的勘查開發礦山進行現狀跟蹤調查評價,收集遙感影像數據并入庫。
2.2對收集的數據進行整理、查錯、糾錯、匯總

圖5 三稀調查成果數據庫建設技術路線Fig.5 Outline of three rare minerals resources strategic survey results database

圖6 多源數據抽取、轉換、加載技術路線(以資源儲量為例)Fig.6 Outline of extract,transform and loading processes(a case of minerals resources reserves)
收集的資料有各種不同的來源,涵蓋全球基礎地質、三稀礦山、礦床、礦業經濟等有關的數據,包括異構數據庫、論文、書籍、網站 、結構化和非結構化文檔等,各來源數據大體上都是不完整的、有噪聲的、不一致的多結構數據,不能簡單地對這些數據進行錄入,必須對其進行預處理,查錯糾錯,分析匯總,在此基礎上分析確定它們是否是三稀數據庫應包含的數據。然后將這些數據人工進行整理,分門別類地保存在對應的Shapefile、MapGIS、Excel等格式的文件內,作為入庫的原始數據。在數據收集登記以及之后人工整理的過程不可避免會出現錯誤,不能滿足入庫條件,而且空間數據可以是 Excel格式的數據,也可以是Shapefile或是其他格式的非固定結構化的數據,甚至是描述性的數據,所以ETL過程是非常必要的 (圖6)。對于收集的Excel、Word等格式的屬性數據,此過程要進行數據格式判斷、數據有效性判斷;對每一個值均要進行判斷,如年份必須為有效的整數,其他數據有的為字符串、有的為數值,而數值則必須是有效的。收集的數據來源的多樣性決定了數據質量參差不齊,故對各種格式的無效數據進行過濾、替換則成為至關重要的一環。空間數據的ETL過程更為復雜棘手,必須采用計算機進行有效性判別,同時還要人為進行各種空間參數、空間要素的正確性判斷等,以及屬性值與屬性進行關聯的正確性等。對原始數據進行篩選提取后,再使用程序將其轉換成與目標數據庫中相近的數據格式/類型,然后進行判斷。通過判斷后,系統才能夠將這些數據保存到對應的數據庫中。
2.3按數據庫設計要求開發集成大數據運行服務平臺
數據庫首先是要服務于用戶,面向用戶需求,集成涵蓋多個專業領域的三稀大數據平臺,并開發數據庫管理系統,設計友好的用戶界面,采用空間數據庫與屬性數據關聯的所見即所得的查詢方式。
大數據平臺是基于GIS技術的空間數據管理平臺,開發語言為C#,代碼示例如下:
public static Pnt_Info WTConfig(short sType)
{
Pnt_Info pntInf=new Pnt_Info();
switch(sType)
{
case 0://礦產地[顏色、高度、寬度、筆寬、子圖號、圖層]
string[]t_KCD=System.Configuration.ConfigurationManager.AppSettings["WTKCD"].Split(',');
if(t_KCD.Length!=5)
{
t_KCD=new string[]{"1","0.00005","0.00005","0","7","21"};
}
pntInf.iclr=Convert.ToInt32(t_KCD[0]);
pntInf.type=Enum_Pnt_Type.gisPNT_SUB;
pntInf.layer=Convert.ToInt16(t_KCD[5]);
pntInf.ovprnt=0;
pntInf.sub.angle=0.0;
pntInf.sub.height=Convert.ToDouble(t_KCD[1]);
pntInf.sub.width=Convert.ToDouble(t_KCD[2]);
pntInf.sub.penw=Convert.ToDouble(t_KCD[3]);
pntInf.sub.subno=Convert.ToInt32(t_KCD[4]);
break;
case 1://礦產點[顏色、高度、寬度、筆寬、子圖號、圖層]
string[]t_KC=System.Configuration.ConfigurationManager.AppSettings["WTKC"].Split(',');
if(t_KC.Length!=5)
{
t_KC=new string[]{"1","0.00005","0.00005","0","7","22"};
}
pntInf.iclr=Convert.ToInt32(t_KC[0]);
pntInf.type=Enum_Pnt_Type.gisPNT_SUB;
pntInf.layer=Convert.ToInt16(t_KC[5]);
pntInf.ovprnt=0;
pntInf.sub.angle=0.0;
pntInf.sub.height=Convert.ToDouble(t_KC[1]);
pntInf.sub.width=Convert.ToDouble(t_KC[2]);
pntInf.sub.penw=Convert.ToDouble(t_KC[3]);
pntInf.sub.subno=Convert.ToInt32(t_KC[4]);
break;
case 2://礦區編號[顏色、高度、寬度、漢字字體、排列方式、漢字字形、橫向間隔、圖層]
string[]t_KQBH=System.Configuration.Configuration-Manager.AppSettings["WTKQBH"].Split(',');
pntInf.iclr=Convert.ToInt32(t_KQBH[0]);
pntInf.type=Enum_Pnt_Type.gisPNT_NOTE;
pntInf.layer=Convert.ToInt16(t_KQBH[7]);
pntInf.ovprnt=0;
pntInf.ch.angle=0.0;
pntInf.ch.chnt=Convert.ToInt16(t_KQBH[3]);
pntInf.ch.hvpl=Convert.ToInt16(t_KQBH[4]);
pntInf.ch.ifnt=1;
pntInf.ch.ifnx=Convert.ToInt16(t_KQBH[5]);
pntInf.ch.space=Convert.ToDouble(t_KQBH[6]);
pntInf.ch.height=Convert.ToDouble(t_KQBH[1]);
pntInf.ch.width=Convert.ToDouble(t_KQBH[2]);
break;
}
return pntInf;
}
}
三稀成果數據庫在建設過程中就逐漸開始服務各級用戶,迄今為止已經開始在三稀礦產資源調查評價項目部署、稀土礦遙感動態監測、三稀圖集編制等工作中發揮了重要作用。
贛南地區稀土開采具有小礦多、民采多、環境破壞嚴重等特點,由于分布多在丘陵地帶,植被覆蓋率較高,這樣為礦山開采動態監測增加了難度,而遙感有數據更新快、獲取方便的有利條件,由于技術的發展和適宜的重訪周期,能夠在各種情況下實現對同一地點地表信息的周期性觀測,為礦產開發管理提供動態監測服務。
利用三稀礦產戰略調查成果數據庫中的空間數據庫的多重數據疊加綜合分析功能 (圖7),在數據庫中選擇礦權矢量數據與多時相遙感柵格影像數據疊加分析,在贛南重點研究區進行礦產資源開發遙感動態執法調查,證實運用遙感技術對礦產資源違法開采信息進行監測有直觀、快速取證、定量分析的優點,為在更大范圍內推行遙感調查奠定理論和實踐基礎。
“三稀戰略調查成果數據庫”具有較強的專業性,便于廣大地質專業人員研究使用已有的科學數據成果,提高綜合對比研究水平,推動三稀礦床地質研究工作。該數據庫的成功建設為我國三稀金屬礦產資源安全政策制定與動態監管提供數據信息平臺。本數據庫建設工作得到了地調局資源評價部、各省三稀項目參加科研人員,及全國項目組王瑞江、李建康研究員等的大力支持,特致謝意!

圖7 數據庫中集成礦權矢量數據與遙感柵格影像數據用于動態監測越界開采Fig.7 Database integrated mining right vector data and raster image data for remote sensing dynamic monitoring of cross-border exploitation
[1]王登紅,王瑞江,李建康,等.中國三稀礦產資源戰略調查研究進展綜述[J].中國地質,2013,40(2):361-370.
[2]王登紅,趙芝,于揚,等.離子吸附型稀土資源研究進展、存在問題及今后研究方向[J].巖礦測試,2013,32(5):796-802.
[3]袁忠信,李建康,王登紅,等.中國稀土礦床成礦規律[M].北京:地質出版社,2012.
[4]李德仁,程濤.從GIS數據庫中發現知識[J].測繪學報,1995,24(1):37-44.
[5]左群超,楊東來,趙汀,等.礦產預測研究數據模型[M].北京:地質出版社,2011.
[6]趙汀,王登紅,王瑞江,等.克里格法在離子吸附型稀土礦勘查儲量估算中的應用 [J].巖礦測試,2014,33 (1):126-132.
Construction and application of rare earth,rare metal and rare-scattered elements mineral resources database
ZHAO Ting1,WANG Deng-hong1,HUANG Wen-bin2,LI Xiao-mei1,ZHENG Guo-dong1,SUN Yan1,YU yang1
(1.MLR Key Laboratory of Metallogeny and Mineral Assessment,Institute of Mineral Resources,Chinese Academy of Geological Sciences,Beijing 100037,China;2.National Geological Library of China,Beijing 100083,China)
With the development of GIS spatial database technology,more and more mineral deposit research need the support of GIS database.‘Three rare’is referred to the rare earth,rare metal and rare-scattered element mineral resources widely distributed in China.There is a long history of three rare mineral deposits study accumulated a lot of valuable geological data.In 2011 the‘national three rare minerals resources strategy survey project’supports the construction of a‘three rare minerals resources strategic survey results database’.The database covers more than 34 kinds of rare earth,rare scattered elements.It has the world's store and trade data of three rare in the main market.This article describes the design idea to build this global coverage of the three rare resource distribution,industry,market,consumption,quality control and trade,large-scale spatial database technology route.The three rare strategic survey database so far plays an important role in the evaluation of CGS geological survey project,rare-earth ore remote sensing monitoring and three rare minerals resources mapping.
database;rare earth,rare metal and rare-scattered elements;mineral resources;GIS
P628.4;P618.7
A
1674-9057(2016)01-0036-06
10.3969/j.issn.1674-9057.2016.01.006
2015-06-08
中國地質大調查項目 (1212011220807;12120113079500)
趙汀 (1975—),博士,副研究員,研究方向:礦產資源與經濟,1971076064@qq.com。
引文格式:趙汀,王登紅,黃文斌,等.三稀戰略調查成果數據庫建設與應用[J].桂林理工大學學報,2016,36(1):36 -41.