楊明莉 薛林福** 冉祥金 桑學佳 燕群 戴均豪
1. 吉林大學地球科學學院,長春 1300612. 中國礦業大學,徐州 221116
近年來,以人工智能、大數據為代表的新一代信息技術高速發展,地球科學的定量化研究開啟了新階段(趙鵬大, 2015; Bariketal., 2019; Zuo and Xiong, 2018; 蔡惠慧等, 2019; 季斌等, 2018; Wu and Zhang, 2020; 吳永亮等, 2017; 張亞光等, 2019)。面對海量多元異構的地學數據,傳統數學統計分析方法短板凸顯,智能化分析越來越成為研究熱點(李超嶺等, 2015; 周永章等, 2017, 2018; Holdenetal., 2019)。2018年1月5日,趙鵬大院士在接受《中國國土資源報》的采訪中指出,智能化是新時代地質工作的新趨勢和新特征。翟明國等(2018)也強調,大數據驅動下的礦產資源預測系統,是智慧找礦的重要基礎。礦產地質調查的自動化和智能化,也是礦產地質調查方法、技術發展的必然趨勢(劉艷鵬等, 2020)。
礦產地質調查經歷了1:20萬礦產普查、成礦帶1:5萬礦產地質調查等一系列發展階段(薛林福等, 2014),隨著GIS、空間數據庫、地理信息分析技術在礦產地質調查中的引入,數字化和自動化的礦產地質調查及找礦預測取得了較多重要進展(Chen, 2015; 李豐丹等, 2015; 劉艷鵬等, 2020; 吳永亮等, 2017; 于萍萍等, 2015; 周永章等, 2017)。
無人機(UAV)、人工智能、知識圖譜為代表的新技術、新方法為實現智能礦產地質調查創造了環境(Lietal., 2020; Wangetal., 2018; 左仁廣, 2019)。已有學者利用人工智能(向杰等, 2019; 蔡惠慧等, 2019; Xiong and Zuo, 2021)實現了部分區域礦產資源的智能化預測評價。知識圖譜也成為了地學大數據應用的有效智能工具(周永章等, 2020, 2021; 袁滿等, 2021)。無人機、機器人也被越來越多地運用到地質信息的智能獲取領域(Funakietal., 2014; Sangetal., 2020)。5G技術為數據傳輸提供了高速通道。傳感器技術的發展為獲取高精度、高分辨率的多源礦產地質數據提供了新的技術方法(胡杰和張琳, 2016)。集成電路,尤其是近年來手機等手持設備的發展為進行礦產地質調查大數據處理提供了方便的數據采集工具(Leeetal., 2018)。
但當前礦產地質調查仍無法克服許多實際困難與挑戰:積累的基礎地質和礦產地質資料利用率不夠,包括一些斷裂幾何形態與活動方式、地質界面類型與分布等重要信息,對找礦預測支撐不足;大量基于文字的地質數據和知識難以提取有效信息;缺乏超高分辨率、高精度的遙感、航磁等地質調查數據;尚未構建結構功能完備的礦產地質調查平臺及完整的礦產地質調查生態系統。簡言之,歷史數據互聯的困難限制了找礦理論的普適性,既有數據挖掘的困難削弱了預測過程的健壯性,高精數據的匱乏制約了預測結果的精確性,地質調查生態系統的欠缺則加劇了現有數據、理論、方法的孤立,導致智能化找礦工作仍然“各自為戰”,難以凝聚合力推動新時代礦產地質調查方法的進一步發展。類似“地球系統-成礦系統-勘查系統-預測評價系統”的找礦預測完整生態鏈已成為未來迫切需要解決的關鍵科學技術問題(周永章等, 2021)。
針對礦產地質調查中面臨的具體問題,本文采用人工智能深度學習技術,提出一種新型礦產地質調查智能化的生態系統基本框架,硬件上包括基于多種智能設備進行數據采集、利用云計算架構進行數據的存儲,軟件上包括基于深度學習技術進行多源異構數據分析、基于知識圖譜和深度學習技術進行找礦預測等,初步實現了“智能礦產地質調查云平臺(簡稱為云平臺)”,提出了數據驅動與知識驅動相結合的找礦預測方法,集成了采用深度學習技術進行地質空間特征匹配找礦預測和基于知識圖譜進行找礦預測的方法,并采用空間特征匹配找礦預測方法在甘肅大橋-崖灣地區進行了找礦預測試點。
智能礦產地質調查是基于人工智能等新一代信息技術的礦產地質調查,在礦產地質調查過程中能夠智能化地采集數據、分析數據,進行成礦遠景預測及深部找礦(Aknetal., 2010; Appleton and Ridgway, 1993; Bonham-Carteretal., 1988; Bugaetsetal., 1991; Butt, 2016; Casanaetal., 2014; Chen, 2015; Eberleetal., 2015; de Souza Filhoetal., 2007; Friedeletal., 2016; Gholamietal., 2011; Lietal., 2020; Al-Garni, 2010; Markwitzetal., 2016; Pereiraetal., 2015; Qiuetal., 2019; Rodriguez-Galianoetal., 2015; Maetal., 2007; Zuoetal., 2019)。智能礦產地質調查將會推動礦產地質調查與評價理論、方法和技術的重大變革,如:能夠優化礦產地質調查與評價流程,實時分析礦產地質調查數據并進行礦產資源動態評價;動態展示礦產地質調查項目進展的詳細情況;通過各種便攜式數據采集設備在野外采集大量高分辨率、高精度數據,與已有數據資料相結合,分析復雜的成礦地質條件,靈敏地識別重要的找礦標志,大幅增加礦產資源的發現幾率。
智能礦產地質調查生態系統是指與智能礦產地質調查相關的智能數據采集設備、應用(APP)、用戶、標準、規范、云平臺等組成部分及相互關系構成的完整系統(圖1)。構建礦產地質調查生態系統對完善礦產地質調查流程,提高礦產地質調查的效率與效果具有十分重要的意義。通過平臺數據管理,可以積累數據,數據量越大越有利于提高智能找礦預測的可靠性。不斷積累數據、完善找礦預測模型、APP、數據采集工具等,形成系統完備的智能礦產地質調查體系,能夠快速、高效、精準地進行礦產地質調查與評價。

圖1 智能礦產地質調查生態系統的組成及相互關系Fig.1 Composition and relationship of intelligent mineral geological survey ecosystem
智能礦產地質調查生態系統的核心是云平臺。各種智能數據采集設備可以通過網絡向云平臺傳輸數據,平臺對數據進行智能分析,并向礦產地質調查人員和管理者提供礦產地質信息。智能礦產地質調查是在“地質云”這一云平臺的基礎上設計開發的,充分利用地質云現有的硬件資源與軟件接口,接收并存儲各種智能數據采集設備收集的數據資源。用戶通過手機或桌面APP與平臺交互,如用戶拍攝一張蝕變巖的照片上傳到平臺,平臺的智能識別系統可以給出蝕變巖的名稱、描述及成礦意義等方面的信息,或用戶上傳一個地區的地質、物探、化探、遙感等方面的資料,平臺的智能找礦預測系統將對研究區進行智能找礦預測,給出預測遠景區和勘探靶區。
智能礦產地質調查與現有礦產地質調查的流程基本一致,主要包括預研究、野外工作、找礦預測、驗證四個階段,但前者更強調工作流程的自動智能、水平,包括工作流程各階段與云平臺的深度耦合、野外現場的無人機智能數據采集、面向多源異構大數據的智能分析算法等。
預研究階段的工作步驟為:(1)資料收集與整理,在云平臺上建立數據庫;(2)通過智能地質分析提取地質、物探、化探、遙感資料中成礦地質要素與找礦標志,發現各種地質要素與已知礦床(點)的相互關系,揭示隱藏的成礦規律;(3)采用智能找礦預測系統圈定重點找礦工作區;(4)部署野外地質、物探、化探工作。
野外工作階段的主要工作步驟為:(1)采用無人機進行遙感、航磁、能譜等方面的數據采集;(2)地質點觀察、實測剖面、大比例尺填圖;(3)對新獲取的資料進行整理,按照統一的數據格式輸入到云平臺的數據庫。
找礦預測階段的主要工作步驟為:(1)采用云平臺的智能數據分析功能進行成礦要素相關性分析和成礦規律分析;(2)采用平臺的智能找礦預測功能進行找礦遠景預測和勘探靶區圈定。
驗證階段的主要工作步驟是采用平臺的找礦靶區優選功能篩選出最有利的找礦目標區進行驗證工作,如對重點地區進行高分辨率物探、化探測量,對可靠的找礦目標進行鉆探驗證。
智能礦產地質調查技術體系主要由智能數據采集子系統、智能數據管理子系統、智能數據分析子系統、智能找礦預測子系統、智能繪圖與可視化子系統、礦產地質調查云平臺、技術標準等部分組成(圖1)。
礦產地質調查過程中,多種儀器、設備、軟件系統被用來獲得多元數據。在智能礦產地質調查體系中,利用無人飛機、無人車、無人船等作為運載工具,搭載各種儀器,如微型光譜、磁、能譜等信息采集系統,來獲取礦產地質基礎大數據,智能采集樣品,形成智能化地數據采集體系。
以無人機為平臺的礦產地質數據采集系統是礦產地質數據智能采集的重要發展方向。在地形高差起伏大的地區,無人機可以被用來進行剖面掃描,獲取地質信息:
(1)地質露頭影像。在勘查區域利用無人機采集地質露頭影像數據,于內業環境中分析并識別地質露頭的找礦標志信息,如礦化、蝕變等;
(2)剖面掃描數據。根據設定剖面的范圍,自動掃描剖面,采集數據(如光學影像、光譜、地磁、伽瑪能譜等);
(3)終端實時智能識別。利用訓練好的智能識別模型于數據采集時完成地質對象的異常識別,包括礦化異常、光學異常、光譜異常、地球物理異常,從而輔助數據采集方案決策。
除此之外,智能數據管理能夠降低數據管理的復雜性,根據需求自動從數據庫中提取數據、自動進行數據格式和坐標系變換等。
智能礦產地質調查數據分析包括:基于地質圖或空間數據庫提取找礦預測信息;基于礦產地質調查數據和資料的智能集成與分析技術;超高分辨率無人機遙感影像智能分析技術;物探、化探、遙感等資料智能分析技術;智能綜合礦產地質分析技術;智能三維建模技術等。
3.2.1 智能礦產地質數據分析方法
區域礦產地質調查成果主要以礦產地質圖形式表示。根據地質圖每個地質單元的屬性信息(時代、巖性描述、含礦性等)和地質報告資料,采用BERT(Bidirectional Encoder Representation from Transformers)等自然語言處理(Natural Language Process, NLP)神經網絡架構將文本資料等非結構化數據轉換為計算機能夠計算的數值數據。
(1)智能成礦地質體分析:分析地質體的成因、巖相古地理背景、構造環境、建造類型等,識別成礦地質體的類型。
(2)智能成礦構造分析:主要包括:①斷裂幾何形態與斷裂之間的相互關系分析,識別有利成礦的部位,識別斷裂成礦構造系統。②分析褶皺構造的幾何學、規模、運動學特征及其與巖脈、礦體、蝕變作用的關系,分析褶皺與成礦的關系。③進行成礦構造和控巖構造智能分析。
(3)智能成礦地質界面分析:基于研究區的空間數據庫,以地質圖上的弧段(地質界面)為基本分析單元,根據弧段兩側地質體的巖性描述,用NLP技術識別地質界面類型,判斷地質界面是否是成礦地質界面以及成礦地質界面的類型。
(4)智能成礦作用標志篩選:采用NLP、無監督聚類等大數據分析方法,通過對所有疑似成礦作用地質標志與成礦地質體和礦體的關聯分析篩選出成礦作用特征標志。
3.2.2 智能物探、化探數據分析方法
智能物探數據分析方法是基于深度學習網絡,如卷積神經網絡(CNN)、生成對抗網絡(GAN)、自動編碼解碼器網絡(AE),以非震地球物理數據為輸入源,智能解釋數據中隱含的斷裂、隱伏巖體、隱伏地質界面、隱伏成礦地質體信息。
智能化探數據分析算法則是基于CNN、Mate-learning(元學習)的化探智能分析方法。以目前流行的各種不同的深度學習模型,進行改造,適配網格化后的化探數據,識別弱小異常、圈定地球化學異常,分析地球化學異常空間結構,從而圈定找礦遠景區。
3.2.3 智能遙感數據分析方法
遙感數據是地質數據中常見的大數據,通過分析遙感異常,可以用來解釋地質構造現象、分析地質問題。通過將遙感數據進行切片,建立遙感地質解釋數據集,包括斷裂構造解釋數據集、環形構造解譯數據集,利用深度學習算法進行有監督或無監督學習,從而實現智能遙感地質解譯。
當前基于數據驅動(或科學)的礦產資源定量預測是一種在地質大數據的基礎上,結合地質理論和數學模型進行礦產資源的定量預測過程(陳建平等, 2005; 于萍萍等, 2015; 王懷濤等, 2018)。近年來,基于機器學習的礦產資源預測方法也被越來越多的學者所研究,逐漸成為當前礦產資源預測研究的熱點(向杰等, 2019; 蔡惠慧等, 2019)。
智能找礦預測包括知識驅動、數據驅動或綜合預測三種途徑,本文分別采用人工智能深度學習技術(蔡惠慧等, 2019; Xiong and Zuo, 2021),匹配地質空間特征進行找礦預測,實現了數據驅動的找礦預測方法,采用知識圖譜技術(周永章等, 2020, 2021; 袁滿等, 2021),構建了西秦嶺典型礦床的知識圖譜進行找礦預測,實現了知識驅動的找礦預測方法。
此外,本文結合數據和知識驅動進行綜合預測,通過深度學習技術識別礦產地質調查大數據的特征,結合礦床模型知識圖譜研究推理引擎,提出了知識驅動與數據驅動相結合的找礦預測方法實現方案。
3.3.1 地質空間特征匹配找礦預測方法
地質空間特征匹配找礦預測方法是一種基于地質類比思想開發的數據驅動的智能找礦預測方法。可以采用多種方法實現地質特征匹配找礦預測,其中一種實現方法是:(1)采用相同范圍、相同網格單元大小對研究區的地質、物探、化探、遙感數據進行網格化;(2)采用深度自編碼神經網絡(AE)進行特征提取;(3)根據第(2)步所提取的特征,采用高斯混合模型(GMM)進行空間聚類;(4)根據已知礦床(點)所在位置,確定其所屬類別;(5)在礦床(點)所在類別中,選取一定比例(如30%)的數據點作為訓練數據和驗證數據,優先選擇靠近已知礦床(點)的數據;(6)用選取的數據作為訓練數據和驗證數據,訓練和驗證最近鄰網絡(KNN)模型,選擇最優的K值;(7)用訓練好的模型對研究區每個網格單元進行預測,得到預測結果(圖2)。

圖2 地質特征匹配找礦預測方法Fig.2 Prospecting prediction method based on geological feature matching

圖3 基于知識圖譜的智能找礦預測方法Fig.3 Intelligent prospecting prediction method based on Knowledge Graph
3.3.2 基于知識圖譜的智能找礦預測方法
知識圖譜是Google公司2012年提出的,最初應用于其搜索業務,后逐漸推廣應用到社交網絡、醫療、金融等其他領域,在地質領域的研究處于起步階段。知識圖譜能夠以語義網絡的方式表示礦產地質領域知識和區域礦產地質知識,通常基于地質報告、研究報告、論文等半結構化或非結構化資料,構建礦產地質知識圖譜(周永章等, 2020, 2021; 袁滿等, 2021)。礦產地質領域知識是長期研究總結得出的一般性規律和知識,如成礦理論、找礦模型等。區域礦產地質知識是指在具體研究區所獲取的知識,如大橋-崖灣地區的金礦(點)主要產于三疊系滑石關組,金礦與硅化角礫巖密切相關等知識。
基于知識圖譜的找礦預測方法是以礦產地質知識圖譜及區域礦產地質知識圖譜為基礎,采用鏈路預測、中心性計算、社區發現、相似度計算等知識圖譜分析方法進行知識推理,發現地質要素與成礦作用的關聯關系,挖掘隱藏的成礦地質規律與模式,發現有利的成礦空間位置、成礦時間、成礦物質和成礦能量供給條件,預測可能的成礦位置,確定有利找礦區或找礦靶區(圖3)。

圖4 數據驅動與知識驅動相結合的智能找礦預測方法Fig.4 Intelligent prospecting prediction method based on data and knowledge
基于知識圖譜的找礦預測主要通過知識匹配和路徑推理進行預測總結,該方法的實質是比較已知礦床和礦床模型的知識圖譜與擬預測位置的知識圖譜的相似性。如果擬預測位置的知識圖譜與已知礦床模型的知識圖譜的節點、節點屬性、關系具有一致性,則該擬預測位置的成礦條件越好,成礦和找礦的可能性越大。根據地質圖、研究報告、論文、實測物探和化探數據獲取擬預測位置的礦產地質信息,形成擬預測位置的知識圖譜,并與礦床模型的知識圖譜的屬性與關系進行匹配。屬性匹配是指如果礦床模型與擬預測位置的知識圖譜具有相同類型的節點(如蝕變類型),且蝕變類型是相同的(如均為黃鐵礦化),則表明礦床模型的知識圖譜的節點與擬預測位置的節點是匹配的。關系匹配是指礦床模型與擬預測位置之間具有相同的節點與節點的關系,如礦床與斷裂的關系及擬預測位置與斷裂的關系均為位于斷裂交匯部位。基于知識圖譜的找礦預測方法的最大優勢是能夠比較礦床模型和擬預測位置相關地質要素之間的復雜相互關系。
基于知識圖譜找礦預測的流程為:通過相同標簽篩選節點,采用中心性算法計算中心節點;通過鏈路預測算法預測中心節點的路徑,并結合隨機游走算法增加路徑的多樣性,以增強預測路徑樣本多樣性;通過社區發現算法計算各路徑基于關系復雜度的聚類,篩選含多向傳遞性和定向性的節點;通過相似度算法計算路徑的相似度,篩選最佳路徑,配比優選路徑各節點的屬性信息,預測有利找礦位置(圖3)。
3.3.3 數據驅動與知識驅動相結合的智能找礦預測方法
綜合數據驅動與知識驅動進行找礦預測。該方法結合特征匹配、特征分析、知識圖譜、推理預測,融合多種類型數據進行找礦預測。在知識圖譜的基礎上,采用推理引擎智能分析礦床特征、成礦規律、礦床成因,并在此基礎上進行找礦預測(圖4)。
在已有找礦預測理論和方法的基礎上,采用云計算架構,集成大數據和人工智能找礦預測方法,建立智能礦產地質調查云平臺,提供一個以人工智能技術為核心的,具有感知-分析-預測-決策強大功能、簡單易用及高度靈活和可擴展的系統平臺,實現精準和高效的礦產資源調查與評價,實現勘查過程精細管理、智能數據分析、多尺度智能礦產資源預測、社會化信息服務等功能,為實現智能礦產地質調查搭建基礎平臺。
智能礦產地質調查云平臺是智能礦產地質調查生態系統的核心組件,主要提供數據存儲、數據分析、找礦預測、可視化等核心功能。該平臺能夠利用礦產地質調查所獲得的數據,集成新一代基于大數據和人工智能的找礦預測方法進行找礦預測,形成智能礦產地質調查與找礦預測產品服務體系(圖5)。

圖5 智能礦產地質調查云平臺架構圖短虛線部分為近期即將上線的功能,點虛線為平臺遠景規劃的功能Fig.5 Architecture of intelligent mineral geological survey cloud platform
圖5描述了智能礦產地質調查云平臺的整體架構,涵蓋了智能礦產地質調查的多個方面。主要提供的服務與功能包含:基于深度學習技術分析物探數據,實現了智能物探解釋;應用深度自編碼神經網絡結合高斯混合模型實現了化探異常智能圈定;通過對地質要素矢量化實現了智能地質分析等智能數據分析功能;通過改造后的KNN、孿生網絡等深度學習模型,實現了遠景預測和靶區圈定等智能礦產資源發現服務;基于NLP實現了自然資源知識問答功能等;基于Hadoop、深度學習、知識圖譜等技術已經實現了智能數據分析、智能礦產資源發現、知識問答等服務層,以及三維建模、深部找礦預測、搜索與查詢、智能礦產地質分析、二維可視化、三維可視化等應用層功能。
不同于地質云平臺現有的功能,智能礦產地質調查云平臺不僅提供數據的智能采集功能,而且實現了基于礦產地質調查大數據的多種數據分析功能,并提供了智能的找礦預測服務,為智能礦產地質調查生態提供了基礎的環境及智能化平臺。
智能礦產地質調查云平臺以CentOS操作系統為基礎,基于微服務架構,采用ArcGIS地圖服務器對地理底圖、地質圖、成礦規律圖、建造構造圖等圖件進行展示,以JavaScript、Node.js、JSON、XML、HTML為前端開發語言,以Java、Python為服務器端開發語言,使用Oracle、PostGIS等進行空間數據庫管理,用MongoDB進行半結構化和非結構化數據管理。整體來說,云平臺由大數據分布式存儲子系統、數據接入子系統、數據分析子系統、找礦預測子系統4個部分組成(圖5)。
(1)大數據分布式存儲子系統
平臺將存儲海量的全國礦產地質調查異構數據,不僅包括物探、化探、遙感、鉆孔等結構化數據,還包括地質報告、專著、論文等非結構化和半結構化數據,也包括地質圖、勘探線剖面圖、實測剖面圖、野外照片等圖形圖像數據,數據格式和內容都非常復雜。為了滿足所有數據的存儲、管理以及對外共享的要求,平臺針對結構化數據采用傳統的SQL型數據庫,針對非結構化數據采用基于Hadoop分布式文件系統(HDFS)架構的分布式文檔數據庫來進行數據的高效存儲。本子系統主要提供信息查詢與統計分析功能,包含礦產地質信息查詢、勘查區及項目查詢、礦產勘查工作量查詢、統計查詢與可視化等。
(2)數據接入子系統
主要包括離線采集、實時采集、網絡采集三種數據采集方式。離線采集主要實現從分布式數據庫采集礦產資源信息的功能。實時采集主要實現對各種類型的實時數據的采集,例如野外地質路線觀察點信息(如照片、視頻、描述、產狀測量、物性測量等)、物探采樣點位置、化探采樣點位置、無人機影像、光譜測量、能譜測量等。網絡采集則是采用網絡爬蟲技術從網絡資源中獲取礦產資源相關信息。

圖6 甘肅大橋-崖灣礦集區重點研究區地質簡圖(a)大地構造分區;(b)主要地質體;(c)研究區地質圖. 1-第四系砂礫石層、殘坡積以及風成黃土;2-新近紀甘肅群紅色泥巖夾砂礫巖;3-白堊系雞山組紫紅色礫巖;4-侏羅系龍家溝組鈣質礫巖;5-三疊系大河壩組砂板巖;6-三疊系滑石關組二段灰巖;7-三疊系滑石關組一段角礫狀灰巖;8-石炭系岷河組灰巖;9-泥盆系黃家溝組一段鈣質板巖;10-泥盆系黃家溝組二段灰巖;11-泥盆系黃家溝組三段千枚巖;12-泥盆系紅嶺山組灰巖千枚巖互層;13-志留系白龍江群灰板巖;14-巖體;15-礦床;16-斷裂Fig.6 Geological maps of key research area in Daqiao-Yawan ore concentration area, Gansu Province
(3)數據分析子系統
數據分析子系統主要提供礦產地質數據處理與分析服務。利用多種分析引擎,如數據挖掘、機器學習、深度學習等,對多源數據進行處理與分析。主要包含:①區域地質圖智能分析功能,可以挖掘地質圖中所包含的礦產地質信息。②重磁數據找礦信息智能提取功能,可以對控礦斷裂、硅鈣面、地質體接觸界面、隱伏巖體等成礦地質信息提取;揭示重要地質界面三維空間展布、含礦地質體的深部發育狀況。③地球化學異常智能提取。④遙感找礦信息智能提取,包括斷裂構造、蝕變帶等信息提取。⑤基于高分辨率無人機影像的成礦地質要素分析和找礦標志識別,主要包括蝕變帶識別(位置、色調、蝕變類型、蝕變帶分布等);在無人機三維模型的基礎上,提取主要地質界面(層面、斷裂)的產狀要素,進行精細控礦構造解析。
(4)找礦預測子系統
系統集成一系列找礦預測方法,主要包括:地質特征匹配找礦預測方法、基于知識圖譜的智能找礦預測方法、數據驅動與知識驅動相結合的智能找礦預測方法、基于三維地質模型的深部找礦預測方法。通過多源礦產地質調查數據,利用最適合的找礦預測方法進行找礦預測分析,繪制預測區的找礦遠景區,為后續的礦產地質詳查提供依據。
智能礦產地質調查云平臺采用云計算架構,可伸縮性強,可隨數據的增加彈性增加存儲、計算等資源。同時,由于大量的原始數據存儲在地質云空間中,數據的安全性及保密性可得到保障。智能礦產地質調查云平臺在數據分析和找礦預測方面充分利用了人工智能技術,大量減輕了人工作業的負擔,同時找礦預測技術所圈定的找礦異常區可大幅減少野外工作量,將有限的資金用于更有效的找礦工作中,不僅加快了找礦進程,而且減少了找礦成本,能夠為當前的找礦突破戰略提供技術方法和手段。
甘肅大橋-崖灣地區橫跨中秦嶺陸緣盆地和澤庫前陸盆地、南秦嶺陸緣裂谷三個Ⅲ級構造單元(圖6b)。
甘肅大橋-崖灣地區地層以合作-岷縣-江洛區域性斷裂為界,北部地層屬華北地層大區秦祁昆地層區東昆侖-中秦嶺地層分區中秦嶺地層小區,位于研究區西北部;南部地層隸屬于華南地層大區南秦嶺-大別山地層區迭部-旬陽地層分區南秦嶺地層小區,為區內的主體。研究區中秦嶺地層小區僅出露晚古生界泥盆系西漢水群,南秦嶺地層小區地層出露較完整,古生界、中生界、新生界均有出露。
研究區侵入巖出露較少,且出露規模較小。研究區西部主要見有小金廠印支期角閃石英閃長巖體和廟轉子印支期花崗閃長巖。研究區東北部出露牛兒坪細粒二長花崗巖巖株,呈北東-南西向的葫蘆狀展布,侵位于三疊紀滑石關組灰巖、板巖及砂巖中,出露長約1070m,寬約60~250m,面積0.13km2,該巖株南東局部被新近紀砂礫巖覆蓋。大橋金礦區花崗閃長巖脈較發育,一般長約20~280m,寬4~30m,走向以NE向為主,呈透鏡狀產出。巖脈多沿三疊系順層侵入,有多條巖脈沿著硅化巖層侵入,巖石致密,被強烈硅化,局部可見有含有硫化物的硅化細脈穿插其中。花崗閃長(斑)巖脈的LA-ICP-MS鋯石U-Pb測年結果在207.0±1.5Ma~215.0±1.2Ma之間(陜亮等, 2016),為印支期晚期巖漿活動的產物。區內巖漿活動與金礦成礦關系密切,為金礦的成礦地質體。
研究區處于秦嶺褶皺系西段,褶皺構造較為發育。北部中秦嶺構造帶褶皺規模較大,并發育次級背、向斜及小規模的層間褶曲,軸面劈理、板(層)劈理較發育,大部分板劈理面與層面平行。在空間分布上,東南部南秦嶺構造帶,由于所處構造單元不同,褶皺構造發育程度、組合面貌等不盡一致。
研究區斷裂構造較發育,發育大小不等的斷層共有664條,其中規模較大的斷裂有2條。斷裂走向以北東向為主,其次為近東西向。其中北東向斷裂發育,且規模大、延伸遠,并向北東方向收斂,在平面上具帚狀構造特征。
甘肅大橋-崖灣地區是重要的金礦成礦區,主要有大橋超大型金礦、安房壩中型金礦、飲馬河小型金礦等3個巖漿熱液型金礦床及20處金礦點,金礦床及部分金礦點如表1所示。大橋金礦為研究區的典型礦床,其發育與三疊系滑石關組硅化角礫巖密切相關。
按照智能礦產地質調查流程(見章節2),對大橋-崖灣地區分別進行了預研究、野外工作、找礦預測和驗證工作,以圈定預測區。
5.2.1 預研究
在收集整理大橋-崖灣地區1:5萬礦產地質調查、1:5萬化探和1:5萬航磁資料的基礎上,建立了多源數據空間數據庫。大橋-崖灣地區的找礦預測主要基于1:5萬礦產地質資料,及Ag、As、Au、Ba、Bi、Cu、Hg、Mn、Mo、Pb、Sb、Sn、W、Zn等14種元素的1:5萬化探數據。
為了把地質界線、斷裂構造信息融入到找礦預測過程中,根據地質圖資料采用如下方式進行了地質信息的網格化處理:(1)按一定的網格單元大小,如100m×100m,把研究區劃分為一系列的網格;(2)對應每段地質界線或斷裂線(相當于地質圖的弧段或線段),生成一個網格層,每個網格單元值為該網格單元到弧段或斷裂的最短距離的倒數;(3)生成所有地質界線和斷裂的網格層。采用這種地質信息的網格化方法,能夠表示空間位置與地質界線或斷裂的空間相關性。每個網格單元的值越大,表明該網格單元與地質界線或斷裂的關系越密切。這一過程通過云平臺的數據處理子系統來完成。大橋-崖灣地區有地質界線弧段2105個,共生成2105個地質界線網格化層;有斷裂664個,生成了664個斷裂網格化層。把這些網格單元層疊加起來,對應每個網格單元有2769個數據,相當于用2769維的數據表示該網格單元的特征。

表1 甘肅大橋-崖灣礦集區重點研究區的主要礦床(點)
化探數據的每種元素以及航磁數據采用克里金插值法進行網格化,網格范圍與網格單元大小與地質資料網格化的范圍和大小一致。
5.2.2 野外工作
在傳統的野外地質勘查基礎上,增加了無人機礦產地質勘查的工作。利用無人機對大橋-崖灣地區的已知礦區進行了高分辨率影像采集,采集到的數據通過移動網絡傳輸至智能礦產地質調查云平臺,利用遙感融合技術形成了高分辨率無人機遙感數據,分辨率可達到0.1m,部分區域的分辨率可達到1cm。利用智能遙感分析方法,對無人機高分辨率影像進行切片處理,分析并識別出露地質體的礦化和蝕變情況等找礦標志。
5.2.3 找礦預測
采用上述特征匹配找礦預測方法(見章節3.3.1)對大橋-崖灣地區進行了找礦預測,網格單元的大小為200m×200m,研究區共劃分為186×349=66774個網格單元。
不同的網絡結構對預測的結果影響較大,模型的初始學習率、衰減率也會影響模型分類的準確性。因此,本文開展了大量的試驗來選擇最佳的網絡結構并優化深度學習參數,通過兩種不同的指標來決定模型的優劣,一個指標是回判率R,即模型預測的區域中包含已知金礦床(點)的個數占總金礦床(點)的百分比。另一個是預測面積占有率S,即預測區面積占工作區面積的百分比。回判率R越高,預測面積占有率S越低,則模型表現越優秀。
大量的試驗表明,采用由5個全連接層組成的編碼器和5個全連接層組成的解碼器構成的深度自編碼神經網絡對地質、化探數據進行壓縮降維,在保持原始數據特征的情況下,減少了計算量。降維后每個網格單元所獲取到的特征向量為64維。采用高斯混合聚類方法對降維后的網格單元進行特征分類。根據已知的23個金礦床(點)(圖6和表1),以金礦床(點)所在類別的30%的網格單元特征數據構建訓練數據集和驗證數據集,并對KNN網絡模型進行訓練和驗證。
最終,采用上述模型獲得的回判率R最高,達到83.35%,同時,預測面積占有率S最小,達到9.42%。最后,利用訓練好的KNN模型,對大橋-崖灣地區的所有網格單元進行了預測(圖7)。
圖7中,預測區的顏色代表了該區域的特征類型,如果兩個區顏色相同表明這兩個區具有相同的成礦和找礦地質條件,如大橋金礦位于C9區,該區的顏色是獨特的,表明大橋金礦的成礦條件在全區是獨特的,B2與C6的顏色相同,表明其具有相同的成礦條件。
智能找礦預測結果表明,研究區可劃分為A、B、C、D、E等5個主要找礦遠景區(圖7),各預測區的主要地質特征為:
預測區A:位于研究區北部的關壩地區。該區地表主要出露泥盆系黃家溝組和紅嶺山組,被EW向斷裂切割,區內已發現兩處金礦點。
預測區B:位于研究區西部草坪鄉-馬場里一帶。該區主要出露三疊系滑石關組和大河壩組,部分出露新近系甘肅群。該預測區的南部和北部具有不同特征,進一步可分為B1、B2兩個區,其中B1區主要出露三疊系滑石關組和新近系甘肅群,B2區主要出露三疊系大河壩組與滑石關組。區內地層主要被EW向和NE向斷裂切割,已知B2區馬場里附近發現一處金礦點,B1區目前未發現金礦床(點),找礦遠景較好,重點尋找斷裂帶型金礦。
預測區C:位于研究區中部庫裕塘-石峽鄉一帶,整體呈NE向展布,是重要的找礦目標區,該區已有大橋超大型金礦、飲馬河小型金礦,并發現13處金礦點。該區地表出露三疊系滑石關組、石炭系岷河組、新近系甘肅群,發育NE、NEE、近南北等多組斷裂,處于構造方向轉折變化區,存在隱伏的環形構造,化探組合異常明顯,具有很好的成礦條件。基于地質、地化資料的特征分類結果表明,該預測區可以分為C1~C9共9個子區(圖7),其中C3子區包含六處金礦化點,C5與C7子區目前未發現金礦化點,C5與C7子區可以作為下一步找礦勘探的重點區域。C2、C7、C8的東北區,目前工作程度較低,經野外地質研究和綜合分析,具有良好成礦條件。
預測區D:位于研究區左下部楊家地灣南側。該預測區主要出露志留系卓烏闊組、泥盆系下吾那組,部分志留系卓烏闊組被第四系更新世風成黃土覆蓋。區內已發現一處金礦化點。
預測區E:位于研究區中下部田家河周邊。該預測區主要出露志留系卓烏闊組、泥盆系鐵山組、石炭系溢瓦溝、三疊系滑石關組、新近系甘肅群;近EW向斷裂被NE向斷裂切割,斷裂走向有一定變化,化探異常明顯,有1個已知中型金礦床(安房壩金礦)。
5.2.4 驗證
針對上文得到的預測區,重點對C8預測子區進行了高精度磁測工作,布置了一條高精度磁測剖面貫穿C8子區,以驗證預測結果。在野外獲取數據的基礎上,針對本次工作干擾較大的特點,首先對高精度磁測數據進行了預處理,然后進行了化極、求導、延拓等多項數據處理,最后,在MAGS軟件下進行了反演。
通過反演,驗證了C8預測子區含有較高磁性的硅化角礫巖,并且位置相對準確,且礦脈延伸更加確定。同時,測定結果也顯示,硅化角礫巖型金礦石與其他巖類相比有較明顯的磁性差異,為通過磁法驗證金礦預測區提供了較好的地球物理手段。
(1)新一代人工智能技術可以融合結構化、半結構化和非結構化數據進行找礦預測,能夠有效地提高找礦預測效果,使找礦預測走向精準化和智能化。基于深度學習的空間礦產地質特征匹配找礦預測方法能夠高效智能地確定找礦遠景區或找礦靶區。
(2)智能找礦預測方法具有高效、快速的特點,采用該方法在甘肅大橋-崖灣地區圈定了5個有利找礦區,為該區的找礦勘探提供了科學依據。
(3)智能礦產地質調查方法是一種與現代信息技術高度融合的高效、綠色、智能化的地質調查方法,人工智能貫穿于礦產地質調查的各個階段,是礦產地質調查的重要發展方向。建立礦產地質調查生態系統對變革礦產地質調查方法具有重要意義,不僅可以促進礦產地質調查流程、數據、管理的標準化,其對礦產地質調查方法的變革亦具有重要意義。