李智
摘 要:本文對大數據在地質礦產中的應用進行分析,明確了計算機性能下數據挖掘技術應用的必要性,能夠清晰的觀測到地下礦區的具體位置與范圍,希望為關注此話題的人提供有效的參考。
關鍵詞:大數據;地質礦產;數據挖掘技術
0 引言
大數據技術是指在積累大量的歷史數據基礎上對數據進行合理的分析,獲取相關信息,大數據在地質礦產中應用的主要方法為數據挖掘技術,通過對數據的聚類、關聯、分類與預測進行分析,并結合地質礦產的特點進行論述。
1 數據挖掘技術的概述
數據挖掘又稱為資料探勘、數據采礦,一般是指從大量的數據中通過算法篩選出隱藏其中的人們需要的信息,主要利用計算機技術對大量的數據進行統計、在線分析處理、情報檢索等數據處理。
數據挖掘技術在地質礦產中的應用主要用于整合大量復雜的數據,并從大量的數據中提取相關的數據信息,為地質礦產的開發提供科學性、精確性較強的數據資源,提高地質礦產工作的工作效率。一方面,地質礦產挖掘過程中會涉及較為大量的數據資源,具體的推理過程較為復雜,需要數據挖掘技術借助計算機技術對數據進行快速的處理,提高數據整合的精準度。另一方面,龐大的數據之間關聯性較為復雜,用于解釋地質礦產的數據管關聯更為復雜,需要通過各類建模、公式分析等,對數據進行整合分析,大數據技術的應用能夠通過參數設置快速篩選復雜的信息數據,理清眾多繁雜數據的相關聯性,地質礦產工作的開展可以直接將各項數據帶入到大數據建設的模型中進行計算,并利用大數據技術直接利用模型展現數據之間的相關聯性[1]。
2 數據挖掘技術的具體方法
2.1聚類分析法
聚類分析法是指對大量的數據進行聚類分析,最為常見的聚類分析法為K-means算法,其主要原理為根據特征向量,將地質礦產中的特征向量分給與其最為相近的聚類中心,聚類中心與分配給其的對象被稱為一個聚類,K-means算法的中的每一聚類會根據聚類中心中包含的數據對象進行重新的計算,該過程在算法技術的推動下將會不斷重復直到滿足某個終止條件為止。該方法的應用特點之一是可以根據人們的需求進行算法的設計,K-means算法的中的特征向量、終止條件等都可以根據人們的需求,通過數據設置得出最終的數據信息,并應用到地質礦產的挖掘工作中。另外,K-means算法的應用使得數據挖掘技術算法的應用更加具有科學性。
2.2關聯分析法
數據挖掘技術使用的關聯分析法主要原理為分析數據之間的關聯性,兩個數據或多個數據的變量之間存在一定的關聯性,則表示兩個數據相互關聯,挖掘地質礦產中潛在的關聯數據,能夠對地質礦產中的各項數據進行精準度較高的預測,從而提升地質礦產的相關工作效率。關聯的規則可用A=>B來表示,以地質礦產中的數據分析為例,選擇地質礦產挖掘過程中產量最高的幾類礦石,觀察數據變量之間的相關規律,如A礦石出現后,B礦石出現的情況隨之提高,二者之間的變量呈現正相關,由此可以判斷A礦石周圍有很大的概率存在B礦石,在地質礦產挖掘過程中會通過礦石之間的關聯性對地下的礦石層進行概率性的判斷,以達到預判的目的。或利用A^B[sup]=>C[conf]來表達數據之間的關聯性,其中sup表示支持度,conf表示置信度,主要的表述模式事件A和事件B發生后事件C發生的幾率,在地質礦產工作中的主要應用為A區域出現一種礦石,A區域周邊出現其他類礦產的幾率是多少,數據挖掘法利用相關的數據公式信息求得具體的事件發生概率,有效提高地質礦產的工作質量與工作效率,以此提高地質礦產企業的整體競爭力。
2.3分類與估計法
數據挖掘技術中數據的分類是數據分析的基礎,將地質礦產中大量的歷史數據進行分類,建立相應的分類模型,地質礦石中可根據礦石的珍貴程度、可應用程度以及具體的質量水平進行分類,在地質礦石的開采過程中可根據具體的優良率進行合理的開采計劃安排。估計法是指根據地質礦石的一項數據對相關的數據進行估計,如根據一類礦石的數量,估計另一類礦石的具體數量,或根據一類礦石的數量,估計另一類礦石存在的幾率等,估計法的應用需要建立在一定的數據分類與數據分析的基礎之上,估計的數值會隨著數值的精準度越加精準,以此保障地質礦石開采工程的效益最大化。
2.4預測法
地質礦石相關工程中的數據挖掘法對預測法的應用主要通過數據分類與估計得出數據模型,利用數據模型對地質礦石的未知變量進行預測,預測法在數據挖掘技術中主要作用為幫助地質礦石預測具體的礦石數量、礦石區域與礦石的產量,地質礦產的開采工程也可以通過預測法對具體的開采過程的效益、成本消耗、產量等數據進行預測,預知地質礦產開采的收益對比,明確預測法的準確幾率。該類預測結果需要在礦石開采結束后才能得以驗證,通過對預測結果的驗證預知預測的準確性,為今后的地質礦產的相關變量預測做出充分的準備[2]。
2.5描述與可視化法
描述與可視化是數據挖掘技術在地質礦產中的較為直觀的表現形式,能夠將數據分析的結果通過Yonghong Z-Suite等工具進行展現,使得數據分析結果更加清晰可見,在地質礦產工作中主要應用遙感信息技術進行相關數據的提取,采用TM1、TM4、TM5、TM7波段組合提取地質礦產中含羥基(OH-)、含碳酸根離子等物質的蝕變反應,并通過各類鐵離子的遙感異常記錄相關的遙感數據,將各類數據進行聚類分析,將分析結果通過數據模型的形式呈現出來,可以清晰的觀測到地質礦產的具體分布情況,數據模型能夠清晰的描述地質礦產中各類礦石的具體分布,地質礦產的工作人員可根據數據模型進行開采圖紙的繪制,劃定礦靶區,將地質礦產的具體開采步驟可視化,以此提高地質礦產相關工作的工作效率。地質礦產的數據挖掘需要大量的歷史數據作為數據分析的依據,采用TM、ETM技術可以相對精準的分析出遙感信息,并結合非遙感信息進行合理的推算,以此求得圖像類數據,增加地質礦產的可視化。
3 結束語
總而言之,大數據在地質礦產中的應用技術主要為數據挖掘技術,通過聚類分析法、關聯分析法、分類與估計法、預測法、描述與可視化法等方法的應用,對地質礦產中的大量遙感數據與非遙感數據進行整合處理,為地質礦產工程提供科學性、準確性較強的預測數據,提高地質礦產工作的整體質量與水平。
參考文獻
[1]鄒志友.地質大數據背景下礦產資源的評價與預測方法探究[J].世界有色金屬,2018(19):114-115.
[2]李文魁.淺析大數據在地質礦產中的應用[J].世界有色金屬,2017(03):52-53.