高 鑫,薛林福,冉祥金,燕 群,王 睿
(吉林大學地球科學學院)
礦床成因類型判別是找礦預測和礦產(chǎn)勘查中十分重要的研究工作,礦床成因類型的確定決定了找礦方向和是否能夠成功地找到礦產(chǎn)資源。中低溫巖漿熱液型金礦床可以劃分為中溫巖漿熱液型金礦床、遠成低溫巖漿熱液型金礦床2個亞類。中溫巖漿熱液型金礦可以劃分為:破碎帶蝕變巖型、石英脈型和部分爆破角礫巖型等3個子類。遠成低溫巖漿熱液型金礦床可以劃分為:卡林型、類卡林型、微細浸染型、濁積巖型等4個子類[1-2]。
國內(nèi)外研究人員已經(jīng)在地質(zhì)學領域從不同角度構(gòu)建了地質(zhì)本體模型。TRIPATHI等[3]構(gòu)建了水文地質(zhì)本體;NGO等[4]從維基百科中抽取結(jié)構(gòu)化數(shù)據(jù)進行地理本體的構(gòu)建;COX等[5]利用機器學習建立了地質(zhì)年代本體;侯志偉等[6-7]根據(jù)地學數(shù)據(jù)中的時間概念及其特征進行時間本體建模,應用于地學數(shù)據(jù)檢索,可以優(yōu)化數(shù)據(jù)檢索質(zhì)量,在此基礎上提出將中國地質(zhì)年代與地層概念相結(jié)合,構(gòu)建地質(zhì)年代本體,能為用戶提供知識查詢服務,解決了檢索中的語義異構(gòu)問題;姚健鵬等[8]利用Protégé本體建模軟件對銅礦床領域本體進行了構(gòu)建;WANG等[9]開發(fā)了一個基于本體的區(qū)域地質(zhì)時代、古生物學和基礎地質(zhì)學信息的數(shù)據(jù)集成與可視化系統(tǒng),實現(xiàn)了北美地質(zhì)時間尺度本體的建模與可視化、化石信息的檢索與顯示等功能。陸智卿等[10]利用Jena建立了包含圖片層與知識層的沉積相知識庫。在地質(zhì)找礦領域,利用推理規(guī)則進行礦床成因類型的判別還沒有得到應用,由此,本文采用Protégé本體建模軟件研究了基于推理規(guī)則進行中低溫巖漿熱液型金礦床判別方法研究,期望該方法具有很高的礦床類型判斷準確度,為其他礦床成因類型的判別提供依據(jù)。
本體形式化地描述了一個論域[11]。一般由概念、概念間的關系及建立在該關系之上的原理3部分組成。Protégé本體建模軟件是一種本體知識模型構(gòu)建工具,被廣泛應用在醫(yī)學、法律和農(nóng)業(yè)等本體知識模型構(gòu)建中。本體通常表示為{C1,R,P,C2,I}形式[12],C1(Concept)代表概念或類(Class),每一類中的父類可以下設若干子類,是本體中實例的集合,是具有某種特定性質(zhì)的具體或抽象對象匯總而成的集體。R(Relation)代表關系,是類之間的二元關系,將2個類連接在一起,表示類與類之間的相互聯(lián)系。P(Property)代表屬性,是實例之間的二元關系,將2個實例連接在一起,表示實例與實例之間的相互聯(lián)系,可以用于描述事物的特征。C2(Constraint)代表約束,用于在本體構(gòu)建時,對于事物屬性的限制,包括取值范圍和類型等。I(Individuals)代表實例,是類中包含的對象,實例擁有其所屬類的所有屬性和關系。本體概念的引入,在表達復雜礦床的分類與聯(lián)系中提供了有效手段。
1)確定本體領域及范疇:領域是一個知識范圍,在這個范圍內(nèi)的全部知識可以解決領域?qū)奶囟ǚ秶膯栴}[13]。本文構(gòu)建礦床成因類型的本體,并將“中低溫巖漿熱液型金礦床”作為具體研究對象,選擇以《地學大辭典》[14]《地質(zhì)學漢語敘詞表》[15]《勘查區(qū)找礦預測理論與方法(總論)》[1]《勘查區(qū)找礦預測理論與方法(各論)》[2]為主要參資料。礦床成因類型本體推理原理見圖1。
勘查區(qū)找礦預測理論(又稱“三位一體找礦預測理論”)廣泛應用于中國的找礦預測實踐中,其核心概念主要包括:礦床(體)、成礦地質(zhì)體、成礦結(jié)構(gòu)面和成礦構(gòu)造、成礦作用特征標志。礦床(體)是指含有用礦物資源且在一定的經(jīng)濟技術(shù)條件下能被開采利用的綜合地質(zhì)體;成礦地質(zhì)體通常為礦床的形成提供了成礦物質(zhì)、流體和能量;成礦結(jié)構(gòu)面和成礦構(gòu)造為礦床的形成提供了成礦流體運移通道和成礦空間;成礦作用特征標志指示了礦床形成過程。不同礦床成因類型具有不同成礦地質(zhì)體、成礦結(jié)構(gòu)面和成礦構(gòu)造、成礦作用特征標志,可基于此建立成礦與找礦預測地質(zhì)模型。

圖1 礦床成因類型本體推理原理
2)列出重要術(shù)語:對于礦床成因類型本體,要盡可能做到使用通用專業(yè)術(shù)語,如發(fā)育、陸塊區(qū)、造山帶等。著重列出與三位一體找礦預測理論相關術(shù)語。
3)定義類及其中的層級:在Protégé本體建模軟件中,每個本體模型有一個默認總類“owl:Thing”,可以在該總類之下添加多個不同級別的子類,本文主要研究對象為中低溫巖漿熱液型金礦床,以此為例,類的創(chuàng)建過程如下,頂層為礦床概念層,自頂向下由寬泛的礦床成因分類逐層細化到礦床類型,以樹狀形式展現(xiàn)金礦床的分類結(jié)構(gòu)。此外,根據(jù)三位一體找礦預測理論,建立成礦地質(zhì)體、成礦結(jié)構(gòu)面與成礦構(gòu)造、成礦作用特征標志3個大類及其子類,用于表征各類金礦床特征。
4)定義類的關系:用于描述類或?qū)嵗g的聯(lián)系,向上對類動作狀態(tài)或特征的陳述或說明,向下承接了共性特征層;以共性特征層為實例,該層為礦床模型的核心層級,涵蓋了各類礦床從宏觀地質(zhì)信息到微觀地質(zhì)特性等核心知識。本文除了定義用于描述關系的“是”“具有”“屬于”等一般詞外,還根據(jù)三位一體找礦預測理論定義了“成礦地質(zhì)體是”“成礦構(gòu)造是”“成礦結(jié)構(gòu)面是”和“成礦作用特征標志是”等關系。
5)創(chuàng)建實例:創(chuàng)建屬于類的實例,一般為領域內(nèi)的對象,如大橋金礦床。單個礦床作為礦床成因類包含的元素,既向上歸屬于具體的礦床成因類,又與共性特征層的屬性相互融合。創(chuàng)建后可以在個體的Description里聲明其所屬的類,在Property Assertion里聲明其具有的屬性。這里主要對從三位一體找礦預測理論角度下的實例創(chuàng)建過程進行說明,以成礦構(gòu)造中的斷裂為例,一般認為按相對運動方向可以分為正斷裂、逆斷裂、走滑斷裂;按力學性質(zhì)可以分為壓性斷裂、張性斷裂、剪切斷裂、張扭性斷裂、壓扭性斷裂;按走向可以分為北東向斷裂、北西向斷裂等。這些術(shù)語既可以按照層級關系當作父類和子類,也可以按照對象的角度當作實例。為了推理方便,在斷裂類下面創(chuàng)建“正斷裂”“逆斷裂”“走滑斷裂”“壓性斷裂”“張性斷裂”“剪切斷裂”“張扭性斷裂”“壓扭性斷裂”“北東向斷裂”“北西向斷裂”等。同理,“成礦地質(zhì)背景”類下面包含的實例為“大地構(gòu)造單元”“成礦帶”“成礦時代”等。“巖體”類包含的實例為“酸性巖體”“中酸性巖體”“中性巖體”“中基性巖體”“基性巖體”“超基性巖體”“基性超基性巖體”等。
從結(jié)構(gòu)、功能、可用性、一致性、完整性、簡明幾個維度對本體反復評估及迭代修訂,修訂后的本體在以上幾個方面實現(xiàn)相對最優(yōu)。礦床成因類型本體包含的三元組實體1 326 014個,關聯(lián)屬性2 314 541個(見圖1),本體具有較豐富類間關系,適于表達地質(zhì)領域復雜的關系。
語義網(wǎng)規(guī)則語言(SWRL,Semantic Web Rule Language)是由語義方式呈現(xiàn)規(guī)則的一種語言,該語言符合W3C規(guī)范,也是目前比較流行的規(guī)則語言,SWRL表示規(guī)則[16]見式(1):
A1,A2,A3,…,An->B1,B2,B3,…,Bm
(1)
->兩側(cè)的逗號表示合取,A1,…,An和B1,…,Bm可以形如C(?x)、P(?x,?y)、sameAs(?x,?y)或者differentForm(?x,?y),其中C是一個類,P是一個屬性,x和y是變量、實例或者數(shù)據(jù)值。SWRL的突出優(yōu)勢主要在以下2個方面:一方面可以根據(jù)本體推理涉及領域特點,自定義規(guī)則,可復用性好,在相近的領域可以重復使用推理規(guī)則;另一方面,SWRL能夠非常清楚地描述規(guī)則之間的層次關系,具有人機可讀性好、可以直接結(jié)合本體來建立規(guī)則、易于使用等優(yōu)點。
推理機(Inference Engine)在Protégé本體建模軟件中是SWRL Tab插件。在該插件中,可以使用SWRL的所有語法,便于將本體實體加入到規(guī)則中,防止輸入錯誤。Protégé本體建模軟件中的推理機基于HermiT推理算法,可以用來發(fā)現(xiàn)新知識和識別錯誤知識。
由于礦床成因類型本體關系比較復雜,因此本文選擇用SWRL Tab自定義推理規(guī)則,推理規(guī)則定義了由已知知識推導出未知知識,用來推理類的規(guī)則的格式見式(2):
rule-name:R1 (?x)^R2(?x,?y)->R3(?x)
(2)
用來推理關系的規(guī)則格式見式(3):
rule-name:R4(?x)^R5(?x,?y)->R6(?z,?x)
(3)
式中:rule-name為規(guī)則的名稱;R1、R3、R4為本體模型中的某個類;R2、R5、R6為本體模型中的某個類或者屬性;->前面為推理前的狀態(tài);->后面為推理得到的結(jié)果;R3和R6由推理得到。
通過推理,可以對x進行歸類,或者得到z與x之間的新知識。在編寫推理規(guī)則時,將多個規(guī)則組合,可以進行組合推理。
根據(jù)地質(zhì)領域知識,可以創(chuàng)建若干條推理規(guī)則,對本體模型中包含的知識進行推理,對構(gòu)建的本體模型進行補全。例如:一般認為一塊巖石中包含的礦物為石英和長石,則這個巖石為花崗巖。將上述理論歸納為SWRL推理規(guī)則即為“S1:巖石(?a)^礦物(?a,石英)^礦物(?a,長石)->花崗巖(?a)”。
根據(jù)一系列礦床特征和三位一體找礦預測理論,可以進一步判斷礦床的成因亞類或子類,這屬于推理新知識的過程。通過SWRL Tab自定義推理規(guī)則,利用Protégé內(nèi)置推理機可以推理分析該礦床屬于的類型。針對中低溫巖漿熱液型金礦床,建立找礦模型要素本體,根據(jù)推理格式編寫若干推理規(guī)則。例如:金礦床位于巖體附近,金礦床的成礦時代為白堊紀,巖體的侵入時代為燕山期,金礦床的成因類型為中低溫巖漿熱液型金礦床,該推理規(guī)則可以表示為:礦床(?a)^巖體(?b)^附近(?a,?b)^成礦時期(?a,白堊紀)^侵入時期(?b,燕山期)->中低溫巖漿熱液型金礦床(?a)。
在“礦床類”下面添加大橋金礦床實例,以區(qū)域地質(zhì)調(diào)查報告和47篇相關文獻為參考資料,結(jié)合三位一體找礦預測理論,整理出大橋金礦床的成礦要素,結(jié)果見表1。構(gòu)建礦床本體模型,按照大橋金礦床的成礦地質(zhì)背景和礦床地質(zhì)特征為大橋金礦床實例添加屬性,經(jīng)過推理將大橋金礦床的屬性補全,同時在Protégé本體建模軟件中可以看到大橋金礦床被歸為“中低溫巖漿熱液型金礦床”和“中溫熱液型金礦床”(見圖2),代表著推理后礦床成因類型更加明確,從比較模糊的“金礦”細化到了“中低溫巖漿熱液型金礦床”,具體推理過程如下。
選擇基礎地質(zhì)規(guī)則庫對大橋金礦床現(xiàn)有成礦要素進行屬性補全,得出大橋金礦床的巖石主要是濱淺海碳酸鹽組合、陸源碎屑濁積巖、英安巖—安山巖組合;硅化蝕變與金礦化關系密切;成礦地質(zhì)體為印支晚期中酸性隱伏侵入體,沉淀機制主要為充填。
選擇礦床成因的推理規(guī)則庫進行二次推理,得到推理結(jié)果為:大橋金礦床屬于中低溫巖漿熱液型金礦,符合普遍認為的礦床成因類型。分析得到推理的主要依據(jù)是:大橋金礦床成礦地質(zhì)體為中酸性、酸性、偏堿性侵入體;其沉淀機制以充填為主;礦體形態(tài)為層狀礦體、脈狀礦體和復合礦體;礦體受斷裂、硅鈣面等成礦結(jié)構(gòu)面控制;礦化樣式以脈狀、似層狀為主;蝕變類型為硅化、絹云母化(見圖3)。符合礦床成因類型推理一般規(guī)律[17-20]。利用Protégé本體建模軟件的推理機插件進行推理,能夠根據(jù)結(jié)論所在類,挖掘出隱含的關系,最終得到具有參考意義的結(jié)果。

表1 大橋金礦床成礦要素

圖2 大橋金礦床推理前、后所屬礦床類型對比

圖3 大橋金礦床推理后屬性
利用Protégé本體建模軟件,參照勘查區(qū)找礦預測理論,對礦產(chǎn)地質(zhì)知識進行本體建模,在此基礎上基于SWRL,定義一般地質(zhì)規(guī)律規(guī)則和礦床成因類型推理規(guī)則,針對中低溫巖漿熱液型金礦床,利用HermiT推理機完成對大橋金礦床成因類型的推理。經(jīng)驗證,推理結(jié)果準確,并且能夠挖掘出類之間的隱含關系,能夠依據(jù)理論幫助研究人員確定礦床類型。在未來的研究中,可將基于Protégé本體建模軟件的推理判別方法應用于其他礦床成因類型的判別,也可將本方法與現(xiàn)有的人工智能找礦預測模型結(jié)合,探索知識驅(qū)動與數(shù)據(jù)驅(qū)動綜合的找礦預測方法,輔助研究人員開展深部找礦預測工作。