摘 要:本體論與各個領(lǐng)域計算機(jī)技術(shù)的發(fā)展結(jié)合產(chǎn)生了所謂的“領(lǐng)域本體”的構(gòu)建及應(yīng)用研究,首先介紹領(lǐng)域本體的構(gòu)建理論及方法,然后提出基于多層次業(yè)務(wù)流程的石油勘探和開發(fā)領(lǐng)域本體庫的構(gòu)建方法,把石油勘探開發(fā)領(lǐng)域所涉及方面分為多級業(yè)務(wù)活動層次,并以圈閉活動為例列出對應(yīng)的微本體庫構(gòu)建方法的探討。
關(guān)鍵詞:本體;領(lǐng)域本體;石油本體;業(yè)務(wù)流程構(gòu)建本體;微本體
中圖分類號: TP302 文獻(xiàn)標(biāo)識碼:A
1 引 言
本體論(Ontology)概念起源于哲學(xué)領(lǐng)域;在計算機(jī)學(xué)科的使用可以追溯到上世紀(jì)80年代,最終Gruber給出了廣泛接受的概念[1-3]:本體是概念化的明確的規(guī)范化說明。
本體作為一種知識共享模式,為特定領(lǐng)域的人和應(yīng)用系統(tǒng)的交流提供了極大的便利,也正因為如此,本體的研究和應(yīng)用迅速延伸到知識工程、自然語言處理、信息檢索系統(tǒng)、智能信息集成和知識管理、信息交換和軟件工程等領(lǐng)域。而如何對這些不同領(lǐng)域內(nèi)的知識進(jìn)行抽取和描述并構(gòu)建出合適的領(lǐng)域本體已經(jīng)成為當(dāng)前的研究熱點之一[4-7]。
所謂領(lǐng)域本體(domainspecific ontology)是對學(xué)科概念的一種描述,包括學(xué)科中的概念、概念的屬性、概念間的關(guān)系以及屬性和關(guān)系的約束。由于知識具有顯著的領(lǐng)域特性,所以領(lǐng)域本體能夠更為合理而有效的進(jìn)行知識的表示。領(lǐng)域本體一般用來表示某一特定領(lǐng)域范圍內(nèi)的特定知識,以本文為例即研究石油勘探開發(fā)領(lǐng)域本體庫的構(gòu)建方法為主要內(nèi)容。
2 本體的構(gòu)建
2.1 本體的結(jié)構(gòu)
本體的結(jié)構(gòu)(ontology structure)是一個五元組O:={C,R,Hc,Rel,Ao}。作為不同主體之間進(jìn)行交流的一種語義基礎(chǔ),本體由描述某種現(xiàn)實情況的特定術(shù)語集,加上一組關(guān)于術(shù)語內(nèi)涵意義的顯式假定集合所構(gòu)成。在最簡單的情況下,本體只描述概念的分類層次結(jié)構(gòu):在復(fù)雜的情況下,本體可以在概念分類層次的基礎(chǔ)上,加入一組合適的關(guān)系、公理、規(guī)則來表示概念之間的其它關(guān)系,約束概念的內(nèi)涵解釋。一個完整的本體應(yīng)由概念、關(guān)系、函數(shù)、公理和實例五類基本元素構(gòu)成[8-13]:
1)概念是廣義上的概念,除了可以是一般意義上的概念以外,也可以是任務(wù)、功能行為、策略、推理過程等。本體中的這些概念通常構(gòu)成一個繼承的分類層次。
2)關(guān)系是領(lǐng)域中概念之間的交互作用,形式上定義為n維笛卡兒積的子集: R:C1×C2×…×Cn。在語義上關(guān)系對應(yīng)于對象元組的集合。
3)函數(shù)是一種特殊的關(guān)系,n元函數(shù)中的第n個元素由前面n-1個元素惟一確定,形式化的定義為:F:C1×C2×C3×…×Cn-1→Cn。
4)公理是一些永真式的描述。更具體地說,公理是領(lǐng)域中在任何條件下都成立的斷言。
5)實例是指概念中的具體例子,特定領(lǐng)域的所有實例構(gòu)成領(lǐng)域概念在該領(lǐng)域中的值域。
計算技術(shù)與自動化2011年9月
第30卷第3期袁國銘等:本體構(gòu)建理論在石油領(lǐng)域的應(yīng)用研究
2.2 本體的建立方法
本體是對領(lǐng)域中的概念及概念之間關(guān)系的顯式描述。目前,領(lǐng)域本體的構(gòu)建方法還處于探索性研究階段,對不同問題的不同認(rèn)識和解決會得出不同的方法論,但都包含五條規(guī)則:
1)明確性和客觀性:
用自然語言對術(shù)語給出明確、客觀的語義定義。
2)完整性:
所給出的定義是完整的,能表達(dá)特定術(shù)語的含義。
3)一致性:
知識推理產(chǎn)生的結(jié)論與術(shù)語本身的含義不會產(chǎn)生矛盾。
4)最大單向可擴(kuò)展性:
向本體中添加通用或?qū)S玫男g(shù)語時,通常不需要修改已有的內(nèi)容。
5)最少約束:
對待建模對象應(yīng)該盡可能少列出限定的約束條件。
常見的本體構(gòu)建方法:TOVE、骨架法、IDEF5、METHONTOLOGY、KACTUS、SENSUS和七步法。本文探討以七步法為理論根據(jù),步驟如圖1所示:
3 石油本體業(yè)務(wù)框架模型
建立領(lǐng)域本體模型的關(guān)鍵步驟首先在于建立合適的領(lǐng)域本體框架模型。石油業(yè)務(wù)模型(Business Model)是一種通過定義組成活動及活動之間邏輯關(guān)系來描述石油企業(yè)經(jīng)營生產(chǎn)過程的模型,它是勘探開發(fā)數(shù)據(jù)模型的基礎(chǔ)。
業(yè)務(wù)領(lǐng)域的劃分以某種與石油相關(guān)的主題為指導(dǎo)從整體上對油田主要業(yè)務(wù)進(jìn)行劃分。它不是現(xiàn)有機(jī)構(gòu)部門的照搬,也不是基礎(chǔ)業(yè)務(wù)的整理,而是概括的,總結(jié)性的劃分[8-13]。
3.1 業(yè)務(wù)領(lǐng)域方法
按照業(yè)務(wù)管理形式或油田生命周期組織方式進(jìn)行劃分,例如按照業(yè)務(wù)管理可劃分為“勘探、開發(fā)、生產(chǎn)、經(jīng)營”4大類。具體方法是:首先根據(jù)專業(yè)劃分業(yè)務(wù)域。某一專業(yè)在油氣田勘探、開發(fā)中承擔(dān)了某一確定領(lǐng)域的業(yè)務(wù),具有明晰的業(yè)務(wù)邊界。如“物化探”、“鉆井”、“采油”、“分析化驗”等,不同專業(yè)間具有明顯不同的業(yè)務(wù)范疇和業(yè)務(wù)特性。其次根據(jù)油氣田勘探、開發(fā)生命周期劃分業(yè)務(wù)域。油氣田勘探、開發(fā)存在著明顯的階段性,且有較明顯的階段性標(biāo)志,如勘探階段、開發(fā)階段、廢棄階段等,同一階段內(nèi)的若干子業(yè)務(wù)往往具有一定的相關(guān)性,如鉆探階段中的鉆、測、錄、試等。最后根據(jù)油氣田勘探、開發(fā)管理階段劃分管理業(yè)務(wù)域。針對油氣田不同生命周期或階段,存在著一些重要的階段性管理業(yè)務(wù)。其油氣田管理手段和管理方式都不相同,管理內(nèi)容也不相同,如勘探規(guī)劃部署階段、勘探綜合研究階段、開發(fā)部署規(guī)劃階段等。管理業(yè)務(wù)可能集中于勘探、開發(fā)一個或幾個階段,也可能貫穿于勘探、開發(fā)的全過程。
3.2 業(yè)務(wù)領(lǐng)域劃分
業(yè)務(wù)域的劃分以方法生命周期為主線,將專業(yè)業(yè)務(wù)域與方法管理業(yè)務(wù)域有機(jī)的串接起來,盡量符合油氣田勘探、開發(fā)管理的約定俗成的管理習(xí)慣,做到不同業(yè)務(wù)域間的業(yè)務(wù)不重復(fù),并保證能覆蓋所有的勘探、開發(fā)業(yè)務(wù)。
根據(jù)以上原則和方法,把油氣田勘探開發(fā)業(yè)務(wù)劃分為“勘探規(guī)劃與部署”、“物化探”、“井筒工程”、“分析化驗”、“綜合研究”、“開發(fā)規(guī)劃與開發(fā)方案”、“油氣生產(chǎn)”、“油氣集輸”等8大業(yè)務(wù)域[14-15]。
業(yè)務(wù)領(lǐng)域中包含獨立的一個個業(yè)務(wù)和更細(xì)的子業(yè)務(wù)。每個業(yè)務(wù)包含該業(yè)務(wù)的業(yè)務(wù)流程,業(yè)務(wù)流程中包含更細(xì)的、小的子業(yè)務(wù)流程。按照同樣的原則,可以將業(yè)務(wù)逐級細(xì)分下去,直至不可細(xì)分的業(yè)務(wù)功能單元為止,稱為業(yè)務(wù)活動。
大的業(yè)務(wù)包含更小的子業(yè)務(wù)。按照同樣的業(yè)務(wù)劃分原則,可以對業(yè)務(wù)繼續(xù)細(xì)分。業(yè)務(wù)的劃分要覆蓋業(yè)務(wù)領(lǐng)域中的全部業(yè)務(wù)。直到將該業(yè)務(wù)領(lǐng)域中的業(yè)務(wù)全部細(xì)分出來為止。業(yè)務(wù)域-業(yè)務(wù)-業(yè)務(wù)流程-業(yè)務(wù)活動的層次要大于等于三級,業(yè)務(wù)域-業(yè)務(wù)的劃分和業(yè)務(wù)流程的分級都不超過三級;如果確實超過三級,則向上一級壓縮,或重新規(guī)劃分級層次。
以“綜合研究”業(yè)務(wù)劃分為例,如圖3-1所示,首先,綜合研究在整個勘探開發(fā)生命周期處于勘探的中后期階段,也是一個關(guān)鍵性階段,它的專業(yè)特點很突出,產(chǎn)生大量的大塊數(shù)據(jù)和成果文檔,因此把“綜合研究”作為一個頂級業(yè)務(wù)域?qū)ΥK旅姘鍌€一級業(yè)務(wù):“構(gòu)造研究”、“資源評價”、“油藏描述與評價”、“剩余油研究”和“油藏數(shù)值模擬”;而以其中的“資源評價”為例,它又包含:“盆地評價”、“區(qū)帶評價”、“探井評價”和“預(yù)測儲量計算”四個二級業(yè)務(wù);其中“區(qū)帶評價”又包含五個三級業(yè)務(wù)活動:“烴源巖條件評價”、“運聚條件評價”、“儲層條件評價”、“保存條件評價”和“圈閉條件評價”。(注:F/S表明上下位關(guān)系)
3.3 業(yè)務(wù)活動的本體模型
業(yè)務(wù)活動是業(yè)務(wù)流程分解后最基本、不可再分解的最小功能單元。一般來說,一個業(yè)務(wù)流程包括若干個業(yè)務(wù)活動。業(yè)務(wù)活動的劃分與業(yè)務(wù)分析的視角有關(guān)。
業(yè)務(wù)活動描述:對業(yè)務(wù)活動的文字性概要描述,描述按照“6W”的模式進(jìn)行描述,即活動是由誰(Who)發(fā)起的、在什么時間(When)發(fā)起的、在哪里(Where)發(fā)起的、為什么(Why)要發(fā)起這個活動、在這個活動中都涉及到了哪些(Which)對象、這些對象的特性是什么(What)。通過這個“6W”過程,可以將某一業(yè)務(wù)活動中涉及的相關(guān)信息完全抽取出來。
6W的核心實質(zhì)是“對象-活動-關(guān)聯(lián)-特性”,如圖3所示。
4 以圈閉活動本體構(gòu)建為例
4.1 微本體模型
石油勘探開發(fā)領(lǐng)域本體模型給出了在該領(lǐng)域內(nèi)利用本體組織知識、表示知識、應(yīng)用知識的邏輯形式[18]。勘探和開發(fā)領(lǐng)域本體Pet-On可以形式化地表示為五元組Pet-On =
O:論域。根據(jù)勘探開發(fā)領(lǐng)域知識粒度的不同,論域O中的本體分為不同的級別。一級對應(yīng)領(lǐng)域主題,如勘探井位部署;二級對應(yīng)構(gòu)成一級本體的最大粒度的知識,例如烴源巖;其它級別本體劃分方法依次類推。
C:概念或術(shù)語。根據(jù)勘探開發(fā)領(lǐng)域知識粒度的不同,概念或術(shù)語的粒度也不同。通常情況下,概念或術(shù)語也就是相應(yīng)本體的名稱。例如,勘探井位部署是一級本體名稱,同時它也是領(lǐng)域概念的名稱。但是,二者有著完全不同的含義。作為本體,勘探井位部署有著自己的屬性、活動和與其它本體之間的關(guān)系。作為概念,勘探井位部署沒有活動,也沒有屬性,但是有與其它概念之間的聯(lián)系。
R:本體之間的關(guān)系。可以是構(gòu)成關(guān)系,繼承關(guān)系,也可以是作為其它本體屬性的關(guān)聯(lián)關(guān)系。
At:本體屬性。例如圈閉的等級,烴源巖的豐度。
Ac:本體活動或者操作。例如,構(gòu)造評價就是構(gòu)造本體的活動。
4.2 圈閉活動的本體模型構(gòu)建
一個專業(yè)領(lǐng)域的本體模型首先必須確定一個業(yè)務(wù)主題,在相關(guān)業(yè)務(wù)主題的指導(dǎo)下收集和整理該業(yè)務(wù)范圍內(nèi)的所有的詞匯和專業(yè)術(shù)語,然后按照詞匯的等級合理劃分詞集,以樹形的結(jié)構(gòu)模式組織這些詞匯之間的關(guān)系,在詞集整理完善的基礎(chǔ)上要建立這些詞匯的概念、屬性、評價技術(shù)和參數(shù)、操作流程和識別標(biāo)準(zhǔn)以及詞匯之間的關(guān)系等,就形成了一個完整的領(lǐng)域本體模型。
圈閉活動微領(lǐng)域本體的構(gòu)建模型如圖5所示。5 總 結(jié)
本體庫的構(gòu)建是一個浩大的人工智能系統(tǒng)工程,領(lǐng)域本體的構(gòu)建與應(yīng)用又是其中最有廣闊發(fā)展前景的方面,本文提供了在石油勘探開發(fā)領(lǐng)域一種基于業(yè)務(wù)流程的多層次本體構(gòu)建方案探討。可以預(yù)見:在不久的將來,領(lǐng)域本體庫的構(gòu)建與應(yīng)用會對人類社會的進(jìn)步作出巨大的貢獻(xiàn)。
參考文獻(xiàn)
[1] Thomas R Grube. Ontolingua:A Translation Approach to Potable Ontology SPecification[J]. Knowledge Acquisition,1993,5(2):199-200.
[2] Bomt W N. Construction of Engineering Ontofogies for Knowledge Sharing and Reuse[D]. PhD Thesis,Enschede:University of Twente,1997.
[3] Fridman Noy and CD Hafher. The State of the Art in Ontology Design. A Survey and Comparatlve Review[J]. AI Magazine,1997:53-74.
[4] Guoming Yuan,Hongqi Li and Bo Fan.Discussion on the Construction Method of Oil Exploration and Exploration and Development Domain Ontology[C]//Proceedings of ICEOE 2011,the 2011 IEEE International Conference on Electronics and Optoelectronics,Dalian,China :V4-397.
[5] 陳剛,陸汝鈐,金芝.基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報,2003,14(3):350-355.
[6] 馮志勇,李文杰,李曉紅.本體論工程及其應(yīng)用[M].北京:清華大學(xué)出版社,2007.
[7] 袁國銘,李洪奇.關(guān)于決策支持系統(tǒng)的綜述.微型機(jī)與應(yīng)用[J].2010,29(23):5-7.
[8] 陳新發(fā),曾穎,李清輝.數(shù)字油田建設(shè)與實踐-新疆油田信息化建設(shè)[M].北京:石油工業(yè)出版社,2008.27.
[9] 汪福勇,李愛國.淺談中國石油信息標(biāo)準(zhǔn)化[J].石油工業(yè)計算機(jī)應(yīng)用,2005,13(1):2-6.
[10]Fridman Noy and CD Hafher. The State of the Art in Ontology Design. A Survey and Comparatlve Review[J].AI Magazine,1997:53-74.
[11]Guarino N. Formal Ontology and Information Systems. In: Proceedings of the lst International Conference on Formal Ontology in Information Systems (FOIS’98)[J].Trento,Italy:IOS Press,1998,3-15.
[12]Quine W V. From a logical Point of view: Nine Logicophilosophical Essays,Cambridge, Massachuetts[M]USA:Harvard University Press,1980.
[13]Guarino N,Carrara M,Giaretta P.Formalizing Ontological Commitments. In:Proceedings of 12th National Conference on Artificial Intelligence(AAAI’94)[J]. Seattle, Washington, USA, 1994,(1):560-568.
[14]鄧志鴻,唐世渭,楊冬青,等.本體內(nèi)代數(shù)系統(tǒng)之研究[J].計算機(jī)工程與應(yīng)用,2001,7(23):7-8.
[15]Peter Mika. Ontologies are us: A unified model of social networks and semantics [J] .Web Semantics: Science, Services and Agents on the World Wide Web, 2007, 5(1) :5-15 .
[16]楊義忠,王承勇,林淑鳳.石油主題詞表[M].北京:石油工業(yè)出版社,1994.
[17]劉寶和.中國石油勘探開發(fā)百科全書[M].北京:石油工業(yè)出版社,2008.
[18]袁國銘,李洪奇,樊波.關(guān)于知識工程的發(fā)展綜述[J].計算技術(shù)與自動化,2011,30(1):138-143.