王玄, 楊麗波
(東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)
元數(shù)據(jù)的初始定義是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,如今元數(shù)據(jù)的涵義隨著長期的研究與發(fā)展已經(jīng)演化為對系統(tǒng)環(huán)境知識的概括[1]。元數(shù)據(jù)的應(yīng)用涉及諸多領(lǐng)域,范圍十分廣泛,如網(wǎng)絡(luò)資源搜索、圖書管理以及GIS等等。元數(shù)據(jù)的歷史可以追溯到20世紀(jì)60年代,到目前為止的這段期間經(jīng)過了數(shù)據(jù)字典的發(fā)展與基于數(shù)據(jù)倉儲的CASE工具的發(fā)展,現(xiàn)正向著數(shù)據(jù)倉庫元數(shù)據(jù)存儲和元數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)系統(tǒng)階段不斷發(fā)展[2-3]。
元數(shù)據(jù)因其重要性吸引了眾多學(xué)者的關(guān)注與研究。元數(shù)據(jù)的用途并不局限于描述數(shù)據(jù)與索引數(shù)據(jù),還觸及了數(shù)據(jù)的查找、轉(zhuǎn)換、管理和使用[4-6]。尤其是在集成分布式多源異構(gòu)空間數(shù)據(jù)時(shí),為了屏蔽地理空間數(shù)據(jù)的復(fù)雜結(jié)構(gòu)和模型,采取在內(nèi)部構(gòu)建數(shù)據(jù)源訪問引擎、在外部預(yù)留元數(shù)據(jù)接口的方式來實(shí)現(xiàn)對多源空間數(shù)據(jù)的整合[7]。元數(shù)據(jù)在不斷擴(kuò)大其影響的過程中,在信息集成中的應(yīng)用已經(jīng)從單一的元素分析選擇過渡轉(zhuǎn)變?yōu)榻TO(shè)計(jì)。許多專家學(xué)者對其在信息集成中的研究重心也發(fā)展成為描述與展現(xiàn)信息資源的一種手段和方法,尤其是對信息資源內(nèi)部及資源之間具有復(fù)雜關(guān)聯(lián)或?qū)蛹壗Y(jié)構(gòu)關(guān)系的一類信息的描述[8]。元數(shù)據(jù)的研究己經(jīng)從純理論的探索研究階段走出,現(xiàn)正走向更加廣泛、深入的實(shí)際應(yīng)用研究中[9-11],將元數(shù)據(jù)相關(guān)理論及技術(shù)用于指導(dǎo)本文對油田完井信息集成的研究,將會(huì)是有力的理論依據(jù)。
該模型定義了用戶類別、實(shí)體對象類別、功能類別三個(gè)集合并對集合中元素的三個(gè)屬性作了介紹。該模型根據(jù)用戶、實(shí)體對象、功能之間的屬性關(guān)系進(jìn)而實(shí)現(xiàn)了實(shí)體對象和功能的集成綁定。各種集合的定義如下:
(1)用戶類別集合Uu={U1,U2…,Um}其中m為用戶類別數(shù)目,每個(gè)類別包含3個(gè)屬性Rue、Ruf、Ru,分別用于描述用戶所關(guān)心的實(shí)體對象、用戶關(guān)心的功能、用戶與用戶類別關(guān)系。為了增強(qiáng)該模型的安全性,用戶類別集合Uu對用戶進(jìn)行了級別劃分;
(2)實(shí)體對象集合Ee={E1,E2…,En}其中n為空間實(shí)體對象數(shù)目。每個(gè)實(shí)體對象包含3個(gè)屬性Reu(實(shí)體對象所涉及的業(yè)務(wù)領(lǐng)域)、Re(空間實(shí)體對象與地圖圖層之間的關(guān)系)、Ref(實(shí)體對象所綁定的功能);
(3)功能類別集合Ff={F1,F2…,Fk}其中k為所有功能類別數(shù)目。每個(gè)功能包含3個(gè)屬性Rfu(功能與業(yè)務(wù)領(lǐng)域的關(guān)系)、Rf(各類功能之間的關(guān)系)、Rfe(功能可以作用于哪些實(shí)體對象);
分析定義可知,在鏈接用戶集合與功能集合的過程中起到橋接作用的是實(shí)體對象集合。通過對上述三個(gè)集合進(jìn)行聯(lián)結(jié),該模型構(gòu)建了一種“每類實(shí)體對象上綁定的用戶所關(guān)心的功能”的集成關(guān)系。
基于1的3個(gè)概念的界定自動(dòng)集成算法的步驟如下。
(1)首先進(jìn)行地圖圖層數(shù)據(jù)組織,依據(jù)實(shí)體對象集合中每類實(shí)體對象的屬性Re(空間實(shí)體對象與地圖圖層之間關(guān)系)劃分GIS地圖圖層。
(2)通過用戶登錄的信息確定用戶屬于用戶類別集合中的哪一類別Uj,根據(jù)Uj的2個(gè)屬性Rue(用戶關(guān)心的實(shí)體對象)、Ruf(用戶關(guān)心的功能)確定該用戶關(guān)心的實(shí)體對象及功能。
(3)依據(jù)上一步中的Uj的屬性Rue(用戶關(guān)心的實(shí)體對象)與實(shí)體對象集合E中每類實(shí)體對象Ei的Reu(實(shí)體對象所涉及的業(yè)務(wù)領(lǐng)域)進(jìn)行匹配關(guān)聯(lián),明確用戶在每類實(shí)體對象中可操作的實(shí)體對象有哪些,進(jìn)而明確用戶在每類地圖圖層上的可操作區(qū)域。
(4)依據(jù)第2步中Uj的屬性Ruf(用戶關(guān)心的功能),與第3步中確定的可操作的實(shí)體對象集合中每類實(shí)體對象Ex的屬性Ref(實(shí)體對象所綁定的功能)進(jìn)行匹配,確定用戶在可操作的每類實(shí)體對象上關(guān)聯(lián)綁定的所有功能。
(5)對第3步中用戶可操作的區(qū)域采取一定的手段或方法進(jìn)行展示;對第4步中集成的所有功能以可視化接口(如菜單等)的方式進(jìn)行組織與展示;通過用戶與地圖上實(shí)體的交互實(shí)現(xiàn)用戶對GIS上集成的信息的獲取、完成集成功能的使用。
根據(jù)上述集成的思路,設(shè)計(jì)了通用的信息集成元數(shù)據(jù)模型,如圖1所示。

圖1 完井業(yè)務(wù)數(shù)據(jù)關(guān)系模型
圖1中的原子與分類關(guān)系分別對應(yīng)了上文3個(gè)定義中的分類關(guān)系,圖1中的3張關(guān)系表(用戶與實(shí)體關(guān)系、實(shí)體與功能關(guān)系、用戶與功能關(guān)系)分別代表了上述3個(gè)定義中的其他的屬性關(guān)系,最后通過這3張?jiān)獢?shù)據(jù)表的關(guān)聯(lián)實(shí)現(xiàn)對這3種信息的集成。
由于油田完井業(yè)務(wù)重點(diǎn)關(guān)注完井過程中井的相關(guān)生產(chǎn)數(shù)據(jù)管理,故下面主要對A2模型中實(shí)體井上關(guān)聯(lián)的部分完井生產(chǎn)業(yè)務(wù)數(shù)據(jù)、組織結(jié)構(gòu)關(guān)系進(jìn)行分析。其中表井CD_WELL_SOURCE存儲了井ID、井的基本信息、機(jī)構(gòu)ID,則通過此表就可以關(guān)聯(lián)井實(shí)體所涉及的完井生產(chǎn)業(yè)務(wù)數(shù)據(jù),通過井ID關(guān)聯(lián),如井的完井生產(chǎn)統(tǒng)計(jì)信息、施工進(jìn)度監(jiān)測信息等;同時(shí)此表還可以關(guān)聯(lián)組織機(jī)構(gòu)表,通過機(jī)構(gòu)ID關(guān)聯(lián),進(jìn)而獲取單位信息。部分完井業(yè)務(wù)數(shù)據(jù)關(guān)系模型,如圖2所示。

圖2 完井業(yè)務(wù)數(shù)據(jù)關(guān)系模型
油田GIS空間數(shù)據(jù)模型主要涵蓋了與油田開發(fā)生產(chǎn)業(yè)務(wù)相關(guān)的空間信息模型,每一類實(shí)體都被規(guī)劃在不同的圖層之中,實(shí)體與實(shí)體之間,或者說圖層與圖層之間的數(shù)據(jù)關(guān)聯(lián)的橋梁是組織機(jī)構(gòu)。部分GIS空間數(shù)據(jù)模型,如圖3所示。

圖3 GIS空間數(shù)據(jù)模型
由此可見,GIS空間數(shù)據(jù)模型中的每個(gè)實(shí)體都與組織機(jī)構(gòu)有關(guān)聯(lián)。其中,井實(shí)體表中通過井ID、機(jī)構(gòu)ID和站間ID連接組織結(jié)構(gòu)和站間,該表還存儲了其他一些信息:如井號、橫縱坐標(biāo)、所屬圖層ID等;站、間有各自存儲的實(shí)體表,通過各自的唯一標(biāo)識ID和組織機(jī)構(gòu)連接,代表了一種歸屬關(guān)系。由于實(shí)體和組織機(jī)構(gòu)的關(guān)聯(lián)關(guān)系,在實(shí)際應(yīng)用時(shí)使得圖層在區(qū)分用戶權(quán)限顯示方面更加方便。圖層表方便了地圖加載中對圖層進(jìn)行控制,不同級別用戶,依據(jù)組織關(guān)系和圖層ID進(jìn)行圖層的顯示控制。
集成后的完井信息集成管理系統(tǒng)的功能組織方式分為2種,一種是基于“用戶-功能”的形式,一種是基于“用戶-實(shí)體對象-功能”的形式。對于哪些用戶對哪些業(yè)務(wù)功能有操作權(quán)限,以及涉及到實(shí)體對象的操作功能,不同用戶對哪類對象上的功能有操作權(quán)限,想要對這些信息之間的關(guān)系進(jìn)行清晰、有效地組織管理則必須使用元數(shù)據(jù)及其建模技術(shù)。基于筆者對兩種數(shù)據(jù)模型的分析可知,想要實(shí)現(xiàn)完井業(yè)務(wù)數(shù)據(jù)模型和GIS實(shí)體的關(guān)聯(lián),則將完井業(yè)務(wù)數(shù)據(jù)模型和GIS空間數(shù)據(jù)模型進(jìn)行關(guān)聯(lián)即可,實(shí)體表是關(guān)聯(lián)的橋梁。例如,井實(shí)體表作為媒介,將完井業(yè)務(wù)模型和GIS空間數(shù)據(jù)模型關(guān)聯(lián)起來,則實(shí)現(xiàn)了用戶(組織機(jī)構(gòu))-實(shí)體對象(井實(shí)體)-業(yè)務(wù)(完井生產(chǎn)業(yè)務(wù)數(shù)據(jù))的關(guān)聯(lián)模式,以達(dá)到信息集成的目的。基于以上分析,本節(jié)根據(jù)元模型驅(qū)動(dòng)理論與技術(shù),結(jié)合實(shí)際完井信息集成需求,以油田完井業(yè)務(wù)數(shù)據(jù)、GIS空間數(shù)據(jù)以及數(shù)據(jù)之間的關(guān)聯(lián)為基礎(chǔ),構(gòu)建了完井信息集成需要的系統(tǒng)元模型,如圖4所示。

圖4 集成系統(tǒng)元模型
系統(tǒng)元模型存儲了用戶權(quán)限信息、右鍵集成菜單信息、完井生產(chǎn)中出現(xiàn)的實(shí)體的問題信息等,用戶權(quán)限模型設(shè)計(jì)的好處是為滿足不同用戶對系統(tǒng)業(yè)務(wù)功能的需求提供了便利,通過授權(quán)機(jī)制就可完成,可以通過對某個(gè)角色進(jìn)行授權(quán),或者對特定的用戶進(jìn)行直接授權(quán),不需要改變程序代碼,保證了系統(tǒng)的靈活性;右鍵集成模型存儲了菜單組織方式、集成函數(shù)和URL等;問題匯總模型存儲的是完井過程中某一環(huán)節(jié)出現(xiàn)的問題信息(問題類型)、出現(xiàn)問題的實(shí)體、問題的具體描述等。
集成系統(tǒng)元模型的設(shè)計(jì)有利于系統(tǒng)的維護(hù)與擴(kuò)展,更有利于系統(tǒng)的推廣。通過使用元數(shù)據(jù)描述集成系統(tǒng)的用戶、業(yè)務(wù)數(shù)據(jù)、實(shí)體對象、功能間的關(guān)系,對于系統(tǒng)的用戶權(quán)限和業(yè)務(wù)處理功能實(shí)現(xiàn)了維護(hù)的靈活性,元數(shù)據(jù)的使用也增強(qiáng)了系統(tǒng)的擴(kuò)展性。
中間件在應(yīng)用時(shí)必須有能夠在分布式環(huán)境中使用的通信服務(wù)也就是平臺,目的是為了屏蔽分布式環(huán)境下的異構(gòu)操作系統(tǒng)和網(wǎng)絡(luò)協(xié)議,根據(jù)這種服務(wù)(平臺)實(shí)現(xiàn)的不同機(jī)制與使用的不同目的,主要有三類,分別為用于遠(yuǎn)程過程中調(diào)用的中間件、主要針對消息使用的中間件、基于對象請求代理的中間件。中間件可以向我們提供各種各樣的通訊服務(wù),例如:訂閱發(fā)布、同步、廣播、排隊(duì)等,此外,我們還可以充分利用這些平臺,搭建多種類型的構(gòu)架,實(shí)現(xiàn)事務(wù)處理監(jiān)控器以及對象事務(wù)管理器等不同應(yīng)用下的功能,實(shí)現(xiàn)分布式多源數(shù)據(jù)的訪問。中間件的存在使我們只需重點(diǎn)關(guān)注構(gòu)架相關(guān)的要素即可,只需把描述這些要素的代碼準(zhǔn)備好,因?yàn)橹虚g件幫助屏蔽了平臺之間的異構(gòu)性,加之構(gòu)架已經(jīng)定義了系統(tǒng)結(jié)構(gòu)和相應(yīng)的組件,在構(gòu)架要素有所變化時(shí)這些代碼就會(huì)產(chǎn)生作用。在此時(shí)這種應(yīng)用情景下,用戶所需要考慮與注意的地方很少,所有事情全部可以經(jīng)由構(gòu)架搞定。程序無需關(guān)注其執(zhí)行的流程、系統(tǒng)API如何使用、架構(gòu)的體系、以及架構(gòu)的代碼都可以和構(gòu)架不相關(guān)。綜上所述,中間件的優(yōu)勢顯而易見,且具有多方位、多角度的優(yōu)勢,如實(shí)用性、擴(kuò)展性、移植性等等。
中間件由于其能夠使資源的再利用這一特性,將成為其在軟件構(gòu)件領(lǐng)域的一個(gè)突出使用特點(diǎn),中間件的應(yīng)用使得軟件開發(fā)者能夠迅速地、方便地對應(yīng)用模式進(jìn)行抽取并形成標(biāo)準(zhǔn),是較為顯著的構(gòu)件化特性。
首先,中間件的應(yīng)用使得產(chǎn)品具有良好的兼容性。舉一個(gè)事實(shí)案例說明:有一位BEA的客戶想把自己的系統(tǒng)從IBM平臺轉(zhuǎn)移到Sun平臺,代碼應(yīng)用C語言制作,恰恰由于使用了中間件技術(shù),使得從開始移植到在Sun平臺再次編譯完成只使用了3個(gè)小時(shí),重點(diǎn)是未出現(xiàn)任何其他錯(cuò)誤,既快速又便捷。由此我們可以看到,無論是在多種不同的操作系統(tǒng)、硬件平臺和網(wǎng)絡(luò)數(shù)據(jù)庫產(chǎn)品還是在客戶端,基于中間件的不同種類的產(chǎn)品都具有且保持了極好的兼容效果。
其次,中間件使系統(tǒng)更加穩(wěn)定,降低了系統(tǒng)模塊之間交互帶來的風(fēng)險(xiǎn)。
另外,開發(fā)者都期望達(dá)到軟件的開發(fā)成本預(yù)算少、開發(fā)效果好的目的。中間件的使用使得這一期望成為現(xiàn)實(shí)。在軟件程序的實(shí)際開發(fā)中,程序各部分所占的比例不同對軟件的開發(fā)成本與效率影響很大,一般情況下,業(yè)務(wù)邏輯和應(yīng)用部分占三成,基礎(chǔ)功能占七成,應(yīng)用中間件以后,其簡化邏輯操作、提高基礎(chǔ)功能復(fù)用性的優(yōu)點(diǎn)顯而易見。
最后,中間件的合理利用對軟件整體的競爭性發(fā)展也起到了促進(jìn)作用,因?yàn)橹虚g件的使用使得開發(fā)人員能夠集中精力在軟件的特色功能研發(fā)方面,避免或縮短了工作量大且累人的軟件開發(fā)周期,有利于軟件在市場中的迅速應(yīng)用與盈利,同時(shí)提高了軟件的競爭性。
本文研究的完井信息集成是通過使用中間件技術(shù)實(shí)現(xiàn)WebGIS與完井的信息之間的交互集成的。使用中間件的目的是為了將各集成模塊關(guān)聯(lián)起來,屏蔽各集成模塊之間的各異性。通過對現(xiàn)有完井信息管理系統(tǒng)功能的分析,系統(tǒng)中的參數(shù)主要通過URL和Session方式傳遞。中間件在信息集成中起到的是雙向數(shù)據(jù)的傳遞與轉(zhuǎn)換的作用,具體的實(shí)現(xiàn)方式是通過建立中間件映射表(該表中包括了URL地址、參數(shù)及參數(shù)值等信息的映射關(guān)系)并對中間映射表中的信息進(jìn)行讀取再轉(zhuǎn)換成URL或者Session值來實(shí)現(xiàn)信息的集成轉(zhuǎn)換。基于中間件技術(shù)的集成方法,如圖5所示。
根據(jù)圖5可知中間件的執(zhí)行流程如下:用戶登錄系統(tǒng)后,與WebGIS進(jìn)行交互,進(jìn)而發(fā)起請求,該請求經(jīng)由中間件發(fā)送到現(xiàn)有的完井信息管理系統(tǒng),該系統(tǒng)進(jìn)行了分析后將傳遞的相關(guān)參數(shù)發(fā)送給中間件,中間件再將參數(shù)傳遞給WebGIS,WebGIS最終依據(jù)傳遞過來的參數(shù)在瀏覽器中展示相應(yīng)的功能視圖給用戶[12-14]。其中,實(shí)體與功能的對應(yīng)關(guān)系、需要傳遞的參數(shù)、函數(shù)等都保存在中間件中,中間件實(shí)現(xiàn)了現(xiàn)有的完井信息管理系統(tǒng)與WebGIS的合理集成與融合。比如在對右鍵集成菜單進(jìn)行集成研究時(shí),用戶與地圖進(jìn)行交互點(diǎn)擊井實(shí)體,進(jìn)而觸發(fā)函數(shù)事件,系統(tǒng)將井號和展示的菜單項(xiàng)名稱發(fā)送給中間件,經(jīng)過中間件解析與匹配后便對應(yīng)了現(xiàn)有系統(tǒng)中的井號和菜單所鏈接的功能頁面,最后在現(xiàn)有系統(tǒng)中根據(jù)該井號進(jìn)行相關(guān)業(yè)務(wù)處理操作,將功能處理后的結(jié)果返回給WebGIS呈現(xiàn)給用戶。

圖5 基于中間件技術(shù)的集成方法
本文的研究內(nèi)容已實(shí)際應(yīng)用在采油廠完井中,綜合了采油廠完井各項(xiàng)關(guān)鍵業(yè)務(wù),實(shí)現(xiàn)了完井業(yè)務(wù)多領(lǐng)域分散信息的歸一化,促進(jìn)了各部門間對完井業(yè)務(wù)數(shù)據(jù)信息的共享與高效管理,這正是本文研究的目的、意義與價(jià)值所在。此外,該信息集成框架的應(yīng)用在很大程度上消除了以往完井各領(lǐng)域各自獨(dú)立且形式各異的管理方式所帶來的完井信息一體化綜合管理的難題,實(shí)現(xiàn)了完井業(yè)務(wù)在各部門間的無縫銜接與集成,同時(shí)使得系統(tǒng)易于擴(kuò)展與維護(hù),為后續(xù)業(yè)務(wù)功能的增加與變更帶來便利;通過完井業(yè)務(wù)的直觀展示與管理,改變了傳統(tǒng)手工設(shè)計(jì)、紙質(zhì)或電子表格傳輸?shù)托实墓芾矸绞剑黠@大幅度提高了對完井整體施工進(jìn)度的把控與信息管理的效率。
系統(tǒng)已經(jīng)投放在大慶油田采油三廠的工技大隊(duì)、地質(zhì)大隊(duì)、生產(chǎn)運(yùn)行部和基建等業(yè)務(wù)部門運(yùn)行,并且對大慶油田多個(gè)開發(fā)區(qū)塊的井進(jìn)行了系統(tǒng)應(yīng)用實(shí)踐,同時(shí)緊密結(jié)合大量完井不同領(lǐng)域、不同權(quán)限用戶的反饋意見,根據(jù)實(shí)際需求進(jìn)行了完善與改進(jìn),目前運(yùn)行情況良好,由此證明了本文的研究具有實(shí)際應(yīng)用價(jià)值與理論研究意義。
[1] 許永濤.基于E-R-P建模體系的政務(wù)信息資源元數(shù)據(jù)模型和應(yīng)用的研究[D].大連:大連理工大學(xué),2008.
[2] Liu, Xiaozhong. Generating metadata for cyberlearning resources through information retrieval and meta-search [J]. Journal of the American Society for Information Science, 2013, 64(4):771-786.
[3] Brigitte, Jaakko Lappalainen, Kostas Kastrantas. Modeling the Semantics of Contextual and Content-specific Research Metadata using Ontology Languages:issues on combining CERIF and OWL [J]. Procedia Computer Science, 2012(9):1563-1570.
[4] 郭容寰,毛煒青.基礎(chǔ)地理信息元數(shù)據(jù)的管理和應(yīng)用[J].測繪與空間地理信息,2007(3):75-78.
[5] Yimin Zhu, Mehmet Emre Bayraktar, Shu-Ching Chen. Application of metadata modeling to dispute review report management [J]. Journal of Civil Engineering and Management. (Text in English; Abstracts in Lithuanian, Russian), 2010, 16(4):491-498.
[6] Lee Jung Yeoun. A Study on Modeling Metadata and Developing Standard Elements to Establish Oral History Archives [J]. Journal of the Korean society for information management, 2009, 26(1):163.
[7] Yongmin Yan, Tracy McLane. Metadata management and revision history tracking for spatial data and GIS map figures [C]. COM.Geo '12 3rd International Conference on Computing for Geospatial Research and Application, Reston, VA, USA, 2012, 7:1-3.
[8] Wosniok, Christoph, Lehfeldt. A metadata-driven management system for numerical modeling [C]. Oceans - San Diego, San Diego, CA, USA, 2013, 9:23-27.
[9] 黃雯雯.基于元數(shù)據(jù)的WebGIS集成平臺維護(hù)框架研究[D].大慶:大慶石油學(xué)院,2009
[10] 劉偉.基于GIS的城市規(guī)劃決策系統(tǒng)的設(shè)計(jì)與開發(fā)[D].武漢:中國地質(zhì)大學(xué),2014.
[11] 崔珂瑾,程昌秀.空間數(shù)據(jù)模型研究綜述[C].中國地理信息產(chǎn)業(yè)大會(huì),2013.
[12] 馮璐璐,趙偉國.面向?qū)ο蟮腉IS水文水資源數(shù)據(jù)模型設(shè)計(jì)與實(shí)現(xiàn)[J].城市建設(shè)理論研究,2013(32):24-27.
[13] 牛思文.基于中間件技術(shù)的仿真系統(tǒng)構(gòu)造[D].北京:北京化工大學(xué),2007.
[14] Anthony W. Isenor, Tobias W. Spears. Combining the Arc Marine Framework with Geographic Metadata to Support Ocean Acoustic Modeling [J]. Transactions in GIS, 2014, 18(2):183-200.