999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Oracle 11g語義技術的測繪學科分類本體庫構建

2015-07-04 11:50:30孫立志徐洪秀天津市測繪院天津300381
城市勘測 2015年5期
關鍵詞:語義測繪數據庫

孫立志,徐洪秀(天津市測繪院,天津 300381)

基于Oracle 11g語義技術的測繪學科分類本體庫構建

孫立志?,徐洪秀
(天津市測繪院,天津 300381)

摘 要:通過對中國圖書館分類法和中國科學院圖書館圖書分類法及測繪學敘詞表等相關資料的分析,確定本體中的類和定義類的語義關系,基于Protégé工具構建測繪學科信息公共本體、測繪學科分類—中圖法本體及測繪學科分類—科圖法本體,在構建的本體基礎上基于Oracle 11g語義技術構建測繪學科分類本體庫,為進一步語義檢索提供基礎。

關鍵詞:本體;測繪學科分類本體庫;Protégé;Oracle 11g語義技術

1 引 言

隨著信息技術的發展,互聯網已經成為了人們信息交流和知識共享的基礎平臺。測繪學作為一門古老的學科,它主要研究地理信息的獲取、處理、描述和應用,其研究的范圍非常廣,相應的圖書館中的書籍范圍也很廣,內容也很多。在測繪圖書資料的檢索中加入語義技術,可以通過使用本體來提升計算機的理解數據的能力,從詞語所表達的語義層上來認識和處理用戶的檢索請求,從而可以提高圖書資料檢索的查準性和檢全性[1]。本體作為語義技術的基礎,其對信息形式化的表達可以提高信息檢索的性能,因此本體庫的構建成為語義研究的基礎。本體庫構建的是否恰當標準會對語義檢索起到決定的作用[2]。

隨著語義網的發展,眾多公司加入到語義技術的研發當中,出現了一批語義產品。在語義網的眾多語義產品中,Oracle 11g語義技術引入了業內第一個開放式、可伸縮且安全可靠的語義數據管理平臺[3]。TopQuadrant公司的TopBraid語義產品已經與Oracle數據庫11g語義技術集成[4]。Oracle Spatial 11g作為Oracle Database 11g企業版的一部分,引入了一種高效的語義數據管理技術,而這種技術在任何其他的商業或者開源的三元存儲領域都是最先進的[5]。

2 Oracle 11g語義技術

2007年7月Oracle 11g版本正式發布,基于圖標數據模型,可像操作其他對象關系數據類型一樣對RDF三元組進行保存、索引及查詢。在繼承了10g版本中對RDF(Resource Description Framework,資源描述框架)語義支持的同時,進一步擴展了其對RDFS (RDF Schema)、OWL等W3C標準的支持。其特征包括對RDF/ OWL數據和本體的支持,高效執行大數據加載,基于OWL、RDFS和用戶定義規則的進行推理,通過SQL用SPARQL語義圖模式對RDF/ OWL進行查詢,支持虛擬模型,通過Jena Adapter對Java API和SPARQL的支持,用本體輔助通過SQL操作對相關數據進行查詢,提高查詢、加載和推理的工作性能,能夠處理超過10億的元組等特征。2009年9月Oracle公司發布了期待已久的Oracle 11g Release2,對于Oracle數據庫語義技術有了新的突破。在Oracle Spatial 11g Release2中語義數據庫有了新的特征,包括用虛擬私人數據庫來提供元組文字安全和標簽安全的支持,基于流行自然語言工具為文檔建立語義索引,用一個RDF圖將管理變成表達元組,并行增加推理和優化owl:sameAs,OWL 2 RL/ RDF規則支持,SPARQL過濾器及Union語句等特征[6]。

2.1Oracle 11g語義技術優點

Oracle數據庫11g語義技術使企業數據更靈活,其對語義數據模型的管理帶來了超越基于文件或特殊的語義數據管理方法,其優勢如下[7,8]:

(1)成本低廉:所有語義應用程序都可以與其他應用程序組合并將其部署到企業級數據庫中,這樣會降低用戶使用成本;Oracle支持SOA(Service-Oriented Architecture,面向服務的體系架構),從而使用戶在進行web開發時不需要安裝和維護桌面客戶端軟件,也不用將語義數據的存儲和管理在企業級數據庫外分開。

(2)風險較低:用戶可以選擇在任何服務器平臺上部署應用程序,并使用已有的資源來管理已部署的應用程序。由于RDF和OWL模型以及其他類型的數據可以通過Oracle 11g語義技術直接集成到Oracle數據庫企業級管理系統,所以可以提高應用的綜合性能、可擴展性能及安全性能。

(3)回報較高:用戶可以通過Oracle 11g的RAC技術實現更大數量的用戶對應用程序的訪問,而只需通過互聯網不用增加任何的組織費用。

(4)性能較好:Oracle 11g數據庫具備了數據庫行業領先的安全性能和可擴展性能,Oracle Spatial 11g作為Oracle 11g企業級數據庫的一部分,對于關鍵任務的語義數據模型也具備這樣的性能,其能夠管理TB級的RDF數據集,數據集的服務群體范圍從幾萬到數萬用戶。

(5)開放式結構:一些主流語義軟件工具供應商已經宣布對Oracle 11g數據庫的RDF/ OWL數據模型的支持,其中包括TopBraid公司[9]。此外,許多主流開源工具提供了與Oracle 11g語義技術集成的插件支持。

2.2Oracle 11g語義技術功能

Oracle數據庫語義技術作為Oracle Spatial 11g的一部分,基于RDF/ RDFS/ OWL/ SKOS標準,將語義數據的存儲引領到一個開放式、可伸縮的、安全可靠、高效率的對RDF和OWL數據存儲的應用平臺。圖1描述了Oracle 11g的語義功能。這些語義數據庫能夠對RDF/ OWL數據和本體提供存儲、加載并且數據操作語言DML ( Data Manipulation Language),用RDFS、OWL,SKOS和用戶定義的規則進行推理,通過SQL用SPARQL圖方式對RDF/ OWL及本體進行查詢,并且可以用本體輔助查詢企業相關數據[10,11]。

圖1 Oracle 11g語義功能

3 測繪學科信息公共及分類本體的構建

通過咨詢武漢大學圖書館專家得出本體構建所依據的參考資料,對資料進行分析,在基于Protégé工具生成本體。

3.1本體領域的參考資料

中國圖書館分類法,1999年由北京圖書館出版社出版第4版,共分為5個基本部類,下分22個大類,標記采用漢語拼音字母與阿拉伯數字相結合的混合制號碼,嚴格按小數制方式排列。中國圖書館分類法通行中國內地圖書館,幾乎全部的中學、小學、大學、研究機構以及出版社都是用中國圖書館分類法。武漢大學圖書館也逐步將正在使用的其他分類方法逐步統一到中國圖書館分類法。本文中將此分類法簡稱為中圖法。中國科學院圖書館圖書分類法,1958年由中國科學院圖書館編寫,共分5大部25大類,標記采用阿拉伯數字,號碼分兩部分:大類及其主要類目采用00-99的順序數字,細分類采用小數制。目前,武漢大學圖書館部分子圖書館還采用的是中國科學院圖書館圖書分類的方法進行對圖書的劃分。本文中將此分類法簡稱為科圖法。

測繪學科敘詞表是2000年,全國測繪科技信息網在國家測繪局及總參測繪局的支持下,組織中國測繪科學研究院、原武漢測繪科技大學等單位的有關專家、學者編制的敘詞型檢索語言工具。該敘詞表由字順表、等級索引表、范疇分類索引表及英漢索引表四部分組成,共收錄敘詞三千余條。

3.2分析領域資料并基于Protégé工具生成本體

測繪學科信息公共本體以中圖法和測繪敘詞表為參考資料,測繪學科分類—中圖法本體以中圖法為參考資料,測繪學科分類—科圖法本體以科圖法為參考資料。三種本體的類分別來自于相應分類法中的學科概念,本體的層次關系來自于相應分類法中的概念層次關系。由于中圖法和科圖法范圍很大,本文中只選取測繪學科的部分進行研究。

分析相關資料并咨詢圖書館專家可以得出,每種分類法概念存在著明顯的包含關系,例如:P2測繪學包含P23攝影測量與遙感;兩種分類法概念之間存在著映射關系,例如:中圖法中的P2測繪學和科圖法中的56.1測繪學存在著映射關系;在測繪學科內,學科之間也存在著各種聯系,例如:P23攝影測量與遙感與P207測量誤差與測量平差存在著聯系;通過對中圖法和科圖法分析可知,分類號是學科概念的唯一標識,可將分類號作為概念的屬性分別添加到三個本體中;敘詞對用戶搜索起到一定的指導作用,可以將敘詞按照學科類別添加到測繪學科信息公共本體中;敘詞的英文翻譯對用戶搜索時輸入英文關鍵字起到作用,可以將敘詞的英文翻譯按照學科類別添加到測繪學科信息公共本體中;作者和出版社信息對于語義檢索起到一定的作用,可以通過從圖書數據中抽取,推薦給用戶使用,可以將抽取得到的信息按照學科類別添加到測繪學科信息公共本體中。

本文本體的描述語言為OWL語言,所以用Protégé工具建立本體最重要的是建立好以下三部分: Individuals、Properties及Classes[12]。Individuals,個體,代表一個領域里面的對象,可以理解成一個類的實例(instances of classes)。在測繪學科信息公共本體中,將敘詞表作為所屬學科的實例添加到本體中,例如將“中誤差”作為“測量誤差與測量平差”學科的一個實例添加到本體中。Properties,屬性,其真正含義不和面向對象編程語言中的屬性一樣,它的真正含義是2個個體之間的雙重聯系,例如“攝影測量與遙感”與“地理信息系統”學科間存在關聯關系,可以用have_relate _to表示。Classes,個體的集合,它是一系列概念的語義表達,和編程語言中的類非常相似,有繼承體系,每一個學科在本體中為一個類,學科間的包含關系以“子類”表示[13],例如攝影測量與遙感為測繪學的子類。圖2為在protégé工具中生成的測繪學科分類—中圖法本體結果,從圖中左邊紅框區域可以看出本體的層次結構,其中選擇舉例的為“攝影測量學與測繪遙感”類,右面分別顯示了該類的label屬性,即中圖法分類號;SuperClasses為它的父概念,此處為“測繪學”;Disjoint classes為它的兄弟概念,表示同一層次上沒有任何關系的類。

圖2 測繪學科分類—中圖法本體

圖3 測繪學科分類—中圖法本體層次結構圖顯示

圖3給出了基于Protégé OWLViz插件顯示的論文中所建立的測繪學科分類—中圖法的類的層次結構顯示,左邊區域為整個本體的效果顯示,但由于界面截圖大小的限制,將其縮小到可以在一個頁面進行截圖,然后對某個小區域進行放大得到右面的清晰結構。其中右面的放大區域是左面的類層次結構的一部分,即為紅框框住區域的放大顯示。

4 基于Oracle 11g語義技術構建測繪學科分類本體庫

一個語義庫只有一個語義數據網絡,但一個語義網絡可以有多個語義模型,每個語義模型又對應著一個語義表,本文將構建支持測繪圖書檢索的語義網絡,該網絡包括測繪學科信息公共本體(scopea)、測繪學科分類—中圖法本體(CLCA)及測繪學科分類—科圖法本體(ZLCA)模型。語義模型的構建過程可分為創建存儲RDF數據的模型、數據規范化和將語義數據載入模型三個步驟。下面將以測繪學科分類本體(CLCA)為例子來對構建模型的過程進行描述。

4.1創建存儲RDF數據的模型

創建存儲RDF數據的基礎架構和模型,具體步驟為:①創建表空間,用以存儲語義網支持;

②創建語義數據網絡:SEM_APIS.CREATE_SEM_ NETWORK(tablespace_name),其中表空間名與上步驟創建的表空間匹配;

③創建表空間用于存儲用戶對象,創建臨時表空間用于存儲用戶臨時操作;

④創建用戶seruser/ seruser,并授予用戶必要的權限(create session,resource);

⑤以上一步驟創建的用戶連接數據庫,創建語義數據表service_rdf_CLC_data,用以存儲CLCA語義模型中的三元組數據;表包括兩個字段:id number,triple sdo_rdf_triple_s;

⑥創建語義模型:sem _apis.create _sem _model (model _name,table _name,column _name,model _tablespace);其中model _ name即為模型名,此處為CLCA。table_name為語義數據表名稱,為上一步驟創建的語義數據表,column_name為表中的列名,此處為triple。

⑦重復⑤和⑥的操作分別創建語義數據表ZLCA_ TPL和語義模型ZLCA。

⑧重復⑤和⑥的操作分別創建語義數據表SCOPEA_TPL和語義模型scopea。

4.2將Protégé生成的OWL數據規范化并載入模型

采用Jena插件將基于Protégé生成的OWL數據表示成為N-Triple類型的數據。然后將語義數據載入到語義模型,在該本體導入語義庫時,采用Oracle 11g提供的Bulk load方法導入。具體步驟為:

①將Jena包解壓到本地,然后設置相應的環境變量。

②Protégé建立本體后的表現形式為owl數據,要將其轉換為三元組形式。在進入DOS環境執行相應的轉換命令,命令為rdfcopy {source}>{ target}, source為要轉的owl數據的絕對路徑,target為轉換成三元組形式的數據的絕對路徑。

③以上面創建語義模型步驟中創建的用戶來連接數據庫。創建臨時表Staging table,包括的字段為RDF $ STC_sub RDF $ STC_pred RDF $ STC_obj RDF $ STC _sub_ext RDF $ STC_pred_ext RDF $ STC_obj_ext RDF $ STC_canon_ext;

④授予mdsys對語義數據表service_rdf_CLC_data的插入權限,此外,授予mdsys對stable表的選擇、更新權限;

⑤用sqlloader將n-triple數據載入到臨時表中,進入DOS環境執行相應的命令,命令為sqlldr userid= seruser/ seruser control=E: df_demosulkload.ctl data =e:all.nt direct =true skip =0 load =1000000 discardmax=0 bad=d0.bad discard =d0.rej log =d0.log errors =10000000;其中userid即為創建語義模型的用戶名及密碼,data為要載入到語義模型中的三元組數據。

⑥將數據從臨時表載入到語義模型。用SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE(model_ name,table_owner,table_name);,其中model_name即為語義模型名稱,table_owner為創建語義數據表的用戶,table_name為語義數據表的名稱。

⑦重復②~⑥步驟,將測繪學科分類—科圖法本體數據規范化并載入到語義數據模型中。

⑧重復②~⑥步驟,將測繪學科信息公共本體數據規范化并載入到語義數據模型中。

4.3顯示構建成果

采用上述方法,論文中共構建3個語義網模型scopea、CLCA、ZLCA,分別是測繪學科信息公共本體、測繪學科分類—中圖法本體、測繪學科分類—科圖法本體。已創建的測繪學科本體庫結構示意圖如圖4所示。一個數據庫只能構建一個語義網,這里Sem_Net-Work表示已構建的支持測繪圖書檢索的語義網。語義網里有三個語義網模型,每個語義網模型對應著一個語義數據表。scopea模型對應著SCOPEA_TPL語義數據表,SCOPEA_NS為命名空間表。CLCA模型對應著SERVICE_RDF_CLCA_DATA語義數據表,CLCA _NS為命名空間表。ZLCA模型對應著ZLCA_TPL語義數據表,ZLCA_NS為命名空間表。

圖4 測繪學科本體庫構建示意圖

5 結 語

本文通過對測繪學科分類領域資料的分析,介紹測繪學科本體庫的構建方法,并在此基礎上基于Oracle 11g語義技術構建測繪學科本體庫,為測繪圖書語義檢索研究提供基礎,且該本體庫的構建方法可以為其他方面構建本體庫提供參考借鑒。

參考文獻

[1] 鄭任凡.基于本體的語義檢索技術研究[D].上海:華東師范大學.2007.

[2] 李宏偉.基于Ontology的地理信息服務研究[D].鄭州:解放軍信息工程大學,2007.

[3] Murray C.Oracle Database Semantic Technologies Developer’s Guide[EB/ OL].(2009-09-03).http:/ / download.oracle.com/ docs/ cd/ B28359_01/ appdev.111/ b28397.pdf

[4] Quadrant T.Getting Started Guide[EB/ OL].(2007-07-21).http:/ / www.topquadrant.com/ composer/ docs/ TBCGetting-Started-Guide.pdf.

[5] Zhe Wu, George Eadon, Souripriya Das, Eugene Inseok Chong,Vladimir Kolovski,Melliyal Annamalai,Jagannathan Srinivasan.Implementing an Inference Engine for RDFS/ OWL Constructs and User-Defined Rules in Oracle[A].In: 2008 IEEE 24th International Conference on Data Engineering[C].Cancun,Mexico,2008:1239~1242.

[6] Mills Davis.Semantic Wave Report:Industry Roadmap to Web 3.0 & Multibillion Dollar Market Opportunities[EB/ OL].http:/ / www.project10x.com,2010-5-4.

[7] Eric Lai.Oracle’s Semantic technology catching on [EB/ OL].http:/ / www.computerworld.com/ s/ article/9020958/ Oracle_s_semantic_technology_catching_On,2007-5-23.

[8] Zhe Wu.The Semantic Web for Application Developers [EB/ OL].http:/ / download.oracle.com/ otndocs/ tech/ semantic_web/ pdf/ oow2007_semantics_forappdev_k.pdf,2010 -5-3.

[9] The Protégé Project.http:/ / protege.standford.edu/

[10] Xavier Lopez,Souripriya Das.Why,When,and How to Use Oracle Database 11g Semantic Technologies[EB/ OL].http:/ / www.oracle.com/ technology/ tech/ semantic_technologies/ index.html,2008-11-23.

[11] Zhe Wu.Oracle Semantic Technologies Inference Best Practices with RDFS/ OWL[EB/ OL].http:/ / www.oracle.com/ technology/ tech/ semantic_technologies/ pdf/ semantic _ infer_bestprac_wp.pdf,2008-2.

[12] 鄧志鴻,唐世渭,張銘等.Ontology研究綜述[J].北京大學學報·自然科學版,2002,38(5):730~738.

[13] 肖敏.領域本體的構建方法研究[J].情報雜志,2006 (2):70~71,74.

The Construction of Surveying and Mapping Science Classification Ontology Based on Oracle 11g Semantic Technology

Sun Lizhi,Xu Hongxiu
(Tianjin Institute of Surveying and Mapping,Tianjin 300381,China)

Abstract:Through the analysis of China Library Classification and Classification China Academy Library and the surveying and mapping science thesaurus and other related information,determine the ontology classes and define the semantic relations of ontology classes,build surveying and mapping science information public ontology,surveying and mapping science classification- China Library Classification ontology,surveying and mapping science classification- Classification China Academy Library ontology based on the Protégétools,build surveying and mapping science classification ontology used the construction ontologybased on oracle 11g semantic technology,which provides the basis for further semantic retrieval.

Key words:ontology;surveying and mapping science classification ontology ; protégé;oracle 11g semantic technology

文章編號:1672-8262(2015)05-11-05中圖分類號:P20,P208

文獻標識碼:A

收稿日期:?2015—05—13

作者簡介:孫立志(1986—),男,工程師,碩士,主要從事WebGIS開發等技術工作。

基金項目:國家自然科學基金資助項目(40971243)

猜你喜歡
語義測繪數據庫
語言與語義
浙江省第一測繪院
工程測繪中GNSS測繪技術的應用
04 無人機測繪應用創新受青睞
無人機在地形測繪中的應用
電子制作(2017年9期)2017-04-17 03:01:00
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 国产黄视频网站| 国产丝袜91| 五月婷婷激情四射| 狼友av永久网站免费观看| 五月婷婷综合色| 亚洲天堂网在线播放| 91在线中文| 亚洲另类国产欧美一区二区| 日韩在线观看网站| 国产亚洲视频中文字幕视频| 美女毛片在线| 国产精品思思热在线| 精品久久蜜桃| 秘书高跟黑色丝袜国产91在线| 日本国产精品| 毛片一区二区在线看| 欧美激情第一欧美在线| 国产在线精品美女观看| 国内精品久久久久久久久久影视 | 漂亮人妻被中出中文字幕久久| 亚洲va欧美va国产综合下载| 欧美亚洲欧美| 国产精品无码在线看| 欧美精品啪啪一区二区三区| 欧美国产日本高清不卡| 日韩中文字幕免费在线观看| 国模极品一区二区三区| 亚洲色图欧美在线| 亚洲国产看片基地久久1024 | 久久久久亚洲精品无码网站| 国产综合精品一区二区| 蜜臀av性久久久久蜜臀aⅴ麻豆| 免费一级α片在线观看| 欧美福利在线| 88av在线| 天堂成人在线| av一区二区三区高清久久| 四虎综合网| 91娇喘视频| 人妻21p大胆| 青青草原国产av福利网站| 一本大道AV人久久综合| 一级成人a做片免费| 日本手机在线视频| 国产精品3p视频| 自拍偷拍欧美日韩| 老色鬼久久亚洲AV综合| 四虎成人免费毛片| 亚洲成aⅴ人在线观看| 激情成人综合网| yjizz国产在线视频网| 日本爱爱精品一区二区| 高清免费毛片| 欧美亚洲国产视频| 999在线免费视频| 亚洲床戏一区| 免费网站成人亚洲| 国产jizzjizz视频| 3p叠罗汉国产精品久久| 亚洲国产天堂久久九九九| 黄色网页在线观看| 毛片免费在线| 国内精品一区二区在线观看| 国内熟女少妇一线天| 亚洲色无码专线精品观看| 成人在线视频一区| 亚洲AV一二三区无码AV蜜桃| 国产三级精品三级在线观看| 欧美日韩精品在线播放| 91亚洲精选| 色天天综合| 日韩欧美国产三级| 素人激情视频福利| 九九精品在线观看| 国产精品亚洲专区一区| 久久婷婷国产综合尤物精品| 999国内精品久久免费视频| 日韩国产亚洲一区二区在线观看| 91精品国产麻豆国产自产在线| 97久久精品人人做人人爽| 在线日本国产成人免费的| 亚洲Va中文字幕久久一区|