李華昱,張培穎,肖 晗
(中國石油大學(華東)計算機與通信工程學院,山東青島 266580)
?
基于抽取規則和本體映射的領域XML語義集成
李華昱,張培穎,肖晗
(中國石油大學(華東)計算機與通信工程學院,山東青島266580)
油氣井工程領域中存在大量的XML文檔,傳統的XML集成方案無法提供面向語義的信息查詢,導致數據利用率不高。針對油氣井XML文檔WeXML語義集成與查詢應用需求,提出一種基于抽取規則和本體映射的語義集成方法。首先定義一系列類、屬性抽取規則,分別將WeXMLSchema中的元素、屬性映射為WeOWL本體中的類和屬性;然后,利用實例轉換算法將WeXML文檔轉換為本體實例數據;由于WeOWL提供有限的局部語義模型,需要在兩者之間建立語義映射,并借助WeOWL中的術語對全局語義模型中的類和屬性進行解釋,進而提供面向領域全局本體的語義查詢。通過構建WeXML數據語義集成原型系統,對提出的轉換規則、轉換算法和映射規則進行了驗證。
計算機信息管理系統;抽取規則;本體映射;領域XML;語義集成
XML是領域數據重要的信息表示和存儲形式,也是應用系統之間進行數據交換的主要標準。然而,由于XML缺乏足夠的語義信息,傳統的XML集成方案無法提供基于領域術語的語義查詢,而利用語義Web與本體技術,對XML文檔進行語義集成,是一種有效的解決方案,也是領域數據集成的研究熱點之一。
目前,XML語義集成主要采用2類方法:1)定義一系列映射規則,從XML文檔或XMLSchema中抽取本體,并利用映射信息將XML數據轉換為本體實例數據,再通過構建基于語義的查詢訪問接口,實現語義集成?!?br>