999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多層領域本體的知識表示通用模型研究

2020-06-09 07:21:38李金海何有世馬云蕾周愛平
計算機工程與應用 2020年11期
關鍵詞:語義概念模型

李金海,何有世,馬云蕾,周愛平,3

1.泰州學院,江蘇 泰州225300

2.江蘇大學 管理學院,江蘇 鎮江212013

3.東南大學 計算機網絡與信息集成教育部重點實驗室,南京211189

1 引言

知識表示是知識管理的基礎,知識表示模型直接決定了知識管理的有效性。目前大多數信息系統主要是基于關鍵詞對知識進行管理的,在知識的管理過程中,沒有考慮到知識所蘊涵的語義關系,導致了知識檢索結果的查全率及查準率都不能令用戶滿意[1]。而知識表示方法直接影響到知識檢索的準確率以及知識的重用效果[2]。

關于知識表示的方法主要有面向對象、語義網絡以及基于本體[3-4]等。與其他表示方法相比,基于本體的知識表示方法保證了知識理解的唯一性,同時能夠適應信息系統涉及的知識領域多樣性以及語義關系復雜性的特點,因此,該方法已成為知識表示的主要方法[5-7]。本文將本體知識引入到知識表示模型,通過本體最大程度的挖掘知識的語義。目前,基于本體的知識表示已得到了一定的研究,如,李曙光等針對企業特定領域內的信息資源,基于本體理論研究信息分類編碼方法,并實例化本體生成需要的信息編碼,為信息資源的組織提供了框架[8]。Brandt等通過本體知識表示數據倉庫中數據的調用知識以及產品設計過程中的經驗知識[9]。朱海華等構建了基于本體的產品服務知識管理系統,該系統能實現產品服務活動案例所涉及知識的獲取與重用[10]。王力等提出一種產品設計知識的本體構建方法,基于此構建了基于本體的產品設計知識表示模型,該模型提高了產品設計知識共享與重用效率[11]。

雖然基于領域本體的知識表示方法具有較強的可理解性與可擴展性,能夠形式化地描述某一領域的知識,在針對單一領域知識的系統中得到了很好的應用,而多領域知識的集成是未來的方向,如涵蓋各類商品的電子商務平臺,各類商品的知識間有著各自的特殊性,基于單一領域本體難以表示出所有商品的信息。但是若通過不同的領域本體來表示各類商品知識,將有礙于系統中本體知識的調用;另一方面,假如用戶需要的信息涉及多個領域的知識,由于各領域知識組織形式的不同,此時只能對各領域知識分別進行檢索,這會極大地降低信息檢索的效率?;诖?,將研究領域本體的整合,構建通用型的本體模型,使得各領域的知識可以通過通用本體進行表示,有利于復雜信息系統中信息的有效組織以及信息的準確檢索。

2 知識表示的需求分析

目前信息系統中信息資源大多通過關系型數據庫來表示,關系型數據庫有利于結構化信息的表示,但缺乏對非結構化信息的表示;并且沒有完整的語義模型,缺乏對包含復雜語義信息的知識的支持能力[12]。

2.1 知識表示的特點

無論是網絡購物信息系統還是管理信息系統都不再是單一領域的集合,而是多領域的重構。并且多領域知識重構的特點不僅在信息系統的構建過程中可以得到體現,在信息系統的使用中也能得以體現[13]。

在宏觀層面上,信息系統的設計涉及多個組織,每個組織包括不同部門、而部門內各員工的知識背景存在差異。由于企業職能的多元化,信息系統在使用過程中,需要面對不同領域,信息系統的使用也涉及多領域知識。

在微觀層面上,信息系統的設計所需知識來自多學科多領域,且存儲方式異構,為了知識概念與語義的統一,信息系統的設計需要一種能兼容多領域知識的知識表示方式。并且,信息系統在實際使用過程中,由于用戶需求的多樣化,信息系統需要有效理解不同領域知識間的概念與語義關系。

2.2 多層領域本體

本文的思路是通過通用的本體構建模型來確保各領域知識在語義層面上的統一[14]。頂層本體作為領域本體的參考依據,它揭示了領域知識在更高語義層次上的關系[15]。但是,在諸多領域本體的構建研究中,忽視了頂層本體提供的上層語義知識[13],為領域本體之間多領域知識的互通帶來難題。

基于頂層本體的上層語義關聯,構建多層領域本體模型,統一各領域本體的構建,規范各領域知識的共享與重用。

多層領域本體從多個層面對不同層次的知識體系進行描述,基于本體各層次概念面向的不同層次的知識體系以及自頂而下的本體構建原則,本文構建了四層領域本體,四層領域本體的各層概念及層次關系如圖1所示。

上層本體的構建基于頂層本體,繼承了頂層本體中的實體與關系,并按照實體粒度擴展子類體系,描述了具有領域特征的上層類和關系,起到了銜接頂層及應用本體的功能;針對具體領域,依據明確的領域需求與應用目標,構建能夠較為全面描述該領域知識的應用本體;而實例本體則通過應用本體類的匹配與映射,實現具體領域的實例集成。

3 多層領域本體的構建

傳統的領域本體只能表示具體領域中概念及關系,不能表示多個領域中概念集的共有屬性以及概念間的普遍關系,割裂了領域間知識的普遍聯系,不利于領域知識的復用以及整合。針對基于領域本體的多領域知識表示的不足,本文構建了多層領域本體通用模型,用于多領域知識的表示,圖2為由頂層本體、上層本體、應用本體、實例本體組成的四層本體架構的多層領域本體模型框架。

圖1 多層領域本體的層次關系圖

圖2 多層領域本體的模型框架

3.1 頂層本體的構建

作為適用于各領域構建領域本體的普適框架,在信息系統的知識表示中,頂層本體能適應不同領域需求的變化,能夠用于各領域知識的共享與重構。頂層框架中的實體不具有領域特征,是對現實世界中的對象從各層面進行的抽象描述。基于已有文獻[16],分析了基于5W1H的頂層本體構建方法,將頂層本體分為六個通用組成模塊,即What-客體模塊、Where-地點模塊、When-時間模塊、Who-主體模塊、Why-原因模塊、How-方法模塊。

通過四元組O=(C,A,R,X)表示概念及概念間的關系,其中,C 表示本體中概念的集合,A 表示概念屬性的集合,R 表示概念間關系的集合,X 表示本體的公理與規則組成的集合。

概念集合C 由5W1H 的六個模塊的概念集合組成,即C=Cwhat∪Cwhere∪Cwhen∪Cwho∪Cwhy∪Chow,為了保證概念非奇異,設Ci ∩Cj=?{i ≠j ∧i,j ∈(what,where,when,who,why,how)}。

Cwhat表示有關研究對象的概念集合,其他五個以此類推。

本體中的概念間的關系R 分為分類關系Rt 與依賴關系Rd,即R=Rt ∪Rd,R ?Ci×Cj(Ci,Cj ∈Cwhat∨Cwhere∨Cwhen∨Cwho∨Cwhy∨Chow)。

分類關系包括繼承關系kind-of 及整體部分關系part-of,依賴關系表示概念間存在的語義關系。

通過Protégé定義頂層本體中的概念、屬性、關系及公理。以When-時間模塊的頂層本體為例,如圖3 所示。時間模塊的頂層本體涵蓋了時間所有的通用概念、屬性以及關系。

圖3 When-時間模塊的頂層本體

3.2 上層本體的構建

上層本體涉及多領域知識,本體的粒度過大,不利于知識的復用、整合及維護[17]。為了解決該問題,研究了模塊化的上層本體構建方法,細化本體構建粒度,通過多領域專家協作、自治構建模塊化本體的基礎上,完成本體的復用、裂變、重組,從而提升通用本體的構建效率及進化能力[18],上層本體的模塊化構建流程[19]如圖4所示。

其中,核心本體、原子本體都是領域本體,原子本體是模塊化本體構建中的最小單位,是構建的基礎,深度不超過a(a >1);而核心本體是模塊化本體構建的骨架,具有子模塊,深度不超過b(b >1)。模塊化本體構建就是將子模型集成到核心本體模型中。具體步驟如下:

圖4 上層本體的模塊化構建流程

步驟1 根據本體的構建目標確定領域范圍。

步驟2 依據領域邊界劃分本體模塊。

步驟3 確定各模塊的核心本體及原子本體。

步驟4 將原子本體模塊集成到核心本體模塊,構建本體模塊。

步驟5 將多個本體模塊集成為一個模塊化本體。

在模塊化本體構建過程中,通過多領域專家的協作管理,保證各領域之間語義的一致性,及模塊化本體的構建質量。

每個上層本體模塊由c 個核心本體與d 個原子本體組成,其中,c=1 或0,d ≥0,即每個上層本體模塊最多包含一個核心本體。若c=0,則上層本體模塊為原子本體模塊;若c=1,則上層本體模塊中至少有一個核心本體是其一個子模塊的根,逐層分解,最終的子模塊為原子本體模塊。以電子產品上層本體為例,其模塊化本體的形成如圖5所示。

圖5 電子產品模塊化本體

3.3 應用本體的構建

應用本體是上層本體的細分領域,依據頂層本體以及上層本體的基礎框架,基于實際的應用場景,分析相關領域的關鍵知識,依次拓展上層本體,構建表示具體應用領域知識的模型。

基于信息系統所涉及的具體領域知識需求,確定知識表示所需要的領域本體,一方面基于主題詞表,制定詞表向本體轉化的映射規則;另一方面將領域中已有本體作為補充資源,通過詞表概念的規范、映射和本體的重用、重構,形成能夠體現領域共有特征的核心概念及關系體系,從而構建用于多領域知識組織和描述的應用本體,形成應用本體的詳細描述文件OWL[20]。

概念體系的構建是應用本體構建的重點工作,主要包括5個部分:

(1)確定本體的核心大類;

(2)確定類的等級關系;

(3)定義類間的關系;

(4)定義類的屬性;

(5)創建類的實例。

應用本體的構建具體流程如圖6所示。

圖6 應用本體的構建流程

以電子產品上層本體中的筆記本應用本體的構建流程為例:

(1)創建筆記本主題詞表

基于TF-IWF算法提取筆記本行業分類標準中的關鍵詞,借助HowNet的標準對關鍵詞進行規范,構建筆記本主題詞表。

(2)確定類的等級體系

基于筆記本應用本體的核心概念,對類的等級體系進行擴展。

(3)定義類的屬性

筆記本應用本體的屬性代表概念的數據特征。

如“存儲設備”類包含3 個屬性:內存容量、硬盤容量以及光驅類型。

(4)定義類間的關系

分析概念與概念之間的關系,定義筆記本領域本體中類間的關系。本體中的關系可劃分為等級關系與非等級關系,主要的類間關系包括:整體-部分關系、同義關系、反義關系、轉指關系、指示關系。

(5)筆記本應用本體的OWL實現

通過Protégé構建筆記本應用本體,以OWL語言作為本體的表示語言,構建的本體由24個類,56個數據屬性以及13個關系組成。

圖7 實例本體的概念集C與關系屬性集R

3.4 實例本體的構建

采用手工構建本體的方法,以OWL 語言作為本體的表示語言,利用protégé 完成實例本體的設計。實例本體的具體創建流程如下:

步驟1 解析應用本體模型的OWL,得到概念模型,獲取對應目標的概念集C。

步驟2 解析應用本體模型的OWL,得到關系模型,獲取與概念集C 相對應的關系屬性集R。

步驟3 設置概念C 相關聯的數據屬性集A,由本體的公理與規則X 約束。

步驟4 將上述的概念集C、關系屬性集R、數據屬性集A,填充到實例本體。

以“筆記本”領域中的聯想Air 13實例為例,為其創建實例本體,其中,概念集C 與關系屬性集R 如圖7所示,數據屬性集A 如表1所示。

表1 實例本體的數據屬性集A

4 基于多層領域本體的語義檢索仿真實驗

基于多層領域本體的知識表示通用模型的有效性通過該模型的語義檢索進行驗證。具體驗證步驟如下:

步驟1 獲取用戶的查詢請求;

步驟2 將查詢的條件與本體庫中的概念進行語義匹配;

步驟3 通過搜索引擎查詢語義索引庫;

步驟4 將檢索結果以一定的相關度進行排序;

步驟5 排序結果返回給用戶。

4.1 語義檢索實驗流程

仿真實驗包括本體管理、語義索引庫、查詢分析及信息檢索四個模塊,如圖8所示。

圖8 語義檢索實驗流程

語義檢索的主要功能是從用戶請求中挖掘出檢索關鍵詞,并將它們傳遞到系統的檢索模塊。仿真實驗中的語義擴展包括同義關系、整體-部分關系及實例關系。將預處理后的查詢條件與語義索引庫中的信息進行匹配,計算兩者的相似度,對相似度不小于閾值α 的檢索結果進行排序,并以合適的形式返回給用戶。

本實驗語義相似度的計算采用基于屬性的Tversky算法,對于檢索關鍵詞M 和待檢索概念N ,Tversky算法如下:

其中,f(M ?N)表示M 和N 的公有屬性個數,f(MN)表示M 有而N 沒有的屬性個數,f(N-M)表示N有而M 沒有的屬性個數,權重β 與γ ∈[0,1],本實驗中設β=γ=0.5。

若相似度Sim(M,N)≥α,則概念N 滿足檢索要求。

4.2 實驗結果分析

為了客觀地評價基于多層領域本體的知識表示通用模型的有效性,在單個領域以及多個領域知識環境下,將其與基于傳統領域本體的知識表示模型以及傳統的關鍵詞知識表示模型進行對比分析。

其中,單個領域選擇應用本體中的筆記本應用本體,多個領域選擇電子產品上層本體中多個應用本體。

在單個領域知識環境下,仿真實驗隨機選取10 個筆記本應用本體內相關主題進行測試;而在多個領域知識環境下,仿真實驗在電子產品上層本體中隨機選取10個不同應用本體內相關主題進行測試。不同領域環境下三種模型在不同的相似度閾值下的語義檢索結果如表2所示。其中,召回率R 與精度P 是衡量檢索效果的兩項重要指標,假設,系統檢索到的相關信息為A,系統檢索到的不相關信息為B,相關但是沒被系統檢索到的信息為C ,不相關且沒有被系統檢索到的信息為D,則召回率R=A/(A+C),精度P=A/(A+B)。

在單個領域環境下,從整體上看,基于多層領域本體的知識表示模型與基于傳統領域本體的知識表示模型的召回率R 與精度P 差異都有限,基于多層領域本體的知識表示模型略高;但相比于基于關鍵詞的知識表示模型,無論是召回率R 還是精度P,基于本體的知識表示模型優勢都較為明顯。這說明在表示單個領域知識時,基于多層領域本體與基于傳統領域本體的知識表示模型,由于不涉及多個領域知識,因此,它們的效果相當;但它們都考慮了概念間的語義關系,因此,較單純的基于關鍵詞的知識表示模型具有明顯優勢。從不同相似度閾值的局部上看,隨著相似度閾值的降低,三種模型的召回率R 都是逐步提升;三種模型的精度P 在相似度閾值取中間值時達到頂峰;并且在相似度閾值取中間值時,三種模型無論是召回率R 還是精度P 之間的差異都最小,這是因為多層領域本體主要功效在于提高查詢請求與相關結果間的相似度,降低與不相關結果間的相似度,從而讓更多的相關結果排在比較靠前的位置,因此在相似度閾值較高或較低時,基于多層領域本體的知識表示模型優勢明顯,在中間相似度閾值時,優勢就不那么顯著了。

在多個領域環境下,從整體上看,不同于單個領域環境,此時,基于多層領域本體的知識表示模型與基于傳統領域本體的知識表示模型的召回率R 與精度P 有著明顯的差異;而基于傳統領域本體的知識表示模型與基于關鍵詞的知識表示模型之間的差異反而降低了。這是由于基于多層領域本體的知識表示模型有利于不同領域知識間的調用與共享,在多領域環境下,基于多層領域本體的知識表示模型的性能才能完全體現;而基于傳統領域本體的知識表示模型的優勢被很大程度上削弱。從不同相似度閾值的局部上看,相比于單個領域,無論是召回率R 還是精度P ,同一相似度閾值下,基于多層領域本體的知識表示模型稍微有所降低,但基于傳統領域本體的知識表示模型與基于關鍵詞的知識表示模型降低得則更為明顯。且隨著相似度閾值的增加,后兩者的召回率R 與精度P 的降低幅度也在增加。說明當系統對相似度要求較高時,基于多層領域本體的知識表示模型較后兩者更適合于涉及多領域知識的系統要求。

5 結論

考慮到傳統的基于關鍵詞的知識管理過程中,沒有分析知識所蘊涵的語義關系,導致了知識檢索結果的查全率及查準率都不能令用戶滿意。因此,分析了基于領域本體的知識表示,但也只能適用于單一領域知識體系,在分析復雜信息系統的知識表示需求基礎上,借鑒頂層本體提供的上層語義知識,構建多層領域本體,并詳細分析了各層本體的構建流程。

最后,通過基于多層領域本體的語義檢索驗證了基于多層領域本體的知識表示通用模型的有效性。仿真實驗結果發現,在單個領域環境下,無論是多層領域本體的知識表示模型,還是傳統領域本體的知識表示模型,二者效果相當,較基于關鍵詞的知識表示模型具有明顯優勢。在多個領域環境下,基于多層領域本體的知識表示模型的優勢得以真正體現,無論是召回率R 還是精度P ,不僅較基于關鍵詞的知識表示模型有顯著優勢,較傳統領域本體的知識表示模型也有顯著優勢。

表2 不同領域環境下三種模型語義檢索性能結果對比表 %

猜你喜歡
語義概念模型
一半模型
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言與語義
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
3D打印中的模型分割與打包
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
主站蜘蛛池模板: 国产天天射| 天天激情综合| 亚洲国产中文欧美在线人成大黄瓜 | 国产天天色| 欧美成人免费一区在线播放| 久久中文无码精品| 国产成a人片在线播放| 亚洲AⅤ波多系列中文字幕| 奇米影视狠狠精品7777| 99热国产这里只有精品无卡顿"| 国产男人的天堂| 亚洲AV人人澡人人双人| 精品国产免费观看| 一级黄色片网| 国产成人AV综合久久| 欧美成人日韩| 伊人久久大香线蕉aⅴ色| 99视频在线看| 在线观看国产小视频| 高清免费毛片| 丰满的熟女一区二区三区l| 成色7777精品在线| 无码一区18禁| 久久久久免费精品国产| 国产主播在线一区| 亚洲香蕉久久| 一级黄色欧美| 在线五月婷婷| 最新亚洲av女人的天堂| 成人免费视频一区二区三区| 天天色天天操综合网| 国产香蕉在线视频| 欧美另类第一页| 手机在线国产精品| 国产美女自慰在线观看| 亚洲AV永久无码精品古装片| 一区二区三区在线不卡免费| 国产免费网址| 亚洲熟女中文字幕男人总站| 亚洲精品制服丝袜二区| 在线精品亚洲国产| 成年人国产网站| 欧美特级AAAAAA视频免费观看| 一本大道AV人久久综合| 亚洲午夜片| 超碰aⅴ人人做人人爽欧美| 99国产精品免费观看视频| 欧美人在线一区二区三区| 看你懂的巨臀中文字幕一区二区| 精品福利国产| 国产成人高清精品免费5388| 国产成人精品优优av| 特黄日韩免费一区二区三区| 久久香蕉国产线看观看精品蕉| 丝袜久久剧情精品国产| 国内精品小视频福利网址| 色成人综合| 亚洲国产综合第一精品小说| 久久性妇女精品免费| AV无码无在线观看免费| 福利在线免费视频| 欧美精品在线视频观看| 亚洲不卡网| 精品国产电影久久九九| 国产激爽大片高清在线观看| 久久这里只有精品免费| 人妻21p大胆| 成人一级免费视频| 亚洲中文字幕23页在线| 欧美丝袜高跟鞋一区二区| 精品三级在线| 欧美精品在线看| 国产精品欧美日本韩免费一区二区三区不卡 | 在线免费亚洲无码视频| 全部免费特黄特色大片视频| 正在播放久久| 日本成人一区| 免费一级无码在线网站| 91精品福利自产拍在线观看| 国内精品视频| 国产97区一区二区三区无码| 国产综合欧美|