999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種本體與Lucene融合的工藝知識檢索方法

2015-05-10 11:06:28王慶文裴彥純周建慧楊海成
制造業自動化 2015年23期
關鍵詞:語義工藝

王慶文,裴彥純,周建慧,楊海成,3

(1.北京航空航天大學 機械工程及自動化學院,北京 100191;2.中國航天科工飛航技術研究院,北京 100074;3.中國航天科技集團,北京 100048)

0 引言

在科技高速發展的今天,企業中的知識迅速膨脹,制造企業也不例外。知識管理,就是為企業實現顯性知識和隱性知識共享提供新的途徑,利用集體的智慧提高企業的應變和創新能力。工藝知識是涉及產品全生命周期的,目前國內工藝知識管理主要應用于CAPP范疇,主要對產品設計過程中的工藝知識進行了有效的管理,也有很多高校和研究院正在對產品全生命周期的工藝知識管理展開了深入研究。而國外對工藝知識的管理研究則側重于知識管理的框架和知識表達方式及評價[1]。其中,工藝知識的共享是工藝知識管理中很重要的一部分,如果知識庫中的知識不能夠及時地共享,那么工藝知識管理的水平就要大打折扣。

工藝知識檢索是知識共享的一種有效途徑,面對產品全生命周期的大量工藝知識,北京航空航天大學的姜明提出了一種基于內容的工藝知識檢索方法[2],此方法是通過Lucene檢索工具包中的檢索方法,構建了工藝文檔的索引結構,并對其內容進行抽取和分詞,是一種基于內容的檢索方法。但這種方法只是機械的分詞匹配,工藝術語之間的關系在索引中并不能體現出來,若能將工藝術語之間的關系添加至索引中,就可以使得檢索過程對工藝文檔和用戶輸入的查詢條件進行推理解析后再查詢,這樣檢索過程將更加智能化,成為一種工藝知識語義檢索的方法。

構建工藝術語之間的聯系,采用比較多的是構建工藝本體。目前,越來越多的領域在其知識管理中引入了本體,如飛機故障知識本體[3]、幾何學知識本體[4]。部分制造業知識管理中也引入了本體,如OHSMKBS領域本體[5]、機械加工工藝本體[6]等。在制造業中我們將工藝知識的相關本體簡稱為工藝本體。

在工藝知識語義檢索中,通過工藝本體對文檔內容和查詢關鍵字進行擴展,擴展的方式則依據工藝知識管理系統的具體檢索需求。目前,采用較為廣泛的是三元組擴展[7],三元組(主體,謂詞,客體)可以準確地表達工藝術語之間的聯系。本文通過在Lucene索引結構和查詢條件結構中引入工藝術語語義三元組屬性項,在基于內容檢索的基礎上,對工藝文檔的內容進行了語義擴展,彌補了檢索過程中機械分詞匹配查詢的單一性,使得工藝知識檢索系統對文檔內容的檢索更加語義化,智能化。

1 工藝本體與Lucene融合的工藝知識檢索結構

Lucene工具包提供了中文分詞、文檔建索和文檔檢索工具,雖然可以將工藝術語詞典加入Lucene詞典中實現對工藝術語的分詞,但在查詢時,只能進行機械的工藝術語匹配,并不能很好地體現文檔內容的語義。

為將文檔內容的語義抽取出來,在Lucene分詞后,對其中的工藝術語進行語義擴展,這種擴展主要是依據構建的工藝本體中工藝術語之間的聯系,分析工藝術語及其上下文中的其他術語,將其擴展為一個子句,也就是三元組,由于這種三元組表達了文檔中內容論述的主題或方向,因此我們稱其為語義三元組。

將擴展后的語義三元組添加到Lucene索引中后,查詢時同樣對用戶輸入的查詢條件進行擴展,得到查詢語義三元組,去查詢對應的語義三元組索引項,這樣就形成了完整地語義檢索過程。

本文通過分析工藝文檔的屬性和檢索需求,采用Lucene和工藝本體結合的方法,提出了一種工藝知識語義檢索方法的總體流程,如圖1所示。

工藝知識語義檢索方法共分為三個部分,即工藝文檔建索,工藝文檔查詢,檢索結果返回。

工藝文檔建索過程,是在存儲到知識庫的同時,抽取其各類屬性,工藝文檔的屬性分為內容屬性和文檔相關信息屬性,內容屬性需要通過中文分詞后建立索引,而相關信息則直接抽取后建立索引。但對于文檔的語義信息,并不像文檔作者或文檔發表日期這類屬性可以直接抽取,需要對文檔內容中的工藝術語及其上下文進行推理擴展后才能獲得。因此,依據工藝本體中工藝術語之間的各類關系,對文檔內容中工藝術語進行擴展后得到文檔語義信息,最后與其他屬性項一起添加至Lucene索引結構中。

圖1 工藝知識語義檢索方法總體流程

工藝文檔查詢過程,是對用戶輸入的查詢條件進行整合,獲得用戶需要查詢的內容以及其他約束(如文檔作者等),對于用戶輸入的內容需要進行中文分詞后才能建立查詢條件,然而對于文檔的語義信息,因為用戶輸入地查詢關鍵字并不是語義三元組,因此需要對其輸入的關鍵字進行同建索過程相同的語義擴展后,獲得語義三元組,生成查詢條件。最后,將所有的查詢條件進行整合獲得總查詢條件,對Lucene索引文件進行查詢。

檢索結果返回過程,是將Lucene查詢得到的抽象結果總集,每一條結果記錄中都包含了其對應的數據庫位置信息,進而查詢工藝知識庫,得到目標工藝文檔。

2 工藝本體與Lucene索引和查詢條件融合

2.1 工藝本體與Lucene索引融合

工藝本體主要存儲了工藝術語之間的聯系,給定目標工藝術語,依據工藝本體中建立的關系可以對其進行擴展,擴展后得到目標工藝術語的相關語義三元組。獨立的工藝術語并不能體現工藝領域中具體的語義,例如“熱處理”,熱處理的知識一般包括熱處理的簡介,熱處理對材料性能的影響,熱處理在工藝過程中的工序安排等,獨立的“熱處理”并不能表達出具體的語義。

在Lucene索引結構中如果添加語義三元組索引項,可以將工藝文檔內容進行推理擴展后再建立索引。Lucene的索引結構以及建索過程都是用戶自己定義的,因此可以完美地將工藝本體中的關系,通過推理擴展后,融入到Lucene索引結構中。

例如,某篇文檔中大量出現了“熱處理”和“硬度”“韌性”等工藝術語,只將這些關鍵字添加至索引中,并不能體現他們之間的關系,通過工藝本體中“熱處理”與“材料性能”的關系和“材料性能”與“硬度”、“韌性”的關系,可以擴展得到“熱處理影響硬度”、“熱處理影響韌性”、“熱處理影響材料性能”等語義三元組,再將這些語義三元組添加至Lucene索引中,如此,Lucene索引中不僅包含了該文檔的內容及時間作者等信息,也包含了文檔內容中的語義信息。

本文通過分析工藝文檔檢索需求以及工藝本體與Lucene融合需求,設計了如圖2所示的工藝本體與Lucene融合后的索引結構。

工藝文檔的屬性有很多,具體抽取哪些屬性是依據檢索時的需求來設計的,當然文檔本身的屬性并不能體現文檔內容中包含的語義,在抽取基本屬性后,添加至工藝文檔的屬性結構中,對于文檔語義信息而言,在抽取獲得純文本后,依據工藝本體中工藝術語之間的關系,對其進行語義擴展,得到對應的語義三元組,再將這些語義三元組作為一項屬性添加至屬性結構中。

最后,將所有屬性項封裝,在封裝時,共分為三個索引項,數據庫定位索引項用來確定工藝文檔在工藝知識庫中的位置;約束條件索引項在查詢時進行約束,不進行中文分詞,實現一種精確匹配;內容檢索索引項在查詢時進行中文分詞,實現一種模糊匹配。

圖2 工藝本體與Lucene融合后的索引結構

2.2 工藝本體與Lucene查詢條件融合

查詢條件,是Lucene工具包將用戶輸入的檢索關鍵字以及某些約束條件,依據查詢規則整合成一個總的可以對Lucene索引文件進行讀取查詢的條件。查詢條件的查詢規則以及查詢的索引項需要滿足Lucene的索引結構,應該與索引項一一對應。

工藝本體在對查詢條件擴展時,不僅因為Lucene索引結構中加入了語義三元組屬性,而且作為語義檢索的要求,一個完整的語義檢索系統,不僅要能理解工藝文檔的內容,對文檔內容進行擴展,更需要理解用戶輸入的檢索條件,對檢索條件進行擴展。查詢時應該與建索時進行同樣的語義擴展,所謂同樣的擴展,就是推理擴展的規則應該一致,這樣在擴展后得到的語義三元組與索引中的語義三元組匹配才有意義。

例如,用戶輸入“熱處理材料性能”或者“熱處理對材料性能有什么影響”進行檢索,無論哪一種,都需要對其分詞后采用工藝本體中術語之間的關系進行推理擴展,將其轉換成“熱處理影響材料性能”語義三元組,再去對索引文件中語義屬性進行查詢。如此,若某篇文檔中語義屬性中也包括“熱處理影響材料性能”這個三元組,則通過Lucene的相關度計算后會得到較高的匹配度。

本文通過分析工藝本體與Lucene融合后的索引結構,以及各個屬性項的查詢需求,設計了如圖3所示的工藝本體與Lucene融合后的查詢條件結構。

用戶輸入的檢索條件中,依據檢索需求,獲取其輸入的內容,建立對應的查詢條件,然而對于語義檢索條件而言,并不是用戶輸入的,是通過工藝本體分析用戶輸入的內容查詢關鍵字,進行語義擴展后得到對應的語義三元組,將這種語義三元組依據查詢規則建立語義索引項的查詢條件。

最后,將所有的查詢條件通過Lucene布爾運算整合為總查詢條件,總查詢條件中分為兩類查詢條件,約束查詢條件是對約束條件索引項進行精確查詢,即不分詞的查詢;內容查詢條件是對內容檢索索引項進行模糊查詢,即包括中文分詞的查詢。

3 工藝本體模型及與語義擴展功能的映射關系

3.1 工藝術語標準

圖3 工藝本體與Lucene融合后的查詢條件結構

工藝本體構建的最終目的是工藝知識的語義檢索,工藝知識的檢索中包含了大量的工藝術語,因此工藝本體中應包含大量工藝術語,而且對工藝術語之間的層次關系也應有明確的定義。

依據中華人民共和國國家標準《機械制造工藝基本術語》GB/T4863-2008中收錄的工藝術語以及之間的層次關系,可以構建工藝本體的層次結構樹,然后對樹上每個節點依據工藝領域中工藝術語之間的關系添加屬性、約束等,最終完成工藝本體模型的構建。

3.2 工藝本體模型

工藝本體的構建應滿足在檢索中的擴展要求。對于某個工藝術語而言,在工藝領域中可能包含其概念分類方面的知識、與同類術語比較的知識、與其他術語聯系的知識等。例如“淬火”,可能有“淬火”與材料性能之間的影響、與正火等其他工藝方法的比較、與加工精度之間的關系等,同時淬火與硬度之間的關系應能被理解為淬火與材料性能之間的關系。

根據語義擴展的需求,本文采用protégé構建了工藝本體,由于篇幅關系,圖4給出了工藝本體模型的一部分。

圖4 工藝本體部分模型

可以看出,工藝本體的構建是依據工藝知識檢索中的需求而建立的,通過構建工藝術語之間的聯系,可以在檢索過程中通過對索引和查詢條件進行語義擴展,進而實現工藝知識的語義檢索。

3.3 工藝本體與語義擴展功能映射

依據擴展時工藝領域中的語義關系,工藝本體中的工藝術語設置了同義詞實例,相關約束,以及工藝本體中樹狀結構的父子關系。在擴展時,為了得到語義三元組,不僅需要根據約束關系直接擴展,而且還應該在擴展之前,進行工藝術語的同義詞替換,以及根據父子兄弟關系的繼承原則去更好地表達工藝文檔的內容語義。工藝本體與擴展功能之間的關系映射結構如圖5所示。

圖5 工藝本體與擴展功能映射關系

父子關系和兄弟關系,如“材料性能”的子類應該包含“硬度”、“強度”、“韌性”等,“硬度”與“強度”、“韌性”等構成一種兄弟關系。這種關系可以實現一種語義傳遞,例如“熱處理”與“硬度”有關系,“硬度”又屬于“材料性能”,通過推理就可以得到“熱處理”與“材料性能”之間的關系。

同義詞關系,每個工藝術語應有其對應的同義詞實例,因為用戶輸入的條件和工藝文檔中的詞匯并非與工藝本體中類的名稱完全一致,例如,若不能將“材料的性能”轉換為“材料性能”,是無法對其進行擴展的,因為工藝本體中不包括“材料的性能”這個類。

約束關系,這是語義三元組擴展的核心關系,如“熱處理”與“材料性能”之間的約束,是得到“熱處理影響材料性能”三元組的直接來源。

父子兄弟關系實現了關系的繼承,同義詞關系實現了同義詞的替換,這兩者最終的服務對象都是語義三元組的擴展。因為通過工藝本體中關系的語義推理獲得合理的語義三元組才是工藝本體的價值和意義所在。

4 基于本體和Lucene的工藝知識檢索系統實現

在工藝知識管理系統中的工藝文件檢索模塊中,以“熱處理材料性能”作為關鍵字查詢,得到的結果如圖6所示。

可以看到,在“熱處理對硬度影響”這篇文檔中,雖然沒有出現“材料性能”這個關鍵詞,但由于大量出現了“硬度”,在工藝本體中,“硬度”屬于“材料性能”的子類,因此根據熱處理與硬度之間的關系,擴展后得到了“熱處理影響材料性能”這一主題,查詢時也將查詢條件轉換為此三元組,因此Lucene在檢索時,由于匹配度很高而進行了合理的排序,達到了語義檢索的目的。

5 結論

圖6 工藝知識語義檢索結果

使用protégé3.4.5構建了工藝本體,分析了工藝本體的結構,在原有的基于內容的檢索平臺上,引入工藝本體,通過Jena工具包和Lucene工具包構建了索引結構和查詢條件結構,系統中實現了工藝術語關聯擴展、同義詞擴展以及語義檢索功能,大大提高了工藝知識檢索的質量。

[1] EjubKajan,Leonid Stoimenov. Toward an ontology-driven architectural framework for B2B[M].ACM Press.2005:60-66.

[2] 姜明.基于內容的工藝知識檢索方法研究[D].北京:北京航空航天大學,2011.

[3] 周揚,李青.飛機故障知識的本體建模及語義檢索[J].計算機工程與應用.2011,47(16):12-15.

[4] 鐘秀琴,符紅光,佘莉,黃斌.基于本體的幾何學知識獲取及知識表示[J].計算機學報.2010,33(1):168-173.

[5] 呂素剛.基于本體的加工工藝知識庫系統研究及應用[D].南京:南京航空航天大學,2011.

[6] 馬宏福,楊志剛,袁艷麗,金寶寧.基于本體論的機械加工工藝知識管理[J].機械制造與研究.2006,35(2):72-74.

[7] Chun Liu,QingPingGuo. Analysis and Research of Web Chinese Retrieval System Based Lunece[M].IEEE Computer Society.2009:1051-1055.

猜你喜歡
語義工藝
語言與語義
轉爐高效復合吹煉工藝的開發與應用
山東冶金(2019年6期)2020-01-06 07:45:54
5-氯-1-茚酮合成工藝改進
世界農藥(2019年2期)2019-07-13 05:55:12
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
一段鋅氧壓浸出與焙燒浸出工藝的比較
銅業工程(2015年4期)2015-12-29 02:48:39
FINEX工藝與高爐工藝的比較
新疆鋼鐵(2015年3期)2015-11-08 01:59:52
認知范疇模糊與語義模糊
絡合鐵脫硫工藝在CK1井的應用
W ELDOX900鋼焊接工藝評定
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 欧美成人一级| 波多野结衣无码中文字幕在线观看一区二区 | 毛片网站观看| 免费看a级毛片| 欧美激情,国产精品| 国产一级毛片在线| 亚洲成人福利网站| 日本www在线视频| 日韩在线影院| 免费看av在线网站网址| 色悠久久综合| 亚洲IV视频免费在线光看| 丁香婷婷激情网| 亚洲国产成人综合精品2020| 中文字幕va| 久久久久人妻精品一区三寸蜜桃| 天堂va亚洲va欧美va国产| 亚洲视频在线观看免费视频| 在线观看免费人成视频色快速| 成人午夜亚洲影视在线观看| 最新亚洲人成网站在线观看| 国产一区亚洲一区| 亚洲视频免| 久青草国产高清在线视频| 国产福利免费视频| 成人福利在线视频免费观看| 欧美日韩在线成人| 国产成人亚洲精品色欲AV| av午夜福利一片免费看| 久久午夜夜伦鲁鲁片无码免费| 97se亚洲综合在线| 国产噜噜噜视频在线观看 | 亚洲精品日产AⅤ| 青青网在线国产| 久久一本精品久久久ー99| 久久免费精品琪琪| 欧美午夜在线观看| 热久久国产| 草草影院国产第一页| 国产成人高清精品免费软件| 999精品在线视频| 色天天综合| 99精品在线视频观看| 91麻豆精品国产91久久久久| 日韩欧美国产三级| 青青草国产在线视频| 2020国产精品视频| 亚洲精品自拍区在线观看| 日韩毛片免费| 欧美黄色网站在线看| 亚洲精品国产精品乱码不卞| 在线免费不卡视频| 99久久国产精品无码| 亚洲国产天堂在线观看| 露脸国产精品自产在线播| 亚洲最新网址| 国产精品无码在线看| 制服丝袜亚洲| 国产精品成人一区二区| 国产va免费精品| 国产精品免费露脸视频| AV老司机AV天堂| 国产白浆在线| 无码日韩精品91超碰| 精品欧美一区二区三区在线| 无码电影在线观看| 97超碰精品成人国产| 日本精品αv中文字幕| 国产91小视频在线观看| 91小视频在线观看免费版高清| 国产麻豆永久视频| 欧美有码在线观看| 亚洲精品少妇熟女| 国产福利拍拍拍| 国产成人乱码一区二区三区在线| 国产精品片在线观看手机版 | 亚洲三级片在线看| 91精品国产麻豆国产自产在线| 青青国产视频| 国产成人亚洲无码淙合青草| 国产精女同一区二区三区久| 国产成人永久免费视频|