999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知網的可拓領域信息元庫的構建方法

2015-12-03 05:18:18陶星李衛華汪中飛
智能系統學報 2015年5期
關鍵詞:語義概念信息

陶星,李衛華,汪中飛

(廣東工業大學計算機學院,廣東廣州510006)

基于知網的可拓領域信息元庫的構建方法

陶星,李衛華,汪中飛

(廣東工業大學計算機學院,廣東廣州510006)

為了解決某個領域的矛盾問題,須構建領域信息元庫以提高計算機語義理解能力。結合知網的表達知識的形式化特點,提出了對基元進行改造,增強語義互操作性的方法。在知網2000版中,以教育領域為案例,提取出教育領域的概念及其屬性,并在此基礎上改造與更新,構造可拓學的教育領域基礎庫。在實驗過程中采用關系型數據庫實現了信息元的存儲,表明了可以提高語義互操作能力,驗證了該方法的可行性。

可拓學;知網;信息元;矛盾問題;語義

可拓學是由中國學者于1983年提出的一門原創性橫斷學科,它以形式化的模型,探討事物拓展的可能性以及開拓創新的規律與方法,并用于解決矛盾問題[1]。所謂矛盾問題,是指在現有條件下無法實現人們要達到的目標的問題。要解決某個領域的矛盾問題,使計算機自動生成可拓策略,必須有該領域的知識庫做為支持。這是可拓策略生成系統亟需解決的一個關鍵且基礎的問題[2]。

文獻[3]提出“可拓信息-知識-智能形式化體系結構”這一構想,指出研究以物元、事元和關系元為基本元的信息表示體系,以建立信息元庫。

知網(HowNet)是一套知識描述規范體系,一個通用的常識知識庫,描述了世間萬物所有的概念、概念的屬性及屬性之間的關系[4]。但是知網并不能解決矛盾問題。以知網的知識資源為基礎,借助可拓學基元表達體系,將有望讓其計算機自動生成(或人機結合引導生成)解決矛盾問題的策略。

本文提出一種基于知網來建立領域可拓信息元庫的方法,并以教育領域為研究案例,探討改進后的基元如何表達可拓知識和解決語義二義性問題,是未來解決某一領域的矛盾問題的基礎研究。

1 可拓信息元庫

在“可拓信息-知識-智能形式化”體系[3]研究中提出了該體系的主要功能模塊:信息元庫、知識表示庫、可拓策略庫。為了實現該體系,信息元庫的建立是首要工作。

信息元庫集成了領域的基礎知識,是支持策略生成系統的基礎庫。由于信息元庫容量龐大,且其中涉及領域繁雜,又有非結構化組織,對于許多的復雜情況根本不存在查詢結果,必要時,仍需要查詢整個信息元庫,查詢效率極低。本文將分別建立信息物元、信息事元、信息關系元模型,并將其存儲在信息元庫中,每次查詢時先在信息元庫中查詢;若不能得出查詢結果,再進行可拓變換,這樣可提高查詢效率。

2 知網的理論概述

2.1 知網的知識網絡體系

知網是一個以英、漢雙語所代表的概念以及概念的特征為基礎,以揭示概念與概念之間以及概念所具有的特性之間的關系為基本內容的常識知識庫[4]。知網知識庫中的概念是通過義原與義原之間的關系來描述的。

知網所描述的概念之間的關系有:上下位關系、同義關系、反義關系、對義關系、部件—整體關系、屬性—宿主關系、材料—成品關系、施事/經驗者/關系主體—事件關系、受事/內容/領屬物、屬性關系、實體—值關系、事件—角色關系、相關關系。這些關系形成了一個網狀的知識系統,進而使計算機對其可進行操作。

2.2 知網知識庫描述語言

知網知識庫描述語言是一種面向計算機的結構化描述語言[5]。為了實現計算這一設計目標,知網的創立者進行了2個工作:1)將概念分解為義原,并形成一套完整的分類體系;2)將義原通過各種關系的組織表達一個概念。因為知網中的每個義原都表示一個唯一的特定的意義,這樣就能解決自然語言處理的語義的歧義性問題。

在知網知識庫描述語言(KDML)2000版中,通過一些特定的符號來描述義原之間的關系的。如表1所示。

表1 KDML符號及其含義Table 1 Symbols and meanings of KDML

例如:

這個概念的含義是:大學生是N范疇。是“人”類別的一員,是施行“學”行為的,屬于教育領域類概念。

3 基于知網的信息元的構造方法

知網的哲學思想:世界上一切事物(物質的,精神的或事情)都在一定的時間和空間內不停地運動和變化。它們通常是從一種狀態變化到另一種狀態,并通常由其屬性值的改變來體現[2]。這一思想與可拓學的思想有異曲同工之妙。初步的研究顯示,將可拓學與知網這2個中國原創的理論和應用工具相結合,研究解決矛盾問題的策略生成問題,可為策略生成研究提供一種新的思路。

由于知網本身就是一個具有語義的通識知識庫,可以借助知網中義原及其語義關系的表達方式,對信息元的結構進行重新構造。

3.1 信息物元的構造

信息物元,是指具體對象、其特征和量值構成的有序三元組,而知網中的義原均為概念,并非具體的對象,所以,對信息物元并不需要基于知網進行重新改造,仍然使用可拓學中對于物元的定義。例如:

3.2 信息關系元的構造

信息關系元主要描述的是信息物元和信息事元之間的關系。通過對知網的描述,可以知道知網在描述概念及概念之間的關系上,已經有完備且有效的關系,只是知網不具備解決矛盾問題的能力。基于此,本文提出信息關系元模型如表2所示。

表2 信息關系元的結構Table 2 Structure of relation-element

在此信息關系元結構中,定義了4種關系屬性。1)isKindOf,即具有繼承關系或者上下位的信息元,譬如:“筆-鋼筆”、“白-雪白”等;2)isPartOf,表示具有整體與部分關系或者包含關系的信息元,又可細分為組合和聚合,譬如:“中國-上海”、“森林-樹”等;3)hasAttributeOf,表示與該具有屬性關系的信息元;4)hasInstanceOf,表示概念及其概念實例關系。譬如:“學校”的上位屬性是“場所”,其屬性有很多:名稱、地點、級別等。“學校”又可分為:“小學”、“中學”、“高中”、“大學”、“研究院”等。通過這樣的關系定義,希望其不僅可以支持基本的可拓變換:置換變換、增(減)變換、擴(縮)變換、分解變換和復制變換,并能具有一定的智能,幫助對矛盾問題的理解。

本文規定,每種信息關系元,都有某些固定的特征,譬如:關系前項(antecedent)、關系后項(conse?quent),其余特征需根據知網中的知識表達,進行相應的改造。詳細的改造方法如下。

基于知網中的關系符,本文分別進行如下處理。

1)空符號

在知網中,空符號義原主要存在于概念詞典中,一般有3種含義。

在知網中,實體、事件、屬性/屬性值、數量/數量值定義的第1項均為空符號義原,用來表示其主要特征。對于實體和事件概念來說,該第1項表示上下位關系。在信息物元中,將定義為isKindOf屬性。例如:

其對應的信息關系元為

對于屬性和數量的概念,因為其含有的“&”關系,可不對第1義原進行處理,將在之后的“&”關系的處理中詳細介紹。

2)“&”關系

在知網中,“&”表示“屬性-宿主”關系。對此類概念,不提取第1義原,改為提取該概念和第2義原之間為上下位關系。因為第2義原描述了具體的數量/屬性類,可以更加準確地對概念的語義范圍進行界定。例如:

按照上述轉換規則,可以得到上下位信息關系元(isKindOf):“模式”-“樣式”,其對應的信息關系元為

其表示的意義為:“模式”是屬于物質的樣式類別。

3)“%”關系

在知網中,“%”表示“整體-部分”關系,與屬性/數量關系類似,不再提取第1義原作為其上下位關系,而是直接提取“%”關系作為isPartOf屬性。例如:

從中,可以提取2個信息關系元,上下文關系元(isKindOf):“琴鍵”-“部件”、整體部分信息關系元(isPartOf):“琴鍵”-“樂器”。其對應的信息關系元為

在知網中,對于這些關系的提取,都可以直接進行,不再贅述。

3.3 信息事元的構造

對于信息事元的改造,一方面要保證其語義的完整性,另一方面,更要規定其模型,針對不同類型的事件,事件模型不一樣。對于某一領域內的知識,應該進行分類,并建立相應的事件模式。譬如:“報考”這一事件一定有考生(actingObject)和學校(re?ceivingObject)的參與,所以在建立這類事元時,施動對象(actingObject)和接受對象(receivingObject)特征是固定的必不可少的。

知網2000中使用到約70個動態角色是指概念在實際的語言中所構成的各種關系,如施事、受事、經驗者、時間、處所等[6]。有了這些動態角色的注釋,通過形式化的表示,計算機就能更好地理解其含義。

本文針對信息事元的構造,采用的方法為:提取第1義原為信息事元的上位屬性,提取動態角色為信息事元的第2屬性。譬如“報考”這一事元,在知網中對其的定義為:

其對應的信息事元為

對于沒有動態角色的義原,例如:

直接取第1義原為該事元的上位屬性,即

3.4 信息復合元的構造

對于現實世界中的復雜事件的描述,需要使用復合元。復合元包括多種形式,包括:物元和事元的復合,物元和關系元的復合等。

前面已經詳細討論了信息物元、信息關系元和信息事元的構造,那么至于信息復合元的構成,即它們的復合,唯一不同的是在信息關系元與其他信息元的復合中,信息關系元將做為其他信息元的特征。例如:“張三要報考廣東工業大學”這一事件,可以建立如下信息復合元:

subject=1,即表示理科;subject=2,表示文科。collegeLevel=0,表示國家重點“985”院校,col?legeLevel=1,表示國家重點“211”或者一本院校,二本院校、三本院校等其他類院校,以此類推。

綜上,分別確定了信息物元、信息關系元、信息事元和信息復合元的結構,并舉例說明該結構是可以反映一個無語義二義性的客觀世界,同時也具有表達可拓知識并支持可拓變換的能力。

4 案例分析——可拓教育領域信息元庫的建立方法

在之前文獻的研究中,利用可拓學很好地解決了某個矛盾問題,譬如:租房可拓策略生成系統、自助游可拓策略生成系統[7],而并未涉及到某個領域的矛盾問題的求解。也有文獻討論了基于本可拓模型的復合元[8],基于可拓模型的本體進化研究[9],為本文的研究提供了很好的基礎。本文以教育領域為案例,說明如何用改進語義能力的信息元解決領域矛盾問題。譬如,高考填報志愿,理想中的學校分熟線和自己高考分數存在矛盾;學習中,學習能力方法和預期成績存在矛盾等。為此,建立一個教育領域的概念體系是研究的關鍵基礎步驟。

4.1 教育領域概念結構

圖1 教育領域概念體系Fig.1 Education concept system

教育概念體系反映了教育體系概念和及其屬性[10]。本文總體上將教育客體分為3類:自然類教育客體,如學科,專業等;社會類教育客體,如學校的各類管理組織機構、教學設備等;精神類教育客體,如教育理論、教育思想等[11]。教育領域的概念結構如圖1所示。面[10]。這種由于咨詢用戶自身對高考填報志愿咨詢領域語義信息理解一致的慣性及咨詢目標十分明確的特點,大大降低了專家的參與度,在確定類、屬性和關系的處理上很容易達成共識。因此,本文采用自底向上建模方法,先行確定核心概念和關系,保障語義的正確性和完整性。

在知網知識庫2000中,分別查詢“學校”、“專業”、“指標”等義原。發現:

建立對應的信息復合元為

4.2 教育領域信息元的構建

以高考填報志愿為例說明可拓領域信息元庫的建立方法。實踐證明,多年來,考生在報考時的關注重點在于:高校名稱、高校地點、高校聲譽、專業設置、學科排名、分數線、招生人數和就業前景幾個方

再具體到某一個事件的表述:“張三要報考廣東工業大學”這一事件,可以建立語義關系如圖2所示。

圖2 報考事件的語義關系圖Fig.2 Semantic relations of“register for examination register for examination”

這樣清楚直觀的表示后,可以方便計算機理解并處理此語義關系,即可清晰的表達出具有清晰的語義互操作性的信息元。

4.3 實驗結果

應用前面所討論的理論知識,考慮到關系型數據庫具有查詢、插入、修改和刪除操作的簡潔性,從執行效率和成本角度考慮,本文使用關系型數據庫建立教育領域的概念體系[11]。本文使用的是SQL Server Express關系型數據庫。

知網是一個較為完整的知識系統,且具有語義可操作性。所以,將知網2000知識庫存入SQL Server 2012 Express數據庫中,數據庫名為:Extenics_HowNet,并提取其中關于“教育”的所有詞匯,共606條記錄,建立表:Edu_HowNet。再按照G_C屬性值的不同,分別建立Edu_HowNet_N,Edu_HowNet_V,Edu_HowNet_ADJ 3張表,如圖3所示。

圖3 信息元表結構Fig.3 Table of information element

如何才能證明計算機是否能理解我們的語義關系呢?本文主要通過基元語義相似度算法來判斷。如果算法的輸入結果在可接受范圍內,就可以判定該領域信息元庫具有語義互操作性。

在可拓信息-知識-策略形式化體系研究過程中,一個待求解問題最初可能是用自然語言表達的信息,如果自然語言存在二義性,計算機無法識別,就無法對該問題建立正確的可拓模型,更無法進一步處理。假設一個考生想要報考華師,但是在知識庫中并沒有“華師”這個基元,所以,利用文獻[12]的詞匯相關度算法,找出所有與其相關的詞語。

首先,建立“華師”信息物元,

然后,在信息元庫中查詢相應信息物元信息,發現并未存放“華師”這一信息物元的具體信息。通過與知識庫中的基元比較,得出結果如下:

數據庫中查詢結果如圖4所示。

圖4 查詢結果Fig.4 Result of query

于是,可以將計算結果:“華中師范大學”,“華南師范大學”,“華東師范大學”推送給用戶。再通過與用戶的交互與反饋,確定哪所“華師”,從而消除語義模糊,以達到理解用戶意圖的目的。

5 結束語

本文基于知網這個通用的語義知識庫,借助知網義原表達方式,解決概念語義二義性問題并提出了一種建立可拓領域信息元庫的創建方法,并以教育領域的高考信息咨詢問題為例,用計算機實現了該建庫方法,驗證了該方法可行性,得到了可接受的結論。這個基礎工作的完成對今后可拓策略生成系統解決教育領域矛盾問題有重要意義。

[1]楊春燕,蔡文.可拓工程[M].北京:科學出版社,2007:1?10.YANG Chunyan,CAI Wen.Extension engineering[M].Beijing:Science Press,2007:1?10.

[2]李立希,楊春燕,李鏵汶.可拓策略生成系統[M].北京:科學出版社,2006:1?23.LI Lixi,YANG Chunyan,LI Huawen.The extension strategy generating system[M].Beijing:Science Press,2006:1?23.

[3]楊春燕,蔡文.可拓信息-知識-智能形式化體系研究[J].智能系統學報,2007,2(3):8?11.YANG Chunyan,CAI Wen.A formalized system of exten?sion information?knowledge?intelligence[J].CAAI Transac?tions on Intelligent System,2007,2(3):8?11.

[4]董振東.HowNet[EB/OL].[2013?10?09].http://www.keenage.com.

[5]郝長伶,董強.知網知識庫描述語言[C]//全國第七屆計算語言學聯合學術會議.哈爾濱,中國,2003:371?377.HAO Changling,DONG Qiang.Knowledge database mark?up language of HowNet[C]//The 7th National Conference on Computer Linguistics.Harbin,China:2003:371?377.

[6]滕巖.基于領域知識的智能信息檢索研究[D].濟南:山東大學,2006,61.TENG Yan.The research of intelligent information retrieval system based on domain knowledge[D].Jinan,China:Shandong University,2006,61.

[7]方卓君,李衛華,李承曉.自助游可拓策略生成系統的研究與實現[J].廣東工業大學學報,2009,26(2):83?89.FANG Zhuojun,LI Weihua,LI Chengxiao.Research and realization of extension strategy generating system for inde?pendent travel[J].Journal of Guangdong University of Technology,2009,26(2):83?89.

[8]劉宗妹.本體可拓模型的復合元實現及應用研究[D].廣州:廣東工業大學,2010:1?48.LIU Zongmei.Research on ontology extension model imple?mented with complex elements and its application[D].Guangzhou,China:Guangdong University of Technology,2010:1?48.

[9]何平.基于可拓模型的本體進化研究[D].廣州:廣東工業大學,2011,89. HE Ping.Study of the ontology evolution based on extension model[D].Guangzhou,China:Guangdong University of Technology,2011,89.

[10]馬捷,劉小樂,黃嵐,等.教育領域本體構建研究[J].情報理論與實踐,2012,35(7):104?108.MA Jie,LIU Xiaole,HUANG Lan,et al.Research on the ontology construction in educational domain[J].Information Studies:Theory&Application,2012,35(7):104?108.

[11]劉小樂.教育領域頂層本體構建及其應用研究[D].吉林:吉林大學,2012,64.LIU Xiaole.The construction and application research of the top?level ontology of educational domain[D].Jilin,China:Jilin University,2012,64.

[12]劉群,李素建.基于《知網》的詞匯語義相似度計算[J].計算語言學及中文信息處理,2002,(7):59?76.LIU Qun,LI Sujian.Word similarity computing on how?net[J].Computational Linguistics and Chinese Information Processing,2002,(7):59?76.

Construction of HowNet?based extendable domain information element base

TAO Xing,LI Weihua,WANG Zhongfei

(College of Computer,Guangdong University of Technology,Guangzhou 510006,China)

To solve contradictory problems in a domain,it is necessary to construct the domain information element base and to improve the semantic recognition ability of computer software.Combined with the characteristics of for?malized expression of knowledge in HowNet,this paper proposes an approach to redefine the construction of basic?element which is the logic cell of Extenics to enhance semantic interoperability.Taking the domain of education as an example,the concepts and their properties of education are extracted in HowNet 2000,and further reconstructed and updated.Thereby the basic?element base of Extenics in the domain of education is built.A relational database(SQL Express)has been used to store the information element in the experiment,showing that the new basic?ele?ment can improve semantic interoperability,and proving the feasibility of the method.

Extenics;HowNet;information element;contradictory problem;semantic

陶星,女,1989年生,碩士研究生,主要研究方向為智能軟件。

李衛華,女,1957年生,教授,主要研究方向為面向Agent計算、網絡信息系統、智能軟件。發表學術論文40余篇。

汪中飛,男,1988年生,碩士研究生,主要研究方向為智能軟件。

TP39

A

1673?4785(2015)05?0790?07

10.11992/tis.201412006

http://www.cnki.net/kcms/detail/23.1538.TP.20150827.1024.008.html

陶星,李衛華,汪中飛.基于知網的可拓領域信息元庫的構建方法[J].智能系統學報,2015,10(5):790?796.

英文引用格式:TAO Xing,LI Weihua,WANG Zhongfei.Construction of HowNet?based extendable domain information element base[J].CAAI Transactions on Intelligent Systems,2015,10(5):790?796.

2014?12?08.

日期:2015?08?27.

國家自然科學基金資助項目(61273306).

陶星.E?mail:xingtao0724@163.com.

猜你喜歡
語義概念信息
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
語言與語義
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 国产91透明丝袜美腿在线| 亚洲h视频在线| 天天操天天噜| 伊人久久精品无码麻豆精品 | 国产精品男人的天堂| 亚洲一级毛片在线观| 一级全黄毛片| 国产精品污污在线观看网站| www.日韩三级| 美女内射视频WWW网站午夜| 天天干天天色综合网| 日韩黄色大片免费看| 国产精品露脸视频| 国产精品久线在线观看| 日韩欧美国产精品| 久久久久88色偷偷| 国产网站在线看| 午夜老司机永久免费看片| 91精选国产大片| 一本综合久久| 国产成人亚洲精品无码电影| 亚洲综合极品香蕉久久网| 日本高清有码人妻| 日本AⅤ精品一区二区三区日| 日韩免费中文字幕| 经典三级久久| 亚洲无码日韩一区| 亚洲成a∧人片在线观看无码| 亚洲综合色婷婷中文字幕| 国产69囗曝护士吞精在线视频| 全部免费特黄特色大片视频| 91色国产在线| 午夜国产大片免费观看| 99久久国产自偷自偷免费一区| 激情综合激情| 国产嫖妓91东北老熟女久久一| 国产精品手机视频| 国产精品毛片一区| 97se综合| 色精品视频| 国产乱人免费视频| 欧美中文字幕一区| 黄色一级视频欧美| 国产一区二区精品福利| 亚洲精品另类| 美女内射视频WWW网站午夜 | 国产精品观看视频免费完整版| 日本手机在线视频| 全裸无码专区| 国产www网站| 最近最新中文字幕免费的一页| 欧美五月婷婷| 中文字幕久久波多野结衣| 欧美成人看片一区二区三区 | 国产成人高清精品免费| 国产精品高清国产三级囯产AV| 国产成年无码AⅤ片在线 | 国产成人高清精品免费5388| 国产一区二区三区免费观看| 免费三A级毛片视频| 超清无码一区二区三区| 在线观看免费黄色网址| 特级做a爰片毛片免费69| 国产原创第一页在线观看| 亚洲国产综合精品一区| 久久精品免费国产大片| 青青草国产一区二区三区| 无码aⅴ精品一区二区三区| 日本国产精品| 亚洲最大在线观看| 日本欧美午夜| 色窝窝免费一区二区三区| 国产偷倩视频| 亚洲综合日韩精品| 国产精品3p视频| 婷婷色狠狠干| 欧美色丁香| a色毛片免费视频| 久久精品这里只有国产中文精品| 国产高潮视频在线观看| 夜色爽爽影院18禁妓女影院| 自慰网址在线观看|