999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體和關聯數據的單元信息知識組織模式研究

2019-05-07 07:50:40呂葉欣張娟
現代情報 2019年5期

呂葉欣 張娟

摘 要:[目的/意義]為滿足用戶多層次、多粒度的知識獲取需求,圖書館文獻資源組織的對象由文獻單元逐步向知識單元轉變。[方法/過程]文章在研究單元信息概念和表示模型的基礎上,提出基于本體和關聯數據的單元信息知識組織框架,并深入探討了實現單元信息語義組織的核心步驟。以中醫養生領域為例,闡述單元信息知識組織語義模型的應用過程。[結果/結論]本文構建的單元信息知識組織模式,是實現單元信息細粒度組織、語義化揭示以及多維度關聯的有效途徑。該研究可為特定領域單元信息的語義應用提供參考。

關鍵詞:單元信息;本體;關聯數據;知識組織

DOI:10.3969/j.issn.1008-0821.2019.05.006

〔中圖分類號〕G254.6 〔文獻標識碼〕A 〔文章編號〕1008-0821(2019)05-0041-07

Abstract:[Purpose/Significance]For the purpose of users knowledge acquisition at multiple levels and multi granularity,the object of librarys literature resources organization has gradually shifted from a literature unit to a knowledge unit.[Method/Process]On the basis of researching unit information concept and representation model,this paper put forward a framework of unit information organization based on Ontology and Linked Data,and discusses in depth the core steps of realizing the semantic organization of unit information.Taking“Yang sheng”as an example,this paper presented the application process of the semantic model of unit information knowledge Organization.[Result/Conclusion]Unit information knowledge organization constructed in this paper was an effective way to implement fine-grained organization,semantic revelation and multi-dimensional correlation of unit information.This research can provide reference for the semantic application of unit information in other specific fields.

Key words:unit information;ontology;linked data;knowledge organization

隨著信息技術和數字圖書館的發展,圖書館傳統的以文獻單元為基礎的信息組織體系已經不能滿足用戶的知識性需求。深入到文獻內部,實現細粒度的單元信息的組織與檢索成為未來發展趨勢。通過對文獻中蘊含的單元信息進行分析抽取,并運用語義技術和方法,達到對知識單元語義層面的組織,形成基于文獻的知識網絡。在此基礎上,實現具體的檢索、自動分類、智能推理方面的應用。

目前,國內運用語義技術實現細粒度知識的組織方法已經取得了一些研究成果,如知識元表示、知識元抽取、知識元標引。單元信息的知識組織方法可以借鑒知識元的研究成果,如知識元與本體的結合成為一種重要的知識組織表達方式,被應用于各類知識庫的構建。但在文獻深度知識組織和開發實踐中,目前較少引入關聯數據的相關技術和方法。關聯數據作為一種簡化的語義網模型,可以實現不同領域、不同來源、不同系統間知識資源的關聯,更好地實現知識之間的多維度關聯與開放獲取。本文將本體和關聯數據引入單元信息的知識組織,通過對單元信息特征和專業領域的屬性和語義關系進行描述和揭示,構建多維鏈接的文獻知識網絡。

1 單元信息及其知識組織框架

1.1 單元信息概念

知識單元作為知識組織的對象,目前學術界仍未形成統一認識。馮汝佳等[1]從粒度原理出發,對知識單元、知識元的概念做了界定。認為知識單元是任意粒度的用于知識組織的文獻片斷。而知識元作為一種表征知識點的細粒度資源,是知識組織中不可分割的最小控制單位,如數據、事實、結論、公式等。知識單元可以是一個或多個知識元的集合。

本文中的單元信息是指從文獻中提取的獨立、完整、有價值且不可拆分的內容片段。單元信息在粒度層級上與知識元的概念一致,都是不可拆分的最小獨立單元。但在知識形態上又與知識單元相似,都是隱含在文獻中的片段信息。單元信息的實質是一種細粒度的知識單元,是論述某一問題的觀點、數據、方法等段落語句[2]。

1.2 單元信息本體表示

單元信息作為一種細粒度的知識單元,對其進行知識組織和檢索其前提是要建立知識表示模型。目前細粒度知識資源的表示方法主要包括基于特征的線性知識表示方法和結構化的知識表示方法。單元信息的線性描述模型雖能揭示單元信息的屬性特征,卻不能揭示單元信息內在結構和語義關聯。通過使用語義結構代替傳統線性結構的知識表示模型,可以使用戶更容易通過語義元數據(Semantic Metadata)進行高效檢索和瀏覽。此外,數字環境下依靠人工添加元數據的方式難以提高搜索引擎的檢索效率和準確率,而結構化和語義化的知識表示,能夠幫助機器實現自動分類、聚類、數據挖掘及語義檢索[3]。在借鑒已有的知識元本體模型以及文獻本體模型的基礎上,結合單元信息自身的特點,將單元信息結構表示為:UI=〈s,c,p〉三元組。其中s表示來源文獻、c表示單元信息內容,p表示單元信息屬性,其結構表示模型如圖1所示:

來源文獻包括圖書、期刊、學位論文3個子類,與單元信息間是整體與部分關系。內容是單元信息的內容本身,用戶可從中獲取知識,其獨立完整且粒度小,用戶閱讀后都能掌握某一主題的相關知識[4]。屬性主要是單元信息的元數據項,包括唯一標示符(采用URI表示)、名稱、主題、類型、格式和創建者。元數據項的提取除對單元信息特征進行描述和定位外,還能建立單元信息之間基于外部特征的顯性關聯關系,如責任者合作、關鍵詞共現等。主題詞是提取單元信息的重要內容特征,是單元信息內容的高度概括,其主要來源于領域本體中的概念表達,通過主題標注,生成一條或多條帶有標注的主題句,能建立如上下位、等同、相關以及本體構建的豐富語義關聯,挖掘知識間的隱性關聯關系。類型則通過分析單元信息內容即主題句信息得到,類型的提取主要用于基于單元信息內容類型的聚類和瀏覽,包括方法、概念、事實、陳述和數值。單元信息的格式包括文本型、圖片型和視頻型,也可能是各種媒體類型交叉和融合的,比如文本中含有圖片、視頻的綜合性多媒體單元信息。

1.3 單元信息知識組織總體框架

基于本體和關聯數據的單元信息組織是對海量、異源、異構文獻信息資源進行精確化抽取、細粒度揭示、深度序化和語義化組織的過程,其核心意義在于實現單元信息的語義關聯。單元信息知識組織包括知識資源和知識組織體系內容建設[5]。知識資源包括單元信息、來源文獻以及相關外部數據集。知識組織體系是對單元信息進行加工組織的方法體系,包括元數據、本體、關聯數據等語義網核心技術。通過元數據描述、本體建模、關聯數據組織模型構建等方法實現對單元信息的外部特征和內容特征的描述,知識屬性和關系屬性的揭示,語義表達單元信息關聯組織的需求,構建多維文獻知識網絡,為基于語義關聯的知識發現、查詢瀏覽、本體可視化等知識服務和應用提供底層源數據的組織管理模型。

本文提出基于本體和關聯數據的單元信息知識組織框架如圖2所示,該框架為4層結構,從下至上分別為數據層、語義層(本體層)、關聯層和應用層。各層功能相對獨立,上層功能基于底層功能實現。

數據層是單元信息組織框架的基礎,其中包括兩大部分:本地數據源和外部數據集。本地信息源是指存儲于本地的單元信息庫,是以文獻庫為基礎,根據相應的抽取規則人工或計算機自動抽取出的單元信息集合。外部數據集是最終與單元信息庫進行鏈接的數據對象集合。

語義層(本體層)是實現單元信息組織的關鍵,原始信息缺乏明確的形式化定義,在分析單元信息資源特征、知識結構、內容特點基礎上構建語義標注模型,繼承、復用現有語義描述框架及本體基礎構建與各類相關資源相契合的語義關聯模型。其工作主要包括兩部分內容:首先,采用owl語言基于本文搭建的語義標注模型對單元信息進行資源描述;其次,基于關聯數據原則,采用HTTP URI標識所有資源,最大限度地復用已有本體或詞匯表對單元信息相關資源進行規范描述;最后,將所有標注后的資源轉換為統一的RDF格式,借助語義融合的關聯模型把具有語義的RDF鏈接顯性地揭示出來,形成語義元數據網絡。

關聯層是基于語義關聯模型以及各種技術支撐工具,實現對單元信息關聯數據的構建、關聯與發布,并同時與網絡開放的相關資源建立鏈接。依據語義關聯模型轉化的RDF數據集間生成了語義鏈接,從而真正實現單元信息之間以及單元信息與外部數據集間的語義關聯,為上層提供一個統一的知識視圖。

應用層是基于上述組織過程的最終應用實現。

2 單元信息知識組織語義模型構建

構建以單元信息為基礎的多維文獻知識網絡,其核心步驟主要包括兩個方面:一是在本體的指導下,對單元信息進行語義標注,將非結構化的單元信息轉化為規范的知識表示,實現單元信息的語義關聯,為上層資源提供語義檢索;二是根據關聯數據特點,通過對單元信息的特征及各類實體間的相互關系進行語義化、層次化、立體化的描述,建立單元信息與其他實體間的語義關聯關系,并采用關聯數據原則進行發布,實現以單元信息為核心的網狀知識圖譜。

2.1 單元信息本體標注模型構建

單元信息模型的形式化表示主要是基于XML和基于本體的方法[6]。基于本體的單元信息語義標注一般要基于某個領域。根據應用目標不同,可將本體在本研究中的應用分為單元信息表示本體和領域本體。單元信息表示本體提供了一種知識表示框架,以層次表達的方式規范描述單元信息的內容、出處、元數據等,實現了知識的形式化表示。領域本體提供了其所在領域知識的標準性描述,即領域知識的元數據或規范術語集,可在內容層面豐富領域資源的語義關聯關系。采用兩種本體相結合的方式為單元信息的語義標注提供系統的標注框架,能更好地促進隱性的知識挖掘。根據上述內容,單元信息本體標注模型構建主要包括3方面工作:單元信息表示本體設計、領域本體構建以及兩者之間的關聯表示。如圖3所示:

圖3 單元信息語義標注模型

上文已闡述了單元信息表示本體的構建方法。采用Protégé工具及本體描述語言owl建立領域本體,通過Jena[7]技術完成對領域本體的解析,從而實現計算機的訪問、操作和語義推理。領域本體的建立應盡可能地重用已有知識資源來獲取領域概念,如敘詞表、分類表以及本體等。上述各本體構建后,單元信息描述本體使用對象屬性has Subject實現從單元信息到領域本體的關聯,領域本體使用對象屬性has Resouce實現從概念到單元信息的關聯,從而將單元信息實例中的主題詞同領域本體中的概念實例關聯起來,通過領域本體構建的豐富語義關聯,利用推理機挖掘知識間的隱性關聯。此模型的優點在于,替換任意單個本體不會對其他相關本體產生影響,是一種更為通用的單元信息標注模型,同時滿足領域概念動態擴展的需求。經過本體標注和映射的單元信息鏈接成具有本體語義的知識網絡,存儲于知識庫中,為實現知識推理和語義檢索提供了基礎。

2.2 單元信息語義關聯模型構建

基于本體的語義標注雖可實現對單元信息資源的細粒度組織和語義標注,但不支持資源本身的開放獲取,關聯數據作為語義網中使用URI和RDF發布、分享、連接各類數據、信息和知識的最佳實踐[8],能滿足資源間廣泛關聯與開放的知識組織需求,幫助用戶挖掘不同領域的知識資源,建立多維度的知識鏈接。關聯數據采用RDF數據模型,RDF三元組的URI采用來源于各種規范詞表及本體的URI來標識知識對象,從而實現跨領域資源實體的規范性描述,為實現不同領域、不同來源、不同系統間資源實體的鏈接奠定了基礎,具有較高的可獲取性[9]。

由于關聯數據本身不具備語義功能,所以需要應用已有的成熟的詞表或本體作為語義描述框架。單元信息語義關聯模型是通過對各類實體的元數據項進行分析和抽象,找出語義關聯性,定義類及類的屬性,盡可能復用現有廣泛使用的元數據或本體相關詞匯對各類屬性進行規范化描述(如DC、FOAF、SWRC),并對特定需求的屬性進行擴展。屬性包括表達概念之間關系的對象屬性和表達概念特征的數據屬性,通過對象屬性與其他實體類進行外部關聯,建立各類型資源間的語義關聯。根據單元信息本體描述模型,本文主要抽取了單元信息(ui:UintInformation)、來源文獻(ui:ResourceDocument)、學科人物(foaf:Person)3個核心實體類初步建成單元信息關聯模型,屬性和類間關系如表1所示:

為以上實體類及屬性,添加如下關聯條件:

單元信息類、來源文獻類的屬性主要復用DCMI的部分核心元素,通過互逆屬性dcterms:hasPart和dcterms:isPartOf描述出來源文獻與單元信息間的整體與部分關系,單元信息類、來源文獻類通過對象屬性dcterms:creator與人物類建立著者關聯。

人物類重用foaf:Person、swrc:FacultyMember的部分核心詞匯進行語義描述。通過擴展屬性foafx:createUI和對象屬性swrc:publication分別建立與單元信息類、來源文獻類的作品關聯,也可通過foaf:topic_interet描述著者的研究領域,與主題概念建立關聯關系。

此外,將知識組織資源(如主題詞表、術語表、分類法以及各領域敘詞表)采用SKOS語義描述,其概念主題可通過dcterms:subject屬性與單元信息、來源文獻建立語義關聯,將主題概念嵌入相關實例中,使各層次知識單元在主題層次上關聯起來。同時,主題詞表等通用詞表可通過SKOS詞表[10]中定義的skos:broadMatch、skos:closeMatch、skos:exactMatch、skos:mappingRealtion、skos:narrowMatch、skos:narrowMatch詞匯鏈接實現與領域本體概念間的映射。

單元信息關聯模型的構建思路實現了從粗粒度的來源文獻到細粒度的單元信息,從二維知識組織層次到多維知識組織網絡的演化,全方位展現信息資源體系的語義關系。類間語義關系如圖4所示。

為單元信息關聯模型的每個概念節點添加實例,利用定義好的類和屬性來描述具體的資源對象,形成語義元數據的關聯網絡。通過文本、圖片、

視頻等形式,充分展現了單元信息與來源文獻、領域概念、人物之間的語義互聯關系。用戶可利用RDF語義鏈接,快速查找、獲取相關資源。

本文建立的單元信息語義關聯模型是一種較為一般的模型,當選定某一具體領域時,可根據領域資源特點增加新的實體關系,構建語義化程度更高的關聯模型。

3 單元信息知識組織語義模型應用實例——以中醫養生領域為例

本文以中醫養生領域為例,示例單元信息知識組織語義模型的應用過程,主要包括以下幾個步驟:

第一步,根據單元信息鑒選原則[11]從權威出版社、核心期刊發表的中醫養生領域文獻中抽取單元信息。本文選取兩段單元信息作為標注示例。

單元信息一:高血壓是常見的心血管疾病危險因素之一,隸屬于中醫的“眩暈”范疇。其病因主要有情志不遂、飲食不節、體虛年高、跌仆外傷等[12]。

單元信息二:孫思邈《備急千金要方·風眩》首次提出“風眩”的病名及定義:“夫風眩之病,起于心氣 不定,胸上蓄實,鼓有高風面熱之所為也。痰熱相感而動風,風心相亂則悶 瞀,故謂之風眩”。并提出風、熱、痰致眩的觀點[13]。

第二步,參考領域本體構建框架進行中醫養生本體建模,規范中醫養生領域中概念描述及關聯關系[14]。

第三步,基于單元信息語義標注模型(如圖3所示)對上文中抽取的道家養生理論單元信息進行語義標注;以上文確定的元數據標準對其來源文獻、相關人員進行標準化描述,并在描述過程中建立內容對象之間的關聯關系。使用URI引用機制對這些資源對象進行標識,如圖5、圖6所示。

圖5、圖 6以RDF三元組形式表達了單元信息內容本身、單元信息之間以及單元信息與來源文獻、 領域專家、養生領域本體概念等外部資源的屬性、屬性值以及它們之間的邏輯關系。在實際應用中,采用RDF/XML序列化方式進行存儲。

圖5中“內容”實例是兩段單元信息片段的內容本身,通過主題概念“飲食不節”與“高血壓”之間的“導致”關系、“眩暈”與“高血壓”之間的"對應"關系,語義揭示單元信息片斷本身的邏輯關系。通過概念實例“高血壓”與“風眩”之間的等同關系以及“風熱痰”與高血壓之間的“導致”關系建立起兩段單元信息之間的語義關聯。

圖6中“內容”實例是高血壓病因單元信息,與來源文獻實例“中醫養生來源文獻”通過“dcterms:isPartof”建立整體與部分關系,通過“dcterms:subject”與中醫養生本體概念實例(高血壓、眩暈)相關聯,與養生領域專家各個子類的實例通過“dcterms:creator”相關。用戶在獲取高血壓病因單元信息的同時,不僅可以查找來源文獻的相關信息,還可以查找到作者的其他研究成果以及擅長的領域,建立起與中醫養生領域本體中定義的核心概念之間的關聯。

第四步,通過語義關聯模型(如圖4所示),在各種軟硬件工具的支撐下進行單元信息關聯數據集的創建與發布,最終實現資源間的語義關聯,為用戶提供單元信息在線瀏覽與分類導航、本體可視化瀏覽與檢索以及基于SPARQl的查詢等語義應用服務。

參考文獻

[1]馮儒佳,王忠義,王艷鳳,等.科技論文的多粒度知識組織框架研究[J].情報科學,2016,(12):46-54.

[2]張娟,倪曉建.精準服務與單元信息組織探析[J].圖書館理論與實踐,2017,(8):50-52.

[3]徐昊.科技知識對象的語義模式研究[D].長春:吉林大學,2013:1-109.

[4]許春漫.泛在知識環境下知識元的構建與檢索[J].情報理論與實踐,2014,(2):107-111.

[5]付苓.面向大數據的單元信息知識組織體系建設框架[J]情報理論與實踐,2016,(6):96-98.

[6]付苓.基于本體網絡概念化單元信息研究[J]情報雜志,2018,37(1):122-125.

[7]HP LABS.Jena-A Semantic Web Framework for Java[EB/OL].http://jena.sourceforge.net/index.html,2011-09-25.

[8]Bizer C,Heath T,Berners-Lee T.Linked Data-The Story So Far[J].International Journal on Semantic Web and Information System,2009,5(3):1-22.

[9]翟姍姍.基于關聯數據的非物質文化遺產資源聚合研究[M]北京:科學出版社,2015.

[10]Bechhofer S,Miles A.SKOS Simple Knowledge Organization System Reference[EB/OL].http://www.w3.org/TR/skos-reference/,2014-05-26.

[11]倪曉建.問道書淵:圖書館工作偶拾[M].上海:上海科學技術出版社,2014.

[12]司亞雪.中醫養生健康教育對高血壓患者生活方式的影響[J].中國中醫藥現代遠程教育,2011,(12):85-86.

[13]顧寧,陳紅錦.高血壓病中醫特色療法[M].北京:人民軍醫出版社,2012.

[14]中醫養生本體[EB/OL].http://www.tcmkb.cn/ontologies/health/,2015-10-01.

(責任編輯:陳 媛)

主站蜘蛛池模板: 国产jizzjizz视频| 亚洲中文字幕日产无码2021| 欧美翘臀一区二区三区| 久久久久亚洲精品成人网| 亚洲无线一二三四区男男| 成人自拍视频在线观看| 国产成人久久777777| 视频一区视频二区日韩专区| 日日摸夜夜爽无码| 在线欧美日韩国产| 性欧美在线| 色婷婷在线播放| 成人综合在线观看| 综合色88| 欧美伦理一区| 亚洲中文字幕在线一区播放| 国产美女视频黄a视频全免费网站| 高清久久精品亚洲日韩Av| 999精品色在线观看| 亚洲国产清纯| AV网站中文| 精品视频在线观看你懂的一区| 欧美人与动牲交a欧美精品| 99久久亚洲精品影院| 经典三级久久| 成人年鲁鲁在线观看视频| 午夜国产精品视频黄| 国产精品三级av及在线观看| 福利片91| 精品国产成人三级在线观看| 久久国产免费观看| 毛片网站免费在线观看| 日韩精品免费一线在线观看| 亚洲AV无码乱码在线观看代蜜桃| 亚洲日韩高清在线亚洲专区| 中文字幕在线视频免费| 亚洲精品爱草草视频在线| 国产精品99一区不卡| Jizz国产色系免费| av无码久久精品| 秋霞午夜国产精品成人片| 欧美成人午夜视频免看| 天天色天天操综合网| 久久人妻xunleige无码| 婷婷六月综合| 性视频一区| 二级特黄绝大片免费视频大片| 精品夜恋影院亚洲欧洲| 亚洲一区二区三区国产精品 | 国产在线麻豆波多野结衣| 国产呦精品一区二区三区网站| 国产无遮挡猛进猛出免费软件| 亚洲清纯自偷自拍另类专区| 免费观看亚洲人成网站| AV不卡无码免费一区二区三区| 日韩人妻精品一区| 国产理论精品| 国产无人区一区二区三区| 最近最新中文字幕免费的一页| 亚洲综合精品香蕉久久网| 98超碰在线观看| 亚洲三级a| 国产精品美人久久久久久AV| 久久精品日日躁夜夜躁欧美| 亚洲第一黄色网址| 无码粉嫩虎白一线天在线观看| 香蕉视频在线观看www| 中文字幕一区二区人妻电影| 午夜一区二区三区| 国内精品手机在线观看视频| 亚洲男人在线| 72种姿势欧美久久久大黄蕉| 亚洲第一天堂无码专区| 在线观看欧美国产| 国产成人精品第一区二区| 狠狠色狠狠色综合久久第一次| 日本五区在线不卡精品| 无码中文字幕加勒比高清| 亚洲精品成人7777在线观看| 99中文字幕亚洲一区二区| 精品一区二区三区波多野结衣 | 欧美激情网址|