999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的家譜知識圖譜模型及檢索系統

2017-07-12 16:07:08朱玲萱
電子設計工程 2017年12期

姜 贏,張 婧,朱玲萱

(北京師范大學 珠海分校,廣東 珠海519087)

基于本體的家譜知識圖譜模型及檢索系統

姜 贏,張 婧,朱玲萱

(北京師范大學 珠海分校,廣東 珠海519087)

基于更好地提供家譜知識管理與信息檢索服務的目的,提出了建立基于本體的家譜知識圖譜模型的方法。采了本體技術解決了家譜管理模型中宗族人物關系知識建模問題。利用了本體分子技術解決了家譜中動態知識和多粒度知識問題。通過基于Java EE框架B/S模式的家譜檢索系統的開發與實驗,實現了關于家譜檢索的5大功能,對于我國家譜館藏知識的挖掘與利用有積極意義,也為本體在復雜領域知識圖譜的綜合運用提供了新思路。

家譜;本體;本體分子;知識圖譜

家譜是指以記載某一家族血緣世系為核心內容的,用以維系家族世次順序的文獻載籍,具有重要的歷史資料價值。數量可觀的家譜,不僅對家庭制度、婚姻制度、人口與替等研究有著不可替代的資料價值,即對歷史學、民俗學、社會學、經濟學、教育學等都能提供許多重要資料。如稱雄一世的徽商研究,其中不少有價值的資料主要是從皖南徽商家譜中尋得的[1]。家譜也為尋家族根認同提供重要資料。隨著改革開放的進一步發展,海內外游子過去夢想的尋根謁祖,早已成為現實。特別是香港回、澳門回歸祖國之后,洗雪了百年民族恥辱,海外華人揚眉吐氣,“一國兩制”更增強了海內外中華民族子孫的向心力,于是訪故里、訪故舊、訪祖國,掀起了更大的尋根認同熱。浩如煙海的家譜資料則為尋根認同提供了保證。家譜對進行愛國主義教育、開展尋根認同、促時臺灣回歸祖國統一大業,有其他資料不能取代的重要作用。

研究建立家譜知識圖譜模型的主要目的是支持家譜信息的查詢,方便人們追根溯源,以發掘家譜的歷史文化價值。家譜知識圖譜系統的工作內容是通過對現有的家譜信息進行有效的收集、分析,在現有的技術基礎上,描述家譜知識,建立宗族人物關系網絡,并使用可視化的方式展示家族動態變化的過程,以方便人們了解其家族的繁衍過程以及姓氏來源。

1 研究現狀分析

隨著信息技術的普及化,家譜的電子化成為現實,而且電子家譜查詢系統在人們的生活中也有了一定的應用[14]。國內外影響比較廣泛的電子家譜系統有:1)尋根網[2]:尋根網以家譜為紐帶介紹了全國近五百多個姓氏的源流及歷史人物、歷史典故、分布范圍,家譜收藏研究等多方面的內容。尋根網立足從基本地情、人情出發,充分運用現存的家譜和當今的人口資料,追溯、探討各姓氏的發端、由來,以及遷徙的狀況、路線、當前的聚居點,同時收集、列舉有關該姓氏中比較突出的人物及他們所做出的歷史功跡。尋根網有一個尋根檢索欄目。該欄目提供譜資料、百家姓、字輩派語、歷史圖片、歷代年號、新老地名、地方志等家譜信息的查詢。該查詢通過關鍵詞匹配實現,以文本的形式返回查詢結果。2)中國家譜網[3]:中國家譜網介紹了與家譜相關的新聞、家譜總目、姓氏文化、譜文化等家譜 知識,幫助人們追本溯源。中國家譜網的檢索欄目可以通過姓氏、分布地、堂號、名人等關鍵字的匹配進行尋根問祖方面的信息查詢,姓氏拼音、中文姓氏等關鍵詞的匹配檢索百家姓信息,另外也支持其他關鍵詞的匹配來檢索古今地名、歷史名人、歷代年號等內容的查詢。3)PhpGedView[4]:PhpGedView系統以直觀的圖表展現家譜信息,具有不同語言的版本。其用來傳達信息的圖表主要有一下幾種:家譜結構樹,以樹形圖的形式展現家譜的世系圖,每個人物對應的節點包含有人物圖像、出生日期和死亡日期等信息,并且包含鏈接到人物詳細信息的超鏈接。關系圖,通過輸入兩個人物的名字,展現這兩個人物的相關關系。家系圖,可以檢索人物的父母、兄弟、子女、祖父母的信息。對應于每種關系,以一個樹形圖的形式展示出來。該系統用圖表的形式展現信息,內容直觀,但是依然是基于關鍵字的檢索。

綜上所述,一般的電子家譜主要基于關鍵詞匹配進行查找,查詢結果往往是原始的家譜文獻或簡單的家譜結構樹,很少做進一步的智能化處理,不能進行深入的語義挖掘。這些問題正好是本體論及其相關技術能夠解決的問題[13]。文中提出基于本體的家譜知識圖譜模型研究,將本體的引進對于解決家譜問題的作用主要體現在3個方面:1)本體描述家譜概念。本體可以很好的描述家譜中的概念,讓家譜信息成為機器可理解的知識,為進一步的推理做好準備。2)本體分子[5]理論和技術解決家譜中的動態知識和多粒度知識問題。3)本體推理實現家譜隱性知識的挖掘。本體推理利用推理公理和推理規則的使用,根據現有的本體模型中的三元組得出額外的本體三元組,實現了隱性知識的挖掘。

2 家譜知識圖譜模型關鍵技術問題

2.1 宗族人物關系知識描述問題

作為家譜中最重要的內容,“世系表”就是說明一個家族成員,如:父子、兄弟間的相互關系,寫清楚祖先后代每一個家族成員名字的圖表[15]。它有4種基本的記述格式:歐式、蘇式、寶塔式和牒記式[6]。這四種世系表形式都各有特色,這是一般族譜中比較常見的世系表,但也有其它的變化,在記述家族世系表時,可根據掌握材料的多少、家族成員的多少等靈活采用。筆者在分析其他家譜系統世系表基礎之上,總結與提煉家譜知識中共性特征,提供最大限度兼容性以滿足各種類型家譜中個性特征的管理要求,提出了基于本體的家譜世系表知識建模框架。世系表結構可以抽象為一個本體層次模型的樹模型。如圖1中的世系表為樹形結構,節點以性別區別顏色,男性為淺色背景,女性為深色背景。

圖1 世系表樹形結構圖

在家譜知識圖譜中,宗族人物之間的關系描述是最重要而又最復雜的。如 “父母與子女”、“祖父母”、“曾祖父母”、“兄弟姐妹”、“妯娌關系”、“連襟關系”、“叔侄關系”、“姨甥關系”等等。筆者以本體RDF/OWL語言[7]作為家譜人物關系描述語言,能夠通過統一的模式表達豐富的人物關系。人物用本體實例來描述(圖中的節點),人物之間的關系用屬性來描述(圖中的邊)。圖中鼠標焦點所描述的是“宋慶齡”是“孔令杰”的“阿姨”,也就是一種“姨甥關系”。通過這種描述方式,可以建立復雜的家族人物關系網絡。

但是如果人物之間關系過于復雜,家譜橫跨的歷史時期過于漫長,那么家族人物之間關系的建立會變得非常費時費力。筆者采取本體推理技術能夠很好的解決這個問題。本體推理的思路是:只建立家族人物之間最直接的關系,而對于間接關系通過制定推理規則自動生成人物關系[7]。“宋慶齡”和“孔令杰”的“阿姨”關系并不需要在數據庫中建立,而是通過制定“姨甥關系”推理規則自動生成的。“宋慶齡”之所以是“孔令杰”的“阿姨”,原因是以下3條規則:1)“宋靄齡”是“宋慶齡”的“姐妹”;2)“宋靄齡”是“孔令杰”的“母親”;3)“宋慶齡”是“女性”。 本體通過RDF/OWL語言描述顯性知識(宗族人物直接關系),通過規則推理挖掘隱性知識 (宗族人物間接關系),能夠較好的解決家譜宗族人物關系問題。

2.2 家譜多粒度知識管理問題

知識管理的粒度指的是知識組織和檢索過程中的基本知識單元的范圍的大小以及描述程度的粗細。在知識粒度劃分方面,家譜知識管理面臨者兩難的局面:一方面以家族人物為知識單元,顯得粒度太細;另一方面,如果以整個家譜作為知識單元,又顯得粒度太粗而且缺乏知識揭示、演化、管理與利用的靈活性。因而,目前迫切需要一種粒度適中的知識單元作為知識管理的基礎。

解決家譜多粒度知識管理問題將采取本體分子技術:同時采用兩種粒度的本體分子,建立兩者之間的關聯。如圖2所示,按照“人”作為粒度劃分本體分子,則關于這個人的家傳、藝文著錄、家譜圖像、所對應的家譜可以作為靜態信息,即為本體分子的 “核子”,婚配情況等動態信息則作為“離子”;按照“家譜”作為粒度劃分本體分子,則將這個家族的姓氏源流、堂號、家訓看成本體分子的“核子”,可能包含的動態信息則看成本體分子的“離子”。在“人”和“家譜”這兩種知識粒度的基礎之上,可以根據需要創建新的知識粒度,如“張三的兄弟關系”、“李四的婚姻關系”等等。

圖2 基于本體分子的家譜多粒度知識示意圖

2.3 家譜動態知識演化問題

動態知識的特點在于,隨時間或情境的延續或變化,用于揭示知識內涵的特征屬性的狀態以及這些特征屬性之間的關系都會隨之演化。家譜中存在的動態知識主要有以下幾種[8]:1)家族的姓氏的起源。比如說諸這個姓,是五代十國的時候,后周有個貴族叫諸葛十朋,趙匡胤發動陳橋兵變建立宋朝后,又不愿別人打聽到他,諸葛十朋就改姓名諸十朋,隱居在會稽山中,他的后代于是改姓單姓諸,成為諸姓的一個來源。2)家族的姓氏的變化。總的說來原因有:避禍改姓、避諱改姓古代帝王的名字不準別人使用、同一姓因異體字寫法不同,以及少數民族漢化以將原來的部落改為漢姓。3)家譜中人物的婚姻配偶關系、人物仕途歷程等等都是隨時間和情境的變化動態演變的。

解決動態知識問題也采取本體分子技術[9]。本體分子按照一定粒度劃分知識語義片段,如人物本體分子和家譜本體分子,主要包括“核子”和“離子”兩個部分。“核子”是本體分子中靜態不變的知識,如家譜人物本體分子中關于人物的 “性別”、“出生時間”等等。“離子”是本體分子中可以動態變化的知識,如家譜人物本體分子中人物的“姓名”、“婚配關系”、“仕途歷程”等等。

對于家譜中家族本身,它的“家族姓氏”可能由于各種原因不斷變化,但是家族還是那個家族。比如春秋戰國時期,陪趙太子赴秦的藺相如,因太子途中得急癥而亡被處極刑,割頭挖心,藺氏的家族因此受其株連,為逃避這場災難,藺字去頭,挖心(“佳”),改姓為門;清朝由于文字獄,個別姓氏如“查”成了忌諱,于是家譜改成了“香”,隨后,文字獄的平反,姓氏又改了回來。“家族姓氏”的這種變化不能說是家族本身的變化,它的核還是沒有變。對于本體分子的控制,最重要的是要抓住本體分子的核子。不管本體分子如何動態變化,它的核是不會變化的。

由于本體分子中還存在著“離子”在不斷演變,本體分子的形態可以隨之改變,比如一個人的仕途歷程盛衰表現為各個時期人的經歷與境遇的不同變化。針對這些動態變化的知識,可以建立各種家譜本體分子演化的模型。

3 基于本體的家譜知識圖譜檢索系統

3.1 系統總體架構

模型系統的整體設計采用B/S模式,是采用Java EE框架的系統體系結構實現的。客戶端使用瀏覽器訪問服務器提供的Web接口或Web頁面;服務器端采用多層體系架構設計,包括:基于Web服務器的表現層、基于應用服務器的中間層、基于數據庫系統的數據存儲層等,系統的整體結構如圖3所示。視圖表現層為用戶通過瀏覽器訪問信息檢索系統提供了一個基于Web的接口,該層所采用的主要技術包括客戶端的Prefuse[10]技術,以及服務器端的JSP、Servlet技術。應用服務器中間層采用中間件技術,由JavaBean技術實現,運行在應用服務器中。本體查詢組件和本體構建組件是整個系統的核心部件,使用了Jena[11]的API來實現。數據存儲層是家譜本體庫和家譜本體分子庫,采用AllegroGraph[12]系統實現數據存儲,是整個系統的基石。

圖3 系統結構圖

3.2 系統功能

如圖4所示,家譜查詢系統主要包括:家譜檢索,人物檢索,字輩排行,追根溯源,家族名人,家族遷徙,家族輝煌等功能。字輩排行,追根溯源,家族名人和家族輝煌,家族遷徙是該系統的特色欄目,通過這些欄目的使用,用戶可以獲得非常良好的體驗,更加方便快捷地獲取他想獲取的信息。

系統主要功能包括:

1)家譜檢索:家譜檢索欄目主要實現檢索一個家族的基本信息,如姓氏源流,堂號家訓,世系圖,家傳,家譜圖像,家族關系等。在世系圖中,用戶輸入姓氏“奇渥溫”,年代“1167-1292”,并指定為“精確查詢”后,點擊“搜索”按鈕,圖6的下半部分的結果顯示展現出了奇渥溫家族1167年到1292年的世系圖。其中,加了框框的表示的是有官位,框框里面是橙色表示這個人曾經是帝王。最上層的“鐵木真”出生于1167年,最下層的“真金”死于1292年。

2)人物檢索:人物檢索欄目用于檢索人物以及人物之間的關系。下面再分個人查詢和兩人關系查詢這兩種功能。兩人關系又可以具體定位到婚姻,兄弟姐妹,平輩,祖孫等關系。在這里我們使用具名圖來表示不同粒度知識的檢索及動態知識的表示。

3)字輩排行:字輩排行欄目提供對一個家族中某一字輩的人物及其附近幾代的人物進行檢索的功能。例如,用戶輸入姓氏“歐陽”,字輩“子”,選擇“精確查詢”后點擊“搜索”按鈕,可檢索出“歐陽”家族中,與“子”字輩上下相鄰3個字輩的宗族人物排行。

圖4 基于本體的家譜知識圖譜檢索系界面

4)追根溯源:追根溯源欄目是我們的一個特色欄目。用戶可以借助于此系統,追根溯源,查詢自己所在的家族以及該家族的遷徙信息。我們可以簡單地輸入自己或自己的長輩的姓名、字輩信息,有選擇地輸入所在的地域信息,實現或精確或模糊的查詢。

5)家族名人:提供對某個家族的著名人士的查詢。輸入家族姓氏即可查詢到這個家族中的所有名人,點擊名人可查看其詳細信息。也可限制某一時期的名人查詢。例如,用戶輸入姓氏“李”、起始年代沒有明確限制,表示查詢李家有記載的所有家譜,選擇“精確查詢”后點擊“搜索”按鈕,結果即會顯示在頁面下半部分。系統給出了李家從唐朝開始所有的名人志士的列表,點擊人名后可查看此人物的詳細信息。

4 結 論

制定家譜知識管理標準,建立家譜知識圖譜模型,開發家譜知識檢索系統,解決家譜管理模型中靜態知識的描述問題與動態知識的演化問題,它對于我國家譜館藏知識的挖掘與利用有積極意義。文中提出采取基于本體的知識圖譜技術路線,綜合應用本體推理、本體分子和本體演化等技術,具有較強的可行性。

[1]徐彬.論明清徽州家譜編修與徽商的互動[J].學術研究,2011(6):107-111.

[2]尋根網.[EB/OL][2018-06-02].http://xungen.so/.

[3]中國家譜網.[EB/OL][2018-06-01].http://www.chinajiapu.com/view/index.asp.

[4]PhpGedView.[EB/OL][2018-05-21].http://www.phpgedview.net/.

[5]董慧,陳文樵,羅憶,等.數字檔案本體分子論及其應用研究[J].中國檔案,2010(3):57-60.

[6]丁紅.浙江家譜版本特征分析 [J].圖書館理論與實踐, 2006(1):104-107.

[7]董慧,余傳明,徐國虎,等.基于本體的數字圖書館檢索模型研究 (Ⅳ)——歷史領域知識推理機制[J].情報學報, 2006(6):666-678.

[8]周遠成,夏群芳.漢族姓氏演變源流述略[J].湖南城市學院學報, 2005(1):75-80.

[9]董慧,王菲,姜贏,等.基于數字圖書館的本體應用環境研究.中國圖書館學報[J],2009(5):52-58.

[10]肖明,栗文超,夏秋菊 .基于Prefuse和層次聚類的信息檢索主題知識圖譜研究[J].現代圖書情報技術, 2012,V28(4):35-40.

[11]Apache Jena.(2010-12-11)[2011-12-23].http://jena.apache.org/.

[12]袁瑩.基于AllegroGraph的空間數據語義查詢研究[J].廈門理工學院學報, 2011(4):50-54.

[13]夏翠娟,劉煒,陳濤,等.家譜關聯數據服務平臺的開發實踐[J].中國圖書館學報,2016(3):27-38.

[14]陳智兵.家譜檔案及其管理工作探析[J].蘭臺世界,2015(S5):95-97.

[15]陳國軍,張庭玉.二叉樹電子家譜設計[J].信息與電腦(理論版),2015(4):88,94.

Ontology based knowledge graph model of genealogical record and retrieval system

JIANG Ying,ZHANG Jing, ZHU Ling-xuan
(Beijing Normal University, Zhuhai 519087, China)

In order to provide better service of genealogical record knowledge management and information retrieval,it presents a method of creating ontology based knowledge graph model of genealogical record.It uses ontology technology to solve the problems of person relations in a family tree.Ontology molecule technology is adopted to resolve the problems of dynamic and multi-granularity of knowledge in genealogical record.A genealogical record retrieval system is developed and experimented based on Java EE framework and B/S model,with 5 major system functions.It puts forwards a new method of comprehensively applying ontology to knowledge graph in the complex domain,which is of great significance of knowledge mining and utilizing of genealogical record in store in China.

genealogical record; ontology; ontology molecule; knowledge graph

TN99

A

1674-6236(2017)12-0161-05

2016-08-22稿件編號:201608159

文化部科技創新項目(201505);廣東省科技計劃項目(2014A080804001)

姜 贏(1981—),男,湖北武漢人,博士,副教授。研究方向:自然語言處理,語義分析。

主站蜘蛛池模板: 亚洲开心婷婷中文字幕| 91在线无码精品秘九色APP| 日本亚洲欧美在线| 青青草国产免费国产| 中文无码精品A∨在线观看不卡 | 日韩精品亚洲人旧成在线| 欧洲av毛片| 国产自无码视频在线观看| 99在线免费播放| 国产主播在线观看| 国产一级二级三级毛片| 日韩在线视频网| 欧美精品在线免费| 中国特黄美女一级视频| 美女黄网十八禁免费看| 毛片免费高清免费| 亚洲精品动漫| 一个色综合久久| 国产精品专区第1页| 久草美女视频| 成人夜夜嗨| 亚洲综合经典在线一区二区| 人妻少妇乱子伦精品无码专区毛片| 茄子视频毛片免费观看| 亚洲一区二区日韩欧美gif| 人妻中文久热无码丝袜| 91 九色视频丝袜| 国产第二十一页| 1769国产精品视频免费观看| 一本大道视频精品人妻| 久视频免费精品6| 亚洲欧美一区二区三区麻豆| 日韩午夜片| 92精品国产自产在线观看| 91九色视频网| 国模视频一区二区| 欧美激情成人网| 久久精品aⅴ无码中文字幕| 四虎综合网| 国产理论一区| 国产欧美日韩在线一区| 国产成人高清亚洲一区久久| 国产一级毛片高清完整视频版| 亚洲美女高潮久久久久久久| 国产欧美另类| 亚洲大学生视频在线播放 | 亚洲一区二区在线无码| 国产人免费人成免费视频| 最近最新中文字幕免费的一页| 午夜国产理论| 国产XXXX做受性欧美88| 国产大全韩国亚洲一区二区三区| 国产成年女人特黄特色毛片免 | 怡春院欧美一区二区三区免费| 日韩一级毛一欧美一国产| 国产亚洲精久久久久久久91| 欧美三级视频网站| 国产第一页亚洲| 欧美成人免费| 91年精品国产福利线观看久久| 亚洲精品视频免费看| Jizz国产色系免费| 精品国产91爱| 日日摸夜夜爽无码| 996免费视频国产在线播放| 天天干天天色综合网| 国产精品护士| 99精品免费在线| 手机在线国产精品| 91啪在线| 国产91特黄特色A级毛片| 精品国产电影久久九九| 日韩不卡高清视频| 国产激爽大片高清在线观看| 色欲不卡无码一区二区| 一级爆乳无码av| 免费毛片a| 欧日韩在线不卡视频| 欧美日韩精品一区二区视频| 一级毛片不卡片免费观看| 日本成人不卡视频| 40岁成熟女人牲交片免费|