999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

滿族民間故事口述檔案知識組織研究

2022-01-06 12:52:14王志宇
蘭臺世界 2021年12期

鄧 君 呂 佳 王志宇

一、引言

進入21世紀以來,非物質文化遺產的保護與傳承愈發受到國內與國際社會的普遍關注,《保護非物質文化遺產公約》在聯合國教科文組織的統籌推動下得以頒布,世界多國也紛紛響應,出臺相關政策。其中,我國依托《中華人民共和國非物質文化遺產保護法》,將非物質文化遺產的保護與傳承納入國家法律層面。滿族民間故事作為國家級非物質文化遺產,是滿族的集體記憶和中華民族寶貴的文化財富。現代生產生活方式快速變化發展,口耳相傳的滿族民間故事活態傳承受到沖擊,除了培養“非遺”傳承人外,深入田野采錄滿族民間故事將其“固化”到一定載體上也是一種良好的保護傳承方式,而這一保護方式形成的直接成果即為滿族民間故事口述檔案。

“口述檔案是指以錄音或根據錄音逐字記錄的方式對個人有計劃采訪形成的檔案。”[1]77結合滿族民間故事采集實際情況,筆者認為,滿族民間故事口述檔案是個人或組織在對滿族民間故事進行調查時,對滿族民間故事講述人的講述內容以錄音、錄像、文字等方式記錄從而形成的有價值的原始材料。目前,滿族民間故事口述檔案開發利用方式較為傳統,以傳統編研出版為主,但這遠不能滿足數字時代用戶的知識需求。因此,迫切需要創新滿族民間故事知識組織技術與方法,從而促進滿族民間故事的保護與傳承。

知識組織由信息組織發展而來,是對知識單元之間的關系進行揭示、描述和發掘的活動。知識組織方法眾多,其中分類法按學科體系組織知識,具有很強的系統性;主題法按問題組織知識,靈活性較強,但兩者均是線性知識組織方法,不能充分揭示知識內在本質和知識間復雜關聯;元數據是目前描述檔案內容、背景和結構信息以及過程管理信息的主流方法[2]36,但難以達到不同粒度的知識揭示。本體(Ontology)作為知識組織的核心方法,是共享概念模型的形式化、明確的規范[3]199,其跨越了語義鴻溝,在機器和人之間建立了廣泛的表達連接,充分實現領域知識模型概念交換和重用。筆者以知識組織視角切入,采用本體方法對滿族民間故事口述檔案進行知識層面組織,以網絡化、非線性、可視化的方式揭示滿族民間故事口述檔案中知識及其關聯關系,推動滿族民間故事口述檔案知識面向語義化、精細化組織。

二、文獻回顧

“口述檔案”這一概念始源于1984年國際檔案理事會出版的《檔案術語詞典》中出現的法文詞條“Archives orals”[4]42。我國關于口述檔案的研究發軔于20世紀80年代中期,1986年呂明軍[5]6進行口述檔案理論探討,包括其概念、價值、興起及原因等方面內容,拉開了我國口述檔案的研究序幕。時至今日,口述檔案已歷經30多年的研究歷程,取得了豐富的研究成果。在基礎理論研究方面,王茂躍[6]15、張仕君[7]12、王景高[8]6、張錦[9]5等學者對口述檔案概念進行辨析,主要在“‘口述檔案’是否屬于檔案”這一問題上進行了激烈的爭辯;劉旭光[10]88、馮舫女[11]31、黃霄羽[12]4等人對口述檔案的價值與作用進行深入探討,認為口述檔案除了本身具有憑證價值和參考價值外,還有填補歷史空白、構建社會記憶、保護民族文化遺產等價值。在口述檔案實踐研究方面,李小江[13]26、李濤[14]12、古琬瑩[15]87等人從不同視角對口述檔案的搜集與整理進行重要闡述;傅華[16]41、楊祥銀[17]60、蔣琳[18]70對國外口述檔案實務工作進行介紹和推廣,以期為我國口述檔案工作提供借鑒和參考。口述檔案開發利用研究能有效推進口述檔案價值實現,其研究成果目前已涉及各專門領域,如歷史名人口述檔案[19]、高校口述檔案[20]33和黨史口述檔案[21]84開發利用等。在政府大力倡導保護非物質文化遺產的背景下,加之少數民族文字檔案匱乏,眾多學者將目光聚焦于少數民族口述檔案研究。如子志月[22]、孫麗娜[23]、鄧寶瑚[24]78、董甜甜[25]23分別探討了云南少數民族口述檔案、佤族口述檔案、瑤族口述檔案和白族民間故事口述檔案的開發利用,并從增強開發利用意識、完善法律制度、注重編研成果多樣化、舉辦展覽、出版書刊、拍攝影視作品等角度創新開發路徑。

相比于圖書、情報等其他信息資源,檔案具有一定封閉性,知識服務體系相對獨立,知識組織研究起步相對較晚,故而檔案學界對理論研究相對匱乏。熊志云[26]29認為,以知識組織方式開辟檔案服務網站是整合檔案信息資源的有效手段;王應解[27]23闡述了數字社會信息化浪潮下檔案知識組織的必要性,并就“如何進行檔案知識組織”做了初步探討。方法技術層面,學者們主要探討了各類知識組織方法應用于檔案資源的適用性,如李婉月等人[28]56對分面組織、本體和關聯數據檔案資源知識組織方法和技術進行調研分析,以期建立合適的檔案知識組織框架;呂元智[29]44分析了關聯數據在檔案資源知識組織中的可行性和必要性,并提出“關聯”組織框架及完善建議;張斌等[30]51提出,基于本體的檔案知識表示和組織是檔案知識庫知識處理的最佳選擇,并提出基于知識庫的知識服務模型。領域應用方面,近年涌現出了一批依托相關領域檔案資源進行知識組織實踐的成果。如陳海玉等[31]111對“南昌起義”這一事件的數字資源進行本體構建,實現知識聚合和可視化,推進抗戰檔案資源知識服務;陳忻等[32]80通過LDA模型對北京香山紅色檔案進行深入挖掘并構建本體,實現知識細粒度關聯,促進紅色檔案資源開發利用;祝振媛[33]72以《吳氏西宅宗譜》為研究對象,構建了吳氏家譜本體,推動“新鄉賢建設”和“家風建設”。

綜上所述,口述檔案領域研究成果豐碩,內容豐富,經歷了從理論探討到實踐研究這一主線轉變,且研究方向仍在繼續拓展,但對口述檔案開發利用方式的研究還不夠創新。檔案資源知識組織的研究成果隨著檔案知識服務需求的增長而不斷增加,尤其在知識組織方法技術方面,學界已普遍認同本體是檔案資源良好的知識表示和知識組織形式。但對檔案資源進行本體構建實踐的研究尚處于初級階段,對于非物質文化遺產口述檔案方面也尚未有構建先例。本體具有開放集成性、語義化、共享性等優勢,因此筆者選擇對滿族民間故事口述檔案進行本體構建,實現知識組織向多維網絡化、可視化方向發展,促進滿族民間故事口述檔案深層次的開發利用。

三、滿族民間故事口述檔案本體模型構建

筆者以斯坦福大學創建的七步法[34]為基礎,并根據滿族民間故事口述檔案知識的特點,設計了針對滿族民間故事口述檔案的本體構建方法,并以Protege作為其本體開發工具,具體步驟包括:確定本體專業領域及復用本體、確定數據來源與數據預處理、定義類和類的等級體系、定義類的屬性、實例可視化和知識檢索。

1.確定本體專業領域及復用本體。

(1)確定本體專業領域范疇。滿族民間故事口述檔案以一則則滿族民間故事為主體內容,以口述者、采集者、采集時間、采集地點等描述性信息為輔助內容。其中故事主要包括反映建州女真起源的神話,反映人物、史事和地方風物的傳說,反映人與自然、階級社會關系以及滿族動植物崇拜的幻想故事,反映農耕滿族經驗與際遇的生活故事等[35],是珍貴的非物質文化遺產。因此,涉及的領域主要是非物質文化遺產領域和口述檔案領域。

(2)考察可復用本體。CIDOC-CRM是文化遺產領域重要的本體模型,它是20多年開發和維護工作的結果,開發旨在通過為基于證據的文化遺產信息集成提供通用且可擴展的語義框架來促進對文化遺產信息的共享理解。其最新版本是2021年5月發布的7.1.1版本,共包含81個實體(Entity)和160個屬性(Property),內容涵蓋文化遺產領域的歷史史實、時間、地點、人物等信息[36],可用于滿族民間故事口述檔案本體模型的復用。

同時,筆者根據國家檔案局發布的行業標準《口述歷史電子檔案元數據方案》(DA/T-2015)相關規定,結合滿族民間故事口述檔案知識實際情況,進行部分本體自定義。為了日后能在語義網環境中實現本體復用與共享,需要了解或定義本體的前綴及IRI。CIDOC-CRM本體模型前綴為ecrm,IRI為http://erlangen-crm.org/150716/,類的命名方式為“實體代碼”+“實體名稱”,如“人物”類為“E21 Person”,屬性命名方式為“屬性代碼”+“屬性名稱”,如屬性“參與了”命名為“P11 had participant”。自定義的本體前綴為mfs,IRI為http://www.semanticweb.org/mfs#。為清晰地區分類與屬性,將類標記上角標c,將對象屬性和數值屬性分別標記上角標op和dp。

2.確定數據來源與數據預處理。本研究以《滿族民間故事·遼東卷》(上中下卷)[37]數字資源作為主要數據源,其收錄513篇滿族民間故事,每篇故事后附相關采錄信息,為構建本體提供了翔實的數據基礎。同時,為確保數據的豐富性和代表性,以中國非物質文化遺產網[38]、遼寧非物質文化遺產(國家級)多媒體資源庫[39]、《滿族民間故事選》[40]、《滿族民間故事選》(第一集)[41]和《滿族民間故事選》(第二集)[42]的數字化文本作為補充數據源。采用人工方式對以文本格式、圖片格式存在的數據進行采集,獲取有關滿族民間故事的內容數據與口述檔案形成過程中的描述性數據。采集后,對數據進行預處理,剔除重復數據,對有效數據進行校對核查。

3.定義類和類的等級體系。類是具有某種共同屬性的事物集合,確定本體的類及子類是本體構建的基礎。筆者對上文采集的數據進行深入分析與概念歸納,并結合CIDOC-CRM和《口述歷史電子檔案元數據方案》(DA/T-2015)有關實體與元數據,對滿族民間故事內容信息進行概念提取,得到“民間故事”“故事角色”“故事地點”“習俗”“風物”和“方言”;對描述性信息進行概念提取,得到“口述者”“采集者”“采集時間”“采集地點”。其中“民間故事”類可按其表達內容的不同劃分為“神話”“傳說”“故事”三個子類,“口述者”“采集者”都是人物,所以兩個子類歸為“人物”大類,但“故事角色”中包括神仙、鬼怪等非真實存在人物,因此不能將其歸入“人物”大類,而單獨設類。同理,將“采集地點”和“故事地點”歸為“地點”大類,將“采集時間”和“故事時間”歸為“時間實體”大類,最終形成八個大類。滿族民間故事口述檔案類及說明具體見表1(見下頁),類及類的層次結構如圖1(見下頁)所示。

圖1 滿族民間故事口述檔案本體類及類的層次結構

表1 滿族民間故事口述檔案本體類及其說明

4.定義類的屬性。定義好滿族民間故事口述檔案的類與其子類后,需要對類的屬性進行定義,可以更好地體現類的內涵和實現類之間的相互關聯,從而實現單一的線性向網絡化的知識組織模式轉變。

類的屬性包括對象屬性和數據屬性。對象屬性是實現語義推理的重要基礎,因為它是連接類之間、類與實例之間、實例與實例之間的橋梁,相當于語法結構中的謂語動詞,屬性的定義域相當于語法結構中的主語,其值域相當于語法結構中的賓語。比如屬性“講述了”將作為定義域的“口述者”和作為值域的“民間故事”相連接,對象屬性除了能將兩個不同的類之間進行關聯,還可以指向自身,滿族民間故事中,故事角色往往有一定的社會關系,如姐妹關系、父子關系、師徒關系,而這類關系兩端相連的都是“故事角色”類,因此屬性關系指向“故事角色”自身。

數據屬性是描述類自身特性的內在屬性,能使類的內涵更為豐富。其定義域是類,值域是某一數據類型,如xsd:string、xsd:integer、xsd:float、xsd:int等。在滿族民間故事口述檔案中,口述者的數據屬性十分重要,口述者年齡、性別、職業、文化程度可以在一定程度上揭示滿族民間故事的保護與傳承情況,甚至可以為下一步的保護措施提供有益參考。如口述者的年齡大多在70歲以上,說明口述者隊伍年齡老化,則需要加強滿族民間故事傳承人的發展培養,確保其能夠活態地傳承發展下去。滿族民間故事口述檔案的屬性定義具體見表2,添加屬性后的知識本體見圖2。其中實線代表父類與子類的關聯,虛線代表定義的各屬性,連線的箭頭代表從定義域指向值域。

圖2 添加屬性后的滿族民間故事口述檔案知識本體

表2 滿族民間故事口述檔案本體屬性及其說明

5.實例可視化。對滿族民間故事口述檔案進行類與屬性的定義后,是完成了本體模型的框架搭建,是概念層面的構建,需要向其中添加實例才能豐富知識本體,是應用層面的構建。筆者對采集到的滿族民間故事口述檔案數據進行評估取舍,選取了代表性實例進行添加,共錄入129個實例,其中民間故事類28個、人物類21個、時間實體類14個、地點類22個、習俗類6個、方言類10個、風物類7個、故事角色類21個。表3(見下頁)為添加的部分實例,圖3(見下頁)展現了添加實例后的本體模型。

圖3 添加實例后的滿族民間故事口述檔案知識本體

表3 滿族民間故事口述檔案部分實例

6.知識檢索。知識組織旨在實現知識檢索,知識檢索是進行知識組織的歸宿。本體構建完成后,筆者采用Protege中OntoGraf插件自帶的Search檢索功能進行基本的知識檢索,以驗證模型的可用性。以搜索“康熙”二字為例,為清晰表達各知識單元屬性,根據OntoGraf檢索界面呈現結果,繪制可視化圖,見圖4。

圖4 以“康熙”為關鍵詞進行的知識檢索

在本體庫中所有與“康熙”有關的內容被檢索出來。從類與實例的關聯觀察,可以看到“康熙”和“乾隆”是“故事角色”的實例,“康熙與乾隆的一副對聯”是“傳說”的一個實例,“康熙年間”是“故事時間”的一個實例,也就是說,可以檢索出與“康熙”二字有關的所有實例,并關聯其所屬類別。從實例與實例的關聯觀察,可以從關聯線數最多的“康熙與乾隆的一副對聯”出發,以此為中心,了解它與其他實例的關系,我們可以清晰地了解到“康熙與乾隆的一副對聯”采集地點在本溪滿族自治縣偏嶺鎮泥塔村,采集時間為2008年7月19日,口述者為愛新覺羅·慶凱,采集者為張瑩,故事發生地點為北京,故事發生時間為康熙年間,康熙與乾隆是此故事的角色,且二者為爺孫關系。此外,在Protege系統中點擊愛新覺羅·慶凱,可以看到其具體的數值屬性,其出生日期為1935年7月,民族為滿族,文化程度為初中文化,性別為男,采集故事時其年齡為74歲。

由此可見,知識檢索實現了滿族民間故事口述檔案不同類型知識單元的關聯,當檢索某一知識時,與其有關聯的所有知識以可視化方式呈現,并能展現其具體關系,充分體現滿族民間故事口述檔案內涵,實現了其知識內部細粒度挖掘和開發利用,有利于人們從細微角度了解滿族民間故事,從而感受民族精神與民族智慧。

四、總結

本文以滿族民間故事口述檔案為研究對象,以本體模型構建方法為基礎對其進行知識組織,探索滿族民間故事口述檔案深度開發,揭示滿族民間故事口述檔案知識間動態關聯,為民間故事口述檔案本體構建與知識檢索提供了一定參考價值,但同時也存在不足之處:對于數據的采集與分類使用手工方式,使采集數據量有限且效率較低,質量缺乏保障,類與屬性的定義有待進一步完善。未來,筆者將在以下方面繼續開展深入研究:(1)融合機器學習、自然語言處理等人工智能技術,將傳統的手工數據采集轉變為半自動、自動方式,高效高質對模型進行科學性維護。(2)應用SPARQL語言查詢滿族民間故事口述檔案知識本體語義關系,增強知識檢索能力與語義化程度。(3)實現滿族民間故事口述檔案知識推理,將不能通過可視化圖清晰展現的屬性采用知識推理機制挖掘隱性關聯。

主站蜘蛛池模板: 大香网伊人久久综合网2020| 亚洲乱码在线播放| 毛片在线播放网址| 色亚洲激情综合精品无码视频| 国产成a人片在线播放| 2020最新国产精品视频| 日韩性网站| 91精品人妻互换| 欧美天天干| 在线观看免费人成视频色快速| AV不卡无码免费一区二区三区| 国产精品一区在线麻豆| 在线亚洲天堂| 精品国产免费观看| 三上悠亚一区二区| 国产探花在线视频| 日本在线免费网站| 中国国产高清免费AV片| 国产成人AV大片大片在线播放 | 亚洲丝袜中文字幕| 色综合热无码热国产| 免费一级毛片在线观看| 性网站在线观看| 亚洲成aⅴ人片在线影院八| 四虎精品国产AV二区| 久热99这里只有精品视频6| 久草中文网| 萌白酱国产一区二区| 国产成人久久777777| 精品福利视频网| 无码免费的亚洲视频| 亚洲色偷偷偷鲁综合| 手机在线看片不卡中文字幕| 亚洲国产综合自在线另类| 91视频免费观看网站| 欧美成人aⅴ| 国产精品久久久久鬼色| 黑人巨大精品欧美一区二区区| 免费啪啪网址| 日本不卡在线播放| 亚洲色欲色欲www网| 18禁色诱爆乳网站| 亚洲午夜综合网| 久久semm亚洲国产| 日本妇乱子伦视频| 久久精品娱乐亚洲领先| 最新午夜男女福利片视频| 奇米精品一区二区三区在线观看| 久久96热在精品国产高清| 久操线在视频在线观看| 一级一级一片免费| 婷婷成人综合| 波多野结衣一区二区三区AV| 日韩在线视频网站| 青青操国产视频| 久青草国产高清在线视频| 亚洲最新在线| 亚洲精品波多野结衣| 一区二区理伦视频| 影音先锋亚洲无码| 国产丝袜91| 亚洲欧美另类中文字幕| 日本欧美视频在线观看| 久久香蕉国产线看精品| 久久久久无码国产精品不卡| 日韩精品一区二区三区视频免费看| av免费在线观看美女叉开腿| 国产福利2021最新在线观看| 精品国产一二三区| 一级毛片免费播放视频| 亚洲天堂日韩在线| 久久免费精品琪琪| 综合色亚洲| 伊人久综合| 久久人搡人人玩人妻精品一| 国产第八页| 鲁鲁鲁爽爽爽在线视频观看| 日本久久免费| 高清久久精品亚洲日韩Av| 毛片在线播放a| 九色视频在线免费观看| 日韩天堂网|