蔡 璐,熊擁軍,劉燦姣(.湖南圖書館;.中南大學圖書館;.中南大學文學院)
?
基于本體和元數據的非遺資源知識組織體系構建
蔡璐1,熊擁軍2,劉燦姣3
(1.湖南圖書館;2.中南大學圖書館;3.中南大學文學院)
摘要:非遺數字化保護是一項系統工程,為有效組織和揭示非物質文化遺產相關信息資源,本文從系統論的角度分析非遺主體、客體、過程、成果和環境五大基本因素所涉及的資源對象。應用本體論的知識組織理論與方法,構建非遺領域本體概念模型,確定這一領域的概念和關系。結合元數據的信息組織形式,對各種形態的非遺數字資源對象進行規范描述。為非遺資源的有序化組織與揭示提供理論參考。
關鍵詞:本體論;元數據;知識組織;信息組織;非物質文化遺產
非物質文化遺產(簡稱非遺)數據庫建設中,涉及的信息資源類型多樣,如傳承者、文化機構、工藝品、文獻資料、研究成果等,也存在多種表現形式,如文字、錄音、錄像和數字化多媒體等。非遺數據庫建設不僅僅是將數據簡單地組織和羅列,更重要的是揭示非遺領域的知識內容和資源的相互聯系,構建一個具有知識性、關聯性的知識體系。為適應這一需求,本體(Ontology)作為一種可在語義和知識層次上描述信息系統概念模型的建模工具,自提出以來就引起了國內外眾多科研人員的關注,并在許多領域得到廣泛應用,如知識工程、數字圖書館、信息檢索語義網等。[1]
本研究基于本體的理論和方法,對非遺資源涉及的概念和關系進行知識組織,對概念所涉及的屬性應用元數據進行語義描述,從而全方位地揭示出非遺領域的知識內容及其相互關系。
1.1資源組織模式的層次分析
隨著信息技術的發展,信息資源的內容、外在形式、存儲介質、傳輸手段都在發生變化,且組織模式也在發展變化之中,其組織形式從早期的數據組織,發展到目前的信息組織和知識組織。
數據組織(Data Organization)是按一定的方式和規則對數據進行歸并、存儲和處理的過程,最終形成一個綜合的數據集合。常用的數據組織技術有文件和數據庫。數據組織僅解決了異構信息實體的合并問題,無法反映信息實體間客觀存在著的多種聯系。
信息組織(Information Organization)也稱為信息整序,是對信息的外部特征和內容特征進行揭示和描述,使信息從無序的集合轉換為有序集合的過程。[2]信息組織依靠元數據對各種形態的信息單元和資源集合進行規范的描述、管理和有序保存。但信息組織的深度僅限于信息實體和文獻層面,沒有揭示信息實體內部的概念和語義,因而從信息組織系統中所獲取的還是信息集合,而不是知識的集合。
知識組織(Knowledge Organization)則是指對事物的本質及事物間的關系進行揭示和控制的過程和方法。[3]它是資源組織的高級階段,可使眾多的資源集合成一張巨大的知識網絡,使得面向用戶的知識檢索與知識服務成為可能。它不但包括詞表、分類法等傳統的信息組織技術,也包括了語義網、本體等現代信息和知識組織技術。[4]
1.2基于本體的知識組織
本體在哲學領域是研究客觀事物存在的本質。然而在計算機科學和信息科學領域,它是一種模型,是對那些客觀存在的對象類型或概念,及其屬性和相互關系進行形式化的表達。[5]
基于本體的知識組織,核心是構建本體模型,其要素包括類、實例、屬性和關系。類也稱概念,是指集合、概念、對象類型或事物的種類。比如把圖書的集合看成一個類或概念,特定的一本書為類中具體對象的實例。對象和類具有的特征、特點和參數,稱為類的屬性,如圖書類的屬性有標題、作者、出版社等。不同的類之間彼此存在的關聯稱為關系,如圖書和作者之間是撰寫關系。
基于本體的知識組織方法需構建一個形式化表達的本體模型。一般構造本體模型可以采用三段法[6]:(1)概念化,確定領域的元概念以及概念之間的關系,概念之間的關系包括同義關系、屬種關系、相交關系和相離關系等;(2)模型化,就是用圖示的方法表示元概念和概念間的關系,構建形式化的本體關系模型;(3)軟件化,利用程序語言將本體模型轉化為軟件,形成知識組織系統。在知識組織領域,常用的本體模型如BIBO書目本體、FRBR書目本體、VOAF詞匯表朋友本體、SWRC研究社區語義網本體、VIVO Core科研本體和FOAF朋友的朋友本體等。
1.3基于元數據的信息組織
元數據是關于數據的數據,定義了數據的含義,是對數據的語義描述。在信息組織領域,常用的元數據描述標準如MARC、DC、PRISM、CDWA和VRA Core等。
在基于本體的知識組織中定義了領域的概念及其關系和屬性,其中概念的關系和屬性需要依靠元數據來進行規范,描述各個概念的內容特征。因此,從相應的元數據標準及本體模型中選擇和制定描述資源屬性的元素,也是知識組織中的重要步驟之一。
基于本體的非遺資源知識組織,需要在對非物質文化遺產資源分析的基礎上,確定這一主題所涉及的概念和關系,然后用本體模型形式化地表達出來。
2.1系統論視角下非遺資源的分析
非遺保護是一項系統工程,從系統論的角度來看,非遺保護涉及主體、客體、過程、成果、環境五大基本因素,這些基本因素相互作用形成一個有機整體,如圖1所示。

圖1 系統論視角下非遺資源體系
(1)主體是指參與非遺保護的機構或人物。非遺保護機構根據其性質可分為生產機構(如歌舞、戲曲、書畫等藝術創意或表演機構和組織)、管理機構(如非遺保護涉及的教育、科技、文化等國家和地方行政管理部門)、保護機構(如非遺保護的專門機構或組織)、傳播機構(如博物館、檔案館、圖書館、文化館、廣播電視臺、出版發行機構、藝術學校、高校藝術院系等)、研究機構(如非遺保護專門研究機構、高校藝術院系等)和其他機構(無法列入以上部分的機構和組織),且參與非遺保護的很多機構具有多重屬性;根據非遺保護的機構類型和性質,人物有創造者、表演者、生產者、傳播者、管理者、研究者、公眾等,參與非遺保護的很多個人也具有多重屬性。
(2)客體是指非遺保護的對象,即非遺資源。非遺資源包括顯性非遺資源和隱性非遺資源兩大類。顯性資源以實物、文字、圖片、符號、聲頻、視頻等形式存在于各類物理載體中,如工具、道具、原材料、制成品、手稿、照片、圖片等事物,表現為物質形態。隱性資源無形存在于組織機構(如藝術機構或團體等)或依附于個人(如創造者、表演者、生產者、傳播者、研究者等)的技能、技藝、技巧等,具有活態性,需要實時呈現,以事件(活動、表演等)的形式來表達,表現為非物質性,有些可復制,有些不可復制。非遺資源以顯性和隱性方式存在。
(3)過程是指非遺保護主體作用于非遺客體的方式和手段,如非遺保護機構或個人通過各類項目或活動保護、修復、傳承、傳播、保存、研究非遺資源,形成非遺保護成果。
(4)成果是指經過非遺保護過程而產生的各類成果。主要是記錄非遺的載體(如實物、文獻[紙質文獻、聲像文獻、縮微文獻、數字文獻,如數據庫、網頁、網站等]、藝術人才[大腦、口耳相傳]等)和記錄非遺的內容(如非遺內容的生產、表演、創意、創造、再現、展示等)。經過保護的非遺資源又以顯性和隱性方式呈現,成果又成為新的非遺資源。
(5)環境是指完成非遺保護所需要的運行機制和保障條件,主要包括非遺保護的政策、法律、法規、制度、經費、技術、設備、人員(教育)等。
2.2非遺信息資源概念化
圍繞非物質文化遺產這一主題進行知識組織,首先需要確定這一領域的概念(或類),并定義概念之間的關系。非遺領域重要的概念主要有:非遺主體,包括“人物”和“機構”兩個概念;非遺客體,涉及在傳承過程中以物質形態存在的“事物”和非物質活態展現的“事件”兩個概念;在非遺保護過程中產生的“項目”,以及在保護、研究、傳承和管理過程中產生的各類“文獻”,包括政策、制度、法律和法規等。每個概念及其子類的說明如下。
(1)非遺項目類。是指非物質文化遺產的普查項目,對非遺資源以項目為單位進行組織。目前我國建立了國家、省、市和縣四級非遺項目名錄,名錄中按“十分法”對項目進行分類。
(2)人物類。包括非遺的傳承者、研究者和管理者。傳承者如傳承人、創造者、講述者、表演者、生產者、演唱者、傳播者等;研究者如文獻作者、作品作者等;管理者如調查者、采錄者等。
(3)機構類。與非遺的生產、管理、研究、傳播和保護等相關的責任部門,主要有保護機構、研究機構、管理機構三類,如文化行政部門、保護中心、研究所、檔案館、圖書館、博物館等。
(4)事物類。包括工具、道具、原材料、制成品、手稿、照片、圖片、地圖、錄像帶、錄音帶、光盤、唱片、幻燈片等客觀存在的一切物體,以及文化場所和空間。這些類型的物體在數字化后以文本、圖片、音頻和視頻的形式保存。
(5)事件類。與非遺相關的知識、技能、社會實踐、觀念表述等的表現形式,具有活態性,需依附于群體或個人在相關活動中才能展現出來。在非遺數字化保護中,這類資源也是以文本、圖片、音頻和視頻的形式記錄并保存。
(6)文獻類。包括人物或機構對非遺進行研究所產生的研究成果,如圖書、期刊論文、會議論文、學位論文、專利、報紙、科技成果等;也包括在管理過程中產生的政策和法規以及在傳播過程中產生的網站、網頁、新聞報道等。
2.3非遺信息資源對象模型化
為清晰地描述非遺資源在知識組織中各概念的相互關系,通過圖示的方法將這一領域的概念和關系表達出來,構造出非遺的形式本體概念模型,如圖2所示。概念的屬性在本文下一小節通過元數據來語義描述,各概念之間存在相互交叉滲透的關系,非遺六個概念之間存在的關系在圖2中以邊的形式表示,如非遺項目與事物之間為使用與被使用的關系;非遺項目通過事件來展現;人物參與事件,并生產和創作事物;人物和機構保護、管理、研究和傳播非遺,同時產出研究成果;人物和人物之間存在社會關系,如師徒關系、兄弟關系和父子關系等。這些關系構成了一種網絡關聯結構。

圖2 非遺信息本體概念模型
非遺的本體概念模型把該領域概念的內在特征,按照一定的知識結構組織起來,而各個概念的屬性則需依靠元數據來進行規范描述。因此,選擇相應的元數據標準和選擇描述概念屬性的元素,是信息知識組織重要的一步。
3.1資源對象描述元數據標準與規范的選擇
在非遺本體概念模型中需要描述的資源類型為非遺項目、人物、機構、事物、事件和文獻六個大類。在數字化保護過程中,為了更好地實現非遺資源的共享和互操作,非遺資源的元數據描述優先參考或采用目前成熟的元數據標準和規范。針對非遺資源的特征,各概念對應的資源對象類型、已有或可參考的元數據標準與規范如表1所示。
“非遺項目”類元數據標準與規范,現有可參考的如孫曉菲的《數字時代的元數據實踐》一書中關于非遺項目實體元數據,[7]是根據我國非遺調查表和申報書樣本中欄目設置,并參考DC而定義了非遺項目對象的元素。
“人物”和“機構”類實體,可參考的元數據標準與規范如《國際檔案(團體、個人與家族)規范記錄標準》,它是描述法人、個人及家族數據形成檔案的一個標準工具。[8]另一個重要的“人物與機構”類規范是FOAF(Friend-of-a-Friend,簡稱FOAF),[9]包括了Person和Organization類實體,其用來描述Web頁面上的個人信息之類的信息。
“事物”類資源主要為直觀對象或可視對象(實物),這類資源常用的元數據描述標準有CDWA和VRACore。CDWA(Categoriesforthe Description of Works of Art,藝術作品描述類目)用于描述藝術品,如油畫、雕刻、陶藝、設計、表演藝術等。[10]VRACore(Visual Resources Association Core Data,視覺資源委員會核心元數據)用來描述網絡環境下的藝術、建筑、史前古器物、民間文化等藝術類可視化資源。[11]事物類對象數字化后以文本、圖像、音頻和視頻的形式存在,可用《中國數字圖書館標準規范》CDLS進行描述。
“事件”類資源對象和事件類一樣,數字化后以文本、圖像、音頻和視頻的形式保存。
“文獻”類資源常用的元數據描述規范如都柏林核心元數據(簡稱DC),DC元數據一般適用于網絡資源著錄。基于DC的擴展在我國產生了CDLS元數據規范、CADAL元數據規范和CALIS元數據規范。對于非遺文獻類資源,本研究以CDLS元數據規范為參考依據。CDLS為科技部科技基礎條件平臺工作重點項目《中國數字圖書館標準規范》,[12]其元數據標準包括的電子文獻類資源有三類,①古文獻系列元數據規范:古籍、輿圖、家譜、拓片和地方志;②論文系列元數據規范:期刊論文、會議論文和學位論文;③其他系列元數據規范:電子圖書、網絡資源、音頻資料、視頻資料和圖像資料。
3.2資源屬性核心元素的選擇與定義
選擇好非遺各類資源數字對象所參考的元數據標準與規范后,接下來便是非遺本體中各類概念屬性核心元素的選擇與定義。對于非遺項目、人物、機構、事物、事件和文獻六個概念,其屬性的核心元素部分或全部復用DC的15個核心元素,并根據相應可參考的元數據標準確定各概念的屬性元素集。非遺概念屬性的核心元素定義如表2所示。

表1 非遺領域相關資源類型及元數據標準

表2 非遺概念屬性的核心元素

元素復用:《中國數字圖書館標準規范專門數字對象描述元數據規范》人物(person)人物名稱(name)人物基本信息(personInfo)人物主題(subject)人物描述(description)人物類型(type)人物標識符(identifier)人物關系(relationship)人際關系(hasPersonRelation)屬于機構(isOrganizationOf)有作品(hasWorks)屬于項目(isProjectOf)人物位置(location)數字化的事物和事件包括:文本、圖像、音頻、視頻元素復用:《中國數字圖書館標準規范專門數字對象描述元數據規范》機構(organization)機構名稱(name)機構責任者(creator)機構描述(description)機構類型(type)機構標識符(identifier)機構關系(relationship)有成員(hasMembers)有作品(hasWorks)有項目(hasProject)機構位置(location)文獻(現代文獻、古文獻)
在對非物質文化遺產信息資源進行組織時,不只是建立一個存貯各種資源的數據結構,更重要的是揭示非遺信息資源內在的聯系和豐富的知識。從知識組織的角度來看,本體論適合于網絡環境下知識的表達與知識的關聯;從信息組織的角度來看,元數據適合于文獻資源特征的語義描述。因此,充分利用本體和元數據的各自優勢,實現對非遺信息資源的知識組織、語義描述,是一種很好的結合。
[參考文獻]
[1]裴炳鎮,等.一個語義web信息處理平臺的設計和實現[J].貴州大學學報(自然科學版),2004,04:397-402.
[2]信息組織[EB/OL].[2015-02-25].http://wiki. mbalib.com/wiki/信息組織.
[3]蔣永福,付小紅.知識組織論:圖書情報學的理論基礎[J].圖書館建設,2000(4):14-17.
[4]邱均平.知識管理學概論[M].北京:高等教育出版社,2011.
[5]本體(信息科學)[EB/OL].[2015-02-25].http: //zh.wikipedia.org/wiki/本體_(信息科學).
[6]葉鷹.信息科技的形式本體論研究[J].情報學報,2003,33(5):561-564.
[7]孫曉菲.數字時代的元數據實踐[M].杭州:浙江大學出版社,2013.
[8]ISAAR(CPF):International Standard Archival Authority Record for Corporate Bodies,Persons and Families,2nd Edition[EB/OL].[2015-02-25].http://www. ica.org/10206/standards/standards-list.html.
[9]FOAF Vocabulary Specification 0.99[EB/OL].[2015 -02-25].http://xmlns.com/foaf/spec/.
[10]Categories for the Description of Works of Art[EB/OL]. [2015-02-26].http://metadata.teldap.tw/standard/ CDWA/Element%20List.htm.
[11]VRA Core 4.0 Element Description[EB/OL].[2015-02-26].http://www.loc.gov/standards/vracore/VRA_ Core4_Element_Description.pdf.
[12]CDLS中國數字圖書館標準規范建設[EB/OL]. [2015-02-26].http://cdls.nstl.gov.cn/index.html.
動態·資料
(本刊訊)2月1日至2月29日,寧夏銀川市圖書館依托國家圖書館優質數字資源,開展了“網絡書香過大年”“同筑中國夢、共度書香年”春節楹聯主題文化活動,充分利用網絡新媒體平臺,將春節服務推送到讀者身邊,加強讀者的互動參與,讓廣大市民切身體驗到中國傳統文化的魅力。
銀川市圖書館通過官網、微博、微信公眾平臺等進行廣泛宣傳,使得“網絡書香過大年”活動深受讀者喜愛。參與者不僅有學齡兒童,還有退休老人。讀者不僅通過圖書館公共電子閱覽室進行線上互動,還用手機等移動設備掃描二維碼進行答題互動。據不完全統計,有近2000人參與了此次活動。
“同筑中國夢、共度書香年”春節楹聯主題文化活動以楹聯拜年為主要內容。讀者進入銀川市圖書館官網首頁活動專區后,可以欣賞到100副傳統春聯、古籍中的春聯、國圖公開課“楹聯文化”系列講座、文津經典誦讀詩詞精選等文化資源。同時,銀川市圖書館通過微信公眾平臺分期推送“楹聯文化”四期。此外,制作了40塊楹聯文化展板,在圖書館一樓大廳展示,每天都有不少讀者駐足欣賞。
銀川市圖書館開展的“網絡書香過大年”“同筑中國夢共度書香年”春節楹聯主題文化活動,使圖書館活動內容線上與線下同步進行,傳統與“互聯網+”融為一體。銀川市圖書館還將陸續推出更多優質的數字文化活動,讓銀川市數字圖書館服務惠及更廣泛的社會公眾。(張婕)
The Construction of Intangible Cultural Heritage Information Knowledge Organization System Based on Ontology and Metadata
Cai Lu,Xiong Yong-jun,Liu Can-jiao
Abstract:Digital protection of intangible cultural heritage is a systematic project. This article analyzes the resource objects related to subject, object, process, achievement and environment of intangible cultural heritage from the perspective of system theory. Based on knowledge organization theory and method of ontology, this article tries to build a concept model to determine the concepts and relationships in this field. Combined with information organization form of metadata, it normatively describes various types of digital resource objects to provide a theoretical reference for orderly organizing and revealing the intangible cultural heritage resource.
Keywords:Ontology;Metadata;Knowledge Organization;Information Organization;Intangible Cultural Heritage
[收稿日期]2015-07-01[責任編輯]王崗
[作者簡介]蔡璐(1976-),女,副研究館員,研究方向:數字圖書館技術;熊擁軍(1972-),男,副研究館員,研究方向:數字圖書館技術;劉燦姣(1976-),女,教授,研究方向:信息資源管理。
[基金項目]本文系湖南省科技廳重點項目(項目編號:2014GK2018)的研究成果之一。
中圖分類號:G250.74;G255.76
文獻標志碼:B
文章編號:1005-8214(2016)03-0039-05