李 波
(河池學院圖書館,廣西 宜州 546300)
非物質文化遺產是各族人民世代相承的、與群眾生活密切相關的各種文化表現形式和文化空間,[1]如民俗活動、表演藝術、傳統知識和技能以及相關的器具、實物、手工制品等。網絡化和信息化的高速發展,使社會經濟、文化的全球化程度不斷加深。在消費文化的強勢沖擊下,弘揚我國各民族優秀的非物質文化遺產,對保護民族文化多樣性,促進國家文化創新具有重要的戰略和現實意義。
在非物質文化遺產保護工作中,圖書館在信息資源的整合和組織方面具有獨特的優勢。發揮這一優勢,建立非物質文化遺產信息資源數據庫,可以說是圖書館參與非物質文化遺產保護的最佳途徑。以非物質文化遺產項目為綱目,整合相關知識、圖書資料、網絡資源等信息資源,使之數字化、結構化、系統化,以互聯網為平臺進行資源共享,可以為非物質文化遺產的宣傳、研究、傳承提供豐富的信息資源和便捷的信息服務。在非物質文化遺產信息資源數據庫建設中,元數據模型的設計(即信息資源組織的語義總體架構的設計)是一項非常重要的基礎性工作,它是不同類型數據庫在具體元數據方案設計時可依據的一個基礎框架,是不同數據庫系統間實現互操作和數據共享的基礎。
國內對于非物質文化遺產信息資源元數據模型的研究尚處于起步階段,從目前公開發表的成果來看,只有福建省圖書館的方允璋在其專著《圖書館與非物質文化遺產》中提出的“非物質文化遺產知識庫元數據方案”。該方案提出的元數據模型以非物質文化遺產相關的知識元素為描述對象,使用DC元數據核心元素集來描述對象。[2]此模型存在的不足主要體現在以下三個方面。
DC的設計目的是描述網絡資源對象,便于網絡資源的辨識、索引、檢索。在對象的內容方面,DC核心元素強調的是內容的通用性,而不考慮具體內容的特殊文化屬性及其內在的知識脈絡。方充璋元數據方案的描述對象是與非物質文化遺產相關的各種知識元素,其最主要的目的就是“認知”,而反映“非物質文化遺產”的特殊文化內涵應是其首要考慮的因素,但這顯然不是DC要解決的問題。因此,將DC用于非物質文化遺產對象的描述實際上是一種忽視描述對象的特殊性、為規范而規范的做法。
與非物質文化遺產相關的各種知識元素,既包括抽象的知識,又包括具體的人、實物、空間、文獻資源。這些對象除了“與非物質文化遺產相關”這一共同特征外,每一類型對象還具有自己獨特的共性維度。如“人”的共性維度有年齡、學歷、民族、種族等,“文獻”的共性維度有主題、作者、年代、學科等。只有15個核心元素的DC要整合多個互不重合的共性維度且包容不同分類維度的巨大差異,在實踐中必然會降低元素定義的明確性、邏輯性,用戶難以形成統一的認識,據此,該元數據方案的規范性和可操作性不高。
方充璋元數據模型沒有反映出非物質文化遺產項目與其相關信息資源之間的從屬、參證關系以及同一非物質文化遺產項目下不同信息資源之間的聯系。由于模型的描述缺乏對信息資源之間關系的清晰架構,而同一非物質文化遺產項目主題下的眾多信息資源勢必孤立的存在,因此難以對信息資源進行類分,無法達成對非物質文化遺產項目的全面認知。
非物質文化遺產信息資源系統的應用以達成對非物質文化遺產的全面認知為最終目標,則其元數據模型所包含的對象、概念、屬性應首先要充分反映“非物質文化遺產”區別于其他文化現象的特定內涵、知識脈絡以及各類非物質文化遺產所具有的共性特征。
為了使元數據方案具有較好的規范性和與互操作能力,非物質文化遺產信息資源元數據模型的設計應充分吸收、應用、兼容目前流行的元數據標準。由于各種元數據標準的適用對象不同,如DC適用于網絡資源,CDWA適用于藝術品,FGDC適用于地理空間。在應用已有的元數據標準時,應從有利于充分揭示描述對象特征出發,決定是整體框架使用還是局部使用,切不能盲目搬用。
一方面,元數據模型應容納較多的元素,有較強的描述能力。由于用戶的具體需求是多樣的、難以預期的,資源描述與信息檢索技術的發展是迅速的,因此,一個元素豐富的元數據模型對信息資源的組織管理、內容揭示、數據檢索會有很強的應用彈性。反之,一個元素匱乏的元數據模型,在面對技術升級、用戶描述要求細化時,便會難以應付,需要不斷的擴充修改,模型的實用性會大打折扣。另一方面,元數據模型的設計應有便于不同類型用戶,針對不同的需求進行元素擴展的機制。
目前,我國已建立國家、省、市、縣四級非物質文化遺產認定、管理體系,相關文化管理職能部門也已經建立有相關的信息系統,形成一套權威、規范的數據,如各省、市的《非物質文化遺產代表作申報系統》,各級文化管理部門與申遺信息系統都是未來數據庫資源建設重要的信息源。因此,在元數據模型使用的元素、概念上,應特別重視與這些信息數據的對接,以便在未來的資源建設中,通過元素間的映射關系共享這些豐富的信息源。
非物質文化遺產信息資源數據庫是一個按非物質文化遺產項目組織起來的信息系統。非物質文化遺產項目是其元數據的描述對象,每一個非物質文化遺產項目如“劉三姐歌謠”“侗族大歌”等就分別是元數據的一個基本單元。
非物質文化遺產項目是一種復合型對象,它既包括項目的遺產類別、分布地域、歷史淵源、傳承譜系等概括性知識內容,又包括與項目對象相關的人物、文化空間、實物、文獻、網絡資源等物理實體、數字實體。在信息系統中,與上述兩種類型描述對應的是非物質文化遺產項目對象的內容描述、相關實體資源描述。在非物質文化遺產信息系統中,對概括性知識的認識需要相關實體對象來印證、補充、具體化。每個相關實體資源對象雖然是獨立的,但它們在非物質文化遺產信息系統中,總是因具有與某一特定非物質文化遺產項目的關聯性、指向性才具有認識價值。因此,對象知識內容與相關實體之間的關系也是項目對象描述的一個重要內容。這種關系描述主要體現在元數據在結構化信息系統中的組織方式以及元數據各組成部分在結構化系統中的層級關系上,也可以體現在元數據內容描述、資源描述中的“相關性”屬性的定義上,而不作為一個獨立的描述模塊。項目對象的內容描述、相關資源描述,加上結構化信息系統所必需的管理描述,三個描述模塊共同構成了對非物質文化遺產項目對象的描述(如圖1)。

圖1 非物質文化遺產對象信息結構圖
通過對非物質文化遺產項目對象語義的分析,可為我們提供三個描述模塊所涉及的核心屬性和概念,這些屬性和概念在元數據設計時,可對應于元數據的元素,或作為元素的定義的語義基礎。對象核心屬性與概念的分析和提取應首先考慮對象知識、資源內容的充分呈現,概念應具有一定的專指度,以便用戶對信息的認知、檢索與評價。其次,盡可能引用已有的元數據方案中的的規范概念、通用屬性,可根據對象的屬性特征,從一個或多個通用的元數據方案中選擇接近和相通的概念實體,使元素定義具有通用性、規范性。[3]45-46
非物質文化遺產的概念有其特定的文化內涵,因此,對非物質文化遺產項目的內容描述(也就是概括性知識描述)應反映其特殊的文化內涵特征。目前,在通用的幾種元數據方案中只有名稱、類別、主題、地域等通用概念可以借用,缺乏其他具有專指度的概念。在這種情況下,筆者參考《國家級非物質文化遺產代表作申報書》設置的信息項目提取了民族、歷史淵源、基本內容、相關器具與制品、傳承譜系、基本特征、主要價值、瀕危狀況、保護措施9個專指概念,[4]加上前述4個通用屬性,自定義1個反映對象非物質文化遺產認定情況的“遺產認定”屬性,共14個屬性、概念,以此作為內容描述的元素定義基礎。
與非物質文化遺產相關的實體有傳承人、研究者、工藝品、藝術品、實物、文獻資料、組織機構、網絡資源。以上8種實體對象按相似性可分為5個大類:1)人物:包括傳承人與研究者,相關的屬性有姓名、性別、地域、年齡、職業、職務、民族、簡介8個通用屬性。2)直觀對象:包括工藝品、藝術品、實物,可直接參考使用VRC(視覺資料核心類目)或CDWA(藝術作品描述類目)元數據的元素定義。3)文獻資料:具體包括圖書、報刊、手稿、非書資料等、可使用MARC元數據的字段定義或DC元數據元素定義。4)網絡資源:具有URL的、可訪問的網絡資源,包括電子文本、電子圖書、電子期刊、網站、網頁、視頻、圖片、音頻等,可直接使用DC元數據元素定義。5)組織機構:屬性有名稱、地區、負責人、地址、簡介、郵編、電話、郵件等。
管理描述包括記錄標識、記錄創建者、創建機構、時間(記錄創建時間、記錄更新時間)、編碼、語種等通用管理描述屬性。
基于非物質文化遺產項目對象的信息結構、語義成分分析,我們可以構建一個非物質文化遺產信息資源的元數據模型(如圖2)。這一模型基本體現了非物質文化遺產對象所涉及的核心屬性與概念以及它們之間的關聯、層級關系。在每個描述模塊中,除筆者分析提取的屬性、概念外,還設置了“自定義元素”集,用來容納用戶根據應用需要自定義的元素,在不改變基本結構前提下,使模型具有可擴展性。

圖2 非物質文化遺產信息資源元數據模型
除引用的DC、VRC等已有元數據的元素定義外,本模型沒有規定各屬性、概念在元數據中的使用方式。在具體的元數據方案中,這些屬性、概念既可對應元數據的元素名稱,也可以是修飾詞、值或是元素定義的規定性內容。用戶可以根據描述詳略級別的需要以及置標技術的選擇進行靈活處理。如在內容描述中的民族、歷史淵源、基本內容、傳承譜系等9個屬性,若強調對非物質文化遺產項目對象的內容進行較詳盡的描述,則每一個概念可以對應設置一個元素;如只需要概括性描述,則可以只設置一個“摘要”元素,將以上8個概念的內涵作為元素的定義的具體內容。
基于前述對元數據描述對象基本單元的界定,在本元數據模型中,對每個非物質文化遺產項目對象的管理描述、內容描述都是不可重復的,每個對象只能有唯一的管理與內容描述。對于對象的相關實體資源描述部分,由于每個項目對象會有多個相關資源,每個具體資源的內容、載體、類型不同,所以對象的資源描述部分是可重復的,每一個具體相關資源在對象的相關資源描述中都應該得到反映。
在具體元數據方案設計中使用本元數據模型,首先要根據具體數據庫所涉及的內容選擇元數據模型中具體描述模塊或模塊中的組件。如《非物質文化遺產傳承人數據庫》,根據數據庫涉及的內容分析,可確定其元數據應包括非物質文化遺產對象管理描述、內容描述模塊以及相關實體資源描述中的人物描述組件。再如,設計開發一個包括紙質文獻、電子文獻的《非物質文化遺產研究文獻數據庫》,則根據模型中相關資源的分類,可以確定數據庫元數據方案應包括管理描述、內容描述以及相關資源描述中的文獻資料、網絡資源描述組件。
根據數據庫對元數據詳略的具體需要以及描述、檢索應用的需要,在選定的模塊與組件中選擇所需的概念、元素,建立具體的元數據元素定義方案。在具體元數據方案的設計時,在確定元數據方案所包括的基本描述模塊后,便可以根據描述的詳略要求,選擇全部、部分、分拆、合并使用基本模塊中元素或概念作為元數據方案的元素、修飾詞、元素定義內容。其次,考慮到具體的、特殊的描述、檢索應用需要,可以增加用戶自定義的元素,以容納本模型沒有涵蓋的描述內容以及其他特殊的描述要求。如,若建立一個以人物介紹為重點內容的《非物質文化遺產傳承人數據庫》,則在具體的元數據方案設計時,在對象的內容描述模塊中就可以只選擇使用名稱、主題、類別等通用型核心元素,而不需要使用歷史淵源、基本內容、傳承譜系、基本特征、主要價值、瀕危狀況、保護措施等專指性很強的概念。如果類似于《非物質文化遺產知識庫》這樣強調對象全面知識的項目,則在對象的內容描述模塊中就可以使用上述專指概念,對非物質文化遺產的要關知識進行全面、細致的描述。
本元數據模型只是一個語義和結構框架,它并沒有規定具體使用哪種編碼方法和存儲方式。在信息資源數據庫開發中,確定了元素的語義定義后,可根據數據庫的使用環境、數據管理效率、通用性、互操作性需要確定使用何種編碼和存儲方式。以一個大型商業數據庫為平臺的大型的非物質文化網絡多媒體資源數據庫為例,從使用環境上,就考慮用關系數據庫來編碼和存放元數據。如重點考慮元數據在網絡環境下互操性和可辨識性,則可考慮使用基于RDF 和 XML 的編碼方法。[3]62
目前國內對非物質文化遺產信息資源元數據的研究尚處于初級階段,本人在前人研究的基礎上,提出了自己的一家之言,旨在拋磚引玉,促進這一領域的研究。
[1]中華人民共和國文化部.國務院辦公廳關于加強我國非物質文化遺產保護工作的意見[EB/OL].[2011-01-20].http://www.mcprc.gov.cn/sjzz/shwhs/200608/t2006083 1_70859.html.
[2]方允璋.圖書館與非物質文化遺產[M].北京:北京圖書館出版社,2006:208—219.
[3]趙 亮.元數據規范應用框架與編碼[C]//繆其浩.元數據與圖書館.上海:上海科學技術文獻出版社,2005.
[4]中國藝術研究院.國家級非物質文化遺產名錄申報范本——阿詩瑪申報書[EB/OL].[2011-01-20].http://www.ihchina.cn/inc/doc/asm.doc.