熊擁軍 陳 湘 彭 維(.中南大學圖書館 長沙 40083;.湖南圖書館 長沙 400)
?
非物質文化遺產相關資源元數據標準比較研究*
熊擁軍1陳湘2彭維2
(1.中南大學圖書館長沙410083;2.湖南圖書館長沙410011)
〔摘要〕文章在對非物質文化遺產(以下簡稱“非遺”)相關資源常用元數據標準調研的基礎上,研究各元數據標準的元素特點。采用對象關系模型的分析方法,對非遺資源進行分析,并對非遺相關資源的八種元數據標準進行介紹、比較和分析。結果表明:非遺相關資源涉及到項目、人物、機構、物質資源和非物質資源五類資源對象,各類資源對象常用元數據標準在結構特點、功能需求、元素組成、核心元數據和編碼等方面表現各異。
〔關鍵詞〕非物質文化遺產信息資源元數據標準
〔分類號〕G254.364
〔引用文本格式〕熊擁軍, 陳湘, 彭維.非物質文化遺產相關資源元數據標準比較研究[J].圖書館,2016(2):33-37
*本文系湖南省科技廳科技計劃項目“數字化傳承視域下非物質文化遺產分類和元數據標準研制與推廣研究”(項目編號:2014GK2018)的研究成果之一。
非物質文化遺產(簡稱非遺)是指各族人民世代相承的、與群眾生活密切相關的各種文化表現形式和文化空間[1]。在信息化時代,以文字、錄音、錄像和數字化多媒體等形式對非遺信息進行真實、系統的記錄,并以互聯網為平臺進行資源共享與傳播,成為當前非物質文化遺產保護的發展趨勢[2]。
在非遺數字化建設中涉及的信息資源種類繁多,如傳承者、文化機構、工藝品、文獻資料、研究成果等。對這些資源進行數字化加工、組織描述、管理、服務和保存過程中,元數據標準的制定是非遺數字化建設中首要的、基礎性的工作。目前國內外已經產生并得到實際應用的元數據標準有幾十種,如DC、CDWA、MARC等,每種元數據標準都有自己的特色,對不同領域不同類型的資源在信息組織中的描述各具優勢。因此,對適應于非遺相關資源的元數據標準進行梳理和分析,可為非遺信息領域元數據標準的制定提供決策依據。
非遺的主體是知識、技能、表現形式本身,相關的工具、實物、手工藝品和文化場所是非遺的物質基礎和物質環境,社區、群體或個人是非遺的創作者或傳承者[3]。因此,非遺資源對象包括了項目、人物、機構、物質資源和非物質資源5類,其對象關系模型如圖1所示。

圖1 非物質文化遺產資源對象關系模型
“人物”類對象包括傳承者和研究者,傳承者包括社區、群體或個人,研究者為從事非遺學術研究的企事業科研人員?!皺C構”類對象為與非遺管理和研究相關的責任部門,如文化行政部門、保護中心、研究所、檔案館、圖書館、博物館等?!绊椖俊鳖悓ο笫侵阜沁z的普查項目,對非遺資源以項目為單位進行組織,目前我國建立了國家、省、市和縣四級非遺項目名錄?!拔镔|資源”類對象包括工具、道具、原材料、制成品、手稿、照片、圖片、地圖、錄像帶、錄音帶、光盤、唱片、幻燈片等歷史遺留物,以及文化場所和空間?!胺俏镔Y資源”類對象是指非遺相關的知識、技能、社會實踐、觀念表述等表現形式,如非遺知識、研究信息、傳播信息等。
各資源對象之間的關系為:非遺信息資源是以項目的形式進行組織,機構對象與其他對象之間是管理與被管理的關系,人物對物質資源和非物質資源進行創建、研究、實踐和管理等。
在對非遺資源數字化保護時,對“物質資源”對象,通過錄入、掃描、攝影、轉錄、攝像等方式,將非遺資源加工轉換成數字資源進行保存,各非遺資源對象所涉及的資源類型及相關元數據標準如表1所示。

表1 非遺資源對象相關資源類型及元數據標準
元數據標準針對不同領域、不同類型資源,功能需求不一樣,因此在元素的設置上存在差異,這樣的元素稱為特殊元素,但對于特征相近的資源,相應的元數據標準也有很多相似之處,這樣的元素稱為通用元素。下面針對相關元數據標準的元數據結構、元素特點、功能等方面進行介紹和比較分析。

表2 非遺相關資源元數據標準適用的資源情況

DC 網絡資源任何人,包括學者、專家、學生、圖書館編目員等用于資源發現CDLS 中文數字資源圖書館、檔案館、博物館等針對中文數字資源的特點,選取不同類型的資源對象(如電子圖書、期刊論文、古籍、拓片、輿圖等)建立元數據規范CADAL 數字資源 圖書館針對不同資源類型專門的元數據規范有中文圖書、西文圖書、期刊、學位論文、古籍等
3.1機構人物類元數據標準
ISAAR(CPF)為《國際檔案(團體、個人與家族)規范記錄標準》,它是描述形成檔案的法人、個人及家族的一個標準工具,由國際檔案理事會ICA著錄標準委員會制定,2004年頒布了第2版[4],主要在檔案界使用。

表3 ISAAR(CPF)和FRAD元數據元素分析
ISAAR(CPF)的元數據共分為四大類,包括身份、描述、關系和控制四類,四大著錄項又可細分為27個著錄子元素[5]。(1)身份類(Identity Area)元數據標識被著錄實體與定義文件標準化檢索點的信息。(2)描述類(Description Area)元數據用于描述被著錄實體性質、背景及活動的相關信息。(3)關系類(Relationships Area)元數據用來記錄與描述同其他團體、個人或家族之間的關系。(4)控制類(Control Area)元數據用來唯一標識規范記錄,并記錄如何、何時及由何機構創建與維護規范記錄。
《規范數據的功能需求》(FRAD)是國際圖聯規范記錄的“功能需求與編號工作組”于2008年12月制定的用于規范記錄創建者制作的數據與用戶需求相關聯[6]。FRAD將規范數據定義為個人、家族、團體,或作品名稱的信息集成體,這些名稱是參考書目或圖書館目錄和數據庫記錄的受控檢索點的基礎。FRAD采用“實體-關系”方法論將資源定義為16個實體,并列舉了這些實體之間的關系,其中機構人物類實體有個人、家族、團體和機構,以及它們之間的關系。
ISAAR(CPF)標準和FRAD規范的具體元素分析如表3所示。兩種元數據對人物/團體身份和特征的描述都比較詳細。ISAAR(CPF)有控制類特殊元數據,說明ISAAR(CPF)元數據同時注重對信息管理,而FRAD在人物家族關系方面的元素比ISAAR(CPF)定義得更深入細致。
3.2物質資源類元數據標準

表4 CDWA和VRA Core4元數據元素分析
物質資源類對象包括直觀對象或可視對象,如工具、道具、原材料、制成品、文化場所等,其以文本、圖像、音頻、視頻的形式來進行數字化保存,對這類資源常用的元數據描述標準有CDWA和VRA Core。
CDWA(Categories for the Description of Works of Art,藝術作品描述類目)是由AITF(the Art Information Task Force)研究和開發,主要在博物館使用[7],用于描述藝術品,如油畫、雕刻、陶藝、設計、表演藝術等。藝術品具有物理形態,還與時間、人物、歷史文化等方面關聯。CDWA元數據標準中有很多元素反映了藝術品所特有的這些特征,代表性的有:方位/布置、題銘/標志、風格/時期/流派/運動和評論;在物理形態方面有:度量、材質/技術、物理描述;在對藝術品的保存和管理方面有:條件/檢查歷史、保存/處理歷史、擁有/收藏歷史、展覽/借出歷史。CDWA元數據標準的元素共包括27個一級元素,381個子元素。
VRA Core(Visual Resources Association Core Data,視覺資源委員會核心元數據)由美國視覺資料協會制定的元數據標準[8],用來描述網絡環境下的藝術、建筑、史前古器物、民間文化等藝術類可視化資源。VRA Core目前已推出第四版(2007年4月),定義了19個核心元素(見表4)。VRA Core描述的視覺資料反映的主體是藝術品類,所以元素的定義與CDWA很相似,例如反映藝術品特征的共同屬性有sytle、period、culture、material和measurements等[9],而VRA Core專注視覺資料的描述,在CDWA中非視覺資料的一些元素如exhibition/loan history在VRA Core中就沒有。
3.3非物質資源類元數據標準
對于非物質資源,如知識技能、研究信息、傳播信息、法律文件、多媒體等,以數字化的形式保存,常用的元數據描述方案如機讀目錄格式(MARC)和都柏林核心元數據(DC),MARC一般適于傳統印刷型文獻著錄,而DC元數據一般適用于網絡資源著錄,基于DC的擴展在我國產生了CDLS元數據規范和CADAL元數據規范。
3.3.1MARC元數據標準
MARC最早由美國國會圖書館編制,目前版本為MARC21,在圖書館界得到廣泛應用。MARC在20世紀90年代以前,主要用于紙質文獻的著錄,90年代后,由于大量非書資料的出現,1991年美國國會圖書館開始實施USMARC書目格式一體化,使得MARC可以同時描述圖書、連續出版物、檔案與手稿、計算機文檔、地圖、音樂、視覺資料等七種文獻類型。
MARC書目記錄的交換格式是ISO2709,是一種標準的記錄結構,由記錄頭標區、目次區和數據字段區三個部分組成。其中,數據字段區分為10個數據塊,相當于10種類型元數據的元素集合,每個數據塊又包含若干個字段及其子字段。MARC元數據包含的字段數量眾多,且能描述各種類型的文獻,包括現實的或虛擬的,被喻為當今最完美的元數據。
3.3.2DC元數據標準
DC元數據即“都柏林核心(Dublin Core)元數據”,由OCLC首倡于1994年,其維護和推廣機構為DCMI(Dublin Core Metadata Initiative),DC元數據規范基本內容包括15個元素的元數據集合,主要用來對網絡資源進行語義描述。
DC的15個元素依據其所描述內容的類別和范圍可分為三類:(1)資源內容描述類,包括題名(Title)、創建者(Creator)、主題(Subject)、描述(Description)、其他責任者(Contributor)、格式(Format)、來源(Source)、權限管理(Rights)、語種(Language)、相關(Relation)和覆蓋范圍(Coverage);(2)知識產權描述類,包括出版者(Publisher);(3)外部屬性描述類,包括日期(Date)、資源類型(Type)和標識(Identifier)。
DC元數據有兩種應用模式:簡單DC(Simple DC),即在15個元素基礎上擴展和縮減,不使用任何限定詞;復雜DC(Qualified DC),即增加了子元素,以及元素限定詞和編碼體系[10],使得DC元數據可以進一步描述資源的詳細特征,靈活地表達信息的特性。
3.3.3 國內基于DC擴展的元數據規范
(1)CDLS項目資源元數據規范
CDLS為科技部科技基礎條件平臺工作重點項目《中國數字圖書館標準規范》,2002年由中國科技信息研究所、中國科學院文獻情報中心和中國國家圖書館聯合發起[11]。其子項目《專門數字對象描述元數據規范》參照DC的擴展規則制定了數字資源基本元數據規范和專門元數據規范。
CDLS基本元數據規范復用了DC的15個核心元素。專門元數據規范包括了13種資源類型,分為三類:①古文獻系列元數據規范:古籍、輿圖、家譜、拓片和地方志。古文獻核心元數據在15個DC核心元素的基礎上再增加了4個核心元素(版本、物理特征、收藏歷史、館藏信息);②論文系列元數據規范:期刊論文、會議論文和學位論文;③其它系列元數據規范:電子圖書、網絡資源、音頻資料、視頻資料和圖像資料。目前CDLS元數據規范在高校圖書館特色庫和CALIS資源庫建設中得到廣泛應用。
(2)CADAL項目資源元數據規范
CADAL為“大學數字圖書館國際合作計劃”項目,2002年由浙江大學聯合國內外的高等院校、科研機構共同承擔,目標是構建多學科、多類型、多語種的海量數字資源。
CADAL元數據標準復用了DC的15個元素(見表5),并根據項目資源對象特征增加了3個元素,分別為版本信息(Edition)、MARC記錄(Marc)和學位(Degree)[12]。各元素通過修飾詞來進行擴展,形成了針對不同資源類型的專門元數據規范,如中文圖書、西文圖書、期刊、學位論文、古籍、民國圖書、報紙、外文科技報告、滿鐵資料、僑批、地方志、圖片、音頻、視頻和縮微膠片等。

表5 CDLS和CADAL元數據元素分析
元數據標準描述了具體對象所需要的元素集合、各元素語義定義、著錄規則和應用語法規定等。上述非遺相關資源元數據標準涉及到需求情況、功能和元素的對比分析,對非遺資源元數據標準或規范的制定帶來以下啟示:
(1)通用性原則形成基本元數據標準
某一領域內的資源類型多樣,不同類型的資源有不同的數據特征,元數據也不一樣,眾多類型資源需要一個統一的描述框架,基本元數據標準(也稱共享元數據標準、核心元數據標準)正是出于這種原因而產生的。如CDWA對藝術類的油畫、雕刻、陶藝、設計、表演等類型資源制定的元數據標準包括了27個核心元素;VRA Core針對視覺藝術資料定義了19個核心元素;CADAL針對中文圖書、西文圖書、期刊、學位論文、古籍等制定了18個核心元素。非遺資源同樣也涉及到多種類型資源,如非遺項目、人物、機構、物質資源和非物質資源等,也需在共享層面制定非遺資源的核心元數據集,以對非遺領域內各種類型的資源進行統一的描述和管理。
(2)個性化原則形成專門元數據標準
同一領域內各種類型資源的特征存在共性的同時,也存在個性。所以,在領域內建立健立基本元數據標準(核心元數據集)的基礎上,根據具體資源類型的特征,通過橫向擴展(增加元素)或縱向擴展(增加修飾詞),來建立各資源類型特有的元數據,稱為專門元數據或專有元數據。如CDLS在復用DC基本元數據基礎上,通過增加元素或子元素,制定了13種類型的專門數字對象元數據標準。對于非遺各類型資源對象,可以在制定核心元數據的基礎上,針對非遺資源的具體個性特征制定包括項目、人物、家族、機構、文本、圖像、音頻、視頻、藝術品、古文獻、現代文獻(如圖書、報紙、專利、期刊論文、學位論文、會議論文、網絡資源等)等類型的專門元數據標準。
(3)元數據標準簡單與復雜的均衡
簡單易用是元數據標準獲得元數據制作人員接受的關鍵,元數據具備足夠的描述能力和可以提供良好的服務是判斷元數據實用價值的標準。然而,元數據標準過于簡單,就會對著錄對象描述深度不夠,不能充分揭示資源特征,比如簡單DC;元數據標準過于復雜,又不易推廣和被廣大用戶接受,比如MARC。對于非遺資源元數據標準,可參考簡單的MARC和復雜的MARC,做到簡單與復雜并存,在簡單元素的基礎上定義擴展集,以適應不同層次的功能需求。
(4)元數據標準與功能需求相適應
元數據標準的功能主要包括對資源的描述、管理、發現與定位和長期保存。在“著錄描述”方面,元素涉及了內容、載體、位置與獲取方式、制作與利用方法等,元素數量往往較多,如MARC、CDWA、ISAAR(CPF)是這類元數據的典型代表。在“資源管理”方面,支持資源的存儲與使用管理,數據元素除比較全面的著錄描述信息外,還包括權利管理、電子簽名、資源評鑒、使用管理等方面的信息。在“長期保存”方面,元素除對資源進行描述和管理外,還包括格式信息、制作信息、保護條件、轉換方法、保存責任等內容。在“發現和定位”方面,主要幫助人們檢索和確認所需要的資源,元素往往限于作者、標題、主題、位置等簡單信息,DC是其典型的代表。非遺信息資源元數據的元素涉及較廣,功能涉及到對資源的描述、管理、服務(檢索和定位)和長期保存。
(5)元數據著錄規則
元數據著錄規則是進行文獻編目工作時要遵守的規則,是在元數據標準或規范下的具體實施方法,元數據著錄規則的制定可方便元數據標準應用到實際工作中。元數據著錄規則規定了每個元素的要著錄的內容、格式和示例。如CADAL、CDLS、MARC、DC等都有著錄規則的規范文件。因此,非遺信息資源也應根據各項目資源的特點,定義元數據各元素及子元素的著錄規則。
(6)元數據編碼/交互規則
編碼規則是將元數據集所有語義、結構及描述內容以計算機或人可讀的形式描述出來。從標準、開放、互操作角度,采用標識語言對元數據集進行描述,一般采用的語言有XML、SGML、RDF、ISO2709等,其中XML編碼應用最為廣泛。對非遺元數據可采用XML 和RDF來進行語義、結構和內容的描述,方便非遺資源的交換和相互操作。
(來稿時間:2015年9月)
參考文獻:
1.楊紅.非物質文化遺產數字化研究[M].北京:社會科學文獻出版社, 2014
2.黃永林,談國新.中國非物質文化遺產數字化保護與開發研究[J].華中師范大學學報(人文社會科學版), 2012(2):49-55
3.李波.非物質文化遺產信息資源描述模型探析[J].四川理工學院學報(社會科學版), 2011(3):118-121
4. ISAAR (CPF): International Standard Archival Authority Record for Corporate Bodies, Persons and Families, 2nd Edition[EB/OL].[2014-11-24]. http://www.ica.org/10206/standards/standards-list.html
5.段榮婷.國際檔案規范記錄標準化研究[J].檔案學研究,2013(5):63-73
6.規范數據的功能需求[EB/OL]. [2014-11-24]. http://eprints. rclis.org/13191/1/frad_2009-zh.pdf
7. Categories for the Description of Works of Art[EB/OL]. [2014-11-11].http://metadata.teldap.tw/standard/ CDWA/Element%20List.htm
8. VRA Core 4.0 Element Description[EB/OL]. [2014-11-14]. http:// www.loc.gov/standards/vracore/ VRA_Core4_Element_Descri ption.pdf
9.于嘉. VRA Core元數據的發展與現狀[J]. 新世紀圖書館, 2008(4):75-78
10. DCMI元數據術語[EB/OL]. [2014-11-21]. http://dc.library. sh.cn/dcmi-terms.htm
11.中國數字圖書館標準規范建設[EB/OL]. [2014-11-22]. http://cdls.nstl.gov.cn/cdls2/w3c/
12. CADAL標準規范文檔[EB/OL]. [2014-11-25]. http://www. cadal.cn/bzgf/
A Comparative Study on Metadata Standard Related to the Intangible Cultural Heritage Resources
Xiong Yongjun1Chen Xiang2Peng Wei2
( 1. Library of Central South University; 2. Hunan Library )
Abstract〔〕On basis of the investigation of common metadata standard related to the intangible cultural heritage this paper researches the characteristics and analyzes intangible cultural heritage resources by the method of analysis for objectoriented model, and makes introduction, comparison and analysis of the eight kinds of metadata standards of intangible cultural heritage resources. The results show that the intangible cultural heritage involves five kinds of resource objects such as project, character, institutions, material resource and non-material resource, and the common metadata standards of each resource object are different in structure characteristics, functional requirements, elementary composition, core metadata and coding, etc.
Keywords〔〕Intangible cultural heritageInformation resourcesMetadata standard
〔作者簡介〕熊擁軍(1972-),男,中南大學圖書館副研究館員,研究方向:數字圖書館技術;陳湘(1975-),男,湖南圖書館館員,研究方向:數字圖書館;彭維(1982-),男,湖南圖書館館員,研究方向:湖南文獻學。