王昆鵬
摘要:設計制定元數據標準是對傳統童謠進行數字化保護的基礎工作。該文梳理了比較成熟的元數據標準,分析了設計傳統童謠元數據的作用和意義,總結了童謠元數據設計思路,并參照都柏林核心元數據(DC)標準,確定了童謠元數據的10個核心元素。
關鍵詞:童謠;元數據;非物質文化
中圖分類號:G25? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2018)31-0014-02
童謠,也叫民間兒歌,古代稱“孺子歌”“童子歌”“小兒語”,是在兒童中流傳的口頭短歌,節奏明快、音韻和諧、朗朗上口、幽默有趣。在古代,由于兒童文學不被重視,童謠一直僅限于民間流傳,偶爾出現于史料典籍和地方志中,沒有被系統搜集整理。近現代以來,少數學者注意到了傳統童謠的價值并進行了收集,但從最終結果看,收集成冊的童謠只是冰山一角,還有大量童謠在民間流傳,并有失傳危險。所以,童謠的整理保護工作應該引起重視。
傳統童謠作為一種非物質文化,采用數字化的手段進行保護是較為合理的做法。在數字化保護過程中,設計建立傳統童謠元數據標準是一項基礎性工作。解決對傳統童謠信息的著錄和描述問題,為傳統童謠信息的收集、整理、保護、共享、發現提供技術支持,從而建立傳統童謠信息庫,完成對傳統童謠的數字化保護。
1 元數據發展現狀
元數據(Metadata),又稱中介數據、中繼數據,被稱為描述數據的數據,主要是描述數據屬性的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述并收藏數據的內容或特色,進而達成協助數據檢索的目的。
目前元數據的研究和應用已比較成熟,形成了不少國際標準,比較有影響的有:
1) CDWA,適用于博物館和藝術作品;
2) DC,適用于網絡資源;
3) EAD,適用于檔案和手稿資源;
4) FGDC,適用于地理空間信息;
5) GILS,適用于政府信息;
6) TEI,適用于電子形式全文;
7) VRA,適用于藝術類可視化資源;
8) MARC,適用于圖書館和文獻資料。
國內也制定了不少切合實際應用的元數據標準。例如國家圖書館地方志元數據、國土資源信息核心元數據、中國科學院的科學數據庫核心元數據標準、教育部的基礎教育教學資源元數據規范等等。
這些元數據標準都為相關行業的信息化起到了促進和基礎支撐功能。
2 童謠元數據的作用
方便童謠信息的采集建庫。建立了元數據標準,就有了童謠數據庫建庫的支撐,可以將文獻資料或現場采集到的信息進行有效序化,完成信息資源庫的建設。
方便童謠信息的查找發現。元數據可以為童謠提供一套規范的數據標準,為每一則童謠建立一條完善的信息數據。為童謠信息的查找發現帶來極大的方便。
方便童謠信息的獲取和共享。元數據中包含童謠的出處、類型等信息,因此信息的獲取變得容易。經過著錄的信息都采用統一或相互兼容的元數據來描述,可以很容易實現童謠信息的共享。
方便傳統童謠的數字化保護。對傳統童謠的整理,大多數依然是采用結冊出版成書的形式。這種方式對于童謠的保護只能起到部分作用。限于紙質文獻的篇幅和出版限制,基本上是不能容納所有收集到的童謠內容。元數據標準的制定可以規范童謠的收集整理工作,起到童謠保護的推動工作。
3 童謠元數據設計思路
確定傳統童謠的著錄對象。童謠是一種口頭傳唱的民間文化,通過口口相傳的方式傳播。在古代不屬于正統文學范疇,很少有童謠被專門的文獻記載,只有少部分出現在史料中。現代以來,因為被部分學者注意,出現了一些童謠的征集活動,并有整理成書出版。在元數據設計時,為了能廣泛適用于童謠的現狀,覆蓋的范圍應包括文獻中記載和實地采集的所有童謠。所以,元數據設計過程中應明確著錄對象是童謠,而不是記錄童謠的各種文獻。
元數據標準制定。在國際標準元數據格式中,機讀目錄(MARC)和都柏林核心元數據(DC)是目前應用較多的兩種。這兩種標準都是為了將資料信息格式化,方便存儲,完成對信息內容和形式特征的揭示,方便檢索。機讀目錄(MARC)是一種書目著錄標準,數據結構完整,描述能力較強,廣泛應用于圖書館和圖書期刊等出版物領域。都柏林核心元數據(DC) 是在網絡環境下產生的,特點是格式簡潔應用靈活,非常適用于網絡環境下的信息發現,是目前應用最為廣泛的標準。在明確著錄對象是童謠而不是文獻的情況下,可以容易得出,都柏林核心元數據(DC)比機讀目錄(MARC)更適用于傳統童謠。所以傳統童謠元數據可以參照都柏林核心元數據(DC)標準進行設計。
4 確定元數據核心元素
在都柏林核心元數據(DC)標準中,共有15個元素,基本上涵蓋了數據信息的字段。結合傳統童謠的情況,可確定10個核心元數據。
1)資源形式,對應都柏林核心元數據(DC)中的Format元素,具體對于傳統童謠,資源形式主要包括出版物和非出版物,出版物指收集在圖書期刊等文獻上的童謠,非出版物指現場采集到的數據。
2)題名,對應都柏林核心元數據(DC)中的Title元素,指童謠的標題。傳統童謠通常情況下并沒有嚴格的標題,往往需要收集整理者命名。在已出版的文獻中,整理者一般已經為童謠命名。現場采集的童謠,采集者可以根據內容組織命名,也可以以首句作為童謠的題名。
3)主要責任者,對應都柏林核心元數據(DC)中的Creator元素,一般指作者,但傳統童謠口口相傳,沒有明確的作者。主要責任人可以是相關出版物的責任人或是童謠的收集整理者。
4)其他責任者,對應都柏林核心元數據(DC)中的Contributor元素,在童謠元數據中,可以標識采集口述人。
5)出版項,對應都柏林核心元數據(DC)中的Date,Publisher元素,指童謠出處出版物的出版信息項。
6)歸屬類別,流傳至今的傳統童謠數量很多,對其進行科學分類可以方便研究。傳統童謠的分類可以按照大多數出版物采用的主題法,根據童謠的主題內容進行分類,如育兒歌、數數歌、顛倒歌等等。
7)采集地點(流傳區域),傳統童謠具有強烈的地域屬性和方言特點,在一定范圍的區域流傳。
8)主題詞,對應都柏林核心元數據(DC)中的Subject and Keywords元素,采用自由詞標引。
9)全文,收錄童謠的全文文本。
10)相關文獻,相似童謠、其他收錄文獻、原始采集視頻鏈接等等。
5 結論
傳統童謠的數據信息相對比較復雜多樣,與出版物、視頻圖片等資料相比,格式化的程度不太高,切信息量有限。所以在制定元數據標準和具體應用中,如何體現信息的靈活性和如何最大限度地揭示信息的準確性是應特別強調。另外,針對童謠信息的情況,在數據收集整理階段如何細化主觀內容部分也需專門研究,如題名設定、分類、主題詞等等。
參考文獻:
[1] 姚伯岳,張麗娟,于義芳,等.古籍元數據標準的設計及其系統實現[J].大學圖書館學報,2003(1):17-21.
[2] 夏翠娟,林海青,劉煒.面向循證實踐的中文古籍數據模型研究與設計[J].中國圖書館學報,2017,43(6):16-34.
[3] 崔運鵬,錢平,蘇曉鷺.農業科技信息核心元數據標準框架研究及其著錄信息管理系統[J].中國農業科學,2007(4):685-692.
[4] 熊擁軍,陳湘,彭維.非物質文化遺產相關資源元數據標準比較研究[J].圖書館,2016(2):33-37.
[5] 張勇,蔡璐,李月明.非物質文化遺產數字資源元數據標準應用的研究和思考[J].圖書館,2016(2):38-42.
[6] 許鑫,張悅悅.非遺數字資源的元數據規范與應用研究[J].圖書情報工作,2014,58(21):13-20+34.
[7] 陳正平.巴渠民間文學與民俗研究[M].四川大學出版社,2001.
[8] 趙景深,車錫倫.古代兒歌資料[M].少年兒童出版社,1962.