【摘要】本文研究旨在為客家文化資源數(shù)字化構建一個標準體系,包括資源的采集加工標準、元數(shù)據(jù)規(guī)范和著錄規(guī)則及元數(shù)據(jù)庫建庫標準、文檔保存與管理標準、加工工作規(guī)范和信息服務標準,提出客家文化資源數(shù)字化標準框架,包括準備標準框架、主文檔保存與管理標準框架、元數(shù)據(jù)描述標準框架、資源服務發(fā)布標準框架和資源共享標準框架。
【關鍵詞】客家文化資源;數(shù)字化標準;唯一標識符;元數(shù)據(jù)
1.引言
客家是一個具有顯著特征的漢族民系,也是漢族在世界上分布范圍最廣闊、影響最深遠的民系之一,客家文化是中華五千年歷史長河中的一朵瑰麗奇葩,有著源遠流長的歷史。客家文化的形成是在獨特的社會環(huán)境和獨特的歷史淵源中,經(jīng)過漫長的歷史進程,在不斷的推陳納新的過程中形成的。客家文化在中華文化整體中是一個非常特殊、突出的文化類型,客家文化在近現(xiàn)代對漢文化的豐富起到了重大的作用。客家文化在中國文化中占有重要的地位,其重要性是不言而喻的,國內乃至世界范圍內對客家文化的研究都是一個熱點。
2.客家文化資源數(shù)字化的必要性
客家文化資源的開發(fā)和利用并不容樂觀,從國內外研究現(xiàn)狀來看,客家文化研究的文獻保障和整理明顯不足,主要體現(xiàn)在:
(1)客家文化的資源分布分散,具有一定的地域局限性;
(2)客家文化的資源種類單一,體現(xiàn)在資源的載體上主要集中在紙質媒介上,多媒體的資源特別是多媒體數(shù)字資源數(shù)量少;
(3)客家文化資源的數(shù)字化少有開展,資源的存在形式大都處于一種原始狀態(tài),這對資源的檢索和利用帶來很大的不便,數(shù)字化、標準化工作尤為重要。
1992年聯(lián)合國教科文組織開始在全世界范圍內推動文化遺產(chǎn)數(shù)字化,以便永久性地保存和最大限度地為公眾公平享有,隨著文化工作者和信息技術工作者的努力,目前數(shù)字化技術在保護文化遺產(chǎn)方面取得了驕人的成績。近年來黨中央、國務院對保護非物質文化遺產(chǎn)工作高度重視,全國非物質文化遺產(chǎn)保護工作普遍推開,其中運用文字、錄音、錄像、數(shù)字化多媒體等現(xiàn)代化科技手段對珍貴、瀕危并具有歷史價值的非物質文化遺產(chǎn)進行真實、系統(tǒng)和全面的記錄,建立檔案和數(shù)據(jù)庫是中國民族民間文化保護工程的主要實施內容之一。因此利用數(shù)字信息化的手段對客家文化資源進行保護是非常有必要的,也是非物質文化遺產(chǎn)保護研究現(xiàn)階段的一個重要領域。
3.客家文化資源數(shù)字化技術規(guī)范體系
客家文化資源數(shù)字化技術規(guī)范體系包含以下幾部分:資源采集加工標準、客家文化資源元數(shù)據(jù)規(guī)范和著錄規(guī)則及客家文化資源元數(shù)據(jù)庫建庫標準、主文檔保存與管理標準、數(shù)字化工作規(guī)范和信息服務標準。
在標準制定過程中,盡可能直接引用和采納國內外已經(jīng)普遍應用的技術標準和規(guī)范。一些指標的制定考慮到最新的實踐情況以及最新的技術情況,一些校驗方法采用國內外最新的校驗工具和方法。重點參考美國國會圖書館國家數(shù)字圖書館計劃的“關于文本和圖像數(shù)據(jù)數(shù)字化轉換的技術規(guī)范” [1]和中國臺灣地區(qū)的“數(shù)位典藏國家型科技計劃”[2]的技術資料匯編以及科技部“中國數(shù)字圖書館標準與規(guī)范建設”項目“數(shù)字資源加工標準規(guī)范與操作指南”子項目的相關成果[3]。橫向上保持與相關同期標準,如與國家圖書館《數(shù)字資源(文本、音頻、視頻)加工標準與工作規(guī)范》、《數(shù)字資源對象管理規(guī)范》及唯一標識符、元數(shù)據(jù)、長期保存等子項目相關成果的一致性;縱向上盡量保持與CDLS項目、中國高等教育數(shù)字圖書館(CADLIS)及其他大型數(shù)字圖書館建設項目的標準規(guī)范的可轉換性和易轉換性[4]。這樣既保持了與同期其他相關標準的協(xié)調,又兼顧歷史標準的繼承。
3.1 客家文化資源的采集加工標準
客家文化資源的主要信息源有:正史、地方志、地方史、家譜、族譜、研究人士著述、客家地區(qū)報刊、音像制品、網(wǎng)站和數(shù)據(jù)庫等,載體形式多種多樣,要針對不同載體形式的資源制定出不同的采集加工標準。另外,還有一些客家文化資源并未承載于特定的載體之上,如:客家語言文學、客家人物、客家建筑、客家飲食、客家音樂舞蹈、客家民間美術、客家文物古跡、客家民俗民風等,這些資源都是以自然的形態(tài)而存在,需要有特定的設備按特定的程序步驟來進行采集,因此對設備、程序和流程需要有特定的標準和規(guī)范來操作。
散布在民間的客家文化資源品種繁多,良莠不齊,如何進行甄別取舍挖掘出有代表意義的和具特殊價值的資源是資源建設中的一大難點,即如何界定原始資源的保存等級、加工等級以及發(fā)布和服務等級,其中涉及隱私權、知識產(chǎn)權、商標權等法律層面,在標準的制定過程中必須在各種法律的框架下得到支持。
3.2 客家文化資源元數(shù)據(jù)規(guī)范和著錄規(guī)則及客家文化資源元數(shù)據(jù)庫建庫標準
不同類型的資源有著不同的元數(shù)據(jù)描述標準框架。例如,博物館建立了SPECTRUM和CDWA元數(shù)據(jù)標準框架來支持博物館館藏資源的管理,檔案館建立了ISAD(G)、ISAAR(CPF)和EAD元數(shù)據(jù)標準框架來支持檔案館館藏資源的管理,圖書館使用MARC元數(shù)據(jù)標準系列來支持書目數(shù)據(jù)的管理與交換。客家文化資源按其資源類型確定所在領域的元數(shù)據(jù)標準,并完整記錄元數(shù)據(jù)文檔。這個文檔應該列出所用的所有元數(shù)據(jù)元素的詳細目錄,以及這些元素對數(shù)字資源進行描述的方法。
3.3 客家文化資源數(shù)字主文檔保存與管理標準
數(shù)字主文檔保存為數(shù)字化生產(chǎn)過程的一個有機部分。保存依賴于數(shù)字資源生產(chǎn)的過程記錄,因為所保存的重要信息都是在這個過程中產(chǎn)生的。保存不僅僅是選擇合適的文件格式和數(shù)字介質的類型,而應該將其視為數(shù)字資源管理的基礎工作,以保證其長期和重復使用。
(1)文檔格式:使用開放的文檔格式可以增強互操作性和資源的重復利用,并能根據(jù)不同的使用目的進行創(chuàng)建和修改。數(shù)字主文檔包括文本型、靜態(tài)數(shù)字圖像、視頻數(shù)字資源、音頻數(shù)字資源,不同類型的數(shù)字主文檔生產(chǎn)與保存的標準各有不同。
(2)存儲介質:不同的數(shù)字存儲介質在數(shù)據(jù)存取時對軟硬件有不同的要求,且在管理方面都存在著一些差異。
(3)保存策略:主要有三種技術方法來實現(xiàn)數(shù)字資源的保存:技術保存、技術仿真和數(shù)據(jù)遷移。要根據(jù)數(shù)字資源的使用目的、使用功能制定出不同的保存標準。
3.4 客家文化資源數(shù)字加工工作規(guī)范
數(shù)字加工工作流程和相關管理規(guī)定包括對數(shù)字加工的工作流程、人員以及操作規(guī)范等,形成基本完善的業(yè)務規(guī)范及規(guī)章制度自動化管理、存貯和利用與發(fā)布。
3.5 客家文化資源信息服務標準
信息服務包括系統(tǒng)公共信息服務、個性化信息服務、全文信息搜索服務、統(tǒng)一資源搜索服務、信息服務統(tǒng)計分析等,要根據(jù)不同的服務方式和手段建立相應的支持標準。
4.客家文化資源數(shù)字化標準框架
客家文化資源數(shù)字化標準的實施要貫穿數(shù)字化的全過程。明確標準的目的,即標準的作用:
(1)互操作,用戶可以跨越數(shù)字化項目實現(xiàn)對數(shù)字資源的無縫訪問,且無須專門工具;
(2)開放存取,采用開放標準和通用格式,數(shù)字資源將被廣泛訪問;
(3)保存,可確保數(shù)字資源能夠長期使用,以使其投資效益最大化;
(4)安全,保護數(shù)字資源知識產(chǎn)權和用戶個人隱私,確保數(shù)字資源的完整性和準確性。
4.1 準備標準框架
在準備階段,必須清晰界定要被數(shù)字化的原始信息資源的范圍以及生產(chǎn)的數(shù)字資源的用途,同時要考慮原始信息資源的主要特性:如格式、大小、狀況和顏色等。
4.2 制定數(shù)字主文檔保存與管理標準框
為了使數(shù)字資源得到廣泛的訪問存取,新建數(shù)字資應該采用開放的文檔格式。數(shù)字主文檔分4種:
(1)文本型數(shù)字資源:字符編碼、文檔格式;
(2)靜態(tài)數(shù)字圖像資源:光柵圖像、矢量圖像;
(3)視頻數(shù)字資源;
(4)音頻數(shù)字資源
4.3 制定元數(shù)據(jù)描述標準框架
建立完整記錄元數(shù)據(jù)的文檔,這個文檔應該列出所用的所有元數(shù)據(jù)元素的詳細目錄,以及這些元素對數(shù)字資源進行描述的方法。元數(shù)據(jù)分5種:
(1)描述性元數(shù)據(jù);
(2)管理性元數(shù)據(jù);
(3)保存性元數(shù)據(jù);
(4)結構性元數(shù)據(jù);
(5)數(shù)字資源集合的元數(shù)據(jù)
4.4 制定資源服務發(fā)布標準框架
發(fā)布前的準備工作主要是要對數(shù)字主文檔進行處理,從而生成適合于在因特網(wǎng)環(huán)境中傳播的數(shù)字資源副本。發(fā)布包含兩部分:傳輸過程和Web站點:
(1)傳輸過程:文本型數(shù)字資源傳輸、靜態(tài)圖像傳輸、音頻傳輸、視頻傳輸、數(shù)字資源定位;
(2)Web站點:可獲取性、安全性、用戶認證、服務績效
4.5 制定資源共享標準框架
為了實現(xiàn)數(shù)字資源的共享,必須公開數(shù)字資源的元數(shù)據(jù),以便能夠被其他應用和服務所使用。針對客家文化資源數(shù)字化項目來說,公開哪些元數(shù)據(jù)以及采用什么方式公開,與數(shù)字資源的特性和主要共享元數(shù)據(jù)的應用和服務有關。
5.結語
虛擬現(xiàn)實技術是用聲、光、電一體化的信息產(chǎn)品形式表現(xiàn)出來的,利用信息技術、三維掃描技術和高精度攝像系統(tǒng),可大量地獲取實體資源的三維圖像與數(shù)據(jù),并生成物體與場景的三維全景模型,造就一種虛擬現(xiàn)實或虛擬環(huán)境,實現(xiàn)交互式觀賞功能,滿足用戶主動參與的要求。因此,在原始資源的數(shù)字化加工過程和數(shù)字化后數(shù)據(jù)的呈現(xiàn)過程中所選擇的技術標準、過程標準以及信息服務標準要如何體現(xiàn)虛擬現(xiàn)實技術是本研究的一大難點。目前此項標準國內外都未開展研究,可參考和借鑒的成果不多,希望在此提出與同行共同研究。
參考文獻
[1]The Library of Congress Technical Standards for Digital Conversion of Test and Graphic Materials[EB/OL].http://memory.loc.gov/ammem/about/techStandards.pdf.
[2]數(shù)位典藏技術匯編[EB/OL].[2010-11-08].http://core.teldap.tw/Documents/-technique.php.
[3]科技部我國數(shù)字圖書館標準規(guī)范建設項目數(shù)字資源加工子項目組.數(shù)字資源加工標準規(guī)范與操作指南[EB/OL].[2010-11-08].http://cdls.nstl.gov.cn/2003/Process/.
[4]張春紅,唐勇,邵珂.圖像資源數(shù)字加工標準及其應用[J].現(xiàn)代圖書情報技術,2009,1(12):9-14.
[5]肖瓏,陳凌,馮項云等.中文元數(shù)據(jù)標準框架及其應用[J].大學圖書館學報,2001,19(5):29-35.
本文系江西省社會科學研究“十二五”(2012年)規(guī)劃項目“客家文化資源數(shù)字化建設及其公共服務平臺研究”(批準號:12TQ03);2014年贛州市社聯(lián)課題“客家文獻數(shù)字化的價值與功用”的階段性成果。
作者簡介:
王建雄(1970—),男,碩士,贛南師范學院圖書館技術部主任,研究方向:數(shù)字圖書館及其計算機應用。