程妍妍+陳洋

摘 要:從完善我國數字檔案館元數據標準體系,提高其標準化水平出發,對目前國際數字檔案館應用的三類元數據標準及其項目進行調研,包括文件管理元數據標準、著錄元數據標準和長久保存元數據標準,并深入分析國際數字檔案館元數據標準的發展現狀和未來趨勢,以為我國數字檔案館元數據標準制定及項目研究提供參考和有益啟示。
關鍵詞:數字檔案館;元數據;標準
元數據標準是數字檔案館運行的重要支撐,其為數字檔案館的長久保存、憑證性維護和檢索利用等工作提供可供依據的規則和指南。本文通過調研和分析國際數字檔案館主要元數據標準類型和項目,為我國積極研究國際元數據標準的采標或制定,彌補我國現有標準體系的不足,提供有益參考和借鑒。
1 數字檔案館元數據標準的概念和功能
元數據,即“Metadata”,指“長久的、在領域內或領域間支持文件的形成、注冊、分類、利用、長久保存和處置的結構或半結構的信息”。[ ]而元數據標準指“說明元數據元素之間關系的邏輯方案,通常建立元數據的語義(使用和管理規則)、語法和值的完備性等”[ ]。元數據標準核心功能是推動數字檔案館系統間元數據的互操作。元數據互操作指“元數據可以在不同機構和不同類型的信息系統之間順利地移動和交換”[ ]。在互操作過程中,必須首先明確采用何種方式、語言(例如XML),如何解釋元數據等一系列問題,系統之間才能順利地理解交換的元數據。元數據標準就是對這些問題進行說明和規定的規范性文檔,內容包括元數據值的定義方式和語義、值列表、分類詞表、控制詞匯等,以確保交換元數據的質量和一致性理解。
2 國際數字檔案館元數據標準的主要類型及項目
數字檔案館應用的元數據分為三類,包括:①檔案機構移交的電子文件管理元數據;②數字檔案館對接收檔案著錄形成的著錄元數據;③數字檔案館在保管電子檔案過程中形成的長久保存元數據。
2.1 文件管理元數據標準及項目。文件管理元數據標準的研究具有代表性的是美國電子文件專家戴維·比爾曼(David Bearman)主持的“電子文件保管證據性功能需求”[ ],該項目目標是明確確保電子文件憑證性所必需的元數據。該項目貢獻包括:①提出元數據的權威來源:提出從國家法規標準等文獻中總結出電子文件的憑證性需求,繼而從具體需求推導出相應元數據的方法[ ];②建立元數據標準模型:提出元數據業務交流模型(Business Acceptable Communications)(以下簡稱“BAC”),可用于指導元數據標準制定。在澳大利亞,莫納時大學學者蘇·麥克米希(Sue McKemmish)開展了元數據研究和訓練項目(Research and Training Project),該項目在文件連續體理論基礎上提出“法規三元組”模型,將元數據劃分為四大實體:業務、責任者、文件、法規標準,并分別研究了這四大實體應具備的基本元數據元素。這種創新性的元數據模型超越了對文件本身的描述,也描述文件的職責、政策、人員、業務活動等,促使人們對電子文件管理元數據的認識上升到一個新的層次。該模型也被寫入國際標準化組織ISO 23081元數據系列標準。
2.2 著錄元數據標準及項目。著錄形成的條目其實就是元數據,國際著錄元數據標準以國際檔案理事會(ICA)頒布的標準為代表,主要包括:
(1)國際通用檔案著錄規則(以下簡稱“ISAD”(G))。該標準主要用于數字檔案館電子檔案元數據著錄,包括二十六個元數據元素,七大著錄項(標識、背景、內容和結構、利用和使用條件、相關材料、注釋和著錄控制)。
(2)檔案責任者規范記錄標準(簡稱“ISAAR”(CPF))。該標準主要是針對檔案相關的責任者背景信息進行著錄,包含四大著錄項(標識、說明、關系和控制)。該標準不僅提出著錄責任者元數據信息在信息交換時,作為檢索點上的重要意義,也提出了單獨捕獲和維護檔案背景信息元數據,并且保持和檔案自身著錄元數據信息鏈接的重要性。
(3)檔案職能著錄規則(簡稱“ISDF”)。該標準主要是對機構業務職能進行著錄的元數據標準,該標準對職能的定義是由法律、法規、政策授權的,確保組織機構可靠性的責任、職責或任務[ ]。該標準提供四大著錄項,二十三個元數據元素對職能信息進行著錄,包括職能類型、名稱、分類、職能日期、詳細說明、相關職能等,既可以著錄機構的高層次社會職責,也能夠記錄某一次業務活動。
2.3 長久保存元數據標準及項目。長久保存元數據標準最具代表性的是國際聯機計算機圖書館中心(OCLC)2003年發起的長久保存元數據實施戰略項目,發布了《PREMIS長久保存元數據數據字典》[ ]標準,已成為國際長久保存領域事實上的標準,全世界已經有48家機構正式注冊為PREMIS標準的用戶[ ],其中包括美國電子文件檔案館、瑞士國家檔案館、蘇格蘭國家檔案館、新西蘭檔案館等多家機構。PREMIS標準將長久保存元數據抽象為五個實體:知識實體(Intellectual),對象(Objects)、權限(Rights)、主體(Agents)和事件(Events),并對后四個實體的元數據進行了詳細說明。
3 國際數字檔案館元數據標準的現狀分析及未來趨勢
3.1 以文件元數據為主體的標準體系初步形成。 從目前國際對這三種元數據標準的研究來看,文件元數據標準是主體,因為文件元數據標準中蘊含著豐富的文件軟硬件形成環境、業務職能背景、責任者等信息,因此,立檔機構如果遵照科學的文件元數據標準,移交完善的文件元數據,那么,數字檔案館只需在文件元數據基礎上,補充部分的后端著錄元數據,以及長久保存過程(轉化、遷移、利用)中形成的元數據即可。而且從這三類標準來看,標準之間存在元素重疊的現象,因此,元數據完全可以由立檔機構一次生成,數字檔案館重復使用。強調文件元數據標準在標準體系中的重要作用在于:①確保電子檔案的憑證性,文件的形成環境,即所謂的前端,是確保電子檔案憑證性的關鍵點,文件元數據標準可以控制前端的憑證性;②促使數字檔案館工作重心發生改變:數字檔案館工作重心可以轉變為在已經生成的文件元數據基礎上,對其進行驗證和補充后續元數據,而不必像以前那樣從頭開始著錄,避免浪費人力物力,而可以把精力放在更有價值的工作上。
3.2 元數據標準模型的兼容性不斷增強。早期,文件、著錄和長久保存元數據標準的研究是并行和相對獨立發展的,隨著領域之間合作的增強,現代元數據標準越來越有統一的趨勢,最明顯的特征就是元數據標準模型的設計思想越來越接近。以文件和長久保存元數據標準的模型為例進行比較說明,如表1所示。
如表1所示,文件管理元數據標準模型以ISO 23081標準[9]“法規三元組”模型為代表,長久保存元數據標準模型以PREMIS模型為代表,兩者比較發現:兩個模型都采用了實體關系法描述元數據,實體即“任何存在的,或過去存在的,或可能存在的具體或抽象的事物,包括這些事物之間的聯系”[10],元數據標準采用實體來抽象和提煉元數據描述的對象,例如ISO 23081模型將文件元數據描述對象簡單抽象為四個實體,即:文件、主體、業務和法規標準實體,其中每一個實體都應配備相應的元數據,例如文件實體應配備文件題名、形成時間、主題等元數據。同樣,PREMIS模型也對長久保存元數據描述對象抽象為知識、對象等五個實體。從這兩個模型的實體分類來看,存在一定的對應關系,例如兩個模型都提出應具備主體(Agents)、業務(Business)兩個實體,雖然實體的語義略有區別,但是其基本思想是一致的,都強調主體(人員或系統)、業務事件元數據在文件管理和長久保存活動中的必要性。而其他實體,例如文件、法規標準、權限實體等也都可以找到類似的對應實體。
這種模型實體之間的對應關系,體現了元數據標準之間對于元數據分類、功能的一致理解,這也促使標準的兼容性增強,元數據元素映射、交換等一系列工作簡化。并且從目前文件管理元數據和著錄元數據標準的模型關系來看,兩者之間的發展更是緊密,早期文件元數據標準BAC模型和著錄元數據標準ISAD(G)的多級著錄模型相差較遠,但當ISO 23081模型出現后,現在兩種標準采用的模型基本一致,這種一致性會減少多樣化,簡化數字檔案館標準應用和管理,正如著名學者Cunningham指出的,“我們需要的是一套互相關聯的文件管理和檔案著錄元數據標準”[11]。
3.3 元數據標準的未來走向和研究趨勢。數字檔案館元數據標準未來主要有兩個熱點方向,包括:
(1)專業化元數據標準研究。目前元數據標準多應用于政府機構文書類型的電子檔案,應當研究和評估這些研究成果是否能夠適用于那些非文書類型的電子檔案,例如圖像檔案、電子郵件等,雖然國際電子文件真實性項目InterPARES2[12]曾經研究過藝術領域電子檔案的長久保存元數據問題,但未取得一定的標準化成果,該領域仍需要更多挖掘。
(2)面向用戶利用的元數據標準。數字檔案館元數據標準中一個重要的研究領域就是制定能夠反映用戶利用需求的利用元數據標準。目前,在數字檔案館的所有元數據標準研究中,唯獨缺少利用元數據標準。利用元數據就是指能夠反映不同領域用戶的利用需求,用于檢索和查詢檔案的元數據。數字檔案館保管檔案會被不同領域用戶所利用,不同領域的用戶可能需要各種不同的元數據信息來理解和利用檔案材料。開放檔案信息系統模型項目(OAIS)曾提出定義元數據來理解和利用檔案,但是需要哪些元數據,并未明晰。國際多倫多大學、密西根大學合作研究項目AX-SNet(Archival Excellence in Information Seeking Studies Network)[13]致力于明確檔案用戶利用需求,但未出現有影響力的成果。利用元數據標準開發的難點在于對數字檔案館不同用戶群利用方式的理解,包括檔案的目標利用者是誰、其利用檔案的偏好、需要哪些類型的信息來正確、深入地理解電子檔案等。但是基本可以明確的是,利用元數據將基于文件和著錄元數據基礎之上構建。
參考文獻:
[1][2]ISO 23081-2,信息和文獻——元數據管理——第2部分:概念和實施問題[S].
[3]Jorien Weterings MA.Changing theory into practice: playing the metadata Game.[2014-06-30].http://ica2012.ica.org/files/pdf/Full%20papers%20upload/ica12Final00184.pdf/.
[4]Kimberly J.Barata.Functional requirements for evidence in recordkeeping: further developments at the university of Pittsburgh.[2014-07-02].http://www.asist.org/Bulletin/Jun-97/barata.html/.
[5]Wendy Duff. Evaluating metadata on a metalevel.[2014-07-03].http://link.springer.com/article/10.1007%2FBF02437692#page-2/.
[6]ICA.ISDF International Standard for Describing Functions[S].
[7][8]PREMIS Editorial Committee.PREMIS Data Dictionary for Preservation Metadata[S].
[9][10]ISO 23081,信息和文獻——元數據管理[S].
[11][12] Marlene Van Ballegooie.Instalment on “Archival Metadata”.[2014-07-05].http://www.dcc.ac.uk/sites/default/files/documents/resource/curation-manual/chapters/archival-metadata/archival-metadata.pdf.
[13]Helen R.Tibbo.AX-SNet Research Agenda.[2014-07-18].http://files.archivists.org/conference/2008/researchforum/TibboYakelDuff-AbstractBio-2008.pdf/.
(作者單位:南京政治學院上海校區軍事信息管理系 來稿日期:2014-07-27)