摘要:2008年7月,澳大利亞國家檔案館頒布了修訂版的《政府文件管理元數據標準》2.0版。與前標準最大的區別在于,新版標準基于多實體模型。2.0版標準運用最新的電子文件元數據研究成果,采用最新的國際標準,體現了電子文件管理元數據研究的新方向。通過介紹該標準的發展及內容,分析該版標準的特點,以期對我國電子文件管理元數據標準的研究和制定有所啟示。
關鍵詞:澳大利亞;文件管理元數據;標準;多實體方法
澳大利亞1999年5月出臺的《聯邦政府機關文件保管元數據標準》(1.0版)是世界上第一個專門為解決文件長期管理問題而頒布的國家級元數據標準,它規定了澳大利亞聯邦政府機關文件保管系統中應該捕獲的元數據集。作為澳大利亞國家檔案館推薦執行的標準,它為其他國家和地區制定、完善文件保管元數據標準提供了寶貴的經驗,奠定了良好的基礎。時隔9年之后,2008年7月,澳大利亞國家檔案館又頒布了修訂版的《政府文件管理元數據標準》2.0版(以下簡稱2.0版)。2.0版標準是1.0版的完全修訂版,與前一版相同的是,該標準可被參與設計,選擇和實施電子文件管理和業務系統的機構團體、文件管理者、IT人士、軟件商用作參考工具。而與前標準不同的是,該標準基于多實體模型,分別著錄文件、責任者、業務、法規和關系5個單獨的實體。它規定了26個基本元數據項,另有可用于描述這些實體的44個子項。
總之,2.0版標準運用最新的電子文件元數據研究成果,采用最新的國際標準,體現了電子文件管理元數據研究的新方向。
1 標準的發展過程
早在公布1.0版標準的時候,澳大利亞文件管理委員會就已經在進行文件管理元數據的細化、對照和標準化的高級框架研究。澳大利亞國家檔案館也參與了由莫那什大學牽頭的SPIRT文件管理元數據項目,制定了第一個多實體描述文件管理元數據的方法。該項目的成果已經于2000年在網上在線公布。
澳大利亞國家檔案館在1999年,SPIRT項目結束前頒布文件管理元數據標準(1.0版),是因為澳大利亞政府機構和電子文件管理系統開發商迫切需要文件管理元數據標準來指導。在1.0版頒布后,澳大利亞國家檔案館一直設想在多實體方法成熟時頒布該標準的更新版。
自2000年來,ISO和澳大利亞標準委員會都一直研究連續的文件管理元數據。澳大利亞國家檔案館也參與了該研究,其主要成果是ISO 23081——信息與文獻一文件管理流程一文件元數據的頒布。IsO標準基于多實體著錄的方法,極大地影響了新版標準的制定。另外,新南威爾士、南澳大利亞和昆士蘭權威機構都頒布了基于sPIRT項目的三實體模型方法的文件管理多實體元數據標準。這促進了澳大利亞文件管理元數據方法的集合,制定出澳大利亞政府文件管理元數據標準2.0版。
2 標準的概念模型
2.0版標準采用了SPIRT項目的文件管理元數據概念模型,具體見下圖“業務和社會司法背景下產生的文件”的概念模型。br> 
人們進行各種業務活動,在業務過程中創建并管理文件,文件也記錄了進行過的業務。這里的業務含義比較寬泛,包括所有的社會和組織活動。文件管理活動最好能與業務整合在一起。業務活動是人們在社會和組織背景下進行的,而社會和組織背景又受外部規定(如,社會道德及制約、法律、規則、標準、最優化實踐、職業道德)和內部規定(如,企業文化、政策、行政要求、當局)所支配。規定以正式及非正式的方式確定誰負責做什么,以控制社會、組織活動及文件管理行為。社會和組織活動形成的真實的文件能為該活動及企業的職能和集體記憶提供證據,也能說明該命令現在和以前、內部及外部的執行情況。
該模型標示了可以捕獲元數據的文件管理實體及實體之間的關系。對文件管理最佳實踐及其他相關元數據集的反復概念映射,以及對文件管理元數據要求的語義辨析,有助于闡明這些實體及其相互關系的元數據要素要求。
該模型基于文件連續體思想及其在澳大利亞的實踐,尤其參考了Frank Upward制定的文件連續體模型。澳大利亞系列系統(The Australian series system)強調既著錄背景和文件實體,也著錄背景及它們之間動態的關系,因此也成為該模型的主要參考。另外,該模型也吸收了David Bearman、Chris Hurley、Terry Cook及Sue McKemmish的相關文件管理思想。
3 標準的主要內容
該標準分為三個部分,第一部分是背景,介紹了標準及標準的發展、元數據標準化的目的及意義、標準的范圍及用途、元數據集的特點。第二部分是元數據項及子項的具體描述。由于2.0版標準采用了與1.0版標準截然不同的元數據描述方式,內容區別很大。該元數據集采用多實體著錄的方式描述五個不同實體(見表1)。

文件管理元數據有26項,其中8項對彩多實體著錄時是必選的;另有12項是條件選項,選擇與否取決于著錄實體及實體應用的背景;還有6項是可選項,需要更詳細的著錄時可以選擇。元數據元素定義是標準的核心內容。與1.0版類似的是,2.0版標準中的每項元數據元素與子元素都用定義、目的、容器型(是否包含子元素)與否、約束力、使用條件、適用性、可否重復、缺省值、方案及注釋來描述,如果是容器型就增加子元素一項。
最后是附錄部分。除了與1.0版標準、PREMIS及AGLS(As 5044-2002)對照,形成的3個對照表即三個附錄外,附錄D——標準的編碼方案中有元數據實施時所必須參考的具體方案22個。這也是該標準的一個特點,即正文內容十分簡單,僅有26項元數據,44項子元素;附錄部分則包括了著錄所需的全部詳細信息。例如,類別方案分別列出了五個實體各自的具體類別。文件實體分:檔案組合、檔案、系列、卷宗、業務組件、件六類。機構實體分:機構、組織、工作組、個人、機制五類。業務實體分:業務環境、職能、活動、事務四類。法規實體分:立法、規則、政策、業務規定、業務要求、社團期望、標準、文書要求、執行標準、系統說明十類。關系實體分:來源關系、文件管理事件兩類。
4 標準的特點
4.1 多實體方法的運用
2.0版標準既允許多實體也允許單實體的采用,主要取決于當前需求和機構的系統能力。可能的多實體實施包括兩實體(文件和機構)、三實體(文件、機構和業務或文件、機構和關系)及五實體(全部實施)。單實體方法的采用會導致非文件實體被作為文件屬性而被描述,與1.0版標準類似。這是最簡單的 .方法,但不能實現采用多實體方式的優點。
多實體方法能獨立、綜合地描述機構業務和文件管理過程中所包含的其他實體。該方法的優點在于:
①拓寬跨機構業務應用的能力;
②結構描述信息(不同業務系統內部或跨系統)的潛在再利用;
③獲得理解以前業務活動或決定所需的豐富背景信息。
對于不同機構來說,應選擇最能滿足其需求的類型來實施(單實體、部分多實體或全部多實體)。
多實體方法已為澳大利亞多個地方政府制定文件管理元數據標準時所采用,成為新的文件管理元數據標準發展的趨勢。隨著ISO23081的推廣,更多的國家會按照這種方法來制定本國的文件管理元數據標準。
4.2 關系與事件的結合
多實體方法的核心組成是使用關系項來描述發生的事件。關系實體能關聯兩個或更多相關實體,并提供關于關聯實體的事件或活動的信息。通過關系類型,限定關系名稱和起止日期、著錄、關聯實體和變更歷史子項,關系實體能記錄事件發生的所有信息。
關系元數據與其他文件管理元數據一樣是連貫的。即關系元數據應該保存在系統中,保持與關聯的特定實體的鏈接或存儲在一起。事件(關系)發生時總會改變特定元數據項的當前值,因此,事件發生的單獨歷史,某些事件引起的元數據值的改變需要被保存下來。關系實體可被用于保存此類事件及變更歷史。
4.3 強調元數據的再利用性
文件管理元數據的再利用是澳大利亞元數據研究的新焦點,已有項目對此進行專門研究。如,繼SPIRT項目之后的靈活性文件管理元數據項目(Clever Recordkeeping Metadata Project簡稱CRKM),其主要目標是如何在特定系統中一次創建元數據而實現滿足各種業務需求的多次再利用。2.0版標準參考了CRKM的研究成果,強調了元數據的再利用性。
除了繼承1.0版元數據集所具有的靈活性、可重復性、擴展性、協同性、兼容性及相互依賴性特點外,2.0版特別強調元數據的再利用性。該標準指出,有些滿足文件管理任務的元素也可再利用于其他目的。例如,既支持文件管理又支持資源發現和檢索的元數據就應該一次性捕獲并再利用。再如,機構中的文件可以通過網絡或其他電子方式提供公共利用。與之相類似的是其他元數據元素,尤其是那些描述實體而非文件的元素,可能因其他目的而在機構系統中存在,可以被用來支持機構文件的管理。
元數據的再利用縮小了額外元數據或元數據屬性回溯的需求。這樣既提高了業務的效率,又增強了文件的持續性。然而,在再利用之前,必須注意確保特殊元數據元素的含義在不同組織元數據方案中確實相同。
為了貫徹元數據的再利用性,該標準在元數據項設置上,采用了“提取公因式”的方式,即把五個實體中相同描述項目提取出來,如,層級、標志符、名稱、起始時間、著錄,再加入某些及某個實體共有及獨有的項目,如僅適用于責任者和業務實體的許可,僅適用于文件的關鍵詞、格式等。這樣,可以統一不同實體項中相同元數據項的語義結構,進而進行多次再利用。
5 結論
標準是隨著實踐的發展而不斷地向前發展的。澳大利亞政府文件管理元數據1999版標準,緊跟當時電子文件管理研究的步伐和實踐,采用匹茲堡大學的六個層次來描述文件管理元數據,成為后來很多國家和地區制定文件管理元數據標準的典范;該2.0版標準也體現了當前電子文件管理研究的最新成果和方向。其采用的多實體方法必將引起各國的關注,影響本國電子文件管理元數據標準的制定。如,我國的《電子文件元數據標準(征求意見稿)》和電子文件管理細則第一部分:文書電子文件元數據方案(征求意見稿)都采用了多實體著錄的方法。當然,電子文件管理研究仍然在以前研究成果的基礎上不斷地深入。隨著電子文件管理研究及實踐的發展,必將還有更新、更科學的文件管理元數據標準出現,指導電子文件管理的實踐。