
摘要:本文通過文獻分析法,對2000——2011年我國有關電子文件管理元數據的論文進行分析總結,以進一步了解我國電子文件管理元數據的研究現狀,并為未來的研究發展提供幾點建議。
關鍵詞:電子文件 元數據 綜述
“元數據”一詞,由來已久,其最早出現于計算機信息領域。自1996年美國著名電子文件專家戴爾·比爾曼在第十三屆國際檔案大會上提出“元數據”以來,元數據開始進入檔案學界研究人員的視野,并逐漸發展成為檔案學界新的研究熱點,尤其是對電子文件管理元數據的研究。筆者試圖通過文獻分析法,對2000——2011年我國電子文件管理元數據的研究情況進行歸納和總結。
1.數據統計分析
筆者選取了中國期刊全文數據庫、中國期刊全文數據庫-世紀期刊、中國博士學位論文全文數據庫及中國優秀碩士學位論文全文數據庫,使用高級檢索,在“題名”檢索項中填入檢索詞“元數據”,同時在邏輯“且”條件中選擇“關鍵詞”檢索項并填入檢索詞“電子文件”,選擇2000至2011作為檢索時間,最終共獲取有關電子文件管理元數據的論文134篇,其中中國期刊原文數據庫搜索出132篇,中國優秀碩士學位論文數據庫2篇。
通過對論文發表年度的統計分析,可以了解電子文件管理元數據的研究進展情況。依據本文所使用的檢索方法獲取的134篇論文,其年度分布情況如表1所示。
由表1可知,從2000年到2011年,有關電子文件管理元數據的論文數量明顯呈上升趨勢,并且自2002年開始,論文數量一直保持在比較穩定的水平,這說明現階段,電子文件管理元數據問題仍是我國檔案學者普遍關注的問題,有關此問題的研究也仍在持續進行中。
2.電子文件管理元數據研究的主要內容
2.1電子文件管理元數據的概念與功能研究
2.1.1電子文件管理元數據的概念
元數據最早出現于計算機技術領域,此后被廣泛應用于多個領域。自戴維·比爾曼將其引入電子文件管理領域以來,檔案學者開始對其進行研究,而有關元數據概念的研究自然首當其沖。目前為止,我國檔案學者對電子文件領域內元數據的概念研究大致可分成三個階段:初始定義階段、著錄元數據階段以及電子文件管理元數據階段。①
初始定義階段,即直接引入計算機領域元數據的定義:元數據即關于數據的數據(data about data)。但這一概念過于寬泛,可以適用于各種不同領域,并不專門針對電子文件,無法作為電子文件領域的專業術語或概念,不具備專指性和唯一性。同時這個概念也過于抽象,檔案工作人員無法正確的認識和理解它,更不知道在實踐工作中如何具體的運用它。因此,檔案學界繼續對元數據的概念進行探索,進而進入元數據概念研究的第二階段:著錄元數據階段。
著錄元數據階段。所謂著錄元數據,即元數據是關于單一電子文件和文件組合的背景及相互關系的結構化著錄數據。②其實這里的著錄元數據也就是指著錄信息,這一階段支持這一觀點的代表性學者有董永昌、何嘉蓀、劉越男等。董永昌、何嘉蓀就明確提出“元數據是著錄信息”。著錄元數據概念的提出賦予了元數據有關檔案學的特定意義,同時由于著錄這一概念對廣大的檔案工作者而言并不陌生,因而也大大提高了整個檔案界對元數據的認識,有利于在實踐工作中更好的操作和運用元數據。但這一觀點也受到不少研究者的質疑,一些檔案學者認為,元數據與著錄信息在作用、獲取方式、穩定性等方面都有所不同,因此不能單純的將元數據定義為著錄信息。為此,劉越男提出“在電子環境中可以將文件管理元數據理解為著錄信息”③的論點,并從現代著錄定義的拓展、國際元數據標準與檔案著錄標準的關聯以及電子環境中兩者的本質等方面對這一論點進行了論證。
電子文件管理元數據階段。這一階段我國檔案研究者們引入了國際檔案界提出的“電子文件管理元數據”概念,即“在對電子文件及其與文件創建和管理有關的人、過程和系統進行確認以及為其提供憑證和背景信息的過程中,有關文件的管理、利用和文件可理解性的元數據。” 電子文件管理元數據是專門設計用于滿足電子文件管理需求,有關保證文件的真實性、可靠性、穩定性、安全性、完整性、可理解性與可利用性的數據。可以看出,這兩個元數據的概念是從作用的角度對電子文件領域的元數據加以定義的,體現了元數據在電子文件管理中的作用。同時通過賦予電子元數據不同的作用和用途,將電子文件管理元數據與其他領域的元數據區分開來,使其具備檔案學的專業內涵。
2.1.2電子文件管理元數據的功能
我國檔案學界對電子文件管理元數據的功能進行研究的學者較多。目前主要有四種代表性觀點:
(1)用系統論觀點,將元數據的功能分為總體功能和局部功能。代表人物為徐維,他指出“元數據的功能就是指元數據系統在電子文件管理計算機系統中所能發揮的作用和能力。電子文件管理的目的就是通過元數據的功能來實現的。元數據的功能可以分為總體功能與局部功能。”④同時系統的闡述了元數據功能在文件階段的不同體現以及總體功能與局部功能的關系。
(2)用比較研究法,建立新的元數據功能認識模型和聯系模型。檔案學者張正強通過對國際檔案學者、國際標準化組織、國際元數據項目以及國際標準等提出的元數據功能系統進行比較分析,并從行為、能力和功效這三個方面對這些功能加以重新認識和理解,最終建立起基于行為功能、能力功能和功效功能的元數據功能模型及其聯系模型。
(3)從應用和發展的角度,研究元數據的主要功能。XML模式在電子文件管理元數據中的應用被越來越多的檔案學者所重視。主要觀點是從電子文件管理元數據角度來分析,XML模式主要具有描述與約束兩項功能。即XML模式描述元數據元素間的邏輯結構和語義功能;約束元數據元素數據值及類型功能。
(4)從信息資源的角度,論述元數據的具體功能。研究分析這種觀點的學者主要是從元數據對信息資源的著錄描述、組織集合、確認和檢索、管理控制、長期保存以及還原等功能上進行具體分析總結,從而進一步證明了電子文件管理元數據是電子文件管理系統中的“血液”。
2.2 電子文件管理元數據的標準化研究
電子文件管理元數據的標準化研究既包括對各種國際國內元數據標準和規范的研究,也包括對元數據的標準設計框架、語義結構、語法結構等具體內容的研究。
2.2.1 元數據標準和規范研究
目前在檔案學界有不少學者致力于國際元數據標準的研究,研究對象主要有兩個:ISO 23081文件管理元數據標準和《澳大利亞政府文件管理元數據標準》。研究者主要從內容、特點、實用性等角度對標準進行評價和分析,在此基礎上制定出適合于我國國情和實際工作的元數據標準。
關于電子文件管理元數據規范的研究目前還比較少。只有何嘉蓀、金更達兩位發表了3篇題名為“電子文件管理元數據的規范”的系列論文。該規范包括元數據標準模型設計、元數據核心元素定義等內容,并建立了多種模型,如設計框架模型、元數據信息來源模型、元數據標準模型等。從整個元數據標準的設計框架到具體的元數據元素定義,這一標準都給出了比較詳細而具體的解釋和要求規范,有助于元數據在實際工作中的操作和運用。
2.2.2 電子文件管理元數據標準設計框架研究
電子文件管理元數據設計框架為設計電子文件管理元數據標準提供了需要遵循的規則、方法和設計流程等內容,我國有關電子文件元數據標準設計框架的研究,具有代表性的有兩種觀點。一種是由何嘉蓀、金更達提出的電子文件元數據標準框架。在這個框架中,最底層為功能描述與設計原則,其次是基礎理論:文件運動理論,頂層是元數據應用,這是一個自下而上的過程。另一種觀點由張正強提出,通過對電子文件管理元數據頂層框架設計標準化可供選擇的兩大基礎性標準, 即OAIS 參考模型的元數據頂層框架和國際標準ISO 23081元數據的頂層框架的比較分析, 認為在電子文件管理元數據標準的制定上, 應該選擇國際標準ISO 23081第二部分元數據的頂層框架。⑤因為,與其他標準相比,ISO 23081文件管理元數據標準第二部分元數據的頂層框架具有“有電子文件管理理論支持”、“標準化程度高”、“應用廣泛”等特點。
2.2.3 電子文件管理元數據語義和語法結構標準化研究
電子文件管理元數據語義是指人們對其可以直接讀取的內容涵義部分;而語法則是指計算機對其可以直接讀取的置標結構部分。⑥電子文件管理元數據作為一種人工語言,與自然語言相比當然有所不同。但作為一種語言,從語言學角度來看,它也包含語義和語法兩個部分,因此許多檔案學者就從這兩個方面對元數據描述方式標準化的問題加以研究。
(1)電子文件管理元數據語義結構標準化
目前有較多學者對元數據語義結構標準化問題進行了研究,研究內容主要包含兩個方面:一是元數據元素語義結構標準化,二是元數據值語義標準化。
元素語義標準化研究的代表性學者有張正強、張豐滿。張正強教授通過發表元數據元素語義結構標準化的系列論文,對電子文件管理元數據的四個核心元素:主題元素、時間元素、責任者元素和關系元素,都進行了深入而透徹的研究。張豐滿也對這一問題進行了研究,他認為“元數據元素語義的結構化是最基本的語義結構化, 是保證元數據基本元素和子元素理解的一致性、實現基本元素和子元素互操作的關鍵。標準化的元素語義結構有助于實現文件管理元數據描述電子文件的準確性, 保證電子文件真實性、可靠性、完整性和可利用性, 保證電子文件的法律證據價值。”⑦
關于元數據值語義標準化的研究還較少,目前只有張豐滿對這一方面進行了研究。他從基本值語義和值構成語義兩方面,通過對國際標準化組織或外國元數據值語義結構化實例進行比較研究,深入剖析了元數據值語義結構化問題,從而為其標準化打下基礎。
(2)電子文件管理元數據語法結構標準化
元數據語法結構即定義了元數據的格式結構及其描述方式。而目前我國檔案學界有關這兩方面的研究都較少。對元數據格式的研究,主要集中于介紹國外各種元數據格式,包括EAD、TEI、DC等;而對元數據描述方式的研究,主要為對各種置標語言的介紹和比較研究,如HTML、XML及TEXT等。其中以對XML的研究為主,其具有強大的自我描述能力,又具有適合網絡應用的可擴展性。
2.3 電子文件管理元數據應用研究
2.3.1 電子文件管理元數據在電子文件全過程管理中的應用
我國學者黃萃指出,對基于元數據的電子文件全程管理,應該在電子文件管理系統的設計階段、電子文件形成階段、運行階段、維護階段、鑒定階段、歸檔階段、整理階段、保管階段、利用階段、脫機電子文件管理各個階段進行管理,同時在各個階段中元數據的技術得到相應地應用。⑧此外,蘇州大學檔案學系的譚箏培、章丹以及趙梓彤等人對電子文件管理元數據在電子文件鑒定和著錄中的應用進行了具體研究。
2.3.2 電子文件管理元數據在電子文件集成管理與服務中的應用
何嘉蓀教授指出“集成管理與服務是消除信息孤島、實現數據交換和共享的重要手段,同時也是實現電子文件管理的重要手段。就電子文件及其管理而言,集成可以分為三個層面,即系統集成、數據集成和服務集成。系統集成指的是形成、運行、管理、儲存和輸出電子文件的系統平臺相互之間的集成;數據集成指的是電子文件包括元數據以及其他信息資源在內的集成。這兩種集成綜合起來又可以稱為對電子文件的集成管理,是對多種系統平臺以及產生于其中的電子文件——具有分布性、自治性和異構性的電子文件運動全過程施行的,足以保障電子文件真實的、動態的、有效的和全方位的綜合統一管理。集成服務則是在集成管理的基礎上進行的,一是將所有的服務(包括服務內容、服務方式)集成在一起,通過一個具有交互功能的公共服務平臺(或可稱之為門戶),為用戶提供滿意的、高效的服務;二是通過系統集成和數據集成,為用戶提供一個統一的信息服務入口(如搜索引擎),來實現信息的檢索、定位等功能。”⑨
同時基于元數據在確保電子文件真實性和憑證價值、方便查詢與檢索、利于長久保存等方面的有效性。何嘉蓀教授認為“元數據是電子文件管理不可或缺的重要工具”,“元數據管理是電子文件管理的核心問題”,并由此建立了基于元數據的電子文件集成管理與服務模型。
3. 總結
綜上所述,目前我國檔案學界有關電子文件管理元數據的研究主要集中于電子文件管理元數據基礎理論研究、電子文件管理元數據標準化研究以及電子文件管理元數據應用研究這三個方面,可以說,已經形成了初步的電子文件管理元數據的理論體系。但這一體系仍存在部分不夠成熟和完善之處,有待我國檔案學界研究者們的進一步探索。
3.1 致力于電子文件管理元數據標準的制定
我國檔案學界進行電子文件管理元數據研究的主要目的是制定滿足我國電子文件管理實際工作需求的元數據標準,建設電子文件管理元數據標準體系,以解除目前我國電子文件管理面臨的缺乏標準指導的困境,促進我國電子文件管理的科學化、標準化。目前,我國檔案學者們通過分析學習國際標準、借鑒國外相關經驗的方式,已初步形成了比較完善的電子文件管理元數據基礎理論體系。因此,在未來的研究過程中,研究者們應以已有理論知識為基礎,結合電子文件管理實際工作,制定出更多更科學完善的標準規范,指導我國電子文件管理工作實際。
3.2 注重應用研究
電子文件管理元數據應用方面,研究內容相對單一,僅限于電子文件具體管理過程及集成管理與服務等方面的理論研究,缺乏特定的電子文件管理系統中元數據應用問題的研究。所謂特定的電子文件管理系統一般是指實際工作中某個機構或組織,為管理電子文件而專門開發的管理系統。由于缺乏統一標準的指導或對“元數據”認識的不足,無法在管理系統中較好的實現元數據的功能,發揮元數據的作用與價值。因此,研究者們應重視電子文件管理元數據的應用研究,以幫助檔案工作人員解決在實踐工作中遇到的元數據的操作與運用等問題。而這恰恰是現階段迫切需要解決的問題。
3.3 加強理論研究的獨創性
雖然我國目前已初步建立了電子文件管理元數據的理論體系,但通過分析發現,許多理論和方法都引入國外成果,再在此基礎上加以發展的,缺乏一定的獨立性和創新性。如元數據概念的研究,雖然經歷了三個階段的轉變,我們對元數據的認識越來越成熟,越來越明確了,但這三個階段是因國際檔案界對元數據概念的轉變而出現的,并非我們的獨立創新,或自我發展。因此,今后進行理論研究時,除了要善于借鑒國際經驗,我們更應努力實現自我創新。
參考文獻:
① 李雙文.論元數據的概念、層次和作用[J].云南檔案,2009(9):15-16.
② 徐維,胡吉兵,管志宇.元數據概念的產生、發展和成熟[J].中國檔案,2003(8):43-44.
③劉越男.對電子文件管理元數據的再認識[J].檔案學通訊,2005(2):58-62.
④徐維.對元數據功能與性質的深層解析[J].蘭臺世界,2005(7):20-22.
⑤ 張正強.論電子文件管理元數據頂層框架設計的標準化[J].中國圖書館學報,2009(3):80-88.
⑥張正強.電子文件管理元數據描述方式研究[J].中國圖書館學報,2010(5):108-119.
⑦ 張豐滿.電子文件管理元數據元素語義的結構化探索[J].中國圖書館學報,2009(1):97-103.
⑧ 黃萃.基于元數據的電子文件全程管理[J].檔案管理,2003(4):16-18.
⑨ 金更達,何嘉蓀.數字檔案館模式探討——基于元數據的電子文件集成管理與服務研究之二[J].檔案學通訊,2005(5):54-58.
作者單位:李文佳 安徽大學
熊瑤 中國人民大學信息資源管理學院