許臻 顏祥林
(南京大學信息管理學院 南京 210046)
進入21世紀后,我國檔案信息化建設正式開展,特別是2002年國家檔案局發布的《全國檔案信息化實施綱要》將檔案信息化納入了國家信息化建設的格局。至今二十年來,檔案信息化建設一直是檔案學研究的重點,而作為其核心的電子檔案相關研究是最大的熱點之一。但本文經過初步的文獻調研,發現我國對“電子檔案”的研究有相當一部分“隱匿”于“電子文件”的身后,尤其是2002年的《電子文件歸檔與管理規范》(GB/T 18894-2002)頒布之后,學界掀起了對“電子文件”研究的熱潮,相比之下,“電子檔案”在學界并沒有得到足夠多的關注。而從2014年開始,業界對“電子檔案”的關注度逐漸升高,比如《電子檔案管理基本術語》(DA/T 58—2014)(以下簡稱《術語》)和《電子文件歸檔與電子檔案管理規范》(GB/T 18894—2016)(以下簡稱《規范》),特別是2021年實施的新《檔案法》第五章“檔案信息化建設”首次以法律條文的形式確認了電子檔案的法律效力,并對電子檔案的合法要件做出了明確規定[1]。種種政策法規標準都傳遞出了一個信息:檔案界已經進入電子檔案管理的時代,因此有必要對電子檔案管理的已有研究進行一定的關注。
回顧已有的研究,較有代表性的有:文獻[2]指出近五年電子文件的研究熱點主要集中在電子文件的單軌制和單套制、電子文件的管理模式、電子文件的長期保存這三個方面。有文獻[3]通過關鍵詞聚類歸納出電子文件元數據、電子檔案、計算機外圍設備、檔案學會、技術檔案、大數據、檔案法、檔案信息化建設、管理這九大研究主題,還有文獻[4]通過關鍵詞歸納出了電子文件管理研究的4個特征,也有文獻[5]歸納分析了1979—2020年三個時間階段的研究主題。文獻[6]通過文獻關鍵詞詞頻與共現分析,歸納出檔案管理、電子文件和電子檔案等主要研究方向,以及電子檔案、檔案事務、檔案信息化、文件、檔案機構和檔案人等研究主題。
在上述研究中,本文發現:研究的主題分類方法主要停留在關鍵詞的聚類分析上,沒有對具體主題展開分析,且研究主題的劃分也存在一定的交叉。基于此,本文擬從電子檔案管理流程的視角切入,對2000—2020年我國電子檔案相關文獻的研究主題進行再次梳理與分析,以揭示電子檔案研究的主題分布與主要方向,以期為檔案界后期的相關研究提供一定的幫助。
針對現有研究,本文認為有必要先明晰電子檔案的概念。我們在對相關研究進行進一步解讀后發現,有些文章雖以“電子文件”為標題,但實際上其主要研究的是電子文件歸檔后的電子檔案管理活動。由此可知,當前檔案界依然存在對“電子檔案”與“電子文件”二者定位與關系認知不清晰的現象。早在2010年,文獻[7]就指出了電子文件與電子檔案概念使用混淆的現象及其背后的本質原因,很大一部分原因是來自對國外文獻的翻譯錯誤,即大多文獻將“Record”錯譯為“文件”,而不是其真正指代的“檔案”,因此生出了諸多誤會,這也在一定程度上助長了檔案界對“電子文件”的研究熱度。
對于“電子文件”,我們可以從兩個角度理解[8]:一是大電子文件概念,即涵蓋整個電子文件生命周期,從電子文件形成、辦理到歸檔、移交再到最后長期保存和利用;另一個是小電子文件概念,即在形成和辦理階段稱之為“電子文件”,在歸檔以后就叫“電子檔案”,檔案室階段和移交檔案館長期保存處理階段都稱之為“電子檔案”。根據《術語》,電子檔案指“具有憑證、查考和保存價值并歸檔保存的電子文件”。而電子文件指“國家機構、社會組織或個人在履行其法定職責或處理事務過程中,通過計算機等電子設備形成、辦理、傳輸和存儲的數字格式的各種信息記錄”。
因此,要研究電子檔案,無法繞過“電子文件”。為了避免混淆并回應電子檔案管理時代的到來,本文所指電子文件為小電子文件概念。從工作流程上來看,電子檔案是由電子文件及其相關信息經過歸檔形成的,可以將電子文件和電子檔案看作是前身和后世的關系。從責任主體上看,電子文件由電子文件形成或辦理部門歸檔成為電子檔案后,就由檔案部門負責其后續的管理工作,而保管期限為永久的電子檔案及其元數據自形成之日起5年內還應向同級的國家綜合檔案館移交。
已有研究大多是基于關鍵詞,通過關鍵詞聚類等計量方法歸納出研究主題,但其研究結果并沒有和電子檔案的實踐工作相結合,本文認為理論研究也應該建立在實踐工作的基礎上,因此本文選擇從電子檔案工作流程的視角切入,將文獻探討的具體問題與各個管理環節相對應,將理論與實踐進行更好的結合。而《規范》可以為本文的研究視角提供一個基礎參照,因其規定了在公務活動中產生的,具有保存價值的電子文件的收集、整理、歸檔與電子檔案的編目、管理與處置的一般方法。其中,其將電子檔案的管理流程分為業務系統與電子檔案管理系統、電子文件歸檔范圍、電子文件的收集與整理、電子文件歸檔與電子檔案編目、電子檔案的管理、電子檔案的處置等六大環節。本文在此基礎上,將第一個環節調整為“電子檔案的信息技術環境”,并主要關注電子文件歸檔系統、電子檔案管理系統和檔案信息化基礎設施等相關內容,再將其二、三、四環節合并為“電子文件的歸檔管理”,但其中“電子文件的收集與整理”指的是電子檔案前端的小電子文件管理活動,不屬于本文的重點討論范圍,又將第五、六環節合并為“電子檔案的管理與處置”,此外,為了更好地體現檔案工作的最終目的——為社會提供利用這一特性,本文將第五環節中的“電子檔案的利用”獨立出來成為本文研究的重點環節之一,主要涉及電子檔案的整合與開發、服務與利用等內容。至此,本文形成了電子檔案管理的信息技術環境、電子文件的歸檔管理、電子檔案的管理與處置和電子檔案的利用這四大研究主題。
關于本文的文獻分類,主要以文獻探討的問題出現在哪一個工作環節中為判斷標準,若出現涉及多環節的文章,會對其主要論述的問題進行判斷,即本文研究的文獻與其研究主題基本為一對一的關系。
本文為了保證研究對象具有更高的專業性和深度性,將文獻來源限定于《檔案學通訊》和《檔案學研究》兩個期刊中,并以“TKA=’電子檔案’+’電子文件’+’數字檔案’”為檢索式,時間限定為2000年1月1日至2020年12月8日,檢索得出584條結果。正如前文提到的,檔案界對電子文件的理解有大電子文件和小電子文件兩種角度,本文研究的是大電子文件中從電子文件歸檔開始的后端電子檔案管理活動。此外,由于數字檔案是數字檔案館館藏數字資源的總稱,其包括電子檔案、傳統載體轉換生成的數字化檔案和有價值的數字信息資料[9],本文發現許多以“數字檔案”為研究對象的文獻也涵蓋了電子檔案的利用問題。因此本文的文獻篩選和分類標準如下:一是將僅涉及小電子文件管理活動的文獻及其他無關文獻剔除;二是將文獻主要探討的問題與工作環節一一對應分類。通過閱讀文章標題、摘要和部分正文,本文最終從584篇文獻中篩選出318篇相關文獻。
從時間分布上看,318篇文獻總體較為均衡,不過近十年的發文量為177篇,明顯高于2000至2010年的141篇;從研究主題分布上看,除了“電子檔案管理的信息技術環境”這一主題文獻量較少,共30篇,只占總量的9%,而75篇的“電子文件的歸檔管理”和76篇的“電子檔案的管理與處置”以及68篇的“電子檔案的利用”,文獻量占比皆在21%~24%之間,此外,余下69篇為概念辨析等基礎理論探討與綜合性較強無法歸入四大主題的其他類文獻,占比22%。我國電子檔案管理研究主題分布圖如圖1。

圖1 電子檔案管理研究主題分布圖
電子檔案的概念應該是每個檔案工作者都要首先明晰的內容,因此本文將本來被歸在其他類的關于電子檔案相關基礎概念的文獻提到首位論述。
2.1.1 基礎概念
(4)高職泛在學習資源需要保證知識點的連貫性和交叉性。知識是相互關聯的,不是孤立存在的。而現有的資源多是以課程為單位來建立資源庫,課程與課程之間的聯系并沒有在資源庫中體現出來。比如,《數據庫系統》和《C#程序設計》這兩門課就不是孤立地去學,學完的最終目的是需要用c#程序作為前臺和數據庫作為后臺數據支撐實現一個完整的信息系統。當前的教學資源建設就沒有考慮到這一點,而是作為兩門獨立的課程分別開發。類似的課程還有很多。為了避免所構建的教學資源成為一個個的“信息孤島”,應該考慮到知識點的交叉性。同時,為了滿足高職學生的碎片化學習方式,在開發資源時應該考慮以知識點來進行開發,而不是以課程為單位。
由于我國檔案信息化進程晚于發達國家,在起步階段對發達國家相關成果的翻譯和介紹給檔案界的概念使用帶來了很大的影響,很長一段時期以來,檔案界偏向以“大文件觀”的視角來探討實為檔案工作者的工作內容。關于電子檔案和電子文件之間的概念區分,蔡學美[10]指出,電子檔案是由電子文件經過歸檔環節而來的,電子檔案的電子形式是原生的,來源于電子文件。二者是信息化條件下文件檔案生命周期的兩個階段,電子文件是前端,電子檔案是后端。而數字檔案是數字檔案館館藏數字資源的總稱,所包含的概念大于電子檔案,因其除了電子檔案,還包括紙質等傳統載體轉換生成的數字化檔案等。不過,早在我國電子文件和電子檔案研究剛起步不久的2000年,就有文獻[11]提醒到,不論是電子文件還是電子檔案,不能過分強調其形式,其本質都是文件或檔案,“電子文件”或“電子檔案”也會像“機讀檔案”一樣,只是一個過渡性的詞匯,最終仍要回到文件或檔案這樣一些基本概念上來。除此之外,還有文獻[12]在對新《檔案法》中電子檔案的“要素合規”作了詳細解讀的基礎上,把電子檔案要素內容概括為背景要素、案卷要素、形成要素、管理要素和效力要素等。
2.1.2 信息技術環境
根據《規范》,電子檔案的“電子”特性使其依賴于各類信息技術環境,比如可實現電子文件歸檔功能的業務系統、電子檔案管理系統,以及局域網、政務網和互聯網等能適應各門類電子檔案傳輸的檔案信息化基礎設施。于麗娟[13]對在當時國際上最具代表性的電子文件管理軟件功能標準——美國于2002年修訂的《電子文件管理軟件設計評價標準》(Design Criteria Standard for Electronic Records Management Software Applications)做了全面的介紹和分析;于麗娟[14]還對當時最具通用色彩的電子文件管理系統需求標準——歐盟于2001年推出的《電子文件管理通用需求》(Model Requirements for the Management of Electronic Records ,MoReq)做了全面的介紹,該需求報告是最先提倡將EDMS(Electronic Document Management System,電子文件管理系統)和ERMS(Electronic Record Management System,電子檔案管理系統)進行集成的需求報告。除了對電子檔案管理系統通用需求的關注,還有文獻[15]對電子檔案管理系統質量提升的路徑進行了研究,發現發達國家摸索出了“標準引導、政策配套”的基本路徑。諸如以上對國外電子文件和電子檔案管理系統進行介紹和分析的研究為我國電子檔案管理系統的建設帶來了很大的參考價值。在最近的研究成果中,有文獻[16]在電子文件生命周期理論、全程管理與前端控制及信息系統集成理論指導下,構建了自下而上由數據層、業務層、接口層和功能層構成的,左右兩端分別為標準規范體系和安全管理體系的業務系統與檔案管理系統歸檔集成框架。除此之外,國家檔案局分別于2017年和2020年發布《電子檔案管理系統基本功能規定》和《電子檔案管理系統通用功能要求》研究報告也在一定程度上凝聚了多年來我國電子檔案管理系統的理論和實踐成果。此外,電子檔案管理系統的安全保障問題也一直是研究的重點。有機構[17]開發出了適用于電子檔案的專用保障系統,該系統以可視化的電子檔號章的形式表現,通過數字簽名,實現了電子檔案的防偽造、防篡改和防抵賴;還有機構[18]開發出了可保障電子檔案信息安全的基于抗合謀指紋的數字檔案溯源追蹤系統。
該研究主題主要涉及電子文件及其元數據的歸檔范圍、歸檔程序、歸檔要求、歸檔時間、歸檔方式、歸檔格式,以及電子檔案的編目與著錄等內容,其中受到關注較多的是各類新型電子文件的歸檔必要性、可行性等問題。
2.2.1 新型電子文件的歸檔
根據《規范》,電子文件的歸檔范圍包括文書類,照片、錄音、錄像等聲像類,科技類,郵件類,網頁、社交媒體類,還有其他各種專業類電子文件等。其中,網頁、社交媒體類電子文件的歸檔受到了極大的關注。2008年,在我國網絡博客盛行之時,便有文獻[19]對博客歸檔的必要性做了探討,其認為包括博客在內的網絡檔案信息資源更加生動地反映了人類社會生活,是社會數字遺產與歷史記憶的特殊組成部分。隨著互聯網的日漸發達,網頁、社交媒體類電子文件的歸檔已經成了必不可擋的潮流,國內外也都有了各種相關實踐。有文獻[20]借鑒了美國InterPARES項目的主要研究成果電子檔案要素分析模板,發現政務微博信息存在電子檔案的本質性要素,并發現該模板可以為政務微博信息的規范形成與管理提供原則性理念,為我國政務微博信息的檔案化實踐提供了可能性。除了政務領域的網絡信息資源歸檔受關注已久,近幾年也開始出現對個人數字存檔行為的關注。有文獻[21]從圖書情報與檔案管理學科角度,對個人存檔研究進行了重新定位,認為個人存檔是個人信息管理、個人知識管理、文件與檔案管理和網絡信息存檔四個領域的交叉點,其研究框架應包括價值研究、對象研究、行為研究、問題與策略研究。然而在網絡的一切公開信息都可獲取的情況下,個人信息被遺忘權和集體記憶的保護產生了一定的沖突和矛盾,為了保持二者之間的平衡,有文獻[22]提出網絡信息存檔機構應采用更具適應性的個人數據保護規則,堅持“通過設計保護隱私”原則,同時提升對被遺忘權的審查能力,形成與數據主體、數據性質、數據來源有關的評估標準。
2.2.2 “單套制”與“雙套制”
該研究主題主要涉及電子檔案的存儲、備份、鑒定與遷移、移交與銷毀等內容,其中受到關注最多的便是存儲和備份的相關內容,其次是移交與接收。
2.3.1 電子檔案的存儲與備份
關于存儲載體的具體研究對象主要包括縮微膠片、光盤、磁盤、磁帶等新世紀新型載體,關于存儲模式,有文獻[24]提出要使用分級存儲管理,如“計算機硬盤—光盤庫—磁帶庫”這類的在線存儲、近線存儲和離線存儲三級模式。電子檔案的存儲方面的研究之所以這么受關注,很大程度上是因為其載體易受損等特性,因此,電子檔案的備份研究也受到同樣的關注。在最新的相關研究中,有文獻[25]提出可將區塊鏈存儲方式應用于電子檔案的管理中,從管理數據范圍的角度來看,電子檔案管理應用區塊鏈存儲方式可為僅哈希值上鏈、哈希值和部分元數據上鏈、全文和全部元數據上鏈三種類型。
2.3.2 電子檔案的移交與接收
電子檔案的移交主體是立檔單位,電子檔案的接收主體是各級檔案館。據調查[26][27],在2002年至2006年間,我國有一大批地方檔案館都開始收集電子文件進館,而到了2012年,在我國的30個省級檔案館和16個副省級檔案館中,有68%的檔案館已經接收電子文件進館,但移交規范還有待改進。針對移交規范,有文獻[28]就用EEP封裝技術設計了電子文件移交的不同實現方法,并設計了EEP封裝引擎和工具的架構。
該研究主題主要涉及電子檔案的整合與開發、服務與利用等內容。
2.4.1 為社會提供利用
為社會提供利用是所有檔案管理工作的最終目的,21世紀初,電子政務等網絡時代的新背景催生了電子檔案利用的新需求——關聯利用,有文獻將關聯數據這一有效的語義網信息組織規范應用于數字檔案資源知識組織工作中,構建了數字檔案資源知識“關聯”組織框架模型,并針對跨媒體的數字檔案資源整合,構建了可為社會提供集成服務的具體語義關聯聚合實現框架[29][30]。還有文獻[31]提出了基于面向服務的架構(SOA)的數字檔案資源整合模式,該模式能夠通過對各種異構平臺、不同格式的數據源及異構業務系統之間的數據的交換與整合,實現數字檔案信息資源的共享。
2.4.2 個性化服務
數字時代還給個性化的檔案服務帶來了更多的可能性,有文獻基于個性化的信息資產小數據構建了數字檔案資源知識集成服務系統框架,它可以為用戶提供深度化的、個性化的檔案知識服務[32]。近兩年,知識圖譜成了語義網技術在檔案領域中應用的新寵,電子文件知識圖譜能夠為電子檔案用戶提供面向業務活動的知識服務,它是電子文件/檔案數據化的一種方式,有文獻[33]具體描述了電子文件知識圖譜化的轉變過程,即包括知識建模、知識抽取、知識存儲和知識服務四個主要節點。除了以上單一視角或動因的研究,還有文獻[34]從綜合集成研究視角出發,討論了數字檔案資源整合與服務在新思維、新方式、新資源、新基礎設施、新能力和新權力六個維度面臨的機遇、挑戰及未來發展構想。
本文另將綜合性較強無法歸入以上四大研究主題的文獻另分為“其他類”,該類文獻主要探討貫穿電子文件和電子檔案全程管理活動的相關理論和實踐發展,其中較有代表性的研究內容為文檔一體化相關的內容:由于電子文件和電子檔案之間是“前身”和“后世”的關系,因此,自電子檔案出現以來,一直都有不少關于“前端控制”、“文檔一體化”或“全程管理”的思考,該類探討來源于澳大利亞的文件連續體理論。21世紀初,便有文獻[35]提出基于文件連續體理論,通過一體化方法、一體化組織和一體化控制構建電子文件的最優化管理框架,該框架重在跨學科、跨機構的合作。經過十幾年的沉淀與發展,有文獻[36]針對文檔一體化管理的內涵進行了較為具體的闡述——其管理理念包括全程控制與管理、技術保障與依托、頂層設計與規劃;其管理手段包括管理流程的一體化、標準功能一體化和政策模式一體化;其管理目標是簡化流程、提高效率,是保證文檔真實、可用,也是促進資源集成、提升利用效益。
根據前文的研究發現,相關的研究內容越來越廣泛和豐富,“電子檔案管理的信息技術環境”這一主題中的文獻較多關注文件和檔案管理系統功能設計方面的問題,而對檔案信息化基礎設施相關問題鮮少涉及;在“電子文件的歸檔管理”主題下,受到關注較多的是網絡信息資源這一類新型電子文件的歸檔必要性、可行性等問題以及單、雙套制歸檔問題,電子檔案的編目與著錄問題鮮少受到關注;在“電子檔案的管理與處置”主題下,受到關注最多的是電子檔案的存儲和備份問題,較少文獻涉及電子檔案的鑒定與銷毀問題;在“電子檔案的利用”主題下,關聯利用的研究具有較為持久的熱度。
從縱向的時間階段上來看,我國電子檔案的早期研究主要是從大文件觀的視角對電子文件的管理系統、歸檔管理等相關問題進行探討,而后期隨著“電子檔案”與“電子文件”相關概念在檔案工作中逐漸明確,特別是《術語》確立了電子檔案在我國檔案工作中的重要地位之后,直接以“電子檔案”為研究對象的文獻逐漸增多。而近五年來,區塊鏈[37]、知識圖譜[38]等新興技術在電子檔案中的應用以及資源的社會化開發[39]、交互推送服務[40]等新型開發利用模式成為研究的新熱點,這表明了學科交叉與融合的程度逐漸加深。
另外,在上述研究過程中,本文還發現其中面向實施的實踐研究主要為對國外電子檔案管理實踐的介紹和分析,對國內實踐的研究還有待拓展。需要指出的是,由于本文的樣本量較窄,研究文獻僅限于少數期刊,必然有一定的局限性,在研究路線上還有待改進,比如可考慮將樣本量擴大到所有核心期刊,并結合文獻定量分析方法,對電子檔案的研究主題進行更全面的分析,期待有更多學者來進行完善,描繪出更全面的我國電子檔案研究圖景。