文 / 張愛曾
檔案整理有多種方式,廣義上指的是考證、鑒定、編撰檔案,狹義上指的是檔案分類、編制目錄、排列案卷等[1]。檔案整理是為了更方便利用和保管檔案信息。從實踐角度看,檔案整理包括文本整理和數據整理兩大類。隨著現代信息技術的發展,各級檔案館數字化建設進程加快,檔案整理已不再局限于文本,基于互聯網的數據整理變得越來越重要。
檔案文本不但包含了傳統類型的紙質文件,同時也包含了一些簡單的電子文件。文本整理是將文件轉化成檔案的必備條件之一,無論哪一種類型的文件,都需要通過詳細的整理才能更好地反映出歷史信息[2]。沒有經過整理的只能叫做“原始檔案”,經過整理的才是“系統檔案”。“原始檔案”和“系統檔案”的區別在于:“原始檔案”僅要求有一定量的檔案信息,“系統檔案”則除了信息之外,還要求各類信息之間根據預定的順序進行排列,以發揮出檔案的整體功能。“原始檔案”僅強調信息元素的集合,“系統檔案”則進一步強調信息之間的關系結構。通常來說,只有經過整理的具備內部關系結構的檔案,才能更好地反映出各文本信息的歷史關聯,具備歷史記錄功能及歷史再現功能。
檔案文本整理的發展源遠流長,至今已經形成比較成熟的原則和方法。早在十六世紀,歐洲檔案界就將“事由原則”作為檔案文本整理的基本原則,用于登記整理各皇室檔案。十八世紀初,“尊重全宗原則”在法國誕生,被檔案界廣泛采用。二十世紀中葉,荷蘭人論證了檔案文本整理的“來源原則”,由此確定了該原則在檔案文本整理中的地位。1908年,德國著名檔案學家布倫內克構建了“自由來源原則”,進一步修正了原來的檔案文本整理基本原則,按照一定比例分配檔案信息來源和事由[3]。我國近現代以來比較流行的是“尊重全宗原則”。何嘉蓀教授提出了“客觀全宗”概念,對我國檔案文本整理的影響較大。從檔案文本整理的歷史淵源看,保持文本歷史關聯是檔案界永恒的追求。
檔案文本的歷史關聯也叫做檔案內在關聯,主要是指文本產生以及處理中構建起的內部聯系,一般體現在檔案文本的來源、保存的時間、信息內容及表現形式等方面,其中檔案文本來源的關聯最為重要[4]。但是檔案文本來源關聯與歷史關聯并非是等同的,而只是歷史關聯的展現形式之一。當前的檔案文本整理有不少只是強調文本來源關聯,用這種來源方式掩飾更本質與宏觀的歷史關聯,存在一定的偏頗。所以檔案文本整理要有較高的歷史性原則,而不是只堅持本文來源原則。文本歷史關聯可以在檔案整理的多個層次得到應用,如全宗劃分層次、檔案分類層次、立卷層次等。此外,保存時間的關聯、信息內容的關聯、表現形式的關聯等,也可以作為檔案歷史劃分的依據,使檔案文本的歷史關聯更加豐富。
檔案數據是一種數字化的信息形式,可以在數據庫中得到永久保存。相對于檔案文本來說,數據形式有了計算機和互聯網的支持,賦予了檔案整理新的功能及意義。檔案數據主要反映出以下三種信息。首先是檔案內容,這是檔案的本質所在,同時也是檔案信息最大的主體,可以充分體現出歷史原貌。其次是檔案形式,即檔案信息格式、代碼標準、排列規則等。再次是數據載體,即數據通過怎樣的平臺進行整理和傳輸。由此可見,檔案數據的整理方式,主要圍繞內容、形式、載體進行,將內容進行數字化處理,形成適合網絡儲存和傳播的格式,而載體也多種多樣,包括數據庫、網絡平臺、各種新媒體等。檔案數據整理在文本整理的基礎上有了大幅飛躍,在理論意義上可以達到永久保存,儲存空間也更大,在信息分析、傳輸、修正等方面具備更多優勢。
通過檔案數據整理,形成了豐富的數據檢索目錄,如全文索引、題目索引、案卷索引等,或者根據文號、類型、地名、人名等進行檢索,構建一個全面性的搜索網絡,使檔案數據在整理之后能夠提供強大的服務功能。而隨著互聯網及信息技術的發展,檔案數據整理更方便地對每一份檔案所包含的信息進行詳細描述,有效錄入單份檔案的全部特征,并通過網絡平臺任意組合這些特征,在多途徑的條件下實現全方位檢索。檔案數據整理既反映了各檔案信息的歷史關聯,又反映了信息之間的邏輯聯系。從這方面看,檔案數據整理在很大程度上超越了文本整理,但又離不開文本整理的特質。首先,文本整理作為原始檔案最初的整理形式,在檔案管理過程中不可或缺,數據整理需要文本整理的支撐,才能發揮出更大的作用。其次,數據整理是文本整理的“加強版”,甚至在某些情況下可以脫離文本整理,在互聯網上采集更多的信息,但許多珍貴的權威的檔案,還是需要文本進行提供。
檔案數據整理需要一定的載體才能順利實現。從當前的情況看,檔案數據整理的載體形式主要有數據庫、信息采集軟件、文本掃描系統、智能檢索系統及各類新媒體等[5]。其中數據庫建設是檔案數據整理的核心環節,只有具備合適的數據庫,才能使檔案數據整理有實踐意義。目前比較流行的數據庫有SQL server、Oracle、Aceess、MySQL等,具體采用哪種數據庫要視數據系統的實際情況而定。信息采集軟件則是用于捕捉網絡相關信息,不斷豐富檔案資源庫內容。文本掃描系統用于檔案文本的掃描著錄,對原始文本進行數字化處理。智能檢索系統是提供檔案服務的重要方式,用戶可以通過各類型的檢索享受到檔案數據整理所帶來的便利性。此外,隨著網絡新媒體的快速普及,越來越多的檔案館開始通過新媒體平臺傳播信息,如通過官方微博、微信公共號等,為廣大用戶提供檔案服務入口,增進檔案館與用戶之間的聯系,使數據系統有更多的平臺對公眾開放服務。
檔案是為社會服務的,這是一個不爭的事實。社會的發展離不開人類的各種社會活動,這些實踐活動涵蓋了社會的方方面面,甚至具體到每一個事件,都會生成一定的檔案信息。與此相對應的是,所有檔案信息都有一個屬于自己的具體事件。而當社會實踐活動完成之后,事件就會成為一段歷史。無論是檔案文本整理還是數據整理,都存在著歷史關聯性,這也說明兩種整理都是為了實現檔案的社會性。歷史和檔案也是相對應的,檔案有著較強的歷史價值,即便時過境遷,原來的社會活動場景已無法再現,但檔案記錄了當時的痕跡,提供給后人查閱的機會。傳統檔案整理主要是文本整理模式,相對來說在全面性和保存性方面有所欠缺,但檔案文本是最原始、最真實的信息,同時也是檔案數據的母體,絕大多數的檔案數據都是通過檔案文本數字化轉變而來的。所以,充分發揮檔案數據整理的優勢,填補文本整理中的空缺,有利于找到檔案和歷史的一一對應之處,最終揭開歷史真實的“面紗”。
檔案與社會活動關聯密切,兩者的主客體關系也是動態的。在社會實踐活動發展的過程中,逐漸形成有價值的檔案。在這種情況下,社會活動是主體,檔案是客體。當社會活動結束以后,逐漸成為一段歷史,只在檔案中留下記錄痕跡,這時檔案就變為主體了。檔案文本整理主要是為了分類原始檔案,對已經發生的社會活動進行重構。任何歷史片段都是由社會活動碎片組成的。檔案工作者在厘清檔案與社會活動的關系之后,需要對這些碎片進行必要的整理,確保檔案信息的真實性,能夠對社會負責、對歷史負責[6]。而檔案數據整理則是基于文本整理發展起來的,在幫助文本整理重構社會活動方面,數據整理可以起到很好的輔助作用。首先,數據的便捷性擴大了社會活動的重構范圍,有助于檔案文本滿足多樣性的社會活動利用需求。其次,在社會活動重構的過程中,檔案文本提供了詳細的依據,重要文本內容可以進行數字化處理,形成長久的保存方案,將一些社會活動資料納入到數據整理中,從而形成文本和數據的雙重保護。
文本整理是一項傳統的檔案整理方式,需要大量的人工處理,工作效率較低。而數據處理借助計算機和互聯網,形成了自動化的處理模式,極大地解放了人力。在數字化時代,檔案信息可以在不同的載體上面自由轉換,提升了檔案整理效率。但這只是一種整理模式上的進步,文本整理依然不可或缺,兩者是一個有機的整體。許多卷宗還是需要經過文本的初步整理,才能提供更多的數據來源。從形式上看,文本整理是一種有形的整理,而數據整理超越了紙質資料,將有形化為無形,可以在網絡平臺上實現深度檢索[7]。對于文本整理來說,文件排列與著錄是隔離的,需要單獨進行,而數據整理則有效合并了這兩個環節,這樣可以解決文件不能及時著錄的問題,更真實地對歷史情況進行反映。無論是檔案文本還是檔案數據,具備更多聯系的“文件集合”遠比單一文件的價值高,這就需要兩種處理方式相互補充,發掘出一定數量的“文件集合”功能,全面提升文本整理的覆蓋范圍,并使數據整理具備豐富的資源潛力。
信息裂變是數據的一大關鍵功能,在數據整理中,信息裂變可以大大拓展檔案文本的范圍。例如數據整理捕捉到一條原始的文本信息,就會比對數據庫中是否存在關聯信息,這樣就會發現第二條、第三條甚至更多的相關信息,而且后面的信息也可能存在關聯度,這樣就產生了信息裂變現象,使得一條檔案信息能夠帶出一系列的關聯信息。數據整理根據檔案文件之間的邏輯聯系,構建起一個龐大的數據檢索系統,有利于信息裂變的快速實現。這種現象在生活中有著極大的應用價值,例如歷史學家在翻閱歷朝歷代文本檔案的同時,可以通過數據系統的搜索,全面掌握與主題相關的各種信息,便于自身的專題研究;地質學家在分析地震災害的過程中,除了翻閱氣象檔案之外,還可以借助信息裂變的方式,深入數據系統查找相關信息,這有利于地震災害原因的準確發現,根據一定規律現象為地震預防提供決策依據。由此可見,無論是文本整理還是數據整理,都能在信息裂變的基礎上擴大檢索范圍,在提高檔案文本利用價值的同時,也使數據系統發揮出更大的效用。
參考文獻:
[1]呂永明.檔案整理和數字化加工服務外包的實踐與思考[J].檔案與建設,2016(8):69-71.
[2]劉麗平.歸檔文件按“件”還是按“卷”整理問題研究[J].北京檔案,2017(4):21-24.
[3]鄭慧玲.檔案的物質結構與檔案整理[J].山西檔案,2014(2):48-50.
[4]王協舟,尹偉灃.《歸檔文件整理規則》解讀——基于新舊規則兩個標準的文本分析[J].檔案學通訊,2017(4):75-79.
[5]朱琪.民國檔案數字化前原數據整理編目[J].中國檔案,2015(2):50-51.
[6]郭鵬.北京大學對清代內閣大庫檔案的整理及其啟示[J].山西檔案,2016(6):15-17.
[7]王勤.規范檔案整理 促進檔案移交——解讀《中央檔案館文件級檔案接收質量檢查辦法》[J].中國檔案,2016(12):29.