■ 楊健生 李孔燕
民國檔案文件級目錄制作方法研究
■ 楊健生 李孔燕
民國檔案文件級目錄制作是當前國家重點檔案保護與開發的重要基礎工作。當前,民國檔案目錄建設總體上仍處于手工管理思維延續期及計算機輔助管理檔案實體的階段。隨著計算機檔案管理技術的興起,檔案管理的效率得到了提升,目錄信息的著錄更加全面,查詢更加便捷。在信息化發展和大數據廣泛應用的背景下,檔案工作者應秉承多角度、多方位充分利用的導向,對民國檔案文件級目錄進行體系化的重新架構,規范相關著錄項目,以更好地滿足檔案管理、保護和開發的需求。
在實際操作中,省檔案館通過在外包公司的運用實踐中發現,依托計算機輔助提取目錄,可以更加快速、規范、準確題名,也重點解決了公司新招錄青年人員快速學習入門的問題,現在每人每日平均200條以上,并且錯誤率低,檢索有效性得到了提高。經實踐研究發現,對民國檔案文件級目錄制作方法探析主要有以下幾點:
因為我們制作的目錄是給現代人使用,所以需要使用現代公文語言對其進行規范。現代公文語言的題名基本結構為:“責任者+關于(或虛詞“就”)+事由+的(介詞)+文種”。在這一題名結構中,獨立的統計表、登記簿等沒有文種的文件材料無需著錄文種信息。題名是對檔案內容的歸納概括,但并不是憑空想象出來的,擬寫題名包括兩個過程,一是內容信息采集過程,即閱讀檔案,從中采集反映檔案材料內容信息;二是將采集到的信息組成一句通順、規范的語言,即擬寫題名。對題名結構的規范主要從三方面展開:
題名擬寫的難處在于其中的“事由”采集和表述,因人而異的語言表述習慣使得“事由”的規范看似不可能。通過研究,我們發現“事由”規范化擬寫的難度其實是人為的,是人為設定的“體現時代特征”的規定使之變得困難。用現代公文語言去表述“事由”,語言平實、表述準確、語句結構規范。這種平實的“說明文”用語,為我們規范“事由”的表述提供了基本條件,而且民國檔案文件級目錄是敘述過去的事情,講清楚檔案主要內容是唯一目的,不需要表達“情緒”及藝術修飾。因此民國檔案文件級目錄“題名”中的“事由”,可以僅僅是平鋪直敘的敘事文字和詞匯,其語法結構單一,具有規范化表述的語言基礎。
規范表述“事由”,首先要明確“事由”的信息組成。“事由”歸根到底就是對一份檔案中包含的歷史事件或者歷史行為進行歸納和說明。民國檔案目錄中的“事由”即對民國歷史上發生的“事情”說明,而每一件“事情”的信息,一定是由時間、地點、機構、人物、事項名稱或事件主題等要素等構成,具體到每一份檔案材料,它所包含的信息內容也不會超出以上內容。因此,規范“事由”表述,就是圍繞這幾個“事由”組成元素進行信息采集,并將采集的信息組織成通順語言予以表述的工作。在開展這項工作時,只要遵循有這些元素信息的則采集,沒有的不創造,就能實現準確、完整歸納檔案內容的目的。
“事由”的信息能否用規范的文字表述,是決定信息傳達是否精確的關鍵。對于歷史事件或事物,有了“天、地、人”這三個元素才具備了前提和主題,通過這三個元素的相互作用最終才產生了“事”。“事”是指一組關系、一個行為、一個過程或一個具體的物,可以歸納、概括為一個特定的事件主題或事項名稱。目錄是檔案材料的“內容提要”或信息“線索”,并不是研究歷史的報告或敘述歷史的詳細內容或摘要,因而在描述“事”時,不用講述事情的前因后果,細枝末節,僅需將其主題內容或名稱闡述清楚即可。因此,我們認為在使用現代公文語言的情況下,對于民國檔案文件級目錄“題名”中的“事由”,能夠用結構化的方式組織信息并進行規范表述,即將各組成元素按照:時間→地名→人物(包含機構、職銜信息)→事件主題或事項名稱的通用邏輯順序組織描述語言,這樣的語言合乎漢語描述事物的一般表述方法,能夠表達清楚事情。其中時間、地名、機構、人物是指與事項直接相關的特定對象,應視檔案情況采集,如果檔案中有這些內容則采集,如無則不需刻意拼湊。同時,由于檔案材料事無巨細,為提高目錄制作工作效率,避免累贅和語句重復,凡是在責任者著錄項目中已經有的地名、機構、人名的內容,及與文件時間著錄項目相同的時間等,無需在“事由”中重復敘述。
經過規范后,一個完整民國檔案文件級目錄“題名”可用現代語言,按以下結構組織:責任者+關于+事由(按時間→地名→機構、職銜、姓名→事件主題或事項名稱,排序組成)+的+文種。使用這個結構表達題名,看起來比過去要求的項目更多,內容更復雜,似乎加大了目錄制作難度。確實,如果純粹手工制作是比較復雜,著錄人員很難將信息采集齊全,并迅速組織成一個題名。但如果放到整個民國檔案基礎目錄體系中,并且在使用計算機著錄的條件下看,情況就大不一樣,在計算機輔助著錄條件下,不需要著錄人員記憶采集到信息,其組織題名語句花費的精力和時間也將大大減少,擬寫題名反而比手工著錄簡單。
題名中的大部分元素在目錄制作時,已進行了采集和著錄,且題名是按照固定結構進行表述的,所以完全可以使用計算機的自動化性能,將已有的各個項目自動組織起來,自動形成一個“參考題名”,著錄人員只需對照檢查這個“參考題名”,對其中表達不夠順暢的語言進行局部修改,很多情況下甚至不用修改,就能形成符合規范結構、內容完整準確、表達通暢的“題名”。使用計算機輔助著錄方法,采集各個項目著錄信息的過程,就是題名的擬寫過程。完成各項目的信息采集,就自動完成“參考題名”擬寫,而有一個可視化的“參考題名”,對于提高題名擬寫質量和效率有極大的幫助。
制作民國檔案文件級目錄的第二個困難是快速、準確地從檔案中采集到著錄信息。只有對民國檔案進行歸類,才能提高著錄信息采集的效率。民國檔案文件級基礎目錄分為保管類著錄項目、基礎利用類著錄項目,實現著錄項目“模塊化”,在一定的技術條件下,甚至有可能按“流水線”方式,組織一個團隊分工配合進行信息采集,提高工作效率。
在制作目錄時,根據著錄項目的信息需求,按照民國文書的結構,到相應的位置快速查找和提取著錄元素信息,逐個錄入到計算機,經計算機輔助工作,形成完整的著錄信息。因此,搞清楚民國公文結構,對于民國檔案文件級基礎目錄著錄至關重要。
保管類著錄項目主要有:檔案館代碼、檔案館名稱、檔案編號(電子文件名)、頁數(電子畫幅數)、語種、政權標識、載體形態、破損狀況、破損數量、附注等項目。這些項目的著錄信息有一個共同特點,即都與檔案內容無關,屬于檔案的外在屬性,在著錄時一般不需要進行比較復雜的分析加工。
基礎利用類著錄項目主要有:題名(也屬于保管類著錄項目,為表述方便放置到此)、責任者(發文者)、受文者、文種、文件日期、事件時間(著錄事件所針對的時間,如與文件日期相同,則無需在此著錄)、事件地名(檔案事項內容所針對的地點,由省、縣兩個項目組成,錄入檔案形成時的歷史地名)、機構(檔案內容直接涉及機構,不含發文者和受文者,錄入機構全稱)、人物(由職銜、姓名組成,不含發文者和受文者)、控制使用等項目。主要的采集方法有:
(1)文種著錄項目信息采集方法
民國公文的文種在不同的年代有一些變化,而且由于民國公文規范性不足,文種名稱較多,有的符合規范,有的是書寫者的習慣,有的沿用清代的文種,由于制作民國檔案文件級基礎目錄不是研究民國公文,而且文種本身并不直接具有“檢索、利用”價值(需與題名等項目配合查看才具有使用價值,是屬于利用者的工作),因此,在著錄文種信息時,不用進行所謂規范,既增加著錄工作的復雜性,也無益于提高目錄的使用價值,在采集著錄信息時,只需照錄原文書寫的文種即可。
(2)責任者(發文者)、受文者著錄項目信息采集方法
責任者(發文者)、受文者是民國檔案文件級基礎目錄中兩個很重要的著錄項目,是反映檔案內容和歷史事件關系的重要信息。這兩個著錄項目的信息在民國正式公文中,一般都在文頭、落款及正文末尾位置,但在不同類型公文中的具體位置略有不同,根據公文類型在固定的位置查找,一般都能方便找到著錄信息。需要強調的是,這兩個項目信息應該著錄其全稱。
(3)文件日期著錄項目信息采集方法
文件日期即民國檔案文件材料的形成日期或“文件日期”。民國文件材料的“文件日期”一般在文件“落款”處,規范的民國公文要求,在落款蓋發文機構的印章(官印、關防)時,必須“騎年蓋月”,因此,一般來說,其“文件日期”就是發文機構落款印章下書寫的文件日期。
(4)“事由”構成元素信息采集的一般方法
題名由:“責任者”關于“事由”的“文種”的結構組成,“事由”的實質就是對一份民國檔案主題內容的歸納,是民國檔案文件級基礎利用類目錄的關鍵信息,直接影響檔案查找利用的效率,是目錄的主要信息內容。關于怎樣歸納和敘述“事由”,在前面的研究中我們已經找到“分別著錄事由組成元素,依托計算機自動生成參考題名,并修改為正式題名”的解決方法。具體來講,就是要按照文件結構,按其信息元素分布規律,快速采集檔案內容中記錄的、與所述主題事項相關的、不寫明不足以區別與其他同一主題事項的時間、地名、機構、人名以及事件主題或事項名稱等信息。
通過對民國檔案文件級目錄制作方法的全面探索研究,提出了全新的民國檔案文件級目錄架構,根據國家標準規范題名結構,使用人工結合計算機輔助擬寫題名,實現目錄制作與數據庫建設一體化的工作方法,將民國檔案文件級目錄規范化提高到一個新的水平。將過去的民國檔案文件級目錄制作中“歸納擬寫”題名的方法,深化為“準確提出內容構成元素信息”,然后按照“通用表述結構”組織所采集信息,最后略加修飾表述語言的方法,從而實現民國檔案文件級目錄表述的規范化,確保信息的完整性和準確性,并便于現代人閱讀理解。
云南省檔案局