錢 毅
檔案數據庫是以檔案的本體管理為基礎,兼顧數據庫設計和應用發展的需要,將包括檔案實體信息、管理信息、應用環境信息在內的各種類型數據按照特定數據模型進行組織的數據集合。在長期實踐中,數據庫以其獨特的優點已經證明它是信息資源組織、管理、共享的最佳方法,在數據冗余度、管理效率、數據完整性控制等方面都有良好的表現。事實上,檔案數據庫是各類檔案信息系統正常運行的核心組件,是檔案信息化不可或缺的基礎工作之一。
在建設結構合理、格式規范、便于共享的檔案數據庫的過程中,僅僅依靠數據庫理論是不能勝任的,數據庫管理系統(DBMS)本質上就是管理所用的工具和平臺,其數據結構、類型、內容范圍等關鍵要素都必須依靠檔案基本管理理論提供的營養來進行保障,也是我們平常所說的業務支撐。
一、檔案分類理論對檔案數據庫的建設起著導向作用
從管理學上講,任何管理活動,拋開其最終目的,其最基本的目的或者基本要求都是要使被管理對象有序化,檔案管理的基本目的就是要使檔案有序化,包括檔案實體管理和信息管理的有序化。將數量龐大、內容形式復雜多樣的檔案有序化的具體方法很多,但最基本的方法就是分類,即“對檔案總體進行分割、劃分,將其分為若干層次、大小不同的部分或門類、種類、類別,然后對這些不同的部分、門類、類別等實施分別管理。”“這實質上也是人類社會所有管理活動乃至認識活動的基本方法。”正因為如此,“說得籠統一點,檔案管理理論上的所有能稱得上‘重大的分歧和爭論,大都圍繞著分類方法展開。”①
由是,筆者將檔案分類作為影響檔案數據庫建設的基礎理論,該理論直接影響著檔案數據庫建設的方向。在檔案理論界中邏輯主義和歷史主義的分類思路得到普遍認可。邏輯主義的分類思路是根據檔案的一般特征作為分類標準和依據,根據嚴格的形式邏輯進行劃分的分類思想,比如按照保管期限、密級等進行劃分。歷史主義的分類思路是按照事物的現實存在狀態與界線對事物進行區分的,強調根據事物的現狀進行把握,盡可能接近事物的真實狀態,是一種客觀主義的分類思路。歷史主義方法在檔案實體管理領域的具體體現就是全宗原則,在分類時首先按照檔案所屬的全宗進行歸類。邏輯主義分類思想有助于從某一具體特征進行劃分,便于對檔案進行多角度的靈活定位;歷史主義則強調了檔案來源屬性這個根本特征,有助于完整理解檔案內容,這也是檔案數據庫區別于其他文獻數據庫的關鍵要素。事實上,在檔案管理的過程中這兩種分類思想都是需要的,彼此是不可取代的。
一般來說,對檔案的實體管理基本采用了歷史主義的分類方法,大體都按全宗進行排架整理;而檔案內容信息的管理則可以同時采用兩種方法,一般以邏輯主義分類方法為主。在檔案數據庫建設中,一般是在來源單位層次上建立實體數據庫,實際上是將一個全宗(一般是檔案室層次)或全宗群(一般是檔案館層次)作為建庫范圍,同時利用視圖、索引等數據庫對象對內容實施邏輯管理,使檔案管理理論中的“二元主義”得以在數據庫建設中融合。
二、全宗原則及其理論發展對檔案數據庫建設發揮指導作用
檔案管理基本理論認為檔案的實體管理必須維護和尊重檔案的本質特性,必須采用歷史主義的方法,遵守全宗原則,這一思路對于檔案數據庫的建設具有重要的指導作用。
首先,全宗原則是檔案實體分類的基本方法,是人們經過理論分析和實證研究之后得出的寶貴經驗。以全宗為基本單位建設檔案數據庫,數據庫內容反映的是一個現實的實體單位的歷史記錄,保證了檔案數據具有一個堅實可靠的立足點,這是單純地依靠邏輯分類方法所達不到的。
其次,采用全宗原則指導建設檔案數據庫,能夠最大限度地維護檔案的原始記錄性。因為全宗作為一個獨立組織或個人形成檔案的全部,是一個不可分散、不可打亂混淆的有機整體,這樣能夠最大限度地維護和保持檔案的本質特性——原始記錄性,這也是檔案信息在管理組織上獨樹一幟、不同于圖書、資料、情報等文獻的根本原因。檔案數據庫作為檔案信息管理的重要工具和手段,必須服從這一更高的管理目的。良好的數據庫設計可以將全宗原則的諸多思想在檔案數據庫建設中實現,包括全宗內部管理層次、管理聯系等。像文書立卷工作中要求的“保持文件之間的歷史聯系”、科技檔案管理中的“成套性原則”等思想都可以通過數據庫的設計得以體現。
第三,依據全宗理論進行檔案數據庫建設,有利于數據庫的建設與維護工作。按照這種思路進行檔案數據庫建設在多數情況下能夠保證數據庫的建設者、管理者、擁有者、維護者是統一的,數據庫建設各方的利益是一致的,有助于保證檔案數據庫建設的動力、資金以及作用的發揮。
值得注意的是,雖然全宗原則是檔案管理的基本原則和方法,但它并不能解決檔案管理的所有問題。由于社會實踐的不斷發展,全宗原則面臨不少新的挑戰,也因此得到新的發展,這些發展對檔案數據庫的建設同樣產生了具體的影響。
1、全宗內部檔案的差異化管理需求要求建立相對獨立的檔案數據庫。
雖然全宗原則強調一個來源單位的檔案應當集中保管,但也沒有忽視對同一來源檔案之間的差異化管理。隨著社會實踐的發展,同一全宗內檔案的種類、載體類型及其管理要求日益多樣化、復雜化、專門化,這使得對全宗的集中統一保管難以實施。在檔案實體管理范疇,同一全宗內就有可能出現紙張、照片、錄音帶、錄像帶、磁盤、光盤、縮微膠片等多種載體,其中相當一部分特殊載體的檔案在保管利用上都有特殊要求,因此往往需要將其組織為一個單獨的管理體系,設置專門機構,提供專門的庫房和設備,雖然可以在編號系統中設置它們與全宗的關系,但在實體管理層面上已經不具有嚴格的不可分散性。在檔案信息管理范疇,由于不同門類檔案的管理差異,同一全宗內不同類別的檔案也多采取分別管理的措施,比較典型的像人事檔案、會計檔案等由于具有不同于其他檔案的管理要求,采取由人事部門、財務部門單獨保管的管理方式。
與此相對應,基于全宗的檔案數據庫在建設時都會考慮到這些差異的存在,通過建立多媒體檔案數據庫來存儲管理照片、錄音、錄像等專門載體檔案,通過建立人事檔案數據庫、會計檔案數據庫對這些業務性較強的檔案實施專門化管理。
2、自由來源原則為專門檔案的數據庫建設提供理論基礎。
自由來源原則認為全宗不僅是歷史性、客觀性的,也可以是邏輯性的,這是對全宗理論的重大發展。像許多行業性、專業性很強的檔案就要求打破傳統全宗范圍的限制,而按照行業或專業系統進行集中統一管理。比如城建檔案、項目檔案雖然破壞了各項目參與組織全宗的完整性,但卻有效地維護了項目檔案的完整性。在多數情況下保證后者的完整性具有更為重要的現實意義。這里的工程項目就是一個邏輯意義上的全宗單位,由此可見,全宗理論在其本身的發展過程中存在分合的演化過程,并不完全拘泥于狹義的全宗概念。
自由來源原則等理論為城建檔案數據庫、項目檔案數據庫等專門檔案數據庫的出現提供了理論基礎。它們以邏輯全宗為單位進行創建,符合其管理要求。
三、邏輯主義分類思路適合檔案數據庫的內容管理
歷史上最著名的邏輯主義分類方法應該就是法國國家檔案館館長卡繆和多努堅持的事由原則,該原則在法國大革命前就應用于各國的國家檔案機構,但這些國家檔案機構所保管的大都是來源單一的檔案,所以事由原則尚能發揮作用。但面對改革后法國國家檔案館中來源、內容、形式、種類、數量各不相同的檔案,這種分類方法就顯得捉襟見肘了。這兩任館長使用統一的事由原則對全部館藏進行統一分類,即使他們根據檔案復雜性的增加將事由大類由4類拓展到24類,也不能將所有檔案都劃分清楚。很明顯,在綜合性檔案館內按照統一事由原則對檔案實體進行分類是典型的“刻舟求劍”的行為。但這并不能說明邏輯分類方法不能用于實體分類,而是它更多地適用于檔案的內容分類。
邏輯分類法在檔案數據庫的內容管理中有著非常普遍的應用。我們知道,檔案的實體整理必須按照其形成時的本來面貌去管理,但檔案內容信息是極為豐富多彩的,人們對這些內容的需求也是多樣化的,但和現實世界中檔案實體的排序只能有一種一樣,在數據庫中我們一般通過有限的基本表來反映檔案實體的記錄信息。我們絕沒有必要根據用戶的每一個需求重建數據庫,在表達邏輯需求方面,數據庫擁有強大的管理手段,我們可以依據我們感興趣的特征(或特征組合)通過索引、視圖、查詢等數據庫對象很方便地對檔案數據庫進行邏輯重組,好像魔方一樣,可以變換出我們需要展現的內容。比如視圖在數據庫理論中有個綽號叫“虛表”,就形象地表達了視圖具有的邏輯力量,它可以將用戶關心的屬性從若干個基本表中抽取出來進行組合,滿足用戶的查詢和使用要求。而且在計算機環境中,由于軟硬件屏蔽了許多對用戶無關的內容,使得用戶可以像操縱基本表一樣操縱視圖,就好像檔案實體真的是按照我們指定的特征進行分類一樣。
四、電子文件管理理論為檔案數據庫的未來發展提供營養
電子文件管理已經成為目前檔案信息化進程中不可回避的課題。電子文件是信息化環境中業務過程和業務成果的真實記錄,因此保證電子文件的真實、完整、可用具有非常重要的意義。電子文件生命周期理論認為,電子文件從形成到銷毀或保管是一個完整的運動過程,對電子文件生命全程的管理和監控措施應當前置到電子文件管理系統的設計之中,包括對其運動全程的狀態記錄。檔案數據庫在電子文件管理環境中如何發揮作用,需要電子文件管理理論提供支持。
與傳統檔案進行事后管理不同,現代文件檔案管理倡導的前端控制原則要求將整個文件管理過程的目標、要求、規則等進行系統分析,將需要在文件形成階段實現的功能盡可能進行整合。這就要求對文件數據結構的設計要考慮到整個文件管理活動的需要,實時收集需要進行前期控制的數據元素,為確保電子文件的真實可靠、完整安全、長期可讀提供保障。換言之,檔案數據庫不能像傳統方式那樣,在檔案文件接收完畢、文件的真實性有案可查的情況下開始數據建設,而是要在第一時間規劃完畢,伴隨文件生命周期進行動態跟蹤,將各個環節需要記錄的數據各就其位,構成一個完整的數據鏈條,為該文件的描述、利用、驗證、保存等提供信息。美國當代著名的電子文件管理專家戴維·比爾曼指出“必須根據文件保管系統的功能需求、文件種類以及業務活動的證據性需求,提前界定著錄信息。在電子文件環境中,對元數據予以明確規定,有助于設計和實施在文件生成之際自動截獲元數據的系統,確保文件在轉載、傳輸過程中相伴產生的元數據的完整。”②
緊接著的問題在于如何確定用于描述的元素,元數據理論為此提供了解決方案。元數據就是數據的數據,用于描述數據的內容(what)、覆蓋范圍(where, when)、質量、管理方式、數據的所有者(who)、數據的提供方式(how)等信息,是數據與數據用戶之間的橋梁。元數據通過描述信息資源的屬性,用于識別、評價、追蹤資源,從而實現對信息資源一體化的組織和有效管理。根據對電子資源管理的需要,元數據可以分為描述型、管理型、技術型和使用型、保存型。事實上,電子文件是多種不同類型信息的一個集合概念,對于不同類型的信息形式,其描述、管理、保存方式都具有不同的屬性集。元數據最基本的功能是通過數據元素集定義資源對象的各類屬性,這些屬性的大量實例可以表達為關系型數據庫中的表,或者以XML等形式進行置標,從而能夠利用數據庫系統或各類應用軟件進行管理。可見,以元數據為中間對象,可以利用數據庫實現電子文件的有效管理。
注釋:
①張輯哲:《維系之道——檔案與檔案管理》,北京:中國檔案出版社,1995年。
②戴維·比爾曼著,王健等譯:《電子證據——當代機構文件管理戰略》,北京:中國人民大學出版社,1999年。
作者單位:中國人民大學信息資源管理學院