宋玉濤 張先俊
(河南省電力勘測設計院,河南 鄭州 450007)
數(shù)字檔案館是檔案行業(yè)的新興事物,是國家檔案事業(yè)信息化建設的重要歷史發(fā)展階段。中國電力規(guī)劃設計協(xié)會《電力勘測設計行業(yè)檔案工作發(fā)展三年(2006~2008)規(guī)劃》要求:加大檔案信息化建設投入,實現(xiàn)檔案管理方法和管理內(nèi)容上的轉(zhuǎn)變,在電子檔案管理軟件應用技術上取得進展,使電子檔案管理在轉(zhuǎn)換為勘測設計能力上有明顯體現(xiàn);盡可能建立本單位的數(shù)字化檔案館。
近年來國家在深圳、青島兩個檔案館試點建設數(shù)字檔案館,并將成功經(jīng)驗向各行業(yè)各地方推廣。那么什么是數(shù)字檔案館?在總結(jié)成功經(jīng)驗的基礎上,目前大家比較認可的定義是:以網(wǎng)絡為支撐,以數(shù)據(jù)庫為核心,以檔案專業(yè)的管理軟件為工具,通過建設“三個平臺”——網(wǎng)絡支持平臺、業(yè)務管理平臺、信息服務平臺,實現(xiàn)數(shù)據(jù)傳輸網(wǎng)絡化、業(yè)務管理自動化、信息服務在線化。

進行數(shù)字檔案館建設,首先必須要搞懂它的基本結(jié)構,否則就會無從下手。其實,在數(shù)字檔案館這么一句簡單的定義中已經(jīng)揭示了它的基本結(jié)構:即網(wǎng)絡支持平臺、業(yè)務管理平臺、信息服務平臺。這3個平臺既相對獨立,又緊密相連。每一個平臺針對的對象不同,解決的問題不同。
數(shù)字檔案館3個平臺的組成結(jié)構可以參照OSI(開放系統(tǒng)互聯(lián)參考模型)來理解。OSI是國際標準化組織于1978年定義的一個描述網(wǎng)絡層次結(jié)構的標準模型,通過OSI保證了各種類型網(wǎng)絡的兼容性,互操作性。OSI說明了信息在網(wǎng)絡中是如何傳輸?shù)模约案鲗釉诰W(wǎng)絡中的功能和它們的框架概念。3個平臺作為檔案工作來理解可以與傳統(tǒng)檔案管理模式相對應,作為計算機網(wǎng)絡來理解可以與OSI的7個層相對應,見下圖:
與OSI模型功能相似,在數(shù)字檔案館3個平臺中,當前層平臺的下一層平臺都為當前層提供服務。3個平臺的結(jié)構為傳統(tǒng)檔案工作向數(shù)字檔案館過渡提供了理想的結(jié)構模型。
從檔案傳統(tǒng)管理模式來看,網(wǎng)絡支持平臺對應的是檔案信息的存儲利用模式。傳統(tǒng)檔案工作在這個平臺上主要考慮檔案的庫房容量,檔案案卷上如何標識,檔案信息如何組織起來對外提供利用等。庫房管理和檔案案卷組織存放形式是傳統(tǒng)檔案工作的基礎,沒有這個基礎檔案管理無從談起。
在數(shù)字檔案館的概念中,網(wǎng)絡支持平臺是處于最底層的一個平臺,是所有服務的基礎。這一層平臺主要完成數(shù)字檔案館的硬件布置與連接。如:網(wǎng)絡配置、服務器設置、客戶端要求、實體文件和各種條目信息的組織形式、存儲容量分析等。主要對應OSI 模型中的下面4層。即:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡層和傳輸層。這一層平臺面向檔案業(yè)務管理平臺,向檔案業(yè)務管理平臺提供服務,對數(shù)字檔案的有效存儲和安全傳遞負責。
網(wǎng)絡支持平臺中重點考慮的一個方面是海量數(shù)據(jù)存儲。海量數(shù)據(jù)是數(shù)字檔案館的一個鮮明特點,它既是數(shù)字檔案館對外提供利用的基礎,也是加工和處理的對象。一般來說數(shù)字檔案館可以成為一個單位最大的數(shù)字信息庫之一,存儲量以“T”計。在硬件配置時應考慮大容量硬盤或磁盤陣列,在做異地備份時可以考慮光盤。
另一個考慮的重點是保存信息的多樣性。隨著信息技術的發(fā)展,我們產(chǎn)生的電子信息日益呈現(xiàn)出多媒體化,這種趨勢將來會越來越明顯。如我們平時經(jīng)常遇到的工程圖紙信息(掃描圖tif、工程CAD圖紙)、文書檔案信息(原文及批文tif、word、htm)、電子圖書(CEB)、電子期刊(CAJ、PDF)、電子版規(guī)程規(guī)范(PDF),圖片信息(JPEG、BMP、GIF)等。為用戶保存和提供多媒體信息是網(wǎng)絡支持平臺應完成的功能,千兆甚至萬兆以太網(wǎng)和高速交換機為大容量信息傳遞提供了硬件基礎。
對應于業(yè)務管理平臺,傳統(tǒng)檔案管理模式可以劃分為的6個工作環(huán)節(jié),即:收集、整理、保管、鑒定、統(tǒng)計、提供利用。這6個環(huán)節(jié)體現(xiàn)了檔案的日常工作,規(guī)范了檔案信息的流向,保證了進出檔案庫的信息都是完整、準確、有效的。在數(shù)字檔案館設計中應考慮實現(xiàn)這6個環(huán)節(jié)的功能,以便和傳統(tǒng)紙質(zhì)檔案的管理相兼容。
從計算機網(wǎng)絡角度看,這一層平臺是數(shù)字檔案館非常重要的一層,起著承上啟下的重要作用。這一層主要對應于OSI模型中的會話層和表示層。在OSI模型中,會話層主要功能是為會話實體間建立連接,表示層主要功能是為通信提供一種公共語言。這兩層的功能映射到業(yè)務管理平臺中主要通過數(shù)據(jù)庫和檔案編號體系來完成,而數(shù)據(jù)庫的管理在整個數(shù)字檔案館中起著核心的作用。檔案管理人員通過數(shù)據(jù)庫完成對數(shù)字檔案信息的各種相關操作,同時接收信息服務平臺發(fā)送過來的服務請求。所有數(shù)字信息經(jīng)過檔案編號體系編碼后進入數(shù)字檔案館進行有序保管,完成一個歸檔過程。檢索出來的信息通過這一層分類排序提供給信息服務平臺,完成一個服務過程。檔案6個工作環(huán)節(jié)通過數(shù)據(jù)庫和檔案編號體系相互作用共同完成數(shù)字檔案館的系統(tǒng)操作及日常維護。
在業(yè)務管理平臺,數(shù)字檔案館可以和工作流程中的上一級進行對接和連通,使檔案工作得以延伸,從根本上解決數(shù)字檔案歸檔率低的難題。以設計行業(yè)CAD圖紙歸檔為例,通過和出版崗位的繪圖儀連通,構筑同一個數(shù)字化管理平臺,實現(xiàn)在出版CAD圖紙的同時完成歸檔,可以使CAD圖紙歸檔率達到95%以上。
在許多數(shù)字檔案館系統(tǒng)設計中都把業(yè)務管理平臺設計成C/S形式,系統(tǒng)的日常管理通過檔案工作崗位的計算機來完成。這樣做有利于數(shù)字檔案館的管理工作相對獨立,提高了系統(tǒng)的安全性和保密性,提高工作效率。
業(yè)務管理平臺完成的重點任務是系統(tǒng)管理、人員注冊、數(shù)據(jù)庫日常維護、權限設置和安全控制。從安全角度講,該層對整個系統(tǒng)的安全和有效負責。用戶對系統(tǒng)的操作都要通過該層來識別其權限屬性,判定該請求能否進入下一層平臺。系統(tǒng)的日志記錄也在這一平臺完成。
在傳統(tǒng)檔案管理模式中,信息服務平臺對應于檔案服務形式。檔案部門根據(jù)用戶的需求選擇不同的服務方式,提供給用戶不同的檔案產(chǎn)品。比如用戶可以用查卡片的方式檢索檔案,也可以利用計算機檢索,還可以咨詢檔案管理人員。不同的服務方式帶來了不同的操作,但結(jié)果應當是相同的。
從計算機網(wǎng)絡角度來看,該層平臺對應于OSI模型中的應用層。與應用層功能相似,信息服務平臺是數(shù)字檔案館3個平臺中的最高層平臺,也是最靠近用戶的一層平臺。它不同于其他層平臺之處在于它不為任何一個平臺提供服務,它只為數(shù)字檔案館以外的用戶提供服務,用戶通過信息服務平臺完成對系統(tǒng)的操作。該層的任務是研究用戶的需求,如何為用戶提供方便、準確、舒適的服務。
信息服務平臺對用戶負責,該層不關心數(shù)字檔案信息在哪里存放,它的組織形式是什么,它是如何傳遞等具體問題。該層對用戶提出的需求進行分析并啟動業(yè)務管理平臺的數(shù)據(jù)庫系統(tǒng)對館藏數(shù)據(jù)進行檢索,檢索后的結(jié)果由業(yè)務管理平臺排序后提供給用戶。該層提供給了用戶模糊檢索、跨庫檢索、全文檢索等多種檢索工具,并可以為用戶提供瀏覽下載等多種功能。
信息服務平臺最強大的功能在檢索上。模糊檢索、跨庫檢索、全文檢索等多種檢索方式的采用會大大提高數(shù)字檔案的查全率和查準率。跨庫檢索和全文檢索是數(shù)字檔案館的突出特點的體現(xiàn),在數(shù)字檔案的環(huán)境下,檔案利用者不會感覺到信息存在于各個不同的數(shù)據(jù)庫中,而只是根據(jù)需要查詢索取自己所需要的信息,不管信息是被標引或是沒有被標引,系統(tǒng)都會自動提供所有相關信息,真正達到相當高的查全率。數(shù)字檔案館模糊了庫與庫之間的界線,對外界只提供一個統(tǒng)一的界面,極大地方便了利用人員查閱和使用檔案。
信息服務平臺提供能瀏覽多種媒體格式的瀏覽器,在一個界面環(huán)境下完成多媒體信息的瀏覽或下載,方便了用戶對檔案全文信息的檢索和利用。
該層平臺一般設計為B/S結(jié)構。在通常的設計中,采用數(shù)字檔案館網(wǎng)站來鏈接各個數(shù)字資源庫,網(wǎng)站上有瀏覽器插件、各種檢索工具插件等。這種設計的目的是方便用戶登錄數(shù)字檔案館,降低用戶端計算機的要求。
在3層平臺結(jié)構中,用戶對數(shù)字檔案館提出的需求是一層一層向下傳遞,在完成相關操作后信息又一層一層向上傳遞,最后提供給用戶。比如用戶要完成一個檢索,首先經(jīng)過信息服務平臺接收處理并識別是什么需求,分析后傳遞給業(yè)務管理平臺。在業(yè)務管理平臺啟動數(shù)據(jù)庫的檢索,通過對網(wǎng)絡支持平臺中實體文件的檢索,完成需要信息的查詢,然后向上傳遞回業(yè)務管理平臺進行排序或分類,最后提供給信息服務平臺,完成一次操作。用戶最終看到了檢索結(jié)果,見圖1。

圖1 最終檢索結(jié)果
數(shù)字檔案館結(jié)構的形成經(jīng)歷了一個發(fā)展歷程,它的發(fā)展和整個檔案管理軟件的發(fā)展相一致。在早期單機版的計算機輔助管理檔案階段,只能部分實現(xiàn)“業(yè)務管理平臺”這一層的功能。這一階段的特點是以單個的計算機為基礎,以對檔案卷冊的目錄級管理為重點,具有簡單的查詢、打印、排序等功能,沒有網(wǎng)絡支持平臺和為用戶服務的平臺。隨著網(wǎng)絡本身的發(fā)展以及網(wǎng)絡數(shù)據(jù)庫的出現(xiàn),具有“網(wǎng)絡支持平臺”部分功能的第二代檔案管理軟件開始出現(xiàn),但還不能保存管理檔案的全文。電子檔案的出現(xiàn)使得檔案管理軟件跨入第三代。第三代檔案管理軟件以網(wǎng)絡為基礎,以檔案的全文管理為重點,具有網(wǎng)絡查詢、瀏覽、下載全文等功能,初步具備了3個平臺的結(jié)構。第四代檔案管理軟件以檔案整體的數(shù)字化為基礎,以檔案管理中的歸全率、完整率為突破口,從電子文件的收集階段開始介入進行管理,實現(xiàn)了檔案工作的延伸和拓展,達到了確保檔案電子版全文的歸全率和完整率的目的。這些功能的完成需要3個平臺互相作用,缺一不可。

表1 檔案管理軟件發(fā)展歷史
從數(shù)字檔案館的整體結(jié)構來說,數(shù)字檔案館的建設是一個系統(tǒng)工程,并非一朝一夕就能完成,它對一個單位的網(wǎng)絡、計算機、檔案管理、電子檔案管理甚至相關部門都提出了較高的要求。對系統(tǒng)需求進行分析時宜從最高層入手,最底層結(jié)束。進行建設時宜從最底層入手,最高層結(jié)束。3層平臺的結(jié)構為我們研究數(shù)字檔案館提供了很好的模型,也為建設數(shù)字檔案館提供了理想的參照