摘要:以檔案信息服務平臺的構建為主線,著重探討構建這個服務平臺的基本要素,即檔案網絡體系、檔案門戶網站、檔案數據庫、檔案信息服務系統、檔案信息資源存儲管理架構,并對這些基本要素所包含的內容進行論述。
關鍵詞:數字檔案館 檔案信息服務 網絡體系 門戶網站 數據庫 服務系統 存儲管理
1 檔案網絡體系——數字檔案館提供服務的傳輸平臺
網絡是數字檔案信息流通的渠道,網絡使數字檔案信息得以傳遞、變換,具有無損耗性和增值性。數字檔案館要依托網絡向政府和社會公眾提供網絡化檔案信息服務。
1.1 數字檔案館高速局域網的建立
數字檔案館是一種新概念和新技術,檔案數據類型包括文本、圖片、聲音、圖像、視頻等多媒體信息,多媒體信息的傳輸需占用足夠的帶寬;同時,數字檔案館要支持多用戶的并發訪問。因此,數字檔案館網絡環境建設首先要考慮建立內部的高速局域網。
所謂高速局域網,一般是指數據傳輸速率在100Mbit/s以上的局域網。當前流行的高速局域網技術有:交換式以太網、快速以太網、千兆位以太網、100-VG Any LAN、FDDI、ATM。各種高速局域網技術各有其優點,并廣泛用于各行各業中。數字檔案館應根據實際情況及比較各種高速局域網技術的優點有選擇地組建內部高速局域網。目前,各類已建成或正在建設的數字檔案館已經在充分考慮其應用及發展的基礎上,遵循開放性、可擴展性、易用性、易管理性、穩定性及安全性的設計原則,遵照國家有關法律法規,采用館內網、政府專網、公眾網“三網并舉”且三網物理隔離的模式,建立了網絡設施好、網絡平臺先進、網絡布點多、網絡管理可靠的內部高速局域網。
1.2 四通八達的數字檔案館網絡體系
數字檔案館的目標是在寬帶IP網上形成大規模、高質量的檔案信息庫群,通過網絡向檔案館內部、全國乃至全球提供服務。這就需要組建四通八達的數字檔案館神經網絡體系,以便進行有效的檔案信息傳播。
建立全國各級各類數字檔案館上下互連的檔案網絡體系.可采用自建數字檔案館專網和利用已有的網絡兩種模式。從節約成本、資源共享、追求效率的角度出發,檔案部門自行建立全國范圍的數字檔案館專用網是不必要的。比較現實和可行的組網模式是檔案部門可以充分利用已有的網絡平臺來構建中國數字檔案館網。一是利用我國已建成的國家級的、開放件的骨干網。目前,我國十大骨干互聯網已經初具規模,這些骨干網之間通過互聯網交換中心互聯、對等直聯和轉接互聯,并已相繼實現了國際聯網。其中,CERNET在全國第一個實現了與國際下一代高速網INTERNET2的互聯。另外,在同家公布的“十一五”規劃中,首次將“三網融合”這一重大技術動向寫入其中,互聯網、電信網、電視網“三網合一”是網絡發展的必然趨勢。全國各級各類數字檔案館可根據情況自主選擇某一相關的或接入較為方便的骨干網來共同建立中國數字檔案館網。二是利用政務網,實現數字檔案館與政務網相通。目前,我國已在運行的數字檔案館,如深圳數字檔案館、青島市數字檔案館、天津開發區數字檔案館、杭州網上檔案館等,均是借助骨干互聯網、政務網來達到為全球公眾和政府服務的。
2 檔案門戶網站——數字檔案館提供服務的窗口平臺
檔案網站是檔案館室面向網絡世界的服務窗口,[1]具有展示功能[2]、服務功能[3]。數字檔案館已經無法回避數字檔案資源的收藏、管理、保存、服務等問題,近年來世界各國數字檔案館紛紛在網絡平臺上建立了自己的網站,并以此作為檔案信息的展示和服務的基點。同內外比較有代表性的“數字檔案館”,如美國日美關系數字檔案館(http://jarda.cdlib.org)、英國國家數據數字檔案館 (http://ndad.ulcc.ac.uk)、 日本亞洲歷史資料中心(http://www.jacar.go.jp)、深圳數字檔案館(http://www.szdai.gov.cn)、青島數字檔案館(http://www.qdda.gov.cn)等,均通過網站開展網上檔案資源共享服務。
2.1 數字檔案館網站的門戶建設策略
目前,美歐一些國家的數字圖書館門戶已經在網上運行,國內如中國高等教育數字圖書館在2002年也把數字圖書館門戶納入到數字圖書館建設的總體規劃當中,中科院國家科學數字圖書館網站也推出新版門戶網站。受數字圖書館門戶網站的啟示,我國數字檔案館應以一定的虛擬社區作為自己的服務對象,走門戶網站道路。
門戶網站是指集成了多樣化內容和多種服務模式的Internet網站,按其內容范圍可分為水平門戶網站和垂直門戶網站。水平門戶網站提供的信息是面向大眾的包羅萬象的各式各樣的信息,如各種各樣的新聞、娛樂網站.考慮的是所有用戶的信息需求,滿足的是用戶的一般信息需求。垂直門戶網站是為特定用戶服務的網絡入門,主要關注的是用戶的一些特殊的信息需求,如各種各樣的學術、科研、專門數據庫等網絡門戶,其所面對的對象相對來說要少一些,但其有不可替代性。與水平門戶網站相比,垂直門戶網站并不求大而全,而是力求做到某個特定領域內的全面,對這個領域之外的信息并不收集.也不提供這個領域外的服務-這種特定的服務可以有效地把對這一特定領域感興趣的用戶與其他網民區分開來.并能長期持久地吸引住這些用戶。因此,數字檔案館網站應建設成垂直門戶網站。
2.2 數字檔案館門戶網站建設的思路和技巧
一個網站的成功與否,主要是由用戶的認可程度來決定的.而用戶的認可主要是對網站內容的認可。因此,數字檔案館網站的總體設計應體現“以人為本,以內容為中心”的原則,要把數字檔案館內外、網上網下的檔案信息資源集中在一個互聯網頁面上,簡化檔案信息用戶對有用檔案信息的查尋,并根據相應的規則向檔案信息用戶提供“一站式”服務。
數字檔案館門戶網站頁面布置應突顯以下幾個大欄目:(1)檔案數據庫,集中顯示目前本館自建和合建的所有數據庫清單,點擊網絡開放目錄和全文庫即可進行檢索;(2)檔案服務系統,包括分布式參考咨詢系統、館際互借和原文傳遞系統等;(3)培訓欄目,集中介紹數字檔案館的有關情況、網絡檔案數據庫資源使用方法等;(4)網絡導航。同時.還應注意以下幾個問題:(1)選擇適合的建站技術如ASP、PHP、XML、CGI、CFM、ASP、NET等技術來建立網站;(2)主頁結構清晰,網頁層次結構不應超過3層,在任何一個頁面都要沒有返回主頁的鏈接;(3)注意色彩的運用;(4)注重網站的動態性。
3 檔案數據庫——數字檔案館提供服務的資源平臺
檔案數據庫是指以系統或有序的方法編排的、并可通過電子方式單獨訪問的檔案數據的集合。數字檔案館依托網絡、通過網站向檔案信息用戶提供服務.還需要有各類網絡檔案數據庫作為后臺保障。數字檔案館應建設量多、質高、易用的網絡檔案數據庫。
3.1 單個數字檔案館獨自建立網絡檔案數據庫
從目前我國建設數字檔案館的實際情況來看,主要處于單個檔案館獨自作戰模式。在建設網絡檔案數據庫方面.也主要是基于本館檔案資源來進行的。在具體的建設過程中,又分為兩種情況:一是通過檔案館工作人員對館藏的檔案資源進行錄入、掃描等數字化“加工”自建檔案數據庫;二是將檔案數據庫建設業務外包,如杭州市檔案館將“數字化加工車間”全部外包給信雅達公司運作[4]。作為一個數字檔案館,應首先建設館藏檔案目錄數據庫,包括全宗級、案卷級、文件級目錄,并應注意它們之間的級連關系。其次,應根據自己的館藏特色開發檔案全文數據庫,檔案全文數據庫應涵蓋有文本型、圖形圖像型和多媒體型。檔案目錄數據庫與檔案全文數據庫要能實現無縫對接。在數字檔案館建設的初期,一些檔案數據庫信息內容不是在數字檔案館系統中直接形成的,這就需要將做好的數據最后裝入到數字檔案館系統中。目前,我國各類數字檔案館在自建檔案數據庫上投入很大且成效顯著,如深圳數字檔案館建立了一定規模的數字檔案資源庫:機讀目錄數據庫1927948條,全文信息庫約13077頁,照片信息庫23000條,錄像信息庫19500條[5]。
3.2 多個數字檔案館聯合共建網絡檔案數據庫
數字檔案館有狹義和廣義之分,狹義數字檔案館是指作為個體的數字檔案館,廣義數字檔案館是指作為社會整體性的數字檔案館,由狹義的數字檔案館而至廣義的數字檔案館,這是數字檔案館建設的規律[6]。廣義數字檔案館的實現需要多個個體數字檔案館的共同經營,其核心部分主要是數據庫建設。2005年政府確定投資的“金檔工程”項目已經國務院批準,國家總投資5億,主要用于全國各地檔案館歷史檔案的數字化采集工作.建立我國國家級、全國性檔案數據庫,這為各數字檔案館的聯合建庫提供了契機。在具體操作上.多個數字檔案館聯合組建區域性檔案數據庫。以全國各級行政區劃為準,自上而下,區域性數據庫可分為省級、市級、縣級等層次,由行政區劃內上、下兩級數字檔案館分工共建,共同推進區域檔案數據庫建設。青島市數字檔案館和青島市所屬12個區市數字檔案館共同建設了青島市區域性檔案目錄中心,在這方面做出了典范。
4 檔案信息服務系統——數字檔案館提供服務的工作平臺
數字檔案館檔案信息服務系統是數字檔案館在先進的信息組織、交流理論指導下,運用適當的方式與策略,采用現代化的計算機網絡和通訊技術,有效地搜集、整理、存貯數字環境下的檔案信息資源并及時、高效地提供滿足檔案信息用戶的系統,是檔案信息用戶利用數字檔案館時提交申請、檢索、咨詢的基礎交流工具,其設計的優劣將直接影響檔案信息用戶對數字檔案館的使用效率。
4.1 數字檔案館檔案信息服務系統的集成化
隨著數字檔案館建設進程和檔案信息全球化走勢的加速,數字檔案館的發展形成了兩種主流模式:特種館藏型模式和服務主導型模式。特種館藏型模式是將檔案館或相關機構的珍藏或特種館藏的檔案資料進行數字化.提供網上共享。例如日本的亞洲歷史資料中心、伊利諾斯數字檔案館、美國的西北數字檔案館等。服務主導型模式的資源一般由三部分組成:檔案館本身的數字化特種館藏、電子檔案、在因特網上有用的檔案信息資源。它們用統一的界面向檔案信息用戶提供服務。例如國內的若干綜合性數字檔案館。服務主導型數字檔案館強調檔案信息資源與服務的集成,數字檔案館基于服務的集成就是建立數字檔案館集成檔案信息服務系統,借助集成化的檔案信息服務系統來靈活調度多樣化的檔案資源,開展多元化服務。檔案信息服務系統應集成以下服務功能:(1)檔案信息檢索功能;(2)數字參考咨詢功能,包括分布式合作參考咨詢;(3)檔案信息推送功能;(4)個性化定制功能;(5)館際互借與檔案文獻傳遞功能;(6)導航功能;(7)檔案信息用戶在線培訓功能。這樣,檔案信息用戶只需面對一臺計算機,就能享受到從咨詢、查找到打印、下載、傳遞等全過程的動態檔案信息服務。
4.2 建立集成化檔案信息服務系統應注意的問題
數字檔案館檔案信息服務系統的集成是一個非常廣泛而復雜的課題,就個體數字檔案館而言,要求建立面向開放和分布數字信息環境的集成檔案信息服務系統,包括上述所描述的功能;就各個數字檔案館的關系而言,還包括開放元數據轉換、開放鏈接服務、開放用戶認證控制系統等,允許其它數字檔案館發現、鏈接、嵌入和調用所需檔案信息資源和服務模塊.從而靈活配置所需檔案信息服務流程,無縫地集成所需資源和服務。另外,數字檔案館檔案信息服務系統的集成表現出動態性特點,動態集成是在服務系統運行階段的集成。數字檔案館服務系統動態集成過程涉及到服務發現、服務整合、服務調用等多個環節,而動態集成對服務系統的智能化要求很高,需要眾多技術的支持。因此,要認真選擇相關技術如Web—Services技術、本體技術等來解決數字檔案館服務系統的動態集成問題。
5 檔案信息資源存儲管理架構——數字檔案館提供服務的倉儲平臺
數字檔案館提供網絡服務時,需要大量的檔案信息資源做有力后盾,而這些檔案信息資源需要有一個容量大、可擴展、高安全、易管理的“檔案庫房”來存放,海量存儲系統可承擔此重任。
海量存儲設備主要有磁盤陣列、磁帶庫、光盤庫、光盤塔、光盤網絡鏡像服務器等。在數字檔案館的海量存儲系統中,這些存儲設備因其信息存儲特點的不同。應用環境也有較大區別。磁盤陣列主要用于網絡系統中的海量數據的在線存儲;磁帶庫更多的是用于網絡系統中的海量數據的離線存儲;光盤庫則主要用于網絡系統中的海量數據的近線存儲。各數字檔案館可以根據自己的實際需求來選擇不同的存儲設備并在數字檔案館網絡系統中采用DAS(直接附連存儲)、NAS(網絡附加存儲)、SAN(存儲區域網絡)等存儲技術靈活組配這些存儲設備,可搭建出不同架構的倉儲平臺。
5.1 基于DAS的檔案信息資源存儲管理系統
DAS模式是將存儲設備通過SCSI接口或光纖通道直接連接到一臺服務器上。這種方式下,大容量的存儲設備如磁盤陣列、磁帶庫、光盤庫等作為服務器的外設使用,單個服務器的每一個SCSI通道上最多可掛接15個存儲設備。當存儲空間不足時,這種附屬于網絡服務器的資源存儲方式主要是通過增加磁盤數量或更換更大容量的硬盤來擴展容量,但當服務器上的接口或可供掛接的驅動器數量已滿,則只能再增加服務器了。DAS架構使用服務器上的網絡操作系統來管理存儲設備,數據的存儲是分散的,數據管理需第三方軟件支持。DAS實行異地備份,依靠雙服務器和相關軟件實現雙機容錯功能。DAS對小型數字檔案館比較適合。
5.2 基于NAS的檔案信息資源存儲管理系統
NAS模式是把存儲設備通過自帶的網絡接口直接連接到網絡中,配置一下IP地址,就可以被網絡上的檔案信息用戶所共享。NAS設備的物理位置很靈活,既可以放置在數據中心的工作組內,也可以放在其他地點,通過物理鏈路與網絡連接起來,無需應用服務器的干預。NAS設備是一種真正即插即用的網絡存儲設備,當需要增加存儲空間時,只需要在線簡單地搭接更多新的NAS設備,就能夠實現無限擴展,不需要再配置應用服務器。NAS采用集中式存儲結構,集中管理數據,可通過Web方式對NAS設備進行遠程設置、遠程升級及遠程管理。NAS使用網絡進行備份和恢復。NAS集成本地備份軟件,可實現無服務器備份,即使服務器發生故障,檔案信息用戶仍可進行數據存取。NAS適用于中、小型數字檔案館。
5.3 基于SAN的檔案信息資源存儲管理系統
SAN模式是通過一個單獨的網絡(通常是高速光纖網絡)把存儲設備和掛在TCP/IP局域網上的服務器群相連。每個光纖通道支持126個節點設備,并且能夠使多臺存儲設備整合成巨大容量的虛擬存儲池,動態的分配存儲空間資源,滿足大數據量信息跨設備存儲的需要。隨著檔案數據量的增長,SAN允許獨立地增加它們的存儲容量,同時仍然保持在線。SAN是獨立于服務器網絡系統之外幾乎擁有無限存儲的高速存儲網絡。SAN實現了存儲設備的統一管理。SAN以數據存儲為中心,將數據存儲管理集中在相對獨立的存儲區域網內,使得管理及集中控制實現簡化。SAN的數據備份直接在存儲網內進行,同時在SAN中也可以通過建立雙機容錯、多機集群,實現RAID校驗等方式進一步保證數據的安全性。SAN可以使用網關和WAN連接實現遠程的災難恢復備份。SAN適合大、中型數字檔案館。
5.4 基于“NAS-SAN”或“DAS-NAS-SAN”的檔案信息資源存儲管理系統
DAS、NAS、SAN三種模式都有各自的特征,將DAS、NAS、SAN三種技術融合,即“NAS-SAN”或“DAS-NAS-SAN”匯聚,已經成為大勢所趨。這兩種組合模式是目前最先進的檔案信息資源存儲管理方案,對于大型數字檔案館來說是個不錯的選擇。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。