王成琴
一、導航式檔案網上檢索系統的基本內涵
當你因愛好、研究或其他應用需要查找某方面或某一類的檔案信息時,但你卻不知道這些檔案的館藏情況和館藏地方,你可能就希望如果有一個像百度、谷歌那樣的網站就好了。只要輸入關鍵詞,便可查詢相關的信息。但是目前,雖然各地檔案工作者已經做出了很大的努力,如很多檔案館建立了網上查詢系統,公布了館藏目錄,發布了檔案編研成果等,但是這些都是“單兵作戰”,檔案館“各自為政”,功能比較少,水平比較低,還無法滿足用戶的上述要求。因此筆者建議建立一個導航式檔案網上檢索系統。
導航式檔案網上檢索系統就是一個基于廣域網能夠整合各個檔案館的資源,提供檔案信息檢索的服務系統。這一系統可以為各類檔案利用者提供跨地域、跨行業、跨部門的檔案信息,提供所需檔案的數量、所在的地方、利用的方法、條件和聯系方法以及其他檔案等相關信息,發揮檔案利用的索引導航作用,從而向多層次、廣地域的公眾檔案利用者提供指引,讓檔案信息更加貼近普通公民,貼近需求者,實現檔案信息資源的社會化。
導航式檔案網上檢索系統應該具備這樣的功能:一要有一個關于檔案信息的統一的網絡檢索界面,能讓利用者方便的識別和利用這個系統;二要有一個強大的跨地區、跨部門、跨行業的檔案信息資源數據庫,保證能給公眾提供大量的查詢信息;三要能按一定標準提供檢索結果,為利用者進一步利用提供指引。比方說某一利用者因研究徐悲鴻的需要,需查找有關徐悲鴻的檔案資料,但又不知道該類檔案資料在什么地方、在哪個檔案館有,如何去查詢等。這時便可以利用這樣的檢索系統,通過輸入“徐悲鴻”這一檢索詞,通過一個檢索頁面提供數據庫中所有關于徐悲鴻的檔案信息(包括收藏者鏈接和聯系、查閱方法等),為進一步利用起到導航作用。
二、建立導航式檔案網上檢索系統是提升檔案利用水平的必然
1、檔案利用工作重點轉變的需要。由國家檔案局、中央檔案館于1997年2月頒發的《關于在全國檔案系統加強社會主義精神文明的意見》要求各級檔案館充分發揮五個功能,即檔案保管基地功能、檔案利用中心功能、愛國主義教育基地功能、學術研究場所功能、文明服務窗口功能。然而這些功能的發揮都要通過檔案的有效利用來實現,而先進的檢索手段又是有效利用的必備條件。隨著檔案館功能的拓展,檔案利用群體也不再是以政府機關干部和學者為主體,作家、研究人員、創作編導、編史修志、政策制定甚至休閑欣賞等任何一個普通公眾都有利用檔案的可能性。這種利用者的“隨意性”要求檔案館提供一種“通俗”、易操作的“傻瓜”式檢索系統。
2、檔案信息網絡管理發展的需要。目前各檔案部門為實現檔案資源共享,正加大力度進行檔案資源整合,加強數字化建設。全國大多數檔案館都建立了檔案網站,提供了數量巨大的信息資源。要想利用這些資源,按目前狀況需要到各個檔案網站上去檢索查詢,這對于普通公眾來說,存在兩個問題。一是專業性的檢索系統和各檔案網站檢索方式的多樣性影響著檔案信息的查準率和查詢速度。二是檔案信息“各自為政”存儲在各個檔案網站上,不能互相鏈接。作為完善的檢索系統應該使公眾盡可能直觀、方便、準確的檢索。因此信息網絡管理工作不僅需要數字化的“虛擬檔案館”的內容,還需要以最簡單的檢索方式打開這所大門的鑰匙,滿足多樣的檢索利用需求。
3、檔案利用范圍擴大的需要。早在2002年9月召開的第十四屆國際檔案大會第三次全體報告會的議題是“檔案館在休閑利用社會中的作用”。英國著名檔案學家邁克爾·庫克指出整個社會應該把檔案館看作是一個文化機構,即使是貼上“文化娛樂”甚至“消遣”的標簽也是無可厚非的。也就是說除公務需要外,檔案開始和普通公民的生活興趣、愛好、鑒賞等休閑活動聯系到一起,人們有意無意地利用檔案的隨意性要求有一種寬范圍的查詢檢索系統,能滿足公眾用戶準確、快捷、方便地檢索,找到所需的檔案信息。
4、國內外檔案網站已經出現了這樣的雛形。筆者打開美國國家檔案館網頁,發現不僅信息資源豐富,而且還擁有全國各種檔案館館藏信息的聯網數據庫,實現全國檔案信息資源集成化查詢檢索和利用,并通過目錄式方法將有關檔案部門鏈接起來。國內已經有部分網站或多或少地實現了或正在準備實現這樣的一些功能。國內有一法律界人士建立的網站,與全國283個地市的律師合作,建立一個專業檔案查詢網,可以查詢企業工商證照、房產、車輛設備資產及人員等方面的信息。浙江檔案網在檢索系統中提供國內外可檢索的相關資源的鏈接,四川檔案網則準備提供全省部分市、州的館藏目錄查詢。這些網站提供這方面的服務已經體現了網上檢索的方向,但基本還是區域性的、不完整的和初始的,實現真正的導航指引功能還有很長的路要走。
三、導航式檔案網上檢索系統建立的方法與要求
建立導航式檔案網上檢索系統需要對各檔案館的檔案信息進行全面搜集、合理組織和有效利用。搜集各地檔案館的檔案信息,整合成一個統一的檢索資源數據庫是一個關鍵環節和艱巨任務。那么,采取什么方法獲取分散而又數量巨大的檔案信息?這里可以借鑒和引進搜索引擎技術。
目前,搜索引擎基本分為兩類:全文搜索和分類目錄。全文搜索是利用“網絡蜘蛛”軟件,通過網絡上的各種鏈接自動獲取大量網頁信息內容,并按規則分析整理形成數據庫。分類目錄是通過人工的方式收集整理資料,人工編輯審核后輸入數據庫,也叫目錄搜索引擎。全文搜索引擎是一個自動過程,提供的查詢結果量大、關聯度低,而且通過網上自動抓取,前提是必須有足夠量的網頁內容。分類目錄依靠人工收集整理,能提供更為準確的查詢結果,但收集的內容有限。鑒于各地檔案網絡建設不平衡、提供利用的網頁內容少,甚至沒有可供利用的網頁內容等情況,全文搜索引擎技術難以發揮應有的作用。再考慮到檔案利用有開放與未開放的特殊性,不可能將卷宗內容全文在網頁上反映出來,只能提供檔案卷宗的基本信息,再加上對網站數據庫建設的時間沒有硬性要求。因此,筆者認為,建立導航式檔案網上檢索系統采用分類目錄技術比較合適,同時考慮到各地檔案網絡的不斷發展及網頁內容的不斷豐富,全文搜索技術可以作為補充。
建立導航式檔案網上檢索系統,從理論上講可以由國家檔案管理部門承擔,也可以由社會機構承擔,進行網絡經營(就像谷歌、雅虎一樣)。但目前各地檔案網絡建設水平較低,內容匱乏,不可能完全像谷歌那樣依靠全文搜索技術獲取大量可利用的檔案信息,還需要各地檔案機構密切配合,提供可供利用的檔案信息來共同建設檔案信息資源數據庫。因此,就我國集中式管理體制而言,目前由國家檔案管理部門牽頭建設比較合適,有利于發揮職能作用、協調上下級關系、制定標準規范、發揮系統的最大效用。在具體運作上也可以采取市場化的方法。建立一個能充分發揮作用、運行有序的導航式檔案網上檢索系統還要做到以下幾點:
1、要建立一個檔案信息供給機制。由于各地檔案網站利用方面內容不多,建立資源數據庫目前除部分自動獲取網頁內容外,主要需各地檔案館提供可供利用的檔案信息。我們可以同時采取行政管理手段和技術手段,建立起正常的檔案信息供給渠道。同時,各地要加強檔案信息資源建設,加快館藏檔案上網步伐,將館藏檔案目錄信息全部上網,擴大檢索范圍,為實現全文檢索(檔案信息網上自動采集)創造條件。
2、要制定網上檔案信息標準規范。在兼顧方便檢索和檔案自身特點的基礎上,統一檔案信息的格式,包括檔案題名、檔案號、主題詞、形成時間、館藏單位名稱及鏈接、聯系方法及閱檔條件等信息內容,建立一個科學的資源數據庫。
3、要有良好的檢索功能。要支持自然語言、關鍵詞、主題詞三種檢索語言;支持特征字段檢索(如檔案題名,檔案機構名,檔案號等);支持分類目錄結構,按照特定屬性進入相關類目,可以一層一層的查找,如藝術——美術——國畫——畫家——徐悲鴻。方便利用者準確、便利、快捷地查找所需的檔案信息。
4、提供良好的服務。檢索結果顯示方式要多樣化,增加保存、復制、打印、下載等功能,提供網上預約調卷、查閱服務、用戶提問或反饋等互動平臺,給用戶一個友好的界面,提高服務質量,充分發揮導航式檔案網上檢索系統的功能。