摘要:全文檢索技術應用于公共檔案館,無論是對公共檔案館服務理念的轉變、服務水平的提高,還是對檔案信息服務工作效率的提高、檔案信息服務形式和服務范圍的拓展都具有積極的促進作用,進而有助于實現我國各級公共檔案館向新型公共檔案館轉變。但從目前我國公共檔案館現狀來看,全文檢索技術在各級公共檔案館普及應用中還面臨著全文檔案數據庫建設難度大等一系列問題。文章最后建議通過做好頂層設計,建立配套的實施保障體系和將其納入考核指標體系中等途徑加快推進全文檢索技術在我國新型公共檔案館中建設中的應用。
關鍵詞:全文檢索技術新型公共檔案館全文檔案數據庫
谷歌、百度等網絡搜索引擎之所以大受用戶歡迎和喜愛,一個重要原因就是其強大的搜索功能能在海量信息中將所需的內容快速搜索出來反饋給用戶,而之所以能做到這一點,主要在于全文檢索技術的應用。同傳統的檔案信息檢索技術相比,全文檢索技術具有的檢索全面性、用戶友好性以及能根據信息內容完成檢索的特點。在公共檔案館館藏資源不斷豐富、電子文檔與檔案館數字檔案館建設基本完成之時,作為提供檔案信息服務機構的公共檔案館,引入全文檢索技術,對我國加快推進新型公共檔案館建設,更好地開展檔案信息服務利用工作,提供了一個切實可行的方法和入口。
一、我國新型公共檔案館建設中
應用全文檢索技術的背景分析
我國《檔案法》第十三條規定:“各級各類檔案館,……采用先進技術,實現檔案管理的現代化”;第十九條規定:“檔案館應當定期公布開放檔案的目錄,并為檔案的利用創作條件,簡化手續,提供方便”②。由此可見,各級各類檔案館采用先進技術,實現檔案管理現代化并為社會利用檔案提供方便,是法律賦予各級公共檔案館的義務。2009年10月30日,國家檔案局在上海召開的全國檔案館工作會議中,楊冬權局長在題為《以豐富館藏、提高安全保障能力和公共服務》的講話中提出,下一個十年,全國檔案館工作的主要任務是搞好館舍建設、館藏建設、信息化建設、公共服務建設等,努力把各級檔案館建設成“五位一體”的新型公共檔案館,實現檔案館事業的跨越式發展。
與此同時,隨著我國公民檔案信息意識和自我維權意識的不斷增強、電子文件數量的幾何級增長,衍生出新形勢下新的檔案需求,公民通過到公共檔案館(或數字檔案館)查閱檔案原件來解決關系到個人生活的案例逐步增多,涉及到土地所有權、房產歸屬、學歷學位、婚姻證明、工作調動、財產繼承等方方面面。因此,新形勢下廣泛的檔案利用需求必然要求有新的服務方式來支撐和適應。全文檢索技術作為目前最先進、有效的信息檢索技術,可以為公共檔案館實現檔案管理現代化提供必要的技術條件支撐。
在國外,公共檔案館因其便利性,能及時滿足復雜多樣檔案用戶的檔案需求,而得到公眾普遍認可,社會地位普遍較高。而在我國,公共檔案館因長期處于封閉或半封閉狀態,邊緣化趨勢明顯,社會認可度低。各級各類公共檔案館在信息資源占據經濟社會發展主導地位的今天,及時、有效、合理地開發所屬檔案信息,便于檔案用戶使用,保證穩定的檔案用戶群,實現自身職能轉型,已迫在眉睫。
不管是法律賦予的義務,還是為自身生存、發展謀求出路,亦或是包括全文檢索技術在內的現代信息技術的不斷成熟和普及,全文檢索技術應用于我國公共檔案館,提升公共檔案館服務水平和質量,已是至關必要。二、全文檢索技術在我國新型公共檔案館建設中
的積極作用
全文檢索技術,憑借強大的信息檢索功能,為公共檔案館實現服務利用方式的轉變、全面提升公共檔案館檔案管理的信息化水平提供了一條切實可行的途徑。
1、有助于轉變公共檔案館服務理念、提高服務水平
人類社會已進入信息時代,檔案館存儲的檔案,檔案的信息屬性日益凸顯,檔案已被視為當代社會一種核心信息資源,社會對這些檔案的需求量逐步增大。檔案價值的實現,只有通過檔案館對檔案的不斷開發,才能使檔案資源得到廣泛利用,進而實現檔案價值由潛在價值向現實價值轉變。公共檔案館守著一堆“寶貝”,卻不懂得利用這些“寶貝”,以此來提升自身的社會地位和社會影響力,是對資源的一種極大浪費。
按照《中華人民共和國檔案法實施辦法》第二十二條規定,各級各類檔案館在為社會提供利用檔案時,可以按照規定收取一定的費用。可見,公共檔案館在開展檔案信息服務時,收取合理的服務費用,具有法律依據。同時,從國際通行做法來看,也并無不妥。各級各類公共檔案館,在條件允許的情況下,建立基于全文檢索技術支撐下的軟件管理平臺,提供多種檢索途徑,根據檔案用戶需求,開展檔案信息咨詢服務,如“在線咨詢”、“電話和Email咨詢服務”等,保證檔案用戶及時獲取到所需檔案信息,在此基礎上收取一定的費用。如此一來,一方面,可以提高檔案館日常運行經費和檔案工作人員的經濟收入水平;另一方面,檔案用戶乃至社會能及時獲取到所需檔案信息,會逐步形成對各級各類檔案館檔案的依賴性,檔案信息利用需求不斷提升。對檔案館及檔案工作人員而言,通過自身努力,其工作能不斷得到認可,自身價值逐步得以實現,根據社會學的社會角色理論,角色和社會地位是一對集合體,檔案館及檔案工作人員在整個社會體系中會扮演著越來越重要的角色,同時享受著較高的社會地位。這樣一來,可最大限度地促進公共檔案館及檔案工作人員的工作積極性和主動性,也可促進公共檔案館及檔案工作人員實現由傳統被動式服務理念向積極主動式服務理念的轉變,不斷創新檔案服務方式,及時提供用戶所需檔案信息,提高檔案服務水平和服務效果。
2、有助于提升公共檔案館檔案信息服務工作效率
對傳統的公共檔案館檔案信息檢索而言,無論是最為傳統的人工檢索方式,還是半智能化的檔案檢索方式,都有一個共同點:不僅費時、費力,而且其查全率、查準率不高,公共檔案館檔案工作人員工作量大,工作效率低。傳統的人工檢索方式通過檔案館工作人員查找事先編制好的索引目錄,然后在檔案庫房中再經歷由全宗一年代(機構)一卷內目錄一文件這樣一個查找過程,查找一份文件有時需花費較長時間,如果查找多份文件,則需更長時間;而半智能化的檔案檢索方式,公共檔案館工作人員一般也是在事先著錄標引的基礎上,通過計算機輔助,查找到某份文件的相關外在信息,然后再去相應的庫房位置將檔案取出,這種半智能化的檔案檢索方式其檢全率、檢準率都很大程度上取決于事先對文件的著錄、標引質量以及查找人員對庫房檔案內容的熟悉程度。相對于傳統的檔案館檔案檢索方式,全文檢索方式提供多條檢索途徑,檔案信息用戶可通過計算機直接檢索到所需檔案全文,而無需在到檔案庫房中進行查找(除非確有必要,由檔案館工作人員找出原件)。查找到所需信息變得更加容易,與此同時,在建立全文檔案數據庫時,因為公共檔案館中所有檔案資源都事先經過檔案工作人員精心地著錄和標引成結構化的檔案信息,因此不容易造成重復開發,為公共檔案館節省了大量的管理成本和時間成本等,不斷提升了公共檔案館檔案服務工作效率。
另一方面,全文檢索技術可將檔案全文中任何有意義的詞作為檢索詞在全文檔案數據庫中進行查找,同時,全文檢索技術中所采用的同義詞表(如“計算機”與“電腦”同義;“中國”與“中華人民共和國”同義)以及自動切詞技術(如搜索“單體”,“簡單體系”則自動被排除)都可使用戶迅速檢索到此檔案館中用戶所需檔案。工作人員也可有更多精力,根據檔案價值大小,基于需求導向原則,實行分級開發策略,將更多有用檔案及時開發。
3、有助于拓展公共檔案館檔案信息服務形式及范圍,提高檔案服務質量
隨著現代聲像記錄技術的廣泛應用,現代公共檔案館館藏資源不斷豐富,館藏結構不斷優化。公共檔案館除收集紙質檔案,還收集圖片、音頻、視頻等多種形式的聲像檔案,進而保證某一事件的全面性和真實性。就目前全文檢索技術而言,不僅支持通過各類圖標制作軟件、音頻視頻制作軟件將圖片、聲音、視頻進行格式化處理,而又不改變圖像、聲音、視頻等本來面貌的多媒體數據庫建設,同時還能通過建立一套通用的標引方法將其檢索出來,充分保證所檢索的各類格式的檔案均為檔案原件(電子手段展示檔案最初原貌),進而滿足檔案用戶更高層次的個性化需求一一能提供關于某一事件或主題所有的圖片、聲音、視頻等檔案形式,而不僅僅只局限于文本型檔案。
另一方面,在與全文檢索技術相匹配的全文檔案數據庫的建設中,檔案服務人員已事先將館藏檔案都精心地著錄和標引成結構化的檔案信息,同時,對輸入的館藏檔案都設置相應的保密級別,不同檔案用戶對應不同的級別。因此,檔案用戶利用全文檢索技術時,在相應級別前提下,可獲得最為全面、廣泛和準確的檔案信息。這樣一來,既保證了檔案信息的安全性,也保證了檔案信息檢索的檢準率和檢全率,提高了檔案館檔案服務范圍。
各級各類公共檔案館在提供檔案信息服務時,既有多樣的檔案信息形式,又可獲得某一事件或某一主題的更為全面、廣泛的檔案信息,有助于提高公共檔案館檔案服務質量。
4、有助于延長公共檔案館館藏紙質檔案,特別是珍貴檔案和高齡檔案的壽命
傳統的檔案檢索最終都要深入庫房,調閱檔案原件(部分用仿制品取代),顯然多次查閱原件和復制原件會加快原始檔案的破損、污損,從檔案價值來看,這對于檔案價值的發揮顯然不利。在全宗檔案群中,“高齡檔案”和一些特別珍貴檔案一般都是孤本,一旦損毀,將不復存在。最大限度地延長這些“高齡檔案”和珍貴檔案的壽命,發揮檔案價值,是公共檔案館面臨的現實問題。全文檢索技術通過事先一次性電子掃描和識別技術將檔案數字化后導入全文數據庫。檔案信息檢索用戶需查找利用時,可直接通過計算機用戶端查找到檔案全文,在需要時通過在檢索設備上連接打印機即可得到所需檔案的復印件(為證明其真實性和可靠性,可由檔案館出具相關證明),在很大程度上減少了調閱檔案原件和復印檔案原件等行為,進而減少了因直接接觸對檔案原件所造成的損毀,有助于延長檔案壽命。
三、全文檢索技術運用于新型公共檔案館建設中面臨的問題
目前絕大多數公共檔案館對館藏檔案都已進行了數字化轉換并且隨著當前信息技術的快速發展,特別是數據庫技術、數據挖掘技術、輸入輸出技術等一系列技術的長足發展,又為全文檢索系統提供了技術支撐。有了上述保障條件,全文檢索技術在部分檔案館⑤的實施使用,取得了一定的積極效果。同時,使用全文檢索技術從理論上來講,也較為簡單,但是,當前全文檢索技術要在公共檔案館中得到普遍使用,還面臨著一系列問題:
1、全文檔案數據庫建設難度大
全文檢索技術的使用,全文檔案數據庫的建設是重中之重。隨著辦公自動化和信息技術的發展,電子文件增長迅速,各級各類公共檔案館傳統的紙質檔案數字化處理也形成了大量的數字化信息。但從筆者對一些省市檔案館的調研中發現,無論哪一級別的檔案館其館藏檔案均仍以紙質檔案為主。在仍以紙質檔案為主的公共檔案館,建立全文檔案數據庫,除需將館藏所有紙張檔案通過電子掃描轉化成數字化的圖像檔案、通過諸如OCR(OpticalCha racterRecognition)將數字化的圖像檔案再識別成特定的數據格式外,公共檔案館檔案工作人員還需對所有數字化檔案進行必要的著錄和標引,其工作任務量之大、對檔案工作人員的專業知識、技術水平要求之高以及對資金要求之多,已甚難完成。另外,公共檔案館其自身特性決定了它不同于其他公共職能機構,檔案館需保存諸如“高齡檔案”和比較陳舊的檔案,而這些原件大多破損、殘缺、污損;與此同時,檔案館保存的相當數量手寫檔案,因筆跡不一、筆體不同及書寫不規范,這些檔案的識別工作將更是一建設巨大難題。
前期建設的多數全文檔案數據庫,由于軟件功能設計不足、數據庫系統閾值限制等原因,或多或少遭遇數據庫“脹庫”問題。同時,新建設的全文檔案數據庫既要能滿足眼前需要,還需考慮到長遠發展需求。到底全文檔案數據庫采用何種標準建設,在公共檔案館館藏檔案數量,特別是電子文件數量呈現幾何級增長的時代,是擺在各級各類公共檔案館面前一個亟待解決的難題。
2、全文檢索技術并不適用于所有檔案信息資源
一方面,從檔案利用者的角度來講,檔案利用者關心的是檔案信息查找時的便捷、省時且并不復雜的利用程序。在公共檔案館檔案全宗群中有相當一部分檔案是以專題形式存在,其本身信息量并不大,對其進行簡單的著錄、標引,建立索引,就可方便地查找到這些專題檔案信息。而且近年來,各公共檔案館積極組織編研,其編研對象中主要就是一個個專題檔案,對那些經考證歷史價值高、用戶查找利用次數多的專題經過整合形成二次文獻、三次文獻,查找利用時較全文檢索技術而言,其實可能還更為方便,對這些專題檔案花費大量人力、物力用于前期投入工作建設全文檔案數據庫,從經濟學成本一效益角度來講,并不能實現檔案館有限資源的最優化利用。另一方面,由于檔案是一類特殊的信息資源,其保密性、安全性要求較高,各公共檔案館都有大量涉密檔案,因全文檔案數據庫包含檔案的全部信息,無論采用多么先進的檔案保密技術,在電子化環境下相對傳統紙質檔案而言,毋庸置疑更容易泄露,特別是對那些事關國家安危、民族存亡的絕密檔案,一旦泄露,后果將不堪設想。因此,對公共檔案館中有關保密性較高的檔案,從安全性角度考慮,也不宜采用全文檢索技術。
3、檔案用戶類型復雜多樣、層次參差不齊,檔案信息需求不一
在全文檔案數據庫下實現的全文檢索技術相對傳統檢索方式,其先進性、檢索的有效性不容懷疑。各級各類公共檔案館其檔案利用者(或檔案服務對象)不僅來自各行各業,檔案用戶類型復雜多樣且數量龐大。這些檔案用戶由于所從事職業、工作任務、檔案(信息)素養、語言(漢語、英語、檔案檢索語言、計算機語言等)能力的不同,會形成復雜多樣的個性化檔案信息需求,而且隨著時間的推移,這種個性化的檔案信息需求會越來越難滿足。因此,用相同的檢索方式去應付和滿足所有檔案用戶的檔案信息需求,特別是在當前我國公眾檔案意識逐步提高、檔案利用逐步便利的現實狀況下,全文檢索技術在各級各類公共檔案館中的普遍運用還將經歷一個較長的時間跨度。
最后,全文檢索技術在各級各類公共檔案館中的推廣應用必須依賴既有較高的檔案專業水平,又必須是懂數據庫技術、懂信息組織和信息檢索且具有較為長遠的戰略規劃和眼光的專門人才才能實現,而目前我國各級各類公共檔案館檔案人員隊伍中所呈現的檔案管理人員數量不多、專業化程度較低以及復合型人才缺乏等并未從根本上徹底改變。因此,專業人才隊伍匱乏也是制約全文檢索技術在各級各類檔案館有效開展運用的問題之一。
四、加快推進全文檢索技術在我國新型公共檔案館應用的幾條建議
全文檢索技術全面應用于我國新型公共檔案館,從總的來講,就是要構建一個基于全文檢索技術支撐的軟件管理平臺,這一管理平臺包含全文檔案數據庫和檔案利用服務系統兩部分,其中全文檔案數據庫是關鍵和核心,檔案利用服務系統是檔案館對外提供全文檢索的前端服務窗口。
1、做好頂層設計,統籌兼顧。也即對該項工程“整體理念”的具體化,從公共檔案館館網總體建設狀況和各級各類公共檔案館實際情況,有計劃、分層次、分階段逐步推進開展,制定相關的標準規范,通過在不同層級公共檔案館中構建具有兼容性的軟件管理平臺以及通過先小范圍內試驗,后推廣,樹示范典型等方法,加快推進全文檢索技術在我國新型公共檔案館的普及應用。做好頂層設計,也即意味著在具體實施前,經過科學論證,不盲目倉促上馬,統籌兼顧現有資源,既考慮到眼前需要,也兼顧到長遠發展需要。
2、建立配套的實施保障體系。為確保推進全文檢索技術在我國新型公共檔案館的應用,除需具有國家層面穩定的政策支持,還需相應的技術和非技術方面保障。因此,一方面要出臺相應政策,為全文檢索技術在我國新型公共檔案館的積極推進,提供好的政策環境;另一方面,要使得全文檢索技術和相關的配套應用技術不斷成熟。管理平臺建設、保障檢全和檢準的自動切詞方案、保障檔案信息的安全策略等均需有相應成熟技術才能予以保障。與此同時,檔案館需及早轉變服務理念,檔案館工作人員要快速實現角色轉換,除此之外,還需建立便于該項工作積極開展的組織管理體制(即通過一定的管理方式實現管理資源的最合理分配,各檔案館在我國集中制管理體制下,立足檔案館實際,實現與之相對應的管理模式,充分發揮該種管理模式的作用,以變應變),通過合理的制度設定來約束、督促各類人員,通過引進、培訓、深造、交換等多種方式使得檔案館人才結構合理化以及通過多種渠道積極籌資,確保經費所需。最后,檔案館要積極營造良好的工作氛圍,確保檔案館工作人員心情愉悅便于溝通交流。
3、將其納入考核指標體系中。當代公共檔案館的性質已經從單純的科學文化事業機構轉變成集科學文化和信息服務于一體的機構,這也就決定了當代公共檔案館是建設服務型政府的重要部分,公共檔案館是政府對外開展信息服務的一個重要窗口,直接關系到政府形象和為民眾提供服務的水平。全文檢索技術作為目前最先進、有效的信息檢索技術,很大程度上能夠為公眾提供一個便捷的信息獲取通道。因此,應將其納入相應的考核指標體系中,進而保障和加速推進全文檢索技術在我國新型公共館的應用。一方面,在政府對公共檔案館進行日常和年度考核時將其作為考核指標之一且占據相當大的權重,并且將其考核結果作為下一年度對公共檔案館各種資源分配(人員編制、撥款額等)的重要參考;另一方面,在對公共檔案館檔案工作人員的日常和年度考核時,也將其作為重要考核指標,將其考核結果作為個人晉升、培訓、物質獎勵等的參考依據,最大限度的發揮檔案工作人員的參與性、能動性和創造性。