檔案文獻檢索策略的構造及其實現是一個比較復雜的過程、由于用戶的檢索需求具有較大的隨機性以及檢索者對用戶需求的分析和表達也往往因人而異,再加上檢索系統本身功能上的不完備等多種原因,因而在構造檢索策略的過程中必然會存在著一些產生檢索失誤的潛在根源,使檢索者無法完成既定的檢索目標或出現一定的檢索偏差。只有通過正確分析失誤的原因,采用各種反饋途徑和調節方法對檢索策略進行修改、完善和調整,才能最終實現有效檢索,提高檢索效率,達到既定的檢索目標。
一、檢索策略的動態過程及反饋模式
在計算機檢索的條件下,由于用戶的提問需求與文獻標識之間的對比匹配是由計算機完成的,機器不具備人腦那樣隨機應變的思維活動,而是嚴格地執行人們事先編好的程序。因此,在構造檢索策略時,需要對各方面問題作出周到、全面的考慮,對可能影響檢索策略實施的因素作出事先的安排和處理,并納入檢索策略的運行過程之中。通過設計的反饋模式使檢索策略明確化、形式化并固定化,以便盡可能減少檢索失誤的潛在根源和人為的決策失誤。
一般來說,在設計檢索策略的反饋模式時應考慮到以下幾個方面的因素:
(1)用戶的提問需求是否被準確地進行了主題分析;(2)所選數據庫是否恰當;(3)所選檢索送行是否恰當;(4)提問的概念組面是否被轉換成了一組合適的檢索詞或分類號等檢索項;(5)檢索項的邏輯組配是否正確與完善,即檢索表達式的網羅度與專指度是否恰當;(6)是否考慮了檢索項的構成條件和原則;(7)所選擇的關于檢索結果的輸出格式內容是否滿足用戶的相定性判斷;(8)是否充分利用了各種反饋途徑與調節方法;(9)是否有目的、有針對性地進行了檢索效果的評價分析。
總之,通過充分利用各種交互途徑和反饋信息,盡可能地疏通反饋渠道,使整個檢索過程成為一個不斷進行動態平衡的流通回路,使檢索狀態的過去、現在與將來緊密相關,并將檢索過程中的動態變化以及由反饋調節所引起的檢索效應都盡可能地納入系統的控制之下,從而使檢索目標與檢索效果之間的距離逐步縮小,使檢出的結果與用戶的提問需求趨向一致。
二、檢索策略的調節方法
影響檢索策略構造優劣的因素有很多,但由于用戶提供的提問需求以及他們可能利用的計算機檢索系統的客觀條件各不相同,這樣,對于某—特定的利用提問需求,檢索者可能選擇不同的檢索途徑和檢索項,并由此構造出不同的檢索表達式。這是構造檢索策略的關鍵。因此,當用戶對檢出結果不滿意時,應隨時進行分析比較,主要通過適當調節檢索表達式中的泛指詞、專指詞和相關詞之間的數量比例及邏輯組配關系,以達到要求的查全率和查準率的比例來改善檢索效果。而其中查全率和查樁率是目前報述檢索結果的最好、最常用的指標,也是衡量檢索策略優劣的根本標準。因此,對于檢索策略調整的重點也應放在通過調節查全率和查準率的比例關系以改善檢索效率,使用戶獲得滿意的檢索結果。
檢索策略中影響查全率和查準率的因素很多,但主要都包含在檢索系統的收錄范圍、檢索語言、標引和檢索等方面。所有這些因素又可以概括為人為因素和客觀因素兩類。
(1)人為因素的影響。在編制檔案檢索工具時,由于收錄的檔案文獻不全面、不明確和在標引時人為造成的各種錯誤,使人們在從事文獻的存貯和檢索過程中自覺或不自覺地造成查全率和查準率的下降,這些因素被稱為是“不合理影響因素”。
(2)客觀因素。在檔案文獻檢索中,無論怎樣調整檢索策略,無論怎樣改進檢索工具的質量,要同時實現查全率和查準率的100%是不可能的。因為它們之間存在著反變關系,也就是說,在排除了人為因素影響的前提下,提出了查全率往往就會相對地降低查準率,反之亦然。具體來講,檢索時不能全面描述檢索要求;檢索策略過于簡單;檢索表達式中使用邏輯與太多,或者不適當地使用了邏輯非;數據庫(或檢索工具)選擇不當;檢索途徑和檢索方法過少等,都會造成查全率的下降。而使用不適當的檢索詞;檢索系統不具備邏輯非功能和反饋功能,邏輯或使用不當;檢索表達式中允許容納的詞數量有限;截詞部位不當等則會造成查準率的下降。
(一)調節檢索策略中提高查全率的主要方法
要提高查全率,主要應從擴大檢索范圍入手。常用下列調節檢索策略的方法:
(1)降低檢索的專指度。可以從詞表中或檢出的文獻中選—些相關詞補充到檢索表達式中去,即增加用邏輯連接的相關檢索向;或者,去掉一些用邏輯與(AND)連接的非主題限定詞,這樣對于提高查全率的效果一般比較直觀明顯。
(2)刪除檢索式的某個概念組面。這樣,就可以通過降低檢索表達式的網羅度而擴大檢索策略的范圍,以達到提高查全率的目的;但同時可能檢出一些與用戶提問需求無關的文獻,從而降低了查準率。
(二)調節檢索策略中提高查準率的主要方法
大多數檢索課題的特點是高專指度的,而不是泛義的,對檔案文獻檢索而言,尤其如此。專指度的內容多數情況下是由各方面的因素彼此制約而成的,為了提高檢索課題的查準率,在有一定查全率的基礎上再進行縮檢,可以主要利用調節檢索策略的方法。
以上說明了調整檔案文獻檢索策略所用的各種方法及其對查全率和查準率的影響。由此可見,檢索策略的構造過程,實際上就是一個通過各種反饋與調節的方法不斷地消除檢索行為的模糊性與隨機性的動態的決策過程。檢索策略與用戶的提問需求以及檢索結果之間所存在的差異,通過反饋形式傳遞到檢索系統,使檢索者和用戶根據具體情況分析失誤原因,分別采用各種相應的反饋途徑和調節方法,及時改變檢索策略的方向、強度和內容,最終使檢出結果與用戶的文獻需求趨向一致。
(作者單位:齊齊哈爾市碾子山區審計局)