武漢科技大學圖書館 張旭幫
盡管因特網技術發展迅速,人們可免費從網上獲取的信息不斷豐富,但就其信息資源的系統性、完整性、可靠性而言,還是難以與大型的商業化聯機檢索系統相匹敵。聯機檢索,是指檢索者利用終端設備,通過遠程通信線路或網絡,使用一些特定指令和檢索提問式,并采用“人—機對話”的方式,對聯機檢索系統的幾個或幾十個數據庫同時進行搜索的過程。
美國DIALOG系統是當今世界規模最大的國際聯機檢索系統,也是運作最為成功的商業化聯機數據庫系統。其信息容量大、數據質量高、文獻類型齊全、資料來源可靠、更新速度快、專業面廣,基本上包括了所有學科領域。它以功能強大的檢索軟件為支撐,其檢索算符、檢索途徑眾多,查詢搜索方便靈活、快捷簡便,更兼有數據庫總索引瀏覽、聯機詞典輔助檢索等別具特色的功能;具有其他網絡數據庫系統無可比擬的技術、資源優勢。在實際利用中,只要使用者的檢索策略得當,一般都能達到較高的查準率和查全率,獲得滿意的效果。
因此,多年來DIALOG系統一直是我國科技查新工作中的主要檢索工具,同時也是國內科技、經濟信息檢索服務中利用率最高的國際聯機檢索系統。在進行國際聯機檢索時,一般可采取下列幾個步驟:
國際聯機檢索前最好先對相應的檢索刊物進行手工試檢,或利用因特網搜索相關信息,了解專業文獻分布情況,初步估算文獻量,以便確定相應的聯機檢索方案;手檢(或因特網搜索)摸底有助于準確地掌握專業用詞,以提高下一步檢索的準確性。有時通過試檢發現,手工檢索或因特網搜索也能滿足信息需求,這時放棄國際聯機檢索,便可節省不少的費用。
這是一個分析課題內容,確定主題概念,選擇檢索詞,構造提問式的過程。但要注意的是,在國際聯機檢索時,我們常用的是一些英文數據庫,因此不要想當然地使用一些“中式英語”的信息提問。現以“國外教育管理現代化” 的檢索為例:當今發達國家的教育管理本身就包含有現代化管理的內容,如用“現代化”這個概念去搜索,既顯得多余,同時也不符合人家的表述習慣。
選擇數據庫一般有這幾種方式:①利用數據庫一覽表或數據庫簡介資料來選擇;②參考與數據庫對應的檢索刊物(如“化學文摘”、“工程索引”、“科學文摘”……等等)進行選擇;③利用檢索系統的索引文檔篩選。例如,在檢索中,若選用的數據庫較多,這時可先利用DIALOG系統的411索引文檔進行預檢掃描,以顯示各數據庫的檢索效果,便可確定合適的數據庫。
各種國際聯機檢索提問單均大同小異,一般有:課題名稱、內容簡介、檢索詞、檢索邏輯式、數據庫……等等。可按順序依次填寫。但對“輸出要求”項,應注意以下幾點:①國際聯機檢索通常采用脫機打印,以減少聯機費。②一般情況下,聯機檢索中直接指定輸出文獻數量的方式通常要比限定年代輸出的方式簡便,這既節省機時,又能合理地控制文獻量,其效果較好。
確定了檢索策略,再填寫好檢索提問單,交給聯機檢索操作人員,便可以檢索了。
由于國際聯機檢索費用較高,因此,在動手檢索前,應針對聯機檢索過程中可能出現的各種情況(如:命中文獻量太多或太少、檢索結果為零、不相關文獻居多等),準備幾套備用方案,以便隨時根據終端屏幕顯示的情況,及時、有效地進行調節、修正,不斷完善檢索策略,力爭以最短的時間、最少的花費,獲得最佳的檢索效果。
對檢索結果進行分析、研究,總結經驗;并根據篩選出的切題文獻記錄的出處索取原文。
計算機檢索的效果,既是廣大信息用戶的利益所在,也是專業檢索人員密切關注的問題,它還直接影響著檢索系統在信息市場上的競爭能力。通過評價數據庫系統的檢索質量,研究影響檢索效果的各種因素,將有助于我們在計算機信息檢索的實踐中提高檢索質量,改善檢索效果。
衡量檢索效果主要有兩個標準:查全率和查準率。查全率是指檢出的相關文獻量與數據庫中相關文獻總量的比率,它反映了相關文獻被檢出的程度。
查全率=[檢出相關文獻量/數據庫內相關文獻總量]×100%
查準率是指檢出的相關文獻量與檢出文獻總量的比率,它反映系統拒絕非相關文獻的能力。
查準率=[檢出相關文獻量/檢出文獻總量]×100%
英國學者在分析、研究了大量的有關數據后,提出查全率和查準率之間存在著一種“互逆相關”的規律。也就是說,為了提高查全率而放寬檢索范圍,往往使查準率下降;要想提高查準率而縮小檢索范圍,則常使查全率降低。在實際中,偶爾也會出現查全率和查準率同時達到很高的值,但這只是極個別的情況。而查全率和查準率之間互相制約的現象卻是普遍存在。
由于高查全率和高查準率難以同時獲得,因此在確定檢索目標時,應對檢索結果的查全率和查準率有所考慮。如果能事先明確優先保證查全率或查準率,將有助于制定相應的檢索策略,取得檢索過程中的主動權。對于工礦企業從事應用研究和工藝流程設計的用戶,他們往往只要求檢索的結果能解決他們的實際問題,不一定需要很多文獻,而要求較高的查準率。對于一些從事基礎理論研究或為申請專利而“查新”的用戶,他們往往需要全面、系統地收集某一主題范圍的資料,因此對查全率要求較高。不同的用戶,根據從事工作的性質不同,以及研究階段的不同,對查全率和查準率將有所側重。在一般的情況下,不必過分地求全求準,以免造成顧此失彼的結果。
計算機檢索的效果取決于許多因素,如標引質量、系統功能、數據庫結構及檢索策略等。標引的深度是指標引一篇文獻所用的標識數量,標引深度越大,則提供的檢索標識就越多,所標引的文獻被檢出的概率就越大,查全率也就越高。然而,過度的標引又會引起誤差,影響查準率。因此,標引深度即不宜過淺,也不能過度,問題的關鍵就是如何才能做到適度標引。合理的標引必須遵循這樣的原則:正確地選擇標識,準確地表達文獻的主題概念;全面地揭示主題內容,不遺漏有價值的信息;進行合理的取舍,不過量標引;保持標引的前后一致性。要達到這些標準是很困難的;在實際中,標引的質量主要取決于詞表(主題詞表、標題詞表和分類表等)的質量和標引人員的專業知識、工作經驗以及對檢索語言的掌握程度等。
一般來說,受過一定機檢訓練的用戶,常常能夠保證檢索的質量。因為各專業人員熟悉自己所研究的學科領域,檢索目的明確;在掌握了必要的機檢知識和方法后,就能夠制定較為合理的檢索策略,并能在反饋調節中作出準確地判斷,從而獲得滿意的檢索效果。要達到這一步,還有待于在各專業人員中廣泛地普及計算機信息檢索知識;同時也應在高校文獻檢索教學中進一步地充實、完善機檢的內容,使大學生、研究生掌握一定的檢索技能,以便在今后工作中能夠有效地利用計算機檢索這一現代化的信息手段,快速、準確、全面地獲得相關信息,緊跟世界科技發展的新形勢。
國際聯機檢索系統擁有龐大的信息資源,所涉及的內容包羅萬象,十分豐富。可以說人類從來沒有像今天這樣可以方便地獲取各類的信息。在當今信息量極大、通信業極為發達的時代,掌握信息更加重要。面對如此巨大的信息海洋,如果不掌握獲取信息的方法和技巧,只能是望洋興嘆!因此,掌握網絡信息檢索技能,及時準確、全面獲取信息,提高鑒別、選擇與利用文獻信息的能力,有利于消化新信息,吸收所需的專門知識,從而更好地從事科研和各種管理活動,快速獲取成功。
[1]蔣瑤.淺談關于網絡信息檢索的認識.大眾文藝:學術版,2010(9).