開封市科技情報研究所 唐繼嶺
網絡環境下開展科技文獻檢索的有效途徑
開封市科技情報研究所 唐繼嶺
在科研立項、申報科技成果獎勵、科技成果鑒定、專利申請、技術咨詢等工作開展之前,都要進行文獻信息檢索。所謂文獻信息檢索,就是通過一定的技術手段從文獻信息源中查找所需特定文獻信息的過程。隨著計算機技術和互聯網的飛速發展,傳統的以紙質印刷為載體的科技文獻信息的傳播方式遇到了嚴峻的挑戰,互聯網成為人們取之不盡、用之不竭、常用常新的萬能工具,并為科技人員全方位地獲取科技文獻信息提供了新的信息服務平臺。科技人員通過利用網絡或數據庫資源可以方便、快捷地采集到自己所需的信息,避免了繁瑣的紙質檢索工作的翻閱、查找,大大提高了檢索效率,節省了檢索時間。據統計,目前全世界僅專利文獻存儲量就超過4000萬件,每年公開的專利文獻多達100萬件。科技人員要想在浩如煙海的網絡信息資源中快速準確地獲取所需要的文獻信息就必須掌握一些科技文獻檢索技巧。
科技人員可以通過利用搜索引擎和專業數據庫檢索兩種方式獲取網絡文獻信息資源。
1.搜索引擎檢索方式。搜索引擎是一種幫助用戶查詢信息的搜索工具。它以一定的策略在因特網中搜集、發現信息,對信息進行理解、提取、組織和處理,并為用戶提供檢索服務,從而起到信息導航的目的。網上中文搜索引擎不同于數據庫檢索,在檢索科技文獻時的準確性、功能完備性以及信息網絡度等方面均存在較大差異,只能作為檢索的輔助工具。通用搜索引擎是指一些以站點存在,提供網址、網頁文章及綜合性服務的檢索引擎。常用搜索引擎主要有谷歌、百度、搜狗、雅虎等。每種搜索引擎都有不同的特點。只有選擇合適的搜索工具才能得到最佳的結果。
現行的搜索引擎一般提供兩種查詢方式,即簡單查詢和高級檢索。簡單查詢是根據輸入的關鍵詞或短語不加限制地進行查詢,這樣得到的結果是檢索到的相關文獻題錄非常齊全,但不一定十分準確。高級檢索就是根據給出的一些搜索引擎支持的檢索條件,來檢索符合條件的文獻信息,這樣的檢索一般很準確。通過搜索引擎獲取文獻信息存在的主要問題是:由于因特網上的信息資源分散無序且缺乏深度、查準率低和檢索精度不高,使網絡檢索的系統性和完整性不如聯機檢索。
2.數據庫檢索方式。近年來,全文數據庫和電子期刊在聯機檢索數據庫中所占比例迅速增大。通過國內外知名的文獻數據庫檢索可以查詢到更詳細和更權威的文獻數據信息。數據庫檢索包括3種檢索方式,即傳統檢索(初級檢索)、高級檢索(復合檢索)和專業檢索。傳統檢索是老用戶習慣的檢索方式,使用簡單,但查準率低。高級檢索是多種檢索條件任意組合的限制性檢索,文獻命中率高。專業檢索主要是分類檢索。我們平時使用最多的是傳統檢索和高級檢索。
利用專業數據庫進行文獻檢索,一般要經過以下幾個步驟:分析檢索課題,選擇檢索系統及數據庫,確定檢索途徑,構建檢索提問式,上機實踐和輸出檢索結果。
1.分析研究檢索課題。在文獻檢索之前,要對所需檢索的項目課題認真加以分析研究。分析研究課題是檢索的準備階段,是選擇數據庫和確定檢索策略的基礎,直接影響檢索效率。通過對課題的分析研究,明確課題所涉及的主要內容和相關內容及所需的文獻類型、語種、時間等。全面了解課題的內容以及用戶對檢索的各種要求,有助于選擇檢索系統及數據庫,制定合理的檢索策略,充分地了解某一專業學科的發展動態和趨勢,通曉其在國內外的總體發展概況,掌握該學科研究的前沿動態和課題進展,做到心中有數,有的放矢。這將對文獻信息檢索的后續準備工作大有益處。
2.科技文獻信息源的確定。科技人員在進行文獻檢索之前應根據對檢索課題的分析研究確定好文獻信息源。文獻信息源是指以紙質為載體的傳統科技文獻資料和以電子為載體的電子文獻資源。目前,電子文獻資源已成為科技人員獲取科技文獻信息的主要途徑,傳統的紙質文獻載體只是作為輔助工具。電子文獻資源有公開的因特網信息資源和專業數據庫資源等文獻信息資源。數據庫資源既有綜合性的,也有專業性的,它們在文獻收錄的覆蓋面、文獻信息標引質量和提供的檢索功能上有很大的差異,如果選擇不當,直接影響檢索效果。因此,應根據選題的具體要求選擇相應的數據庫。目前,我國應用的全文數據庫主要有:清華同方中國學術期刊全文數據庫、博碩士研究生優秀論文全文數據庫、重要報紙全文數據庫、萬方全文數據庫、重慶維普中文科技期刊全文數據庫、人大報刊全文數據庫、超星電子書提供的全文數據庫等。一般情況下,理科文獻檢索首選清華同方和萬方中國學術期刊全文數據庫、博碩士研究生優秀論文全文數據庫及重慶維普中文科技期刊全文數據庫。文科文獻檢索首選人大報刊全文數據庫等。
3.正確確定檢索標志,選擇恰當的檢索路徑。檢索標志是指能表達檢索課題主題概念和信息需求的名詞術語、分類號、名稱及代碼等的總稱,包括主題詞、關鍵詞、著者名稱、題目、分類號、分子式、專利號等。要根據檢索課題特征選擇最能描述檢索主體的檢索詞等檢索標志。根據選定的檢索詞,選擇恰當的檢索路徑進行檢索。比較常見的檢索途徑有以下幾個。
(1)著者途徑。是指通過已知著者名稱來查找文獻,包括“個人著者索引”、“集體作者索引”。
(2)主題途徑。是指利用能表達文獻內容的主題詞來檢索文獻,包括主題索引、關鍵詞索引等,這些索引都是按字母順序編排。
(3)號碼途徑。是指通過已知號碼查找文獻,包括報告號、專利號、標準號等,通常按縮寫字母順序加號碼次序排列。
(4)分類途徑。是指按照文獻所屬的學科類別檢索文獻,主要是利用分類號來進行檢索。檢索工具收錄的文獻都是按照一定分類系統進行編排的,同類內容的文獻處于同一類名之下,但查出的文獻涉及面寬、針對性不強,因而還需要進一步篩選。
(5)其他途徑。指使用分子式索引、藥物名稱索引等來查找文獻。這些索引通常只附在與之有關的某些檢索工具中。在檢索時,既要掌握相應的學科知識,也要了解其特定的編排方法。
4.構建檢索提問式。使用同一檢索式可以一次性地將上百個數據庫的有關文獻檢索出來。檢索提問式是文獻檢索中用來表達用戶檢索提問的邏輯表達式,由檢索詞和各種布爾邏輯算符、截詞符以及規定的其他組配連接符號組成,檢索提問式構建得是否合理,將直接影響查全率和查準率的高低。構建檢索提問式時,在多個關鍵詞之間正確運用邏輯組配運算符“與”(and)、“或”(or)、“非”(not)等邏輯關系詞語進行組配和限定,可以準確地獲取所需要的文獻信息。
5.一次文獻的獲取。依上述檢索途徑和檢索方式通過登錄相關專業文獻數據庫檢索到一次文獻后,按照頁面提示操作即可進行網上文獻閱覽或原文復制下載。
綜上,檢索技巧的運用,在文獻檢索中有著非常重要的作用。只要經過不斷的檢索實踐,就能逐漸掌握并靈活運用檢索技巧和規則,并最終得到查全率、查準率都比較理想的檢索結果。一般地說,在不了解網絡或是不知何種工具能夠檢索到所需信息的情況下,可以選擇搜索引擎;如果需要了解某專業最新信息,可登錄專業網站進行瀏覽;如果要查詢某一篇論文或某專題資料的全文,則需通過有關文獻數據庫進行檢索;如果既要保證信息檢索高效又要查全查準,則綜合利用文獻數據庫、搜索引擎和專業網站3種途徑開展檢索效果較好;如果是將手檢和機檢相結合來檢索,會得到更滿意的檢索結果。智能化信息整合優化技術的采用,使得利用計算機檢索文獻的功能越來越強,而檢索技巧越來越簡單化,科技人員將會更便捷地檢索到所需文獻信息。