劉蓓++任亞波
摘 要:隨著網絡化和數字化的快速發展,人們對信息的需求已成為生活中不可或缺的一部分,但如何從這繁雜、龐大的資源庫中快速搜索和提取對自己有價值的信息就成為廣大用戶必須面臨的問題,而信息檢索成為解決這一問題的關鍵。因此,該文主要圍繞信息檢索展開討論,選擇以立體印刷技術論文的撰寫為例,從課題分析、檢索工具的選擇、檢索關鍵詞的確定、檢索過程及結果輸出、分析、提煉等方面對文獻信息檢索技術及其應用進行詳細介紹。
關鍵詞:信息檢索 信息分析 信息提煉 立體印刷
中圖分類號:TM63 文獻標識碼:A 文章編號:1674-098X(2016)09(c)-0100-02
在新的生活環境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,為正確決策提供參考。一方面,人們可以利用網絡方便、自由、快捷的發布、查詢信息;但另一個方面,由于網絡環境的開放性,信息更新的快速性,使得信息資源出現分散、異構、無序的特性,極不利于人們有效開發和利用這些資源。面對信息急劇增長、技術不斷更新的新局面,需要我們對信息檢索技術進行深入的研究,從而提高網絡信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。
1 信息檢索概述
信息檢索是將信息按一定的方式組織起來,并根據信息用戶提交的查詢條件檢索出相關文檔的過程和技術。信息檢索涉及數據庫技術、圖書和情報科學、人工智能、自然語言處理、機器學習等眾多知識和學科領域[1]。信息檢索作為一門學科,主要研究信息的獲取、表示、存儲、組織和訪問。
1.1 信息檢索的意義
信息檢索是對信息進行集中表示、存儲、組織加工、統一管理,使用戶更容易得到所需要的信息,進而對信息進行加工,根據分析得出新的思路和方法,實現信息激活和增值。有效的信息檢索可以節省科技人員的時間,提高工作效率;幫助人們進行知識更新;繼承和借鑒前人勞動成果,促進科技的快速發展;協助管理者做出正確的決策。
1.2 信息檢索的四要素
信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們借助信息系統獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎,如專著、期刊、報告、學位論文、會議記錄、專利、標準、統計數據、政府出版物、檔案文獻信息等;信息獲取能力是信息檢索的核心,是指人們對信息的了解、查找、整理加工;信息利用是信息檢索的關鍵,即對信息進行有效的加工和利用。
1.3 檢索語言及方法
檢索語言是為溝通文獻標引與文獻檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進行檢索的標識,按學科性質進行系統排列,包括主題、科學、圖書和專利分類語言;主題語言是直接以表達文獻主題的詞語作為檢索標識,包括關鍵詞、標題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特征用代碼系統來標引和排列的檢索語言,例如,分子式索引系統;自然語言是指未經規范化處理的檢索語言。
信息檢索包括手工和計算機檢索,常用的檢索方法有拉網法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸為兩大類:一類是用信息的外部特征,如責任者、題名、某種序號、機構名等作為檢索標識;另一類是用描述信息內容的分類號、關鍵詞、主題詞等作為檢索標識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標文獻時,要利用高級檢索方式設置一些查詢條件,如查詢范圍、時間、方式(模糊和精確)、字段邏輯關系的編輯等。
2 信息檢索流程
信息檢索過程可分為以下步驟:課題的確定——選擇合適的數據庫——初步擬定檢索式檢索——調整檢索策略(考慮準確性)——命中結果分析——批量下載——信息分析。下面以立體印刷技術的相關資料的搜集為例介紹信息檢索過程。
2.1 檢索工具選擇
對于日常信息的搜索,通常采用百度、谷歌等網站,但對于專業文獻的檢索則需要專門的數據庫,每個數據庫都有自己的特點。
(1)館藏書目查詢:書目是將圖書、期刊按一定規則收錄,并有序編排的檢索工具。通常包含題名、責任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數高校圖書館都有自己的館藏書目數據庫,檢索、下載。
(2)中國學術期刊全文數據庫:目前世界上最大且連續動態更新的數據庫,內容覆蓋工程技術、自然科學、農業、哲在新的生活環境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,為正確決策提供參考。一方面,人們可以利用網絡方便、自由、快捷的發布、查詢信息;但另一個方面,由于網絡環境的開放性,信息更新的快速性,使得信息資源出現分散、異構、無序的特性,極不利于人們有效開發和利用這些資源。面對信息急劇增長、技術不斷更新的新局面,需要我們對信息檢索技術進行深入的研究,從而提高網絡信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。
1 信息檢索概述
信息檢索是將信息按一定的方式組織起來,并根據信息用戶提交的查詢條件檢索出相關文檔的過程和技術。信息檢索涉及數據庫技術、圖書和情報科學、人工智能、自然語言處理、機器學習等眾多知識和學科領域[1]。信息檢索作為一門學科,主要研究信息的獲取、表示、存儲、組織和訪問。
1.1 信息檢索的意義
信息檢索是對信息進行集中表示、存儲、組織加工、統一管理,使用戶更容易得到所需要的信息,進而對信息進行加工,根據分析得出新的思路和方法,實現信息激活和增值。有效的信息檢索可以節省科技人員的時間,提高工作效率;幫助人們進行知識更新;繼承和借鑒前人勞動成果,促進科技的快速發展;協助管理者做出正確的決策。
1.2 信息檢索的四要素
信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們借助信息系統獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎,如專著、期刊、報告、學位論文、會議記錄、專利、標準、統計數據、政府出版物、檔案文獻信息等;信息獲取能力是信息檢索的核心,是指人們對信息的了解、查找、整理加工;信息利用是信息檢索的關鍵,即對信息進行有效的加工和利用。
1.3 檢索語言及方法
檢索語言是為溝通文獻標引與文獻檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進行檢索的標識,按學科性質進行系統排列,包括主題、科學、圖書和專利分類語言;主題語言是直接以表達文獻主題的詞語作為檢索標識,包括關鍵詞、標題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特征用代碼系統來標引和排列的檢索語言,例如,分子式索引系統;自然語言是指未經規范化處理的檢索語言。
信息檢索包括手工和計算機檢索,常用的檢索方法有拉網法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸為兩大類:一類是用信息的外部特征,如責任者、題名、某種序號、機構名等作為檢索標識;另一類是用描述信息內容的分類號、關鍵詞、主題詞等作為檢索標識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標文獻時,要利用高級檢索方式設置一些查詢條件,如查詢范圍、時間、方式(模糊和精確)、字段邏輯關系的編輯等。
2 信息檢索流程
信息檢索過程可分為以下步驟:課題的確定——選擇合適的數據庫——初步擬定檢索式檢索——調整檢索策略(考慮準確性)——命中結果分析——批量下載——信息分析。下面以立體印刷技術的相關資料的搜集為例介紹信息檢索過程。
2.1 檢索工具選擇
對于日常信息的搜索,通常采用百度、谷歌等網站,但對于專業文獻的檢索則需要專門的數據庫,每個數據庫都有自己的特點。
(1)館藏書目查詢:書目是將圖書、期刊按一定規則收錄,并有序編排的檢索工具。通常包含題名、責任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數高校圖書館都有自己的館藏書目數據庫,檢索、下載。
(2)中國學術期刊全文數據庫:目前世界上最大且連續動態更新的數據庫,內容覆蓋工程技術、自然科學、農業、哲學、醫學、人文社會科學等各個領域??蛇M行高級、專業、跨庫檢索以及期刊導航。
(3)中國優秀博碩士論文數據庫:目前國內相關資源最完備、連續動態更新的高質量學位論文數據庫,包含理工、農業、醫藥、文史哲、法律、教育與社會科學、電子與信息科學、經濟以及專題文獻等。
(4)外文文摘數據庫:既包含單學科數據庫,如CA(化學)、PA(石油)、Georef、Medline等,又包含多學科綜合數據庫,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。對于國際化的今天,外文檢索已成為每個考研人員必備的技能。
(5)其他數據庫:Google學術中文和外文搜索、萬方、維普、知網、專利檢索系統以及標準文獻檢索數據庫等。數據庫文件普遍采用CAJ和PDF格式,須下載專門的瀏覽器來閱讀。
2.2 檢索詞確定
確定中文檢索詞:設置與論文名字相關的檢索詞進行檢索,如,立體印刷、3D印刷、立體圖像、立體印刷品;確定英文檢索詞:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image
2.3 檢索過程及結果分析
利用以上介紹的檢索方式以及各個數據庫的特點,選用中國知網、Google學術、碩博士論文數據庫、EI和專利網,結合設定的檢索詞進行文獻檢索,該文例子主要圍繞圖書、期刊、碩博士論文和專利來搜索。為了便于對文獻的管理、引文編排,論文寫作采用EndNote插件建立分類文獻庫。在搜索文獻時注意盡可能將時間設定在近5年內,學位論文搜索優先,這樣對研究對象的背景、現狀首先有大概的了解;其次進行大量其它文獻的檢索,可以參考論文后的參考文獻、某個領域的專家或數據庫連接到的相似文獻等來擴展檢索。無論對于中文還是外文的搜索,不能盲目下載,必須注意文章摘要與目標對象是否有關,否則會加大有用文章篩選的工作量。
檢索到的文章由于存在相似性,一定要做好分類,方便快速查找??偟膩砜戳Ⅲw印刷技術相關文獻主要涉及人眼視覺理論、光柵成像、立體圖像制作、光柵材料及使用、立體印刷產品質量評價和市場分析、立體印刷工藝研究以及相關設備制造等。通過以上文章的搜索我們可以對立體印刷有大致的了解,對于寫綜述性的論文可以按照以上點來設置章節標題,如果要進行某一點的深入研究,需要認真研讀,將文章的各個點吃透,或進一步查閱相關資料??傊?,文獻檢索不能盲目,初步檢索分析后,再次具有針對性性的進行檢索。
3 結語
該文圍繞信息檢索技術展開討論,首先,簡單的介紹了信息檢索的含義、目的、意義、檢索要素和方法等,讓大家對此有直觀的認識。其次,結合立體印刷技術綜述報告的例子,詳細的闡述了文獻的查找渠道、提煉、分析和總結過程,對以后工作和學習中有效的進行信息檢索具有一定的參考價值。
參考文獻
[1] 劉雙魁.信息檢索與利用[M].上海:東南大學出版社,2010:8.
[2] 祁延莉.信息檢索概論[M].北京:北京大學出版社,2013:7.
[3] 張金松.基于引文上下文分析的文獻檢索技術研究[D].大連:大連海事大學,2013:4.