關(guān)鍵詞:網(wǎng)絡(luò)信息檢索;檢索工具;發(fā)展趨勢(shì)
摘 要:論述了信息檢索的概念、類型、意義、主要方式、原理以及網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)。
中圖分類號(hào):G252.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2011)01-0007-03
Research based on Information Retrieval and Development Trends
Wang Xiao-bo
(Library of Scientific and technological institute of Heilongjiang, HeilongjiangHarbin150027,China)
Key words:Web Information Retrieval; Retrieval Tools; DevelopmentTrend
Abstract:This paper discusses the concept of information retrieval, type, meaning, the main method, principle and the development trend of Web information retrieval.
1 信息檢索的產(chǎn)生和概念
從眾多的信息中查找出符合特定需要的文獻(xiàn),或某一問題的答案(數(shù)據(jù)、事實(shí)經(jīng)過或結(jié)論等),這樣一個(gè)查找過程,通常被稱為信息檢索。雖然這種查找行為很早就萌芽于圖書館的參考工作之中,但信息檢索的概念直到本世紀(jì)五十年代以后才產(chǎn)生。它是現(xiàn)代記錄下來的知識(shí)急劇增長(zhǎng)而需要給以合理的存儲(chǔ),人們查尋的著眼點(diǎn)更多地指向包含在文獻(xiàn)中的信息而不是文獻(xiàn)本身,以及電子計(jì)算機(jī)應(yīng)用到信息工作領(lǐng)域使人們擁有強(qiáng)有力的信息處理手段而導(dǎo)致出現(xiàn)的名詞。
完整的信息檢索概念包括兩項(xiàng)工作:(1)信息存儲(chǔ)過程,即搜集、篩選、整理、積累現(xiàn)有信息及檢索工具,建立信息檢索系統(tǒng)。(2)信息檢索工程,即利用信息檢索工具查找所需要的信息。廣義的信息檢索過程包括信息的存儲(chǔ)與檢索兩個(gè)過程。狹義的信息檢索僅指檢索過程。
2 信息檢索的類型
2.1 按照信息存儲(chǔ)的載體和實(shí)現(xiàn)查找的技術(shù)手段劃分,信息檢索可以分為以下幾種:手工檢索。即檢索者翻閱、查找印刷型檢索工具,這種檢索靈活方便,但是檢索效率低。機(jī)械檢索。即利用探針或檢索器件,對(duì)代表檢索標(biāo)識(shí)的穿孔卡片進(jìn)行選取,可大大提高檢索效率。光電檢索。即把檢索標(biāo)識(shí)變成黑白點(diǎn)矩陣或條形碼,存儲(chǔ)在縮微介質(zhì)上,利用光電效應(yīng),通過檢索機(jī)進(jìn)行查找。計(jì)算機(jī)檢索。即把檢索標(biāo)識(shí)轉(zhuǎn)換成二進(jìn)制編碼,存儲(chǔ)在磁性載體上,由計(jì)算機(jī)根據(jù)程序進(jìn)行查找和輸出。
2.2 根據(jù)存儲(chǔ)與檢索對(duì)象來劃分,信息檢索可以分為:文獻(xiàn)檢索。即以特定的文獻(xiàn)為檢索對(duì)象,包括全文、文摘等。事實(shí)檢索。即以特定的事項(xiàng)為檢索對(duì)象,凡是查找有關(guān)人物、地名、術(shù)語、時(shí)間等,都屬于事實(shí)檢索的范疇。數(shù)據(jù)檢索。即以特定的數(shù)據(jù)為檢索對(duì)象,如篇數(shù)、人數(shù)等。
3 信息檢索的意義
3.1 開發(fā)信息資源
由于以不同形式存在的信息經(jīng)過積累和傳遞,作用于物質(zhì)活動(dòng)過程時(shí),能更好地利用和開發(fā)物質(zhì)資源;與資本和勞動(dòng)結(jié)合時(shí),則可以為人類創(chuàng)造新的物質(zhì)財(cái)富,因而信息資源與能量資源、物質(zhì)資源并稱為當(dāng)代社會(huì)的三大資源。信息資源管理與開發(fā)水平已成為衡量一個(gè)國(guó)家信息文明程度的重要標(biāo)志。信息檢索是信息存儲(chǔ)和信息傳遞的重要環(huán)節(jié),是信息產(chǎn)業(yè)的重要基礎(chǔ)之一;信息檢索技能的提高和手段的日益現(xiàn)代化,將大大加快社會(huì)信息資源的開發(fā)速度和程度。
3.2 避免重復(fù)勞動(dòng)
人類積累起來的大量文獻(xiàn)信息資源是一個(gè)巨大的知識(shí)寶庫(kù),是人們從事科學(xué)研究、技術(shù)開發(fā)、文學(xué)與藝術(shù)創(chuàng)作所不可缺少的信息資源;重視信息資源的開發(fā),重視信息檢索和傳遞工作,可以確保學(xué)術(shù)研究和文藝創(chuàng)作、避免盲目性和重復(fù)勞動(dòng),可以幫助我們充分利用他人研究成果,在他人研究的基礎(chǔ)上有所改進(jìn)和創(chuàng)新,從而創(chuàng)造出更多質(zhì)量更高的信息資源。
3.3 節(jié)省勞動(dòng)時(shí)間
信息檢索是研究工作的基礎(chǔ)和必要環(huán)節(jié),成功的信息檢索可以起到事半功倍的效果;尤其是隨著信息技術(shù)的更新發(fā)展,研究者可以在很少時(shí)間里完成信息調(diào)研,從而節(jié)省勞動(dòng)時(shí)間,提高工作效率。
3.4 協(xié)助管理決策
管理決策必須依賴信息咨詢才能保證其科學(xué)性、公正性,信息咨詢成功的基礎(chǔ)則是通過科學(xué)合理的信息檢索獲取大量有用的信息資源。
3.5 提供科學(xué)方法
有人曾用信息爆炸一詞來描述當(dāng)今社會(huì)中信息生產(chǎn)與信息載體數(shù)量的迅猛增長(zhǎng),在浩如煙海的信息資料之中盲目地找尋自己所需要的信息資源,自然是一種非常困難的事情。信息檢索則為人們提供了一套較完整的開發(fā)、利用信息資料的方法,包括信息檢索工具的選擇、信息檢索策略的制定、信息檢索手段的選擇等等。
4 信息檢索的主要方式
4.1 直接檢索
直接檢索就是從瀏覽、閱讀文獻(xiàn)信息資源中獲取所需要的情報(bào)信息過程,它是研究者習(xí)慣使用的方法,具有以下幾個(gè)優(yōu)點(diǎn):(1)易于把握文獻(xiàn)信息實(shí)質(zhì)內(nèi)容。(2)可直接對(duì)信息內(nèi)容判斷取舍。(3)簡(jiǎn)便易行。(4)信息獲取速度快,時(shí)效高。
4.2 間接檢索
間接檢索就是以檢索工具為導(dǎo)向,進(jìn)而查找原始文獻(xiàn)信息資源以獲得所需信息的過程,其優(yōu)越性在于:(1)使盲目的分散檢索成為有目的的集中檢索,因?yàn)闄z索工具將分散在不同學(xué)科、不同類型、不同語種中但主題內(nèi)容相同的文獻(xiàn)信息集中在一起,這樣就可避免直接檢索的分散性、盲目性,大幅度提高檢索效率。(2)檢索工具中的信息源不限于某一個(gè)或幾個(gè)信息機(jī)構(gòu),這樣就可以為用戶提供廣泛的信息來源。(3)提供有規(guī)律的檢索途徑,因而檢索者只要掌握檢索工具所提供檢索途徑的規(guī)律性,就可以實(shí)現(xiàn)有效的信息檢索。(4)消除語言障礙,因?yàn)闄z索工具通常只用一種文字寫成,檢索者只需掌握常用文種,即可實(shí)現(xiàn)多語種信息檢索。(5)檢索工具通常提供相關(guān)主題的題錄或文摘而不是全文,因而可加快檢索速度。
5 信息檢索的原理
信息存儲(chǔ)工作包括文獻(xiàn)收集、信息加工整理,最后形成有序的、具有存儲(chǔ)標(biāo)志的文獻(xiàn)信息數(shù)據(jù)庫(kù);信息檢索工作則包括用戶提出課題檢索要求、通過分析形成檢索標(biāo)志,然后到文獻(xiàn)信息數(shù)據(jù)庫(kù)中進(jìn)行檢索標(biāo)志與存儲(chǔ)標(biāo)志的匹配,凡是匹配成功的,相應(yīng)信息款目即為只能改選檢索結(jié)果。
因而,所謂信息檢索原理,簡(jiǎn)單地講,就是檢索提問標(biāo)志與存儲(chǔ)在檢索工具中的文獻(xiàn)特征標(biāo)志進(jìn)行比較或稱匹配,然后提取相符合的文獻(xiàn)信息的檢索方法。在機(jī)檢中所采用的檢索原理通常是依靠邏輯運(yùn)算的布爾檢索方式,這種方法是運(yùn)用以“與”(and)、“或”(or)以及“非”(not)為主的邏輯運(yùn)算來檢索所需信息的。
6 網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)
6.1 可視化趨勢(shì)將會(huì)更加明顯
網(wǎng)絡(luò)信息檢索的可視化是指將數(shù)據(jù)庫(kù)中的不可見的語義關(guān)系用圖像形式可視化顯示并表達(dá)用戶檢索過程??梢暬木W(wǎng)絡(luò)信息檢索可以使文獻(xiàn)或檢索式內(nèi)部的語義關(guān)系簡(jiǎn)化,用戶能夠很容易的判斷一個(gè)檢索中的相關(guān)的文獻(xiàn),可視化的網(wǎng)絡(luò)信息檢索是一個(gè)透明的檢索過程,不僅使檢索更容易、有效,還為用戶展示了更豐富、更直觀的信息??梢暬W(wǎng)絡(luò)信息檢索使用戶進(jìn)行交互式輸入,允許在信息空間進(jìn)行動(dòng)態(tài)移動(dòng),允許用戶修改數(shù)據(jù)的顯示方式,使他們理解數(shù)據(jù)的個(gè)人偏好可視化。如今,可視化技術(shù)在地理信息系統(tǒng)(Geographic Information System)、產(chǎn)品設(shè)計(jì)(Product Design)、城鎮(zhèn)建設(shè)與規(guī)劃(Urban Construction and Plan)等領(lǐng)域得到了應(yīng)用。所以可視化的網(wǎng)絡(luò)信息檢索將會(huì)更加明顯。
6.2 個(gè)性化服務(wù)將進(jìn)一步提高
網(wǎng)絡(luò)信息檢索的個(gè)性化是指各個(gè)網(wǎng)站針對(duì)不同的用戶需求提供給用戶有特色的服務(wù)內(nèi)容。網(wǎng)站提供個(gè)性化服務(wù)的實(shí)質(zhì)是提供適應(yīng)用戶需要的產(chǎn)品。事實(shí)上,網(wǎng)上已經(jīng)開始出現(xiàn)專門收錄某一領(lǐng)域信息的網(wǎng)站,尤其是在一些熱門領(lǐng)域。一些大型的搜索引擎已經(jīng)注意到個(gè)性化信息服務(wù)的提供。目前支持個(gè)性化信息服務(wù)所需的支撐技術(shù)已經(jīng)基本成熟,如數(shù)據(jù)推送技術(shù)、網(wǎng)頁動(dòng)態(tài)生成技術(shù)和智能代理技術(shù)。可以預(yù)見,將來網(wǎng)絡(luò)的“個(gè)性化”功能將得到進(jìn)一步加強(qiáng)。用戶可以根據(jù)個(gè)人喜愛的方式來檢索信息,并且可以在一定程度上改變檢索顯示的結(jié)果格式,用戶還可以對(duì)命中的檢索結(jié)果進(jìn)行限制,要求僅提供權(quán)威的結(jié)果,從而提高檢索質(zhì)量。
6.3 用戶友好化進(jìn)一步提高
未來科技的發(fā)展都要以人為本,網(wǎng)絡(luò)信息檢索也不例外。用戶友好化的目的就是讓用戶更方便地訪問信息資源。它主要包括兩個(gè)方面的內(nèi)容:一是用戶界面友好化,例如利用窗口、圖標(biāo)瀏覽器和超文本等用戶友好界面技術(shù),使用戶不必知道所要查找的信息在網(wǎng)絡(luò)存放的位置,也不必掌握許多操作命令,同樣能得到滿意的檢索結(jié)果。另一方面是更好的為檢索結(jié)果提供方式,使用戶方便地進(jìn)行瀏覽、選擇和利用。
6.4 網(wǎng)絡(luò)信息檢索提供全文檢索
全文檢索是指以各類數(shù)據(jù)諸如文字、聲音、圖像等為主要處理對(duì)象,根據(jù)數(shù)據(jù)資料的內(nèi)容,而不是外在特征來實(shí)現(xiàn)的信息檢索手段。它是信息檢索發(fā)展的最前沿和目前的最高階段。與其他檢索技術(shù)相比,全文檢索技術(shù)的新穎之處在于,它可以使用原文中任何一個(gè)有實(shí)際意義的詞作為檢索入口,而且得到的檢索結(jié)果是原文文獻(xiàn)而不是文獻(xiàn)線索,從而使人們能快速方便地查到他們想要的文獻(xiàn)原文。
6.5 網(wǎng)絡(luò)信息檢索主動(dòng)性發(fā)展趨勢(shì)
網(wǎng)絡(luò)環(huán)境使世界范圍內(nèi)的信息傳播成為現(xiàn)實(shí),網(wǎng)絡(luò)環(huán)境中的電子圖書、網(wǎng)絡(luò)期刊等出版物,可以自動(dòng)形成人名、地名、年代等關(guān)鍵詞,具有自動(dòng)編制書本式索引的功能,提供豐富的檢索點(diǎn),具有較強(qiáng)的檢索功能和靈活多樣的檢索結(jié)果輸出形式,并可以通過網(wǎng)絡(luò)主動(dòng)分發(fā)給信息用戶。
6.6 網(wǎng)絡(luò)信息檢索標(biāo)準(zhǔn)化發(fā)展趨勢(shì)
網(wǎng)上信息的多樣性、復(fù)雜性以及分散和無序,嚴(yán)重地影響了網(wǎng)絡(luò)信息檢索,因此,必須規(guī)范網(wǎng)絡(luò)信息的計(jì)量標(biāo)準(zhǔn),結(jié)束當(dāng)前這種無序的狀態(tài),建立一整套網(wǎng)絡(luò)信息錄入、數(shù)據(jù)組織、信息檢索以及檢索結(jié)果規(guī)范化的標(biāo)準(zhǔn)。標(biāo)準(zhǔn)化是網(wǎng)絡(luò)信息檢索的當(dāng)務(wù)之急,也是網(wǎng)絡(luò)環(huán)境中信息檢索的發(fā)展趨勢(shì)。
6.7 網(wǎng)絡(luò)信息檢索語音化發(fā)展趨勢(shì)
隨著綜合科技的高速發(fā)展,在不遠(yuǎn)的將來,語音識(shí)別系統(tǒng)就會(huì)像文字輸入法一樣普及,它的普及,可以減輕用戶的手、眼、腰的疲勞,而且盲人也能方便的進(jìn)行網(wǎng)上檢索,系統(tǒng)通過語音合成技術(shù),把所檢索的信息轉(zhuǎn)化成聲音,以供盲人使用。語音化檢索是網(wǎng)絡(luò)信息檢索的一個(gè)重要的發(fā)展趨勢(shì)。
綜上所述,隨著網(wǎng)絡(luò)技術(shù)的新興和發(fā)展,信息檢索技術(shù)也必將隨之發(fā)展,技術(shù)發(fā)展是無限的,而技術(shù)的發(fā)展也都是為了用戶信息檢索的方便和實(shí)用而服務(wù)的,這是一種趨勢(shì)。
參考文獻(xiàn):
[1] 沈固朝.網(wǎng)絡(luò)信息檢索工具、方法、實(shí)踐[M].北京:高等教育出版社,2004.
[2] 馬文峰.人文社會(huì)科學(xué)信息檢索[M].北京:北京圖書館出版社,2004.
[3] 許家良.信息檢索[M].北京:國(guó)防工業(yè)出版社,2004.
[4] 陳軍蓮.網(wǎng)絡(luò)信息檢索中存在的問題及對(duì)策[J].圖書館,2007(5).
[5] 賀曉利.信息資源網(wǎng)絡(luò)檢索的特點(diǎn)、問題及對(duì)策[J].現(xiàn)代情報(bào),2007(5).
[6] 孔為民.信息檢索技術(shù)的新趨勢(shì)[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2009(3).
(編校:馬懷云)