鄭曉川
隨著大眾生活水平的提高,對知識的追求也越來越熱情,圖書館的建設成為一項重要的事業,而在信息化時代,建設數字圖書館成為必然,與之相關的各種數字技術體系的完善也必不可少。本文探討了數字圖書館的信息檢索技術問題,文章從闡述數字圖書館概念、信息檢索技術概念入手,進一步介紹了數字圖書館的信息檢索技術,最后分析了數字圖書館信息檢索技術的發展趨勢。
【關鍵詞】數字圖書館 信息檢索技術 概念 發展趨勢
數字圖書館的建設滿足了用戶對知識獲取的是需求,而信息檢索技術的發展則提高了用戶獲取知識的效率,給用戶帶來了方便快捷高效的服務享受。尤其是各種基于圖像的檢索、基于視頻信息的檢索、基于音頻的檢索方式的完善,更是為圖書館事業發展做出了重大貢獻。
1 數字圖書館概述
數字圖書館是現代社會中一種獨特的圖書館存在形式,它是圖書館發展進程中的新形式,數字圖書館以現實中館藏的和網絡中存儲的數據資料作為對象,以國際互聯網作為傳播渠道,借助現代化的信息處理技術和計算機設施,讓全世界的任何用戶都可以享受到全面的電子信息服務。
而數字圖書館具有幾個突出的特點:
(1)它具備高效率的計算機管理體系;
(2)它具有新興的數字化訊息儲存處理功能;
(3)它包含了高效便捷的聯網查詢渠道;
(4)它提供了一種以用戶為核心的高級服務模式。
2 信息檢索技術概述
在現代信息社會中,檢索是一種重要的功能,其最大的價值在于可以最大限度地實現信息共享,信息本身具有明顯的共享性質,而實現共享可以有力地促進人類寶貴知識財富、研究結論的傳播與共同應用,人們需要利用某種有效的方式在海量的信息源中快速辨別并提取自己迫切需要的那一部分,該過程便被稱為檢索。
而信息檢索的實際含義,指的是對早已記錄在案的各樣信息整合加以查看,以求能檢索到符合自己和單位所求信息特征的內容的這個操作流程,它可以把信息細節和讀者需求進行科學匹配。
3 數字圖書館的信息檢索技術
3.1 搜索引擎技術
搜索引擎術是對數字圖書館的數據資訊資源加以科學整合、管理以及檢索的高級軟件,它可以體現館藏和網上導航的作用,也可以為萬千讀者帶來快捷、簡易的檢索體驗,幫助讀者在網上快速獲取目標原文資料,搜索引擎術是構成數字圖書館的重要部分。按照信息搜索辦法和信息服務方法的差異,搜索引擎也可以劃分成不同的類型,一般來說可以劃分成目錄式、關鍵詞和元搜索引擎幾種。就目前發展情況來看,數字圖書館中運用最多的是元搜索引擎的辦法。該辦法通常會缺乏自成一體的數據資源庫,更多的是依賴基層的某些獨立分布的數據庫內部信息,借此建設邏輯性強、高度虛擬的資源庫,以此達到讀者用戶的要求。
3.2 信息檢索代理Agent技術
信息檢索代理Agent,可以說是一種主動色彩明顯的信息檢索辦法,它能夠將智能Agent、信息檢索等操作手段結合起來,建成全新的檢索模式。信息檢索代理Agent可以依據用戶率先提出的信息檢索要求,從而參考用戶平常的檢索習性、上網痕跡中留下的可以反映搜索者的興趣傾向、推測出其大概的搜索需求方向,借助已經存在的檢索服務體系,主動在網絡體系中提取出相應的有用信息,及時監控信息源的發展動態,并把相關信息用發出郵件等等方法快速提醒用戶,其具體功能包括智能導航、知識檢索、用戶知識的學習與管控等等。
3.3 基于內容的信息檢索技術
在數字圖書館快速進步的環境中,大多是以多媒體、超文本為重點儲存方法的海量數據資料,關鍵詞搜索的辦法早已經難以非常精準地體現出多媒體所蘊含的視覺聽覺知識訊息,基于文本信息的關鍵詞檢索辦法也無法滿足用戶的所有需求,因此基于多媒體訊息的檢索技術得到更多的應用。
3.3.1 基于圖像的檢索模式
它把圖形中所包括的信息作為基礎,在解析圖形細節后,提取核心的色彩、形狀等要素信息,按照這些要素完成索引,用戶可以依靠表述自身對圖像的大概印象,經過若干次的近似匹配后,于大容量圖像庫中尋找到目標圖。
3.3.2 基于視頻資料的檢索
該辦法能夠在諸多視頻中查找出目標片斷。視頻一般是用場景、鏡頭和幀來劃分的,而相關的檢索方式則依靠對視頻資源的適當分割,在鏡頭中提取關鍵幀,同理也是依據色彩、形狀等特點完成檢索。
3.3.3 基于音頻的檢索
通過對聲音的數字化處理,得出檢索內容。音頻信息通常是用音量、音調、音強、帶寬、音長和音色等元素來切分。檢索之前,需要對音頻信息建成索引,然后根據具體的韻律、旋律等等感知特點進行搜索。
4 數字圖書館信息檢索技術的發展趨勢
4.1 統一的檢索界面
結合當前數字圖書館的發展情況來看,未來的信息檢索體系將更加完善,倡導一站式的服務方式,實現界面友好,保障用戶操作的便捷度。在技術上做到分布式、跨語言、跨平臺的檢索技能。
4.2 主動的信息推送服務
以前的情報服務中的SDI技術在實踐中被證明是具有很高的價值的,以后將更完善地引入到網絡信息服務體系中去,信息服務單位將能夠借助信息推送技術把讀者感興趣的內容,用郵件方式直接傳給用戶。
4.3 多種檢索模型高度一體化
以后的檢索體系中包含的檢索模式將更多的傾向于幾種不同檢索模型的結合,不同的檢索技術融合起來以后,將達到取長補短的效果,檢索方法和效果將得到質的提升。
4.4 檢索的個性化
未來的信息檢索強調個性化服務。數字圖書館以網絡為依托,將圍繞用戶的興趣、愛好、習性、專長等個性需求,主動地為讀者選擇資源,并定期地把符合用戶需求的信息以用戶喜好的方式發送給用戶。
5 結語
綜上所述,加強對數字圖書館信息檢索技術的研究,具有重大的現實意義。相關工作人員需要明確數字圖書館的概念,同時把握信息檢索技術的要點,了解各種數字圖書館的信息檢索技術,包括搜索引擎技術、信息檢索代理Agent技術、基于內容的信息檢索技術,在此基礎上,預測數字圖書館信息檢索技術的發展趨勢,比如它統一的檢索界面、主動的信息推送服務、多種檢索模型高度一體化、檢索的智能化、檢索的個性化等等。
參考文獻
[1]賀子岳.世紀之交中國圖書館事業發展研究綜述[J].圖書館情報知識,2012(03):43-46
[2]劉建華.數字圖書館信息檢索技術[J].微電腦世界,2010.
作者單位
南陽醫學高等專科學校 河南省南陽市 473000