楊 敬
淺析智能搜索引擎技術及其在數字圖書館個性化信息服務中的應用
楊 敬
隨著職能信息技術的不斷發展與成熟,職能搜索引擎技術和數字圖書館的個性化信息服務業逐漸趨于完善。職能信息檢索的本質就是使其職能搜素引擎能夠得到不斷的改進與發展,而以該技術為基礎的構建數字化的圖書館個性化的服務系統,為數字圖書館的發展需要。本文以職能搜索引擎技術和其在圖書館的應用為基礎,分析個性化發信息服務中職能搜索引擎的應用于發展。
智能搜索引擎 數字圖書館 個性化信息服務
對于使用者而言,搜索引擎的主要作用實際上就是為了幫助因特網操作者查詢信息,該搜索技術是建立在一定方法中的因特網搜索、發現信息。對信息實施處理、理解以及提取的過程,同時最終提供給使用者,也就是信息導航。而從不同的角度來看,搜索引擎也有很多種類。比如特殊性型、通用型以及專業型,另外還有分布式、集中式等系統。
(一)系統互交性較低
因為缺少最有效的查詢接口,很多使用者往往不能有效的描述自己的相關查詢要求,而很多搜索引擎往往都沒有一邊查詢的同時一邊修正關鍵詞的能力,操作者往往不能利用不斷細化或者精確的查詢詞來表述自己信息需要的目的。另外,系統往往也只能負責返回結果給使用者,但是不會對結果實施評價甚至有效選取,不能利用反饋來深入熟悉系統的性能[1]。
(二)缺少適應信息源的動態變化要求
很多網絡的信息更新、自身的開放性以及動態性等要求,直接導致搜索要求更新以及維護很難真正意義上的跟上信息源的改變,致使死鏈接出現網絡滯后。所以,使用科學有效的管理以及技術體系,使得搜索要求能夠有效地反應信息源為搜索引擎必須面臨的話題之一。
(三)個性化能力不足
實際上,搜索引擎對所有的操作者而言均為單一的模式,查詢有關的,所得到的結果往往也千差萬別,不能有效的參考操作者的背景知識以及興趣特征,也不存在對單個使用瀏覽模式以及瀏覽行為實施分析的功能,因此在某種程度上說也不具備提取用戶興趣以及適應操作者習慣的能力[2]。
職能搜索引擎的本質就是搜索引擎有效融合先進的人工職能技術,該種機制以一定的知識庫為基本技術基礎,具備較高的自然語言能力和知識處理的能力,可以有效地分析與理解使用者自然形式出現的基本知識或者概念查詢等問題,最終有效的突破一般搜索引擎要求必須借助較為精確的關鍵詞實施檢索的要求,能夠有效實現自然語言的檢索,最終突出其較強的個性化和智能化的特點。
職能搜索引擎后端往往是由多臺的分布式的服務器組合而成,客戶端往往以專業的瀏覽器或者插件構成智能化人工接機口。另外能夠利用網絡蜘蛛等相關智能化信息調度相關程序實施信息源的有效搜索,同時借助邏輯推理機制能夠有效地明確操作者的檢索目的,在搜索之前就能夠有效的識別不同操作者的不同興趣,最終達到過濾以及推薦的目的。
(一)數字圖書館的個性化服務
所謂個性化服務實際上就是以操作者為中心,在分析操作者專業、行為以及愛好等基礎上,依據操作者的個性化需要開展相關信息服務,它本身具備較強的針對性、安全性、主動性以及知識性,可以有效地提升操作者對數字圖書館的信息服務要求。依據不同的技術要求,數字圖書館的個性化的服務主要具備下面幾個形式:首先是個性化的定制以及推送服務,也就是操作者的興趣愛好,使用定制的Web頁面的信息頻道、信息源,將郵箱發送出現,使得有特色型的界面以及信息能夠完全地展示在具備特定需要的操作者計算機中,同時個性化推薦和報道服務,也就是利用智能化的推薦與主動報道的途徑,深入的研究操作者的專業特點,以及研究興趣等,最終主動的向用戶推薦其需要的相關信息。另外是個性化的知識決策服務,此種服務的大背景下充分強調使用信息挖掘、知識發現以及語義網絡,對有效的信息內容實施深層次的挖掘和分析,向操作者提供可以用于合理分析、決策知識以及智能查詢的要求[3]。
(二)智能搜索引擎應用于數字圖書館個性化中
如果搜索引擎具備智能化要求,則其高度的智能化功能以及突出的個性化服務則為其存在的必要基礎,其在數字圖書館的個性化服務系統的構成過程中,有著決定性的作用,而智能搜索引擎的內部往往是由語義理解、智能過濾以及訪問登記等組成,同時與指令組織、信息加工以及頁面定制等配合完成任務,在智能化的基礎上,其以較好的自然語言理解以及知識邏輯推理,來探討、判斷相關信息行為,對其發揮著信息挖掘以及知識發現的效果。
以職能搜索引擎為要求的數字圖書館的個性化服務系統,不但可以有效地體現出前者的系統優勢,同時還能夠節約系統甚至簡化系統,當然需要特別注意的是,知識庫為搜索引擎的核心以及根本,其也是在數字圖書館的信息資源庫中提煉而成的,是對數字圖書館信息資源的概括、判斷以及提取[4]。
(三)職能搜索引擎技術改進要求
現階段,職能搜索引擎的技術應用于數字圖書館的個性化服務中還僅僅是初始階段,還有很多的技術問題以及客觀問題。伴隨著計算機的發展,網絡搜索等相關IT技術的應用研究與快速發展,此技術必須滿足個性化的服務要求。提升知識本體論層面的研究和判斷能力,職能化的大背景下搜索引擎對知識語言層面以及常識層面的理解往往較為全面,同時也更加精確,所以需要不斷地改善知識本體論層面的功能,提升對知識概念復雜語義關系的能力。
隨著我國數字資源的不斷增長以及網絡數據的海量增加,搜索引擎所暴露的問題也越來越多,急需人工的職能技術介入。而作為計算機大背景下的產物,職能搜索引擎自身所具備的優越性也更為突出,個性化的服務作為整個的數字圖書館對其所發揮的意義越來越大。
[1]孟瑞玲.個性化PageRank算法在圖書館智能搜索引擎中的實現[J].現代情報,2010,30(7):93~96.
[2]成博.多Agent智能搜索引擎及其在圖書館中的應用研究[D].湘潭大學,2008.
[3]代金晶,紀希禹.基于語義網的智能搜索引擎在數字圖書館中的應用[J].圖書館學研究,2008(9):52~54.
[4]馬崴.多Agent智能搜索引擎在圖書館信息服務工作中的應用研究[J].情報探索,2011(2):96~99.
(作者單位:西安政治學院)