劉偉
【摘 要】本文主要對網絡信息檢索進行論述。
【關鍵詞】網絡信息;檢索
隨著信息技術的高速發展,信息資源的越來越顯得重要,而網絡信息資源也逐步成為這個信息時代的核心資源。信息檢索技術也很快得到發展,在此網絡信息檢索隨著網絡的發展也應運而生。網絡信息檢索,就是將描述特定用戶所需網絡信息的提問特征,與信息儲存的檢索標識進行異同比較,從中找出與提問一致或基本一致的網絡信息的過程。相對傳統文獻檢索,網絡信息檢索顯現出了很多的優越性,如不受時間地點的限制,檢索方式多樣化,多元化等。但是我覺得網絡信息檢索的發展還不是十分完善,仍存在些問題,如目前檢索工具在信息搜集缺乏統一的規范管理,檢索過程會出現很多雷同,甚至無用的垃圾信息等。以下從網絡信息檢索目前存在的問題,及針對問題面臨的以后的發展方向進行了探討。
隨著網上信息資源的膨脹發展,一種搜索引擎,無論它多么完善都不可能滿足一個人所有的檢索需求。如果遇到文獻普查、專題查詢、新聞調查與溯源、軟件及MP3下載地址搜索等情況,人們就更需要使用多種搜索引擎來比較、篩選和相互印證。為解決逐一登陸各搜索引擎,在各搜索引擎中分別多次輸入同一檢索請求等煩瑣操作,基于網絡檢索工具的檢索工具產生了。
目前這列檢索工具只要有兩種:集成搜索引擎和元搜索引擎。所謂集成搜索引擎是在一個檢索界面上鏈接若干種獨立的搜索引擎,檢索時,一次檢索輸入,可以指定搜索引擎也可以要求多個引擎同時檢索,搜索結果由各搜索引擎分別以不同頁面提交的網絡檢索工具,其實是利用網站鏈接技術形成的搜索引擎集合。集成搜索引擎制作與維護技術簡單,可隨時對所鏈接的搜索引擎進行增刪調整和及時更新,尤其大規模專業搜索引擎集成鏈接,深受特定用戶群歡迎。如國內天網搜霸和百度搜霸,國外比較著名的有“搜索之家” “網際瑞士軍刀”等。
另一個是元搜索引擎,用戶只需遞交一次檢索請求,由元搜索引擎負責轉換處理后提交給多個預先選定的獨立搜索引擎,并將所有查詢結果集中起來以整體統一的格式呈現到用戶面前。國外比較著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前國內現在還沒有見到真正意義上的元搜索引擎。元搜索引擎雖沒有網頁搜尋機制,亦無獨立的索引數據庫,但在檢索請求提交、檢索接口代理和檢索結果顯示等方面,均有自己研發的特色元搜索技術支持。目前元搜索引擎技術主要有并行處理式和串行處理式兩大類。并行式元搜索引擎運行時是將查詢請求同時發向各個獨立搜索引擎,然后將的結果按特定的順序呈現給用戶;串行式元搜索引擎運行時是將查詢請求先發向某個獨立搜索引擎,待其返回結果后再將請求發往另一個獨立搜索引擎。
從第一個元搜索引擎Metacrawler誕生至今,這一新型的網絡檢索工具異軍突起,發展迅速,目前可用的元搜索引擎已近百種。由于元搜索引擎的功能受著源搜索引擎和元搜索技術的雙重制約,元搜索引擎比較理想的并不多見。信息檢索專家邢志宇將元搜索引擎存在的問題歸納如下:(1)大多元搜索引擎不支持多語種,尤其是漢語檢索;(2)一些元搜索引擎實現檢索語法轉換的能力有限,不支持指定字段檢索,不能充分發揮各個獨立搜索引擎的高級檢索功能;(3)部分元搜索引擎無源搜索引擎列表,用戶不能自主選擇和調用源搜索引擎;(4)大部分元搜索引擎僅支持調用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人為地限制了搜索資源的利用;(5)在檢索結果上,元搜索引擎只能返回十幾、數十條“相關度”較高的結果,大量可能有價值的源搜索引擎的檢索結果被忽視,影響檢索結果的全面性。
Internet的發展使信息采集、傳播和利用無論是從規模還是速度都達到了空前的水平。我覺得未來網絡信息檢索技術的發展方向如下:
1.智能化
現有的檢索引擎存在著查全率和查準率低的問題,未來的搜索引擎技術必須具有能及時挖掘新信息和及時能鏈接新增的信息,多途徑檢索功能,用戶可以交互式檢索,搜索出滿意的信息。提高網絡信息檢索技術水平并實現智能檢索,智能化是網絡信息檢索未來主要的發展方向。智能檢索是基于自然語言的檢索形式,機器根據用戶所提供的以自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索,智能檢索技術就是采用人工智能進行信息檢索的技術,它可以模擬人腦的思維方式,分析用戶以自然語言表達的檢索請求,自動形成檢索策略進行智能、快速、高效的信息檢索。最近幾年,智能信息檢索作為人工智能的一個獨立研究分支得到了迅速發展,而且目前已有一些搜索引擎支持智能檢索,但智能化程度還不高,這方面還有待進一步的發展。
2.標準化
現在的網站信息瞬息萬變,雜亂紛繁,很是需要進行分類整理。目前雖然有大量的搜索引擎,但還沒有一個統一嚴格的分類方法來管理,網絡信息資源在組織分類上需要制定一個統一的分類標準。還要規范網絡術語,提高資源共享的程度,這樣可以有效保證用戶的檢索效率。
3.個性化
科技的發展要以人為本,隨著科學技術的發展,個性化服務也將成為網絡信息檢索的一個發展方向。隨著互聯網的飛速發展,每個人的對信息的需求將不再滿足于標準化、單一化的大眾需求。不同的人需要不同的服務,如殘疾人士對網絡信息檢索的要求就要區別于常人,要是信息檢索能很好的識別語音檢索就能很有效的滿足他們的信息需求。如何使用戶更方便、快捷地使用各種檢索工具,滿足用戶各種檢索要求,個性化服務也會成為網絡信息檢索重要的發展方向。
在這個知識大爆炸的時代,要想從浩如煙海的信息資源中快速準確地找到自己所需的信息,就需要我們在不斷信息檢索實踐中總結及掌握一些檢索技巧。當然也需要我們不斷的發現問題,努力解決問題。也由衷地希望隨著科技的發展,網絡信息檢索技術越來越成熟,能給人們帶來各式各樣的服務,讓我們的生活更加便利。 [科]