999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

提高網絡信息搜索匹配準確率的相關研究

2012-12-31 00:00:00金貴榮
科技資訊 2012年31期

摘 要:步入信息化時代,人們獲取信息的主要方式就是通過網絡。Internet上的信息量不斷更新增多,雖然為人們提供了豐富的信息資源,但是卻也加大了人們搜索所需信息的難度。一些搜索引擎,諸如百度、Google等雖然提供了網頁搜索的便捷方式,但由于關鍵詞的匹配是信息檢索技術的基礎,因此搜索結果往往存在冗余及多余無用信息,搜索匹配準確率不高。如何在浩瀚如海的信息空間里快速、準確的查找到所需信息,是目前人們關注的焦點問題。

關鍵詞:網絡信息 搜索匹配 準確率

中圖分類號:TP391 文獻標識碼:A 文章編號:1672-3791(2012)11(a)-0002-01

1 搜索引擎技術

基于Internet信息檢索技術,將Internet上的網頁間建立相關聯的索引數據庫,便于用戶檢索時在庫中快速定位信息并提供信息給用戶即為搜索引擎。

搜索引擎由量大部分組成:前臺和后臺。例如:Google、百度等即為前臺。前臺主要用于為用戶提供檢索接口,依據用戶的請求進行信息的檢索,并反饋用戶經過濾后的信息資源;后臺用于實時搜集網頁建立引擎。

搜索引擎可以大范圍的進行信息源的檢索,進一步提高召回率,且提升檢索的全面性、綜合性等。搜索引擎的缺點在于查詢的時間相對較長。

2 造成網絡信息搜索匹配準確率低下的因素

(1)無關、重復信息過多。由于傳統搜索引擎需要返回的網頁有很多,而且網頁內存在大量無關且多余的信息,有部分網頁內容相同,造成用戶難以在海量信息中對所需信息準確、快速定位。(2)檢索方式單一。由于通常情況下信息檢索技術都是采用關鍵詞匹配檢索方式查詢,關鍵詞并不能將用戶所需的信息資料準確的表達出來,或者用戶很難找到合適的關鍵詞進行查詢。(3)關鍵詞檢索通常情況下僅使用詞頻信息,并沒有涉及語義、句法及語用信息方面,所以只是在篇章或段落里面檢索答案,并不是最明確的答案[1]。

3 網絡信息搜索匹配原理

信息搜索就是進行網絡信息的快速匹配。詞匯的檢測、匹配需要依據語言特征,通過對基礎語言詞匯數據進行對比、對核才能完成。網絡信息特征是傳統信息搜索方法進行檢索的依據,但由于網絡中的數據量較大,而且詞匯存在相似的特征,造成網絡中數據有很大一部分相似,傳統的匹配搜索法檢索結果會存在大量的非匹配詞匯,用戶在提取數據源時無法滿足需求,導致搜索匹配準確率不高。

4 提高網絡信息搜索匹配準確率的策略

(1)基于網頁去重。在進行信息檢索時將不同鏈接、卻基本相同的信息資源進行后臺整合,將多余的冗雜信息去除,就能夠提高信息檢索的精度及效率。

(2)基于分面、分類。對一個概念進行不同角度的劃分或將其分成不同的側面,進行細13091f9321483fa9408f5083cac5db9a349a87ae742f7f31ffce656df98ffb73分后編制能夠替代主題詞表的分類體系。這樣用戶進行信息檢索時,先將檢索到的關鍵詞劃分成為一些子類別,從中選擇合乎自己要求的類別,選中后系統再次進行分類,直到用戶滿意或系統分類到達節點。這樣將其一步一步細化進行檢索能夠快速實現用戶所需信息搜索,且準確率較高。

(3)基于詞頻統計。統計法是信息檢索的最基本方式之一。詞頻統計法又是最常用的統計方法。通常情況下作者都會在一篇文章中進行重點詞語的強調,重點詞語便會在文中反復出現。這樣可以進行檢索信息的關鍵詞統計,并設置一個閾值,如果關鍵詞出現的頻率(詞頻率)超過了閾值,便會返回所對應的文章。還可以顯示出關鍵詞的順序及在文中的位置。

(4)基于自動文摘??萍嫉倪M步帶動了自然語言處理技術的發展,使其得到了廣泛的應用。用戶在進行信息檢索時,自然語言處理技術會對檢索到的網頁、文檔進行自動抽取摘要信息的功能,用戶依據文摘選擇符合自己需求的信息進行瀏覽,這樣提高了檢索的準確性及效率。

(5)基于知識的表示及處理。將與世界事實、關系及過程等信息編碼,使其成為科學的數據結構即為知識表示。語義網絡及產生式表示法是常見的兩種知識表示法。采用知識表示方法進行信息檢索,對于具有相同意義的關鍵詞檢索,當輸入關鍵詞以后,搜索的信息能夠將同義的描述顯示出來。

(6)基于超鏈接技術。超鏈接是一種網狀檢索,能夠進行沿鏈訪問,是以超鏈接網絡作為瀏覽基礎進行瀏覽的方式。當網絡中的信息、文檔依照不同的主題進行分類存儲以后,主題詞表以及分類體系間所具備的相關聯系會形成網狀的結構。將分類體系中的類作為一個節點,相互間的關系作為鏈,就形成了網狀體系,在此基礎上能夠進行超鏈接檢索。

(7)基于語料庫。語言的詞匯、語義、語法結構及語用信息都屬于語料庫范圍。語料庫是進行信息檢索、統計、比較研究的基礎。目前自然語言處理的各環節已經融入了語料庫研究,并有機結合自然語言處理方法,有效的促進了對用戶檢索意圖的理解,加深了知識表示,極大的推動了信息檢索匹配的準確性。

(8)基于合適的網絡檢索工具。檢索需求不同可以采用不同的檢索引擎、專題數據庫及主題指南等。這樣可以較為準確的檢索出所需的信息資料,提高搜索匹配效率。

(9)高效檢索技巧:①打開多個檢索窗口可以有效的節省檢索等待時間。②關閉主頁圖像能夠提升下載速度。③運用詞組檢索能夠提高信息匹配準確性。④直接查找信息源,利用IP地址直接打開網頁及網站。⑤選擇就近的網絡站點。⑥使用大型專業數據庫進行搜索。⑦使用網絡搜索軟件。⑧不在上網高峰期進行信息的檢索。

5 結語

伴隨互聯網的發展,信息資源將會進一步的增加、膨脹。為了提高網絡信息搜索匹配的準確率,可以借助一些常用的技術方法等,并進一步理解用戶檢索意圖,加上一些檢索技巧能夠有效的提升搜索匹配準確率。網絡信息搜索匹配準確率的提升需要不斷的進行探索研究,科技的進步必將促進網絡信息檢索技術的準確性提升。

參考文獻

[1] 陳海光.HNC理論和隨機模糊在問答系統中的應用研究[D].江蘇:江蘇大學,2009.

主站蜘蛛池模板: 在线观看亚洲成人| 91麻豆国产在线| 黄色成年视频| 国产精品香蕉| 狠狠色噜噜狠狠狠狠奇米777| 91精品国产福利| 欧美97欧美综合色伦图| 国产91线观看| 无码区日韩专区免费系列| 国产香蕉在线视频| 国产女人在线观看| 日本不卡视频在线| 99久久性生片| 国产草草影院18成年视频| 国产精品主播| 中国一级特黄大片在线观看| 亚洲日韩欧美在线观看| 国产99在线| 久青草网站| 国产免费羞羞视频| 免费精品一区二区h| 秋霞一区二区三区| 欧美怡红院视频一区二区三区| 成人精品免费视频| 国产99在线观看| 欧美一区福利| 中文字幕色站| 色偷偷一区二区三区| 成人午夜精品一级毛片| 国产成人亚洲精品色欲AV| 成人精品亚洲| 亚洲欧美日韩成人在线| 亚洲精品动漫| 一级全免费视频播放| 人人看人人鲁狠狠高清| 992tv国产人成在线观看| 国产精品99一区不卡| 精品国产免费观看一区| 日韩欧美亚洲国产成人综合| 国产成人在线小视频| 亚洲精品视频免费观看| 国产屁屁影院| 亚洲欧美成人网| 国产成人一区免费观看| 精品偷拍一区二区| 国产91蝌蚪窝| 人妖无码第一页| 国产成人毛片| 国产91特黄特色A级毛片| 国产精品亚洲精品爽爽| 欧美三级日韩三级| 国产网友愉拍精品视频| 精品三级在线| 日韩av手机在线| 中文字幕久久亚洲一区| 9966国产精品视频| 成人免费一区二区三区| 国产精品自在自线免费观看| 国产av无码日韩av无码网站| 无码'专区第一页| 无码AV高清毛片中国一级毛片 | 久久精品这里只有国产中文精品| 国产午夜无码专区喷水| 福利视频99| 在线网站18禁| 午夜精品一区二区蜜桃| 久久久久无码国产精品不卡| 手机精品视频在线观看免费| 亚洲精品视频免费看| 国产制服丝袜91在线| 成人免费黄色小视频| 亚洲综合久久成人AV| 国产肉感大码AV无码| 亚洲,国产,日韩,综合一区| 国产成人精品免费av| 天天色天天综合网| 91欧美亚洲国产五月天| 国产精品hd在线播放| 国产精品黄色片| 片在线无码观看| 欧美精品aⅴ在线视频| 成人va亚洲va欧美天堂|