999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web挖掘的個性化信息檢索系統總體設計

2013-10-17 06:09:12王水萍
網絡安全技術與應用 2013年11期
關鍵詞:信息檢索搜索引擎用戶

王水萍

(鄭州經貿職業學院計算機系 河南 460005)

1 搜索引擎的現狀研究

隨著Web信息成指數級的增長,傳統搜索引擎能夠搜索出來的網頁越來越多,但這些搜索出來的網頁大多都與用戶請求無關,并且網頁之間沒有任何關系,用戶需要從眾多的結果中過濾出自己所要的信息,大大加重了用戶的檢索負擔。傳統的搜索引擎是通用型的搜索引擎,一般來說,不同的用戶輸入相同的查詢請求總會返回相同的查詢結果,然而,對于每一個用戶來說,由于關注點不同,用戶更期望得到個性化的檢索結果。

搜索引擎本就是為了方便用戶在網絡信息中搜索有用的信息。利用個性化技術來提高搜索引擎系統的性能,主要是為了給查詢用戶提供較為準確的個性化搜索結果。比如,當用戶用傳統的搜索引擎來查詢時,如果輸入“蘋果”,由于傳統搜索引擎采用普通的排序算法排序,不同的用戶輸入“蘋果”,搜索引擎返回的結果都是相同的。一般情況下,排在前面的網頁都是一些“平板電腦”、“手機”等電子產品的頁面,然而如果用戶的興趣不在于此,而是想查詢蘋果收購和銷售方面的信息,那么相關的搜索結果就不是他們想要的。但是,當傳統的搜索引擎使用了個性化檢索技術后,用戶的查詢結果就發生了改變,這時搜索引擎系統利用用戶興趣模型來對初始的搜索結果頁面集進行優化過濾,從而為用戶返回個性化的查詢結果,這也就是用戶想要的結果。

2 WEB挖掘在信息檢索領域的應用

個性化信息檢索系統主要是面向廣大的Internet用戶,因此本文設計的該系統考慮綜合了多種解決方法和個性化技術。

Web挖掘是Web技術、數據挖掘、計算機技術、信息科學的一個交叉學科,是數據挖掘在網絡環境下的應用。在Web信息檢索領域使用Wcb挖掘技術,目的是提高信息檢索的準確率和效率,改善查詢結果。其幾點應用如下:

①使用Web內容挖掘中的聚類技術、文檔分類技術對Web文檔進行分析處理,對文檔進行摘要,以改善Web文檔索引的組織結構,提高檢索效率。

②Wcb結構挖掘通常分析頁面間的鏈接結構和組織結構發現重要的信息,用以改進檢索的結果。

③Web使用挖掘常用的一個領域就是對服務器端用戶日志進行挖掘,通過用戶日志挖掘出用戶的興趣,從而獲取用戶的反饋信息,也可以通過對用戶日志里的訪問歷史進行分析來發現有用的用戶訪問模式,為構建用戶的興趣模型提供有效的信息,利用用戶興趣模型對檢索結果的過濾可以提高信息檢索系統的查準率。因此,將Web挖掘技術運用到個性化信息檢索系統中,能夠提高信息檢索的效率及準確度。

3 個性化信息檢索系統體系架構設計

基于Web挖掘的個性化信息檢索系統架構如圖1所示。

圖1 個性化信息檢索系統架構

個性化信息檢索系統的整個運行過程可以描述為:首先,我們利用信息搜集索引模塊中的Spiders來遍歷Internet自動獲取收集文檔信息,并通過過濾、轉換技術對文檔信息進行處理,提取索引項生成索引表,將索引處理過的數據放入索引數據庫;接著,在處理后的數據上利用個性化模型進行相關度檢測,并對搜索結果進行個性化過濾,最終用戶可以搜索到符合自己興趣的個性化結果。因為用戶隨著環境的變化和時間的推移會形成新的興趣,也同樣會對原來感興趣的東西失去興趣,用戶的興趣處于不斷變化之中,所以個性化興趣模型也需要不斷更新。由此可見,我們需要及時根據用戶的興趣變化來調整個性化興趣模型。因此,個性化興趣模型的功能非常重要。利用智能代理能夠實時跟蹤監視用戶行為,分析判斷用戶的瀏覽行為來及時發現用戶興趣的變化。因此,個性化興趣模型的主要工作就是用戶興趣模塊的構建和及時更新。

4 個性化信息檢索系統的組成

該個性化信息檢索系統為了滿足不同用戶個性化檢索的需求,構建用戶興趣模型,采用相關反饋技術過濾掉了大量不相關文檔,有效地提高了用戶進行信息檢索的效率。

根據圖1,系統架構主要包括下面幾個模塊組成:信息搜集索引模塊、用戶興趣建模模塊、用戶興趣自動更新模塊、結果過濾模塊。其中的用戶興趣建模和用戶興趣自動更新模塊構成了個性化模型。本系統考慮了用戶個性化的需求和用戶個體的差異,所以能夠提供更準確更高質量的檢索結果。

①信息搜集索引模塊

利用Spiders來遍歷Internet自動獲取收集文檔信息,并通過過濾、轉換技術對文檔信息進行處理,提取索引項生成索引表,最后將處理過的數據放入索引數據庫。

②用戶興趣建模模塊

本模塊采用一種不需要用戶干預的用戶動態興趣學習方法來生成初始的用戶興趣模型。該模塊通過分析用戶客戶端Wcb緩存中用戶瀏覽過的網頁以及用戶在網頁上的行為,來提煉出用戶的興趣,生成初始化的用戶興趣描述文件。

③用戶興趣自動更新模塊

用戶興趣建模模塊得到的是一個初始化的用戶興趣模型,然而用戶的興趣是動態變化的,如果用戶模型在檢索過程中一直靜態不變,那么根據此用戶模型判斷而做出的輸出結果多半是不準確的。用戶興趣自動更新模塊主要根據用戶的瀏覽行為動態的更新用戶興趣模型。其中用戶在訪問過程中的行為包括了用戶從上網開始到結束的所有動作,比如:用戶對某個頁面的訪問次數、停留時間、是否保存、是否下載等,這些行為動作都能體現出用戶的興趣。本模塊采用智能Agent對用戶瀏覽網頁的所有行為動作進行跟蹤,深度挖掘出隱含在這些行為里的用戶興趣,并隨時對用戶興趣文件進行更新,從而使用戶興趣模型得以動態更新。

用戶興趣建模模塊與用戶興趣自動更新模塊共同構成了個性化模型,也是本系統的重點組成部分。

④結果過濾模塊

本模塊主要利用文本相似度算法比較計算用戶興趣模型和每一個初始結果的相關度,然后依據用戶興趣的相關度按照由大到小的順序返回給用戶,從而使用戶得到個性化的檢索結果,在最大程度上滿足了用戶的個性化需求。

5 個性化信息檢索系統的運行機制

個性化信息檢索系統中各模塊都實現了不同的重要功能,是該系統的核心。這些模塊不但實現的功能各不相同,而且運行機制方式也不盡相同。信息搜集索引模塊和用戶興趣建模模塊是周期運行模塊,用戶興趣自動更新模塊是一個實時運行模塊,結果過濾模塊是按指令調用被動運行的模塊。信息搜集索引模塊周期運行Spiders收集網頁信息,網頁信息經過索引處理后放入索引數據庫。用戶興趣建模模塊按指定的周期執行,周期更新用戶興趣描述文件,實現用戶模型的更新。用戶興趣自動更新模塊實時跟 蹤監視用戶的瀏覽行為,并隨時挖掘用戶的動作來更新用戶的興趣描述文件。結果過濾模塊是只有在查詢請求提交時,才會被調用并執行,是一個不定期被動運行的模塊。

6 小結

本文主要研究了采用Web深度挖掘技術針對個性化信息檢索系統進行總體設計。本系統的設計目的是在為不同用戶提供不同的搜索結果的基礎上為用戶提供能夠滿足用戶興趣的搜索結果,它的前一個功能由個性化模塊實現,后面的功能由結果過濾模塊完成,結果過濾模塊是對初始搜索的結果進行個性化過濾,并依據用戶興趣相關度進行排序,從而使用戶得到滿意的搜索結果。

[1]周迎新,方暉,李欣蔚.基于Web的數據挖掘技術研究[J].科技創新導報.2008(3):25.

[2]林培光.面向Web的個性化語義信息檢索技術[M].北京:中國財政經濟出版社,2009.

[3]張強.搜索引擎—網絡信息檢索方法[J].農業網絡信息.2010(02) .

猜你喜歡
信息檢索搜索引擎用戶
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于神經網絡的個性化信息檢索模型研究
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 亚洲国产欧洲精品路线久久| 青青久视频| 国产v精品成人免费视频71pao| 欧美爱爱网| 国产福利在线免费观看| 亚洲第一天堂无码专区| av一区二区三区高清久久| 国产91精品久久| 日韩经典精品无码一区二区| 精品少妇人妻无码久久| 亚洲最大看欧美片网站地址| 欧美亚洲国产日韩电影在线| 欧美黄色网站在线看| 99re这里只有国产中文精品国产精品 | 久久精品国产精品一区二区| 伊人查蕉在线观看国产精品| 亚洲一区二区三区在线视频| 在线免费无码视频| 波多野结衣无码视频在线观看| 91精品国产一区自在线拍| 91无码人妻精品一区| 国产精品亚洲日韩AⅤ在线观看| A级毛片无码久久精品免费| 日韩精品毛片人妻AV不卡| 亚洲精品欧美日本中文字幕| 欧美国产在线看| 日韩国产黄色网站| 国产精品护士| …亚洲 欧洲 另类 春色| 色婷婷综合在线| 国产精品成人观看视频国产 | 亚洲一区二区三区国产精品| 欧美国产视频| 亚洲精品无码不卡在线播放| 欧美va亚洲va香蕉在线| 国产黑丝一区| 婷婷激情亚洲| 91美女视频在线| 国产欧美日韩在线一区| 亚洲视频无码| 麻豆精品久久久久久久99蜜桃| 亚洲视频免| 亚洲精品国产首次亮相| 国产乱子精品一区二区在线观看| 国产丰满大乳无码免费播放| 国产一区成人| 在线亚洲精品福利网址导航| 国产亚洲精品97在线观看| 欧美精品在线免费| 国产成人av一区二区三区| 丁香婷婷激情综合激情| 波多野结衣久久高清免费| 99re精彩视频| 正在播放久久| 亚洲人成网站在线播放2019| 波多野结衣一区二区三区四区视频| 国内老司机精品视频在线播出| 无遮挡一级毛片呦女视频| 九九久久99精品| 91精品福利自产拍在线观看| 免费看av在线网站网址| 91精品人妻一区二区| 欧美国产精品不卡在线观看 | 日韩精品一区二区三区大桥未久 | 国产麻豆精品久久一二三| 一区二区三区在线不卡免费| 毛片在线播放a| 国内丰满少妇猛烈精品播| 国产亚洲精品自在线| 一本大道香蕉久中文在线播放| 成人国产精品2021| 国产成人久久综合777777麻豆| 毛片久久久| 国产视频自拍一区| 亚洲女同欧美在线| 久久国产精品影院| 2020国产精品视频| 超碰aⅴ人人做人人爽欧美 | 国产91无毒不卡在线观看| 欧美区一区| av尤物免费在线观看| 直接黄91麻豆网站|