999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

BP神經(jīng)網(wǎng)絡(luò)在查詢(xún)結(jié)果排名中的應(yīng)用

2012-11-24 02:17:32劉曉
關(guān)鍵詞:搜索引擎信息

劉曉

(暨南大學(xué) 信息科學(xué)技術(shù)學(xué)院,廣東 廣州 510000)

隨著信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為人們獲知信息的重要渠道。面對(duì)一些門(mén)戶(hù)網(wǎng)站龐大復(fù)雜的信息資源,僅依靠瀏覽器瀏覽的方式來(lái)獲得所關(guān)心的信息是非常困難的,這就促使了站內(nèi)搜索引擎的出現(xiàn)和快速發(fā)展。搜索引擎起到了信息導(dǎo)航的作用,已成為人們獲取信息的有效工具。但是網(wǎng)站的信息量呈爆炸趨勢(shì)增長(zhǎng),每天都有大量新的網(wǎng)頁(yè)出現(xiàn),使得搜索引擎對(duì)信息的覆蓋率和搜索出結(jié)果的相關(guān)性、準(zhǔn)確性在整體上呈下降趨勢(shì)。檢索出的結(jié)果集數(shù)量之多,經(jīng)常都是幾十萬(wàn)條甚至是幾百萬(wàn)條記錄,其中存在著大量的重復(fù)信息或是與檢索主題無(wú)關(guān)的信息,要想從中快速、準(zhǔn)確地找出所需要的信息變得越來(lái)越困難。

目前簡(jiǎn)單關(guān)鍵字搜索已經(jīng)無(wú)法滿(mǎn)足需要,智能化搜索是未來(lái)發(fā)展的必然趨勢(shì)[1]。本文通過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)的深入了解,設(shè)計(jì)并實(shí)現(xiàn)了用BP神經(jīng)網(wǎng)絡(luò)對(duì)站內(nèi)搜索結(jié)果進(jìn)行排名,讓用戶(hù)得到更好的體驗(yàn)。

1 BP神經(jīng)網(wǎng)絡(luò)概述

神經(jīng)網(wǎng)絡(luò)最早是由心理學(xué)家和神經(jīng)學(xué)家提出的,旨在尋求開(kāi)發(fā)和測(cè)試神經(jīng)的計(jì)算模擬。粗略地說(shuō),神經(jīng)網(wǎng)絡(luò)是一組連接的輸入/輸出單元,其中每個(gè)連接都與一個(gè)權(quán)相相聯(lián)。在學(xué)習(xí)階段,通過(guò)調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán),使得能夠預(yù)測(cè)輸入樣本的正確類(lèi)標(biāo)號(hào)來(lái)學(xué)習(xí)。由于單元之間的連接,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)又稱(chēng)連接者學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)需要很長(zhǎng)的訓(xùn)練時(shí)間,因而對(duì)于有足夠長(zhǎng)訓(xùn)練時(shí)間的應(yīng)用更合適。它需要大量的參數(shù),這些通常主要靠經(jīng)驗(yàn)確定,如網(wǎng)絡(luò)拓?fù)浠颉敖Y(jié)構(gòu)”[2]。

神經(jīng)網(wǎng)絡(luò)的一個(gè)例子如圖1所示。輸入對(duì)應(yīng)于對(duì)每個(gè)訓(xùn)練樣本度量的屬性,輸入同時(shí)提供給稱(chēng)作輸入層的單元層。這些單元的加權(quán)輸出依次同時(shí)地提供給稱(chēng)作隱藏層的“類(lèi)神經(jīng)元的”第二層;該隱藏層的加權(quán)輸出可以輸入到另一個(gè)隱藏層;如此下去。隱藏層的數(shù)量是任意的,盡管實(shí)踐中通常只用一層。最后一個(gè)隱藏層的加權(quán)輸出作為構(gòu)成輸出層的單元的輸入。輸出層發(fā)布給定樣本的網(wǎng)絡(luò)預(yù)測(cè)。

2 用于對(duì)查詢(xún)結(jié)果排名的神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)

神經(jīng)網(wǎng)絡(luò)可以有多個(gè)中間層,不過(guò)在本文中,只使用一層。對(duì)輸入的組合結(jié)果就是一組單詞,因此可以將這一層看作是“查詢(xún)層”。圖2是本文神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。所有位于輸入層中的節(jié)點(diǎn)都與所有位于隱藏層中的節(jié)點(diǎn)相連,而所有位于隱藏層中的節(jié)點(diǎn)也都與所有位于輸出層中的節(jié)點(diǎn)相連。

圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

圖2 本文神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

為了讓神經(jīng)網(wǎng)絡(luò)得到最佳查詢(xún)結(jié)果,本文將與查詢(xún)條件中出現(xiàn)的單詞對(duì)應(yīng)的輸入節(jié)點(diǎn)設(shè)值為1。這些節(jié)點(diǎn)的輸出端開(kāi)啟后,會(huì)試圖激活隱藏層,相應(yīng)地位于隱藏層中的節(jié)點(diǎn)如果得到一個(gè)足夠強(qiáng)力的輸入,就會(huì)觸發(fā)其輸出端,并試圖激活位于輸出層中的節(jié)點(diǎn)。位于輸出層中的節(jié)點(diǎn)將處于不同程度的活躍狀態(tài),可以利用其活躍程度來(lái)判斷一個(gè)URL與原查詢(xún)中出現(xiàn)的單詞在相關(guān)性上的緊密程度[3]。最終的結(jié)果取決于被逐漸糾正的連接強(qiáng)度,因此只要有人執(zhí)行搜索,并從結(jié)果中選擇鏈接,就對(duì)該網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

如圖 3所示,許多人已在搜索“apple iphone”之后,點(diǎn)擊過(guò)有關(guān)apple iphone的相關(guān)結(jié)果,而這一點(diǎn)加強(qiáng)了單詞與URL的聯(lián)系。

圖3 應(yīng)用示例

BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶(hù)搜索習(xí)慣過(guò)程如下:

(1)用戶(hù)輸入查詢(xún)?cè)~ word 1(或者查詢(xún)?cè)~組 word 1,word 2…),搜索引擎根據(jù)該詞與查詢(xún)層之間的連接權(quán)重計(jì)算隱層節(jié)點(diǎn)的輸出(實(shí)際上表示的是第i個(gè)搜索詞與第j個(gè)查詢(xún)層之間的關(guān)聯(lián)程度)[4]。作用函數(shù)采用經(jīng)驗(yàn)函數(shù):

隱藏層節(jié)點(diǎn)的輸出為:

其中,Oi表示第i個(gè)輸入點(diǎn)的取值,但一般認(rèn)為搜索詞之間沒(méi)有重要性的差別,所以輸入值均為1。因此輸出調(diào)整為:

此時(shí),實(shí)際上表示的是搜索詞word1+KeyWords[i]對(duì)排名的影響權(quán)重,表示的是關(guān)鍵詞節(jié)點(diǎn)的閾值。

(2)計(jì)算網(wǎng)頁(yè)的排名權(quán)重:

其中,Oi表示第1個(gè)網(wǎng)頁(yè)的排名權(quán)重,表示的是Word 1+KeyWords[i]與第1個(gè)網(wǎng)頁(yè)的連接權(quán);i表示的是網(wǎng)頁(yè)節(jié)點(diǎn)的閾值。

(3)訓(xùn)練網(wǎng)絡(luò),根據(jù)計(jì)算的輸出值與真實(shí)值之間的誤差修正連接權(quán)和影響權(quán)。這里的真實(shí)值是用戶(hù)對(duì)搜索到的網(wǎng)頁(yè)的點(diǎn)擊順序(或者點(diǎn)擊頻率)歸一化后的結(jié)果。

誤差控制為:

其中,p為訓(xùn)練樣本的個(gè)數(shù),n為網(wǎng)頁(yè)節(jié)點(diǎn)的個(gè)數(shù),tl為該網(wǎng)頁(yè)節(jié)點(diǎn)的真實(shí)值(歸一化后的實(shí)際權(quán)重)。

輸出層到隱層的修正。誤差公式為:

影響權(quán)修正:

其中,k為迭代次數(shù)。閾值修正:

隱藏層到輸入層的修正,誤差公式為:

影響權(quán)修正:

閾值修正:

本文討論了BP神經(jīng)網(wǎng)絡(luò)在搜索結(jié)果排名中應(yīng)用,反向推理出搜索詞與隱藏層在相關(guān)性上的緊密程度以及隱藏層對(duì)搜索結(jié)果排序的影響權(quán)重,使搜索引擎更具智能化,提高了搜索的精度與靈活性。

[1]HATCHER E,GOSPODNETIC O.Lucene in action[M].Manning Publications,2004.

[2]Han Jiawei,KAMBER M.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小鋒,譯.北京:機(jī)械工業(yè)出版社,2007.

[3]SEGARAN T.Programming collective intelligence[M].O′Reilly Media,2007.

[4]王紅霞.神經(jīng)網(wǎng)絡(luò)BP算法在網(wǎng)絡(luò)搜索中的應(yīng)用[J].微計(jì)算機(jī)信息,2007,23(15):53.

猜你喜歡
搜索引擎信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
展會(huì)信息
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
廣告主與搜索引擎的雙向博弈分析
知識(shí)漫畫(huà)
搜索,也要“深搜熟濾”
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲精品黄| 麻豆国产在线观看一区二区| 国产欧美视频综合二区| 亚洲床戏一区| 久久中文字幕2021精品| 美女无遮挡免费视频网站| 成人国产精品网站在线看| 国产av色站网站| 亚洲精品色AV无码看| 国精品91人妻无码一区二区三区| 久久美女精品| 亚洲成人在线网| 亚洲精品视频免费看| 亚洲专区一区二区在线观看| 日日拍夜夜嗷嗷叫国产| 国产高清不卡| 无码精品福利一区二区三区| 国产成人综合网| 一级看片免费视频| 国产成人久视频免费| 亚洲综合香蕉| 国产9191精品免费观看| 久久免费视频6| 精品久久综合1区2区3区激情| 在线观看欧美国产| 国产精品任我爽爆在线播放6080 | 小13箩利洗澡无码视频免费网站| 久久精品亚洲热综合一区二区| 国产精品熟女亚洲AV麻豆| 欧美中文字幕在线播放| 亚洲乱码在线视频| 91久久偷偷做嫩草影院| 精品国产成人a在线观看| 91色国产在线| 亚洲伊人电影| 亚洲国产看片基地久久1024| 国产成年女人特黄特色大片免费| 亚洲swag精品自拍一区| 久久久91人妻无码精品蜜桃HD| 毛片免费网址| 精品午夜国产福利观看| 91久久青青草原精品国产| 国产精品所毛片视频| 亚洲91在线精品| 久视频免费精品6| 亚洲美女AV免费一区| 色悠久久久久久久综合网伊人| 亚洲AV无码一二区三区在线播放| 99视频在线免费看| 中文字幕在线不卡视频| 白浆视频在线观看| 免费毛片在线| 色婷婷电影网| 午夜不卡福利| 国产精品自拍露脸视频| 国产乱子精品一区二区在线观看| 国产精品自在自线免费观看| 亚洲中文字幕在线观看| 强乱中文字幕在线播放不卡| 亚洲最新在线| 色综合天天娱乐综合网| 亚洲日韩精品无码专区97| 狠狠做深爱婷婷综合一区| 日韩视频精品在线| 亚洲综合片| 国产菊爆视频在线观看| 国产剧情伊人| 国产主播在线一区| 五月婷婷导航| 97se亚洲综合| 亚洲无码37.| 亚洲综合经典在线一区二区| 九九这里只有精品视频| 试看120秒男女啪啪免费| 一本色道久久88| 99成人在线观看| 日本高清成本人视频一区| 美女扒开下面流白浆在线试听| 久久久成年黄色视频| 不卡国产视频第一页| 色妞www精品视频一级下载| 欧美日韩精品一区二区在线线|