999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于層次分析法的網頁排序技術

2015-07-02 18:14:08呂嘉慧
山東工業技術 2015年13期
關鍵詞:搜索引擎層次分析法

摘 要:在大數據時代,網頁搜索的效率和質量要求越來越高,本文在研究分析層次分析法原理的基礎上,提出了基于此的網頁搜索排序技術和處理方法,通過仿真實證了該方法的可行性和有效性。

關鍵詞:搜索引擎;層次分析法;網頁排序

1 概要

經過多年的探索發展,向量空間模型、語言模型、布爾模型、鏈接分析算法、相關性排序模型等都曾或正被應用到搜索引擎中。目前用得比較多的排序算法是在鏈接分析算法的基礎上加入更多的排序因素:關鍵詞在網頁中出現的位置、點擊次數和網頁被引用次數等。這些方法最大的不足是不同用戶搜索得到的網頁結果排序是一樣。

2 層次分析法

2.1 層次分析法原理

層次分析法(AHP),其主要思想是通過對復雜系統的有關要素及其相互關系進行分析,將其簡化為有序的遞階層次結構,使這些要素歸類到不同的層次,形成一個多層次的分析結構模型,最終把系統分析轉化為確定最低層(決策方案)相對于最高層(總目標)的相對重要性權值的問題。

AHP使用時先將問題中的因素劃分到不同層次中,利用一致矩陣法確定各層次因素間的權重,經過歸一化得出由同層次因素對于上一層次某因素的相對重要性的權值所組成的矩陣。然后計算某層次所有因素對最高層相對重要性的權值。兩次相對重要性權值計算都需進行一致性檢驗。

AHP實現網頁排序的原理是以網頁和搜索關鍵詞之間的相關度為最高層,點擊次數、詞頻、詞位置、引用次數、瀏覽時間和用戶個人信息作為中間層,搜索的結果網頁為最底層。通過結合搜索和層次分析法排序完成搜索任務。

2.2 基于層次分析的網頁排序

首先對用戶提交的關鍵詞進行同義詞查詢,基于關鍵詞及其同義詞進行擴展查詢,查詢返回關鍵詞在頁面中的位置、瀏覽平均時間、點擊率、被引用次數等信息,然后對返回的結果頁面結合AHP分析得出相關性排序網頁,最終向用戶反饋排序結果。

假設用戶提交關鍵詞后得到5個頁面,為得到的頁面創建SearchedPage實例。該實例有以下字段:id(頁面在DB中的編號),relevance(關鍵詞與頁面的相關程度),hitWeight(頁面被點擊次數權重,/100),refWeight(頁面被引用次數權重),posWeight(關鍵詞位置權重,根據關鍵詞第一次出現的位置判斷,標題部分取20,正文按每10%減1,正文前10%取10),freWeight(關鍵詞頻率權重,*100),readTWeight(頁面平均瀏覽時間權重,*100),cusWeight(用戶個性化相關權重,頁面類別與用戶愛好匹配取3,否則取1),synWeight(詞義距離權值,取值0-5,直接匹配取0)。假設這5個頁面:(hitWeight,refWeight,posWeight,freWeight,readTWeight,cusWeight,synWeight)

5個頁面取值分別為:P1(9.6,24,20,0.93,2.7,1,1),P2(3.1,7,9,0.2,1.76,1,1),P3(8.2,13,10,0.98,0.84,3,1),P4(9.7,8,10,1.15,0.79,1,0),P5(5.4,36,20,0.81,0.8,3,2)。利用AHP求解relevance。

根據中間層因素對relevance取值的影響程度,建立比較矩陣T,其中t12= 1/3表示作者認為關鍵詞在頁面中的位置比其出現頻率更重要。

通過計算,得比較矩陣T的最大特征根λ=7.3,相應特征變量為W=(0.11,0.34,0.05,0.24,0.10,0.08,0.09)T,一致性檢驗指標CI = (λ- n)/(n - 1) = 0.05,n = 7。查表知隨機一致性指標為RI=1.32,一致性比率CR=CI/RI=0.038<0.1,通過一致性檢驗。

根據SearchedPage屬性值,構建P1到P5實例對freWeight等指標的判斷矩陣,如下。

因為篇幅有限,本文不列出K2—K10,只給出K2—K10比較矩陣的最大特征值λi(i=1,2,3,……,7)與對應的特征向量Wi(i=1,2,3,……,7)。

λ1=10.04 W1=(0.14,0.05,0.16,0.14,0.12)

λ2=10.86 W2=(0.13,0.02,0.08,0.10,0.17)

λ3=10.09 W3=(0.17,0.03,0.14,0.17,0.11)

λ4=10.11 W4=(0.19,0.07,0.07,0.05,0.04)

λ5=10.12 W5=(0.12,0.03,0.08,0.04,0.25)

λ6=10.01 W6=(0.03,0.04,0.19,0.03,0.18)

λ7=10.29 W7=(0.11,0.03,0.12,0.13,0.07)

算出K1—K10最大特征值、特征向量對應的CI、CR知通過一致性檢驗,層次總排序一致性比率:CR=(t1CI1+t2CI2+L+a7CI7)/(a1RI1+a2RI2+L+a7RI7),其中:(t1,t2,t3,t4,t5,t6,t7)T=(0.11,0.34,0.05,0.24,0.10,0.08,0.09)T,算得CR=0.032,CR<0.1通過檢驗。

因此,通過同義詞和個性化搜索后得到SearchedPage的5個實例P1、P2、P3、P4、P5排序為P1、P5、P3、P4、P2。

3 結語

基于層次分析的搜索排序技術可以較好的解決傳統的同義詞擴展方式又會帶來更多的查詢結果難以合理排序的問題,并有利于提高搜索的精確率和覆蓋率。

參考文獻:

[1]常璐,夏祖奇.搜索引擎的幾種常用排序算法[D].圖書情報工作,2003(06).

[2]金祖旭,李敏波.基于用戶反饋的搜索引擎排名算法[Z].計算機系統應用,2010(12).

作者簡介:呂嘉慧(1993-),女,廣東佛山人,本科,研究方向:搜索引擎。endprint

猜你喜歡
搜索引擎層次分析法
微電子科學與工程專業評價指標體系研究
大學教育(2016年11期)2016-11-16 20:27:55
基于AHP—GRA的工程施工項目進度風險管理研究
價值工程(2016年29期)2016-11-14 01:02:43
關于三江源生態移民創業能力評價指標體系構建的研究
基層社會管理關鍵績效指標體系構建研究
中國市場(2016年35期)2016-10-19 02:03:21
基于層次分析法的乳制品品牌顧客滿意度實證研究
中國市場(2016年35期)2016-10-19 01:52:09
基于模糊綜合評價模型對道路擁堵的研究
商(2016年27期)2016-10-17 07:03:47
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
Nutch搜索引擎在網絡輿情管控中的應用
警察技術(2015年3期)2015-02-27 15:37:09
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
主站蜘蛛池模板: 亚洲成a人片7777| 日本高清免费一本在线观看 | 亚洲精品综合一二三区在线| 在线观看视频99| 国产在线观看91精品亚瑟| 日本高清免费不卡视频| 久久一日本道色综合久久| 色妞www精品视频一级下载| 狠狠色综合网| 国产凹凸视频在线观看| 国产精品尤物在线| 精品少妇人妻一区二区| 亚洲第一中文字幕| 国产亚洲精品无码专| 99尹人香蕉国产免费天天拍| 国产尤物视频在线| 欧美日韩一区二区在线免费观看 | 国产一级二级在线观看| 亚洲伦理一区二区| 国产精品yjizz视频网一二区| 欧美日韩在线国产| 精品视频在线观看你懂的一区| 亚洲人成人无码www| 97色伦色在线综合视频| 就去吻亚洲精品国产欧美| 欧美精品v日韩精品v国产精品| 四虎影视国产精品| 国产精品免费露脸视频| 亚洲高清日韩heyzo| 久久天天躁狠狠躁夜夜躁| 伊人成人在线| 亚洲中文在线看视频一区| 亚洲乱码视频| 91九色最新地址| 精品久久久久无码| 欧美精品成人一区二区在线观看| 伊人久久久久久久久久| 欧美在线黄| 久久久成年黄色视频| 亚洲国内精品自在自线官| 五月丁香在线视频| 四虎精品黑人视频| 白浆视频在线观看| 亚洲国产在一区二区三区| 伊人网址在线| 色哟哟国产精品一区二区| 色窝窝免费一区二区三区 | 国产成人综合欧美精品久久| 国产精品女人呻吟在线观看| 又大又硬又爽免费视频| 精品视频第一页| 国产呦精品一区二区三区下载| 久久久久人妻一区精品| 精品欧美一区二区三区久久久| 国产成在线观看免费视频| 亚洲swag精品自拍一区| 日韩欧美在线观看| 国产后式a一视频| 国产精品自拍合集| 久久99国产乱子伦精品免| 国产成人高清精品免费5388| 久精品色妇丰满人妻| 日本www在线视频| 色天天综合| 99国产精品国产| 日本午夜网站| 欧美色视频日本| 精品一区二区三区自慰喷水| 欧美一区国产| 欧美国产菊爆免费观看| 久久精品娱乐亚洲领先| 爆乳熟妇一区二区三区| 亚洲视频二| 手机成人午夜在线视频| 免费99精品国产自在现线| 欧美一区精品| 日本亚洲最大的色成网站www| 亚洲中文久久精品无玛| 国产欧美精品一区二区| 蝌蚪国产精品视频第一页| 国产激爽大片在线播放| 欧美第二区|