999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

主題網站推薦系統概要設計

2017-05-30 00:19:10王子安
科技尚品 2017年2期

王子安

摘 要:本文探討當一個主題網站積累了足夠多的用戶數據量時。結合基于用戶和物品的協同過濾算法,對網站信息進行篩選,準確的推薦給用戶感興趣的內容。

關鍵詞:個性化推薦;推薦引擎;熱度推薦;協同算法

1 前言

隨著信息技術和互聯網的發展。人們逐漸從信息匱乏走到了信息泛濫的時代。在這個時代,無論是信息消費者還是信息生產者都遇到了很大的挑戰。推薦系統聯系用戶和信息,一方面幫助用戶發現對自己有價值的信息,一方面能夠讓信息自動展現在對它有興趣的用戶面前,從而實現信息消費者和信息生產者雙贏。

2 推薦系統概要

2.1 推薦系統和其他系統的關系

推薦系統要發揮強大的作用,除了推薦系統本身,主要還依賴于兩個條件——界面展示和用戶行為數據。好的推薦界面共性有:通過一定方式展示物品,主要包括物品的標題、縮略圖和介紹等。很多推薦界面都提供了推薦理由,理由可以增加用戶對推薦結果的信任度。推薦界面還需要提供一些按鈕讓用戶對推薦結果進行反饋,這樣才能讓推薦算法不斷改善用戶的個性化推薦體驗。

2.2 推薦系統基本架構

設置引擎的好處:

(1)可以方便的應用于其他系統

(2)可以方便地增加/刪除引擎,控制不同引擎對推薦結果的影響。對于絕大多數需求,只需要通過不同的引擎組合實現。

(3)可以實現推薦引擎級別的用戶反饋。每一個推薦引擎其實代表了一種推薦策略,而不同的用戶可能喜歡不同的推薦策略。

3 算法說明

個性化推薦算法選擇:

協同過濾系統分為基于用戶(user)和基于物品(item)兩種。基于用戶的算法主要是依據尋找和該用戶近似的用戶,通過近似用戶的興趣愛好進行推薦。基于物品的算法主要是尋找到近似的物品進行推薦。

基于用戶的協同過濾算法特點是,推薦內容的種類會比較豐富,缺點是多數為熱門物品,長尾物品可能不會出現在推薦內容中,另外就是用戶過少的前提下會失去精準度。基于物品的協同過濾算法特點是,推薦的內容種類會比較單一,但不會漏掉長尾物品。所以,這點上來看,這兩種算法從一定程度上是互補的。

根據統計,使用用戶協同算法和使用物品協同算法從最終結果上來看,會有50%的一致性,另外50%可能是毫不相干的。

基于主題網站的情況,選擇用戶協同算法較為合適,就目前情況而言,可以使用用戶和物品協同過濾的混搭。

3.1 基于用戶的算法

(1)尋找近似用戶

把目標用戶和數據庫的用戶進行比較,找出和目標用戶最近似的N個用戶。實際操作過程中,我們會發現,當用戶數量級較大的時候,計算時間會非常長。但實際情況是,數據庫的大部分用戶可能是沒有交集的,所以沒必要計算所有用戶,只計算和目標用戶有交集的用戶。

(2)選取有交集的用戶

我們可以通過有過相同行為(例如關注過同一個話題)的用戶來進行篩選。這里篩選的條件需要推敲,篩選條件太簡單還是會造成運算量太大,篩選條件太過嚴格會使得目標用戶得到推薦的門檻變得較高。所以,推薦以下方式進行篩選,條件間為邏輯或關系,即滿足其一即可:

優先級說明:優先級表示優先判斷的條件,如果滿足,無需判斷條件2,如果不滿足,繼續判斷條件2。條件不宜過多,會導致初篩運算量巨大。條件亦不宜過少,過少會導致初篩力度不夠,后期運算量巨大。

(3)計算用戶相似度

用戶相似度計算方法一般采用余弦或者杰卡德,這邊推薦使用杰卡德(jaccard)算法,因為根據用戶行為的那些量并不是特別好余弦化,而且兩者結果很接近。杰卡德算法一般應用于網頁去重,過濾相似度很高的新聞,算法也比較好理解,就是兩個集合的交集除以兩個集合的并集,所得結果就是兩個集合的相似度,數學表達式就是:|S ∩ T|/|S ∪ T|(相似度集合見“用戶偏好”)。這里算出用戶相似度后,要從高到低排序,并且設定一個閥值。例如,我們將閥值設定為5,那么就是按相似度由高到低排序取前5名用戶作為最相似的5個用戶,并且列出相似度值,如下圖“表1”所示:

(4)推薦好友、話題、文章

首先對于推薦的用戶、話題、文章都要設置上限,假設用戶設定為3、話題設定為5、文章設定為5。

①推薦好友

根據“表1”,由高到低的順序,依次推薦用戶1~用戶3。

②推薦話題、文章

我們假設有如下數據:

那么話題推薦度的算法如下,

話題1推薦度 = 用戶1相似度 + 用戶3相似度 = 0.7+ 0.6 = 1.3。

話題2推薦度 = 用戶1相似度 + 用戶2相似度 + 用戶4相似度 + 用戶5相似度 = 2.42。

以此類推得到,話題3推薦度是0.7,話題4推薦度是1.3,話題5推薦度是0.65,話題6推薦度是1.07,話題7推薦度是0.57。由高到低排序依次選取5個,分別是話題2、話題1、話題4、話題6和話題3。如下:

話題 推薦度

話題2 2.42

話題1 1.3

話題4 1.3

話題6 1.07

話題3 0.7

3.2 基于物品的算法

一些準備工作同基于用戶的算法,這里不再重復。

計算物品相似度公式說明:

果變的不準確。這樣的話,可以修改公式為,懲罰物品j的權重。相似度值肯定小于等于1。

3.3 兩者結合的算法

根據統計,使用用戶協同算法和使用物品協同算法從最終結果上來看,會有50%的一致性,另外50%可能是毫不相干的。這里可以使用2種算法結果的并集,并且將交集作為重點推薦。

例如,基于用戶的推薦列表為 a,b,c,d,e,f

基于物品的推薦列表為,a,x,y,b,f,z

重點推薦:a,b,f

推薦:c,d,e,x,y,z

參考文獻

[1]項亮.推薦系統實踐[M].人民郵電出版社,2012.

[2](奧地利)詹尼士.推薦系統[M].人民郵電出版社,2013.

(作者單位:貴陽市第一中學)

主站蜘蛛池模板: 午夜国产在线观看| 日本午夜影院| 成人午夜免费观看| 久久久噜噜噜| 日韩精品一区二区三区中文无码| 久久午夜夜伦鲁鲁片不卡| 欧美中文字幕一区| a级免费视频| 天天躁夜夜躁狠狠躁图片| 影音先锋丝袜制服| 国产成a人片在线播放| 亚洲欧美日韩中文字幕一区二区三区| 国产一区自拍视频| 老司国产精品视频| 亚洲综合久久一本伊一区| 视频二区国产精品职场同事| 亚洲AⅤ波多系列中文字幕| 亚洲日本中文综合在线| 国产一区二区三区日韩精品| 亚洲无码高清免费视频亚洲 | 伊人网址在线| 国产成人艳妇AA视频在线| 女人18毛片久久| 亚卅精品无码久久毛片乌克兰| 亚洲欧美成人在线视频| 在线无码私拍| 一区二区偷拍美女撒尿视频| a亚洲天堂| 国产欧美日韩综合一区在线播放| 91久久大香线蕉| 国产精品手机在线观看你懂的| 欧美日韩一区二区三区在线视频| 国产拍在线| 欧美日韩中文字幕在线| 亚洲欧美一区在线| 男人天堂亚洲天堂| 波多野结衣一区二区三区四区视频| 国产精品第5页| 久久人与动人物A级毛片| 日韩午夜伦| 波多野结衣第一页| 亚洲va欧美ⅴa国产va影院| 久久综合国产乱子免费| 国产AV毛片| 国产视频一二三区| 国产一区二区三区免费观看| 日韩中文精品亚洲第三区| a天堂视频在线| 91小视频版在线观看www| 美女内射视频WWW网站午夜 | 91无码人妻精品一区二区蜜桃| 国产91小视频在线观看| 日本国产精品| a网站在线观看| 亚洲高清资源| 日韩欧美网址| 人妻21p大胆| 五月天丁香婷婷综合久久| 国产高清自拍视频| 国产成人无码久久久久毛片| 91青青草视频在线观看的| 人人爱天天做夜夜爽| 中文字幕日韩丝袜一区| 98超碰在线观看| 国产激情第一页| 国产微拍精品| 亚洲首页国产精品丝袜| 2021最新国产精品网站| 亚洲欧美日韩中文字幕在线| 日本午夜三级| 国产精品99一区不卡| 国产亚洲欧美日本一二三本道| av无码久久精品| 国产 在线视频无码| 99久久精品国产麻豆婷婷| 波多野结衣的av一区二区三区| 亚洲国产黄色| 1024你懂的国产精品| 国产在线视频二区| 亚洲欧美精品在线| 国产美女无遮挡免费视频网站| 情侣午夜国产在线一区无码|