999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Boosting框架的推薦系統(tǒng)架構(gòu)與優(yōu)化

2020-08-03 07:58:33劉彥伯溫雪巖徐克生于鳴
現(xiàn)代電子技術(shù) 2020年8期

劉彥伯 溫雪巖 徐克生 于鳴

摘? 要: 現(xiàn)如今推薦算法已得到廣泛應(yīng)用,但大多數(shù)推薦算法均存在各自的局限性。針對這一問題,提出一種基于Boosting框架的推薦系統(tǒng)架構(gòu),以多種基本推薦算法為基礎(chǔ),集成一個強(qiáng)推薦系統(tǒng)。將基于Boosting的推薦系統(tǒng),在MovieLens 100K中進(jìn)行測試。測試與分析結(jié)果表明,該系統(tǒng)測試結(jié)果顯示Precision達(dá)到39.44%,比原來提高8.63%。因此,集成的推薦系統(tǒng)能夠有效提升推薦效果,為用戶提供良好的用戶體驗(yàn)。

關(guān)鍵詞: 推薦系統(tǒng); 系統(tǒng)架構(gòu); 系統(tǒng)優(yōu)化; Boosting框架; 系統(tǒng)集成; 系統(tǒng)測試

中圖分類號: TN911?34; TP391? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)08?0019?03

Architecture and optimization of recommendation system based on Boosting framework

LIU Yanbo1, WEN Xueyan1, XU Kesheng2, YU Ming1

(1. School of Information and Computer Engineering, Northeast Forestry University, Harbin 150040, China;

2. Harbin Institute of Forestry Machinery, State Forestry Administration, Harbin 150086, China)

Abstract: Nowadays, the recommendation algorithms have been widely used in various fields, but most of them have their own limitations. A recommendation system architecture based on Boosting framework is proposed to solve this problem, by which a strong recommendation system is integrated on the basis of a variety of basic recommendation algorithms. The Boosting?based recommendation system is tested in MovieLens 100K. The testing and analysis results show that the precision of the system reaches 39.44%, which is 8.63% higher than that of the original system. Therefore, the integrated recommendation system can effectively improve the recommendation effect and provide users with a good experience.

Keywords: recommendation system; system architecture; system optimization; Boosting framework; system integration; system testing

0? 引? 言

隨著網(wǎng)絡(luò)的發(fā)展與信息時代的來臨,網(wǎng)絡(luò)上各類的信息數(shù)據(jù)逐漸擴(kuò)大。面對大幅增長的信息,用戶通常不清楚自身所需的信息是否存在或如何獲取信息。且用戶難以從中選出實(shí)際有用的信息,從而出現(xiàn)信息超載問題[1]。為此,各學(xué)者提出了推薦系統(tǒng),其可根據(jù)用戶的信息,如以往的消費(fèi)記錄、愛好等,將用戶感興趣的商品或新聞推薦給用戶[2?3]。

推薦系統(tǒng)現(xiàn)已廣泛應(yīng)用于較多領(lǐng)域[4],但各種推薦系統(tǒng)均存在不同的問題。例如,基于ItemCF[5]的推薦系統(tǒng),只分析了該用戶以往感興趣或相似的商品,而并不能顯式地得到其他用戶的判斷情況;而基于UserCF[6]的推薦系統(tǒng),則依賴于和該用戶興趣相似的其他用戶喜好[7]。為更加全面地分析用戶的喜好,并進(jìn)一步提升用戶滿意度與推薦效果。本文引入Boosting算法的思想,其主要是將多個分類器組合在一起,構(gòu)成一個分類效果更強(qiáng)的分類器[8]。文中指在基于UserCF算法的推薦與時間上下文的推薦[9?10]為基礎(chǔ),提出一種基于Boosting的推薦系統(tǒng)架構(gòu)。

1? 基于Boosting框架的推薦系統(tǒng)

基于Boosting框架的推薦系統(tǒng)是將較多基本推薦系統(tǒng)相集成,形成一個效果優(yōu)良的推薦系統(tǒng)。在本文中,將采用基于ItemCF算法的推薦、UserCF算法的推薦和時間上下文的推薦作為基本推薦系統(tǒng),如圖1所示。

1.1? 基本推薦算法

在本節(jié)中,將依次介紹集成的推薦系統(tǒng)中3個基本推薦算法:基于ItemCF的推薦、基于UserCF的推薦和基于時間上下文的推薦。

1.1.1? 基于ItemCF的推薦

ItemCF的核心思想是,給用戶推薦其過去消費(fèi)商品的相似商品。基于ItemCF的推薦算法主要分為兩個步驟:

1) 計(jì)算商品之間的相似度

用戶感興趣的商品通常局限于某幾個類別,在同一用戶消費(fèi)清單上的不同商品,一般認(rèn)為其位于有限的商品類別中;在不同用戶消費(fèi)清單上的相同商品,一般認(rèn)為其屬于同類別的商品。因此,有較大的相似度。商品之間的相似度計(jì)算公式為:

式中:[Wi,j]表示商品i和j之間的相似度;[Ni]表示喜歡商品i的用戶集合;[Ni]表示喜歡商品i的用戶個數(shù)。

2) 計(jì)算用戶U對一個商品的興趣

利用式(2)計(jì)算用戶對商品的興趣。

式中:[Pu,j]表示用戶u對商品j的興趣;Sj,k表示和商品j相似度較高的前k個商品;Nu表示用戶u消費(fèi)過的商品;ru,i表示用戶u對商品i的評分。

1.1.2? 基于UserCF的推薦

UserCF的核心思想是,具有相同愛好的用戶可能會喜歡同樣的商品。因此,將與當(dāng)前用戶有相同愛好的其他用戶消費(fèi)過的商品推薦給他。基于UserCF的推薦算法主要包括兩個步驟:

1) 找到與目標(biāo)用戶具有相同喜好的用戶集合

不同的用戶相同的消費(fèi)產(chǎn)品越多,則說明這些用戶的興趣愛好越相似。UserCF就是利用這種用戶行為的相似性來計(jì)算興趣相似度,計(jì)算公式為:

在UserCF算法中,[Wu,v]表示用戶u和用戶v的相似度;Nu表示用戶u消費(fèi)過商品的集合;Nv表示用戶v消費(fèi)過商品的個數(shù)。

2) 找到用戶集合中其他用戶消費(fèi)過,但當(dāng)前用戶沒有消費(fèi)過的商品

給用戶推薦與其具有相同喜好的K個用戶消費(fèi)過的商品,首先找到K個用戶喜歡而用戶沒有消費(fèi)過的商品,計(jì)算用戶對這種商品的感興趣程度并進(jìn)行排序。然后,給用戶推薦興趣程度較高的幾種商品。用戶對某種商品的興趣程度計(jì)算公式為:

式中:[Pu,i]表示用戶u對商品i的感興趣程度;Ni表示過去消費(fèi)過商品i的用戶;rv,i表示用戶v對商品i的評分。

1.1.3? 基于時間上下文的推薦

以上算法均未考慮時間因素,從而對推薦系統(tǒng)的準(zhǔn)確率有一定影響。在得到用戶消費(fèi)的時間信息后,其可改進(jìn)相似度計(jì)算,如下:

式中:[Tui]表示用戶u在時間[Tui]中消費(fèi)過商品i;α表示時間衰減參數(shù),其取值隨系統(tǒng)用戶興趣的變化而變化,變化越快,取值越大,反之亦然。

時間信息不僅會影響相關(guān)表的計(jì)算,也會對推薦結(jié)果產(chǎn)生影響。用戶當(dāng)前消費(fèi)的商品通常與最近該用戶的消費(fèi)相關(guān),計(jì)算公式為:

式中,[T0]表示當(dāng)前時間。

1.2? 集成的推薦系統(tǒng)

XGBoost算法是當(dāng)前最流行的集成算法之一,本文采用XGBoost算法框架構(gòu)建集成推薦系統(tǒng)。

1.2.1? XGBoost算法

XGBoost算法主要是通過構(gòu)建多個隨機(jī)樹提高預(yù)測效果。

XGBoost的預(yù)測模型為:

式中:K表示構(gòu)建的隨機(jī)樹總個數(shù);[fk(xi)]表示第k棵隨機(jī)樹,在本文中表示第k個基本推薦系統(tǒng);[yi]表示推薦商品列表。

損失函數(shù)為:

式中:i表示樣本;[lyi,yi]表示樣本i的預(yù)測誤差,誤差越小越優(yōu);[Ωfk]表示樹的復(fù)雜度,泛化能力的強(qiáng)弱與復(fù)雜度高低呈負(fù)相關(guān)。

1.2.2? 基于XGBoost的推薦系統(tǒng)

XGBoost算法屬于Boosting算法,其本質(zhì)是將多個分類效果一般的分類器組合成一個分類效果較強(qiáng)的分類器。

推薦系統(tǒng)主要是將用戶感興趣的商品選出來推薦給用戶,在一定層面上可視為對系統(tǒng)中的商品進(jìn)行二分類,即用戶感興趣的商品與用戶不感興趣的商品。因此,本文將幾個基本推薦算法作為商品的弱分類器進(jìn)行串聯(lián),集成一個推薦效果較強(qiáng)的推薦系統(tǒng)。

2? 試驗(yàn)和分析

2.1? 試驗(yàn)數(shù)據(jù)集

基于Boosting的推薦系統(tǒng)將在公開數(shù)據(jù)集MovieLens 100K中進(jìn)行測試。本文采用的MovieLens 100K數(shù)據(jù)集包括帶時間信息的10萬條評分,主要是943名觀眾對1 682部電影評論。文中選取部分?jǐn)?shù)據(jù)如表1所示。

2.2? 集成的推薦系統(tǒng)試驗(yàn)結(jié)果分析

采用TOP?N的方式對系統(tǒng)進(jìn)行評估,使用N=5,10,15,20,25進(jìn)行實(shí)驗(yàn)。經(jīng)過實(shí)驗(yàn),展示不同N值的準(zhǔn)確度與覆蓋率,如圖2所示。

由圖2a)可看出,基于Boosting框架推薦算法的推薦結(jié)果在TOP?5和TOP?10上比其他算法表現(xiàn)更優(yōu),準(zhǔn)確度比基于ItemCF算法高出6%以上,其覆蓋率在TOP?10上達(dá)到了74.319%。如表2所示,將基于ItemCF算法的推薦、基于UserCF算法的推薦和基于時間上下文的推薦集成為較強(qiáng)的推薦系統(tǒng),Precision為39.44%,recall為24.52%,F(xiàn)1?measure為30.24%,在Precision,Recall,F(xiàn)1?measure這3種指標(biāo)上均高于基本推薦算法。結(jié)果表明,基于Boosting框架的推薦系統(tǒng)具有實(shí)用性。

3? ?結(jié)? 論

本文基于Boosting框架,將基于ItemCF的推薦算法、基于UserCF的推薦算法和基于時間上下文的推薦算法集成構(gòu)建一個強(qiáng)推薦系統(tǒng),并在MovieLens 100K數(shù)據(jù)集中對新算法進(jìn)行測試分析。實(shí)驗(yàn)結(jié)果表明,基于Boosting的推薦系統(tǒng)對于用戶推薦分析預(yù)測有效。從而更加全面地分析用戶喜好,并進(jìn)一步提升用戶滿意度與推薦效果。但本文的推薦系統(tǒng)仍存在難以應(yīng)對的數(shù)據(jù)稀疏性問題,因此將在后續(xù)工作中做出改進(jìn)。

參考文獻(xiàn)

[1] 劉偉,劉柏嵩,王洋洋.海量學(xué)術(shù)資源個性化推薦綜述[J].計(jì)算機(jī)工程與應(yīng)用,2018,54(3):30?39.

[2] 王順箐.以用戶畫像構(gòu)建智慧閱讀推薦系統(tǒng)[J].圖書館學(xué)研究,2018(4):92?96.

[3] WEI J, HE J H, CHEN K, et al. Collaborative filtering and deep learning based recommendation system for cold start items [J]. Expert systems with applications, 2017, 69: 29?39.

[4] 劉輝,郭夢夢,潘偉強(qiáng).個性化推薦系統(tǒng)綜述[J].常州大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,29(3):51?59.

[5] 牛俊潔.教育資源個性化推薦系統(tǒng)的研究與實(shí)現(xiàn)[D].貴陽:貴州大學(xué),2017.

[6] 潘麗芳,張大龍,李慧.基于用戶的協(xié)同過濾(UserCF)新聞推薦算法研究[J].山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,32(4):31?35.

[7] 張博倫.基于協(xié)同過濾的個性化推薦系統(tǒng)研究[D].西安:西安工業(yè)大學(xué),2017.

[8] 陳爽爽.基于Gradient Boosting算法的癲癇檢測[D].濟(jì)南:山東大學(xué),2013.

[9] 繆雪峰,陳群輝,胡羅凱,等.Spark平臺下基于上下文信息的影片混合推薦[J].計(jì)算機(jī)工程與應(yīng)用,2017(10):79?84.

[10] 丁祥武,張東輝.基于Spark的中文新詞提取[J].計(jì)算機(jī)工程與設(shè)計(jì),2017,38(11):303?309.

主站蜘蛛池模板: 国产成人无码Av在线播放无广告| 欧美日韩第三页| 日韩高清成人| 亚洲国产日韩一区| 欧美日韩激情在线| 国产拍揄自揄精品视频网站| 欧美日在线观看| 午夜视频www| 欧美自慰一级看片免费| 91亚洲精品国产自在现线| 精品国产Av电影无码久久久| 久久国产精品嫖妓| 久久久久人妻精品一区三寸蜜桃| 亚洲天堂视频在线播放| 国产一区在线观看无码| 热九九精品| 久久美女精品国产精品亚洲| 中文字幕天无码久久精品视频免费| 四虎国产精品永久一区| 99热国产在线精品99| 久久伊伊香蕉综合精品| 亚洲免费成人网| 四虎永久在线| 国产精品视屏| 国产内射一区亚洲| 免费aa毛片| 免费看av在线网站网址| 人妻中文字幕无码久久一区| 日韩av高清无码一区二区三区| 美女扒开下面流白浆在线试听| 97se亚洲综合在线天天| 久久久久国产精品熟女影院| 亚洲精品天堂自在久久77| 久久人人爽人人爽人人片aV东京热 | 熟妇丰满人妻| 国产aaaaa一级毛片| 久久伊人操| 日韩123欧美字幕| 亚洲精品少妇熟女| 亚洲成aⅴ人在线观看| 中文字幕久久波多野结衣| 久久免费看片| 欧美日韩一区二区在线播放| 色男人的天堂久久综合| 一级毛片中文字幕| 青草视频免费在线观看| 欧美日韩理论| 欧美日韩国产成人高清视频| 亚洲女人在线| 精品一区二区三区四区五区| 久久精品视频亚洲| 国产精品偷伦视频免费观看国产| 色综合五月婷婷| 久久无码av三级| 国产亚洲日韩av在线| 手机在线免费毛片| 亚洲综合二区| 国产精品任我爽爆在线播放6080| 亚洲男人在线| 欧美在线视频a| 老色鬼欧美精品| 五月丁香在线视频| 亚洲男人的天堂在线观看| 色婷婷久久| 亚洲色图另类| 97久久免费视频| 日韩123欧美字幕| 日本成人福利视频| 亚洲精品男人天堂| 国产主播在线观看| 综合人妻久久一区二区精品 | 91精品啪在线观看国产60岁 | 高清无码不卡视频| 亚洲精品麻豆| 亚洲国产高清精品线久久| 中文字幕在线看视频一区二区三区| 无码免费的亚洲视频| 四虎成人精品| 四虎影视8848永久精品| 成人va亚洲va欧美天堂| 国产香蕉在线视频| 午夜免费小视频|