999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于張量分解的個(gè)性化微博推薦算法研究

2017-10-28 18:10:21秦曉暉
軟件工程 2017年9期

摘 要:隨著社交媒體的發(fā)展,微博為人們提供的服務(wù)正在極大地改變著人們使用互聯(lián)網(wǎng)的習(xí)慣,然而微博上用戶發(fā)表的大量信息,以及高頻率的信息更新,使得用戶面臨信息過(guò)載的問(wèn)題而無(wú)法快速獲取他感興趣的信息。推薦系統(tǒng)是解決此問(wèn)題的一種很好的方法,它是通過(guò)研究用戶已有數(shù)據(jù)來(lái)發(fā)掘用戶興趣,從而為用戶推薦可能感興趣的對(duì)象,如產(chǎn)品、網(wǎng)頁(yè)、微博等。本文介紹了一種基于張量分解技術(shù)的微博推薦算法來(lái)預(yù)測(cè)用戶對(duì)微博的興趣度,同時(shí)考慮用戶與微博、用戶與微博發(fā)布者影響因素,以及微博與微博發(fā)布者的影響因素,提高了已有算法的準(zhǔn)確度。

關(guān)鍵詞:微博推薦;矩陣分解;張量分解

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

Abstract:With the development of social media,the services in micro-blog have significantly changed the way people use the Internet.However,as the large amount of information posted by users and the highly frequent update on micro-blogs,users often face the problem of information overload and miss out the content they are interested in.The recommendation system,which recommends items(such as products,web pages,micro-blogs,etc.)to users based on their interests,is an effective solution to this problem.The paper introduces a micro-blog recommendation algorithm based on the tensor factorization technology to predict the user's interest degree on certain micro-blog.The experimental results on real dataset show that the proposed model achieves desirable performance in characterizing the user's interest and the preprocessing of data on micro-blog.Finally,the paper presents the experimental results which show that the method significantly outperforms the baseline method.

Keywords:micro-blog recommendation;matrix factorization;tensor factorization

1 引言(Introduction)

目前,一些微博推薦算法在發(fā)掘用戶在社交媒體中的興趣和行為中表現(xiàn)出了一定的優(yōu)越性,例如基于內(nèi)容的推薦算法,但是目前大多數(shù)方法都通過(guò)內(nèi)容等顯性因素來(lái)預(yù)測(cè)用戶的興趣度而沒(méi)有考慮一些內(nèi)在的隱性因素。然而社交網(wǎng)絡(luò)中的信息是豐富且復(fù)雜的,只通過(guò)一些顯性因素來(lái)預(yù)測(cè)用戶興趣度是不夠的。因子分解模型最初被用于推薦系統(tǒng)中來(lái)對(duì)用戶感興趣的商品進(jìn)行推薦[1]。為了更好地對(duì)用戶行為建模,一些研究使用隱因子模型對(duì)用戶的興趣度進(jìn)行預(yù)測(cè),而這些無(wú)法直接獲取的隱性因素是影響用戶興趣度的主要因素。這些方法使用矩陣分解算法分別考慮用戶和微博主題,用戶和微博發(fā)布者之間的社會(huì)關(guān)系,以及微博發(fā)布者與微博主題之間的隱性因素,通過(guò)兩兩之間關(guān)系來(lái)預(yù)測(cè)用戶對(duì)微博的興趣度。然而,同樣內(nèi)容的微博被不同的發(fā)布者發(fā)布的話,用戶的興趣度是不同的,因此我們應(yīng)綜合考慮用戶與微博,以及微博發(fā)布者它們之間的隱性因素共同對(duì)微博興趣度的影響。

張量是對(duì)向量和矩陣的擴(kuò)展[2],因此它可以表示多元數(shù)據(jù),已有的矩陣分解方法丟失了用戶與微博,以及微博發(fā)布者三者之間在三維空間上對(duì)用戶興趣度的影響而張量分解模型很好地解決推薦系統(tǒng)中存在的多元影響因素[3]。而現(xiàn)實(shí)生活中的數(shù)據(jù)一般都具有多元特征,相對(duì)復(fù)雜,因此張量模型很好地模擬了推薦系統(tǒng)中數(shù)據(jù)的多元影響關(guān)系。

2 微博排序優(yōu)化準(zhǔn)則(Optimizing ranking criterion

for weibo recommendation)

3 基于張量的分解模型(Tensor factorization model)

本文需要同時(shí)考慮用戶、微博、微博發(fā)布者這三個(gè)因素來(lái)預(yù)測(cè)用戶對(duì)微博的興趣度,即將二維矩陣拓展為三維張量來(lái)表示影響興趣度的隱性因素,也就是分解用戶—微博—發(fā)布者張量來(lái)預(yù)測(cè)用戶對(duì)微博的喜好度。

為了和大多數(shù)的基于矩陣分解的推薦系統(tǒng)中的方法對(duì)比,我們可以將三維張量理解為在傳統(tǒng)二維矩陣的基礎(chǔ)上增加一個(gè)維度,即一種典型的張量分解方法Tucker分解,該分解模型產(chǎn)生的類似于SVD的左右奇異矩陣子結(jié)構(gòu)方便與已有算法SVD進(jìn)行實(shí)驗(yàn)結(jié)果對(duì)比[5,6]。Tucker分解把原張量分解為一個(gè)核心張量與一系列矩陣的乘積。這里我們以對(duì)三維張量的分解為例說(shuō)明Tucker的具體分解過(guò)程,詳見(jiàn)公式(5):

4 實(shí)驗(yàn)(Experiment)

4.1 數(shù)據(jù)來(lái)源

本文數(shù)據(jù)來(lái)源于新浪微博,使用爬蟲系統(tǒng)根據(jù)本文需求爬取相關(guān)數(shù)據(jù)[7]。網(wǎng)絡(luò)爬蟲作為一種自動(dòng)提取網(wǎng)頁(yè)信息的計(jì)算機(jī)程序或者自動(dòng)化腳本[8],它是搜索引擎的核心技術(shù)。本文先隨機(jī)選取一個(gè)微博用戶以發(fā)射狀不斷爬取該用戶的關(guān)注者的數(shù)據(jù),以及關(guān)注者的關(guān)注者的數(shù)據(jù),然后從這些數(shù)據(jù)中選出1024個(gè)微博用戶的主頁(yè)信息,但這些用戶的關(guān)注者人數(shù)需超過(guò)15。endprint

4.2 評(píng)價(jià)標(biāo)準(zhǔn)

本文通過(guò)平均準(zhǔn)確率評(píng)估預(yù)測(cè)結(jié)果的準(zhǔn)確度。本文推薦模型的結(jié)果是微博的排序,同時(shí)微博的排序位置還關(guān)聯(lián)了準(zhǔn)確度使得推薦模型能得到更準(zhǔn)確的評(píng)估,即微博成功推薦,如果它的排序越靠前那么平均準(zhǔn)確率就越高。如果系成功推薦的微博個(gè)數(shù)為0那么準(zhǔn)確率為0。評(píng)估公式見(jiàn)式(16):

4.3 實(shí)驗(yàn)結(jié)果

為了驗(yàn)證算法的有效性,本文增加其他幾種方法來(lái)對(duì)比實(shí)驗(yàn)結(jié)果,包括按照時(shí)間排序的方法、按相似度排序的方法、矩陣分解模型算法SVD[9]。張量分解算法(TF)綜合考慮用戶、微博和微博發(fā)布者三者之間的關(guān)系,較SVD更加準(zhǔn)確地評(píng)估對(duì)用戶興趣度的影響。張量分解算法使用隨機(jī)梯度算法來(lái)估計(jì)實(shí)驗(yàn)參數(shù),矩陣分解過(guò)程中K值取30準(zhǔn)確率最高。

5 結(jié)論(Conclusion)

時(shí)間排序的推薦方法由于依賴用戶的登錄時(shí)間而對(duì)登錄時(shí)間前后的微博轉(zhuǎn)發(fā)的概率大,因此預(yù)測(cè)的準(zhǔn)確度很低。相似度排序的算法只通過(guò)關(guān)鍵詞計(jì)算微博表面相似度來(lái)預(yù)測(cè)而忽略了內(nèi)在的語(yǔ)義。SVD只考慮用戶、微博與微博發(fā)布者兩兩之間的關(guān)系,忽略三者之間的共同作用沒(méi)有反映數(shù)據(jù)的真實(shí)信息而準(zhǔn)確度低于TF方法。

參考文獻(xiàn)(References)

[1] Lu J,et al.Recommender system application developments:a survey[J].Decision Support Systems,2015,74:12-32.

[2]Jain P,Oh S.Provable tensor factorization with missing data[C].Advances in Neural Information Processing Systems,2014:1431-1439.

[3] Ding G,Guo Y,Zhou J.Collective matrix factorization hashing for multimodal data[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:2075-2082.

[4] 冷亞軍,陸青,梁昌勇.協(xié)同過(guò)濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能,2014,27(8):720-734.

[5] Rendle S.Factorization machines[A].The IEEE International Conference on Data Mining.Sydney:2010:995-1000.

[6] Cao Y.,et al.Adapting ranking SVM to document retrieval[C].The 29th Annual International SIGIR Conference.Seattle,WA:2006:186-193.

[7] 孫立偉,何國(guó)輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲技術(shù)的研究[J].電腦知識(shí)與技術(shù),2010,6(15):4112-4115.

[8] 高建煌.個(gè)性化推薦系統(tǒng)技術(shù)與成用[D].中國(guó)科學(xué)技術(shù)大學(xué),

2010.

[9] 秦曉暉.基于協(xié)同過(guò)濾的個(gè)性化微博推薦算法研究[J].軟件工程,2017,20(3):14-17.

作者簡(jiǎn)介:

秦曉暉(1987-),女,碩士,助教.研究領(lǐng)域:中文信息處理,人工智能.endprint

主站蜘蛛池模板: 大陆精大陆国产国语精品1024| 国产免费a级片| 免费国产小视频在线观看| 亚洲黄色视频在线观看一区| 91亚洲影院| 欧美日韩精品一区二区视频| 精品综合久久久久久97超人该| 国产精品熟女亚洲AV麻豆| 91麻豆国产视频| 91久久大香线蕉| 成人年鲁鲁在线观看视频| 57pao国产成视频免费播放| 国产午夜一级淫片| 尤物视频一区| 日本人又色又爽的视频| 老汉色老汉首页a亚洲| 日韩福利在线视频| 国产美女一级毛片| 免费看av在线网站网址| 国产精品手机在线播放| 亚洲国产精品无码AV| 666精品国产精品亚洲| 久久中文无码精品| yy6080理论大片一级久久| 国产凹凸视频在线观看| 日韩小视频在线播放| 久操中文在线| 漂亮人妻被中出中文字幕久久| 波多野结衣亚洲一区| 欧美劲爆第一页| 欧美一区二区啪啪| 国产一区二区三区免费| 日本在线免费网站| 国产91熟女高潮一区二区| 亚洲精品无码AV电影在线播放| 91在线激情在线观看| 91视频99| 免费国产黄线在线观看| 亚洲VA中文字幕| 亚洲成人www| 国产情精品嫩草影院88av| 中文字幕乱码中文乱码51精品| 9999在线视频| 日本a级免费| 国产亚洲精品97AA片在线播放| 97在线国产视频| 国产精品va| 久久国产精品麻豆系列| 亚洲日韩国产精品无码专区| 成人福利在线观看| 四虎影视库国产精品一区| 欧美成人看片一区二区三区| 制服丝袜一区二区三区在线| 欧美成一级| 国产精品不卡永久免费| 国产99免费视频| 国产aⅴ无码专区亚洲av综合网| 看av免费毛片手机播放| 亚洲欧美天堂网| 色综合久久久久8天国| 51国产偷自视频区视频手机观看 | 91人人妻人人做人人爽男同| 免费 国产 无码久久久| 亚洲中文字幕日产无码2021| 精品久久久久成人码免费动漫| 她的性爱视频| 99久久精品免费看国产免费软件| 毛片网站观看| 久久国产乱子| 国产第二十一页| www中文字幕在线观看| 国产一区二区三区精品久久呦| 国产中文一区二区苍井空| 成人精品在线观看| 亚洲日本精品一区二区| 女人18毛片一级毛片在线 | 精品久久久久久中文字幕女| 一本大道无码日韩精品影视| 成·人免费午夜无码视频在线观看| 色综合久久无码网| 91精品在线视频观看| 在线播放精品一区二区啪视频|