999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

引入用戶情感偏好矩陣的ItemCF算法研究

2019-07-08 03:41:08岳強郭強李仁德
軟件導刊 2019年6期

岳強 郭強 李仁德

摘 要:傳統基于物品的協同過濾算法(ItemCF)利用物品間的相似性為用戶提供個性化推薦,然而該方法僅考慮了評分數據,而未關注用戶情感偏好。基于從評論中的emoji表情提煉出的用戶情感偏好,提出一種引入用戶情感編號矩陣的ItemCF算法。該方法利用物品共現矩陣與用戶情感偏好矩陣計算物品相似度,進而進行個性化推薦。根據某在線互聯網教育實證數據集的實驗結果表明,該方法相比于傳統基于物品的協同過濾算法,在準確率和召回率上都有所提升,在Top1-5推薦均值上分別提高了0.02和0.03。

關鍵詞:推薦算法;ItemCF;用戶情感偏好;emoji表情

DOI:10. 11907/rjdk. 182557

中圖分類號:TP312

文獻標識碼:A文章編號:1672-7800(2019)006-0056-04

Abstract: The traditional item-based collaborative filtering (ItemCF) algorithm makes use of similarity between items to make individual recommendation to users. However, ItemCF only considers rating data and does not pay attention to usersemotional preferences. Based on user emotional preferences extracted from emoji expressions in reviews, an ItemCF algorithm with user emotional numbering matrix is proposed. This method uses the item co-occurrence matrix and the users affective preference matrix to calculate the item similarity, and then carries on the personalized recommendation. Experimental results on an online Internet education data set show that the proposed method outperforms the traditional item-based collaborative filtering algorithm in terms of accuracy and recall, and improves by 0.02 and 0.03 respectively on the average of Top1-5 recommendation.

Key Words: recommendation algorithms; ItemCF; user emotional preferences; emoji exprersions

0 引言

推薦是解決當今互聯網信息過載問題的主要途徑之一[1],為此國內外眾多專家、學者們研究了各類推薦算法。其中,協同過濾(Collaboration Filtering)推薦是目前應用最廣泛的個性化推薦算法[2]。其核心思想是,利用目標用戶的相似用戶對特定物品的評價,產生該用戶對此物品的評價預測[3-5]。協同過濾算法的最大優點是對推薦對象沒有特殊要求,能處理電影、音樂等難以進行文本結構化表示的對象[6-7]。但協同過濾算法存在評分數據稀疏性等問題,并且只考慮了用戶評分數據,卻忽略了用戶本身的情感偏好[8]。

與此同時,emoji表情已成為當今世界人們相互溝通的一個必不可少的工具[9-10],幾乎所有社交平臺都在廣泛使用emoji表情符號[11-12]。Novak等[13]認為emoji表情是用于表達情感和想法,并將情感可視化的一種符號;Vidal等[14]研究發現,在推特上12 260條關于早餐、午餐和晚餐的推文中,emoji表情比文字更頻繁地用來表達用戶情感。對emoji表情的分析與研究是未來的趨勢[15],為此本文嘗試從評論的emoji表情中提煉出用戶情感偏好,提出一種引入用戶情感偏好矩陣的ItemCF推薦算法。通過提取評論中的emoji表情,依據情感分成積極、中立和消極3類,并分別給每類情感賦予不同權重;然后計算不同類emoji表情數量的加權和以表征用戶情感,構建出用戶情感偏好矩陣;最后利用物品同現矩陣計算物品間的相似度,進而進行個性化推薦。

1 情感計算

本文采用某在線互聯網教育中的用戶評論數據集,評估本文算法的性能。該數據集包含2017年1~3月間共1 324 501條用戶評論記錄,其中用戶評論是指用戶在選擇過的某一社團刊物(下文簡稱為“社刊”)上發表的評論,一個用戶可對某一社刊進行多次評論。本文定義上述實證數據為原始數據,在原始數據中不難發現用戶會在社刊上發表帶有emoji表情的評論。經統計可知,有emoji表情評論記錄的社刊占所有社刊數量的89%。

1.1 emoji表情提取

在計算用戶情感之前,需要對原始數據進行數據清洗與emoji表情提取。首先刪除不含emoji表情的評論記錄;其次,用戶在評論中發表的不同emoji表情數量通常不大于3種,為防止用戶灌水,即在一條評論中發送很多不同的emoji表情,刪除表情種類多于3種的記錄;接下來考慮到極少社刊擁有的用戶數小于3個,其中擁有用戶數為1的社刊,唯一一個用戶為社刊創刊者,為保證社刊品質,刪除擁有用戶數小于3個的社刊記錄。

本文定義原始數據在經過上述3個步驟后保留下來的數據為篩選數據。為了獲得更稠密的數據,本文在篩選數據上構造了投影網絡[16],即將某用戶評論過某一社刊視作一個新單元節點,若與其它單元節點存在相同用戶或社刊則產生連邊。最后,在投影網絡上應用k核分解[17]。實驗中k取最大值3 442,便可得到最核心的單元節點。

從上述最大k值所對應的單元節點中,保留用戶和社刊信息,并分別定義該部分用戶與社刊為核心用戶和核心社刊,再從篩選數據中篩選出包含該部分核心用戶與社刊的評論數據,即篩選后的評論數據是由核心用戶對核心社刊所發表的包含emoji表情的評論數據,本文定義該部分數據為實驗數據。至此,數據清洗及emoji表情提取工作全部結束。

1.2 用戶情感計算

經過數據清洗,得到15 370條數據記錄。在這些記錄中共提取出126種emoji表情,并由7名志愿者將所有表情主觀地分成3類,分別為:積極、中立和消極。為了檢驗志愿者主觀分類結果的一致性,避免出現某個志愿者胡亂分類的情況,本文對分類結果進行了Krippendorff's alpha檢驗[18]。當Alpha值大于基準值0.6時,表明不同志愿者分類結果間的差異是可以被接受的[19]。文中實驗的Alpha值為0.706 9,大于基準值0.6,所以志愿者的分類結果是可取的。之后,對7名志愿者的分類結果取眾數,即獲得相應emoji表情的所屬分類。

4 結語

emoji表情已成為互聯網時代必不可少的元素之一,是人們表達情感的重要載體。通過分析海量emoji表情信息,可以了解用戶情緒狀況、對某個社會現象的觀點,以及對某款產品的偏好等。本文從用戶情感角度入手,將emoji表情引入到ItemCF推薦算法中,但推薦效果依賴于評論中emoji 表情轉化成用戶情感的準確性。因此,未來工作可對文中emoji表情進行更加細致的分類,使提煉出的用戶情感更為精確,從而提高推薦效果。

參考文獻:

[1] 劉建國,周濤,郭強,等. 個性化推薦系統評價方法綜述[J]. 復雜系統與復雜性科學, 2009, 6(3): 1-10.

[2] 周軍鋒,湯顯,郭景峰. 一種優化的協同過濾推薦算法[J]. 計算機研究與發展,2004, 41(10): 1842-1847.

[3] 鄧曉懿,金淳, 韓慶平,等. 基于情境聚類和用戶評級的協同過濾推薦模型[J]. 系統工程理論與實踐,2013,33(11): 2945-2953.

[4] 熊聰聰,鄧瀅,史艷翠,等. 基于協同過濾的美食推薦算法[J]. 計算機應用研究,2017,34(7):1985-1988.

[5] 鄧愛林,左子葉,朱揚勇. 基于項目聚類的協同過濾推薦算法[J]. ?小型微型計算機系統,2004,25(9):1665-1670.

[6] 羅辛,歐陽元新,熊璋,等. 通過相似度支持度優化基于K近鄰的協同過濾算法[J]. 計算機學報, 2010,33(8): 1437-1445.

[7] 榮輝桂,火生旭,胡春華,等. 基于用戶相似度的協同過濾推薦算法[J]. 通信學報,2014,13(2):16-24.

[8] 馬宏偉,張光衛,李鵬. 協同過濾推薦算法綜述[J]. 小型微型計算機系統,2009,30(7):1282-1288.

[9] 趙屹星垚. Emoji表情中的受眾心理研究[J]. 設計藝術研究, 2016,6(1):46-49.

[10] 金芊芊. Emoji表情符號的藝術價值[J]. 常州工學院學報:社科版,2017,35(3): 52-55.

[11] 楊莞桐. 青年群體emoji表情符號使用情況調查與研究[J]. 人間,2016,217(22):17-19.

[12] TANG D, QIN B, LIU T. Document modeling with gated recurrent neural network for sentiment classification[C]. Conference on Empirical Methods in Natural Language Processing,2015: 1422-1432.

[13] NOVAK P K, SMAILOVI? J, SLUBAN B, et al. Sentiment of emojis[J]. ?PloS one, 2015, 10(12): e0144296.

[14] VIDAL L, ARES G, JAEGER S R. Use of emoticon and emoji in tweets for food-related emotional expression[J]. Food Quality & Preference, 2015, 49(6): 119-128.

[15] 許雅. 移動社交語境下Emoji表情的傳播態勢與功能探究[J]. ?新媒體研究,2016, 2(8): 24-28.

[16] J?SCHKE R,MARINHO L,HOTHO A,et al. Tag recommendations in folksonomies[M]. Knowledge Discovery in Databases:PKDD 2007. Springer Berlin Heidelberg, 2007:506-514.

[17] BATAGELJ V, ZAVER?NIK M. Generalized cores[J]. arXiv preprint cs/0202039,2002.

[18] KRIPPENDORFF K. Agreement and information in the reliability of coding[J]. Communication Methods and Measures,2011,5(2): 93-112.

[19] HAYES A F. SPSS macro for computing Krippendorff's alpha[J]. ?Retrieved September, 2006, 6(4):17-20.

[20] 項亮. 推薦系統實踐[M]. 北京:人民郵電出版社,2012.

(責任編輯:黃 健)

主站蜘蛛池模板: 麻豆精选在线| 精品久久久久久中文字幕女 | 色有码无码视频| AV老司机AV天堂| 国内精品视频| 首页亚洲国产丝袜长腿综合| 亚洲天堂日本| 婷婷亚洲最大| 欧美日韩激情在线| 午夜福利无码一区二区| 人人91人人澡人人妻人人爽| 国产新AV天堂| 四虎国产永久在线观看| 91探花国产综合在线精品| 日本www在线视频| 3D动漫精品啪啪一区二区下载| 欧美一区二区三区不卡免费| 99re经典视频在线| 国产成人高清精品免费软件 | 97一区二区在线播放| 波多野结衣在线一区二区| 国产在线观看高清不卡| 99视频国产精品| 国产小视频a在线观看| 在线视频一区二区三区不卡| 亚洲性日韩精品一区二区| 日本一区二区三区精品国产| a毛片免费观看| 97国产在线观看| 久久伊人操| 欧美精品二区| 亚洲精品国产首次亮相| 中文字幕 91| 亚洲一区二区在线无码| 日韩欧美国产成人| 欧美一级99在线观看国产| 色噜噜狠狠色综合网图区| 亚洲国产一成久久精品国产成人综合| 欧美综合中文字幕久久| 国产a v无码专区亚洲av| 国产精品成人一区二区| 日韩AV无码免费一二三区| 国产午夜一级毛片| аv天堂最新中文在线| 亚洲经典在线中文字幕| 免费人成视网站在线不卡| 91年精品国产福利线观看久久 | 欧美性天天| www.av男人.com| 大香伊人久久| 久久久久久久久久国产精品| 久久久噜噜噜| 午夜国产不卡在线观看视频| 国产一级妓女av网站| 中文天堂在线视频| 国产熟睡乱子伦视频网站| 国产亚洲精品资源在线26u| 老司国产精品视频| 最新日本中文字幕| 爱做久久久久久| 视频在线观看一区二区| 2022国产91精品久久久久久| 久操中文在线| 国产靠逼视频| 国产自产视频一区二区三区| 在线中文字幕网| 日韩精品无码不卡无码| 五月婷婷综合网| 污网站在线观看视频| 国产成人精品男人的天堂| 40岁成熟女人牲交片免费| 亚洲日本韩在线观看| 一级毛片在线播放| 色婷婷亚洲十月十月色天| 国产欧美视频综合二区| 午夜视频免费一区二区在线看| 激情無極限的亚洲一区免费| 制服丝袜亚洲| 亚洲精品中文字幕无乱码| 色亚洲成人| 精品国产美女福到在线不卡f| 中文字幕 91|