999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種個性化推薦用戶的情感分析方法

2021-07-23 12:51:54徐積文張永棠
新一代信息技術 2021年6期
關鍵詞:文本用戶模型

徐積文,張永棠

(廣東東軟學院 計算機學院,廣東 佛山 528225)

0 引言

評論信息是消費者選購商品的參考信息之一,對商品購買決策的影響非常重要[1],然而,評論信息形式為半結構化或非結構化,商品購買決策時面臨前所未有的挑戰[2]。文獻[3]采取基于內容的熱門話題的個性化推薦,并且利用文本相似度計算方法計算微博話題與用戶之間的相似度,實現個性化的推薦。文獻[4]提出一種聯合K-means的個性化推薦方法,將具有相似特征的產品聚到一個類別內,然后將與每個聚類中心點最近的產品推薦給用戶。文獻[5]在新聞文本分類的文本分類算法中使用LDA進行特征降維;文獻[6]在研究文本間的相似性問題時,使用 LDA模型計算文本相似,根據文本相似度將搜索記錄數據結果集進行分類。

這些推薦系統一般使用戶評分數據的推薦算法,存在數據稀疏、評分信息不能夠真實有效地表達用戶興趣等問題。本文以網站商品評論為物品特征描述語料,使用隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)[7]主題模型提取物品主題特征,在此基礎上,結合TF-IDF提取主題關鍵詞特征,作為物品描述文本信息的主題——關鍵詞特征集,以增強主題粗粒度特征對物品的描述能力,提高推薦的準確率。與現有的算法相比,該算法能更好地解決冷起動問題。

1 模型描述

1.1 LDA 主題模型

LDA主題模型其實是基于“文本–主題–詞”的三層貝葉斯產生式模型[8],用LDA主題模型對產品的評論內容進行主題詞的抽取,用主題維度來代替原來的詞項維度,可以較好地降低文本表示的特征維度。本文通過使用主題模型,文本就被投影到k個主題上。

示文本Dn在主題Tk上的概率。

LDA的圖模型結構如上圖 1所示,在 LDA模型中,一篇文檔生成的方式為:

圖1 LDA的三層貝葉斯網絡模型圖Fig.1 Three-layer Bayesian network model of LDA

(1)文檔規模的大小服從 Poisson分布,記作 N~Possion(ζ);

(2)文檔Dm主題分布參數的生成θm~ Dir(α),即狄利克雷分布生成文檔Dm的K維主題向量mθ,其中狄利克雷分布參數用α表示。這個操作需要重復N次,生成所有文檔主題隨機分布;

(3)生成文檔特征詞wm,n:以根據文檔的主題向量θm的多項式分布Mulitinomial(θ)選擇該詞對應的某一隱藏主題zm,n,接著以多項式概率分布Mulitinomial(φ(z))即φk,從主題z中擇某一特征詞wm,n。

1.2 LDA 主題模型拓展

2 推薦算法

2.1 用戶評論文本情感分析

本文使用Google公司的開源工具Word2vec[9],處理及簡化向量空間中詞向量運算,包含兩種語言模型。其中,CBOW根據上下文語境預測目標詞語,Skip-Gram根據當前單詞預測上下文語境窗口內的詞語。

具體處理及簡化運算的步驟如下:

Step.1通過爬蟲程序爬取評論信息,并進行預處理;

Step.2訓練主題模型,生成word2vec詞向量;

Step.3獲取文本關鍵詞語的詞向量,計算每條評論文本詞向量均值,做為每條評論文本的文本向量;

Step.4將有標記的評論文本向量按4∶1比例分為訓練集和測試集,采用 SVM 分類器,篩選出物品的正向評論、獲取物品正向評論率。物品i正向評論率posir為物i正向評論條數counti,與物品i總評論條數 c ommentsi比值。

2.2 個性化產品推薦列表

在給具體某用戶推薦物品時還需要考慮該用戶歷史評分,把用戶ui對物品 j的評分用Si,j進行表示,用戶歷史記錄中有打分行為的物品數目為n,用戶ui對物品 j的評分偏好記為wi,j,則計算公式為:

其中posir是物品i的正向評論率,是物品i正向評論條數與其總評論條數比值。

3 實驗及結果

實驗數據采用爬蟲技術從豆瓣電影網站[9]采集共1 000部電影,830萬條評論信息,并獲取用戶對電影評分數據,部分評論數據如表1所示。按4∶1樣本進行實驗訓練,計算推薦準確率、召回率信息。

表1 部分電影信息Table 1 Some movie information

圖2和圖3分別展示了Top-N不同推薦長度下推薦準確率、召回率。從圖上可以看出,在比較不同算法在相同的推薦長度下,本文的算法的優勢明顯。基于內容的推薦算法在推薦長度相同的情況下,準確率和召回率均有所提高。

圖2 不同推薦長度下推薦準確率Fig.2 Recommen dation accuracy under different recommendation length

圖3 不同推薦長度下推薦召回率Fig.3 Recommendation recall rate under different recommendation length

4 結論

提出了一種融合用戶情感分析的個性化推薦算法,通過選取主題關鍵詞結合TF-IDF權重進行物品主題關鍵詞特征拓展,分析用戶感興趣物品相似度較高的產品作為推薦列表進行推薦。按4∶1樣本進行實驗訓練,驗證了該算法能更好地解決冷起動問題。

猜你喜歡
文本用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 最近最新中文字幕在线第一页| 色婷婷电影网| 亚洲欧美综合精品久久成人网| 国产成人精品亚洲77美色| 全裸无码专区| 国产色伊人| 国产在线拍偷自揄拍精品| 波多野结衣一区二区三区AV| 九色国产在线| 国产一区二区免费播放| 青青青伊人色综合久久| 国产成人永久免费视频| 午夜视频免费一区二区在线看| 国产在线精品人成导航| 国产福利观看| 日韩成人午夜| 黄色网页在线观看| 欧美成人午夜在线全部免费| 五月婷婷综合色| 波多野结衣一二三| 97超碰精品成人国产| 在线观看91香蕉国产免费| 色丁丁毛片在线观看| 欧美精品v欧洲精品| 欧美自拍另类欧美综合图区| 亚洲色无码专线精品观看| 福利在线免费视频| 久久性视频| 亚洲精品手机在线| 狠狠v日韩v欧美v| 国产日韩欧美中文| 在线观看欧美国产| 国产精品v欧美| 一区二区影院| 国产福利免费在线观看| 亚洲一级毛片在线观播放| 国产成人做受免费视频| 亚洲—日韩aV在线| 亚洲成在人线av品善网好看| 日韩成人在线网站| 亚洲日韩图片专区第1页| 蜜臀AVWWW国产天堂| 亚洲有码在线播放| 亚洲精品图区| 亚洲啪啪网| 欧美在线综合视频| 国产精品一区二区无码免费看片| 91精品啪在线观看国产91| 国产凹凸一区在线观看视频| 99久久精品国产麻豆婷婷| 久久精品午夜视频| 中国精品自拍| 国产簧片免费在线播放| 国产免费怡红院视频| 婷婷五月在线视频| 中文无码日韩精品| 欧美不卡在线视频| 国产中文在线亚洲精品官网| 国产你懂得| 18禁色诱爆乳网站| 国产97视频在线| 成人国产一区二区三区| 99福利视频导航| 毛片基地视频| 久久精品aⅴ无码中文字幕| 国产精品网址你懂的| 国产精品无码影视久久久久久久 | 亚洲乱码精品久久久久..| 成人在线观看一区| 91娇喘视频| 不卡视频国产| 五月婷婷精品| 国产97色在线| 欧美劲爆第一页| 伊人色在线视频| 天堂av高清一区二区三区| 国产成人免费手机在线观看视频| 国产呦精品一区二区三区下载| 国产高清国内精品福利| av免费在线观看美女叉开腿| 手机永久AV在线播放| 亚洲午夜福利在线|