999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于新聞場景下的個性化推薦算法研究

2023-02-28 16:10:30王君威
智能計算機與應用 2023年11期
關鍵詞:用戶

王君威,余 粟

(上海工程技術大學機械與汽車工程學院,上海 201620)

0 引 言

隨著網絡的發展和電子設備的普及,人們已經不再只是通過電視的新報道和紙質報刊了解當下正在發生的事情,利用電子設備獲取新聞消息成為當前的主流趨勢。 打開電子設備時,會看到太多對用戶無用的嘈雜信息。 對用戶而言,沒有好的推薦將很難獲取有用信息,若不能根據用戶個性化的需要加以篩選,信息過載的情況就難以避免。 用戶需求明確時,搜索能快速幫助用戶滿足需求。 當用戶需求不明確時,個性化新聞推薦成為了重要解決方案。

隨著今日頭條、抖音等App 的飛速發展,推薦系統的價值已得到了業界的廣泛認可。 能夠向用戶提供有用信息,滿足用戶需求的新聞推薦也得到了相關學者的關注。 萬梅等學者[1]根據社交網絡不斷演化的特點,提出了一種基于神經網絡嵌入和社交網絡動態演化的新聞推薦算法,基于神經網絡嵌入模型來學習用戶在時間序列和社交網絡中的行為特征,再使用無監督的隨機游走學習用戶的網絡拓撲結構,通過插值法將行為特征向量和網絡拓撲結構匯總表示用戶向量,使用核函數將用戶的交互映射到低維的向量空間,從而提高了相似度計算的效率。 劉羽茜等學者[2]考慮到新聞的內容特征和瀏覽新聞之間的關系、相應的時序變化,以及不同新聞對用戶的重要性等方面,提出了一種全面提取用戶和新聞特征的新聞推薦模型。 該模型基于深度學習,使用注入注意力機制的卷積神經網絡深度提取新聞文本特征,通過對用戶的新聞瀏覽記錄進行時序處理,獲取用戶的興趣趨勢,使得注入注意力機制的深度特征融合新聞推薦模型角度更加全面。 張丹等學者[3]考慮可以基于用戶歷史瀏覽的時間序列來做推薦,使用隱馬爾可夫模型,并在其基礎上加入了狀態駐留的時間元素,將隱馬爾可夫模型的五元素擴展為六元素,以此來提高新聞推薦的準確度。袁仁進等學者[4]針對新聞推薦中的用戶畫像構建與用戶興趣流動的問題,提出一種面向新聞推薦的用戶興趣模型構建和更新方法,使用向量空間與bisecting K-means 一同構建原始用戶興趣模型,然后使用艾賓浩斯遺忘曲線為基礎構造遺忘函數來描述用戶的興趣變遷,更好地反映用戶的興趣變化。陶天一等學者[5]將知識圖譜中“實體-關系-實體”表示事物關系的形式引入到新聞推薦中來,提出KHA-CNN,基于卷積神經網絡和層次注意力機制獲取的新聞報道的特征,根據用戶的交互來獲取用戶畫像,基于兩方特征實現推薦。 王利娥等學者[6]看到當前的推薦模型不能有效地平衡差分隱私的噪聲,提出了一種融合知識圖譜和隱私保護的新聞推薦方法,采用多通道卷積神經網絡模型融合新聞標題、知識圖譜中實體和實體上下文等多維度的特征向量;其次,利用注意力機制為不同敏感程度的特征向量添加不同程度的噪聲,從而降低噪聲對數據分析的影響;然后,對加權的用戶特征向量添加統一的拉普拉斯噪聲,以保證用戶數據的安全性;利用兩階段的隱私保護機制來提高用戶的隱私保護和推薦效果。 朱文躍等學者[7]針對傳統推薦系統中存在的共性問題,冷啟動、數據稀疏、推薦精度較低等問題,提出了基于事件本體的推薦算法,結合新聞結構和語義構建事件本體,對用戶瀏覽的新聞抽取要素,構建用戶興趣模型,綜合事件本體的相似度、用戶興趣相似度、非層次結構相似度三個角度完成推薦。

本文分析了用戶活躍度和新聞時效對新聞推薦的影響,針對新聞場景提出一種個性化推薦方式。通過新聞時效性和用戶活躍度的判斷,對item和user的協同過濾進行改進、并加上冷啟動進行新聞報道的召回,盡可能獲取包含用戶興趣點的所有新聞報道,基于目標用戶的評分進行排序,產生面向用戶的個性化推薦。

1 相關工作

1.1 場景描述

新聞報道的推薦和傳統的物品推薦有些許不同,在物品推薦中,物品的數量和種類在相對長的一段時間里面會保持穩定,不會發生較大的變化;而且短期內用戶對物品的喜好也不會發生大的變動。 與之不同的是,世界上每天都會發布大量的新聞報道,新聞的數量隨著時間的推移也會越來越多。

在新聞推薦中已經報道的新聞,如果當時沒有及時推薦給感興趣的用戶,那么在相對較短的一段時間之后,不會再推薦對應的用戶。 對用戶來講,一般情況下也不會對過往的新聞報道感興趣。 物品推薦往往還存在用戶對推薦結果的顯式評價(包括點贊、關注、購買、評價等行為),而新聞報道的推薦只能根據用戶的歷史交互來判斷推薦結果。 除此之外,活躍度高的用戶交互記錄較為豐富,而活躍度低的用戶交互記錄相對稀疏,在判斷目標用戶的興趣相似集合時,往往會發現活躍度高的用戶與絕大部分用戶的興趣都相近,難以區分用戶的相似情況,這就對個性化新聞推薦提出了較高的要求。

1.2 相關模型

本文提出的個性化新聞推薦整體流程如圖1 所示。 在新聞平臺數據集的基礎上,對用戶交互、新聞報道等相關信息進行數據分析和處理,將數據集通過召回層,從ItemCF 和UserCF 以及冷啟動的角度對新聞進行召回,并基于相似用戶集合或新聞集合對召回新聞的評分進行排序,最后產生目標用戶的個性化新聞推薦。

圖1 個性化新聞推薦模型Fig. 1 Personalized news recommendation model

1.2.1 協同過濾

協同過濾(Collaborative Filtering)是推薦領域中最重要的算法,實質是根據用戶的交互歷史以及擁有類似興趣的用戶的交互記錄或曾經感興趣的物品來給目標用戶進行物品推薦。 主要分為基于item的協同過濾和基于user 的協同過濾。 2 個算法的思想基本一致,核心在于類似用戶判定或喜好物品的相似物品判定,即物品或用戶相似度的計算。

基于item 的協同過濾是根據用戶曾經喜歡的物品,從數據集中找到相似的物品,推薦給用戶。 而基于User 的協同過濾是基于用戶的交互歷史,從用戶集合中找到與目前用戶的興趣較為接近的用戶子集,基于這些不同用戶的交互喜好,給目標產生新的推薦。

協同過濾根據用戶與物品的歷史交互,將用戶點贊、收藏、轉發等不同的行為進行量化,將量化后的行為作為用戶對物品的評分,構建成評分矩陣,評分大小表示用戶感興趣的程度。 無論基于item 的協同過濾、還是User 的協同過濾都是基于評分矩陣R找到與相似物品或相似用戶,基于同樣興趣愛好的人群或相似喜好物品的集合產生的個性化推薦。

由于新聞推薦場景與物品推薦場景不同,在新聞場景下很少有用戶看過新聞后會基于對新聞的喜好進行點贊、收藏、轉發,顯式行為數據的極度稀疏導致無法根據通用方式完成新聞評價,本文使用用戶對新聞的歷史交互點擊作為用戶對物品評分的依據。

以基于User 的協同過濾算法為例,評分矩陣形式如下:

其中,R表示評分矩陣;U表示用戶集合;I表示物品集合;m和n分別表示用戶和物品的個數;使用u(i,j)表示第i個用戶對第j個商品的評分。

協同過濾算法常用余弦相似度或皮爾遜相關系數來衡量用戶或物品的相似程度。

余弦相似度公式如下所示:

其中,u與v分別表示不同用戶的評分向量;i表示物品序號;rui為用戶u對第i個物品的評分;表示用戶u對物品集合中所有物品的評分集合中的第i個物品的評分向量。

在現實情況下由于不同用戶對物品評分的偏好不同,有的習慣給高分、有的經常給低分,會造成評價不統一,影響推薦的效果,為了平衡不同用戶對物品的評分偏差,皮爾遜相關系數以不同用戶的平均分為平衡點對評分進行修正,降低評分的偏差。

皮爾遜相關系數計算方式如下:

1.2.2 基于業務場景改進的協同過濾召回

(1)基于時效性改進的ItemCF。基于item的協同過濾算法分析用戶對物品的交互記錄,找到目標用戶曾經喜歡的item,用戶對物品的交互記錄獲取的評分作為item向量,而不是使用item本身特征,從物品集合中找出這個喜好item最相似的item,這個item將被認為是目標用戶的可能喜好,產生推薦。

在新聞推薦場景下,時效性的要求要比普通的物品推薦高得多,為了滿足新聞推薦對時效性的需要,在傳統基于item 協同過濾推薦的基礎上,設定新聞報道時效的關聯規則,將當前時間戳與報道發布的時間戳做差值,當差值超過一定的限度,就不再將該新聞報道納入被推薦范圍內,差值越小,推薦的優先度則越高。 為此,本文在相似度計算公式上做出改進,將時效性作為衡量新聞報道相似度的一部分。

在本文中,將2 個新聞報道的發布時間戳差值的絕對值的倒數作為衡量2 個物品之間時效性的判斷依據,為了防止報道發布時間過近,導致該時效性的值過大影響整個推薦效果,在分母處加1,防止倒數趨于無窮大。 時效性公式如下:

其中,w表示時效性的權重;i、j分別表示報道集合中第i、j個報道的向量;it、jt分別表示第i、j個報道的發布時間戳。

改進后的基于物品的相似度評判標準可用式(5)來描述:

(2)基于用戶活躍度改進的UserCF。 基于User的協同過濾運用用戶交互構建的評分矩陣,在計算求得用戶相似度后,篩選出與目標用戶興趣較一致的用戶集合,從這些用戶集合中,找出目標用戶之前未曾接觸過的可能感興趣的物品,生成推薦序列,推薦給目標用戶。

用戶集合中有部分活躍用戶對新聞報道有較高的關注度,交互記錄比較豐富,在評分矩陣中該用戶的評分向量較為稠密。 活躍用戶評分向量的方差較大,覆蓋面較為廣泛。 而普通用戶因為個性和偏好的關系,評分矩陣的向量極為稀疏。 因此在評價用戶相似時,能夠發現大量普通用戶都與活躍用戶相似,不能很好區分用戶是否相似。

為此,本文在用戶相似度評判上做出改進,將用戶間的活躍度作為比值,活躍度大的作為分母,活躍度較小的作為分子,構建活躍度的判定公式。 計算公式如下:

其中,u與v分別表示不同用戶,uh和vh分別表示2 個用戶的活躍度。 在新聞推薦的場景下,本文將用戶的活躍度設定為用戶點擊新聞的個數。

將用戶活躍度帶入用戶相似度判定公式中,可得:

(3)冷啟動召回。 冷啟動召回是在協同過濾召回外的補充,是基于用戶特征和物品特征,推斷出用戶可能感興趣的物品召回方式。 冷啟動問題主要分為用戶冷啟動(即沒有用戶的交互記錄)和新聞冷啟動(即新聞沒有被任何用戶點擊)。 本文針對冷啟動的問題,采用基于熱門新聞和地理位置的召回策略,作為額外的新聞召回補充方式。

1.3 算法實現

(1)獲取目標用戶在新聞平臺上的訪問日志,包括用戶ID、用戶點擊的新聞報道ID,用戶點擊的時間戳Click_timestamp、該用戶點擊報道時所在的區域Click_region等特征。

(2)獲取用戶曾點擊過新聞報道的產生時間戳、以及該新聞報道的字數、新聞報道的類型。

(3)根據用戶點擊時間戳,存儲用戶點擊新聞的交互記錄,構建用戶-新聞-時間字典,將其轉換為用戶評分矩陣。

(4)根據用戶評分矩陣,使用改進用戶活躍度的UserCF 查找相似用戶,召回新聞報道。

(5)根據特定新聞的用戶點擊情況,構建新聞報道-用戶-時間字典,存儲新聞報道的向量,轉換成新聞評分矩陣。

(6)根據新聞評分矩陣,使用改進時效性的ItemCF 來查找相似物品,借此召回新聞報道。

(7)根據用戶的點擊次數、用戶點擊報道的區域,進行冷啟動召回,召回相關的新聞報道。

(8)匯總多路召回的新聞報道,從中選取評分最高的新聞,作為推薦結果。

綜上所述,研究給出算法實現步驟流程如圖2所示。

圖2 算法實現Fig. 2 Flowchart of the algorithm

2 實驗及結果分析

2.1 實驗設計

為了驗證提出個性化新聞推薦的效果,本文數據集選自某新聞平臺的后臺用戶新聞交互訪問日志,包含近30 萬用戶、36 萬篇新聞文章、以及多達300 多萬的交互訪問記錄。

仿真實驗隨機從交互數據集中篩選出2 萬用戶以及對應的新聞報道和歷史交互記錄作為數據集,數據集特征包括用戶id、用戶報道交互時間戳、字數、報道id、報道產生時間戳等特征。 構建個性化新聞推薦,針對每個目標用戶使用基于用戶活躍度的userCF、基于新聞時效性的ItemCF 以及冷啟動召回等3 個角度進行召回,每個目標用戶將獲取個性化召回新聞報道。 計算出目標用戶對召回新聞的評價,取評價在TopX的新聞作為推薦結果,呈現給用戶。

2.2 評價指標

為了衡量個性化新聞推薦的推薦效果,本文選取了召回率(Recall,R)、準確率(Precision,P) 以及混合召回和準確率的F1指數作為性能指標。

推薦結果的混淆矩陣見表1。

表1 混淆矩陣Tab. 1 Confusion matrix

選用指標中,Precision表示個性化新聞推薦的準確率,即推薦給用戶的新聞列表中,用戶點擊情況。 數學公式定義如下:

Recall表示個性化新聞推薦的召回率,即所有用戶點擊的新聞列表中,推薦新聞情況。 數學計算公式定義如下:

由于Precision和Recall兩個指標在某些情況下是相互沖突的、準確率高、召回率就會降低,召回率高、準確率會降低。 為了平衡2 個指數的沖突,更好地衡量個性化推薦的推薦效果,引入了F1指標。 數學公式定義如下:

2.3 實驗結果與分析

本次實驗從20 000 個用戶的數據集中隨機選取某用戶,分別以itemCF 和UserCF 以及個性化推薦這3 種方式針對該用戶從其最相鄰用戶集合中選出5、10、15、20、25、30、35、40 個鄰居,基于最近鄰居產生目標用戶的個性化推薦。

表2 和表3 是個性化推薦算法與基于User 和Item協同過濾推薦算法的針對目標用戶產生推薦的實驗效果對比。F1-score的實驗對比結果見圖3。 從以上結果中可以看出,在協同過濾的基礎上加入用戶活躍度和新聞時效性的考量,使用冷啟動補充興趣點,在新聞場景下的推薦效果明顯優于協同過濾。

表2 準確率實驗對比Tab. 2 Comparison of accuracy experiments

表3 召回率實驗對比Tab. 3 Comparison of recall experiments

圖3 F1-score 實驗對比Fig. 3 F1-score experimental comparison

3 結束語

本文基于用戶活躍度和新聞時效性提出了一種個性化的新聞推薦算法,考慮到新聞推薦場景下,用戶對新聞時效性的需求以及不同活躍度用戶對推薦的影響,修改了新聞報道和不同活躍度用戶的相似度判定方式,基于協同過濾,從用戶、新聞報道和冷啟動召回的角度召回用戶可能感興趣的新聞報道。實驗證明,與傳統的協同過濾推薦相比,本文的個性化新聞推薦更為準確。 冷啟動召回的方式緩解了冷啟動,而改進后的召回排序獲取推薦提高了推薦精度。 下一步可以在新聞推薦中融合、更多模型算法更多覆蓋用戶的興趣點完成召回和排序,提高推薦效果。

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 99er这里只有精品| 亚洲欧美国产五月天综合| 久久无码免费束人妻| 福利在线一区| 国产另类视频| 另类欧美日韩| 天天色天天综合| 91成人在线观看视频| 精品一区二区三区四区五区| 亚洲一区色| 在线观看无码av五月花| 欧洲日本亚洲中文字幕| 制服丝袜在线视频香蕉| 在线播放国产一区| 国产va视频| 亚洲无码91视频| 久久精品嫩草研究院| 亚洲色成人www在线观看| 亚洲熟女中文字幕男人总站| 3D动漫精品啪啪一区二区下载| 人妖无码第一页| 午夜无码一区二区三区在线app| 国产成人在线无码免费视频| 成人一区专区在线观看| 欧美三级日韩三级| 国产一区二区福利| 91小视频在线观看免费版高清| 亚洲精品成人片在线观看 | 国产精品免费入口视频| AV在线麻免费观看网站 | 亚州AV秘 一区二区三区 | 国产门事件在线| 亚洲天堂色色人体| 高清无码一本到东京热 | 午夜精品久久久久久久无码软件 | 日本一区二区三区精品AⅤ| 日韩专区第一页| 日本a∨在线观看| 久久国产精品国产自线拍| 成人毛片免费观看| 久久窝窝国产精品午夜看片| 香蕉视频国产精品人| 色视频国产| 国产第四页| 亚洲中文精品人人永久免费| 色综合久久88色综合天天提莫 | 国产精品网址你懂的| 精品在线免费播放| 99久久免费精品特色大片| 毛片卡一卡二| 露脸一二三区国语对白| 丁香婷婷激情网| 国产成人免费视频精品一区二区| 国产精品第三页在线看| 少妇精品久久久一区二区三区| 久草视频福利在线观看 | 91精品国产麻豆国产自产在线| 在线免费a视频| 女同久久精品国产99国| 9久久伊人精品综合| 谁有在线观看日韩亚洲最新视频 | 四虎永久在线精品影院| 免费精品一区二区h| 亚洲国产成人无码AV在线影院L| 日韩区欧美区| 国产欧美日韩视频一区二区三区| 97se亚洲综合| 9丨情侣偷在线精品国产| 97久久精品人人| 亚洲第一成网站| 亚洲第一成年网| 久久午夜夜伦鲁鲁片不卡| 精品無碼一區在線觀看 | 中文字幕日韩久久综合影院| 男女男免费视频网站国产| 色悠久久综合| 国产精品黑色丝袜的老师| 黄色国产在线| 99爱在线| 青青草国产一区二区三区| 国产免费网址| 午夜日本永久乱码免费播放片|