999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

標簽在推薦系統中的應用

2017-02-11 16:51:43丁賽
中文信息 2016年11期
關鍵詞:文本資源用戶

丁賽

摘 要: 隨著大數據時代的到來,收集信息不再是主要問題,如何根據信息更及時地作出更好的決策才是關鍵的問題。個性化推薦系統為這一問題的解決提供了重要方向。本文主要分析標簽在推薦系統中的應用并指出其優勢和在應用中所遇到的困難及如何得到更合理的推薦結果。

關鍵詞:推薦系統 標簽 用戶

中圖分類號:TP391 文獻標識碼:A 文章編號:1003-9082(2016)11-0014-01

一、標簽概述

推薦系統的目的是為用戶過濾龐雜繁雜的信息,找到符合其喜好的資源。標簽是從資源的內容中提取的、對資源進行概括總結的關鍵詞,相較于資源本身,信息量增加,體量減少,減少了用戶的負擔。利用標簽能夠在很大程度上減輕推薦系統的工作量,提高其準確度。

二、標簽在推薦系統中的應用

1.標簽獲取和應用

1.1專家標注法

很多推薦系統在建立時,既沒有用戶的行為數據,也沒有充足的物品內容信息來計算準確的物品相似度。為了在初期提升用戶體驗,很多系統都利用專家進行標注。這方面的代表是個性化網絡電臺 Pandora。雇用一批專家對資源進行標注,可以將資源用多種向量表示,然后通過常見的向量相似度算法計算出其相似度。采用專家標注法的優點是可以有一組受到廣泛接受的標簽庫以供選擇。但是需要大量的人力操作,耗時多且成本高。

1.2大眾分類法

利用用戶產生內容的方法,讓普通用戶自由標注,如Last.fm 音樂電臺,豆瓣等。面對數量眾多且難以進行分析的大量資源,這些網站允許用戶對資源進行隨意標注,獲得資源的相關信息。然后分析用戶的標注行為,提取用戶關系網絡,從關系網絡中分析凝聚子群,進行個性化信息推薦模型的研究。將標簽作為用戶和資源聯系的中間節點,建立用戶-標簽-資源之間的三維關系圖,計算其關聯度,從而預測用戶對于新資源的興趣度,最終產生推薦結果。

1.3內容分析法

對于具體的物品,可從物品本身利用數據挖掘技術自動提取其特征作為標簽。如對于一個新文本來說,首先將其與已有文本對比計算相似度,然后根據相似度選取已有文本的標簽作為新文本的標簽。

2.應用中的優勢

2.1形式簡單,易于處理

標簽是對物品特征屬性的簡要描述,過濾其不重要信息或者用戶不關注的信息,在某種程度上降低了信息過載現象。標簽將網頁、圖片、音頻、視頻等非結構化數據資源轉化為更加容易處理的文本,將文本內容進行壓縮等,方便處理。

2.2易于獲得

通過內容分析法能夠對大量數據進行自動化處理,減少人工負擔,同時避免了因新資源加入產生的冷啟動問題。通過大眾分類法運用大量用戶的群體智慧來標注物品,相較于跟蹤用戶的歷史行為和收集用戶個人注冊信息,降低了系統負擔而且更具合理性,不會侵犯用戶的隱私。

2.3提高了推薦結果的多樣性

標簽具有可重復性和廣泛代表性。用戶在短時間內不會重復購買同一種商品,但是對于標簽,用戶都有自己的喜好和使用習慣,會為不同資源使用同一個標簽。一個標簽可以廣泛用于許多物品,可以跨越不同領域。所以用戶選擇了某一標簽,可以將推薦結果推廣到各個領域。

2.4利用標簽做推薦解釋,更容易獲得用戶信任

對于目前的大量推薦算法,用戶沒有了解的需求和不愿意浪費時間去了解,用戶也就難以真正信任個性化推薦系統所做的推薦。用戶所需要的是直觀的感受。用戶喜歡明星,相信明星,于是就相信其代言的公司和產品。將這一點運用到推薦當中來,一個很重要的橋梁就是人。例如在大眾分類法中,標簽來源于用戶本身及其他用戶對于該用戶共同興趣的物品所做的標注,容易得到用戶認可。

3.應用中的困難

3.1歧義、多義性

在大眾分類法中,用戶標注目的主要有以下三點:一是對資源進行分類,方便將來的查找;二是表達對資源的看法。這是在目前較為流行的方式,用戶樂意在通過社交網絡中將自己的想法分享。三是生產者介紹產品,方便讓市場中的潛在購買者了解。在這三點的驅動之下,標簽被大量創造,而標簽的歧義和多義性正是由于三者目的的差別,個人的知識層次和所處環境的差別所造成的。從客觀上來說,文字語言具有一詞多義,多詞一義的特點,也是大眾分類法難以避免的困境。如果標簽得不到合理處理,那么基于標簽的推薦系統必然也是低效的。

3.2分布稀疏

在大眾分類法和專家標注法中,對于新加入的資源,標簽數量比較少,會出現冷啟動問題,難以準確描述資源。而且讓用戶自行輸入標簽無疑會增加用戶標注的負擔,如果用戶本身沒有標注的習慣和動力,就很有可能不參與標注。對于標簽本身來說,近義詞的存在也讓標簽分布分散。

3.3標簽噪聲

標簽的質量直接影響到推薦系統的性能和推薦結果的準確性。利用內容分析法產生的標簽較為集中,分辨度不高。一個文本對應的標簽數可能比較多,一個標簽對應的資源可能非常多。而大眾分類法也難以避免一些用戶出于各種目的故意打出與事實不符的標簽。例如:為提升好評和銷量,淘寶商家雇傭個人刷單,在評價環節利用好評返現等手段誘導消費者給出商家所想要的評語,而淘寶系統根據客戶的評價形成相應標簽,從而使標簽失去應用的作用。

對于以上問題,推薦標簽和混合使用以上三種產生標簽的方法是目前應用比較廣泛的解決方法。推薦標簽包括向用戶推薦其他用戶在相同類型的資源上使用的標簽和用戶在其他資源中使用過的標簽。推薦標簽可以通過選取某一個詞語代替意思相近的幾個詞語,減少標簽分散程度,提高標簽質量。同時推薦標簽降低了用戶的負擔,用戶不用花費時間去思考應該用哪個詞語來標注,只是在有限的幾個詞語中做選擇,用鼠標的幾個點擊代替在鍵盤上的輸入,增加了資源被標注的機會。而混合使用以上三種方法,主要是發揮各自的優勢,避免一些問題的出現。例如,在新資源加入后,相應標簽較少,可以采用內容分析法將與之最相似的資源標簽作為標簽來解決冷啟動問題,然后采用大眾分類法,利用群體智慧來進一步準確描述資源。

參考文獻

[1]項亮.推薦系統實踐[M].人民郵電出版社.2012:

[2]孔祥迎.基于社會化標簽的個性化推薦技術研究[D].西安:電子科技大學.2013.

[3]任磊.推薦系統關鍵技術研究[D].上海:華東師范大學.2012.

[4]張海燕,孟祥武.基于社會標簽的推薦系統研究[J]..情報理論與實踐,2012,35(5):105.

[5]蔡強,韓東梅,李海生,胡耀光,陳誼.基于標簽和協同過濾的個性化資源推薦[J].計算機科學,2014,41(1):69.

猜你喜歡
文本資源用戶
基礎教育資源展示
一樣的資源,不一樣的收獲
在808DA上文本顯示的改善
資源回收
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 国产一区二区三区在线精品专区| 在线观看国产黄色| 国产成人精品18| 国产综合另类小说色区色噜噜| 国产欧美日韩专区发布| 免费无码又爽又刺激高| 亚洲区一区| 国产亚洲欧美在线人成aaaa| 2024av在线无码中文最新| 国产免费a级片| 亚洲一区二区三区在线视频| 免费高清a毛片| 亚洲国产精品一区二区第一页免 | 国产无码制服丝袜| 在线无码九区| 亚洲精品久综合蜜| 国产区免费精品视频| 成人精品视频一区二区在线 | 亚洲无线视频| 日本三级欧美三级| 亚洲成a人片77777在线播放| 亚洲色图欧美| 国产精品尹人在线观看| 无码电影在线观看| www.av男人.com| 国国产a国产片免费麻豆| 国产一二视频| 成人综合在线观看| 欧美日韩另类国产| 久久人搡人人玩人妻精品一| 亚洲熟女偷拍| 黄色在线不卡| 亚洲国产成熟视频在线多多| 国产欧美网站| 高h视频在线| 国产乱人乱偷精品视频a人人澡| 国产手机在线ΑⅤ片无码观看| 在线观看国产精品第一区免费| 久久久久无码精品国产免费| 亚洲日韩精品无码专区97| 亚洲啪啪网| 亚洲欧美日韩动漫| 四虎影院国产| 欧美www在线观看| 亚洲男人天堂2020| 97在线免费| 91小视频在线播放| 四虎永久在线| 日韩精品一区二区三区中文无码| 一级毛片在线免费看| 国产女同自拍视频| 在线观看无码av五月花| 国产亚洲精品在天天在线麻豆| 久草青青在线视频| 国产精品流白浆在线观看| 无码人妻热线精品视频| 国产福利在线观看精品| 欧美成人aⅴ| 精品少妇人妻无码久久| 2020亚洲精品无码| 女人18一级毛片免费观看 | 美女视频黄频a免费高清不卡| 成人一级免费视频| 天天视频在线91频| 欧美色综合网站| 国产成人a毛片在线| 午夜天堂视频| 亚洲中久无码永久在线观看软件| 日韩二区三区无| 久久综合一个色综合网| 久久久久青草大香线综合精品| 这里只有精品免费视频| 国产精品熟女亚洲AV麻豆| 无码'专区第一页| 97视频免费在线观看| 天天色天天综合| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产尤物视频网址导航| 国产黄色免费看| 国产成人永久免费视频| 国产二级毛片| 超级碰免费视频91|