999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱式用戶行為的推薦系統研究

2016-06-27 02:08:12張天凡
湖北工程學院學報 2016年3期

盧 軍,張天凡

(1.湖北工程學院 計算機與信息科學學院,湖北 孝感 432000;2.湖北工程學院 新技術學院,湖北 孝感 432000;3.西北工業大學 自動化學院,陜西 西安 710072)

基于隱式用戶行為的推薦系統研究

盧軍1,張天凡2,3

(1.湖北工程學院 計算機與信息科學學院,湖北 孝感 432000;2.湖北工程學院 新技術學院,湖北 孝感 432000;3.西北工業大學 自動化學院,陜西 西安 710072)

摘要:在現實生活中,用戶經常在無意識中被周圍的人或朋友的行為所影響,這種受群體行為影響的現象在社交網絡系統中也得到體現,因此可以通過其相關用戶的選擇和行為構建推薦系統。提出一種通過挖掘相關用戶的評價信息來構建輸入數據的隱式推薦系統,該系統包括三個部分:首先根據交際活動評估用戶之間的隱式信任度;然后通過評論獲取語料的情緒關鍵詞推斷用戶情緒等級;最后利用機器學習和回歸算法識別情緒等級和用戶之間信任度的影響程度,并由此給出推薦意見。通過對微博用戶評論數據的分析,驗證了算法的有效性,表明提出的算法能夠正確反映隱式信任度和用戶情緒,從而為決策推薦系統提供支持。

關鍵詞:推薦系統;隱式社會關系;信任度;用戶情緒;支持向量機

當前,隨著社交網絡中大量用戶加入互動,用戶間的關系呈現幾何級增長,這樣導致了兩個突出的問題:用戶感興趣的內容具有大量的可替代品,用戶難以選擇;內容提供方如何為用戶提供個性化的服務。當前,典型的推薦系統主要分為兩類:協同過濾(Collaborative Filtering,CF)推薦系統和基于內容(Content-based, CB)的推薦系統[1]。CF使用量化的用戶評級記錄(如典型的淘寶評價模式)和分析用戶評價,找到用戶間的相似性,從而根據興趣模式相近的原則為用戶進行推薦[2]。而CB則使用了反向觀點,即用戶以前沒有經歷過的就是用戶未來可能感興趣的。

在近年的研究中,研究人員建議引入用戶之間的信任關系改善RS[3]。文獻[4]提出了使用自然語言處理技術來進一步量化用戶評論的方法。而用戶之間的信任關系和情緒是一種隱式社會關系,而且傳統RS系統中評價信息是稀疏的,評價行為非常有限,這會對CF和CB算法的有效性產生影響[5]。由于新用戶沒有歷史行為記錄和評價,因此傳統的CF存在冷啟動問題[6]。

本文提出了一種新的方法,即基于新用戶在其他社會系統(如微博)中的社會關系,為其在新系統中進行推薦。在這種基于社會信任增強的RS中,假設用戶在系統中是朋友關系,因為他們通過社交平臺進行了交流,但這并不能準確地反映現實世界中的實際社會關系[7],這會導致一個問題,即使用戶在網上的評價具有相似之處,但在現實世界中他們的行為可能完全不同,因此也就難以進行個性化推薦。此外,根據較短的評論所提取的詞頻可能并不是最合適的,而結構化的長評價(如典型的LibQUAL+)方式能夠獲得多維度的信息,不僅能夠獲取用戶的喜好信息,還可能提取用戶的情緒信息[8]。在短評價和非結構化語言中進行用戶情緒分析與量化是本文所提出的具有挑戰性的問題之一。

本文的目標是要解決上述不足,建立一種推薦系統模型,即便是在沒有歷史評價等信息的情況下可以通過在線社交網絡獲得用戶的喜好。本文提出了一種基于RS的隱式社會信任和用戶度[9-10]情緒的量化評價方法,該方法能夠通過活動用戶和他的朋友之間的信任級別揭示對相關產品的情緒化程度,即偏好程度[11],從而改善現有的RS系統的性能。

1網絡社交平臺:微博

國內的在線社交網絡的霸主是微博,是一種通過關注機制分享簡短實時信息的廣播式社交網絡平臺。國外最早最成熟的是2006年創建的Twitter,而國內主要以2009年的新浪微博為主,截至2013年,新浪微博注冊用戶達到5.36億[12]。與傳統的博客、網站評論系統不同,微博有140個字的長度限制,但具有發布速度快、傳播范圍廣的優點。與Twitter一樣,微博采用的是“背對臉”交流模式,用戶可以關注另一些用戶,當然也可能被另外其他用戶所關注,這樣用戶可以根據自己的興趣偏好自由選擇關注對象,且關注者的質量和內容質量之間是存在正比關系。

由于微博用戶量龐大,涉及很多興趣領域的內容,因此筆者在其基礎上開展推薦系統研究。信任是一個用戶與另一個用戶之間一種隱式、主觀和模糊的感覺,要對其進行量化就需要從多角度評價用戶當時的情緒。為了收集微博信息,本文使用網絡爬蟲來獲取在線社交網絡中的數據。

2隱式推薦系統的系統框架

本文研究在線社交網絡中朋友對產品購買行為的影響。具體來說,用戶會傾向于從可信的朋友那里選擇產品或服務信息。分析朋友的選擇和他們對產品的滿意程度,以及還有朋友們寫下的心情等信息,從而進行推薦。

在線社交網絡提供了便捷的交流平臺,允許朋友實時生成和發布他們對現實世界的看法,當然也包括當時的心情如圖1所示。

圖1 社交網絡中典型的信息交互過程

圖1中活動用戶提供有趣的選擇,這個用戶可能從他的朋友的評論中發現感興趣的內容或相關信息。以電影為例,朋友A和B分別推薦“瘋狂動物城”和“美人魚”,但由于與A、B的信任度不同,系統可能傾向推薦“瘋狂動物城”而不是“美人魚”,主要原因是A的信任度更高一些。

另一個挑戰是分析在線社交網絡中的用戶情緒對信任度的影響,例如與朋友A的信任度較低,但A表現出較高的積極性看法,而與B具有更強的信任度,但存在一定負面性情緒,此時如何從A和B中選擇就成為一個難點。本文更傾向于使用信任度高的朋友的意見。系統總體框架圖如圖2所示。

圖2 系統總體框架圖

首先使用爬蟲對微博進行提取,以備實驗分析用;然后收集、過濾所需數據,利用情感分析技術分析用戶評價信息包含的情感傾向,并結合信任評級構建推薦系統模型。

2.1隱式社會信任關系

典型的信任模型主要基于兩點:分析用戶對某些項目之間的共同評價和用戶對他人的直接信任評價。但是對其中一些項目的評價并不一定適合于其他項目。例如,有兩個用戶A和B,由于他們都喜歡驚悚片,A向B提供了信任分數,但不能保證B在選擇動作片時的信任分數還可以提供給A?;谛湃卧u價的RS系統根據B的喜好向A提供建議與評級,但是用戶A可以完全不在乎這些建議。

為了更有效地獲得信任度量,可以采用如下方法:人們傾向于向他們的親戚和朋友獲得新的體驗,即使他們有不同的愛好。因此,受到多樣性社會關系的影響,人們的喜好呈現多樣化發展。從這種信任視角出發,RS的新用戶可能獲得如下好處:基于信任度模型所信任的人可能會影響新用戶的選擇,能夠比在線社交網絡中匿名的人提供更好的選擇。相比較而言,被基于建議的信任度模型所信任的用戶比那些在線社交網絡中匿名的人能提供更好的選擇,因為這是一種基于信任的RS行為。

微博平臺中轉發行為意味著用戶將某條他/她感興趣的內容轉發給他/她的朋友,表示為RT。假設用戶u和他的朋友圈F中一個朋友f之間的關系表示為f∈F。而微博好友列表中有兩類人:關注“我”的人和“我”關注的人。有一大批追隨者的人一定很關心他們的意見以及評論的內容(正面的或負面的)。因此,追隨者較多的用戶可能因他的朋友的評價獲得更多的信任。關注者和被關注者之間的比例定義為L,因此有:

(1)

式中:RTu,f是給定時間內由u給朋友f轉發的數量,RTu,F是給所有朋友發送的數量。因此L可以表示為:

(2)

式中:Listin是關注“我”的人數量,Listout是“我”關注的數量。用戶u和f之間的關系可由L表達。因此,信任度可由RT和L兩個因素的歸一化均值表達,即為:

(3)

(4)

利用上式,可以檢測u和f在時間T內各個時段的信任度如下:

(5)

式中:trustu,f是u和f在時間T內的總信任度。

2.2用戶情緒分析

在本研究中,主要關注在線社交網絡中較短的評論。如同現實世界人們所做的一樣,人們在微博上征詢朋友的意見以選擇感興趣的內容。從微博中提取用戶情緒是具有挑戰性的,因為與標準的長點評相比,微博中包含更多的短語和非正式的語言,微博被用戶用來分享他們生活中的點點滴滴,如新聞、愛好和八卦等,一個內容中可能同時包含多個不相關的內容。

(6)

(7)

(8)

(9)

(10)

(11)

這樣將SR分配到sc時,可能介于C中的相鄰分類之間,如SR的預測值可能是1.25。

3項目推理評分

(12)

(13)

準備好上述條件后,可以使用三種典型的機器學習模型用求解未知函數g,其輸出結果為評分的預測值。

4實驗與分析

4.1數據集的獲取

實驗樣本數據集必須包含朋友發布的內容、評論以及其他交流數據。為此,本文在網絡爬蟲的基礎上進行了二次開發以符合研究需要,該部分算法偽代碼如下:

Input 選擇電影內容

output:相關主題和評論包括作者id

for 電影ido

if 相關主題和評論被找到 then

獲取該主題/評論的作者idi

if idi不是名人/商業帳號 then

存儲主題/評論+idi

end if

end if

end for

社會關系數據集(SRD)的統計清單如表1所示。

表1 社會關系數據集統計清單

原始測試樣本參考MovieLens,對微博上2016年1~3月熱門電影數據進行了提取,并按照MovieLens數據格式進行重組。通過將電影名作為關鍵詞進行過濾,將用戶劃分為若干個群通過用戶ID構建其朋友圈,在此基礎上進行信任度量。下面是收集數據并進行過濾的偽代碼:

Input 內容相關的用戶id

Output 所有idi和朋友fi的回復/評論

while idi沒有受到保護或是公開的 do

根據idi獲取朋友列表

Fin←根據idi獲取所有關注者列表

Fou←根據idi獲取關注對象列表

while fi在idi的朋友列表 do

if fi沒有受到保護或公開的 then

for fi在時間段內的所有內容 do

if 內容可以訪問/有效的 then

if 內容是一條回復 then

RT++

end if

if 內容的作者id=idithen

rt++

end if

end if

end for

存儲RT,rt,Fin,Fout

end while

獲取下一個idi

end while

另外,為了對收集的信息進行正確的評價,本文使用三種不同的標注器,并且只保留那些每日更新數量在10條以上的活動用戶信息。

相關系數結果表明,標注1~2之間的相關性是0.4;2~3之間是0.4;1~3之間是0.5,相關結果的平均值為0.44。超出這種關聯性評價結果和評價在理論上表示人們的喜好或社交偏好,但在現實世界不太可能出現這樣強烈的意見或關系。

4.2回歸算法對比測試

使用三種不同的回歸算法進行測試,并使用精度度量來指示三種算法在該測試集上的預測性能。在實驗中,將數據集隨機分割成五個非重疊的區域,然后分別對這五個區域進行測試,每個區域的測試結果用于對另外四個區域的數據進行交叉驗證。使用絕對平均誤差(Mean Absolute Error,MAE)來評價推薦算法的有效性,MAE定義為:

(14)

(15)

三種回歸算法的測試結果如表2所示。

表2 三種回歸算法結果比較

由表2結果可知,SVR的準確度要高于另外兩種算法,誤差率最低,因此在后續的測試中主要以SVR作為本文改進算法的測試基準。

4.3多種推薦算法多尺度橫向對比

在進一步測試中,選擇另外幾種典型的推薦算法進行對比測試,分別是項目平均得分基準(Item Average Score baseline,IAS)、占主導地位的得分基準(Most Dominated Score baseline,MDS)、基于信任的加權平均法(Trust-based weighted mean,TBWM)、基于信任的協同過濾算法(Trust-based collaborative filtering,TBCF)和基于概率多點評價推薦算法(Probabilistic-based with multi-point,PBMP)。

為了更好的進行評價,在對比測試中考慮不同朋友數量對推薦結果的影響,以模擬推薦系統是否能有效根據朋友圈為一個新用戶推薦一組項目。假設存在12名新用戶,從數據集SD中抽取若干名用戶形成朋友列表,然后分配給每個用戶,則新用戶與這些朋友構成了一個密切溝通的群體。具有10個好友的數據集的對比測試結果如表3所示。

表3 幾種算法MAE對比

表3結果表明,本文算法IUBRS具有最低的MAE值0.352,而基于傳統的協同過濾算法TBCF的MAE達到了1.632,原因在于TBCF沒有考慮用戶歷史評價對預測結果的影響。

然后分別測試了好友數量為3、7和11的預測正確率和系統性能,結果分別如圖3和圖4所示??煽闯霰疚乃惴ň哂休^好的性能和較低的錯誤率。

圖3 不同朋友數量的MAE對比

5總結

本文研究了在線社交網絡中典型的推薦系統和協同過濾系統,在該基礎上通過挖掘微博評論數據分析用戶之間的隱式社會關系,并對該關系進行信任度量,構建一種增強的信任度推薦系統模型,同時基于概率方法和多點特征提取研究用戶情緒,以進一步提高預測準確程度。測試結果表明,基于SVR的機器學習算法能獲得最好的性能,并且在多種條件下具有較低的錯誤率。

圖4 稀疏信息矩陣中的性能比較

[參考文獻]

[1]Adomavicius, Tuzhilin A.Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering,2005,17(6), 734-749.

[2]劉淇.基于用戶興趣建模的推薦方法及應用研究[D].合肥:中國科學技術大學,2013.

[3]秦繼偉,鄭慶華,鄭德立,等.結合評分和信任的協同推薦算法[J].西安交通大學學報, 2013, 47(4):100-104.

[4]董小妹.大數據環境下基于本體的協同過濾推薦算法改進研究[D].南京:南京工業大學,2013.

[5]姜維,龐秀麗.面向數據稀疏問題的個性化組合推薦研究[J].計算機工程與應用, 2012, 48(21):21-25.

[6]于洪,李俊華.一種解決新項目冷啟動問題的推薦算法[J].軟件學報, 2015, 26(6):1395-1408.

[7]郭磊,馬軍,陳竹敏,等.一種結合推薦對象間關聯關系的社會化推薦算法[J].計算機學報, 2014, 37(1):219-228.

[8]馬慶國,王凱,舒良超.積極情緒對用戶信息技術采納意向影響的實驗研究——以電子商務推薦系統為例[J].科學學研究,2009,10:1557-1563.

[9]高涵.微博轉發的從眾心理研究[J].中州大學學報,2012,29(3):58-61.

[10]趙玲,張靜.微博用戶的從眾行為特性與影響研究[J].中國電化教育,2013(9):60-64.

[11]李棟,李偉,鄭志剛.從眾心理引起博弈策略的同步振蕩[J].復雜系統與復雜性科學,2009,6(1):29-35.

[12]微博.[EB/OL].[2016-04-08].http://baike.baidu.com/link?url=wIhU4ViqqJ4pVk8t12jt8av-AKv2t-3k3qlPh3R7utSHyvosBAB81mq4cnEVAIhV8dUaN3MVOoy7YF9mMd1liBN3mmefDkmIiun1fIin5TK.

(責任編輯:張凱兵)

Research of Recommendation System Based on Implicit User’s Behavior

Lu Jun1, Zhang Tianfan2,3

(1.SchoolofComputerandInformationScience,HubeiEngineeringUniversity,Xiaogan,Hubei432000,China; 2.CollegeofTechnology,HubeiEngineeringUniversity,Xiaogan,Hubei432000,China; 3.SchoolofAutomation,NorthwesternPolytechnicalUniversity,Xi’an,Shaanxi710072,China)

Abstract:Users are often unconsciously influenced by the behavior of their friends because of the group behavior. Recommendation systems can be built through the relevant user’s behavior. By evaluating mining group users’ information to build an implicit recommendation system algorithm, which consists of three parts, including the evaluation of communication activities based on implicit trust between users, obtaining emotional keywords to infer user’ s emotional level with the help of comments and using machine learning and regression algorithm to identify the level of emotion and the influence degree of trust between users and giving recommendations. By means of data analysis of the web-blog users’ comments, this paper verifies the effectiveness of the algorithm and it may exactly reflect the implicit trust and the user mood so as to provide support for the decision recommendation system.

Key Words:recommender system; implicit relationships; trust degree; users’ emotion; SVM

收稿日期:2016-02-08

基金項目:湖北省自然科學基金項目(2014CFB576)

作者簡介:盧軍(1975-),男,湖北孝昌人,湖北工程學院計算機與信息科學學院副教授,碩士。

中圖分類號:TP391.3

文獻標志碼:A

文章編號:2095-4824(2016)03-0022-06

張天凡(1982-),男,湖北孝感人,湖北工程學院新技術學院講師,西北工業大學自動化學院博士研究生。

主站蜘蛛池模板: 色噜噜综合网| 亚洲精品中文字幕无乱码| 亚洲精品无码久久毛片波多野吉| 色色中文字幕| 一本久道久久综合多人| 99这里只有精品6| 亚洲an第二区国产精品| 亚洲精品在线91| 亚洲精品视频网| 国产网站免费| 久久久噜噜噜| 在线欧美日韩| 毛片免费在线视频| 又粗又硬又大又爽免费视频播放| 精品国产成人av免费| 黄色国产在线| 亚洲一区二区成人| 99视频全部免费| 国产一区二区三区视频| 理论片一区| 不卡视频国产| 免费毛片在线| 国产极品美女在线| 国产成人精品日本亚洲| 久久综合色天堂av| 久久久久亚洲Av片无码观看| 亚洲欧美日韩另类| 2020国产精品视频| 国产精品自在线天天看片| 在线va视频| 久久五月天国产自| 精品日韩亚洲欧美高清a| 无码'专区第一页| 国产一线在线| 好吊色妇女免费视频免费| 日韩一区二区在线电影| 欧美日韩中文字幕在线| 久久精品国产精品国产一区| 亚洲一区二区三区国产精华液| 日本少妇又色又爽又高潮| 亚洲一区国色天香| 99re视频在线| 玖玖精品在线| 特级精品毛片免费观看| 影音先锋丝袜制服| 国产在线小视频| 高清不卡一区二区三区香蕉| 精品视频91| 亚洲精品视频免费观看| 无码粉嫩虎白一线天在线观看| 欧美性猛交xxxx乱大交极品| 免费看的一级毛片| 色香蕉影院| 一本无码在线观看| 成人小视频在线观看免费| 国产91成人| 亚洲国模精品一区| 色综合色国产热无码一| 国产综合另类小说色区色噜噜| 亚洲第七页| 欧美激情首页| 亚洲v日韩v欧美在线观看| 亚洲欧美另类日本| 免费中文字幕一级毛片| 国产精品亚洲一区二区三区z| 91成人在线观看视频| 久久99热66这里只有精品一| 日韩无码视频播放| 欲色天天综合网| 手机精品视频在线观看免费| 国产一级毛片在线| 日韩国产一区二区三区无码| 97se亚洲| 亚洲男人天堂2018| 国产一区二区三区免费观看| 自偷自拍三级全三级视频| 一级福利视频| 97国产精品视频自在拍| 亚洲成人黄色网址| 亚洲熟女偷拍| 九九热精品免费视频| 精品1区2区3区|