雷震,文益民,2,王志強,繆裕青,2
(1.桂林電子科技大學 計算機與信息安全學院,廣西 桂林 541004; 2. 桂林電子科技大學 廣西可信軟件重點實驗室,廣西 桂林 541004)
?
基于影響力控制的熱傳導算法
雷震1,文益民1,2,王志強1,繆裕青1,2
(1.桂林電子科技大學 計算機與信息安全學院,廣西 桂林 541004; 2. 桂林電子科技大學 廣西可信軟件重點實驗室,廣西 桂林 541004)
摘要:因特網上信息嚴重過載,使得用戶不容易從紛繁的信息中找到適合自己的內容。如何準確地向用戶推薦他們想要的信息成為急待解決的問題。熱傳導算法(HC)被廣泛地應用于個性化推薦領域,但是它的熱量傳播機制不利于經歷豐富的用戶喜歡的流行物品得到更多的熱量。因此,本文提出了基于影響力控制的熱傳導算法(THC)。THC引入兩個參數控制度數大的用戶喜歡的度數大的物品對目標用戶推薦的影響。另外,本文提出利用用戶對景點的各項評分及評論的情感極性來判斷用戶是否喜歡一個景點,還提出了一個新的指標buir以度量度數大的用戶喜歡的度數大的物品出現在推薦列表中的比例。實驗結果表明:適度增大的度數大的用戶喜歡的度數大的物品的影響,有助于推薦出目標用戶喜歡的物品,從而有助于提升推薦效果。
關鍵詞:熱傳導;個性化推薦;用戶偏好;情感極性;二部網絡;信息過載;物品流行度;用戶影響力
隨著互聯網的迅速發展,用戶越來越喜歡到相關網站上尋找自己想要的信息。以旅游領域為例,有機構預計2016年中國在線旅游市場規模將達到4 440億元。游客訪問旅游網站,尋找他們感興趣的旅游信息,確定他們想去游玩的景點[1]。但是,旅游網站上信息過載嚴重,游客不容易從紛繁的旅游信息中選擇合適自己需求的信息。進入Web 2.0時代,搜索和推薦為減輕用戶尋找符合自己需要信息的困難提供了可能,其中利用用戶的歷史信息來預測用戶選擇的個性化推薦系統成為一種解決信息過載問題的有效工具[2-5]。現今,商家廣泛使用個性化推薦系統來對潛在的消費者進行物品、服務或信息的推薦。例如,亞馬遜使用基于物品的協同過濾系統[6]進行個性化書本推薦;Google利用用戶的點擊行為數據建立了新聞推薦系統[7];百度開發了Q&A社區的推薦系統[8]等。
近些年,根據物理動力學原理設計的HC算法,已經被成功地應用到了推薦領域。HC算法將用戶與物品的關系用一個二部網絡來表示。但是,HC算法也存在一些不足。在HC算法中,目標用戶喜歡的物品產生的熱量在兩步傳播過程中被分別除以了用戶的度和物品的度,所以它削弱了度數大的用戶喜歡的度數大的物品對目標用戶選擇物品時的影響。事實上,目標用戶對物品的選擇往往受到與他關聯的經歷豐富的用戶(度數大的用戶)喜歡的流行物品(度數大的物品)較大的影響。以旅游推薦為例,如果某用戶不是很清楚什么樣的旅游產品適合自己,他會愿意聽取旅游經歷豐富的游客的意見,而旅游經歷豐富的游客一般會推薦該用戶自己喜歡的而且比較流行的景點(度數大的景點)。
本文主要做了如下研究:一是增大與目標用戶關聯的經歷豐富的用戶以及這些用戶喜歡的流行物品對目標用戶選擇物品的影響,從而提出了HC的改進算法THC;二是在旅游領域為了更準確地判斷用戶是否喜歡一個景點,采用了綜合評價的方法。本文根據用戶對景點的整體評分、風景評分、趣味評分、性價比評分以及用戶對景點評論的情感極性來判斷用戶是否真的喜歡該景點,從而提出了旅游推薦領域的用戶態度判斷算法。
1相關工作
迄今為止,眾多的推薦系統研究者已經提出很多算法,如基于協同過濾的方法[6-9]、基于內容分析的方法[10]、鏈接預測方法[11-12]及混合方法[13]。文獻[14]發現協同過濾算法(CF)推薦的TOP-n個物品更傾向于流行的物品,但是較少關注用戶可能潛在感興趣的物品[15]。為了克服CF的弱點,文獻[13]提出了熱傳導(HC)算法來解決推薦系統中的準確性-多樣性兩難問題。文獻[16]提出的物質擴散(MD)算法,是一種類似于HC的推薦算法,它能帶來較高的準確率。文獻[17]認為MD算法與HC算法分別在準確率和多樣性上有優勢,他們分析了不同度的物品在傳播過程中的影響并引入一個參數控制影響程度,提出了一種混合算法。文獻[18]認為用戶從不同流行度的物品上獲得的熱量應該不同,它們利用一個參數來調控物品流行度對用戶獲得熱量的影響并提出了非平衡熱傳導推薦算法。文獻[19]發現,HC算法中所有不同度的物品和用戶都被同等看待。因此,他們利用邊連接的用戶與物品的度來衡量邊的權重,并提出了基于權重的HC算法(WHC);但是該算法將用戶和物品的度對權重的影響程度視為相同。文獻[5]認為HC算法的準確率較低是由于它傾向于推薦度數小的物品。為降低度數小的物品對目標用戶推薦的影響,他們提出了基于偏向的熱傳導算法(BHC)。BHC算法通過降低度數小的物品的影響,來優先推薦度數大的物品,但是削弱了度數大的用戶對目標用戶的影響。相對于WHC算法而言,THC算法將用戶與物品的度對目標用戶選擇物品的影響區別對待;相對于BHC算法而言,THC算法不僅考慮到了物品的度對目標用戶選擇物品的影響,還考慮到了用戶的度對目標用戶的影響。
2熱傳導算法


(1)
圖1中給出了HC算法的示例。圖1(a)目標用戶喜歡的物品被激活,被賦值熱量1,其余的物品被賦值熱量0;圖1(b)每個用戶得到的熱量是他喜歡的所有物品的熱量均值;圖1(c)每個物品得到的熱量是所有喜歡該物品的用戶的熱量均值。

圖1 用戶-物品二部網絡中的熱傳導Fig.1 Heat conduction in user-item bipartite network
3基于影響力控制的熱傳導算法
在推薦領域,目標用戶對物品的選擇與其相關聯的經歷豐富的用戶有關。以旅游領域為例,比如:一個游客近期想準備一次旅游,由于他掌握的旅游信息有限,所以他很可能不太清楚去哪里游玩比較合適。他一般會咨詢旅游經歷豐富的朋友,了解他們曾經玩過的哪些景點比較好。這些旅游經歷豐富的用戶一般會建議他去游玩自己去過并且喜歡的一些流行的景點,該游客然后會綜合他們的意見,從中選擇自己想要去的景點。受到以上的啟發,本文試圖優先推薦與目標用戶有關聯的經歷豐富的用戶喜歡的度數大的物品。

(2)
式中λ和β分別用來控制度數大的用戶喜歡的度數大的物品對目標用戶影響的程度,它們的取值范圍都是0~1。當λ=β=1時,wγθ就變成了基本熱傳導算法中的傳導率。當λ和β從1到0變化時,度數大的用戶喜歡的度數大的物品對目標用戶的推薦的影響程度會越來越大。

輸入用戶-物品對數據集T,推薦物品個數L,目標用戶u;
輸出top-L個物品。
1)目標用戶u喜歡的物品被激活,被賦值熱量1;
2)熱量按式(2)的傳播方式從物品傳到用戶;
3)熱量按式(2)的傳播方式從用戶傳到物品;
4)物品按照其上面的熱量按降序排序后,推薦給目標用戶u top-L個物品。
4旅游評價中的用戶態度判斷算法
在推薦領域,有時僅憑一個單獨的評分并不足以確定用戶是否真的喜歡當前物品。以旅游領域為例,如圖2所示,某用戶對某景點的整體評分為3,可以認為該用戶喜歡該景點。但是,進一步觀察發現:用戶對當前景點的景色評分為4,對景點的趣味性、性價比的評分均為1。這說明用戶對這個景點也有不滿意的地方。用戶對景點的態度也會體現在其對該景點的評論中。圖2給出的評論中出現了‘馬達聲吵死了’,‘大殺(煞)風景’及‘沒有想象中的輕舟已過萬重山的感覺’等文字。從評論中可以看出用戶對這次旅游的體驗并不滿意。

圖2 用戶對景點評價和評論實例Fig.2 An example of a user’s evaluation and comment on a scenery spot
因此本文設計了確定用戶是否喜歡某景點的算法,即旅游評價中的用戶態度判斷算法。設計理由如下:如果用戶真的喜歡當前景點,那么該用戶對當前景點的各項評分應該都比較高,則所有評分的均值也應該比較大。因此,計算各項評分的均值sa,讓均值大小作為判斷用戶是否喜歡該景點的依據之一。另外,如果用戶真的喜歡當前景點,該用戶對當前景點評論的情感一定會是非負向的。算法中,評論的情感極性計算方法采用文獻[20]中的情感提取算法。以圖2為例,通過分析可知,根據整體評分會認為用戶喜歡該景點,但用態度判斷算法可以確定該用戶對該景點并不是很滿意,因為sa<3且評論的情感極性為負。使用旅游評價中的用戶態度判斷算法能較為準確地判斷用戶是否喜歡某景點。用戶態度判斷算法如下。
輸入 用戶對該景點的整體評分st; 用戶對該景點的風景評分sg;用戶對該景點的趣味評分si;用戶對該景點的性價比評分sp;用戶對該景點的評論信息C;
輸出true,用戶喜愛該景點;false,用戶不喜歡該景點。
1)利用ICTCLAS對C進行分詞,去掉停用詞,利用詞性標注來去掉中性詞;
2)對C中的其余詞,判斷其是否是情感詞;
3)對每一個否定詞wi,找出與其最近的情感詞并且將其情感值從swi+1變成-swi+1;
4)對每一個程度副詞,找出與其最近的情感詞并且用程度副詞對應的系數α乘以情感詞的情感值;
5)利用如下公式計算評論C的情感極性值;
式中,Sc與Swi分別代表評論C與情感詞wi的情感值;m是評論中的詞語個數;
6)計算所有評分的均值Sa:
7)如果Sa≥3且Sc≥0,返回true;否則返回false。
5實驗與結果
5.1數據集
桂林是全國乃至世界知名的旅游目的地。本文從http://www.ctrip.com上抓取了關于桂林市旅游的數據來驗證提出的算法。數據包含了用戶對景點的評分和評論,評分包含了4個方面:用戶對景點的整體評分、用戶對景點的景色評分、用戶對景點的趣味性評分以及用戶對景點的性價比評分(如圖2)。本文采集了包含18 151個用戶對143個景點的18 304條評分及評論記錄。為了有效驗證算法,對數據集進行了預處理。刪除評價景點數量少于2條的用戶,刪除沒有用戶評分的景點,再利用旅游評價中的用戶態度判斷算法計算用戶是否喜歡某景點。數據集包含1 164個用戶對143個景點的5 672條評分及評論信息。
為了對提出算法的有效性進行更可靠的驗證,本文還使用了電影評分的數據集[21]進行對比實驗。刪除對電影評分數目少于2條的用戶,刪除沒有用戶評分的電影,最終得到370個用戶對578部電影的9 331條評分記錄。
每組實驗中,數據集被分為2部分,其中隨機挑選出用戶-物品二部網絡中20%的邊作為測試集,其余80%的邊為訓練集[5]。每組實驗都重復50次,最終的實驗結果是這50次實驗結果的平均值。
5.2評價指標
為了評判提出的想法是否達到了預期效果,即度數大的用戶喜歡的度數大的物品是否被推薦出來。本文提出了一個大度用戶大度物品率指標(buir),用來衡量推薦出的度數大的用戶喜歡的度數大的物品出現在推薦列表中的比例。式(3)給出了目標用戶i的該指標計算方法。
(3)
式中:Ti是用戶i的推薦列表中物品構成的集合,L是推薦列表長度。Ri是與目標用戶i關聯的度數大的用戶喜歡的度數大的物品集合。任意一個用戶,如果他與用戶i有共同喜歡的物品,則將該用戶稱為與用戶i有關聯的用戶,所有這樣的用戶構成的集合稱為與用戶i關聯的用戶集合AU。將AU中的所有用戶按照其度進行降序排序,并取排在前1/3的用戶,將這些用戶構成的集合稱為與用戶i關聯的度數大的用戶集合BU。對BU中的每一個用戶j,將用戶j喜歡的物品按其度進行降序排序,并取排在前1/3的物品,將這些物品稱為用戶j喜歡的度數大的物品。將與用戶i關聯的度數大的用戶集合BU中的所有用戶喜歡的度數大的物品構成集合,稱之為與用戶i關聯的大度用戶喜歡的大度物品集合,即Ri。對測試集中的所有用戶的大度用戶大度物品率取平均就可以得到該算法的大度用戶大度物品率。
為了分析提出算法的效果,本文采用了以下4個指標[5]:排序得分(ranking score)、新穎性(novelty)、多樣性(diversity)及覆蓋率(coverage)。
ranking score(RS):一個好的推薦算法應該將用戶喜歡的物品排在前面。測試集中,如果物品α被目標用戶i喜歡,物品α位于用戶i的推薦列表中排序為r的位置,那么物品α的排序得分為
(4)
式中:m是訓練集中物品總數,ki是訓練集中用戶i喜歡的物品總數。每個用戶的排序得分,是所有推薦給他并且他的確喜歡的物品的排序得分均值。對測試集中所有用戶的排序得分求平均值,就可以得到算法的排序得分。
novelty:新穎性被定義為所有被推薦物品度的平均值。一個推薦算法的新穎性計算如式(5):
(5)
式中:ki是物品i的度,n是算法給所有用戶推薦的物品總數。推薦算法的新穎性值越小,推薦出來的物品越新穎。
diversity:一個推薦算法應該給不同的用戶推薦不同的物品。式(6)給出了多樣性的計算方法:
(6)
式中:L是推薦列表長度,Qij(L)是用戶ui、uj推薦列表中相同物品的個數,Hij表示推薦算法給用戶ui、uj兩者推薦結果間的多樣性。求出測試集中任意兩個用戶的推薦結果間的多樣性值的平均值,就可以得到一個推薦算法的多樣性值。多樣性值越大意味著一個推薦算法給不同的人推薦結果越不一樣。
coverage:推薦算法的覆蓋率是指算法能推薦的物品種類占所有物品種類的比例。式(7)給出了覆蓋率的計算方法:
(7)
式中:n是算法給全體用戶推薦的不同物品的數量,N是物品總數。覆蓋率越大意味著算法能推薦出的不同物品的數量越多。
5.3實驗方案
為了觀察buir指標隨參數λ和β的變化情況以及它對其他指標的影響,實驗提供了THC算法分別在旅游數據集和電影數據集上推薦列表長度分別為5、8、10、12時,各指標隨參數變化的情況圖。圖分為8組,每組5張,共計40張。由于每組圖的變化情況類似,本文只提供了推薦列表L=10時THC算法在旅游數據集上的結果,以分析buir與其他指標的關系。各指標的變化分別如圖3~7所示。為了進一步分析THC方法的有效性,分別使用旅游數據集和電影評分數據集對BHC[5]、WHC[18]、MD[16]、HC[5]及THC在推薦列表的長度分別為5、8、10、12時的排序得分進行比較。實驗結果如圖8、9所示。需要說明的是:某用戶對某電影喜愛的條件是該用戶對該電影的評分大于或等于3。某用戶對某景點是否喜愛的判斷是利用旅游評價中的用戶態度判斷算法計算得出。BHC和WHC中的參數變化范圍為0~1。

圖3 L=10時,THC算法在旅游評價數據集上buir指標隨參數變化圖Fig.3 The variation of THC’s buir index on the travel data set when L=10

圖4 L=10時,THC算法在旅游評價數據集上排序得分指標隨參數變化Fig.4 The variation of THC’s rank score index on the travel data set when L=10

圖5 L=10時,THC算法在旅游評價數據集上新穎性指標隨參數變化Fig.5 The variation of THC’s novelty index on the travel data set when L=10

圖6 L=10時,THC算法在旅游評價數據集上多樣性指標隨參數變化Fig.6 The variation of THC’s diversity index on the travel data set when L=10

圖7 L=10時,THC算法在旅游評價數據集上覆蓋率指標隨參數變化Fig.7 The variation of THC’s coverage index on the travel data set when L=10

圖8 電影評分數據集上各算法的排序得分對比結果Fig.8 The comparison of rank score index on the movie data set

圖9 旅游評價數據集上各算法的排序得分對比結果Fig.9 The comparison of rank score index on the travel data set
5.4實驗結果與分析
圖3~7中的黑色代表各圖中相應指標值較大的區域,白色代表各圖中相應指標值較小的區域,圖中顏色越黑表示相應指標值越大。由圖3可以看出,當λ取值小于0.5,β取值也小于0.5時,此時推薦出來的度數大的用戶喜歡的度數大的物品較多。圖4中相應區域的排序得分較低,這說明度數大的用戶喜歡的度數大的物品一般是大家所喜歡的物品,與文中開始提出的假設一致;由于此時推薦出來的度數大的物品較多,所以推薦的物品的新穎性較低即新穎性值較大,這與圖5中相應區域的指標數據是一致的;另外,度數大的用戶喜歡的度數大的物品在整個系統的所有物品中占的比例是比較小的,因為大多數物品都不是流行物品,所以此時多樣性和覆蓋率都較低,這與圖6和圖7中相應區域的指標數據一致。對于圖4,數據表明:當λ與β分別取0.05、0.55時,排序得分取得最優值0.029 8,但此時buir并不是最大。可以得出這樣的結論:雖然目標用戶會喜歡度數大的用戶喜歡的度數大的物品,但是推薦的量要適度。還可以發現:此時的排序得分要比當λ=β=1.0時的HC算法的排序得分要好,而此時的buir指標也比HC的要高。
通過分析各個評價指標變化圖,可以得出如下結論:1)如果要向用戶推薦較多度數大的用戶喜歡的度數大的物品,則應該將λ與β的取值范圍都限制在0~0.5,因為在此范圍中buir的值均較大。2)如果要使算法的排序得分取得最大值,2個參數λ與β的最優值應該從0~1之間尋找。雖然λ與β在0~0.5取值時,度數大的用戶喜歡的度數大的物品更可能被推薦,但是并不一定是推薦得越多,排序得分越好。3)如果要向用戶推薦較多的新穎物品,則不該將λ與β的取值范圍都限制在0~0.5,因為當buir較大時,推薦出來的度數大的用戶喜歡的度數大的物品較多,此時推薦出來的物品必然不新穎。
圖8和圖9是BHC、MD、WHC、HC及THC在兩個數據集上推薦列表的長度分別為5、8、10、12時排序得分的對比結果。其中BHC、WHC及THC是取所有不同參數結果中的最優值。通過觀察可以發現,本文提出的THC算法,與基本的HC算法相比,在所有的情況下排序得分都要好;與MD、WHC、BHC算法相比,排序得分也都要好,雖然提升程度較小。
通過上面的分析可以知道:通過適度的優先推薦度數大的用戶喜歡的度數大的物品,有助于向用戶推薦其喜歡的物品,從而有助于提升算法的效果。另外,還可以發現MD和BHC算法的排序得分在所有情形下都比HC算法要好,這與文獻[5]中的結論一致;WHC算法在所有條件下都比HC算法的排序得分好,這與文獻[19]中的結論一致。
6結束語
由于HC算法減弱了度數大的用戶喜歡的度數大的物品對目標用戶的影響,本文提出了基于影響力控制的熱傳導算法THC。THC引入2個參數來控制度數大的用戶喜歡的度數大的物品被優先推薦的程度。為了檢驗提出的想法是否達到預期效果,在電影評分數據集和旅游評價數據集上進行了多項對比實驗。本文還提出了旅游評價中的用戶態度判斷算法及一個新指標buir。實驗結果表明,當THC中的2個參數λ和β較小時,度數大的用戶喜歡的度數大的物品能被更多的推薦,但這種推薦要有控制,否則會降低排序得分。實驗結果還表明THC算法在排序得分指標上比BHC、MD、WHC及HC算法表現更好。未來可考慮結合用戶間的朋友關系與信任關系進一步調控度數大的用戶喜歡的度數大的物品對目標用戶推薦的影響。
參考文獻:
[1]文益民, 史一帆, 蔡國永, 等. 個性化旅游推薦研究綜述[EB/OL]. 北京: 中國科技論文在線, 2014. [2014-07-03]. http://www.paper.edu.cn/releasepaper/content/201407-56.
[2]RESNICK P, VARIAN H R. Recommender systems[J]. Communications of the ACM, 1997, 40(3): 56-58.
[3]ADOMAVICIUS G, TUZHILIN A. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions[J]. IEEE transactions on knowledge and data engineering, 2005, 17(6): 734-749.
[4]FELFERNIG A, GORDEA S, JANNACH D, et al. A short survey of recommendation technologies in travel and tourism[J]. OEGAI journal, 2007, 25(7): 17-22.
[5]LIU Jianguo, ZHOU Tao, GUO Qiang. Information filtering via biased heat conduction[J]. Physical review E, 2011, 84(3): 037101.
[6]LINDEN G, SMITH B, YORK J. Amazon. com recommendations: item-to-item collaborative filtering[J]. IEEE internet computing, 2003, 7(1): 76-80.
[7]DAS A S, DATAR M, GARG A, et al. Google news personalization: scalable online collaborative filtering[C]//Proceedings of the 16th International Conference on World wide Web. New York, USA, 2007: 271-280.
[8]LIU Qiwen, CHEN Tianjian, CAI Jing, et al. Enlister: baidu's recommender system for the biggest chinese Q & A website[C]//Proceedings of the Sixth ACM Conference on Recommender Systems. New York, USA, 2012: 285-288.
[9]HERLOCKER J L, KONSTAN J A, RIEDL J. Explaining collaborative filtering recommendations[C]//Proceedings of the 2000 ACM Conference on Computer Supported Cooperative Work. New York, USA, 2000: 241-250.
[10]PAZZANI M J. A framework for collaborative, content-based and demographic filtering[J]. Artificial intelligence review, 1999, 13(5-6): 393-408.
[11]ZHOU Tao, Lü Linyuan, ZHANG Yicheng. Predicting missing links via local information[J]. The european physical journal B, 2009, 71(4): 623-630.
[12]Lü Linyuan, ZHOU Tao. Link prediction in weighted networks: the role of weak ties[J]. EOL (europhysics letters), 2010, 89(1): 18001.
[13]ZHOU Tao, KUSCSIK Z, LIU Jianguo, et al. Solving the apparent diversity-accuracy dilemma of recommender systems[J]. Proceedings of the national academy of sciences of the United States of America, 2010, 107(10): 4511-4515.
[14]ZENG Wei, SHANG Mingsheng, ZHANG Qianming, et al. Can dissimilar users contribute to accuracy and diversity of personalized recommendation[J]. International journal of modern physics C, 2010, 21(10): 1217-1227.
[15]ZHANG Zike, YU Lu, FANG Kuan, et al. Website-oriented recommendation based on heat spreading and tag-aware collaborative filtering[J]. Physica A: statistical mechanics and its applications, 2014, 399: 82-88.
[16]ZHOU Tao, REN Jie, MEDO M, et al. Bipartite network projection and personal recommendation[J]. Physical review E, 2007, 76(4): 046115.
[17]NIE Dacheng, AN Yahui, DONG Qiang, et al. Information filtering via balanced diffusion on bipartite networks[J]. Physica A: statistical mechanics and its applications, 2015, 421: 44-53.
[18]侯磊, 胡兆龍, 張博, 等. 基于流行度的非平衡熱傳導推薦算法研究[J]. 計算機應用研究, 2015, 32(11): 3235-3237.
HOU Lei, HU Zhaolong, ZHANG Bo, et al. Information filtering via non-equilibrium heat conduction with consideration of popularity[J]. Application research of computers, 2015, 32(11): 3235-3237.
[19]LIU Jianguo, GUO Qiang, ZHANG Yicheng. Information filtering via weighted heat conduction algorithm[J]. Physica A: statistical mechanics and its applications, 2011, 390(12): 2414-2420.
[20]SHI Shaoliang, LI Yunpeng, WEN Yimin, et al. Adding the sentiment attribute of nodes to improve link prediction in social network[C]//Proceedings of the 12th International Conference on Fuzzy Systems and Knowledge Discovery. Zhangjiajie, China, 2015: 1263-1269.
[20]LIU Jinhu, ZHANG Zike, CHEN Lingjiao, et al. Gravity effects on information filtering and network evolving[J]. PLoS one, 2014, 9(3): e91070.

雷震,男,1991年生,碩士研究生,主要研究方向為推薦系統與數據挖掘。

文益民,男,1969年生,博士,教授,中國計算機學會高級會員。主要研究方向為機器學習與數據挖掘、極化SAR圖像處理、社會計算。主持省部級科研項目8項,獲得省部級教學、科研獎勵5項,發表學術論文30余篇,其中被SCI、EI收錄18篇,翻譯譯著1部。

王志強,男,1991年生,碩士研究生,主要研究方向為數據挖掘、旅游推薦。
中文引用格式:雷震,文益民,王志強,等.基于影響力控制的熱傳導算法[J]. 智能系統學報, 2016, 11(3): 328-335.
英文引用格式:LEI Zhen, WEN Yimin, WANG Zhiqiang, et al. Heat conduction controlled by the influence of users and items[J]. CAAI transactions on intelligent systems, 2016,11(3): 328-335.
Heat conduction controlled by the influence of users and items
LEI Zhen1, WEN Yimin1,2, WANG Zhiqiang1, MIAO Yuqing1,2
(1.School of Computer Science and Information Security, Guilin 541004, China; 2. Guangxi Key Laboratory of Trusted Software, Guilin University of Electronic Technology, Guilin 541004, China)
Abstract:The overload of information on the Internet can lead to users feeling hopeless about finding the information they are seeking. Making accurate recommendations to users about the information they truly need is an urgent problem that must be addressed. The heat conduction (HC) algorithm has recently been applied in personalized recommendation technology, but its mechanism weakens the heat generated from the larger-degree itemsliked by the larger-degree users. To solve this problem, we propose an improved HC algorithm that is based on user influence control (THC). THC introduces two tunable parameters to better control the influence of larger-degree users′ preferences for larger-degree items on target users. We also consider a user′s comment scores and the sentiment polarity of a comment in a given scenario to accurately judge whether the user truly likes the given scenario. We also propose a new index, called a buir, which measures the ratio of the larger-degree items that are liked by larger-degree users on the recommendation list. Experimental results show that appropriately promoting the influence of larger-degree items that are liked by larger-degree users helps in making recommendations to target users regarding items in which they are truly interested, thereby improving the performance of the recommendation.
Keywords:heat conduction; personalized recommendation; user′s preference; sentiment polarity; bipartite network; information overload; item popularity; user's influence
作者簡介:
中圖分類號:TP391
文獻標志碼:A
文章編號:1673-4785(2016)03-0328-08
通信作者:文益民.E-mail: ymwen2004@aliyun.com.
基金項目:國家自然科學基金項目(61363029);廣西省科學研究與技術開發項目(桂科攻14124005-2-1);湖南省博士后科研專項計劃項目(2011RS4073);廣西信息科學中心項目(YB408).
收稿日期:2016-03-19.網絡出版日期:2016-05-13.
DOI:10.11992/tis.201603042
網絡出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160513.0920.016.html