999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合興趣和行為的用戶轉(zhuǎn)發(fā)行為預(yù)測

2017-03-22 22:20:33劉清
電子技術(shù)與軟件工程 2017年3期

微博轉(zhuǎn)發(fā)是微博網(wǎng)絡(luò)中信息得以傳播的基礎(chǔ),對用戶影響力評估以及網(wǎng)絡(luò)營銷等具有重要意義。現(xiàn)有的方法在考慮影響用戶轉(zhuǎn)發(fā)行為的因素時,大多只考慮微博以及用戶屬性等特征,沒有考慮用戶興趣和用戶歷史行為規(guī)律等個性化特征,本文提出了基于LDA主題模型的用戶興趣與微博相似度計算方法,將計算結(jié)果作為用戶興趣特征,還提出了基于用戶轉(zhuǎn)發(fā)率、與上游用戶交互頻率的用戶歷史行為特征,最后融合用戶興趣特征、用戶歷史行為特征、上游用戶特征、微博特征,建立基于幾種常見分類模型的預(yù)測方法,在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法能夠有效提升預(yù)測準(zhǔn)確性,取得較好的預(yù)測效果。

【關(guān)鍵詞】微博轉(zhuǎn)發(fā) LDA主題模型 用戶興趣 用戶歷史行為規(guī)律 分類模型

1 引言

微博,作為web2.0的典型應(yīng)用之一,是近年來興起的信息交流與傳播平臺,表現(xiàn)出非常強(qiáng)勁的發(fā)展勢頭。由于具有龐大的用戶規(guī)模以及便捷快速的消息發(fā)布與傳播方式,微博已發(fā)展成為當(dāng)前信息傳播與輿論擴(kuò)散的重要平臺。如何對微博的信息傳播機(jī)制進(jìn)行有效的檢測與管控,增強(qiáng)對熱點(diǎn)事件的預(yù)見性,使其能夠更好地服務(wù)于社會是當(dāng)下亟需重視的問題。因此,微博轉(zhuǎn)發(fā)作為微博信息傳播的重要過程,研究其具有重要意義,現(xiàn)有的研究將用戶轉(zhuǎn)發(fā)問題看成是二分類問題,但大多沒考慮用戶的興趣和用戶的歷史行為對用戶轉(zhuǎn)發(fā)行為的影響。

2 問題描述

若給出了用戶的歷史轉(zhuǎn)發(fā)或不轉(zhuǎn)發(fā)微博集合,對用戶轉(zhuǎn)發(fā)行為的預(yù)測問題可看成是機(jī)器學(xué)習(xí)中的二分類問題,通過對微博集合進(jìn)行訓(xùn)練,可得到用戶轉(zhuǎn)發(fā)或不轉(zhuǎn)發(fā)微博的分類結(jié)果。

3 融合興趣和行為的用戶轉(zhuǎn)發(fā)行為預(yù)測

3.1 用戶興趣特征

本文通過LDA主題模型去建立用戶的興趣并計算用戶興趣與微博的相似性,再將計算結(jié)果作為用戶興趣特征。

3.2 用戶歷史行為特征

用戶的歷史行為包括用戶轉(zhuǎn)發(fā)活躍度以及用戶與上游用戶的交互強(qiáng)度。

本文按如下方式定義用戶的轉(zhuǎn)發(fā)活躍度frr:

其中,nrepost表示用戶最近發(fā)布的微博中轉(zhuǎn)發(fā)微博的數(shù)量,npost表示用戶最近發(fā)布所有微博的數(shù)量,frr越大說明用戶最近發(fā)表的微博中轉(zhuǎn)發(fā)微博的比例越高。

本文按如下方式定義用戶的接受用戶與上游用戶之間的交互強(qiáng)度fuv。

其中u表示上游用戶,v表示接受用戶, nv表示一段時間t內(nèi)接受用戶轉(zhuǎn)發(fā)微博的次數(shù),nuv表示一段時間t接受用戶轉(zhuǎn)發(fā)的微博中上游用戶微博的數(shù)量。

3.3 上游用戶特征

上游用戶的特征包括上游用戶的粉絲數(shù)、注冊年限、上游用戶身份、認(rèn)證狀態(tài)。

3.4 微博內(nèi)容特征

微博內(nèi)容特征包括微博中是否@他人,是否含有主題標(biāo)簽,微博發(fā)表時間段以及是否含有超鏈接。

4 實(shí)驗(yàn)分析

4.1 實(shí)驗(yàn)數(shù)據(jù)集

本文基于新浪微博開放平臺提供的API來抓取所需的數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)整體分布見表1。

表1:實(shí)驗(yàn)數(shù)據(jù)集分布

轉(zhuǎn)發(fā)微博 不轉(zhuǎn)發(fā)微博 總數(shù)

62,966 497,130 560,126

4.2 實(shí)驗(yàn)結(jié)果及分析

轉(zhuǎn)發(fā)行為預(yù)測結(jié)果如圖1所示,使用不同的分類模型將有不同的預(yù)測效果,其中使用邏輯回歸進(jìn)行預(yù)測時準(zhǔn)確率達(dá)到0.73,召回率達(dá)到0.75,F(xiàn)1度量值達(dá)到0.75。

為了證明本文考慮的用戶興趣和行為特征的有效性,將結(jié)果和Zhang等人的工作進(jìn)行比較,都使用邏輯回歸模型進(jìn)行預(yù)測,比較結(jié)果如表2所示。

表2:預(yù)測結(jié)果對比

分類方法 準(zhǔn)確率 召回率 F1度量值

本文的方法 0.735 0.752 0.752

張的方法 0.708 0.733 0.735

可以看出本文所提出的的方法預(yù)測結(jié)果更加準(zhǔn)確,能夠?qū)?zhǔn)確率提升將近3%,說明本文考慮的用戶興趣和行為特征能夠提高預(yù)測準(zhǔn)確性。

參考文獻(xiàn)

[1]Xu Z,Yang Q.Analyzing user retweet behavior on Twitter.In:Proc.of the ASONAM 2012.Washington: IEEE Computer Society,2012.46-50.[doi: 10.1109/ASONAM.2012.18]

[2]張旸,路榮,楊青.微博客中轉(zhuǎn)發(fā)行為的預(yù)測研究[J].中文信息學(xué)報,2012,26(04):109-114

[3]曹玖新,吳江林,石偉,劉波,鄭嘯,羅軍舟.新浪微博網(wǎng)信息傳播分析與預(yù)測[J].計算機(jī)學(xué)報,2014,37(04):779-790.

[4]Zhang J,Liu B,Tang J,Chen T,et al.Social influence locality for modeling retweeting behaviors[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence (IJCAI),2013: 2761-2767.

作者簡介

劉清(1993-),男,江蘇省淮安市人。工學(xué)碩士,同濟(jì)大學(xué)學(xué)生。主要研究方向?yàn)樯缃痪W(wǎng)絡(luò)數(shù)據(jù)挖掘研究。

作者單位

同濟(jì)大學(xué) 上海市 201800

主站蜘蛛池模板: 日本成人在线不卡视频| 欧美一级在线看| 日韩成人在线视频| 国产精品女熟高潮视频| 精品视频福利| 极品国产在线| 四虎精品国产永久在线观看| 亚洲国产天堂久久九九九| 日韩国产一区二区三区无码| 亚洲第一视频区| 一本色道久久88| 成人在线天堂| 女人av社区男人的天堂| 亚洲小视频网站| 97青草最新免费精品视频| 欧美日韩精品在线播放| 手机在线国产精品| 亚洲国产综合精品一区| 欧美一级在线播放| 国产精品三级专区| 老司机久久99久久精品播放| 亚洲色精品国产一区二区三区| 动漫精品中文字幕无码| 国产欧美专区在线观看| 国产成人综合网在线观看| 国产靠逼视频| 91精品视频网站| 久久男人资源站| 欧美精品一二三区| m男亚洲一区中文字幕| 99r在线精品视频在线播放| www.国产福利| 一级片一区| 午夜a视频| 国产微拍精品| 黄色成年视频| 免费精品一区二区h| 综合成人国产| 国产激情第一页| 婷婷亚洲视频| 亚洲三级视频在线观看| 欧美亚洲日韩不卡在线在线观看| 亚洲日韩国产精品综合在线观看| 无遮挡一级毛片呦女视频| 思思热在线视频精品| 亚洲福利视频网址| 久久精品丝袜| 色综合中文| 成人免费视频一区二区三区| 亚洲精品麻豆| 欧美曰批视频免费播放免费| 一本视频精品中文字幕| 国产精品白浆在线播放| 国产产在线精品亚洲aavv| 精品少妇人妻无码久久| 少妇精品在线| 精品一區二區久久久久久久網站| 日韩精品久久无码中文字幕色欲| 中文字幕日韩视频欧美一区| 亚洲国模精品一区| 99免费在线观看视频| 欧洲av毛片| 欧美成人一区午夜福利在线| 欧美色综合网站| 狠狠色狠狠色综合久久第一次| 青青草国产免费国产| 免费观看亚洲人成网站| 亚洲欧美成aⅴ人在线观看| 久久久亚洲国产美女国产盗摄| 波多野衣结在线精品二区| 日韩成人在线视频| 久青草免费视频| 亚洲第一区欧美国产综合 | 国产jizzjizz视频| 亚洲黄网视频| 午夜啪啪网| 亚洲天堂网视频| 国产va在线| 91日本在线观看亚洲精品| 欧美天堂久久| 热久久这里是精品6免费观看| 亚洲香蕉久久|