999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Swarm模型的微博用戶影響力評價方法

2021-01-22 06:00:32利,于磊,吳
計算機工程與應用 2021年2期
關鍵詞:用戶模型

王 利,于 磊,吳 渝

重慶郵電大學 計算機科學與技術學院,重慶400065

微博作為社會經濟活動中常見的一種網絡信息交互形式,因為其自身便利、快捷的傳播機制而受到廣泛的肯定和應用,微博中的大量活躍用戶使得微博每天產生海量的數據。這些數據包括微博用戶發表的微博帖子、點贊、分享轉發、評論等。微博用戶的這些錯綜復雜的關系形成了一個巨大的社交網絡結構。由于微博的這些自身特點和優勢,逐漸成為專家和學者研究的重點。

在社交網絡群體與互動方面的相關研究中,個體影響力評估一直是一個重要方向。在社交網絡中,用戶基于社交目的或者自我價值實現的需要,發布和傳播特定話題的信息并與他人互動,以獲得和增強其在網上的話語影響力[1],用戶的影響力是用戶在微博中特定領域重要性的綜合體現。目前關于微博用戶影響力的研究,大體上從以下兩個方面進行。

基于用戶的靜態屬性來研究,Cha等[2]分別從入度、出度、提到以及轉發指標入手,分別研究了各個指標對用戶影響力的影響,并分析了這幾個指標的效果。Wang 等[3]提出了一種在具有可調參數的復雜網絡中節點重要性的新度量。與其他幾個中心度量相比,他們提出的度量比網絡節點的度數、中間度和緊密度中心性更具有區別性。Chen等[4]提出Personal Rank算法,該算法也可以用于計算微博用戶的影響力,但在計算時還是需要依賴PageRank算法。

基于用戶行為特征來研究,Kwak 等[5]提出的TunkRank算法,是基于PageRank的變形,是基于Twitter社交網絡提出的,其思想是粉絲數越多的用戶他們所發布的相關信息越有可能傳播擴散整個網絡。張俊豪等[6]結合用戶自身行為與微博平臺各個用戶之間的關注關聯關系,基于經典PageRank算法提出改進算法UIA(User Influence Assessment)。Kang[7]結合用戶發表微博活躍度和PageRank算法,提出了Behavior-Relation-ship Rank算法來評價用戶影響力。孫紅等[8]在傳統的PageRank算法模型上加入了微博用戶自身在微博中的行為活動,同時考慮到了微博用戶的自身行為,結合用戶權值得到最終影響力。

微博話題直觀地反射了當下大眾對社會熱點及事件的關注,話題中無數個體的態度聚集在一起形成一個動態整體行為,從這個角度看,對微博整體動態行為的研究亦屬于突現計算的研究范疇。本文的主要研究內容是從突現的角度來對微博用戶行為影響力進行評價。

本文從綜合分析用戶的轉發、評論和點贊三種行為入手,結合突現計算Swarm 模型提出一種基于突現計算Swarm 模型的用戶排序算法(Swarm Model user Rank,SMRank),基于PageRank和用戶行為的影響力評價方法是研究者采用和改進比較多的方法,本文算法不同于以往的PageRank 的方法,給出了計算用戶行為影響力的一種新的思維方法。

本文的創新點可以總結為以下兩點:

(1)不再以用戶為節點、用戶之間的關注和粉絲為邊來構建網絡,而是根據微博話題中t 時刻的參與用戶發布微博、轉發微博、評論及點贊關系來構建t 時刻的用戶交互關系網絡。

(2)可以計算不同用戶在不同時刻的影響力,如果需要在某個時間段對微博話題進行引導控制,可以根據用戶不同時刻影響力的不同,對這個時間段用戶影響力值高的用戶進行管理,為微博話題的傳播提供可管可控的思路。

1 相關技術基礎

1.1 突現計算

突現計算(Emergent Computation,又稱涌現計算)[9-10]是多agent系統在處理復雜問題時所展現出來的一種創新的思路邏輯。它是通過利用多個簡單模塊的相互溝通和協作來自我突現出更加復雜行為的系統。突現存在于自然和社會各個領域,如自然界的魚群、鳥群和蟻群,社會領域中城市交通流、掌聲同步和復雜網絡行為等[11]。

1.2 Swarm模型

Swarm 模型[12]是基于自然界群集行為建立的一個用于研究系統突現行為的模型,它以Reynolds 的“Boids”理論為基礎,其中每個個體根據對齊、聚集和分離三條基本規則確定下一步的行為,最終個體在整體上會形成各種不同的排列方式,即產生突現行為。借助Swarm 模型,可以簡化復雜系統中突現規律的研究模式。Spector和Klein在文獻[13]中提出了相關行為的具體計算方法,每個Agent根據周圍的環境及行為參數決定下一刻的方向和速度。

2 基于Swarm模型的微博用戶影響力計算

2.1 問題提出和模型框架

針對大多數微博用戶影響力評價算法都是事前或事后進行計算的問題,本文結合Swarm突現計算模型提出了一種可以在不同時刻對用戶影響力進行計算的方法(SMRank)。SMRank算法的模型框架如圖1所示。

圖1 模型框架圖

2.2 微博特征及定義

由于微博用戶的行為主要受自身認知水平和網絡環境兩大因素的影響,本文中用戶的影響力由兩方面構成:用戶自身影響初值和用戶不同時刻的行為影響力。用戶自身影響初值主要通過用戶粉絲數和用戶在話題傳播前發布微博數計算,用戶t 時刻的行為影響力通過用戶t 時刻交互關系網絡計算,t 時刻用戶交互關系網分為:t 時刻用戶轉發關系網和t 時刻用戶評論點贊關系網。

現有的微博傳播研究通常會直接以用戶為節點、用戶之間的關注和粉絲為邊來構建用戶關系網絡,為了減少冗余節點信息(例如僵尸節點)對研究的影響,并非直接依賴關注和粉絲信息來構建網絡,而是依靠微博話題不同時刻中用戶的轉發、評論及點贊關系來構建網絡,為了方便問題的描述,這里先給出如下幾個定義:

定義1(微博話題中t 時刻的用戶轉發關系網絡)用戶轉發關系網絡用一個二元組G1t=(U1t,E1t,W1t) 表示,其中,G1t表示微博話題t 時刻的用戶轉發關系網絡,U1t表示t 時刻參與話題的全部用戶,E1t表示網絡中的邊集合,邊集合中的每條邊表示兩個用戶之間存在轉發關系,W1t為有向邊的轉發權重。

定義2(微博話題中t 時刻的用戶評論點贊關系網絡)用戶評論點贊關系網絡用一個二元組G2t=(U2t,E2t,W2t)表示,其中,G2t表示微博話題t 時刻用戶評論點贊關系網絡,U2t表示t 時刻參與話題的全部用戶,E2t表示網絡中的邊集合,邊集合中的每條邊表示兩個用戶之間存在評論或點贊關系,W2t為有向邊的評論點贊權重。

定義3(用戶影響力)微博話題中用戶影響力用一個四元組I=(G,U,It,f)進行表示,其中,G 包含G1t和G2t,U 表示參與話題的用戶集合,It表示t 時刻的用戶影響力,f 為五元組I 中各元素的映射關系。對于用戶ui的影響力的定義如下:

2.3 Swarm模型定義

Swarm 模型中agent 在群體沒有控制中心的環境下,完全依照自身判斷與其他個體交互,從而對整體產生影響。與Swarm 模型中agent 相似,微博話題中的任一用戶都可以參與發布微博、關注互動、評論點贊等功能,同時用戶間的交互也會對個體的行為產生影響。根據微博話題中用戶互動交流與Swarm模型中agent交流的相似性,將swarm模型融入到微博話題用戶影響力評價算法中,關鍵在于agent 運動過程中要靈活結合用戶發布微博、轉發、評論及點贊等行為。

基于Spector 和Klein 在文獻[13]提出的計算方法,根據本文的研究內容,在此重新定義Swarm模型的物理含義,在給出定義之前,首先了解以下兩個概念:

微博話題中ui用戶在t 時刻鄰域用戶節點。指對用戶ui影響較大的用戶集合,為轉發用戶ui微博的用戶集合,在不同時刻用戶ui的鄰域用戶是不同的,可以根據微博話題t 時刻的用戶轉發關系網統計得出。

微博話題中ui用戶在t 時刻周圍用戶節點。指對用戶ui有影響,但是影響不是很大的用戶集合,為評論和點贊用戶ui微博的用戶集合,在不同時刻用戶ui的周圍用戶是不同的,可以根據微博話題t 時刻的用戶評論點贊關系網絡統計得出。

定義4(面向微博話題的Swarm模型)

(1)V1在Swarm模型中代表某一agent指向遠離其自身范圍d 內的所有agent 的均向量,在微博中使用用戶ui的鄰域用戶節點來進行計算,通過用戶轉發關系網計算。計算公式如下:

其中,U 是參與微博話題的用戶集合,It-1( v )是用戶v上一時刻的用戶影響力,W1t( vui)是用戶v 對用戶ui在t 時刻的微博轉發貢獻度大小,Rt( vui)為用戶v 對用戶ui在t 時刻微博轉發次數,S1t( vui)表示用戶v 對話題中所有用戶t 時刻轉發微博總數。

(2)V2在Swarm 模型中是指向模擬世界中心的向量,在微博用戶影響力評價中用上次迭代的前20%的用戶影響力的均值表示。計算公式如下:

其中,Top 為上一時刻的前20%的用戶集合,n 為Top用戶個數。

(3)V3是某一agent 周圍所有agent 的平均速度向量,在微博用戶中,使用用戶ui周圍用戶節點對用戶的平均影響力來表示,計算公式如下:

其中,W2t( vui)是用戶v 對用戶ui在t 時刻的微博評論及點贊貢獻度大小,Dt( vui)表示用戶v 對用戶ui在t時刻的評論和點贊數,S2t( vui)表示用戶v 在t 時刻所有評論和點贊總數。

(4)V4是某一agent 指向其周圍所有agent 所構成的中心的向量,在本文中給出的計算公式如下:

其中,N 為話題中所有用戶個數。

(5)V5是一個隨機單位長度向量,在微博用戶行為影響力計算過程中不考慮。

用戶ui在t 時刻影響力公式表示為:

2.4 基于Swarm模型的微博用戶影響力計算算法

一個微博話題發展要經歷萌芽、醞釀、激活、高潮、平息等演變周期,這和復雜系統中魚群、鳥群等群體的突現行為相似,本文結合突現計算模型,提出一種基于突現計算Swarm 模型的用戶排序算法(Swarm Model user Rank,SMRank)。算法首先需要計算用戶影響力初值;然后通過迭代計算不同時刻的用戶影響力;最后對不同時刻用戶影響力求和,得出用戶總的影響力值。SMRank算法詳細描述如下:

用戶影響力初值計算,在本文中主要考慮兩個方面,用戶第一天發表與話題相關微博數、用戶的粉絲數來衡量。使用最大最小值歸一化方法進行計算,用戶影響力初值計算公式如下:

其中,F( ui)為用戶ui在微博話題中的粉絲數,Fmin為用戶集中用戶擁有的最小粉絲數,Fmax為用戶集中用戶擁有的最大粉絲數,P( ui)為用戶ui發布微博數(原創微博),Pmin為用戶集中用戶發布的最少微博數,Pmax為用戶集中用戶發布的最大微博數。

SMRank算法描述如下。

算法微博用戶影響力計算

輸入:微博話題用戶參與關系網G,迭代次數T 。

輸出:用戶總影響力I( ui)。

執行以下步驟:

步驟1 對于用戶ui,根據公式(9)計算用戶影響力初值I0( ui)。

步驟2 對于用戶ui,根據公式(8)計算t 時刻的用戶行為影響力It( ui)。

步驟3 t=t+1;當t 小于T ,轉到步驟2,否則轉到步驟4。

步驟4 對于事件中所有的用戶,用公式I( ui)=I1( ui)+I2( ui)+…+IT( ui)。

步驟5 計算得到最終的用戶責任指數I( ui),進行排序后輸出結果,算法結束。

從算法描述中可以看到,如果用戶總數為 |U |,算法的迭代次數為T ,則SMRank 算法的時間復雜度為O(T |U|2)。在計算用戶影響等級時,需要T |U |個額外空間存儲每次迭代的用戶影響力值,因此,該算法的空間復雜度為O(T |U |)。

3 用戶影響力評價實驗和分析

3.1 實驗數據

在人們的微博社交活動中,很多時候都是以話題的形式產生和傳播的。所以本文使用不同話題作為基本研究對象。使用實驗室開發的爬蟲軟件,通過指定關鍵字搜索新浪微博進行爬取,爬取的數據包含用戶的粉絲、關注關系,微博的評論信息和點贊關系等信息。

本文中數據集采用的是2018年11月26日至2018年11月28日的“基因編輯”和2019年2月15日至2月18日的“某品牌食品安全”的微博話題信息。經過預處理和標準化后,得到兩個微博話題事件的統計信息如表1所示。

表1 數據統計

3.2 實驗方案

3.2.1 實驗對比對象

為了驗證、評估本文方法,采用下列三種常用微博用戶影響力評估算法進行對比。

(1)粉絲數量(FansRank)。按照微博用戶的粉絲數量多少來對用戶排名。

(2)被轉發數量(RepostRank)。按照用戶發布的微博被其他用戶平均轉發數的多少對用戶排名。

(3)PageRank 算法[14]。PageRank 算法是一種用于分析網頁的重要程度的算法,現已被廣泛應用于社交網絡分析、意見領袖識別的研究中。

3.2.2 算法參數設置

在進行實驗時,需要對公式中的一些常量進行設置,設置方法如下:

公式(8)中的常量c1~c4 用層次法計算得出,層次分析法[15]是一種對復雜且模糊的問題進行量化決策的方法,在本文實驗中它們的值分別為0.561 9、0.075 4、0.324 4、0.038 4。

公式(9)中θ1和θ2參數,它們的值根據粉絲數和微博數的權重不同,分別設置為:θ1=0.4,θ2=0.6。在微博話題傳播中,發布微博的貢獻往往高于其他行為,這里的權重按6∶4 劃分,降低了粉絲數過高帶來的偏差,同時也保留了粉絲數對微博用戶影響力的表征能力。

3.2.3 具體實驗設計

本文實驗方案主要包括以下三種:

(1)用戶影響力排名的合理性對比。在“某品牌食品安全”事件數據集上,針對不同方法計算得到的影響等級排名結果,分析排名靠前的用戶的影響值、用戶影響覆蓋率[16]、發布和話題相關微博數等,以說明SMRank算法排名結果的合理性。

(2)影響覆蓋率[16]對比分析。為了評價SMRank 算法的有效性,在“某品牌食品安全”事件數據集上,實驗對比了FansRank 算法、RepostRank 算法和PageRank 算法,計算各方法排名結果靠前的用戶的影響覆蓋率。

(3)不同時間段的影響力對比。通過對排名靠前的用戶不同時刻影響力進行分析,觀察用戶在不同時間的影響力的變化。

其中,(1)和(2)的實驗方案是為了說明本文算法的有效性和合理性,實驗方案(3)是本文與其他算法的主要區別。

3.3 實驗結果分析

3.3.1 用戶影響等級排名合理性分析

為了說明排名結果的合理性,對排名前10的用戶進行分析。表2至表5分別展示了SMRank算法、FansRank算法、RepostRank算法和PageRank算法的實驗結果。

表2至表5中用戶編號是用戶在SMRank算法中的排名序號,從用戶發布微博數和用戶影響覆蓋率兩項指標可以看出,SMRank算法的排名是比較合理有效的。

3.3.2 影響覆蓋率對比

通過SMRank算法、FansRank、RepostRank和PageRank四種算法分別獲得用戶傳播影響力排名,然后對排名前top k 的用戶影響覆蓋率進行對比,實驗結果如圖2 所示。結果表明SMRank 算法可以有效地發現微博話題中影響等級較大的用戶。

表2 SMRank算法排名結果

表3 FansRank算法排名結果

表4 RepostRank算法排名結果

表5 PageRank算法排名結果

圖2 “某品牌食品安全”中四種算法影響覆蓋率

3.3.3 不同時間段影響力對比

本文提出SMRank 算法可以計算不同時間段不同用戶的影響力,在這里時間段設置為天,在不同的數據集上時間段可以根據需要設置為更短或更長的時間(如2 h、6 h或一個月),圖3和圖4分別顯示了不同數據集上的排名前5 的用戶每天影響力變化曲線。可以看到每個用戶在不同的時刻影響力是不同的;圖3 中用戶1 和用戶4 在第一天影響力很大,而在后面兩天影響力降低,說明該用戶是該微博話題的發起者;用戶2、用戶3和用戶5在第二天影響力比較大,它們是話題的主要傳播者。圖4中用戶2、用戶1、用戶4和用戶5在第一天有較大的影響力,說明他們對微博話題的發起起到很重要的作用,而用戶1和用戶3在中間時刻影響較大,說明他們是此微博話題的主要傳播者;最后一天事件熱度降低且即將消亡時,所有用戶的影響力都減小。以上結論和真實網絡中的情況是相似的。

圖3 “基因編輯”中排名前5的用戶每天影響力變化

圖4 “食品安全”中排名前5的用戶每天影響力變化

4 結論

本文在真實的微博話題中進行分析,考慮到微博話題的動態演化和突現計算的相似性,提出了基于Swarm突現計算模型的用戶影響力排序算法。本文算法的評價基礎不是建立在傳統的關注關系網上,而是建立在從微博話題參與用戶出發,結合發布微博、轉發、評論和點贊等用戶行為,構建不同時刻微博話題轉發關系網和評論點贊關系網上;然后在這兩個網絡中進行算法迭代,不僅可以得出用戶影響力排名,而且還可以計算出不同用戶不同時間段的影響力。微博用戶影響力是微博話題重要的研究方向之一,深入研究微博用戶影響力對了解話題信息在微博網絡中的傳播以及其演化規律具有重要的意義。

本文也存在一些不足。由于實驗數據的限制及不完善,對實驗結果會造成一定的影響;其次,本文算法也僅僅通過實驗結果表明它是有效的,缺乏充分的理論基礎。

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 欧美成人手机在线视频| 国产精品jizz在线观看软件| 久久精品电影| 欧美精品伊人久久| 午夜a级毛片| 国产探花在线视频| 人妻无码中文字幕第一区| 狠狠色丁香婷婷| 国产午夜无码专区喷水| 亚洲视频四区| 天天色综合4| 尤物亚洲最大AV无码网站| 亚洲第一成人在线| av免费在线观看美女叉开腿| 天天色天天综合| 亚洲一区无码在线| 老司机精品99在线播放| 亚洲中文字幕久久精品无码一区| 国产区在线观看视频| 在线观看无码av五月花| 国产成人综合在线观看| 亚洲天堂视频在线免费观看| 2021亚洲精品不卡a| 国产主播一区二区三区| 国产杨幂丝袜av在线播放| 欧美在线黄| 国产91精品久久| 国产99热| 白浆视频在线观看| 一区二区影院| 日本五区在线不卡精品| 亚洲人成日本在线观看| AV片亚洲国产男人的天堂| 国产免费a级片| 亚洲日韩AV无码精品| 成人蜜桃网| 亚洲精品午夜天堂网页| 一边摸一边做爽的视频17国产 | 波多野结衣视频网站| 亚洲黄网视频| 亚洲第一黄片大全| 午夜福利免费视频| 国产真实乱子伦精品视手机观看 | 九九热精品视频在线| 欧美成人精品高清在线下载| 97精品久久久大香线焦| 亚洲精品人成网线在线| 怡红院美国分院一区二区| 好紧太爽了视频免费无码| 国产欧美高清| 国产精品黄色片| 99伊人精品| 欧美激情视频一区二区三区免费| 毛片网站在线播放| 日韩毛片免费| 国产h视频在线观看视频| 91成人在线观看| 不卡视频国产| 久久人搡人人玩人妻精品| 99国产精品一区二区| 国内视频精品| 无码专区在线观看| 女高中生自慰污污网站| 久久人体视频| 亚洲日韩精品伊甸| 久久精品一品道久久精品| 亚洲日本韩在线观看| 国产理论最新国产精品视频| 香蕉久久国产超碰青草| 在线人成精品免费视频| 精品久久国产综合精麻豆| 偷拍久久网| 午夜日b视频| 婷婷亚洲天堂| 成人在线第一页| 国模沟沟一区二区三区| 欧美性久久久久| 天堂岛国av无码免费无禁网站| 国产精品色婷婷在线观看| 欧美日韩国产精品va| 99re在线免费视频| 国产农村精品一级毛片视频|