錢萌 王子鳴 程樹林



關鍵詞:社交網絡; 用戶影響力; 結構特性; 用戶行為; 情感傾向
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2023)02-0072-03
1 概述
隨著互聯網技術的深入發展與應用,社交網絡已經成了人們日常生活的重要組成部分,并以各種形式為人們提供溝通、交互等服務。用戶可以通過社交網絡主動創建和共享信息,而不是像傳統媒體那樣被動地消費內容,使得人們的社交生活更為豐富。著名的社交網絡平臺包括Twitter、Facebook、微博等,深受年輕人的喜愛,在人們生活中發揮著不可或缺的作用。平臺允許用戶發布原創內容,分享自己的心情或表達對事物的觀點和態度。用戶也可以選擇關注其他用戶,轉發、評論或點贊自己感興趣的內容,用戶間的不同行為構成了社交關系網。
網絡中用戶的影響力可以看作是影響他人并使他人行為改變的能力[1]。網絡中大量的信息通過用戶間的行為不斷傳播,用戶在接收與傳播信息的同時,也處在影響與被影響的過程中,不同影響力的用戶對信息傳播的速度和范圍影響不同[2]。網絡中的高影響力用戶對于輿情監控、廣告投放等領域有著不可忽視的作用,能最大限度地擴大信息傳播的范圍。例如2020年疫情期間,通過社交網絡實時發布全球疫情信息,實現了準確的疫情動態跟蹤,因此評估社交網絡中的節點影響力具有現實意義,同時,社交網絡中節點影響力的評估可以幫助分析和預測網絡中用戶影響力的大小及演變規律,從而更好地了解信息在網絡中的傳播路徑和理解社交網絡的形成與演化[3]。如圖1中的中心節點則表示網絡中的高影響力用戶。國內外專家學者從不同角度對用戶影響力的評估開展了廣泛研究,大致上可以分為基于網絡拓撲結構、基于用戶行為和基于用戶情感傾向等類型。
2 基于網絡拓撲結構的評估
從網絡拓撲結構出發,其評估方式可以分為基于隨機游走、基于最短路徑和基于節點度的評估等類型[4]。
2.1 基于隨機游走的評估
基于隨機游走的評估方法是利用鄰居節點來刻畫節點的影響力,主要包括特征向量中心性評估[5]、PageRank評估[6]等。
(1)基于特征向量中心性的評估基于特征向量中心性的評估是從節點的中心性出發,通過計算它們的權重,將當前節點的鄰居節點的權重線性和視為該節點的中心度數值[4]。其基本思想是當前節點的影響力取決于鄰居節點的影響力,即鄰居節點的節點影響力越大,則該節點在網絡中的影響力會隨之增大。節點i 在網絡中的影響力可用公式(1)表示。
其中,aij表示網絡轉化成鄰接矩陣M中的值,λ 是鄰接矩陣的最大特征值。
(2)基于PageRank算法的評估
PageRank評估方法是利用網頁間鏈接結構來計算網頁重要度的一種算法,用有向圖表示網頁間的關系。圖中的每個節點表示一個網頁,每一條邊代表網頁間的鏈接,如公式(2)所示。
3 基于用戶行為的評估
從用戶行為出發,在社交網絡中,用戶可以利用社交網絡平臺發布原創內容,分享自己的心情或表達對事物的觀點和態度。除此之外,用戶還可以轉發、評論或點贊其他用戶發布的內容。用戶間的不同行為使信息在網絡中傳播開來,形成了信息傳播網絡,因此評估用戶影響力時不可忽略網絡中的用戶行為。
國內外專家學者從不同角度對用戶影響力的度量進行了廣泛研究,并且取得了一定的研究成果。齊超等人[11]綜合分析用戶轉發、評論等行為,度量了每種行為對影響力的貢獻度,提出根據用戶行為的差異性分配權重的方法來改進PageRank算法。王新勝等人[12]融合了用戶的自身因素和用戶間的互動行為,綜合考慮用戶的直接影響力和間接影響力兩方面,在用戶排名準確性上有了很大的提高。文獻[13]在PageR?ank算法的基礎上,綜合分析用戶的實際行為,引入了微博用戶自身權重,提出了MR-UIRank算法,但是在考慮轉發、評論等行為時,均忽略了其行為的有效性。毛佳昕等人[14]通過分析用戶的行為因素與社會網絡結構信息,將用戶的閱讀行為因素引入模型,更好地對用戶的影響力進行了估計。在文獻[15]中,Wu L等人基于內容的用戶關系和用戶行為的顯性用戶關系提出了MPPR算法,將兩種關系集成在一起評估用戶影響力,在實驗部分與傳統的PageRank算法進行了對比。
上述研究關注于用戶的行為特征及行為習慣,但存在對用戶行為分析不全面的問題,且忽略了用戶隱式興趣偏好這一重要因素。Cheng等人[16]考慮用戶多維社交行為活動與用戶興趣的融合,并量化了用戶行為的有效性,將其作為用戶自身權重,最后合理地融入PageRank算法。文獻[17-18]均考慮到了用戶興趣對于用戶行為的影響,提高了用戶影響力評估的準確性和科學性,但用戶的興趣偏好會隨著時間發生動態變化,且不同用戶對于興趣變化的敏感程度不同[19],因此在構建用于興趣主題模型時,也應該考慮到用戶興趣的漂移。同時,網絡中用戶行為模式具有多樣性,單一維度的指標很難準確地代表用戶興趣,上述研究大多僅關注用戶發布的博文內容,而用戶標簽、關注關系等也可以作為用戶興趣的信息源,因此,在構建用戶興趣模型時應充分考慮這些重要因素。
4 基于用戶情感傾向的評估
社交網絡中用戶在表達對于事物的觀點時,其情感傾向往往決定了用戶對其內容持肯定還是否定的態度[20]。用戶情感的分析與建模能夠幫助正確分析用戶間交互行為[21],這對于用戶影響力的評估中也有著重要的意義。
張繼東[20]等人提出了一種基于用戶交互行為和情感傾向的影響力度量算法,該算法充分融合了用戶間交互信息、情感信息等多維因素構建了影響力評估模型,實驗結果表明該算法提高了影響力計算的準確性。董偉等人[22]充分考慮了交互性及用戶情感傾向,并將其合理地融入傳統的PageRank算法,有效地識別出網絡中高影響力用戶。陳志雄等人[23]通過支持向量機對微博博文進行了情感分析,并對傳統的PageR?ank算法進行了改進,在新浪微博數據集上驗證了所提算法的有效性。Liu等人[24]定義了用戶情緒功率和集群可信度,并提出了一種基于情緒聚合機制的潛在影響用戶發現算法來定位種子候選集。Lanlin Gao等人[25]提取了情感元素,利用所提出的情感匹配和情感轉換算法來獲取用戶的相對情感,并根據用戶的相對情緒,對用戶進行了分類。
上述研究均充分考慮了用戶的情緒對于高影響力用戶識別的影響,且有效提升了影響力計算的準確性。但是仍然存在有待改進的地方,例如對于用戶自身信息考慮不充分、忽略了用戶情緒的動態變化等。同時,用戶的轉發、評論等行為也可以反映用戶的情緒,因此對于情緒元素的提取方式也能夠進行進一步的細化。
5 總結與展望
本文從三個角度對社交網絡中用戶影響力的評估進行了分析總結?;诰W絡拓撲結構的評估考慮了網絡結構特性,基于用戶行為的評估,深入分析了用戶的交互行為,基于用戶情感傾向則對用戶情感進行了分類。上述研究雖然取得了一定的成果,但仍然存在問題,需要進一步探索。未來可從以下從幾個方面優化社交網絡中用戶影響力的評估:如在構建用戶興趣模型時可充分考慮用戶標簽、關注關系等多維度指標、探究用戶興趣及情緒隨時間的演變規律等,這些問題的解決將進一步提高用戶影響力評估的準確性。同時,影響力的評估也能為社交網絡中的社區發現提供新的思路和視角,從而應用于個性化推薦領域,有效提升推薦的精準度。