趙雨華 鄧少靈


隨著微博的發展和意見領袖在網絡中作用的增大,發掘和利用微博意見領袖具有重要意義。本文從社會網絡分析角度出發,根據用戶關注的網絡圖,選取中心性指標和PageRank值作為評價指標,構建微博意見領袖挖掘模型。運用這一模型實證分析“無錫高架坍塌”事件的意見領袖,通過與其粉絲數進行對比驗證,來證明這一方法的可行性。
近年來,微博在眾多交互網絡平臺中已成長為用戶數與使用率最高的社交平臺。新浪微博發布的2020年第三季度的財報顯示,微博第三季度月活躍用戶達5.11億,同比凈增長約1400萬用戶。微博日活躍用戶達2.24億,同比凈增長約800萬用戶。隨著微博的不斷發展,微博意見領袖的研究也逐漸得到了學術界的關注。
相關研究
“意見領袖”這一概念最早出現在1940年,由美國學者拉扎斯菲爾德在《人民的選擇》一書中提出,那些在人際傳播中經常為他人提供信息或意見,并影響他人的“活躍分子”,被稱為意見領袖。微博意見領袖也就是能在微博網絡中能夠起到信息橋梁作用并能在微博網絡中產生一定影響力的網民。
從傳統的社會網絡分析角度,為了挖掘出微博意見領袖,就要確定用戶的中心性和影響力,Freeman等人提出通過中心性指標來實現網絡節點中心性程度的量化,根據不同類型的網絡使用差異化的指標來度量,度量用戶社會網絡中節點地位的指標主要包括度指標、接近中心度指標和中介中心度指標。
王娟等人利用社會網絡分析中的中心性指標:內連接度,外連接度,接近度,中介度和核數對社交網站的意見領袖進行識別,并通過運用SPSS中的主成分分析法對各指標的權重進行確定,最終建立了新的意見領袖識別模型。
除了傳統的中心性度量指標,還有互聯網視角下的PageRank值度量用戶的網絡影響力。
根據現階段研究,微博社會網絡與互聯網在結構上存在一定的相似性,不同的網頁相當于微博網絡結構中的節點,PageRank作為當前網頁評分排序的主要方法,是互聯網節點評價的重要手段,同樣適用于微博社會網絡中用戶的重要性及影響力評價。周飛和高茂庭從用戶自身影響力、用戶行為以及動態行為對內容的影響程度角度入手,提出一種基于用戶影響力和PageRank的意見領袖發現算法。王正成等利用LDA主題模型挖掘出特定話題中的各個主題,對不同主題的用戶分類,結合不同主題分類用戶的屬性以及PageRank算法識別意見領袖。
社會網絡中心性指標是從網絡整體角度進行測量,計算用戶的中心性,而以網絡鏈接為主的PageRank值是從局部進行度量,容易忽略高權威點和整體網絡的刻畫,計算用戶的影響力,因此本文結合這兩種方法共同構建意見領袖挖掘模型并結合具體實例,得到意見領袖。
意見領袖挖掘模型
指標選取
社會網絡中心性指標
點入度。點入度表示某節點受到網絡中其他節點關注的程度,點入度高的用戶在網絡中擁有很高的聲譽,體現了此用戶的吸引力,在網絡中可能成為信息傳播的源頭。
點出度。點出度表示某節點關注網絡中其他節點的程度,點出度高的用戶在網絡中具有較強的社交性,體現了此用戶的積極性,在網絡中能夠從其他成員那里獲得豐富的信息。
入接近中心度。入接近中心度指的是某節點在網絡中傳播信息是不受其他節點控制的能力,入接近中心度高的的人,表明其在網絡中傳播信息的能力強。
出接近中心度。出接近中心度表示某節點在網絡中獲得其他節點信息的難易程度。外接近中心度高的人,表明其在網絡中獲取信息的能力強。
中間中心度。中間中心度表示一個節點擔任其他兩個節點之間最短的橋梁的次數,即一個用戶在多大程度上位于網絡中其他任意兩用戶的“中間”。一個用戶處于“中間”的次數越多,這個用戶的中間中心度就越高,其控制相鄰兩個用戶交往的能力越強,說明其在網絡中處于重要地位。中間中心度高的用戶能在一定程度上影響并控制該網絡中的信息傳播。
PageRank值
PageRank是Google創始人1998提出的,基于網絡結構的排序算法,作為排名運算法則主要是確定不同網頁的等級,基本思想是:單一頁面所鏈接的其他頁面越多,該頁面的影響力越大,相應的PageRank值越大。本文基于微博的關注及被關注關系網絡,利用PageRank算法思想,計算不同用戶在網絡結構中的PR值如
其中,表示用戶的PR值,表示用戶的PR值,表示所有關注用戶的用戶集合,表示用戶關注的所有用戶,表示網絡結構中用戶的數量,為阻尼系數,取0.85。
微博意見領袖挖掘模型的構建
假設用戶社會關系網絡中共有個用戶,首先獲取用戶的點入度、點出度、內接近中心度、外接近中心度、中間中心度和PageRank值指標,分別為?、 W2、 w3、w4、wg、wg其次將各個指標值進行歸一化處理,對6個度量指標加權平均計算,其中指標權重,最終得到意見領袖挖掘模型為
本文引用陳芬通過專家打分確定的指標權重,如公式
實證分析
本文利用python爬取了新浪微博 “無錫高架坍塌”這一話題的相關數據。對從2019年10月10日18時到2019年10月11日23時這段時間“無錫高架坍塌”事件熱門微博以及每一條熱門微博的博主ID名稱進行采集。采集到的這一時段中的“無錫高架坍塌”這一話題下的熱門微博共計273條,涉及博主有169位。本文將通過對這169位博主之間的關注關系進行統計,并建立各博主之間的關注關系網絡,以便分析得到各博主的社會網絡中心性指標值以及PageRank值。其中,社會網絡中心性指標值運用UCINET軟件得出,PageRank值運用MATLAB軟件得出。
根據公式(3)對“無錫高架坍塌”微博話題中169名用戶的這6個指標數據使用離差標準化方法進行歸一化處理,對處理后的數據分析計算出群體內每位用戶的意見領袖值,排名前10的用戶信息分布如表左邊所示,將他們認定為“無錫高架坍塌”事件微博話題中的意見領袖。
基于粉絲數的排序方式是最原始的排序方式,也是新浪微博各類排行榜采用的排序方式。表右邊是微博話題意見領袖的粉絲數排名。通過對比表左右可以發現基于本模型的排序結果和基于粉絲數的排序結果整體上來看還是比較相近的,這在一定程度上驗證了本文所建立的微博意見領袖挖掘模型的科學性。
本文從社會網絡分析角度出發,根據用戶關注的網絡圖,選取中心性指標和PageRank值作為評價指標,構建微博意見領袖挖掘模型。運用這一模型實證分析“無錫高架橋坍塌”事件,得到此話題的意見領袖。通過與粉絲數對比,驗證這一模型的科學性。本文雖取得了一定的研究成果,但是僅從社會網絡分析角度出發來挖掘意見領袖,在未來的研究中,可以結合用戶的行為特征來全面地對微博意見領袖進行挖掘。
(作者單位:上海海事大學經濟管理學院)