◎徐春鳳 葛芳酩 吳雙雙
伴隨著互聯網和5G的飛速發展,網絡和社交媒體已經成為人們生活中越來越重要的部分。隨著網絡的不斷發展,以微博為主的社交媒體平臺逐漸成為輿情發展、演變、傳播的主要空間。本文基于突發事件的意見領袖評價指標分析通過對爬蟲得到的數據進行影響力及活躍度分析,通過分析建立關系圖,發現它們之中的聯系,以及最終找出最有影響力的人,即意見領袖。本文從影響力和活躍度兩方面入手,通過度中心性研究影響力的大小,通過點入度、點出度、絕對中心度和相對中心度衡量活躍度的大小。
借助Python工具,采用關鍵詞搜索的方法對原始微博相關數據進行爬取,爬取的信息包括微博id、用戶id、用戶昵稱、微博正文、轉發數、評論數、點贊數、發布時間、被轉發微博的id等。對爬取的數據進行預處理。最終得到可以構建網絡的節點及屬性文件和邊文件。
本文將建立有向關系網絡(有箭頭的邊)。例如當一個用戶轉發了另一個用戶的博文時,在轉發關系網絡中兩個用戶之間會生成一條單向邊,而不是一條雙向邊。根據微博用戶的id1→微博用戶的博文id1→其他微博用戶轉發博文id1生成新的博文id2→轉發博文id1的微博用戶id2之間的關系構建微博用戶id1和微博用戶id2轉發關系網絡。
網絡密度即為網絡中實際的邊數預最大可能邊數的比率,它的取值范圍在0到1之間,用來衡量一個網絡中各個節點之間連接的緊密程度。當網絡中實際的邊數越接近最大可能邊數的時候,該網絡的密度就越大;反之,則越小。公式1為:
其中,g表示關系網絡中存在的節點數,g(g-1)表示g個節點可能存在的所有不同的線,L代表轉發關系網絡實際存在的線條數,密度的最終取值范圍為[0,1]。網絡密度是介于[0,1]之間,越趨向于0,則說明該網絡中的聯系不緊密,網絡內各節點之間的交往不密切,因此核心人物的存在可能性小;相反,越趨向于1,則說明該網絡內部互動頻繁、聯系緊密,核心人物存在的可能性很大,因此,網絡中極易出現一個或幾個意見領袖,推動整個事件的發展。
意見領袖存在于聯系緊密的小團體中,小團體是指關系特別緊密的一小群人。小團體的存在使得意見領袖有了一定的生存環境,小團體是由網絡密度進行測量的。從已有學者的意見領袖識別研究中可以發現,他們所選擇的樣本都是內部討論較為積極活躍的。因此并不是所有的網絡都存在意見領袖,而只有該網絡的密度較大時才有可能存在核心人物,即網絡的密度成為該網絡是否存在意見領袖的衡量指標。
意見領袖是網絡傳播中的重要角色,是人群中首先或較多接觸大眾傳媒信息,并將經過自己再加工的信息傳播給其他人的人。具有影響他人態度的能力,意見領袖介入大眾傳播,加快了傳播速度并擴大了影響力。
本文結合微博意見領袖的定義及特征,并通過對所有關于意見領袖識別指標的分析,可以得出影響力和活躍度2個一級指標、5個二級指標的評價指標體系。具體意見領袖識別指標如表1:

表1 微博意見領袖評價指標體系
(1)影響力指標分析
結合微博空間中意見領袖影響力指標的分析,將影響力指標分解為:度中心性維度。
“意見領袖”是指活躍在人際傳播網絡中,頻繁的為他人提供信息、意見等并能夠贏得他人的支持,通過個人的影響力對他人的態度、行為產生一定改變的領袖者,從其定義的基本描述可以看出,影響力是意見領袖基本的能力。意見領袖在網絡空間內具有引導輿論走向,推動突發公共問題解決的能力和作用,這都歸功于微博意見領袖具有較大的影響力,結合微博空間中意見領袖影響力指標的分析,將影響力指標分解為:度中心性維度。
在轉發關系網絡中,若某一節點與其所有他節點之間都有直接的聯系,則說明該節點在該網絡群體中占據中心性的位置,因此用戶在微博空間中的位置可以由這一用戶與其他用戶之間的有聯系的點數來描述,即度中心性。
度中心性所表示該節點相連的節點數,即該節點與其他節點之間的聯系程度,表現為為某一節點在局部的中心性,能夠測量出該節點在網絡中的重要程度。公式2為:

CD(i)為用戶i的度中心性,表示該節點相連的節點數;aij為事件微博用戶矩陣,表示微博用戶在事件中的影響力。度中心性越高,說明該用戶的影響力越大。
根據公式2可以計算出每個微博用戶的度中心性,為了進一步比較微博用戶度中心性的高低,將度中心性進行規約化處理,使其介于[0,1]之間。公式3為:

數值越接近于1,代表其度中心性越高,該微博用戶在事件的影響力越大;相反,數值越接近于0,代表度中心性越低,該微博用戶在事件的影響力越小。
(2)活躍度指標分析
微博用戶憑借其在微博空間的影響力是不足以使其成為意見領袖的,然而要想擴大影響力的覆蓋面不僅要靠發布大量真實的信息,還要與其他微博用戶形成交流互動,在互動的過程中逐漸的影響到人們的觀點,改變人們的態度,從而使其他用戶成為其忠實的追隨者。因此在識別意見領袖的指標上應該充分的考慮到活躍度這一指標,活躍度的具體指標包括:點入度、點出度、絕對中心度、相對中心度四個維度。
點入度
在有向圖中,一個點的點入度是以這個頂點為終點的有向邊的數量,如圖1所示。在此轉發關系網絡分析中,定義點入度表示某一節點關注其他節點的程度,即轉發其他用戶的博文數量。個體點入度越大,則說明該用戶在群體中轉發的信息越多,積極主動與其他用戶聯系的次數越多,參與話題的主動性和積極性越強,傾向于信息接收者的角色。
用戶A的點入度可以用 來表示,則圖1中。

圖1 點入度關系圖
點出度
在有向圖中,一個頂點的出度是以這個點為起點的有向邊的數量,如圖2所示。在此轉發關系網絡分析中,定義點出度表示的是某一節點受到其他節點關注的程度,具體可以是其他用戶對該用戶所發博文的轉發、評論等行為。若個體點出度越大,則說明其他用戶對該用戶回復的次數越多,該用戶引起的重視越多,該用戶在群體中傳遞的信息越多,傾向于信息發布者的角色。
用戶A的點出度可以用C(out)來表示,則圖2中C(out)=m。

圖2 點出度關系圖
絕對中心度
點入度與點出度之和為絕對中心度。某用戶的絕對中心度相對于其他用戶的絕對中心度越大,說明該用戶的接收或傳遞信息能力越強。
用戶A的絕對中心度為:

表示用戶A的絕對中心度。
相對中心度
為針對不同規模的網絡,可以用相對中心度衡量。某用戶的相對中心度越大,說明該用戶的影響力越大。
用戶A的相對中心度公式為:

為相對中心度,g為網絡中用戶數量。
網絡環境下,意見領袖在突發事件的信息傳播過程中發揮了重要的作用。本文的研究主要從利用爬蟲工具獲取博文開始,獲取點贊數,評論數及轉發數,在對數據進行清洗和預處理的操作基礎上,通過一些公式計算他們之間的關系,通過軟件進行網絡圖、關系模式的的建立,在此基礎上,通過分析找出最有影響力的人及其對此次事件的影響。
本文接下來的研究方向:一是:根據本文構建的評價指標的基礎上確定各個指標的權值,通過權值計算屬性值,找出最有影響力的意見領袖。二是:在詞云和詞頻分析的基礎上,將結合分詞技術和樸素貝葉斯分類器,進行情感分析建模,得到公共事件中大眾的態度和情感值。三是:將輿情的發展階段和意見領袖相結合,研究大眾的情感發展趨勢和意見領袖情感趨勢之間的異同點,并劃分情感類型,將情感分為消極、中立、積極三類情緒。