,,
社交媒體平臺的出現不僅豐富了用戶獲取信息的途徑和方式,也在一定程度上滿足了用戶的信息需求。而微博因其具有廣泛的用戶基礎和方便、快捷的信息交流等特點,成為當下一種熱門的社交媒體平臺。然而該平臺信息量過大,給用戶的信息選擇帶來一定程度的困難。用戶不僅需要選擇想要獲取的信息資源和類型,還需選擇關注感興趣的微博用戶。對于微博運營商來說,如何為用戶在海量用戶之中推薦其最感興趣的相關用戶是一個亟待解決的問題。
健康作為時下熱門的詞匯和用戶關注的焦點,更多的用戶在社交媒體平臺上獲取健康信息、了解健康知識。然而微博中存在的大量健康用戶卻是非官方的賬戶,其發布的健康信息是否具有影響力和效果、為其他用戶帶來了怎樣的健康信息等問題值得剖析。本文以健康用戶為例,應用社會網絡分析方法,對微博中健康用戶的網絡結構進行分析,旨在為加強微博中用戶之間信息交流提供建議。
社會網絡分析(Social Network Analysis,SNA)是將現實復雜網絡中的個體和復雜關系抽象成節點、線以及方向,綜合利用多種算法,不僅能夠測量行動者個體及他們所處的網絡成員之間錯綜復雜的關系和連結,還能對他們之間的互動模式進行可視化建模[1]。社會網絡分析是在社會學、心理學、人類學等學科基礎之上發展起來的研究方法,隨著互聯網的普及和社交媒體平臺的使用,社會網絡分析方法也開始運用在社交媒體等在線媒體的研究之中,如虛擬學習社區[2]、博客[3]和微博[4]等。社會網絡分析采用定量的方式測量行動者之間的關系,并通過網絡圖或矩陣表示這一關系,通過具體的指標揭示社會網絡特征以及成員間的隱性關系[5]。
目前常用的社會網絡分析軟件主要有UCINET、Pajek、NetMiner、MultiNet等。本文采用的分析軟件是UCINET(University of California at Irvine Network)。UCINET是由加州大學爾灣分校的社會網研究學者Linton Freeman首先編寫和提出的,之后是由波士頓大學的Steve Borgatti和威斯敏斯特大學的Martin Everett進行維護和更新[6]。
雖然UCINET軟件本身不包含網絡可視化的圖形程序,但它可將數據和處理結果輸出至NetDraw、Pajek、Mage和KrackPlot等軟件并制作可視化圖。UCINET可以進行網絡密度分析、核心-邊緣分析、中心性分析和凝聚子群分析等。
為研究微博用戶互相關注之間的網絡結構,解決用戶關注推薦問題,本文以新浪微博作為研究平臺,搜索與健康相關的、粉絲量在100萬以上新浪微博用戶作為研究對象,共得到41個相關微博用戶。
通過新浪微博API測試平臺,下載所關注用戶的ID、關注數、粉絲數、微博數以及收藏數相關信息的數據;利用Ucinet軟件對數據進行社會網絡分析,主要包括核心——邊緣分析,中心性分析,凝聚子群分析和網絡密度分析;最后使用NetDraw可視化軟件對用戶之間的交流情況進行可視化呈現。
網絡密度分析可以衡量一個網絡中各個節點之間連接的緊密程度[7],即所分析的對象集中各個用戶之間互相關注的程度。利用UCINET軟件對所獲取數據的網絡密度進行分析的結果如圖1所示。

圖1 網絡密度分析結果
從圖1可看出,平均矩陣密度僅為0.0409,說明41位微博健康用戶之間的交流程度較低;標準差為0.1980,說明用戶中存在小群體現象,即部分用戶之間交流比較緊密,而與其他用戶之間交流比較有限。
核心—邊緣分析是通過用戶之間的緊密程度將整個社區劃分為核心區和邊緣區(見圖2、圖3)。
圖2沿著主對角線核心節點的分布區域,對核心區和邊緣區進行了明確的劃分。
圖3顯示,初始的二值矩陣與理想矩陣的相關系數(Starting fitness)為0.070,而經過重排后的矩陣與理想矩陣的相關系數也是0.070,說明兩者之間的相關性極低。通過核心-邊緣分析將41位健康信息用戶分為核心區1和邊緣區2,得出位于核心區的用戶較多(32位)。

圖2核心——邊緣分析結果

圖3 核心——邊緣分析結果
中心性分析是用來判斷研究對象中,某一用戶的重要性與否和影響力大小的指標,主要包括點度中心度分析和中間中心度分析。
2.3.1 點度中心度
點度中心度主要是對一個點與其他點相連的緊密程度進行分析,即判斷網絡中的核心用戶。結點的點度中心性越高,在網絡中與該結點直接相連的點就越多,結點在網絡中的“權力”就越大[8]。衡量指標包括點入度、點出度、相對點入度和相對點出度的分析。結果如圖4、圖5所示。
點出度表示某用戶關注其他用戶的程度,點入度則表示某用戶被其他用戶 關注的程度。從圖4中可以看到,32和37號的點出度較高,24號的點入度較高,說明32、37關注其他用戶的程度較高,而24號的被關注度更高。他們在該網絡中都屬于比較核心的、影響力比較大的用戶。

圖4 點度中心度分析結果

圖5 點度中心勢指數分析結果
從圖5可以看到,點入度和點出度的最大值雖然分別為8和7,但其平均值都只有1.634,可見該網絡的外中心度較大,一定程度影響了中心度的判斷。點入讀的集中化中心勢是16.313%,點出度的集中化中心勢是13.75%。中心勢越接近1,說明網絡越具有集中趨勢。因此該網絡中用戶之間的集中化程度較低,相互之間的關系較為分散。
2.3.2 中間中心度
中間中心度可測量出用戶控制其他用戶之間交往的程度,即用戶作為傳播中間人的能力。按照中間中心度數值(非零)大小從高到低排序得到中間中心度分析結果(圖6)和中間中心勢結果(圖7)。

圖6 中間中心度分析結果

圖7 中間中心勢分析結果
中間中心度越高說明一個用戶對于其他用戶的控制力越高,如果一個點的中間中心度為0,那么它對其他用戶就沒有影響。圖6中,24號用戶中間中心度最高,說明其在網絡中處于一個核心的地位。圖7中,整個網絡的中間中心勢為3.24%,數值較小,說明用戶之間交流的過程中相互影響的程度很小,權力也不集中。
凝聚子群分析是為了揭示用戶之間實際存在或潛在存在的關系,明確用戶中具有相對較強的、直接的、緊密的關系的用戶,以形成整個網絡中的子群體。結果見圖8。從圖8可看出,該網絡中用戶被劃分為7個三級的子群體。在每一個子群體中的用戶在整個網絡中的行為、影響力等特征都比其他群體中的用戶更相近。如果進一步減少子群數量,又可以分為4個二級子群體,從上到下依次標記為第I、II、III、IV子群。結合前文分析結果,可以看到,第IV子群的用戶是與其他用戶之間無聯系的用戶,第III子群的用戶僅與其他1-2個用戶之間具有交流,第II子群用戶則是該網絡中與其他用戶之間關聯最多的群體。
核心-邊緣分析是從網絡整體上區分出核心區和邊緣區,而凝聚子群則是將用戶根據其之間的關系進行分組,進一步細化核心區和邊緣區。

圖8 凝聚子群分析結果
利用NetDraw軟件可以清晰地展示各個用戶之間的交流和聯系,也可以看出凝聚子群結果是根據節點之間聯系的緊密程度的不同進行劃分的。如圖9中,位于圖片左側、既不關注其他用戶也不被其他用戶關注的節點都是第IV個子群的節點。
可視化分析結果與核心-邊緣分析結果相同。從圖9可看到,該網絡中節點的連接情況大致可以分為左右兩個區域,左邊區域的節點之間無相互關聯,右邊區域節點之間連接相對緊密。這兩個區域的節點分別于邊緣區和核心區的節點號相對應。
對網絡密度的結果分析中,我們猜測該網絡可能存在抱團現象。通過可視化的呈現,可以清楚地看到41位用戶之間的交流程度比較分散,而以17、24、25、30、36等節點為中心有抱團現象,用戶之間的交流并不均衡。而且17、24、25、30、36等節點也是點入度、點出度還有中間中心度較高的節點,驗證了中心中心度和中間中心度階段的結果,即這些節點是該網絡中的核心用戶。

圖9 可視化分析結果
對網絡中節點的中間中心性進行可視化的結果見圖10。圖中各節點方塊面積的大小代表了節點的中間中心度的大小,可見32、24、16是該網絡中中間中心度較大的節點。因此這些用戶對其他用戶有著較強的控制能力,在該網絡中的影響力更大。

圖10 中心性的可視化網絡結構
通過分析發現,微博中健康信息用戶之間的相互交流程度較低,并且存在抱團現象,不利于良好的信息交流。雖然本文選取的每個健康信息用戶都有很大的粉絲量,且有較大的影響力和聲望,但各用戶之間的交流仍十分有限,有的用戶之間甚至是零交流。用戶之間尤其是有一定影響力的用戶之間交流缺失并不利于構建一個良好的健康信息傳播平臺。
核心-邊緣分析結果顯示,所獲取的用戶之中大部分屬于核心區,但是在可視化結構圖中可以看到,用戶之間交流分散,存在小群體現象,有一些核心節點與其他節點完全是零交流,造成了用戶之間的信息不能達到有效的共享,信息不能得到廣泛的傳播??傮w來說,這41位用戶在自己的小團體中交流程度比較密切,但是脫離了團體之后與其他團體成員交流程度就很小。粉絲量較少的用戶會關注粉絲量較多的用戶,但是同為大粉絲量之間的用戶交流較少。
實現微博作為信息傳播的社交媒體平臺的價值,加強健康信息用戶之間交流,促進健康信息的傳播仍然需要新浪微博平臺和用戶之間的共同努力。首先要加強微博健康社區中核心成員之間的交流,提高核心用戶的活躍度,鼓勵健康信息的發布,加強信息的傳播;其次,微博平臺應為用戶創造良好的交流氛圍,加強網絡社區用戶間的交流。
本文分析了新浪微博中粉絲數量較大、影響力更大的健康信息用戶之間的信息交流情況,但在所傳播的健康信息內容、真實性、可靠性等方面信息并未進行分析和評價,健康信息用戶之間信息交流和傳播的機制和主要障礙等也需要進一步研究。