(江蘇財會職業學院,江蘇 連云港 222061)
隨著“互聯網+”時代的到來,網絡信息量與日俱增,微博自2006誕生以來,以其獨樹一幟的簡短性、開放性、動態性信息傳播風格,極大地促進了信息傳播與共享,尤其在發生一個重大事件或者熱點話題后,便會出現與這一事件相關聯話題跟蹤討論,使得信息在各用戶之間傳遞,因此,微博平臺已逐漸成為人們獲取信息的主要來源。
微博文本語言不超過140個字,從語法、語義顯示出獨特的網絡結構,從而形成對話題事件產生各種情緒、觀點及意見,微博作為一種新興的交流媒體,一方面大大促進了人們之間的交流,催生了基于微博平臺的營銷手段;另外一方面,微博平臺已成為許多不良謠言、誹謗等網絡暴力的陣地,帶來了諸多不良的社會負面影響。
微博用戶在線上交流過程中明顯表現出強烈的社會特征,各用戶在微博網絡中的互相關注、交流評價等行為與網絡的拓撲結構間存在相互影響[1],微博話題在各用戶之間傳遞影響著微博網絡整體發展和形態;反過來,微博的網絡演化也影響著用戶的個體行為。在信息迅速傳播的年代,非常有必要對微博進行深入的研究。
目前,國內外對微博數據的分析主要分為以下幾個方面:①對微博用戶的研究。②對微博文本語義的研究。③對微博信息傳播網絡的研究。目前這幾個方面,在各個維度和深度上都取得了一定進展,通過對微博數據進行輿論引導、用戶興趣關聯推薦等綜合應用,從而凸顯出微博的媒體價值,由于微博環境的開放性,為網民輿論自由提供了條件,但也有少數不法分子會在平臺上散布煽動性言論,因此,運用復雜網絡方法挖掘微博話題特征具有一定的實際應用價值。
目前復雜網絡由學者錢學森給出最為嚴密的定義:復雜網絡即是包含組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡[2]。它被理解為是一種研究復雜系統的手段和方法,已廣泛地應用到眾多學科之中,解決各系統中的復雜現象問題,無論在理論價值上還是工程應用方面都具有重要的意義。
自然界的大量復雜系統如醫學、社會科學、經濟學、物流等都可以用網絡來描述,復雜網絡的復雜性主要體現在網絡結構復雜、網絡動態進化、邊多樣性、動力學復雜性、節點多樣性等特點。
復雜網絡研究的第一步往往是研究復雜網絡性質,由圖來表示網絡性質,抽象的復雜網絡是由點集V和邊集E組成的圖G=(V,E)[3],點集V代表著節點的數量,邊集E代表著網絡邊數的數 ,復雜網絡經過多年的發展,在計算機領域得到了關注,根據實際的網絡情況,可以將圖分為4種類型:加權有向圖、加權無向圖、無權有向圖和無權無向圖[4],為了更客觀反映網絡結構,從多角度描述復雜網絡拓撲特性,主要有度分布、平均路徑長度、聚類系數等。
劉冰瑤等人[6]通過一種特征降維方法解決微博語義中存在的高維性和稀疏性;李坤[7]在傳統的FF模型上,提出基于多維特片的用戶決策模型,建立話題傳播模型,并分析用戶變化對話題傳播的影響。田占偉[8]從節點拓撲結構差異、群落結構兩個度,分析了微博中信息中傳播的規律,構建了微博信息傳播過程模型。
復雜網絡分析方法無論是在微博文本上還是話題傳播方面是都是可行的,在復雜網絡的相關參數,如度分布、聚類系數、平均最短路徑等方面反映了微博語言的語體特征。該研究不僅拓展了復雜網絡方法在語言學領域的應用,而且為基于復雜網絡的微博內容挖掘提供了可行途徑。
與傳統的新聞媒體相比,微博在傳播的速度和深度上遠比傳統媒體來得深遠,一些重大新聞事件將微博作為首發源頭,對于微博用戶來說,了解信息可以選擇感興趣的用戶,也可選擇感興趣的微博,由于微博具有發布功能、轉發功能、關注功能和評價功能,信息可以通過多種傳播途徑在用戶之間實現消息的互通。
微博的傳播特征呈現裂變性、自媒體性、多維特征等性質,一則話題發布后,當轉發的用戶累積到某個點時候,尤其經過大V及公眾人物的發布之后,信息將會達到裂變式傳播,從而使傳播效率大大提高,因此微博具有裂變性;微博的傳播具有自媒體性,信息的分享改變了自上而下的廣播模式,以用戶節點為核心,實現點對點的傳播模式,這種自發傳播性決定了每個用戶都是消息的傳播者和產生者;微博具有多維特性,話題不僅包含語義類信息,更含有發布者的個人情感傾向,有正面評價、負面評價,也有中立觀點,正是由于所持觀點及情感的不同,才會使話題熱度不斷升高。
“互聯網+”時代,隨著社交網絡的蓬勃發展,為學者研究話題傳播提供了海量的實際數據,經過多年的成果積淀,研究者們在話題信息傳播模型上取得了突破性的成果,主要有基于網絡結構的傳播模型、傳染病傳播模型等。
棚寬8~10m、棚長40~60m、棚高2.3~2.5m。棚架主體寬6~8 cm,可選用竹片或塑鋼材料,根據氣候條件可做兩三層內膜支架,內膜支架間距為15~18 cm。
基于網絡結構的傳播模型,是指經過信息傳播的網絡結構與鄰居節點之間的交互關系對信息傳播過程進行建模[9]。此類模型中根據節點的活動狀態又可分為線性閥值模型、獨立級聯模型,以及在此基礎上產生的擴散模型。基于網絡結構的傳播模型應用在信息影響力擴散、個性化推薦等方面,有著獨特的優勢,但是在研究過程中缺乏時效性,未能將網絡之外的因素考慮在內。
基于傳染病傳播模型,復雜網絡傳播動力學中研究最廣泛的是流行病傳播,因為傳染病的傳播過程與信息傳播過程有很大的相似之處,均伴隨著一個起始、傳播、爆發和消亡/平息的全過程,在傳染病模型中,根據個體所呈現的受感染狀態的不同,可分為容易被感染的易感染狀態,具有傳播性的感染態等,從以上狀態的不同,提出不同的傳播模型,最經典的概率傳播模型有SIR模型和SIS模型,SIR模型適合描述可能再次感染的疾病中,SEIR模型存在一個潛伏特性的E態特征,經過潛伏后,才會出現傳染性。傳染病模型與消息傳播有相通性,但是傳染病模型對節點之間的重視不夠,然而微博中的傳播節點是至關重要的。
微博環境下的用戶轉發、點贊、評論等信息傳播行業產生了大量的數據,為信息傳播特征分析提供了良好數據支撐[10]。微博中用戶關系存在3種情況,一是關注,二是被關注,三是相互關注,彼此之間的關注可以計算出用戶的出度和入度。
2.3.1 數據選取與收集
由于新浪微博對第三平臺提供開放的API端口,可以對其網絡中的數據進行操作,包括獲取用戶信息獲取接口,微博文本數據獲取等。2019年國慶節期間,多部優秀的影視作品上映,本研究以2019年10月1日~10月7日之間,“中國機長”話題下的點贊數大于1 000的微博節點及節點間關系為研究對象,獲取的數據包括用戶ID、用戶名稱、關注對象、被關注對象、微博文本、點贊數等,最終獲得數據有9 205 100條。
在獲得的數據中,共包含了2 001名用戶,存在2 041 020條關注關系,以2 001個用戶作為節點,并以他們之間的互相關注為連邊,構建了微博話題傳播過程中的復雜網絡。
2.3.2 微博話題網絡分析2.3.2.1 度分析
度是描述單個節點屬性的最簡單又是最重要的概念之一,節點i的度ki可理解為與節點i直接相連的邊的數目,在有向網絡中,度又可分為出度和入度。
作為網絡節點中的微博用戶,其度是指與本節點直接相連的節點個數,節點的度可以記為:
(1)
通常微博用戶節點度值的大小反映了該用戶節點在整個網絡中的重要性,圖1描述了該話題中用戶節點度值的概率分布,反映出節點度值整體上呈冪律分布。度值大于500的用戶節點,占的份額并不是很多,說明這些節點比其他度低的節點傳播中占有更大的優秀。

圖1 節點的度
通過對較大度的節點進行分析,繪制出微博的入度和出度分布圖,如圖2、圖3所示。

圖2 各節點出度分布圖

圖3 各節點入度分布圖
從圖2和圖3中看出,入度最高的前5個節點分別是:張涵予、歐豪、杜江、袁泉、張天愛、李沁,說明影片因這些明星加快了傳播速度,因為他們具有強大的粉絲,能夠產生口碑效應。出度分布隨著度數增加而人數降低的分布規律,與泊松分布較為類似,這些出度較高的用戶表現出于他人較強的交流意愿。
2.3.2.2 聚類系數分析
Watts和Strogatz將聚類系數定義為某個節點所在鄰居節點之間連邊的數據占可能的最大連邊數的比例[5],可表示為:
(2)
當C取1時從中獲知網絡中所有節點是相連的,本微博話題用戶樣本所得的聚類系數為0.432,說明此網絡的集聚性較好。集聚系數越大說明了網絡節點中任意用戶之間獲得某種關聯的可能性也就越大。
2.3.2.3 平均路徑長度分析
網絡中平均路徑長度L可定義為任意兩個節點之間的平均值,其公式為:
(3)
通過軟件計算出微博關注網絡的網絡直徑為8.733,平均路徑長度為2.159,說明微博在任意2個用戶間進行信息傳播,通過2.159個用戶關聯即可實現信息傳播,由此可見,微博用戶網絡結構在一定程序上利于話題在用戶之間共享和傳遞。
通過引入復雜網絡分析方法對微博話題的網絡結構進行分析,從度分布、聚類系數和平均路徑長度3個指標分析了“中國機長”話題下形成的網絡結構特點,從結論中可以看出微博用戶具有集群性,話題傳播路徑與用戶的信息分享行為緊密相關,因此需要嚴格把控關鍵節點的控制,嚴禁負面言論的產生,引導網絡中的意見領袖來提升話題的熱度,在技術層面上,需要從信息源、內容、傳播路徑進行監管,對不同節點發布信息進行限制。在制度上,提高微博中大節點用戶自律行為,起到規范和引導的作用。