涂貴宇 潘文林 張天軍
(1.云南民族大學數學與計算機科學學院 昆明 650504)(2.云南民族大學軟件工程研究所 昆明 650504)
隨著新浪微博網絡社交平臺的興起,許多網民、媒體等蜂擁而至的在網絡社交平臺上對某一輿論發表觀點、實時交流,無形之間加快了信息傳播的速度和廣度。任何一個網絡中,或多或少都存在著占有不可或缺地位的節點,這些節點一旦被移除或是攻擊,整個網絡很有可能會在連通性、穩定性等方面受到一定程度的影響。例如在微博輿情傳播網絡中,通過控制關鍵人物就能把握輿情的走勢。因此,關鍵節點識別的理論研究意義和應用價值不可估量。
針對輿情超網絡及關鍵節點的識別,國內有不少研究。例如,趙劍華[1]等將SIR 傳播模型運用于社交網絡輿情傳播的分析中;王晰巍[2]等基于SNA闡述了移動環境下網絡輿情傳播;蔣侃[3]等分析了輿情關鍵節點識別及擴散;楊伊帆[4]發現加快網絡輿情消退的關鍵在于對次意見領袖實施干預;魏瑩[5]等闡述用主路徑分析法鑒別關鍵節點和控制輿情擴散;周麗娜[6]等通過鄰接結構熵確定了超網絡關鍵節點;王日芬[7]等研究了社會網絡關鍵節點的識別及應用;張磊[8]等基于超網絡建立語義社會網絡并對其關鍵節點識別進行了研究;馬寧[9]等利用超邊排序算法對網絡輿情領袖進行識別;高俊峰[10]對輿情內的輿論領袖所起到的號召能力進行測度研究;詹天成[11]等將微博內網絡領袖間的關聯用社會網絡分析法進行分析;胡亞雪[12]對面向微博輿情用戶挖掘及消息傳播預測關鍵技術進行研究;許鵬程[13]等對知識超網絡中的領域專家進行識別;Zlatic Vinko[14]等對超網絡中的超邊進行排序提出輿情超網絡模型中的SuperEdgeRank算法等。
本文將在前人研究的基礎上,對新冠肺炎輿情超網絡中的重要節點加以識別,更好地為有關政府機構在新冠肺炎輿情傳播中對關鍵用戶的干預提供依據,以控制新冠肺炎的網絡輿情走勢。
超網絡“Supernetwork”方法是由Nagurney[15]最先明確的,將超越而又超出現有網絡的網絡定義為超網絡。根據模型構建基礎,超網絡模型可分為基于網絡的超網絡模型(Supernetwork)和基于超圖的超網絡模型(Hypernetwork)[16]。基于網絡的超網絡更傾向于梳理網絡層次關系,基于超圖的超網絡更傾向于體現節點之間的復雜關系,當因素、層級涉及的越多的時候,基于網絡的超網絡模型應用優勢越明顯。因此,本文將利用基于網絡的超網絡模型進行后續的研究。
馬寧[17]等闡述微博輿情網絡由社交子網、環境子網、心理子網、觀點子網4 個子網構成;梁曉賀[18]等將微博輿情網絡分為社交子網、觀點子網、時序子網和情感子網;張連峰[19]等認為微博輿情網絡由環境子網、社交子網、內容子網、情感子網和時序子網5 個子網構成等。結合前人的研究思想及超網絡理論基礎,將輿情超網絡劃分為IP 屬地子網、主體子網、內容子網、觀點子網和時序子網,見圖1(a)。在輿情超網絡中,主體子網、內容子網、觀點子網三個核心層子網是相互貫通的,是輿情生命周期存在的主要條件。為了更精準地識別關鍵節點,將內容子網拆分成信息子網和話題子網以及暫且隱去IP 屬地子網和時序子網,剩下的主體子網、信息子網、話題子網、觀點子網間的關聯,見圖1(b)。

圖1 輿情超網絡和輿情節點關聯
2.3.1 主體子網
以微博用戶為節點,用戶間的評論關系為邊連接節點,從而建立主體子網。
定義:節點為微博用戶,以用戶之間的評論關系構造有向邊,由此構造的用戶評論關系網絡見式(1)。
其中P={P1,P2,P3,…,Pn} 是微博用戶的有限集合,EP?P的計算方法見式(2)和式(3)。
其中,P1,P2,P3,…,Pn是微博用戶,是SP網絡中點的集合;(Pi,Pj)為SP網絡中邊的集合。
2.3.2 信息子網
以用戶發布的帖子內容為節點,圍繞該帖子參與討論的話題為邊連接節點,從而建立信息子網。
定義:節點為用戶發布的帖子內容,以用戶圍繞該帖子參與討論的話題為關系構造無向邊,由此構建的信息子網見式(4)。
其中C={C1,C2,C3,…,Cn} 是帖子內容的有限集合,EC?C的計算方法見式(5)和式(6)。
其中,C1,C2,C3,…,Cn是帖子內容,是SC網絡中點的集合;(Ci,Cj)為SC網絡中邊的集合。
2.3.3 話題子網
以用戶討論的話題為節點,話題包含著的關鍵詞相似度為關系連接節點,從而建立話題子網。
定義:節點為用戶討論的話題,以話題包含著的關鍵詞相似度為關系構造無向邊,由此構造的話題子網見式(7)。
其中T={T1,T2,T3,…,Tn} 是用戶討論的話題的有限集合,ET?T的計算方法見式(8)和式(9)。
其中,T1,T2,T3,…,Tn是用戶討論的話題,是ST網絡中點的集合;(Ti,Tj)為ST網絡中邊的集合。
2.3.4 觀點子網
觀點態度傾向可以分為三類:正面觀點、中立觀點和負面觀點。以用戶對某一話題發表的觀點中提取出的態度詞詞匯本體為節點,態度詞的傾向性為關系連接節點,從而構建觀點子網。
定義:節點為用戶對某一話題發表的觀點中提取出的態度詞詞匯本體,以態度詞的傾向性為關系構造無向邊,由此構造的觀點子網見式(10)。
其中K={K1,K2,K3,…,Kn} 是態度詞詞匯本體的有限集合,EK?K的計算方法見式(11)和式(12)。
其中,K1,K2,K3,…,Kn是態度詞,是SK網絡中點的集合;(Ki,Kj)為SK網絡中邊的集合。
在多重因素共同作用下的輿情超網絡模型中,不同因素之間存在著不同類型的關系,其中包括同質因素之間的關聯關系(即層內關系)和異質因素之間的映射關系(即層間映射關系)。主體子網到信息子網的映射表示某微博用戶發布了哪些帖子,可能同一個用戶發布多條帖子,也可能多個用戶發布了同一條帖子(即轉發);信息子網到話題子網的映射表示用戶在某一條帖子中選擇自己感興趣的一個話題或是多個話題展開討論;話題子網到觀點子網的映射表示用戶對某一個話題發表了觀點。4層子網絡層內和層間映射唇齒相依,由此構建輿情超網絡模型。輿情超網絡模型超邊的定義見式(13)。
其中,超邊SEP?C?T?K表示用戶Pi發布了帖子Cj,參與討論話題Tm發表了包含態度詞Kn的觀點。
因此構建的輿情超網絡模型(CPH)見式(14)。
模擬輿情超網絡模型使文中的研究思路和方法清晰易曉。主體子網P、信息子網C、話題子網T和觀點子網K中分別包含了6 個微博用戶、3 個信息節點、5 個話題及20 個態度詞。表1 展示了4層子網絡層間節點的映射關系。

表1 輿情具體超網絡模型示例
1)節點超度
超網絡中的節點超度是指包含這個節點的超邊數量。在輿情超網絡模型中節點超度值越大,其影響力就越大,該節點越可能成為活躍用戶。如在上述建立的輿情具體超網絡模型中,SDP1=2 ,SDP6=3 等。
2)超邊連接度
超網絡中的超邊連接度是指某條超邊所相鄰的其它超邊的數目。超邊連接度越大,該節點越可能成為核心人物。如在上述建立的輿情具體超網絡模型中,L(SE3)=5,L(SE7)=2 等。
3)平均最短距離
超網絡中平均最短距離是指某個節點到達其它所有節點的平均距離,平均最短距離越小的節點影響力越大,該節點越可能成為意見領袖。如在上述建立的輿情具體超網絡模型中,=0.25 ,=0.17 等。
首先基于python 爬取以#新冠肺炎#為主題的微博數據,獲取用戶名稱、帖子及評論內容;其次將jieba 分詞模塊運用于微博文檔以及評論的分詞處理,去除無關的內容,例如標點、“回復:”、“@”等樣式的;最后用python進行LDA[20]模型話題生成。
根據微博用戶之間的評論關系、對應用戶發布的帖子、參與討論的話題以及發表的觀點為關系,建立主體子網、信息子網、話題子網和觀點子網,然后根據各子層間的映射關系,最終建立新冠肺炎輿情超網絡。主體子網絡共有341 個用戶節點,信息子網包括258 條有效網民帖子及評論,話題子網包含47 個話題核心關鍵詞,觀點子網絡中共包含提取出的30個態度詞匯,見表2。

表2 新冠肺炎輿情超網絡各子層網絡
在構建完成的新冠肺炎輿情超網絡中,以微博用戶為研究對象,計算微博用戶的節點超度值、超邊連接度、平均最短距離以及超邊排序值。
1)節點超度
在構成該輿情主體子網的341 位用戶中,大多數用戶的節點超度值是1,表3 中列出了節點超度值排名前10 的微博用戶,這10 位用戶很有可能成為該新冠肺炎輿情超網絡中的活躍人物。

表3 超度值排名
2)超邊連接度
計算上述10 位預備活躍人物的超邊連接度,表4 中列出超邊連接度排名前7 的微博用戶,這7位微博用戶很有可能成為該新冠肺炎輿情超網絡中的核心人物。

表4 超邊連接度排名
3)平均最短距離
計算這7 位預備核心人物到達其他微博用戶的平均最短距離,識別出新冠肺炎輿情超網絡中的關鍵節點,即該新冠肺炎輿情超網絡中的輿情領袖,見表5。

表5 平均最短距離
從表5 中可知,平均最短距離最小的4 位分別是橋組、Real 厲害財經、努力在搞機以及李青大夫。這四位關鍵節點用戶在新冠肺炎輿情超網絡中的部分超邊組成情況如表6所示。

表6 超邊組成情況
其中,在觀點態度詞列Ki中,0 表示用戶未發表觀點,1 表示用戶發表了觀點。C1表示內容為“接種過疫苗,第三次甚至第四次感染…”的帖子,該帖子包含話題#新冠肺炎#;C2表示內容為“r/co?vid19positive 版有13 萬人,每天有人發表自己得了新冠…”的帖子,該帖子包含話題#新冠肺炎#;C5表示內容為“新冠、選舉、經濟,韓國正在進行一場逆天的實驗,新冠疫情日增破40 萬,7 天均增世界第一…”的帖子,該帖子包含話題#韓國#、#新冠肺炎#和#尹錫悅當選韓國總統#;C15表示內容為“海外疫情不斷走高,全球經濟…”的帖子,該帖子包含話題#新冠肺炎#;C31表示內容為“十天前獲批首款國產新冠口服藥的河南真實生物科技有限公司…”的帖子,該帖子包含話題#科技#、#醫藥#、#新冠肺炎#和#首款國產新冠口服藥公司赴港上市#;C74表示內容為“疫情大時代背景下,為了應對潛在的經濟下行壓力…”的帖子,該帖子包含話題#蘋果放緩部分招聘#;C17表示內容為“主動感染新冠會怎么樣?34 人挑戰實驗結果發布…”的帖子,該帖子包含話題#新冠肺炎#;C14表示內容為“韓國把新冠降級為乙類傳染病”的帖子,該帖子包含話題#視頻星計劃#、#疫情#和#韓國#。
本論文將超網絡理論運用于新冠肺炎輿情傳播中的各個子網建模,應用Matlab、python 仿真分析方法識別新冠肺炎輿情中的關鍵節點。介紹了輿情超網絡模型子網絡,主要包括主體子網、信息子網、話題子網以及觀點子網4 層子網絡,并依據層間的映射關系構建輿情超網絡模型;還介紹了用于識別關鍵節點的超網絡測度指標;最后通過仿真分析,證明了超網絡分析法在關鍵節點識別中的可靠性。
在新冠肺炎輿情超網絡中識別出關鍵節點,有助于相關部門實施相應的引導和干預政策,避免因消息在傳播過程中出現“信息失真”現象而引起群眾恐慌,進而妨礙疫情防控工作。在應對突發的公共衛生事件輿情傳播方面,要針對該類輿情事件對群眾進行網民教育,切記不信謠不傳謠、有意識地培養正面意見領袖等,這需要在公共衛生事件輿情超網絡中進行更加深入的仿真分析。