楊奕 張毅



摘?要:[目的/意義]在信息技術快速發展的今天,社交媒體在復雜公共議題中承擔了越來越重要的信息發布、用戶參與和輿論引導功能。通過對社交媒體多平臺的用戶記錄的大數據分析,可以考察跨國家和平臺用戶訴求的差異和傳播途徑。[方法/過程]基于中美貿易爭端的現實案例,使用網絡爬蟲程序定時采集Twitter和Weibo的用戶數據,應用概率主題分析、時間趨勢分析、社會網絡分析等大數據分析方法,剖析兩大平臺在議題分布、時間演化和關鍵影響者的表現形式與屬性差異,嘗試彌補現有研究體系視域的單一性問題。[結果/結論]結果表明:1)在網絡環境中,現實事件對于用戶行為和主題熱度產生迅速的反映;2)引發平臺主題框架差異的原因由特定的環境、制度或文化背景所塑造;3)關鍵影響者的類型和觀點顯著影響當地的議題討論網絡,并引導輿論走向。本研究實現了對社交媒體用戶行為互動觀察維度和理論維度的探索與推論,印證了跨平臺差異的根本解釋,在一定程度上回應理論與實踐研究對社交媒體功能定位和發展優化的關注。
關鍵詞:公共議題;中美貿易爭端;社交媒體;網絡輿情;主題演化;社會網絡分析;比較研究
DOI:10.3969/j.issn.1008-0821.2021.03.010
〔中圖分類號〕G206?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)03-0094-16
Social?Media?Topic?Evolution?Trend?and?Social?Network
Analysis?Based?on?the?Complex?Public?Issues
——A?Comparative?Study?of?China-US?Trade?Disputes
Yang?Yi?Zhang?Yi*
(College?of?Public?Administration,Huazhong?University?of?Science?and?Technology,Wuhan?430074,China)
Abstract:[Purpose/Significance]With?the?rapid?development?of?information?technology?today,social?media?has?assumed?more?and?more?important?functions?of?information?release,user?participation?and?opinion?guidance?in?complex?public?issues.Through?the?big?data?analysis?of?user?records?on?social?media?platforms,the?differences?in?user?demands?and?communication?channels?in?cyberspace?can?be?investigated.[Method/Process]Based?on?the?reality?of?China-US?Trade?disputes?case,the?study?used?the?web?crawler?Twitter?and?Weibo?of?user?data.Then,it?applied?probability?topic?modeling,time?trend?analysis,and?social?network?analysis,to?explore?the?differences?between?the?two?platforms?in?the?issue?distribution,time?evolution,and?key?influencers?for?trying?to?make?up?for?the?problem?of?unitary?vision?existing?in?the?current?research.[Result/Conclusion]The?results?showed?that:(1)in?the?online?environment,real?events?had?a?rapid?impact?on?user?behavior?and?topic?popularity;(2)The?reason?that?caused?the?difference?of?platform?topic?framework?was?shaped?by?specific?environment,system?or?cultural?background;(3)The?types?and?opinions?of?key?influencers?significantly?influenced?the?discussion?network?of?the?platform?and?guide?the?direction?of?public?opinion.The?study?realized?the?exploration?and?inference?of?the?interactive?observation?dimension?and?theoretical?dimension?of?social?media?user?behavior,verified?the?fundamental?explanation?of?cross-platform?factor?differences,and?responded?to?the?social?practice?and?theoretical?researchs?attention?to?the?function?positioning?and?development?optimization?of?social?media?to?a?certain?extent.
Key?words:China-US?trade?disputes;social?media;online?public?opinion;topic?evolution;social?network?analysis;comparative?study
中美貿易爭端起始于2017年8月美國對華啟動“301調查”,隨后對中國進口商品征收額外關稅、設置其他貿易壁壘;中國商務部同時作出反制措施,對價值數百億美元的美方輸華商品征收額外關稅。自此,世界兩大經濟體陷入曠日持久的經貿摩擦。雖然后期雙方一度達成階段性共識,但是這種超越地區限制的遠距離行動,在一定程度形成社會學家Ulrich?Beck所謂的“全球風險”,即雙方的討論解釋依賴于當地社交媒體,在現實世界引發廣泛討論,通過本土或時間范圍呈現全球的視角。
隨著互聯網的普及與網絡傳播的高效性和分散性,信息不僅能夠在較短時間內實現更大范圍的傳播,也打破了傳統以單一主體為中心的信息傳播模式。尤其是微博客等社交媒體的出現,在事件的發展過程中,人們主動或隨機形成且帶有主觀色彩的態度觀點,實際蘊含豐富的信息內涵。這種半結構化、不規律的數據特征通過網絡媒體的形式充分表達,揭示了人們的觀點與思想,也引發了數據驅動的新興輿論力量。在學術研究中,這些海量數據能夠改進傳統方法獲取數據的局限,推動公眾反饋參與形式的轉變,完善參與者關系特征的測量評估,為數據挖掘復雜政治議題研究提供可能。
由于全球事件的交叉性較強,不同學科側重點不同。相關研究主要以外交政策、政府機構改革、國家領導人溝通等主體為對象,集中在國家行政機構改革、政治領袖溝通、全球風險管理、政府管理監督等方面,鮮有研究聚焦公眾視角,開展網絡輿情與數據挖掘可視化的測度研究。此外,現有研究多集中于西方視域或案例,忽略了文化背景的多樣性,無法通過現有研究辨析社交媒體的國別差異。為了克服這些局限性,本文重點關注的核心問題是,根據持續發酵的中美貿易爭端,是否可以找到有效測量并比較跨平臺社交媒體用戶參與的反饋特征及輿論影響者關系結構的方法和路向。
具體來講,本研究以兩個當事國家具有語言和文化代表性的社交媒體平臺Twitter和Weibo為研究對象。基于大數據挖掘與分析視角,使用網絡爬蟲程序采集用戶社交媒體評論的海量數據;采用概率主題模型分析及時間趨勢分析,分析用戶偏好的相關主題框架,不同時期的熱點演化趨勢;然后使用社會網絡分析方法,繪制中美貿易爭端話題意見領袖網絡的結構圖譜,利用相關參數分析測度關鍵影響者在網絡中的位置。探索比較用戶形成網絡拓撲特性的主題規律與網狀結構,有針對性地改進傳統研究方法和調查數據的局限性,回應理論與實踐研究對中美貿易政治議題網絡的關注。
1?文獻回顧與理論基礎
1.1?互聯網社交媒體對信息傳播模式的重構
隨著20世紀80年代網絡技術的興起,信息革命對社會溝通交流方式帶來眾多機遇和挑戰。作為互聯網技術的典型代表,社交媒體概念最早由國外學者Jennifer?B?Unger提出,被定義為“網絡用戶用以交換信息和內容創建的平臺”[1]。在此平臺上,人們可以彼此分享觀點、經驗、見解,平臺為用戶提供了信息內容創造和交換的服務場所。由于參與對話和公開交互等特性,在公共議題的關注討論中,所有用戶既是潛在議題的發起者、傳播者和渲染者,也是信息的消費者和生產者,甚至在不知覺的情況下參與其中[2]。這種由傳統媒介制造話題的“一對多”傳播范式轉變為用戶自發形成的“多對多”,在超越時空與快速傳播的同時,實時更新至話題列表及關注者賬戶中,使得用戶數據交換能力更加高效,為用戶呈現接近事件真相的臨場感知[3]。現如今,學界已將其視為網絡協作模式和用戶創造內容對集體智慧的貢獻[4],成為獲取社會意見的重要渠道之一。
在眾多的社交媒體類型中,微博客(Microblog)是具有代表性的平臺之一。該平臺由豐富的賬戶聚合而成,包含多種形式的溝通模式。微博客的帖子均為公開發布,除特殊設置之外,所有用戶均可以輕松瀏覽,這種低成本、便捷性與時效性并存的信息獲取方式,實現了賬戶間點對點直接的信息互動[5]。更重要的是,這種去中心化的方式顯著增強了人們在信息傳播和溝通交流中的主體性和存在感。其智能化的展示模式深刻地影響公眾觀感,以一種更加強烈的方式推動公眾參與,成為一個民主平等且持續響應的公共話語論壇[6]。
全球不同版本的微博客中,Twitter是世界最大的微博客服務供應商[7],其通用的官方語言(英語)、開放的平臺與使用廣泛的賬戶架構,成為微博客服務的主要場所,因此接近80%的Twitter用戶持續跟蹤其關注者的實時動態[8]。此外,該平臺也是獲取各類型公共事件信息的媒體平臺[9],實時反映現實世界客觀存在的公共議題,尤其在政治經濟與社會討論等方面,受到學界的廣泛關注[10]。與此同時,本研究以中國代表性的微博客平臺“新浪微博”(后簡稱“Weibo”)為另一研究對象,根據微博發布的2020年第一季度財報顯示,截至第一季度末,Weibo月活躍用戶達到5.5億,與去年同期相比凈增長約8?500萬。
從本質內涵來看,社交媒體是公眾參與的主要平臺,社會互動日趨網絡化特點,使得傳統的單一制模式無法發揮最佳效用,多元互動和公眾參與成為新時代公共管理的重要特征。從表現形式上看,微博客新型互動機制打開了數據開放之門,從根本上改變了信息傳播過程中“創建與消費的結構模式”,也是學術研究的理想場所。從發展方向來看,相比傳統的政治參與形式,用戶網絡民主化參與對于直接關系個體利益的特定議題保持更為積極的態度,而不是陷入寬泛的參與形式之中。在此意義上,社交媒體中用戶參與的形式更加真實,在了解事件進展、拓寬參與渠道、激發溝通熱情等方面發揮作用。
1.2?理論基礎
1)框架理論。為了對微博客數據處理過程進行概念化和理論化,本研究借鑒了Goffman?E提出的框架理論(Framing?Theory)[11]。現實中多數傳播過程產生于各類型的框架中,框架本身作為概念背景或主題原則惻隱于某項文本背后,通過將這些表征符號有序地排列組織,形成結構統一和邏輯一致的表達,幫助人們理解框架統攝范圍內產生的信息傳播、社會交往[12],由于相同的信息傳播行為置于不同的社會結構中,其形成框架會產生不同含義。因此,框架理論研究基于這樣一種觀點,即人們對公共事件的反映是由特定社會制度或文化背景所塑造的[13]。當前,學界主要將框架理論應用于現實世界所反映的文本內容,使用信源線索、關鍵詞、圖片的標簽化符號,進而潛在地影響政策觀點、社會價值觀等。隨著信息技術的普及,媒體在框架建構方面的功能進一步提升。一方面,信息傳播形式呈現復合和多元化,既有報紙、電視等傳統媒體,也有微博客、微信客戶端等社交媒體,輿論話語生成與報道框架多元化成為主要的趨勢[14];另一方面,社交媒體的興起,意味著人人都有機會在集體行動中參與框架的建構,眾多非直接利益關聯的網民均可直接參與話題討論。框架理論為本研究提供了關鍵的概念基礎。根據中美貿易爭端的現實案例,從事件的產生、發酵到演化,各界聲音此起彼伏,并在社交媒體場景體現。本文將該理論命題用于分析微博客用戶交流,考察網民個體在評論行為中主要涉及哪些話題,以及這些評論在何時變得升溫或冷卻。基于此,框架理論不僅可以有效量化評論生成的主題框架模式,還能掌握特定主題的時間演化趨勢。其網絡符號構建了特殊的主題框架,進而推論基于微博客的中介化過程所生成的公眾溝通實踐。最后,探索比較不同輿論場的框架差異。
2)意見領袖(或關鍵影響者)。學術界經典的研究成果將影響群體的影響者稱為“意見領袖”,指那些在信息傳播中處于相對有利位置的意見引領者,其觀點得到關注者的支持,具有相對更高的影響力和話語權。因此,意見領袖可以基于這些社會支持,影響其他群體的價值判斷[15],利用可以控制的范圍廣泛傳播信息,推動社會意見形成統一,甚至在社會網絡的邊緣也可間接形成獨特影響力[16]。在社交媒體環境下,通常使用“關鍵影響者”解釋意見領袖概念。在微博客平臺下,用戶間的關系結構通過“關注與被關注”調節,其實質上也形成一個線上的社會網絡。關鍵影響者通過在某領域積累的知識資源或認知能力,處于資源流動網絡的核心位置,進而成為互聯網社會的“意見領袖”。如今,關鍵影響者受到社交媒體研究者的青睞,在于該角色對群體、交往和關系等概念的融合,強調從整體的合作網絡出發,考察影響者的結構位置及影響力來源。當前,學界相關研究逐漸從傳統的概念探析轉至定量化的實證或數據挖掘研究。在本研究中擬回答的問題是:在中美貿易爭端討論中,哪些賬號是Twitter和Weibo平臺的關鍵影響者?研究具體包含兩個方面:第一,社會網絡參與者的整體結構,這是一個由邊和頂點構成的宏觀網絡,頂點表示話題參與者,邊表示他們在提及、轉發、回復等方面的互動;第二,識別關鍵參與者,通過網絡中心性指標,識別量化關鍵影響者構成。
1.3?社交媒體與輿情大數據挖掘
隨著社會信息化程度的不斷加強,互聯網已成為大型的信息資源儲存庫,以此存放非結構化的文本信息。但面對海量的文本信息,傳統的手動操作處理方式已顯得力不從心,如何準確地從非結構化文本數據中提取滿足研究者需要的知識信息,需要創新性地采用數據文本挖掘方法獲取。文本挖掘(Text?Mining)是以信息系統領域中的自然語言處理與數理統計分析為理論基礎[17],結合機器學習與信息檢索技術,從大規模的文本信息中發現并提取關鍵詞和主題信息,尤其在處理多項文本的挖掘過程方面效果最佳[18]。
文本挖掘方法可以獲取海量的信息構成。通過關鍵詞特性提取、嵌入預定義主題、信息放大和縮小等多種方式,對文本內容展開搜索[19],最終轉化為普通人可以理解的“知識”的過程。這種新型研究工具已成為研究者定位海量文本信息的有效工具,也是獲取社會現象、用戶內容、多主體結構關系的載體。現實議題在網絡平臺得以映射,最終也會反作用于社會輿論影響。當前,文本挖掘主要應用于信息抽取[20]、特征識別[21]、演化趨勢[22],關注數據的主題特征、用戶行為、隱私保護等方面的研究。如Javed?N等提出一個概念框架,融合詞性標記、Lexicon分類和聚類生成的語料庫等語義處理技術,分析Twitter用戶參與關于合作性和包容性治理的帖子[23]。Reddick?C?G等根據美國圣安東尼奧市在Facebook平臺上發布與固體廢物管理相關的文本數據,使用概率主題分析確定了市民對于城市建設提出的有關主題[24]。在用戶行為方面,Doran?D等對社交媒體用戶的傳播行為進行可視化分析,預測社會輿論的傾向性[25];Lee?M?J等基于對互聯網在線評論進行民意調查,研究人們對其他網民發布信息的容忍度以及網絡用戶在社交媒體發表意見的意愿程度[26]。在隱私保護方面,Metzger?M?J等研究認為近年來利用社交媒體開展的非法網絡輿情傳播,使得用戶隱私及信息安全存在隱患[27]。Imran-Daud?M等提出一種語義網技術的訪問控制機制,通過自動檢測敏感信息,實現用戶對動態隱私的保護[28]。
綜上,盡管現有研究取得了豐碩的成果,但一些局限性仍然存在。第一,無論是框架理論、意見領袖亦或是社交媒體研究,主要仍集中于西方發達國家的應用場景,針對我國等發展中國家為案例的實證研究較為缺乏。第二,對于用戶大數據的挖掘實驗而言,現有研究主要聚焦于技術算法層面的創新,很少有學者將傳統的社會科學及傳播學理論嵌入至該領域的研究。第三,當前針對社交媒體用戶的研究仍然多屬于理論研究的范疇,很少有研究采取跨國家、平臺、語言的方式,探索比較用戶數據的樣本模式。
2?研究設計
2.1?情境案例
過去30年間,中美兩國在貿易和經濟關系方面取得了長足發展。中國現在是美國最大的商品貿易伙伴、第三大出口市場和最大的進口來源國[29]。然而,在新一屆美國總統選舉之后,這種局面發生了根本性變化。隨著特朗普政府施行新的貿易戰略,美國采取的方法超出常規貿易措施。其目標是通過貿易協定來解決中美雙邊關系中的結構性問題,然而政治層面談判的激烈程度顯示,雙方在尋求達成協議的同時避免采取對等的嚴厲措施的意愿。
2018年3月,美國總統簽署了一份備忘錄,宣布以“中國竊取美國知識產權和商業秘密”為由,對從中國進口的商品征收關稅,涉及金額達600億美元;隨后,中國商務部采取反制措施,對美國進口商品加征關稅;2019年6月,中美兩國領導人在大阪舉行的G20峰會就重啟經貿談判舉行會談;同年8月,美國總統在Twitter上宣布,美國政府將對所有剩余的價值3?000億美元的中國進口商品征收10%的關稅,導致人民幣兌美元匯率跌至7以下;作為回應,中國政府宣布將暫停購買美國農產品。兩國貿易爭端大有“山雨欲來風滿樓”之勢。當前關于中美貿易爭端的文獻較為有限,主要從定性研究切入,基于國際政治學、外交學和經濟學視角,分析潛在的中美關系的經濟影響[30]、國際政治影響[31],預測未來的市場前景,評估加劇沖突的可能性[32],并提出政策層面的解決措施[33-34],較少研究涉及定量分析維度,以及基于用戶網絡輿情的海量數據挖掘研究。
2.2?研究數據
研究擬選取Twitter和Weibo用戶評論文本作為數據樣本。首先,通過網絡爬蟲程序檢索中文原文包含關鍵詞“貿易戰”和英文原文包含關鍵詞“Trade?War”的所有微博客帖子(字段為“賬戶名稱、評論正文、@賬戶提及、發布時間”)。為便于結果的結構化比較,將用戶限定為Weibo用戶為中國大陸地區漢語用戶,Twitter用戶為美國本土地區英文用戶。
為盡量減少兩平臺之間因時差而導致的結果偏差,實驗設定在每天的同一時間(北京時間上午9點,美國東部時間晚上8點)開始收集數據,時間區間為2019年6月29日—9月30日。根據此事件的時間線顯示,如圖1所示,從首次出現至后期達成第一階段協議,該時間段是事件的集中暴發與媒體平臺集中討論較關鍵的時間節點。因此在這個稍瞬即逝的時機,對東西方最重要的兩個微博客平臺開展海量的大數據探索,為學術研究提供了較為難得的機遇。在執行數據分析之前,需要進行必要的數據清洗工作,手動刪除無效、廣告營銷以及含有極端言論的帖子,最終共采集36?035條Twitter和17?568條Weibo數據。
2.3?研究方法
通過網絡爬蟲獲取的賬戶名稱、評論正文、@提及、發布時間等數據,為探索文本主題、時間趨勢、網絡結構提供了不可多得的輿情文本資料。用戶文本是獲取用戶現象、內容、主體結構關系的一種載體,融合大規模和自動化的數據分析,成為網絡輿情和大數據政治學主要的研究方法。本文在現有理論支撐和數據實驗的基礎上提出一種分析框架。
第一,基于潛在狄利克雷分配(Latent?Dirichlet?Allocation,LDA)的概率主題建模。概率主題模型作為功能顯著的智能識別,也是文本挖掘法代表性技術。不同于傳統的文檔檢索依據關鍵詞展開,LDA基于Python語言環境,識別對應的相關主題獲得線索和規律性認知。利用文本分類、聚類和信息抽取方法,找到文檔主題的構成分布,然后檢索與該主題對應的內容,進行相關性探索與推論[35]。因此,可以將LDA視為新形式的文本檢索方法,該技術可處理多項文本,且具有智能分離多個含義的功能。同時,由于該方法基于計算機算法自動實現,可以使數據分析中的主觀偏差最小化[36]。
第二,使用時間趨勢分析(Time?Trend?Analysis)檢驗主題與時間的相關關系。對應于概率主題建模,時間趨勢分析將建模后的主題采用時間序列劃分,關注主題隨時間變化的現象。兩者的相關性能夠引導理解現實世界和數據之間、個體之間、不同群體之間的關系,多應用于統計學和經濟學研究中。但在輿情傳播領域,已有研究多針對突發事件以靜態的方式展開研究,或分析用戶評論在數量上的動態變化,融合主題建模的演化研究則探索不足,事實上,研究不能將兩個維度割裂開來,應綜合兩維度考察用戶輿情的信息內容。因此,本研究嘗試應用時間序列分析,重點對Web數據以天為單位聚合,結合輿論場的時序變遷,生成以3天為周期的時間序列,以此揭示話題隨時間演變的規律。
第三,社會網絡分析(Social?Network?Analysis,SNA)是對關系結構及其屬性加以分析的一種方法。SNA研究社會網絡的關系構成在多個節點之間的連線集合。Twitter和Weibo賬戶彼此分別創建的關注、回復和@提及網絡,可以獲得有價值的關系發現,勾勒用戶互動的圖譜,從而形成理論歸納和總結。SNA包含網絡整體結構和關鍵影響者識別,一是由邊和頂點組成的整體社會網絡,其中每個節點表示話題中的參與者,邊緣表示他們通過提及、轉發和回復方面建立的關系,匯聚了以整體合作數量、網絡密度、網絡規模、中心化趨勢等指標為表征的整體認知圖景。另一方面,網絡內部的參與者網絡,是一個由點度中心度和中間中心性為指標的關鍵影響者識別。社會網絡分析為網絡輿情提供了將空間概念引入研究框架的新機遇,呈現相關話題用戶互動的空間分布及網絡聚類。
3?研究過程
3.1?概率主題分析:基于LDA的議題關注
本節將介紹LDA模型主題的提取過程。通常來講,社交媒體平臺的文本信息由用戶生成,并存儲在后端數據庫中。因此,在進行分類主題之前,需要對文本執行分詞、去除停用詞、清洗無意義字符等預處理操作。在英文預處理部分,使用了Python程序中領先的人類語言數據處理平臺Natural?Language?Tool?Kit,實現分詞和停用詞刪除的操作;中文文本分詞部分則選用Jieba中文詞法分析系統。為完成中文停用詞刪除操作,使用了Apache?Lucene的Smart?Chinese?Analyzer類中使用的中文停詞列表,此后,每個公共評論文檔都表示為單詞向量。然后,使用信息檢索領域的TF-IDF(Term?Frequency-Inverse?Document?Frequency)關鍵詞統計方法,進行篩選操作。過濾掉出現頻率高但不影響文檔主題的詞語,盡可能多地保留影響程度較高的特征詞,即可實現后續的建模分析。
在接下來的實驗中,采用LDA模型定量提取指定數量的關鍵詞和主題,以實現特征降維的作用。具體分析過程為:主題關鍵詞提取→分類主題降維→概率統計及排序。①主題關鍵詞詞提取,根據研究人員設置的主題和關鍵詞數量,系統自動提取相應的主題和關鍵詞;②分類主題降維,將含義相近的主題和特征詞分別標注至具有相同含義的主題中;③概率統計及排序,統計每個分類主題的隸屬概率值并排序。分類主題建立在關鍵詞聚類基礎上,根據不同粒度劃分,可計算出不同的主題數量,因此需要結合需求,對結果進行不斷調試以達到最優求解。作者分別選取的潛在主題數量為20、25、30、35個,發現當Twitter和Weibo的主題總數分別為25和30個時,列表的語義提取效果最好。由于篇幅限制,分別列舉分類主題對應的3個和4個代表性關鍵詞,按照從最高到最低的平均適合度排序。表1和表2分別顯示了Twitter和Weibo主題和關鍵詞的分類結果。
在這一輪的分析中,從兩個平臺的主題集合降維提取4項突出的分類主題,確定了4項Twitter主題(按隸屬概率值從高到低排序)“經濟—金融—股票(0.398665361)、科技—投資—供應鏈(0.296178377)、媒體—社會—輿論(0.216263527)、政府—外交—領導者(0.088892736)”,以及4項Weibo主題“政府—外交—領導者(0.362724762)、經濟—金融—股票(0.351972265)、科技—投資—供應鏈(0.192318333)、媒體—社會—輿論(0.09298464)”。表3和表4分別展示了Twitter/Weibo的分類主題、隸屬主題及概率值的排序結果。
中美貿易爭端也被稱為經濟爭端或經濟沖突,因此Twitter用戶將“經濟—金融—股票”(0.398665361)視為重點的關注議題之一,平臺跟帖出現一些特定且較高隸屬概率值的關鍵詞,如“特朗普衰退、特朗普暴跌、價格、貨幣、下跌、特朗普關稅”等;Weibo用戶也聚焦于相同主題(0.351972265),他們集中關注股市(股指、恒生指數、上證綜指)、外匯匯率(人民幣、美元)、經濟走勢(峰值、衰退、下跌)等方面的內容。
Twitter主題“科技—投資—供應鏈”(0.296178377,關鍵詞“談判、貿易談判、亞洲、出口、投資、進口”等)被用戶視為另一個關鍵話題。例如,美國針對華為公司的貿易制裁在社交媒體引發討論,一名網友表示“我從一開始就懷疑@Huawei是一個容易被視為貿易爭端的目標之一,隨著時間的推移,看看這一切將如何展開,將會很有趣”;也有另一位網友提出“盡管打了貿易戰,但中國科技巨頭@Huawei在2019年上半年賺的錢和2018年全年一樣多”。與此相關,Weibo想對應的主題主要涉及“合作、增長、工廠、半導體、產品、芯片”等字眼,隸屬概率值(0.192318333)排序第3位。
0.216263527,包含新聞媒體單位(福克斯新聞、Youtube、金融時報)和用戶的情緒化表達(擔憂、思考、選擇)兩方面的內容。相對而言,Weibo主題“媒體—社會—輿論”(0.09298464)關鍵詞包含媒體單位(人民日報、中央電視臺、胡錫進)、年輕人(青年、中學校長、朋友圈、教授)、情緒表達(關注、圍觀、緊張)3個方面,但是結果顯示,該主題僅排序第4位,且低于前1位(“科技—投資—供應鏈”主題)接近10個百分點,并非Weibo平臺的熱門關注。
此外,概率主題建模實驗也識別了兩平臺更為顯著的差異。“政府—外交—領導者”主題在Weibo平臺中排序第1,概率超過36%(0.362724762),這意味著超過1/3的相關帖子都在關注與“政治領袖”(國家元首、特朗普、劉鶴、總統、參議員)、“政府”(商務部、美國商務部、政權、華盛頓、政府采購)、“外交”(大阪、G7峰會、談判)相關的話題,且實驗中關鍵詞在不同的分類主題下呈現不斷重合的態勢,從側面支持了主題被頻繁討論的結果。有趣的是,Twitter的排序結果與之正好相反(0.088892736,排序第4),即政府話題在Weibo關注度最高,在Twitter關注度最低,呈現完全不同的特征,存在極為顯著的差異。
3.2?時間趨勢分析:社交媒體討論主題熱度
通過主題趨勢分析,探索用戶關注熱點隨著時間推移發生變化的趨勢特征。檢查兩項指標基于一個基本原則,即將Twitter、Weibo上的帖子與同期現實事件對比,主題隨時間趨勢發生變化,并呈現上升或下降趨勢,當單位時間段評論與關注主題相關時呈現上升趨勢,反之則減少。通過這個操作,可以確定熱門主題趨勢與現實世界的共變關系。需要指出的是,如果某項主題類別在坐標內趨近于零,并不能明確為該類別在相應時間段沒有出現任何隸屬關鍵詞,其實際仍然存在少量數據,雖然在圖中未顯示。圖1(a)~(d)描繪了中美貿易爭端時期Twitter和Weibo用戶關注的主題隨著時間發生變化的趨勢圖。其中,橫軸(X軸)表示以3天為1個周期的時間跨度,時間區間與LDA概率主題實驗相同(2019年6月28日—9月30日);縱軸(Y軸)為對應的隸屬概率值,分別在0~0.8之間。
2019年6月28日—29日,中國國家主席習近平與美國總統唐納德·特朗普在日本大阪舉行G20會談,這是在貿易爭端事件后,兩國領導人的首次會面。因此該事件發生之后(7.1—7.7),在兩國社交媒體均引起強烈關注。其中,關于國際貿易與供應鏈相關話題(主題:科技—投資—供應鏈)討論顯著增加,占比接近50%。在兩平臺中也曾出現多個相同含義的關鍵詞,如“出口(對應Export)、增長(對應Expand)、達成協議(對應Deal)、合作(對應Cooperate),關注持續近1個星期。同時,主題趨勢分析映射出此事件的另一個重要的時刻:8月2日,作為“Twitter治國”的代表人物,美國總統特朗普連續發布4條長篇推特,宣布對中國進口商品加征關稅,如圖2所示。這一事件隨即在兩個平臺上引發了大量討論,尤其在“7.29—8.4、8.5—8.11”兩個時間段,引起廣泛的討論和洗牌。Twitter用戶關注“經濟—金融—股票”(關稅、衰退、市場、債券、道瓊斯指數、價格、特朗普衰退、期貨)和“媒體—社會—輿論”(聲音、福克斯新聞、影響、擔憂、措施、觀察、報道、壓力),主要圍繞經濟指數和情緒表達兩方面,關注美國對中國新一輪經濟貿易制裁的影響。
與Twitter映射的相似之處在于,Weibo用戶同樣密切關注美國總統這個決策對我國經濟的潛在影響,體現為“經濟—金融—股票”主題。但與Twitter截然不同之處在于,相較Twitter持續升高的用戶“情緒表達”,Weibo用戶更為關注事件對“中美關系和中美政治”的影響(“政府—外交—領導者”主題),顯示出與Twitter的根本差異。對Weibo用戶來講,無論經濟調控還是國際關系,政府在調控經濟方面作用顯著,因此人們的分析論證往往集中于政府,實驗顯示討論多為積極評價。雖然不能簡單地將網絡輿情與現實世界進行直接比較,但在動態變化的數據集中,主題概率分布隨著文本索引的增加/減少而增加/減少,可以作為實時追蹤現實情況的有效指標。此外,基于這些差異,可以理解不同國家社會背景與網絡輿情信息在用戶表達、價值描繪、輿論引導、治理理念等方面的顯著差異。
4?社會網絡分析:網絡結構與關鍵影響者識別
微博客平臺涉及轉發、關注、提及其他賬戶,為研究構建用戶關系網絡提供基礎。本文選擇在Twitter、Weibo平臺中“@提及”兩個或兩個以上社交媒體賬號為樣本,共獲得有效Twitter賬號206個,Weibo賬號183個,分別測算宏觀和微觀層面的網絡指數。其中,宏觀指數由整體結構和參與者類別組成,以確定賬戶整體特征;微觀指數以參與者本身為關注對象,包含點度中心性和中間中心勢兩指標,將排名靠前的賬號確定為社會網絡的關鍵影響者。本次實驗采用UCINET?6.0測量網絡中心度,繪圖工具為Gephi0.9.2版本。
4.1?網絡整體結構與參與者類別
通過鄰接矩陣可以考察關鍵影響者的合作現狀,根據微博客的節點關系,構建可視化的矩陣結構圖。如圖5所示,網絡節點面積和連接線條數量,與關鍵影響者的影響力成正比。賬號的指數越高則面積越大、線條數量越多。根據圖3(a)顯示,Twitter關鍵影響者網絡呈現顯著的“一超多強”的聯盟格局。作為核心中心點,美國總統特朗普個人Twitter賬號(@realDonalTrump)控制并影響來自周圍的圈層,其周邊緊密圍繞另外4種類型的關鍵參與者賬號,分別為:第一,美國私營媒體官方賬號,包括@CNN、@ABC、@ABC?News、@CBS?News、@FoxNews等,除了美國本土媒體,也包含少部分來自英國、中國的海外媒體,如@金融時報、@路透社、@BBC、@ChinaDaily、@cctvnews、@XHNews,媒體類別占總樣本量的27.64%;第二,美國現任政府工作人員個人賬號,例如美國國務卿@SecPempeo、眾議院議長@SpeakerPelosi、參議員@SenTedcruz、副總統@Mike_Pengce等,少數美國前任政治家和外國領導人如美國前總統@BarackObama、印度總理@narendramodi包含其中;第三,部分企業官方賬號,包含22家美國公司、9家中國公司和4家德國公司,占總樣本的20.60%;最后,網絡中還包含以記者、黨政機構、研究人員等構成的其他群體,但總體僅占樣本量的29.74%。
圖4(a)顯示中美貿易爭端在Weibo平臺的網絡結構圖。總體來看,該結構主要集中為三大板塊:第一,以我國官方媒體為中心層,占微博的43.11%,其中官方媒體占51.39%(包括@人民日報、@人民網、@中央電視臺新聞等),一般媒體占47.22%(包括@QQ新聞、@163新聞),以及一個香港媒體賬號@香港商報;第二,研究人員在Weibo被稱為“專家”(如@政委燦榮、@林毅夫、@戴旭、@邱振海、@宋忠平等),在Weibo平臺顯示出了較強的影響力,賬號占比約為17%;第三,企業賬戶,Weibo平臺包括20家中國公司(如@華為、@小米、@百度、@聯想、@喜馬拉雅)和4家美國公司(如@迪士尼中國、@Facebook工程團隊、@Apple)賬號,占樣本的14.37%。這3種賬號類型居于Weibo網絡結構的中心區域,表明以這些賬號為核心的結構彼此之間相互關聯的數量最多。除此之外,網絡整體結構還包含記者、黨政機構、學術機構等其他類型,總占比約為25.75%。
4.2?網絡中心度測量與關鍵影響者識別
網絡位置中心性是一種量化網絡中核心節點影響力的指標。在合作網絡中,處于中心位置的關鍵影響者占據更重要的位置,具有更強的群體影響力,網絡中心度指標由點度中心性和接近中心性兩部分組成。其中,點度中心性根據每個節點所持有的鏈接數來分配重要性,指數越高其在網絡中的傳播力越大,影響其他節點的數量越多,客觀反映節點在網絡中的影響力和信息傳播能力;接近中心性主要測量節點與網絡中其他所有節點的最短路徑長度的平均值,該值越高其核心程度越高,與其他節點的距離越近。
根據UCINET?6.0對網絡中心性兩項指標的計算統計和綜合排名,如圖5所示,在Twitter網絡聯盟中,特朗普(@realDonaldTrump)在中美貿易爭端的輿論影響力高居第一且超過其后的各項節點兩倍以上,與新聞媒體@CNN、華爾街日報@WSJ成為排名前3的關鍵影響者。同時,結果顯示Twitter社交網絡影響力與私有媒體的活躍程度存在顯著的正相關。前12名中共10位來自美、英的媒體機構(占比83.33%),除了第2、3名之外,還包括美國消費者新聞與商業頻道@CNBC、彭博新聞社@business、微軟全國廣播公司節目@MSNBC、福克斯新聞@FoxNews、@ABC,以及英國媒體路透社@Reuters、金融時報@FinacialTimes、英國廣播公司@BBC等,唯一的非媒體機構為美國共和黨賬號@GOP,綜合排在第6位。在Weibo平臺中,我國兩大官方媒體機構@央視新聞和@人民日報的中心性測量綜合排名前兩位;排名第3、4位的分別是報道國際資訊為主題的媒體@環球時報,以及該機構的總編輯、著名記者@胡錫進。根據對綜合排名第5~12位的關鍵影響者統計,兩位來自官方媒體(還包括@參考消息、@CCTV4),3位私營媒體(@新浪軍事、@新浪財經、@軍情直播間),3位來自研究人員的個人賬號(@宋忠平、@洪琳、@邱振海)。
5?討論和結論
本研究以中美貿易爭端為案例,通過對兩國微博客平臺共計約54?000份數據挖掘,比較探索了用戶在議題關注、時間趨勢及關系結構等互動的特征差異。如今,以社交媒體為平臺挖掘熱門事件情報的作用愈發重要,微博客應用與爬蟲程序、文本挖掘法的深度融合,為理解海內外網絡民意、制定針對性舉措奠定基礎。本研究試圖將傳播學理論結合信息時代的分析技術,以傳統理論為基礎,以海量數據為支撐,解釋和評價來自兩個國家和平臺的民意特征,闡述用戶輿情可能存在的互動偏差,也為探索網絡輿情研究的新視角提供一定的借鑒意義。
首先,本研究明確了兩國社交媒體平臺概率主題存在顯著差異的根本原因在于不同的社會背景、語言表達及傳播體制產生不同的用戶表達框架,進而激發出截然不同甚至相互對立的價值觀念。在以Twitter為代表的英文社交媒體環境下,用戶關注貿易爭端對經濟和科技的影響;而在Weibo中文平臺背景中,評論則以政府與經濟發展為中心。受到政治宣傳和輿論引導的影響,中文媒體風格呈現以政府機構為主導,以集體理性和措施解決為原則的網絡傳播特征;而在英文媒體背景下,受自由意志及個性化表達的媒體環境影響,體現為與用戶現實關注結合,映射對宏觀經濟政策和經濟衰退等問題的直言不諱。雖然框架理論與網絡輿情的實證研究較為缺乏,但是此結論提供了一些有趣的研究證據。
其次,本研究證明了社交媒體的公眾討論,可以有效反映國際事件的發展,并來源于“現實世界”。通過對時間趨勢的觀察分析,話題關注者的主題往往通過集中式的討論凸顯,以一種動態的方式演變,這些結果讓人們能夠更好地理解用戶在中美貿易爭端前后的演變。同時,重要或有爭議的事件在網絡傳播中發揮至關重要的作用,例如,G20峰會和特朗普總統的4條推文,很好地解釋了網絡轟動效應的根源,也表明重要人物在緩解或擴大潛在問題爭端中扮演了特殊角色。此外,本研究也驗證了所提出的“主題—時間趨勢模型”,結合適當的可視化表達,能夠以一種清晰簡約的方式關注復雜的國際問題。
最后,本研究描繪了社交媒體平臺關鍵影響者網絡與屬性類別的差異。一方面,網絡結構展示兩平臺總體是具包容性的,一小部分賬號處于網絡的邊緣被隔離在外;另一方面,話題討論中占主導地位的群體則被少數個體所壟斷,兩平臺意見領袖屬性的差異也較為顯著。其中,Twitter主要通過美國政治領袖以及若干私營媒體賬號所發布的信息,帶動西方世界的輿論影響;而在Weibo網絡聯盟中,官方媒體、私營媒體和研究人員主要承擔政府“發聲器”的角色,該平臺沒有直接出現政治領袖的個人賬號,而是由研究人員以專家的身份代之,引導網絡輿論并發揮關鍵影響者的作用。
與此同時,本研究仍然存在一些局限性,也為今后的研究提供可以改進的方向。一方面,本研究僅關注英文和中文的微博客內容,無法充分驗證其他非英語或漢語的平臺,因此,未來相關研究可以持續擴大語種的使用范圍,評估社交媒體在更多國家和地區的研究價值;另一方面,未來研究可以考慮將文本情感分析擴展至分析框架,考察網絡輿情的情感色彩,以及集體情緒隨時間和事件產生變化的規律,上述問題有待進一步探討和完善。
參考文獻
[1]Jennifer?B?Unger.The?Role?of?Social?Networks?and?Media?Receptivity?in?Predicting?Age?of?Smoking?Initiation:A?Proportional?Hazards?Model?of?Risk?and?Protective?Factors[J].Addictive?Behaviors,1999,24(3):371-381.
[2]Herold,David?K.Cultural?Politics?and?Political?Culture?of?Web?2.0?in?Asia[J].Knowledge,Technology?&?Policy,2009,22(2):89-94.
[3]李曉靜.社交媒體用戶的信息加工與信任判斷——基于眼動追蹤的實驗研究[J].新聞與傳播研究,2017,24(10):49-67,127-128.
[4]Castells?M.Communication,Power?and?Counter-power?in?the?Network?Society[J].International?Journal?of?Communication,2007,1(1):29.
[5]Parmelee,John?H,Shannon?L?Bichard.Politics?and?the?Twitter?Revolution:How?Tweets?Influence?the?Relationship?Between?Political?Leaders?and?the?Public[M].Lexington?Books,2011.
[6]Kim?S,Lee?J.E-participation,Transparency,and?Trust?in?Local?Government[J].Public?Administration?Review,2012,72(6):819-828.
[7]Barnett,George?A.Encyclopedia?of?Social?Networks[M].Sage?Publications,2011.
[8]Naaman?M,Boase?J,Lai?C?H.Is?it?Really?About?Me?Message?Content?in?Social?Awareness?Streams[C]//Proceedings?of?the?2010?ACM?Conference?on?Computer?Supported?Cooperative?Work,2010:189-192.
[9]Hughes?A?L,Palen?L.Twitter?Adoption?and?Use?in?Mass?Convergence?and?Emergency?Events[J].International?Journal?of?Emergency?Management,2009,6(3-4):248-260.
[10]Kwak?H,Lee?C,Park?H,et?al.What?is?Twitter,a?Social?Network?or?a?News?Media?[C]//Proceedings?of?the?19th?International?Conference?on?World?Wide?Web,2010:591-600.
[11]Goffman?E.Frame?Analysis:An?Essay?on?the?Organization?of?Experience[M].Boston:Northeastern?University?Press,1986.
[12]朱天,張誠.框架理論視域下互聯網圈子的傳播結構認知[J].現代傳播(中國傳媒大學學報),2015,37(10):128-132.
[13]Binder?M,Childers?M,Johnson?N.Campaigns?and?the?Mitigation?of?Framing?Effects?on?Voting?Behavior:A?Natural?and?Field?Experiment[J].Political?Behavior,2015,37(3):703-722.
[14]潘霽,劉暉.公共空間還是減壓閥?“北大雕像戴口罩”微博討論中的歸因、沖突與情感表達[J].國際新聞界,2014,36(11):19-33.
[15]Katz?E,Lazarsfeld?P?F.The?Part?Played?By?People?in?the?Flow?of?Mass?Communications[J].Personal?Influence,1955:31-42.
[16]Dubois?E,Gaffney?D.The?Multiple?Facets?of?Influence:Identifying?Political?Influentials?and?Opinion?Leaders?on?Twitter[J].American?Behavioral?Scientist,2014,58(10):1260-1277.
[17]Swanson?D?R,Smalheiser?N?R,Bookstein?A.Information?Discovery?from?Complementary?Literatures:Categorizing?Viruses?as?Potential?Weapons[J].Journal?of?the?American?Society?for?Information?Science?and?Technology,2001,52(10):797-812.
[18]Bruza,et?al.Literature-based?Discovery[M].Springer?Science?&?Business?Media,2008.
[19]Musto?C,Semeraro?G,Lops?P,et?al.CrowdPulse:A?Framework?for?Real-time?Semantic?Analysis?of?Social?Streams[J].Information?Systems,2015,54:127-146.
[20]楊奕,張毅,李梅,等.基于LDA模型的公眾反饋意見采納研究——共享單車政策修訂與數據挖掘的對比分析[J].情報科學,2019,37(1):86-93.
[21]郝媛媛,葉強,李一軍.基于影評數據的在線評論有用性影響因素研究[J].管理科學學報,2010,13(8):78-88,96.
[22]于江,黨延忠.用信息可視化方法分析科研領域發展狀況[J].科學學與科學技術管理,2009,30(6):10-14.
[23]Javed?N,Muralidhara?B.Framework?for?Participative?and?Collaborative?Governance?Using?Social?Media?Mining?Techniques[J].International?Journal?of?Computer?Applications,2015,123(8).
[24]Reddick?C?G,Chatfield?A?T,Ojo?A.A?Social?Media?Text?Analytics?Framework?for?Double-loop?Learning?for?Citizen-centric?Public?Services:A?Case?Study?of?a?Local?Government?Facebook?Use[J].Government?Information?Quarterly,2017,34(1):110-125.
[25]Doran?D,Gokhale?S?S,Dagnino?A.Discovering?Perceptions?in?Online?Social?Media:A?Probabilistic?Approach[J].International?Journal?of?Software?Engineering?and?Knowledge?Engineering,2014,24(9):1273-1299.
[26]Lee?M?J,Chun?J?W.Reading?Others?Comments?and?Public?Opinion?Poll?Results?on?Social?Media:Social?Judgment?and?Spiral?of?Empowerment[J].Computers?in?Human?Behavior,2016,65:479-487.
[27]Metzger?M?J,Docter?S.Public?Opinion?and?Policy?Initiatives?for?Online?Privacy?Protection[J].Journal?of?Broadcasting?&?Electronic?Media,2003,47(3):350-374.
[28]Imran-Daud?M,Sanchez?D,Viejo?A.Privacy-driven?Access?Control?in?Social?Networks?By?Means?of?Automatic?Semantic?Annotation[J].Computer?Communications,2016,76:12-25.
[29]Murthy?K?V?B.US-China?Trade?Disputes:Studying?Long-Term?Trade?Patterns[J].Manag?Econ?Res?J,2019,5(2019):10406.
[30]Hughes?L,Meckling?J.The?Politics?of?Renewable?Energy?Trade:The?US-China?Solar?Dispute[J].Energy?Policy,2017,105:256-262.
[31]Gompert?D?C,Cevallos?A?S,Garafola?C?L.War?with?China:Thinking?Through?the?Unthinkable[M].Rand?Corporation,2016.
[32]Ikenson?D?J.Cybersecurity?or?Protectionism?Defusing?the?Most?Volatile?Issue?in?the?US-China?Relationship[J].Defusing?the?Most?Volatile?Issue?in?the?US-China?Relationship.Cato?Institute?Policy?Analysis,2017,(815):1-16.
[33]Akhtar?S?I,Morrison?W?M.Digital?Trade?and?US?Trade?Policy[M].Congressional?Research?Service,2017.
[34]Schell?O,Shirk?S?L.US?Policy?Toward?China:Recommendations?for?a?New?Administration:Task?Force?Report[M].Asia?Society?Center?on?US-China?Relations,2017.
[35]Blei?D?M,Ng?A?Y,Jordan?M?I.Latent?Dirichlet?Allocation[J].Journal?of?Machine?Learning?Research,2003,3(1):993-1022.
[36]張毅,楊奕,鄧雯.政策與部門視角下中國網絡空間治理——基于LDA和SNA的大數據分析[J].北京理工大學學報:社會科學版,2019,21(2):127-136.
(責任編輯:孫國雷)