張鑫蕊,張海濤,2,3,欒宇,張春龍
(1. 吉林大學商學與管理學院,長春 130012;2. 吉林大學信息資源研究中心,長春 130012;3. 吉林大學國家發展與安全研究院,長春 130012)
當今世界正值百年未有之大變局,大數據、人工智能、云計算、5G、擴展現實、數字孿生、物聯網等新一代數字技術的運用和集成創新在告知我們正處于人機協同、跨界融合、共融共創的數智時代。與此同時,始料未及的新冠肺炎疫情使得這個時代越發變幻莫測和充滿挑戰,這要求我們系統思考,洞察現狀;主動求變,彰顯價值;精益創新,敏捷改進;未雨綢繆,預見未來。時間、資源、公眾信心是戰勝疫情的關鍵,因此,如何通過科學決策提高應急管理效率、協調統籌應急管理工作、積極應對信息疫情[1]是目前亟須關注的問題。這不僅需要政府等相關專業部門采取緊急措施,更要發揮科技創新的關鍵和中堅作用,體現數智化治理的優勢,以數智技術解析信息流動,從而推進全社會的協同防控。
《中華人民共和國突發事件應對法》中將突發事件定義為“突然發生,造成或可能造成嚴重社會危害,需要采取應急處置措施予以應對的自然災害、事故災害、公共衛生事件和社會安全事件”,其事發的突然性、危害的復雜性和治理的綜合性等特點要求我們以全面且科學的視角去看待每個突發事件的發展脈絡。2022年7月12日,世界衛生組織發布有關第12次新冠肺炎突發事件委員會會議的聲明指出,新冠肺炎疫情繼續構成“國際關注的突發公共衛生事件”[2],其本身所造成的信息封閉引發了國際范圍內的“信息疫情”[3],且具備傳播的快速性、信息的過載性、關注的大眾性、涉略的廣泛性、內容的動態性、空間的跨域性、媒體的社交性、污名的歧視性、真偽的難辨性以及效果的危害性等特征[4],對全球公共衛生、公共行動、社會凝聚力和整個政治格局都具有嚴重威脅[5],形成原因涉及宏觀的社會和歷史環境、中觀的群體互動和微觀的個體心理和個體特征[6]。數智時代新媒體環境下的信息傳播打破時空界限、突破虛實融合,即時性、共享性等特征愈加顯著,交互性、應用性和實踐性較強的多主體協作網絡[7]成為應對信息疫情的重要基礎;信息是主體間協作溝通的樞紐,也正是主體間信息行為的協同交互促進了信息的高效傳遞,從而形成1+1>2的效應,即協同效應[8];信息流動的方式、效率、深度和廣度均會影響協同效應的產生和發展。
目前信息傳播相關研究主要基于SIR(suscepti‐ble, infective, recovered)、SEIR(susceptible, exposed,infective, recovered)、SIRS(susceptible, infective, re‐covered, susceptible)等傳染病模型開展,在研究個體屬性、個體的相關延伸要素以及局部的動態發展變化等角度存在局限性,一定程度上忽略了信息傳播過程中人的行為占據主導地位[9]。與此同時,超網絡研究通常結合工具計算分析網絡上的流量、時間等變量來描述和表示層次網絡間的作用關系與影響程度,相關實證分析主題涉及商界智庫、知識服務、網絡輿情、應急管理、學科交叉、科研合作、交通運輸、經濟管理等。例如,以新浪微博的商界智庫信息作為數據源對比分析移動端與非移動端智庫的信息傳播網絡結構特征異同[10],以超網絡為基礎的用戶創新知識集成模型構建[11],微博輿情中關鍵節點的挖掘分析[12],突發事件信息傳播中的網絡謠言傳播模型[13],突發事件救援中的區域應急調度模型[14],以異構網絡提高學科交叉主題識別的準確度[15],以基于超圖的算法SCRH(scientific collabo‐ration recommendation based on hypergraph)推薦科研合作[16],展示多層交通樞紐以研究潛在樞紐的連接貢獻[17],有效區分初創能力水平以激勵初創企業[18],基于超網絡和在線評論的產品競爭力分析[19]等。可以看出,當前研究缺少面向社交媒體環境中的突發事件場景、契合突發事件特征、體現全局性的、以主體協同為基礎的信息協同網絡結構。因此,本研究以超網絡視角探究社交媒體環境下突發事件信息協同全景,在信息主體協同合作基礎上,以各子網之間的關聯耦合形成以信息流動作為內在邏輯的系統性、緊密性、全面性、普適性的突發事件信息協同超網絡,剖析協同過程的動態性和演化性,識別核心信息主體、關鍵信息鏈路,高效整合信息資源,掌握與分析事件現狀與走向趨勢,推進信息價值共創,由此提高社會凝聚力和公眾信任度,增強突發事件應急處置的可操作性、科學性和實用性;應用情報智慧[20]協同突發事件決策,預防和應對信息疫情問題,從而實現常態化精準管控和科學治理,為應急管理工作數字化、智能化、智慧化獻計獻策。
(1)突發事件信息協同超網絡
哲學視角下,宇宙中各事物之間以及事物內部各要素之間普遍聯系且相互影響、相互制約和相互作用,突發事件的演變通常由各種要素相互耦合疊加交織而成,其背后往往遵循著一定的內在規律和運行機理[21];信息協同是所涉及信息主體在特定時間內,以信息技術為手段,通過與信息環境交互、共享信息資源,獲得協同效應的過程[8];超網絡作為高于而又超于現存網絡的網絡[22],具備以下一種或幾種特征:多層性、多級性、多屬性(或多準則)、流量的多維性、擁塞性、協調性、嵌套性等,能夠將復雜網絡中要素的相互作用和相互影響較為完整地描述和刻畫出來,揭示同構網絡的多重關系和異構網絡的關聯關系[23]。
社交媒體環境下,突發事件信息協同體現多元主體參與、信息流動性、協同效應等特征[8],是信息主體間根據自身信息需求主動展開信息交互行為的過程,在特定時間和環境下,主要涉及信息主體、信息文本、信息基因三個要素。信息主體是指在突發事件中公布和接收信息的用戶主體,信息文本是信息主體在社交媒體中所發布的文本內容,信息基因是從信息主體所發布文本內容中提煉出的關鍵詞語。與常規的同質網絡相比,超網絡能夠恰當融合多種類型網絡,體現兩種及兩種以上類型網絡之間的復雜性,能夠更好地反映突發事件信息協同中信息主體間協同關系,信息間聯動關系,主體與信息文本之間、信息文本與信息基因之間的匹配關聯等;在研究個體屬性和掌控局部動態變化的同時,避免了因研究單一網絡而忽略相關聯的其他子網所涉及的關鍵因素,填補了超網絡理論和信息協同相結合在突發事件場景中的應用空白,為目前突發事件的用戶行為、態勢感知[24]、情感圖譜[25]、情緒演化[26]、風險預測、協同機制[27]、協同決策[28]、應急能力評價等復雜問題的后續研究提供新的思維模式。
綜上,本研究以要素-關系-邏輯為基礎框架,依據知識協同主題與超網絡理論的有機融合[29],闡述突發事件信息協同超網絡的構建方法,從“點、線、面、體”全方位剖析,認為社交媒體環境下,突發事件場景中的信息協同超網絡主要是由信息主體、信息文本、信息基因三要素關聯耦合的多層級網絡結構,信息主體與信息文本、信息主體與信息基因、信息文本與信息基因之間均存在復雜的對應關系,正是這種縱向層級關系將三種網絡有序銜接,形成了主體、文本、基因間協同關聯的系統整體,由此探究子網間更深層次、應用型的問題,形成1+1>2的協同效應。
(2)突發事件信息協同超網絡概念模型
社交媒體環境下,突發事件的信息協同超網絡模型主要包括主體協同網絡、信息文本網絡、信息基因網絡三類子網絡,以及這三類子網絡互相之間的映射關系,涉及節點、邊、權重三項要素,以EICSN(information collaboration super network mod‐el for emergency)表示。定義社交媒體環境下突發事件信息協同超網絡模型為
其中,P={S,T,G}為超網絡的節點集合,S={s1,s2,…,sn}為社交媒體平臺中事件所涉及的信息主體集合,T={t1,t2,…,tn}為信息文本集合,G={g1,g2,…,gn}為信息基因集合;E為超網絡的邊的集合,由所有子網絡邊的集合和所有子網絡之間的映射關系集合構成,分別是主體協同子網絡的邊Es-s、信息文本子網絡的邊Et-t、信息基因子網絡的邊Eg-g,以及主體協同子網絡與信息文本子網絡之間的映射ES-T、信息文本子網絡與信息基因子網絡之間的映射ET-G、主體協同子網絡與信息基因子網絡之間的映射ES-G,即
W為超網絡權重的集合,一方面,包括各個子網絡邊權重的集合,即主體協同網絡邊的權重為W(ES-S),信息文本網絡邊的權重為W(ET-T),信息基因網絡邊的權重為W(EG-G);另一方面,包括信息主體節點的權重W(S),信息文本的權重W(T),信息基因的權重W(G);即
綜上所述,社交媒體環境下突發事件信息協同超網絡模型為
如圖1所示,上述概念模型可以清晰表達基于主體之間的協同交互作用的信息協同過程。通過信息主體與信息文本之間的連接,對應信息主體與文本觀點;通過主體協同子網與信息基因子網的連接體現信息主體對信息基因的貢獻度,以主體所涉及基因個數識別核心主體;通過信息文本子網與信息基因子網絡的連接,定位信息基因的歸屬文本。

圖1 社交媒體環境下突發事件信息協同超網絡概念模型
2.1.1 主體協同網絡建模
主體協同網絡主要研究社交媒體環境下多元信息主體之間協同關系演變的網絡,以各個信息主體作為節點,以信息主體之間的關聯關系作為邊,建立主體協同網絡。該子網絡能夠研究主體之間的協同關系和個體屬性特征,如核心主體的特征分析、群體聚類分析等。主體協同網絡模型表示為
其中,有限集合S={s1,s2,…,sn}是主體協同網絡中的節點集合,對所涉及的信息主體根據社交媒體平臺中的認證信息進行分類,信息主體的篩選是以信息的發布、主體間的協同關聯為準,以是否保留有發布帖子、轉發帖子等行為作為依據。
信息主體節點的權重集合為
其中,W(S)={ws1,ws2,…,wsn}表示信息主體節點權重集合,是指該話題下信息主體的核心程度,以信息主體所涉及的信息基因數量為標準。
主體協同網絡中邊的集合為
其中,若θ(si,sj)=0,則兩個信息主體之間不存在協同關系;若θ(si,sj)=1,則兩個信息主體之間存在協同關系,例如,二者在同一話題下有信息發布行為,包括評論、轉發行為等。
主體協同網絡中邊的權重為
式(8)表示信息主體間的協同程度,例如,信息主體在同一話題下均有信息發布行為則界定為一次協同,主體之間有轉發行為等也界定為一次協同。
2.1.2 信息文本網絡建模
信息文本是信息主體在社交媒體中所發布的文本內容,該文本內容與信息主體之間存在對應關系,由于文本內容存在相同情況以及信息主體發布多條文本的情況,可能存在一對一、一對多、多對一等關系;同時,信息基因是基于信息文本做進一步處理提取得到的,由于存在信息基因相同的情況,信息文本和信息基因之間的匹配關系同樣可能存在一對一、一對多,多對一等關系。綜上,信息文本在信息主體和信息基因之間體現承上啟下的關鍵作用。現有研究主要是對各個信息文本之間的相似度進行比較分析,該項工作對解釋信息主體之間的協同演化過程助力不足,且所涉及工作復雜煩瑣,因此,信息協同超網絡的研究焦點不應僅限于信息文本內容,而是應以信息文本為作為橋梁重點研究信息文本這一層網絡與主體協同網絡、信息基因網絡相互銜接的縱向關系,體現層次分明的關聯關系。與此同時,該子網絡還可以分析文本之間的協同關系及其延伸要素,如信息文本的聚類分析、主題提取及其情感傾向性分析等。
將信息主體發布的文本內容定義為信息文本T,則信息文本網絡模型表示為
其中,有限集合T={t1,t2,…,tn}是信息文本網絡中的節點,對所涉及的信息文本根據社交媒體平臺中的原創帖和轉發帖進行分類,信息文本的篩選以信息文本間的轉發行為作為依據。
信息文本節點的權重集合為
其中,W(T)={wt1,wt2,…,wtn}表示信息文本節點權重,是指該話題下信息文本的核心程度,以點贊數、評論數和轉發數的均值計算信息文本的得分。
信息文本網絡中邊的集合為
其中,若θ(ti,tj)=0,則兩個信息文本之間不存在協同關系;若θ(ti,tj)=1,則兩個信息文本之間存在協同關系,如存在帖子之間的轉發行為。信息主體發布帖子,其他信息主體參與轉發,產生新的信息,體現了主體協同基礎上的信息協同。
信息文本網絡中邊的權重為
式(12)表示信息文本間的協同程度,例如,若信息文本之間有轉發關系,則界定為一次協同。
2.1.3 信息基因網絡建模
信息基因是從信息主體所發布的信息文本內容中所提煉出的關鍵性詞語,包括時間、地點、人物、話題等方面的詮釋。通過對信息基因的提取和凝練,可以分析得出該話題下信息主體討論的聚焦點及話題內容的演變方向,如以時間為變量生成演化脈絡來研究事件發展趨勢等。這一子網絡的節點由從信息文本中提取凝練并篩選得到的有效關鍵詞組成,由于事件發生的突發性和影響力,該子網關鍵詞語適合以出現頻次和重要性程度等作為篩選條件,并以有效關鍵詞之間的共現關系作為邊,由此建立信息基因網絡模型,并定義為
信息基因來源于信息文本分詞集合,以G'來表示信息基因的初始集合,η(gi,tj)=1表示gi是tj的信息基因,否則,η(gi,tj)=0。信息基因出現的頻次以f(gi)表示,其計算公式為
首先,根據信息基因出現頻次的具體排序f(gi)對初始集合G'進行篩選,目的是將出現頻率低的詞語,以及出現頻率較高但其信息含義較低的詞語篩選去除。可得到信息基因節點的集合G,即
其中,節點集合G={g1,g2,…,gn}是指信息基因子網絡中不同基因節點的集合;信息基因節點的初步篩選條件以閾值f0表示,該閾值的設定主要依據所獲取數據的實際規模。
信息基因節點的權重集合為
其中,節點權重W(G)={wg1,wg2,…,wgn}是指該話題下信息基因的重要性程度,通過信息基因的出現頻次f(gi)決定。
信息基因網絡中邊的集合為
邊表示不同信息基因之間的共現關系,代表主體在信息發布中產生的信息協同情況。w(gi,gj)表示信息基因間的共現頻次;w0是共現頻次的閾值,當w0>2時,表示兩種不同的信息基因之間存在相連的邊,能夠體現關聯關系的強弱。
信息基因網絡中邊的權重為
式(18)代表信息基因間關聯程度,由信息基因間共現頻次w(gi,gj)決定,以邊的粗細程度表示。
2.2.1 主體協同網絡與信息文本網絡
主體協同網絡與信息文本網絡的映射關系,表示信息主體之間在社交媒體平臺中協同交互基礎上的信息發布和傳播。根據上文子網絡節點的相關表示,將信息主體與信息文本之間的映射關系集合定義為
其中,α(si,tj)=1表示信息主體si發布了信息文本tj,一般情況下,信息主體與信息文本之間可能是一對一、一對多和多對一的關系,而主體數量和文本數量之間不存在直接的比較關系。
定義信息主體到信息文本之間的映射為
式(20)表示信息主體si發布的信息文本t,數量為1,2…,n。
2.2.2 信息文本網絡與信息基因網絡
由于信息基因產生于信息文本中,二者之間存在包含、對應關系,信息文本的核心思想可由多個信息基因組合表達。通過信息文本子網和信息基因子網的進一步關聯,可以體現出不同信息文本的基因組成,而不同信息文本可能體現相同的核心思想,同一信息基因可能出現在不同的信息文本中,體現信息基因的延續性。因此,將信息文本子網與信息基因子網之間的映射關系集合表達為
其中,β(ti,gj)=1,是指在信息文本ti中,分析提煉得到信息基因gj。
體現映射關系的邊的權重為
式(22)是指在信息文本ti網絡中信息基因gj出現的頻次。
信息文本與信息基因之間的映射關系,可以用兩種方式進行表示。其一是同一信息文本中所包含的信息基因,即
其二是某一信息基因包含在哪些信息文本中,即
2.2.3 主體協同網絡與信息基因網絡
信息主體是信息文本的發布主體,信息基因是信息文本中關鍵詞語的體現。通過信息文本這一橋梁,可以將信息主體與信息基因之間的映射關系集合表示為
其中,當γ(si,gj)=1時,表示信息主體si發布的帖子中含有信息基因gj,即信息主體發布的信息文本中包含有信息基因gj。
關系權重定義為
式(26)表示在主體協同網絡中,某信息主體對信息基因gj的貢獻度。
信息主體與信息基因之間的映射關系可以采用兩種方式進行表示。其一是某一信息主體si發布信息文本的過程中,主觀進行信息組織,表達個人觀點,其中包含的信息基因數量為
其二是若某一信息基因gj存在于多個信息文本中,則其對應的信息主體數量為
EICSN模型需要結合實際案例來展示模型的可視化效果并進行結果分析,整個實證分析過程分為以下五個步驟,具體邏輯如圖2所示。

圖2 實證分析邏輯
Step1.數據采集,數據內容包括文本內容、作者信息、發表時間、分類信息,以及信息的點贊、評論、轉發數量等。
Step2.對數據進行整理清洗,篩選可用數據,去除無效文本,根據數據規模設定基礎閾值。
Step3.數據編碼與提取:對信息主體、信息文本及信息基因集合統一編碼,建立信息主體集合S和信息文本集合T,進而對信息文本進行分詞篩選,提取關鍵詞,建立信息基因集合G。
Step4.子網絡構建:基于信息主體間協同關系建立主體協同子網絡NS,基于信息文本間信息關聯關系建立信息文本子網絡NT,基于信息基因間的協同共現關系建立信息基因子網絡NG。
Step5.超網絡構建:根據子網絡間映射關系,建立社交媒體環境下突發事件信息協同超網絡,并根據數據結果和可視化圖譜做進一步分析,如核心主體、核心文本和核心基因的識別。
數據來源為社交媒體微博平臺,以吉林農業科技學院新冠肺炎疫情這一突發公共衛生事件為例,采集時間為2022年6月22日。由于事件的突發性和話題討論的時間聚集性,以“吉林農業科技學院”作為話題關鍵詞進行采集,所采集的信息文本發布的起始時間為2022年2月24日,終止時間為2022年4月23日,共計5515條。信息文本在實際數據處理過程中需進行篩選和清洗,去除不相關文本,經過篩選最終得到5264條數據,全程使用Python和Excel進行數據處理和關系構建,使用Gephi繪制圖譜。
3.3.1 超網絡圖譜
根據數據處理結果構建超網絡圖譜,如圖3所示,包括信息主體節點、信息文本節點、信息基因節點,節點面積大小表示節點權重大小,邊的粗細程度表示不同節點間關系強度,即邊的權重。

圖3 超網絡圖譜
為使呈現效果清晰化,對基礎數據做進一步處理后,構建部分超網絡圖譜,如圖4所示。圖譜中三類節點在以著色程度進行區分的基礎上,信息主體節點由編碼s表示,信息文本節點由t表示,信息基因以中文文本形式表示。

圖4 部分超網絡圖譜
3.3.2 主體-基因關聯分析
信息協同超網絡的構建過程中,以信息文本作為橋梁進行信息主體和信息基因之間的互聯,由此得到信息主體-信息基因圖譜,如圖5所示。其中,編碼s表示主體節點,中文文本表示基因節點,節點面積大小表示節點權重大小,邊的粗細程度表示不同節點間關系強度,即邊的權重。可以清晰地觀測到信息主體與信息基因之間的邊,即映射關系;單個主體節點可連接多個基因,單個基因節點也可以連接多個主體節點,根據二者之間的關聯關系可進一步做突發事件信息協同過程中核心主體節點的識別。

圖5 信息主體-信息基因圖譜(部分)
3.3.3 核心信息主體識別
信息協同是事件話題下所有多元信息主體共同參與的過程,但少數核心信息主體具有較高的信息基因貢獻度,在發布信息的過程中起到引領事件話題方向的作用;綜合考量數據結果的精確度,選擇通過對信息基因的進一步篩選來識別核心信息主體[30],以核心信息主體所涉及的信息基因個數為權重,以主體間協同關系為邊,兼顧數據規模和圖譜效果,僅呈現部分結果。其中節點的不同著色程度表示信息主體的認證信息,包括官方認證、個人認證、達人認證以及無認證信息。所得核心信息主體圖譜(部分)如圖6所示,核心信息主體列表(部分)如表1所示。分析圖譜和列表的結果可以發現,此次突發事件信息協同過程中,兩個官方認證的信息主體占據主導地位,個別個人認證和個別無認證信息的信息主體均可在突發事件信息協同過程中發揮作用,二者間作用區別并不顯著。

表1 核心信息主體列表(部分)

圖6 核心信息主體圖譜(部分)
3.3.4 核心信息文本識別
信息文本網絡作為信息主體和信息基因互聯的紐帶,在整個信息協同網絡的作用舉足輕重,而且信息文本內容豐富,除了本研究的關鍵詞提取,還可以提取文本主題,分析情感傾向性,進而構建主體的情感圖譜,對突發事件的輿情動態演化分析和風險預測等研究工作均有積極推進作用。因此,識別核心文本是整個結果分析中必不可少的環節,文本節點的面積體現了節點權重,以文本間的協同關系為邊,兼顧數據規模和圖譜效果,僅呈現部分結果。其中,節點的不同著色程度表示信息文本的分類信息,分為原創帖和轉發帖,所得核心信息文本圖譜(部分)如圖7所示,核心信息文本列表(部分)如表2所示,根據圖譜和列表結果分析得到,不僅原創帖的核心程度排名靠前,轉發帖的核心程度也較強,其還可引起二次轉發行為。

表2 核心信息文本列表(部分)

圖7 核心信息文本圖譜(部分)
3.3.5 核心信息基因識別
通過對核心信息基因的識別,可以分析得出該話題下多元信息主體高度聚焦的關鍵點。以關鍵詞的出現頻次為節點權重,權重的大小表現為節點面積的大小;以基因間的共現關系為邊,設置共現頻次閾值大于等于100,邊的粗細程度表示共現程度;節點著色程度與出現頻次一一對應,由此呈現的核心信息基因圖譜如圖8所示,核心信息基因表格列表(部分)如表3所示。

表3 核心信息基因列表(部分)

圖8 核心信息基因圖譜(部分)
突發事件的應急決策管理需兼顧時間的緊迫性和結論的精確性,與此同時,事件的突發性、危害性、廣泛性,以及海量信息的依附性、時效性、傳遞性、共享性也給決策者帶來巨大的挑戰。因此,立足于數智時代,情報學研究者需要與時俱進,充分利用新一代信息技術,彰顯信息的協同價值,服務于情報決策工作,提升協同治理效率。然而現有研究主要從單一層面解讀突發事件信息協同中的研究問題,僅停留在“點、線、面”的階段,并未將其看作要素-關系-邏輯三位一體的系統整體。
本研究以超網絡視角深入探究突發事件中基于主體協同的信息協同過程,以主體間協同關系形成主體協同網絡,以文本之間的協同演化形成信息文本網絡,以關鍵詞之間的共現關系形成信息基因網絡,挖掘三類網絡之間層次分明的縱向動態映射關系,明晰多要素之間相互影響、相互作用而產生的邏輯關聯,進一步解析信息協同的內在規律,構建突發事件信息協同超網絡模型,并以實際案例進行可視化分析驗證,實現了對信息主體及其發布信息文本的深入認識,識別有協同價值的核心信息基因,進而挖掘核心主體,剖析多元主體間信息協同的動態演化過程,最終構建了深層次、全景性、貫通型的信息協同網絡關系,為突發事件的應急情報決策工作提供了一種網絡構建方法,從而能夠更加全面、系統地解讀突發事件的演變動因及機理。后續研究將重點圍繞各子網絡及其關聯關系體現超網絡的應用價值,探索和驗證信息協同超網絡的普適性和應用性,全面研究各層級網絡及整體網絡所表現的動力學機制,進一步構建以多元主體為中心,涉及多要素的需求-數據-創新-目標四位一體共同驅動的信息協同治理體系。