杜楊沁
(中共上海市委黨校 [行政學院]公共管理教研部,上海 200233)
新媒體環境下信息傳遞使得輿情表達更加快捷、多元,方式互動。網絡輿情具有直接性、突發性、偏差性的特點,社會管理者應當了然于心。對現實中出現的各種網絡輿論,社會管理者應能做出及時反饋,防微杜漸。因此,以現代信息技術為工具對突發性事件進行監控和預警,并對網絡輿情進行引導意義重大。
孔建華[1]、劉繼[2]等、盛明科[3]等總結認為,近年來國內的網絡輿情研究大致可以分為基礎技術、支撐技術和應用指標體系研究等幾個方向,具體包括:第一,網絡輿情采集與提取技術(動態網頁數據的松散結構化信息抽取與集成技術等);第二,網絡輿情話題發現與追蹤技術(特征聚類的話題發現技術等);第三,網絡輿情傾向性分析技術(通過判斷網絡環境下傾向性特征詞的特點和類型,構建面向互聯網的傾向性語氣詞典等技術);第四,多文檔自動文摘技術(網絡輿情信息自動生成報文、瀏覽器瀏覽和信息檢索技術);第五,網絡輿情的引導和控制研究(預警指標、監控模型、分析模型等)。
通過我國網絡輿情相關領域的單體化技術研究綜述可以看出:從網絡輿情信息的采集與提取,到話題的發現與追蹤、到態度傾向性分析,到多文檔自動摘要的生成,再到網絡輿情的監控、預警模型的構建,國內網絡輿情安全評估的研究發展迅速。但是,它們大多都是從純技術角度出發,缺乏“輿情”這一社會層面在技術層面上的體現。本文將提出一種基于事件的多維社會網絡結構網絡輿情分析方法,從現實方法上實現對網絡輿情數據信息的分析、利用,進而為網絡輿情的管理和控制提供智能決策依據。
基于事件的統計分析建模方法已經廣泛地在商業決策、智能分析上使用。總結現有的網絡輿情研究廣泛采用的基于事件的分析方法,大致可以分為枚舉分析法、流程分解法、匯總計算法等幾種。
枚舉分析法是最基礎、最簡單的基于事件的網絡輿情分析方法。該方法通過對輿情事件演化過程的跟蹤,以明細的方式記錄了事件發生的要素、重要過程和結果,其表示方式如圖1所示:
A代表事件的主體;Ei代表事件發生的要素i,包括時間要素T、地域要素G、主題要素C等。Di代表事件發生過程中產生的動作。各種統計日志屬于枚舉分析法,例如,針對某個突發性網絡事件形成的網絡訪問和網民參與討論日志,包括突發性網絡事件產生的源頭帖子信息記錄、參與討論的信息記錄、該事件在各大網站、論壇轉載擴散的信息等。枚舉分析模型所有的信息均產生于事件演化的過程中,信息并未進行加工處理,能真實清晰地還原出每個具體事件的全過程。然而,該模型的缺點也十分明顯:第一,存儲量大,當數據量很大時,無法快速形成有效的統計決策數據;第二,冗余信息過多,對統計決策結果形成干擾;第三,缺乏歸納,所有結論僅適用于某個個體,缺乏統計決策依據。綜合而言,枚舉分析法僅適用于網絡輿情分析的初級階段,即輿情的采集和匯總。目前網絡輿情的采集和匯總技術研究大多依據枚舉分析法進行預處理和歸類。
流程分解法是一種局部分析法。它將輿情事件的演化過程按照時間順序或主題分類形成若干演化體,并針對每個演化體形成評價指標。流程分解法同樣也包括事件主體A、事件發生的要素Ei 和演化過程中的動作Di。此外,整個事件被分解成若干個演化體(虛線框的組合),每個演化體都形成階段性評價指標體系Xi,為輿情事件監控和網絡輿情預警提供依據,具體的表示方式如圖2所示。
錢愛兵[4]提出了一種基于主題的網絡輿情分析模型。他以時間作為主軸,以網絡輿情主題為事件主體,選用了某一時間段網絡輿情主題的熱點、網絡輿情主題下輿情信息的焦點和網絡輿情主題的拐點為階段性指標,研究了基于主題的網絡輿情關注度。許鑫和張嵐嵐[5]通過信號的搜集、辨識、解讀和利用將突發事件網絡輿情監控預警分為兩個階段,即突發事件發生前后兩個時間段。突發事件發生前,網絡輿情的監控預警重點關注縱向的深層次數據挖掘,尋找有價值的信息;突發事件發生后,網絡輿情的監控預警主要從橫向展開,把握突發事件隨時間演化的過程。廖海涵[6]等按照生命周期理論將突發事件的發展分為醞釀、爆發和演化三個階段,并分析了對突發事件各階段的網絡輿情應急管理的必要性及具體的監測方法。
流程分解法是建立在枚舉分析法的基礎上,將整個事件拆分成不同的階段。相對于枚舉分析法,流程分解法已經排除了冗余信息,在事件的過程描述和目標追蹤上有了很大的提高,它能夠更加直觀、迅速地找到關注的目標和亟待解決的問題;同時,由于其分段描述的特點,這類模型能為決策者提供更為準確的智能支持,提供有效的解決方案。然而,該模型仍然存在著不足:第一,該模型結構較為固定,往往僅能從某一個視角入手,缺乏靈活性;第二,該模型依賴于事件流程的規范性,如果事件的過程較為復雜,則關鍵節點的拆分較為困難,同時該模型在處理并發事件上較為困難;第三,該模型缺乏對整體的把握,很難針對事件匯總得出定性的結論和總體評價。
匯總計算法是基于流程分解法的一種宏觀分析,它通過某些固定的算法,將各個流程匯總到一起,給出對事件的一個總體評價。具體結構如圖3所示,其中Xi表示i過程的階段性指標,而X表示的是對整個事件最終的評價。匯總計算的方法包括取均值法、設置權重法等。

圖3 匯總計算法
曾潤喜和徐曉林[7]將網絡輿情的變量特征體現分為警源、警兆、警情三類,通過綜合評分法、分類評分法和權重評分法構建網絡輿情監控綜合指標體系。張一文[8]等將輿情主體分為政府子系統、網民子系統、網媒子系統和傳統媒體子系統四個部分,構建了輿情熱度指標跟蹤網絡輿情的演化過程,并用傳統媒體關注度、網民參與度、網民對政府的滿意度、網絡新聞媒體關注度等33個變量作為輿情熱度的度量標準。張一文[9]等從事件爆發力、網民作用力、網媒影響力以及政府疏導力來描述網絡輿情熱度,以突發性事件的演化過程為依據,構建了輿情熱度評價四級指標體系。張艷豐[10]等通過對話題重要度、情感傾向性、話題關注度、輿情受眾的數量以及傳播速度五類指標的加權,對網絡輿情進行監測分析。
匯總計算法彌補了流程分解法缺乏整體把握的不足,能夠抓住輿情變化的核心問題。然而,由于它來源于流程分解法,因此,其具有與流程分解法類似的缺點。此外,因為匯總計算法往往是流程分解法的簡化表現,所以它有時也會喪失輿情監控的全面性。
上述三類方法是目前基于事件的網絡輿情分析的常見方法,其比較如表1所示。綜合表1內容可以看出,這三類模型均從不同的角度嘗試對事件的輿情演化過程進行跟蹤和監控,取得了重要的突破。但是,上述三類方法均以過程為導向進行建模,在每個過程中均加入了較強的條件約束或者規定了較為統一的分析方法,所以均不同程度存在單體化建模方法帶來的欠缺,模型結構往往會受到過程的約束。

表1 基于事件的網絡輿情分析建模方法比較
然而,網絡輿情的演化過程并非具有標準化的定義。史波[11]認為,危機事件網絡輿情演變機理按時間順序由形成機理、過程機理和終結機理構成,而過程機理包括互相作用的三個部分:發展機理、變異機理、作用機理。每個部分都有各自的形成原因、表現形式和發展路徑。因此,網絡輿情的分析和監控是一項復雜的系統工程。網絡輿情的引導需從網絡輿情的組成要素著手,并抓住影響網絡輿情的時機和重點。因此,以過程為導向的建模存在著明顯的不足。本文將從一個全新的視角,以網絡輿情的組成要素入手,建立一種基于多維社會網絡結構的輿情事件分析模型,彌補上述模型的不足。
Burt[12]討論了一種社會網絡結構,如圖4所示。簡單地說,這一社會網絡結構由銀行家、經理和普通客戶組成。這三類人構成了一個復雜的社會網絡結構。三類人可以彼此互相直接聯系,也可以借助其他人形成間接關系。作為銀行家而言,最為有效的關系建立方式為銀行家與經理建立直接聯系,而經理與客戶建立直接聯系,從而銀行家通過經理與客戶建立間接關系。

圖4 多維社會網絡結構
輿情的演化過程可以描述成一個復雜的多維社會網絡結構,它由多個要素構成,要素和要素之間、要素內部均存在復雜的聯系。因此,基于多維社會網絡結構的輿情分析模型構建包括兩個部分:第一,分解輿情演化過程的組成要素,梳理它們之間的聯系;第二,確定各組成要素在模型中扮演的角色,尤其是尋找到扮演“銀行家”角色的要素,構建模型。
突發事件的網絡輿情監測和預警,需要重視輿情發展態勢的分析,并進行威脅估計。因此,對突發事件的網絡輿情監測需要重視中間環節、關鍵環節,對輿情要素進行分解,而非僅僅從整體上得到一個指標。以網絡輿情的組成要素入手,需要針對目標源進行分析,歸納出形成目標源的各個要素。輿情要素可以抽象地分解成多個維度,每個維度表示事件的一個要素,而每個要素又可以分為多個層次。因此,輿情要素就形成了一個立體的具有復雜聯系的社會網絡。通過對輿情演化過程的分析,結合已有的研究成果,我們將輿情要素分解如下:
? 輿情的主體A
本文定義的輿情主體即為網絡上、主流媒體報道的突發事件或者可能形成輿情的重要事件。
? 事件的時間要素T
時間為貫穿于輿情演化過程始終的重要組成要素,時間下分為年(T1)、半年(T2)、季度(T3)、月(T4)、周(T5)、日(T6)、小時(T7)、分鐘(T8)、秒(T9)九層,同時上層與下層之間具有包含和被包含關系:
T9? T8? T7? T6? T5? T4? T3? T2? T1? T
? 事件的空間要素G
空間要素描述的是事件主體的地域分布,可以下分為國家(G1)、省(G2)、市(G3)、縣(G4),同時有:
G4? G3?G2? G1?G
? 輿情的主題類型C
輿情的主題類型是將事件按照規定的類型進行劃分,從而針對不同類型的事件,進行單獨的處理。本文參考李雯靜等[13]介紹的TRS 政府信息公開目錄服務平臺參考分類體系中的主題分類,將主題類型下分兩層,第一層(C1)包括綜合政務、經濟管理等八類,第二層(C2)為詳細的劃分,且有:
C2? C1?C
? 輿情事件的媒介M
輿情事件的媒介是輿情演化的重要載體,也是輿情監控和預警的重要關注點。本文將媒介要素下分三層:第一層(M1)分為傳統媒介和網絡媒介;第二層(M2)將傳統媒介細分為電視媒介、報紙媒介,網絡媒介細分為政府信息網、大型門戶網站、論壇BBS、博客、微博等;第三層(M3)為輿情事件的詳細來源,同時有:
M3?M2? M1?M
? 輿情的傾向性觀點V
輿情的傾向性觀點是輿情監控和預警的重要參考標準,是引導輿情走勢的重要依據。輿情的傾向性觀點V可以分為3層。第一層(V1)由正面主觀觀點、負面主觀觀點和中立客觀觀點組成;第二層(V2)對主觀觀點按強、中、弱進行細分;第三層(V3)則細化到了具體的傾向性語言,且有:
V3?V2? V1?V
? 觸發主體的動因R
促使突發事件形成輿情的原因是復雜多樣的,史波[11]就詳細介紹了形成、發展、變異和終結的動因。曾潤喜和徐曉林[7]將輿情的預警指標分為了警源、警兆和警情。結合現有的研究,本文的動因R下設兩層:第一層(R1)按照輕重緩急和帶來的影響細分為潛在動因、觸發動因和激化動因。潛在動因是尚未直接形成輿情,但有可能觸發輿情的事件,其下分為重大政治事件、重大社會活動、重大經濟事件、重大群體性事件等;觸發動因為已經形成輿情,并有蔓延擴大趨勢的體現,包括偏激言論、激進言論的出現,網上群體攻擊,政治、集會動員等;激化動因是已經造成危害公共秩序的表現,包括集體上訪、集體罷工、政治集會、斗毆等(R2),同時有:
R2? R1?R
? 輿情度量和評價指標X
輿情的度量和評價指標是最終實現對網絡輿情監控、預警和引導的輔助決策工具,是聯系輿情各組成要素的重要環節。因此,輿情度量和評價指標在多維社會網絡模型中應該做為核心要素。
現有文獻認為網絡輿情指標的設立應該遵循以下原則:第一,指標具有可測性;第二,指標具有可靠性和靈敏性;第三,指標具有導向性,能客觀反映輿情的演化過程;第四,指標具有粒度最小性,不能被其他指標所替代。綜合參考現有文獻,本文將輿情度量和評價指標分為兩層:第一層(X1)將指標分為兩大類:直接指標和加工指標;第二層(X2)對指標進行了細分。直接指標為通過對輿情信息的采集和處理后,可以直接獲得的度量指標:包括主題個數、報道事件的網絡媒體機構數量、有關該事件的新聞報道數量、網民參與數量、帖子個數等;間接指標是需要通過采用事先給定的計算公式加工獲得的指標:包括關鍵點指數[14]、主題關注度(主題署名度、主題發布者影響、主題關注度和主題區域范圍)、主題權威度[13]、結論性指標(主流媒體是否關注、網民是否引發行動、政府是否采取措施等計數指標)。
在網絡輿情的要素進行分解并確定使用輿情的度量和評價指標為核心要素以連接輿情的其他組成要素后,多維社會網絡輿情分析模型的結構已經形成。描述某一輿情事件Event的集合可以用公式表示:
圖5給出了基于多維社會網絡結構的輿情分析模型。可以看出,輿情指標X將其他的要素聯系成一個關系網,而輿情事件的演化過程也可以由輿情指標和其他要素的組合得以還原。

圖5 基于多維社會網絡結構的輿情分析模型
結合上述分析,我們認為多維社會網絡模型具有以下幾方面的優點:
第一,研究對象和研究目標明晰,以目標為驅動。在多維社會網絡模型中,輿情事件的主體A和評價指標X是兩個重要要素,主體A為研究的對象,指標X為研究的目標。因此,該模型改變了現有模型“以過程為導向”的思路,轉而“以目標驅動過程”為研究思路。
第二,輿情要素分解清晰,覆蓋了輿情事件演化的主要特征。在多維社會網絡模型中,輿情事件被分為了8個組成部分。同時,每個組成部分又可以細分為多層。通過指標X的連接,8個組成部分形成了一個多維多層次的關系網絡,這一關系網絡能快速地描繪出整個輿情事件演化的過程。
第三,輿情分析靈活多變、適應復雜的網絡輿情演化過程。除了主體A和指標X,其他要素可以根據研究目的不同進行增減,這種結構實現了多視角的網絡輿情分析。一方面,該模型能清晰地描述整個事件的全過程(當所有要素均選擇時有效),另一方面,該模型也可以從某一視角對事件的發展進行放大研究(選擇某幾個要素)。要素組合的多元化、要素內部層次下鉆深度的靈活化,使得網絡輿情的分析及對輿情的引導更為全面。
由此可以看出,多維社會網絡模型很大程度上彌補了枚舉分析法、流程分解法、匯總計算法的不足。同時,只要構建全面的指標體系,覆蓋所有的關系網絡,多維社會網絡模型將具有很強的靈活性和可控性。
1.系統原型設計
輿情系統的原型可分為四層:底層為信息層,存儲著不同分類的各種原始數據;第二層為信息整合層,通過該層的轉換器、度量分析和框架管理,將原始數據進行要素分解、分類整理;第三層為目標資源庫,第二層完成信息處理后,將把以“目標驅動”的資源存儲進該層的關系數據庫、維度空間表和內容庫里;第四層為展示層,該層提供統一的視圖,通過查詢模塊、報表模塊、分析模塊、事件模塊和內容模塊完成輿情演化過程的對外展示,具體如圖6所示。

圖6 基于多維社會網絡結構的輿情系統原型設計
2.網絡輿情數據倉庫的構建
基于多維社會網絡結構的輿情分析系統可以通過網絡輿情數據倉庫的數據存儲和設計架構實現。數據倉庫符合基于多維社會網絡結構輿情系統的構建目標:第一,數據倉庫采用統一的元數據模型,將原始數據進行歸類、加工,保證了面向用戶應用視圖的統一性;第二,倉庫能提供多視角分析的功能,通過對事件要素的維度分解和上下靈活鉆取、對過程的切片、對流程的旋轉放大,從多角度獲取準確有效的信息,形成全面、多元的決策方案。第三、提供自定義查詢、封裝和展示功能,能靈活根據用戶的需要還原真實的場景,并能夠根據規則定義迅速動態計算獲得指標評價體系,為監控和智能決策提供可靠有效的數據指標。
結合以上多維社會網絡結構的分析模型對2021年5月成都49中學學生墜亡事件進行輿情指標實例驗證[注]數據來源為互聯網和新社交媒體。,涉及主要指標有空間要素G、輿情主題類型C、觸發主體動因R,明確該事件屬于教育類輿情,觸發主體動因為重大群體性事件,由于后期呈現出“顏色革命”趨勢,因此又增加了國家安全意識形態滲透性質動因。
主要用于還原輿情演進過程中的主線脈絡和核心事件的影響力,選取聲量為度量指標。并結合輿情要素各維度進行計算,其中,時間要素T選取爆點事件發生后的某個時間段;事件媒介M覆蓋傳統媒介、網絡媒介,并重點關注意見領袖、大V的話語評論。

圖7 成都49中學學生墜亡事件輿情爆點分析圖
主要用于分析影響輿情走勢的情感維度,選取正面傾向性和負面傾向性比率為度量指標,并結合輿情的傾向性觀點V進行計算,主要包括非負面觀點、負面觀點。

圖8 成都49中學學生墜亡事件輿情情感分析圖
主要用于描述影響輿情演進過程中的各新媒體渠道的發展趨勢,選取發帖量為度量指標,并結合輿情要素各維度進行計算,其中,時間要素T選取事件發生的各時間段(天);輿情事件的媒介M覆蓋第二層網絡媒介平臺中微博、新聞、頭條、微信、論壇和其他。

圖9 成都49中學學生墜亡事件輿情渠道發展分析圖
主要用于描述引導輿論走向的微博大V,選取聲量為度量指數,并結合輿情要素各維度進行計算,其中,時間要素T選取事件發生整體事件段;事件媒介M覆蓋第二層網絡媒體中的微博平臺。

圖10 成都49中學學生墜亡事件微博意見領袖分析圖
本文從現有文獻入手,歸納總結出枚舉分析法、流程分解法和匯總計算法等現有基于事件的網絡輿情分析建模方法的結構和缺陷。接著,以多維社會網絡結構模型為理論依據,提出了一種以輿情要素為研究對象,以目標為導向的輿情分析建模方法,取代了現有以過程為驅動的輿情分析建模方法。該模型對網絡輿情要素進行了分解,并以輿情度量和評價指標為連接各要素的橋梁,構建了輿情演化過程的多維度、多層次關系結構。基于多維社會網絡輿情分析的模型能彌補現有單體化輿情分析模型的不足,建立一個多維立體的、多視角的網絡輿情監控、預警平臺。隨后結合近期突發網絡輿情事件對該模型進行實踐驗證,從輿情事件的演變軌跡、輿論導向和傾向、平臺趨勢等方面實現了多視角的網絡輿情分析,并可以實現從某一視角對該事件的發展進行放大研究,使得網絡輿情的分析及對輿情的引導更為全面。