萬麗雯
(武漢理工大學管理學院,湖北 武漢 430000)
方付建定義企業網絡輿情是指一些企業突發事件經過網絡傳播形成強大的“井噴型”輿情,噴涌的網絡輿情直接影響到企業發展和存續。本文定義企業網絡輿情是指在各種事件的刺激下,群眾對在網絡上傳播的企業事件所有認知、態度、情感傾向等的集合。
1.2.1 主體因素
主體是指輿情事件的參與者,包括網民和當事主體。網民的情感傾向、關注度,企業的類型、參與度、回應的及時性等都對企業輿情事件的發展和變化有著巨大的影響。例如2020年的“華為剝離榮耀業務”,在網絡情緒的表達方面,基于華為品牌的認知度,很多人仍然支持華為的決定,積極態度占87%。因此對企業并未造成危機。在企業輿情危機事件中,一些事件由于相關企業的參與和及時響應,輿情才平息下來。因此本文認為主體因素主要包含網民情感傾向、網民的關注度以及企業的參與度三個方面。
1.2.2 客體因素
客體是指輿情事件本身,是客觀存在的屬性。引發輿論危機的常見敏感因素包括產品或服務質量、消費者權益等類型。如“上汽大眾4S店破壞好零件再修理”“三只松鼠薯片致癌物”等事件排名前十。這些輿情事件大多與企業潛在或存在的侵犯消費者權益行為有關,也是社會輿論的敏感點,群眾的關注焦點也聚集在這些事件上,容易引發負面的公眾情緒,加劇輿論糾紛。輿情真實度主要是因為在網絡空間里,大多數言論都難以分辨真假,虛假的言論極易導致與該企業相關的輿情事件危機的發生。本文認為客體因素包含輿情的真實度和敏感度兩個方面。
1.2.3 媒體因素
媒體,是網絡輿情傳播的渠道和手段,主要表示的是事件傳播與擴散的態勢。網絡輿情媒體關注度與網民關注度的含義類似,媒體關注度指的是媒體參與企業網絡輿情的程度。媒體在網絡環境中也是一個重要因素,李綱認為輿情在進入爆發期之后,會受到媒體相關因素的進一步放大。信息化時代,許多輿情話題首先由媒體曝光出來的提供給網民,并且輿情的演化也往往隨著以媒體的信息披露而發展的。本文認為媒體因素主要是媒體的關注度。
1.2.4 本體因素
本體指的是與企業相關網絡輿情事件的信息,包括輿情事件在網絡中傳播的文字、圖片、視頻等。互聯網時代,輿情事件以多種多樣的形式傳播,和單調的文字描述相比,以圖片和視頻為主的傳播形式讓信息變得更為直觀,更具有煽動性。例如2018年,被某位網友曝光的一段拍攝了近20家五星級酒店衛生混亂的視頻,直接影響了該行業的整個聲譽。網絡輿情本體作為輿情傳播的一種形式,對輿情事件危機等級的影響程度較大。本文認為本體因素主要是輿情的傳播形式。
2.1.1 網絡輿情主體
網絡輿情主體對輿論的發展有著關鍵性的作用,通過網民情感傾向、關注度,企業參與度來進行衡量。
(1)網民的情感傾向。
網民的情感傾向是指網民對輿情事件的態度,如贊成、中立、反對。這一指標主要用負面微博占所有微博的比例來表示。比例越大,企業網絡輿情危機發生的可能性越大。
(2)網民的關注度。
關注度表示網民對某個輿情事件的關注程度,用輿情熱度來表示。網絡輿情熱度越高,就表明網民的關注度越強。本文采用原創微博發布量(O)、轉發量(A)、評論量(B)、點贊量(C)這4個指標對輿情熱度進行描述。
(3)企業參與度。
企業參與度就是企業相關人員在輿情事件發生后參與處理的程度。用來評判企業參與面廣不廣、程度深不深,采用專家打分法進行賦值。企業參與程度越高,發生輿情危機的可能性就越小。
2.1.2 網絡輿情客體
網絡輿情的客體是觸發網絡輿情的刺激因素和網絡輿情的對象,直接導致了網絡輿情的發生和傳播。可以通過輿情信息的真實度和敏感度來進行衡量。
(1)輿情真實度。
輿情真實度指的是與企業有關的輿情事件的真實程度,本文在該指標的選取上采用定量分析的方法,主要通過某件企業輿情事件中微博認證用戶占全部微博用戶的比率來確定。比率越大,說明輿情信息的真實性越高。
(2)輿情敏感度。
輿情的敏感度可以直接影響輿情的未來發展。企業相關的網絡信息能夠引起網絡輿情的產生,輿情涉及敏感因素的程度作為輿情敏感度來衡量網絡輿情的可能發展情況。本文通過定性分析的方式來確定,輿情信息的敏感性越高,造成的危害越大,企業網絡輿情危機發生的可能性就越大。
2.1.3 網絡輿情媒體
和普通網民用戶傳遞的輿情信息質量較低的特點相比,媒體的參與減弱了輿情信息的不確定性,從而使得企業產生輿情危機的可能性增強,媒體的關注度通過媒體發布微博量來確定。
2.1.4 網絡輿情本體
本體是指網絡輿情在互聯網上傳播的圖片、文字和視頻。本體作為在網絡上傳播和發酵的一種輿情事件形式,對輿情事件的危機程度有較大的影響。網絡輿情本體表現為輿論傳播的形式,本文借鑒輿情熱度的計算公式來確定傳播形式的表達式。
前文對企業網絡輿情危機的影響因素進行分析和量化處理,盡可能地以最少指標達最優預測目標的準則來選取,并進行量化處理,構建企業網絡輿情預警指標體系見表1。

表1 企業網絡輿情預警指標性質和量化方法
2.3.1 基于K-均值聚類的分級過程
K-均值聚類算法屬于聚類方法中的基于劃分的方法,是聚類方法中最常用的方法之一。本文選擇K-means方法對企業網絡輿情事件危機等級分類和分級。采用事件危機程度值為聚類指標,通過信息熵計算各指標權重,累加即得各個時間點的危機程度值。依據聚類中心把各時刻輿情事件進行歸類、分級。
2.3.2 企業網絡輿情預警模型
本文采用支持向量機進行企業網絡輿情危機預警模型的構建。對于多分類問題,傳統的一對一算法將不能完成,可以間接的利用一對一,即采取一對多的算法(ovr),其主要原理是利用最大輸出法將多個SVM分類器的輸出進行組合,實現多類分類。SVM關鍵是選取核函數的類型,主要有線性核函數、多項式核函數、RBF核和sigmoid核。
本文通過爬蟲軟件、爬取微博平臺企業輿情事件數據。將“網易裁員”事件按照網絡監測情況選取35個時間點的測試指標數據作為樣本,起始時間為2019年11月23日,到12月5日基本平息。本文通過K-means方法評價輿情事件的預警等級,最后通過比較不同核函數SVM來確定最優的預警模型。對原始數據進行預處理后,選取75%的樣本組合成訓練集,25%組成測試集,以此驗證支持向量機模型對網絡輿情預警識別的可行性。
由于不同指標,是通過對不同的數據進行量化處理得到的,所以經常會造成數據量綱差異較大,本文采用min-max變換對原始數據進行無量綱化處理。
將數據集作為信息熵計算中的評價對象,原創微博量、轉發量、評論量和點贊量作為指標,進行權重計算得到輿情熱度中權重分別為0.1417、0.2897、0.2695和0.2991。同理,計算得輿情傳播形式中含圖片微博數量占比和含視頻微博數量占比的權重為0.4311和0.568。
本文通過SPSS23.0完成K-均值聚類,得到該輿情事件不同時間段的分類情況和與聚類中心的距離情況。將“網易裁員”事件按照不同時間點的事件危機程度值分為安全、一般、警告、嚴重。通過K-means方法最終得到四個聚類中心,安全的事件取值范圍為[0,0.09723],一般級別取值范圍[0.09723,0.22417],警告級別取值范圍[0.22417,0.59187],嚴重級別取值范圍[0.59187,1]。
本文采用python3.0中的LIBSVM工具箱建立企業網絡輿情危機預警模型。SVM模型類型選用C-SVM,采用Grid Search調參來提高SVM預測的準確度,在最優參數的選擇中,K折交叉驗證采用5折交叉驗證法。
在未調參情況下,評分非常低,測試集精確度只有42.86%,調參后最佳C值為3,但是測試集精確度只有71.43%,說明數據是線性不可分的,需要嘗試其它非線性核函數,本文選擇應用最廣泛的RBF核函數。在未調參的情況下,模型測試集的精確度是42.86%,調參后最佳C值為3,此時測試集的精確度達到100%。根據精確度可以看出,支持向量機在企業輿情預警方面比較適用,RBF核函數在企業輿情事件預警識別上效果更為理想。