譚勵彥 史毛馨
摘 要:網絡輿論是民眾在互聯網上社會中某種現象或問題所表達出的信念、態度、意見和情緒等表現的總和。首先分析并優選了網絡輿論代表性的影響因素,并利用AHP層次分析法分析出各個因素的權重,建立出網絡輿論指數的方案評價函數模型。然后,研究了網絡輿論指數隨時間的變化關系,從理論上推導一階自治微分方程,得到了指數函數形式。最后,結合新聞事件和數據研究了網絡輿論的函數形式和傳播規律。研究得出,網絡輿論指數函數是由線性函數、指數函數、二次函數構成的分段函數,網絡輿論在發展中包括潛伏期、傳播期、消散期三個階段,具有各自的特征及其判定方法,實現了對網絡輿論的態勢的客觀表述。
關鍵詞:網絡輿論指數;AHP層次分析;分段函數擬合;數據驅動
互聯網成為新聞、觀點、民聲的集散地。當持有、接受、表達某種相同、相似的觀點的人在網絡人群中所占的比例超過一定的閥值,此時就上升為網絡輿論。
網絡的開放性和虛擬性決定了網絡輿論具有突發性、擴散性、馬太效應、偏差性等特點。社會上的一些敏感問題出現在網上而引起一些人的共鳴應是一種正常現象,但是由于各種復雜因素使這些敏感問題向熱點演變為輿論。某些網絡輿論如不及時引導控制,甚至會引起社會群眾的違規和過激行動,影響到社會安定。由于某些網絡輿論爆發“內容威脅”的形式對社會公共安全形成威脅,查明網絡輿論的形成、明晰網絡輿論傳播擴大的因素、依照輿論勢態進行合理引導,將成為營造長期和諧穩定的網絡氛圍和社會治安的必要條件,也必將成為互聯網進一步發展的必然
趨勢。
近年來,部分學者以關鍵字“互聯網”為核心,界定了網絡輿論的概念,如王天意定義為公眾依托互聯網這一現代工具,針對某一件或者某些焦點事件,發表的帶有明顯個人傾向且具有一定影響力的看法、言論的情形。而在百度百科中,網絡輿情被定義為在一定的社會空間內,通過網絡圍繞中介性社會事件的發生、發展和變化,民眾對公共問題和社會管理者產生和持有的社會政治態度、信念和價值觀。結合前人的觀點,給出網絡輿論的定義:它是較多民眾在互聯網上關于社會中某種現象或問題所表達出的信念、態度、意見和情緒等表現的總和。
一、網絡輿論影響因素
丁菊玲等人提出網絡輿論的影響因素應當分為外在、內在兩部分,并深入分析了網絡版主、新聞線人、媒體記者、點擊量、跟帖數等因素。結合前人結論以及實際經驗,本文得出網絡輿論指數的影響因素如圖1所示。本文認為內在因素能夠直接反映出網絡輿論的影響力,并挑選出最具有代表性的因素,包括網頁相關鏈接數量、點擊閱讀量、評論回復量、關注人數(粉絲量)。外在因素則是抽象的概念,包括管理尺度、傳統媒體、名人吸引、網絡媒體評論角度。
外在因素和內在因素這兩種準則共同決定了網絡輿論指數。其中,對于外在因素,由于它的相關數據無法量化(例如,內在因素中,某時刻某輿論的點擊量可查得的,而名人吸引的力度不可得到具體數值),而且內在因素的數據可以反映外在因素的影響,所以本文在網絡輿論指數的評價函數中僅考慮內在因素的數據。此外,對于網頁相關鏈接數量,若選取網頁所有鏈接量作為數據,鏈接的數量顯示在瀏覽器上僅精確到萬位,該數據在短時間內的變化量不明顯,可以看出輿論影響并不是明顯的影響因素。綜上所述,本文選擇將收集關注人數、評論回復量、點擊閱讀量的數據作為數學建模的數據支持。
二、網路輿論指數模型
1.網絡輿論指數評價函數模型
網絡輿論指數(Q)是反映網絡輿論變化的一個指標或參數,如何構建網絡輿論指數的評價函數模型是重要的研究內容。經過分析,評論數(D)、新聞閱讀量(R)、關注粉絲量(F)這三個影響因素盡管均可對網絡輿論指數產生影響,因此選擇這三個內在影響因素作為衡量網絡輿論的指標。但是,它們的影響力度不同。因此,本文選擇使用AHP分析方法,并適當基礎簡化,分析出各個因素的對網絡輿論指數影響的占比或權重。
研究中作如下基本假設:“瀏覽過新聞的人一定點擊了新聞;關注此新聞的人一定瀏覽了該新聞;參與討論的人一定關注了此新聞”。
首先,本文通過網站網友參與人數、網站相關性等因素分別對兩兩統計量間進行重要度賦值,如表1所示。
經過計算,CR=0.003185,即一致性比例處于(0,0.1)之間,表明信息無損失,說明上述判斷矩陣各項賦值合理。
2.網絡輿論指數微分方程
在網絡輿論指數(Q)評價函數模型確定后,研究網絡輿論指數隨時間的變化規律可以用于分析網絡輿論的“擴散性”,以此來判定、解釋和預測網絡輿論指數的變化情況。本文選擇使用微分方程來描述這一關系。論文給出的網絡輿論指數微分方程為:
可以看出,網絡輿論指數的總體上隨時間增長,在前期和后期增長較慢,在中期增長較快。網絡輿論指數的變化率隨網絡輿論指數的增加而增加。顯然,當網絡輿論指數越大時,其造成的社會影響也越大,該影響導致其增長越來越快。網絡輿論指數的變化率隨網絡輿論指數接近峰值而變小。不難理解,當網絡輿論發展到一定時間后,由于更多的人已經對此事件有了相關的了解和認知,該事件的熱度會逐漸下降,新聞頭條被其他事件所取代,其網絡輿論指數變化逐漸趨于平穩并保持在某一穩定值。
3.案例數據分析
為了驗證上述評價網絡輿論指數(Q)評價函數模型及其隨時間的變化規律是否正確,利用2016年發生的“魏則西事件”案例進行深入分析。
對于數據的采集,本文選取1天為一個時段,從點擊閱讀量、評論回復量和關注人數這三個影響網絡輿論指數的因素,選擇各大主流媒體,統計該事件在網上的輿論發酵程度。首先統計百度貼吧關于該事件關鍵詞的總回帖數、搜狐網頁上該新聞的閱讀量及回復量。新浪微博話題的關注量、360熱搜的數據,如表3所示。統計發現,各大媒體的數據量不同,數據反映的信息意義也不同。研究發現,百度貼吧總回帖數、搜狐閱讀量和新浪微博話題關注量這三類數據數據級較大,這反映網民參與數較多,且數據權威性高。這三類數據來自不同的網站,但閱讀量、話題關注和回帖這三類數據從不同層面客觀地反映網民對該網絡新聞重視網民、參與程度。利用歸一化方式,可將三類數據視作來源于同一網絡平臺。
綜上所述,選擇百度貼吧總回帖數,搜狐閱讀量和新浪微博話題關注量這三方數據作為建模數據來源。對于輿論指數的計算,假設網友評論、閱讀、關注的人數比例不變,相對于輿論指數的權值相同,故沿用每項數據的權值(λ),根據評價函數計算出每一時間段的輿論指數,計算結果如表3所示。
圖4(a)為一個月內網絡輿論指數變化規律。可以看出,一個月中不同時段網絡輿論指數的變化規律不同:前半部分函數基本以指數規律上升,而后半段函數則以二次函數增長的同時趨于平穩。需要指出的是,在前半段函數一開始變化趨勢比較平穩,前4個時間符合線性規律,因此證明網絡輿論指數初期的變化的確是由平穩發展再到快速增長的,如圖3(b)所示。當第6天到9天范圍內,輿論指數Q呈指數規律上升,如圖3(c)所示。當10天以后,輿論指數Q曲線輕微波動并逐漸趨于平穩,考慮到其凹凸性,選擇二次函數進行擬合,結果較為滿意。輿論指數的確是隨著時間推移逐漸接近于最大值的圖3(d)。當輿論指數基本保持不變時,該新聞的熱度基本消散,關注的人逐漸散去。
綜合上述分析,得出了一個完整新聞的網絡輿論指數關于時間的分段函數Q(t)。
Q=0.0264t+0.0511,0 根據分段函數看出,一個完整新聞的輿論指數變化分為三個階段,潛伏期(一次函數階段),傳播期(指數函數階段),消散期(二次函數階段)。而且,該分段函數也驗證了通過微分方程解出來的在某一階段Q(t)為指數函數的正確性。 再通過分段函數的擬合之后,本文嘗試使用通過微分方程構造的函數再次進行擬合,比較擬合效果。 通過代入魏則西事件的相關數據對2.2中得到的網絡輿論指數隨時間的變化函數Q(t)進行擬合之后,得到的函數為 不難發現,這兩種擬合方式都能很好地體現出網絡輿論指數關于時間的變化關系。 此外,我們還對另外一些新聞事件的數據也進行了研究,在初始時間內確實符合線性增長的規律,函數斜率的差僅為0.001。對于不同的新聞事件,函數的形式是相同的,均呈現出潛伏期、傳播期和消散期三種不同的函數形態,很好地描述網絡輿情的發展變化趨勢,不同的是函數的系數或指數是不同的。 本文從理論和數據雙方面驅動建模,利用AHP層次分析描述了各準則層對目標方案的權重占比,靈活有效地完成了數學建模工作,并以實例分析了網絡輿論指數隨時間的變化規律,對于網絡輿論態勢表述與指導輿情控制具有重要意義。 (1)基于評論數、新聞閱讀量、關注粉絲量三因素的AHP層次分析法能夠實現網絡輿論指數評價模型,有較高的科學依據,而且計算結果準確。 (2)從微分方程與數據擬合兩個角度,分析了網絡輿論指數隨時間的變化規律。數據分析指出了網絡輿論包括潛伏期(一次函數階段)、傳播期(指數函數階段)與消散期(二次函數階段),在傳播中期網絡輿論指數呈指數上升趨勢,與微分方程所表達的指數函數形式是一致的,實現了“數據驅動”方法。 當然,AHP層次分析中確定權重之間的相對重要度時帶有一定的人為設定,并且不夠直觀,需要進一步研究。 致謝:研究中朱浩楠老師在思路上給予了耐心的指導和支持,楊禮嘉、王穎初兩位同學積極參與了討論和幫助,在此表示衷心的感謝。 參考文獻: [1]王天意.網絡輿論引導與和諧論壇建設[M].人民出版社,2008. [2]丁菊玲,勒中堅.網絡輿情危機事件形成因素分析[J].情報雜志,2011. [3]王蓮芬,許樹柏.層次分析法引論[M].中國人民大學出版社,1990. 作者簡介:譚勵彥(2001—),男,現為北京十一學校高二學生,參加數學建模培訓和比賽多次,先后獲國際獎項1次、國家獎項2次、省部級獎項4次。 編輯 杜元元