黃燁
摘 要:隨著大數據時代的到來,網絡輿情的力量不容小覷。高校作為網絡輿情的聚集地,由于其主體的特殊性,容易引起輿情的聚集和爆發。所以做好高校網絡輿情監測,防范輿情危機的發生,可以有效保障校園網絡信息安全,促進高校和諧穩定發展。
隨著互聯網的發展,大眾喜歡在網絡中發表個人意見,意見一旦聚集形成龐大的輿論就容易導致輿情爆發。網絡輿情的力量不容小覷,現代互聯網發展迅速,互聯網上時刻充斥著各種各樣的信息,稍有不慎,可能一件小事也會愈演愈烈,給互聯網帶來形形色色的風險。例如今年網上爆發的“肖戰227”事件,本來是肖戰粉絲之間的摩擦,卻愈演愈烈,如同滾雪球一樣,造成影響巨大的網絡輿情。肖戰本人也因此受到很大的牽連,個人形象和資源都大受影響?!靶?27”事件證明網絡輿情影響不可忽視,良好的輿情分析管理和監控能力必不可少。
1高校網絡輿情現狀
高校是網絡輿情的聚集地。大學生是一個特殊群體,他們年輕,有朝氣,具有較高的知識水平和較強的認知探索能力,接受新生事物能力強,敢于并且善于表達個人觀點、熱衷于參與輿情討論,容易對一件事情產生共鳴。在大學生當中,可能因為沒有重視一個小的輿情,導致一系列連鎖反應。網絡輿情在高校傳播的主要方式有: 微信、QQ等即時通訊;各類論壇;網絡新聞的評論區;微博、博客(Blog);抖音、快手等短視頻軟件。這些都是輿情的形成和表達的主要途徑,大學生對這些平臺都比較熟悉,也比較熱衷于在這些平臺發表意見和情緒,這對輿情會產生重要的影響。
高校需重視新時代網絡輿情帶來的挑戰,并且建立起完善的網絡輿情應對機制,做好網絡輿情監控以及輿論引導工作,在輿情爆發之前未雨綢繆,減少負面輿情對高校正常工作的沖擊,充分發揮網絡文化的教育與管理功能。
2高校網絡輿情的基本特征
從高校網絡輿情的特征上來說,它實際上是一對矛盾的綜合體:高校網絡表達能夠開放、互動、自由,但同時也是可控的。高校網絡信息是學生情緒化和非理性的表達,但這些內容卻能客觀地反映學生的真實心理狀況。做好網絡輿情監控要了解高校網絡的特征,在此基礎上做出正確的輿論引導和管理。
2.1產生主體特殊
高校網絡輿情的主體是大學生。他們的特殊性在于大學生是一個群體,他們年齡相仿,受教育程度相同,生活和知識水平往往在同一個層次。當網絡輿情發生時,他們很容易產生認同并達成共識。大學生表達觀點的欲望強烈,愿意在網絡上發表對事情的看法和見解,但有時候可能會出現極端現象,容易被煽動情緒,尤其是在網絡這個自由便捷的空間里,大學生往往在未經過深思熟慮且探討不深入的情況下發表意見,形成聲勢浩大的意見傾向,導致網絡輿情危機。
2.2輿情內容多元性
高校網絡輿論涉及的內容廣泛、主題多樣,可能涉及到社會的各個層面。學生們通過各種渠道了解信息,傳播信息,對于感興趣的內容發表各自的看法,宣泄情緒。在虛擬的網絡空間里,不同的意識和思想相互碰撞,網絡輿情呈多元性發展。
2.3網絡輿情突發性
網絡輿情的爆發往往沒有征兆和預警,屬于突然爆發。大學生經常上網沖浪,對網上的事件也比較敏感,一個事件在網上曝光時,大學生往往能迅速反應并發表評論,個人意見很快聚集形成公眾意見。
3網絡輿情監控系統關鍵技術
3.1網絡爬蟲技術
信息采集的主要載體包括網絡媒體網站、論壇、微博、微信等,可利用爬蟲技術進行信息采集。網絡爬蟲是一種基于索引引擎技術的網絡信息獲取工具。它可以根據需要提取網頁的腳本或程序,其基本原理是通過遍歷URL,不斷搜索網絡信息,并將在URL中獲得的數據保存到本地數據庫中,實現信息獲取。
3.2網頁解析技術
要實現對某網站數據的爬取,需要對該網站上網頁數據進行分析,了解網頁的結構之后,在爬蟲代碼中編寫提取網頁中特定數據的代碼。這是將互聯網數據轉化為通俗易懂的信息數據的重要一步,也是決定輿情監測效果的關鍵。目前主要有三種web頁面解析技術:
3.2.1正則表達式:一種字符串匹配的模式,其由普通字符和一些元字符組成。根據特定的語法來設置字符串的匹配規則,用于快速檢查一個字符串是否匹配該規則,還可以從字符串中抽取或者替換滿足條件的子串。正則表達式適用于簡單的字符串,但涉及到難度較大的就無法提取,正則表達式寫起來較為復雜并且出錯率高。
3.2.2XPath:一種在XML和HTML文檔中查找信息的語言,可用于遍歷XML和HTML文檔中的元素和屬性,并根據網頁的樹層次結構獲取節點。這些路徑表達式與常規計算機文件系統中看到的表達式非常相似。
3.2.3BeautifulSoup:是一個一個從HTML或XML中提取數據的Python庫,可以按照節點的名稱、節點的屬性值、節點的文本來搜索符合條件的節點。它是靈活方便的網頁解析庫,處理高效,而且支持多種解析器。使用Beautifulsoup可以不用編寫正則表達式就方便的實現網頁信息的提取,可以高效節約開發者時間。
3.3分詞技術
分詞技術用于將語句拆分成單詞。計算機要理解語義,必須先要識別出關鍵詞,將完整的句子拆分成詞串,就是分詞技術了?,F在常用的分詞算法可分為三類。一種是基于字符串匹配的分詞方法,這種方法需要有一個字典,根據一定的策略,將要待分析的字符串與字典中的條目進行匹配。如果匹配正確,則字符串是一個單詞。根據不同的匹配方法,可以將匹配方法分為正最大匹配法(從左到右)、反向最大匹配法(從右到左)和最小分割法(將每句話中切出的單詞數量最小化)。字符串匹配方法快速、容易實現,但不能有效處理歧義詞。第二種是基于統計的分詞方法,這種方法是對句子中字與相鄰字共現的頻率來計算,共現信息量越大,表明關系越緊密,共現次數越多,越有可能是一個詞。第三種是基于理解的分詞方法,這種方法可以使計算機能夠模擬人類對分詞的語法和語義進行分析。但是這種方法還不成熟,因為漢語結構復雜詞匯量龐大,計算機需要大量的語言知識和信息。
隨著互聯網在全球范圍內的快速發展,網絡輿情給高校的穩定和大學生的成長發展帶來了挑戰。教育領域的輿論發展變化規律極不可控。因此,研究和監測網絡輿情,對于高校的穩定發展具有重要的現實意義。做好高校網絡輿情監測與管理,防范輿情危機的發生,可以有效保障校園網絡信息安全,促進高校和諧穩定發展。
參考文獻:
[1]孫洪慶,李曉光.大數據時代高校輿情導向機制【J】.繼續教育研究,2018(8):27-31.
[2]曹彬,顧怡立,謝珍真 . 一種基于大數據技術的輿情監控系統 [J]. 信息網絡安全,2014(12):38-42.
[3]陳燕.近十年高校輿情及輿情引導研究綜述【J】.陜西理工大學學報,2017(35):85-96.
[4]韋媛媛. 高校網絡輿情引導中的微信應用探討【J】. 當代教育實踐與教學研究, 2015( 4) .
[5]馮如曉,劉志明,雷龍艷. 基于搜索引擎的關鍵詞輿情過濾算法研究【J】 .計算機工程應用技術,2014,10( 6):1328-1332.
[6]劉毅.網絡輿情研究概論【M】.天津:天津人民出版社, 2007:51—52.
[7]胡靜,蔣外文,朱華. W e b 文本挖掘中數據預處理技術研究【J】. ?現代計算機,20 0 9( 3).
(江西警察學院)