趙好好



摘要:在網絡時代,社交媒介平臺已成為高校學生獲得信息、溝通交流、表達情感的主要載體,同時也為高校網絡輿情管理帶來了新的挑戰。在分析高校網絡輿情熱點話題特征基礎上,采用數據挖掘技術,以河南工業貿易職業學院百度貼吧網帖文本內容為例開展高校網絡輿情熱點話題發現并進行情感分析,從而提出高效、科學和更具針對性的輿情引導策略。這對高校輿情管理和引導具有一定的實用價值和探索意義,有助于構建安全穩定、和諧積極的高校輿論環境。
關鍵詞:數據挖掘;高校網絡輿情;熱點話題分析;引導策略
一、前言
據統計,截止到2021年底,我國網民規模已達10.32億,如此龐大的網民規模,勢必給網絡輿情管理帶來巨大挑戰,尤其是高校網絡輿情占比影響力居高不下,網絡輿情的監管難度也大幅提升。
由于高校學生的人生觀、世界觀、價值觀的尚未成熟穩定,缺乏是非辨別能力,思想和觀念很容易受網絡輿情影響,也更容易產生偏激的言論或行為,形成負面輿情。因此,如何有效監管和分析高校網絡輿情,及時發現、引導并制止錯誤偏激的輿論導向尤為重要。
二、研究現狀
到目前為止,國內外對于高校網絡輿情的研究普遍集中在以下幾個方面[1]:
(1)高校網絡輿情傳播特征研究。輿情的傳播特征及形成機制對輿情的發展動向產生了很大的影響。因此,高校網絡輿論的傳播特征已成為? 當前學者關注的焦點,特別是在早期的研究中。
(2)高校網絡輿情監控機制研究。完善的輿論監督機制,是治理高校網絡輿情,避免輿論危機和群體突發事件的一種有效途徑。目前,大多數高校對網上輿論的監督機制并不局限于制度建設,在專業人才隊伍建設方面也存在缺陷。
(3)高校網絡輿情引導機制研究。高校網絡輿情引導機制包括輿情預警、干預、引導、危機處理等過程。輿情預警重點在于輿情系統的建立;輿情干預和引導過程重視權威信息發布、網絡謠言澄清和“意見領袖”引導作用;危機處理過程注重增強網絡道德教育、網絡安全教育等。
(4)高校網絡輿情突發事件應對策略研究?;ヂ摼W是輿情傳播過程中的一個主要媒體,對高校突發事件的產生起到推波助瀾的作用。高校網絡輿情突發事件的研究現階段主要集中在網絡環境下如何解決和處理高校突發事件。
(5)網絡思想政治教育研究。隨著網絡環境的發展,網絡思想政治教育的研究更傾向于采取比較研究、邏輯分析、實證分析等手段,在新媒體和大數據的研究背景下,深入探討網絡環境特有的特性、內在機制及發展趨勢。
但這些研究方法和研究成果并沒有從根本層面上來對高校網絡輿情熱點的形成和演變過程進行分析,也就無法確切的形成有效的監督機制和引導機制。近年來,一些學者嘗試通過數據挖掘技術來進行熱點話題發現,以期能夠更好地對網絡輿情進行分析、監控、引導和應對。
三、高校網絡輿情熱點話題特征分析
高校網絡輿情熱點話題往往是能引起高校大學生群體普遍關注并易形成某些具有特定指向性態度的事件??紤]高校大學生這一特殊群體與社會上其他團體在角色、年齡、生活地域等各方面特征的不同,其形成的話題也往往具備其特殊的表現形式:
(1)熱點話題通常會在某一時間段內頻繁出現,更容易引起話題關注者在思想或行動上的呼應。
(2)熱點話題一般擁有較多的評論、回復信息,經過媒介的傳播,獲取較多評論、回復后,形成熱點話題。
(3)在線上社交平臺上形成的熱點話題在線下也將成為線下輿論交流的熱點。
(4)在社交平臺上所形成的熱點話題內容會在某個時間段周期性復現。
從輿情的傳播特征出發,歸納出高校網絡輿情三個重要特征:內容多元性與分散性、主體的特殊性、形成過程的迅捷性。從參與主體的特征出發,對高校網絡輿情進行分析,總結出其具備現實性、沖突性和情感性等主要特征。從高校本身的特征來看,高校網絡輿情又有其特有的特征:傳播主體的集中性、學生群體的自主性等。此外,高校的安全穩定性、群體性和輿情的突發性也是高校網絡輿情特征分析中不可忽略的一個重要因素。
四、高校網絡輿情熱點話題分析
本文構建了熱點話題分析模型,主要由數據采集、數據處理和熱點話題分析三個部分組成。其中網絡文本預處理、文本分詞、文本向量化可歸納為數據處理,詞頻統計、詞云分析、情感傾向性分析可歸納為熱點話題分析。
(一)數據采集
本文利用 python的開源框架Scrapy和Beautiful Soup開發的主題爬蟲,爬取了百度貼吧中“河南工業貿易職業學院吧”和“河南工貿吧”中的輿情數據,選取時間自2019年1月1日至2022年5月1日期間貼吧數據。貼吧帖子總計2880條,評論、回復貼超過28405條,。貼吧發帖內容屬于短文本,且具有表達形式多樣、語序邏輯要求不強的特點。
(二)數據處理
計算機能夠直接處理結構化的數據,然而一般數據采集能夠采集到的文本數據往往是非結構化的,因此需要對文本進行處理從而使計算機能夠有效的識別和處理。文本處理技術包括網絡文本預處理、文本分詞和文本向量化表示三個基本過程。
1.網絡文本預處理
為確保數據的可用性和高效性,要對網絡文本中無效的、不規范的異常數據進行過濾和清洗。比如爬取貼吧數據每頁中的第一條數據一般為置頂的空貼,主要進行刪除;在同一時間同一用戶發表的相同主題內容帖子,判定為重復數據,要進行刪除;主題和內容同時為空的帖子,判定為空數據,要進行刪除;廣告營銷類發帖也要進行刪除等等。
2.文本分詞
輿情信息在經過預處理后必須進行分詞才可以用于輿情分析,并且分詞結果直接影響文本處理的效果。本文主要選用jieba分詞來對貼吧文本數據進行分詞,同時將一些專業名詞作為自定義詞典補充進去,如“河南工貿”“專升本”“單招”等,以提高分詞的準確率。
中文分詞后會過濾掉一些對表示主題沒有意義或者貢獻比較小的詞,比如“白”“了”“呢”等,即去除停用詞,以降低維度、提高搜索效率。本文使用的停用詞表是在哈工大停用詞的基礎上擴展了四川大學機器智能實驗室停用詞庫、百度停用詞后得到的1986個停用詞。
3.文本向量化
本文采用word2vec詞嵌入算法模型,將分詞T{t1,t2,t3,....tn}映射到空間向量Z{z1,z2,z3,...zn}中,確保每個分詞都能對應一個實數向量,可以使文本的挖掘更加精確。
(三)熱點話題分析
熱點話題分析主要側重于高校學生對于熱點事件或話題的關注度以及情感態度,包括詞頻統計、詞云分析、情感傾向性分析三個方面。
1.詞頻統計及詞云圖分析
將數據處理后的文本數據進行詞頻統計,并按照詞頻顯示詞語[3]。通過繪制詞頻和主題詞云圖,可以更加直觀地了解高校學生關心的熱點話題情況,如圖1和圖2所示。
由圖1和圖2可以看出學校、學長、學姐、專業、工貿、新生、單招、校區、學妹等主題詞在貼吧中出現的頻次比較高,說明在貼吧社交平臺中輿情主體更為關注學校、專業、單招考試、升學等情況,學校管理者應關注學生的日常學習和生活需求,結合貼吧反饋熱點話題內容,及時給學生提供咨詢和幫助。
2.情感傾向性分析
本文選用基于詞典和規則的方法來對熱點話題進行情感傾向性分析。情感分析可概括為積極性和消極性,數值越接近1為積極性,越接近0為消極性。對河南工業貿易職業學院貼吧熱點話題(共5048條)進行情感傾向性分析后,發現其中2581條表達積極情緒,1746條表達消極情緒,1081條保持中立,情感傾向性取值區間為[0.005421,0.999995],如圖3所示。整體來看,河南工業貿易職業學院貼吧主題發帖中中立情緒表達比較集中,占比21.4%,積極情緒更為明顯,占比51.1%。
五、高校網絡輿情引導策略
根據熱點話題分析結果,結合高校網絡輿情熱點話題的特征,提出合理化的輿情引導策略,總結為以下幾點:
第一,加強制度建設,建立聯動機制,協同管理。增進體制建設是強化和改進高校輿情危機應對能力的基石。成立由校黨委領導牽頭,組織部、宣傳統戰部、學生工作部、保衛處、各二級學院、現代教育技術中心、思政部門協同作用的領導小組,形成輿情研判、應對、處理工作全局協同管理機制[4]。
第二,建立輿情預警系統,完善輿情研判預警機制,強化輿情控制能力。有效監控各個自媒體社交平臺,及時把握輿情動態。高校輿情引導中,需要基于完善的檢測體系準確研判潛伏期[5],借助大數據讓網絡輿情信息能夠進行實時統計與分析,篩選出有意義和有價值的輿情信息,以此做出合理分析,為高校輿情引導提供幫助。
第三,培育新型主流媒體,加強陣地建設,優先搶占話語主導權。建立融媒體中心,匯聚全校宣傳合力,打造積極主動的正能量輿論場,通過不斷輸出優質內容,提升學校官方媒體宣傳公信力。做好輿情應急準備,設置輿情處置預案,第一時間做出快速響應,及時應對,力求將高校輿情遏制在萌芽階段,防止事態蔓延,以便高校掌握主導權。
第四,建立健全輿情引導方法,提升輿情處理成效。建立素質全面的輿情工作隊伍是強化學校對網絡輿情引導能力的最有效方式之一。在網絡輿情管理隊伍建設中,需要注重管理人員、教師、學生在網絡輿論引導中三位一體的作用[6]。強化校內思政工作者輿情意識和專業素養,有效疏導學生情緒,引導其正確認識各類輿情及意識形態風險,降低網絡輿情爆發風險。
六、結語
網絡技術更新迭代,社交媒體層出不窮,高校網絡輿情的復雜性、敏感性、多發性等自身特點,為高校網絡輿情的控制帶來了新的挑戰。本文采用數據挖掘技術,通過對本校百度貼吧主題帖進行挖掘分析,發現高校學生群體在網絡平臺上關注的熱點話題,并進行情感分析,進而提出符合高校網絡輿情特征的輿情引導策略。但受數據源的影響,本文的分析存在一定局限性,未能完全概括高校網絡輿情熱點話題及其情感趨勢。接下來,將擴大研究數據范圍,更進一步研究高校網絡輿情預判及學生行為特點,為高校輿情提供更具實際參考意義的引導策略。H
參考文獻
[1]黃欽,關鵬,裴敏俊,等.國內高校網絡輿情研究熱點及趨勢分析[J].高校輔導員學刊,2018,10(05):76-82.
[2]張卓琳.探討網絡輿情熱點話題的傳播模式[J].傳媒論壇,2018,1(11):96+98.
[3]楊單,程鍵,姚怡琦,等.基于文本挖掘的高校網絡輿情用戶情感分析研究[J].武漢紡織大學學報,2020,33(05):74-80.
[4]杜嘉慶.新時代高校網絡輿情的特征、風險和對策[J].北京教育(高教),2022(06):48-50.
[5]朱寶華,胡成旭.新媒體背景下高校網絡輿情分析與引導對策研究[J].中國地市報人,2022,(05):107-109.
[6]隗瑋.新媒體背景下高校網絡輿情特征與引導策略[J].新聞研究導刊,2021,12(06):43-44.
基金項目:河南省高校人文社會科學研究一般項目,項目名稱:基于數據挖掘的高校網絡輿情熱點話題分析及引導策略研究(項目編號:2022-ZZJH-132)