鄧飛
網絡對于高職院校學生具有極強的粘度和網絡傳播連鎖效應,因此高職網絡輿情的應對和處理就尤為重要。基于情感維度的大數據網絡輿情情感傾向性分析的研究,可對高職院校網絡輿情應對與處理進行實證分析。利用網絡爬蟲技術和機器學習技術方法對高職院校學生關注的網絡輿情進行情感趨勢和維度要素的實例分析,根據模型決策結果為高職輿情預警程度的判定、情感維度及狀況提供參考。
問題的提出
新聞輿論工作是黨的一項重要工作,輿論引導能力是國家治理能力的重要內容。隨著社會對網絡輿情重視程度的不斷提高,很多學者對高校網絡輿情涉及到的各領域問題進行了系統研究,包括高校網絡輿情的傳播路徑、形成機制、影響效果、事前、事中和事后的應對與處理等方面。這些豐碩的研究成果無疑為高職院校網絡輿情應對和處理提供了豐富的理論基礎和知識背景支撐。但縱觀這些研究,仍然存在一些不足之處。
首先,現有研究方法一般采用整體描述,缺乏有針對性的聚焦研究,特別是在實證研究方面缺少數據支撐,使得結果難以得到科學的驗證;其次在研究內容上,現有的研究局限于事件本身而忽視了與之高度關聯的社會結構和社會文化;最后,在研究視角上,現有的研究主要集中在學生思想教育方面,而忽視了情感維度分析對輿情形式的研判、預警和系統引導作用。綜上所述,本文基于情感維度的大數據網絡輿情情感傾向性分析的研究對高職院校網絡輿情應對與處理進行實證分析,利用網絡爬蟲技術和機器學習技術對高職院校學生關注的網絡輿情進行情感趨勢和維度要素實例分析,根據模型決策結果為預警程度的判定,為情感維度及狀況提供參考。
高職院校網絡輿情模型構建
輿情理論分析
結合高職院校學生群體和網絡平臺的特點,可以發現:第一,高職學生的需求具有方向一致性和內容個性化的特點。一致性是指高職學生關注點的認同是類似的,個性化是指評論主體由于個體需求及所處環境不同,關注的具體問題不同;第二,高職院校網絡輿情情感態度存在對立面且具有動態性,對于同一社會現象的評論風向往往存在3種情緒:正向情緒、負向情緒和客觀情緒;第三,網絡輿情情感態度表現出顯性和隱基金項目:2019年度全國統計科學研究項目(2019LY69)性的特征。
基于情感維度的大數據網絡輿情情感傾向性分析模型構建
1.構建情感維度變量
情感維度是指群體在網絡輿論語境環境下,需要一些變量來指代情感態度的級別,如輿情強度、輿情情緒以及輿情關注對象。輿情強度變量標簽使用低、中、高表示;輿情情緒使用中性、負向和正向表示;輿情關注對象使用切身利益、關注他人、關注社會表示。
2.分析模型構建基本流程
基于情感維度的大數據網絡輿情情感傾向性分析模型構建步驟包括:利用requests模塊和Xpath模塊編寫微博爬蟲程序,使用SnowNLP模塊進行中文分詞和詞性標注,構建情感詞典、提取情感傾向詞、測算微博輿情情感分值以及數據可視化。
3.輿情數據抓取
本文以2020年8月14目的微博熱搜主題“北京高校秋季開學的疫情防控規定”為數據來源,利用Python語言編寫的爬蟲程序來抓取該主題下的轉發數量、評論數量和具體文本內容以及點贊數量。截止到2020年8月22日,轉發數量為2636條,評論文本為5547條,點贊數量為139007條。
4.利用抓取的微博數據進行情感分析
本文微博網絡輿情文本分析庫采用的是Pyhon第三方庫中的Snow自然語言處理庫。Snow自然語言處理庫使用了基于字符生成的模型進行中文分詞,利用三階隱馬算法進行詞性標注,應用樸素貝葉斯算法進行文本分類,最后基于文本分級算法進行提取文本關鍵詞。情感詞提取利用構建的情感詞典對該微博評論文本的情感詞進行判別、抽取,將情感詞映射到所屬類型上,最后計算該網絡輿情所包含的情感類別頻次。
本文參考情感測算公式,計算文本中正向情緒詞、負向情緒詞以及中性情緒詞的數量進行傾向性計算。微博評論抓取的分析結果集中在0.6以下,因此輿論風向傾向于消極,積極情感較為欠缺。
網絡輿情應對與處理
從上述模型的分析結果看出,假如輿情表現出強烈的負向傾向,將會像導火索一樣引爆某個群體,引導整個校園輿論論調的滾動方向。因此,高職院校網絡輿情應對與處理應該考慮如下方法:
一是利用信息手段構建網絡輿情情感分析系統,重視事前應對。本文通過程序設計構建了一個輿情分析模型,從結果來看能夠比較真實地反映網絡用戶群體的思想動態。
二是利用網絡輿情分析系統中的關鍵詞抽取,找到學生訴求而消解誤解和矛盾。在本文的模型分析中通過文本分析可以得到一些高頻詞匯,這些詞匯背后往往蘊含著學生的訴求導向。
三是培養輿論領袖,引導“羊群效應”。從網絡輿情的發展來看,在微博、朋友圈或自媒體上看到了熱點事件后,部分學生一開始還是不會表現出積極的意識形態,但是在少數的學生個體表達完具有“感召力”的言論后,輿論論調迅速攀升。