任琳


摘 要: 為了掌握學生思想動態,針對性的提供思想政治教育策略,提出了一種基于網絡媒體和數據挖掘的大學生思想動態評估方法。利用網絡爬蟲抓取官方微博內容和評論內容,提取和分析關鍵詞;其次,通過詞云展示和K-means聚類分析及時掌握大學生的思想動態。研究結果表明,通過詞云展示和聚類分析可以有效獲取一段時間內大學生所關注的熱點話題,為大學生思想政治教育提供有針對性的方法和策略,幫助大學生樹立正確的價值取向和思想觀念具有重要的指導意義。
關鍵詞: 網絡媒體; 數據挖掘; 聚類分析; 思想政治教育; 網絡爬蟲
中圖分類號: G 641 ? ? ?文獻標志碼: A
Abstract: In order to grasp the university student thought varying in time, and provide a pertinence ideological and political education strategy, this paper presents a method of dynamic evaluation of college students thoughts based on network media and data mining. First, the Web crawler is used to capture the content of official Weibo and comments, and to extract and analyze key words. Second, the word cloud display and K-means cluster analysis are used to grasp the ideological trends of college students. The results show that the word clouds display and cluster analysis can effectively capture the hot topics that college students have been concerned about for a time period, and provide targeted methods and strategies for college students ideological and political education, it is of great significance to help college students set up correct value orientation and ideological concept.
Key words: network media; data mining; cluster analysis; ideological and political education; Web crawler
0 引言
對大學生思想動態進行評估有助于學校和輔導員開展學生工作。目前這個階段,1995年以后出生的大學生是校園大學生的主力,他們思想活躍、開放、好奇心強和內心較脆弱敏感,思想狀態較難及時地掌控。傳統思政教育以課堂教育為主,更多的是教授思想政治方面的理論知識,無法掌握學生的思想動態[1-2]。
為了幫助學校和輔導員及時掌握大學生的思想狀態,有針對性地開展大學生思想政治教育工作,本文提出一種基于網絡媒體和數據挖掘的大學生思想動態評估模型。通過抓取大學生微博發布的內容,結合情感分析、特征詞提取和自然語言處理等技術,運用聚類、主題檢測和關聯分析等數據挖掘方法,構建大學生思想動態和微博內容之間的關系。
1 技術方法和實驗流程
1.1 技術方法
本文涉及的技術方法主要包括抓取微博數據和話題聚類技術[3-4]。抓取微博數據主要通過網絡爬蟲計算程序實現,主要抓取官方微博用戶數據,如學生社團微博、高校官方微博、各學院官方微博以及班級微博等,這類用戶社會影響力和傳播效果較大。
話題聚類技術主要將抓取到的微博數據提取出關鍵詞,之后運用其技術來進行聚類分析獲得話題類型,依照話題類型能夠掌握其思想狀態和思想波動狀態。通過聚類將話題提取的關鍵詞分成若干個類別,可以掌握大學生關心的話題類型,從而掌握大學生的思想動態情況。
1.2 實驗流程
基于網絡媒體和數據挖掘的大學生思想動態評估流程包含三部分,分別為微博信息及評論抓取、微博內容的解析與關鍵詞的可視化。微博信息和評論抓取主要抓取高校微博、班級微博和社團微博等;微博內容的解析主要包括微博網頁內容的解析、關鍵詞存儲等;關鍵詞可視化主要是實現聚類關鍵詞的展示,實驗流程圖如圖1所示。
2 K-means聚類算法
3 實驗與結果分析
3.1 抓取微博內容
文中通過URL鏈接和網絡爬蟲設計,抓取陜西省2016年7月~2016年10月4個月內部分大學官方微博、社團微博等所發布的內容和評論,抓取部分關鍵詞:
研究生入學考試、北京郵電大學、上海交通大學、招生簡章、考研、創業、面試、就業率、思想政治教育、道德、愛情、計算機組成原理、數據結構、通信原理、學生超市、法律、奧運會、211、985、雙一流、競賽、高校等。
3.2 環境平臺
文中編程操作系統為Windows 7,內存8 GB、中央處理器為Intel(R)Core(TM)i5-2400 4-core,CPU的主頻為2.60 GHz,編程軟件平臺為Matlab2015(a)。網絡爬蟲基于Matlab軟件平臺設計,主要運用urlread函數和regexp函數讀取和解析網頁數據。
3.3 結果分析
由模型動態來分析,能夠比較快的掌握大學生思想動態,幫助其解決心理困擾,疏導他們的行為規范。文中通過詞云圖和K-means聚類分析等模型[8-9],預測他們的思想狀態,提高思政教育工作的及時性和可靠性。
(1) 詞云圖與思想動態預測
通過抓取微博內容、提取關鍵詞,將關鍵詞通過詞云圖展示出來,其中出現頻率越高字體相對較大,也就是該詞匯是大學生群體所討論的熱點話題,詞云圖如圖3所示。
由圖3可得,這段時間出現頻率比較高的詞匯有奧運會、金牌榜、馬蓉和里約等,說明這段時間大學主要關注馬蓉出軌事件和里約奧運會。與學習相關的詞匯有考試、招生簡章、教育和圖書館等,但是這些詞匯的出現頻率不是太高,說明這些問題尚未成為熱點話題。通過詞云圖分析,可以及時掌握大學生的思想狀態,開展有針對性性的大學生思想政治教育。
(2) 聚類結果分析
由于詞云圖只能宏觀的查看話題關鍵詞,無法查看一段時間內的大學生所關注的話題熱點,運用K-means進行聚類分析,分析結果如圖4所示。
由圖4可知,這段時間大學生主要關注如下幾個話題。
1) 討論較多的話題為里約奧運會開幕,他們關心的話題有體育明星等,說明奧運會在他們中間的歡迎程度,從側面可以看出這些學生的思想是積極向上的,喜歡運動并關心國家時事。
2) 討論較多的話題為王寶強與馬蓉離婚案,說明他們的好奇心與圍觀心理較強[10-11],喜歡看娛樂新聞。觀看這類新聞有利于舒緩學習壓力;但如若大學生過分關注這類新聞將影響大學生的思想觀念和價值取向。因此,需要及時幫助大學生樹立正確的價值取向和思想觀念。
3) 討論較多的話題與學習息息相關的話題,如圖書館、招生簡章、考研、就業等。這段時間說明大學生們比較關心自己的前途和未來。因此,可以加強大學生的考研輔導和畢業生就業工作指導等,為大學生提供相關指導和服務,消除大學生內心的擔憂和恐懼。
4 總結
本文運用網絡爬蟲抓取官方微博內容和評論內容,提取和分析關鍵詞,通過詞云展示和K-means聚類分析及時掌握思想動態,獲得一段時間內他們所關注的熱點話題,為大學生思政教育提供有針對性的方法和策略,幫助大學生樹立正確的價值取向和思想觀念具有重要的指導意義。
參考文獻
[1] 鄭永廷. 大學生思想政治教育質量提升的理論研究[J]. 思想教育研究, 2013(6):14-16.
[2] 鄒興平, 艾楚君. 基于層次分析法的"年級主題+基礎"大學生思想政治教育模式的構建[J]. 湘潭大學學報(哲學社會科學版), 2008, 31(6):157-160.
[3] 姚運肖, 武宇清. 基于層次分析法對大學生思想政治工作的探索[J]. 山西農業大學學報(社會科學版), 2011, 10(6):541-544.
[4] 黃曉麗, 曹硯輝. 大學生思想動態監測指標體系初探[J]. 創新與創業教育, 2016, 7(4):143-146.
[5] 趙光華, 鐘京鳳. 基于AHP的大學生思想政治教育有效性評價[J]. 中國成人教育, 2010(4):59-61.
[6] 劉愛榮, 宋子君, 黃妍. 層次分析法在高等學校學生工作績效評價中的應用[J]. 遼寧科技學院學報, 2011, 13(3):97-99.
[7] 張彥坤, 李航, 韓萌. 基于AHP-Fuzzy模型的輔導員工作精品項目的評價[J]. 科技與管理, 2016, 18(2):109-113.
[8] 于紀航. 基于AHP的大學生心理障礙誘發行為評價模型[J]. 金融理論與教學, 2013(2):104-106.
[9] 許慧遠. 基于AHP和BP神經網絡理論的大學生綜合素質測評研究[J]. 思想教育研究, 2009,11(1):200-204.
[10] 孟祥瑞. 基于RAGA的投影尋蹤的大數據時代的大學生思想政治與日常表現評價研究[J]. 經濟師, 2018(3):65-68.
[11] 易云飛, 黃澤, 李林. 改進K-means聚類算法在高校團組織建設中的應用研究[J]. 軟件導刊, 2009(10):72-74.
(收稿日期: 2020.02.25)