鮑磊 曾子濟 閆瑾


摘要:嗶哩嗶哩(以下簡稱B站)作為近幾年快速發展的視頻網站,吸引了大量的年輕人將時間與精力投入其中,使其用戶年輕人居多,B站用戶平均年齡在21歲左右。以對B站的熱門視頻的評論進行分析,探究青少年使用智慧媒體的情況及智慧媒體對青少年的影響。通過爬蟲爬取B站的熱門視頻的評論作為數據集,對這些數據處理通過聚類分析和神經網絡處理得出結論。現階段網絡智慧媒體平臺的評論區存在明顯的網絡水軍行為,這些網絡水軍行為極易誘導青少年的情緒和思考方式,這種影響可能比學校和家庭對青少年的影響更加嚴重。因此,在青少年教育中如何避免網絡水軍對青少年產生不良影響需要政府,教育工作者和網絡智慧媒體平臺共同使用技政策和教育手段來遏制網絡水軍對青少年產生不良影響。
關鍵詞:聚類分析;智慧媒體;青少年行為;網絡水軍
1緒論
本研究的目的在于使用神經網絡和機器學習的方法探索和發現青少年在使用智慧媒體時的行為模式,為研究青少年受智媒影響的行為模型的建立和定量分析智媒對青少年行為影響的數據建模與算法提供基礎。
本研究的意義在于通過使用聚類分析和神經網絡的方法研究智媒中與青少年相關內容的產生機制和傳播方式以及青少年受智媒影響的行為模型,從中發掘出對青少年教育。
2研究過程
2.1數據收集
本文研究所采用的評論數據使用的是B站排名前一百的熱門視頻評論,由于B站的活躍用戶平均年齡在23歲左右;因此,B站熱門視頻的很大程度上反映了年輕人的行為模式,故選擇其排名前一百的熱門視頻評論作為研究數據。
2.2數據預處理
將收集到的評論進行分詞,然后根據每個評論的分詞結果計算每個詞的詞向量,并將每個評論里每個詞的詞向量進行加和為每個評論的特征向量進行后續的數據分析。
2.3數據分析
將處理過評論根據其特征向量進行聚類分析。本研究使用的是K-means聚類分析,本次研究采用同時評估手肘法和輪廓系數這兩種指標來確定最佳k值。
手肘法評估k值是否合適的標準為SSE,評估方法為,當k值小于最佳聚類數時,SSE的下降幅度會很大,而當k值到達最佳聚類數時,SSE的下降幅度會減小,然后隨著k值的繼續增大而趨于平緩。將本研究的數據進行K-means聚類分析并輸出SSE值后,根據手肘法評估最佳k值應為3。
輪廓系數法:使用輪廓系數來確定,選擇使系數較大所對應的k值。公式:
其中,a表示質心與同一簇中其他點的相似度;b表示樣本點與下一個最近簇中其他點的相似度。將數據進行K-means聚類分析并計算輸出輪廓系數后,根據輪廓系數評估最佳k值應為2。
根據上述的評估結果,會發現手肘法計算和根據輪廓系數計算出的k值不一樣,可能是b和a都很大的情況下b相對a大的更多,從而導致SSE較大,所以,綜合評估輪廓系數得到的k值和手肘法得到的k值,最終確定最優k值為3,將樣本分為3類。
3結果分析
根據上述數據分析可以將所獲取的約18萬條評論分為3大類。其中第一類占比最多約為51.65%,第二類占比約為31.13%,第三類占比約為17.22%,同時使用神經網絡對評論進行情感傾向判斷,其中33.65%的評論情感傾向為積極,41.13%的評論情感傾向為中立,25.22%的評論情感傾向為消極。
第一類評論(圖3.1)中42.98%的評論情感傾向為積極,25.65%的評論情感傾向為中立,31.36%的評論情感傾向為消極,帶有情感傾向的評論占比明顯高于未分類的占比,因此,對“積極”和“消極”的評論所屬的用戶名進行聚類分析,發現“積極”和“消極”的評論其所屬的用戶名格式存在大量雷同現象,約占第一類評論中帶有情感傾向的評論的32.15%,如:一串字母+數字,xx+在+地區名和一串隨機字母等組合,因此可以判斷存在水軍刷評論的可能性;然后對“中立”的評論的用戶名進行上述聚類分析,發現其中用戶名格式雷同的數量約占其總體的5.45%,存在水軍刷評論誘導輿論的可能性較小。
第二類評論(圖3.2)中25.86%的評論情感傾向為積極,54.87%的評論情感傾向為中立,19.27%的評論情感傾向為消極,第二類評論中的情感傾向占比較弱,無情感傾向的評論增加;對第二類評論中“積極”和“消極”的評論所屬用戶名和“中立”的評論所屬用戶名分別進行聚類分析,結果為“積極”和“消極”的評論所屬用戶名中用戶名雷同的情況約占其總體的12.78%;“中立”的評論所屬用戶名中用戶名雷同的情況約占其總體的2.63%,因此可以判斷水軍刷評論的可能性較小。
第三類評論(圖3.3)中19.74%的評論情感傾向為積極,62.72%的評論情感傾向為中立,17.54%的評論情感傾向為消極,由此可知第三類評論中評論情感傾向積極和消極的占比大幅度低于未分類時的占比。使用聚類算法對第三類評論中“積極”和“消極”的評論所屬用戶名和“中立”的評論所屬用戶名分別進行分析,結果為“積極”和“消極”的評論所屬用戶名中用戶名雷同的情況約占其總體的5.28%;“中立”的評論所屬用戶名中用戶名雷同的情況約占其總體的0.86%,因此可以判斷水軍刷評論的可能性很小。
4結論
根據上述分析結果可知,b站絕大多數評論多帶有較重的情感因素,與此同時,在有明顯情感傾向的評論中容易混雜網絡水軍發言,網絡水軍通過眾多的小號可以大量發表明顯情感傾向的評論煽動他人。青少年的三觀正處于成型的關鍵階段,且更加頻繁的接觸網絡,容易受到他人在網絡上發言的影響,因此網絡水軍對青少年的影響也更加顯著,青少年也容易在自己不知情的情況下情緒被誘導,從而忽視了自己想法,為網絡水軍所造成的事態推波助瀾。
綜上所述,現階段網絡智慧媒體平臺(如:B站)的評論區存在明顯的網絡水軍行為,由于B站等智慧媒體平臺的用戶平均年齡較為年輕,且青少年更容易受到網絡上的言論影響,這種影響可能比學校和家庭對青少年的影響更加嚴重;因此,在青少年教育中如何避免網絡水軍對青少年產生不良影響需要政府,教育工作者和網絡智慧媒體平臺共同使用技術,政策和教育手段來遏制網絡水軍對青少年產生不良影響。
本論文為國家社會科學基金項目《數據賦能的智慧媒體對青少年行為模式變化影響的研究》(項目編號:19BXW120)支持的階段性研究成果。
參考文獻:
[1]田海燕.智慧媒體對青少年價值觀影響探析[J].傳播力研究,2020,4(11):171-172.
[2]杜建民.智媒時代青少年傳統文化閱讀推廣策略[J].中國出版,2018(14):29-31.
[3]王柳涵.基于內容分析法的科普視頻內容與彈幕解讀——以B站“羅翔說刑法”系列視頻為例[J].新聞研究導刊,2022,13(08):82-84.
[4]何苑,張洪忠,蘇世蘭.基于算法推動的文化傳播“破圈”機制研究——以B站“法國音樂劇”的傳播為例[J].福建師范大學學報(哲學社會科學版),2022(03):113-126+172.
[5]孫強.基于Word2Vec詞向量維度媒體與公眾潛在語義的網絡議程設置研究[J].長江師范學院學報,2021,37(05):56-63.DOI:10.19933/j.cnki.ISSN1674-3652.2021.05.007.