NLP-Based Sentiment Analysis of Wahaha's Patriotic Branding
一ACaseStudyofBilibiliBullet-Screen Texts
ZHANG Chuhua, LIANG Ling (NanfangCollege Guangzhou,Guangzhou Guangdong,51O97O,China)
Abstract:Therapid developmentof naturallanguage procesing technology hasprovided new methodological supportforsocial scienceresearch.Thisstudyfocusesonthefieldofsentimentanalysis,takingBilibilibuletcommentsastheeseachojet,andusingOctopuscollectorandROSTCM6toltoobtainreal-timeinteractiondataofuserstowardsWahahaenterprise.Byusing text miningtechologytoachievestructuredtransformationofunstructureddata,combinedwithmethodssuchaswordfrequencystatitics,emantic networkanalysis,andsentimentpolarityclasifcatio,thesystemnalyesusersentimentfedbackcharacteristics.Research hasfoundthattheconstructionoforporateimagepresentstree-dimensionalcharacteristicsofproductdesignntrepreneurialspiit, andbrandiage,andsocialmediapltformsformemotionalresonanceefectsthroughthecommunicationchainof \"enterpriseplat formconsumerbarage\".TheresearchresultsnotonlyverifytheapplicabilityofNLPtechnologyinthefieldofsocialsiences,but alsoprovideempiricalevidenceforthebrandcommunicationstrategyofthnicenterprisesinthenewmediaerarevealingtheimpor tantroleofdigitalspatialemotionalmobilizationmechanismintheconstructionofcorporatesocialvalue.Thisstudyhasopeedup newresearch pathsforthesocial scienceaplicationsof digitaltechnologythrough interdisciplinarymethods innovation.
Key Words: NaturalLanguageProcessng (NLP);Sentimentanalysis; Wahah'sPatritic Branding; Bullet-screen texts;Socialmedia;Real-time interactive data
數字技術的進步推動了大語言模型建構自然語言處理體系(NLP),情感分析作為其核心應用,通過量化句子情感為行為與認知研究提供新方法。嘩哩嘩哩(B站)日均5000萬條彈幕中, 12.6% 涉及民族品牌議題,其彈幕評論文本表達形成了獨特的網絡情感生態。然而,情感分析領域的研究多聚焦于傳統文本,社交媒體新興文本利用率低,大眾對民族品牌的情感分析缺乏系統探討。因此,利用現代技術與社會熱點相結合進行研究,結合民族品牌的市場表現、消費者行為數據及社會熱點,進行跨領域的信息融合分析,可以揭示品牌與公眾情緒之間的復雜關系,為品牌策略提供更全面的決策支持。同時,構建的情感詞典和分析模型具有廣泛的應用價值,如品牌管理、市場研究、公共關系危機預警等。
通過分析大量相關文獻發現,國內外在情感分析領域的研究已取得了顯著進展,但國內外情感分析領域仍存在以下幾個方面的問題:第一,對社交媒體環境下高度復雜和主觀的情感缺乏深入的分析和理解。第二,詞典構建方面,現有的情感詞典構建方法主要集中在通用情感或特定領域的情感上,如何玲玲(2019)對醫療在線評論的情感分析,謝晉陽(2023)對體育賽事話語表達的探究。這些都進一步展示了情感話語分析的廣泛應用,然而社交媒體語境下的情感表達具有碎片化、符號化等特征,現有詞典未能覆蓋此類場景2。因此,亟須構建適配社交媒體語境的情感詞典。第三,在企業宣發方面,現有情感分析多停留于粗顆粒度情感極性識別,未能針對公眾話語解讀細顆粒度情感,因此難以在實踐上為企業的宣發提供建設性建議。
面對數字化進程加速,未來需突破單一領域限制,探索多領域的情感分析方法;技術迭代將推動NLP在輿情管理、品牌價值建構等場景的應用,實現學術研究與商業實踐的雙向賦能。
1 理論基礎
1.1 自然語言處理(NLP)
自然語言處理是人工智能的重要分支,融合了人工智能、計算機科學和語言學等領域,讓計算機理解、生成和處理人類語言。在自然語言處理發展的過程中產生了三類自然語言處理研究方法:基于規則的方法,自然語言處理的實現主要通過人工編寫規則來完成,這種方法無法全面地讓計算機理解和生成自然語言;基于機器學習的方法,主要是通過統計的方法實現自然語言處理任務,但是數據的收集需要耗費高額的成本且技術復雜;基于深度學習的處理方法,主要通過利用神經網絡完成自然語言處理,其中預訓練模型Transformer架構和BERT、GPT等顯著提升了語義理解能力,推動NLP在多領域的商業化應用[]。
1.2 情感分析
情感分析是自然語言處理的核心應用,自然語言處理的發展為情感分析奠定了理論基礎。情感分析主要分為三個層次:第一,文檔(document)級別,即對整個文檔進行情感分類并進行二分化處理,即分為正、負兩類情感,如產品的整篇評價;第二,句子(sentence)級別,即對文檔中的每個句子進行情感分類,分為正、負和中性三類情感,如產品評價中的一句話;第三,實體(entity)級別,即識別出主題目標,將其分成幾個層面并挖掘出人們在多個維度對該實體的情感喜好[5]。
情感分析通過量化情感分值對文本數據進行分析,利用這種處理方法可以將情感分析數據應用于很多方面。鐘佳娃(2021)認為情感分析領域的熱門主題主要集中于社交媒體、在線評論與商業投資。同時,隨著電子商務的發展,這項技術也成為企業研究消費者用戶需求的關鍵技術。例如,企業借此了解用戶對產品的態度或判斷線上評論中的情感言論
1.3 企業宣發
企業宣發即企業生成內容,指企業在社交媒體發布的官方信息,包括顯意識內容(如產品宣傳視頻)和潛意識內容(如宣發視頻中的情感事件),前者促進理性購買意愿,后者增強情感依附。企業在社交媒體上宣發后,消費者產生的彈幕文本具體表現為顧客契合,即顧客在認知、情感和行為上對企業的表現水平。邵明星(2024)認為高契合顧客會與企業互動并產生消費行為,帶來直接利潤,同時表現出強烈的滿意,形成理性忠誠和情感依附,這對企業可持續發展至關重要。
1.4 情感詞典
詞典建構主要有以下兩個途徑:第一,現成詞典。使用已有的情感詞典,如SentiWordNet、情感詞典BosonNLP、中文情感詞匯本體說明文檔等。這些詞典已經包含大量標注好的情感詞匯和對應的情感分值,可以直接使用這些詞典來進行情感分析,或者作為基礎進行擴展和調整。第二,自定義詞典。根據具體應用領域構建自定義詞典。例如,在分析愛國情感時,詞匯“愛國\"可能被標注為正向詞匯,而“賣國”則為負向詞匯,這有利于比較情感的強烈,但是其中的情感詞使用范圍比較有限。因此,將中文情感詞匯本體庫作為基礎詞典擴充特定領域的詞典,以便對一般的數據進行定性分析。此詞典將初始情感強度設置為1、3、5、7、9五個等級[1,對比其他詞典,它的情感強度劃分得更為細致。
2 研究設計與分析
2.1 研究問題、目的、對象與工具
研究問題:一是領域詞典構建問題,即如何構建適用于企業情感領域的詞典?二是公眾情感話語解讀問題,B站彈幕評論文本中用戶對娃哈哈品牌的情感表達具有哪些特征?其背后蘊含的社會文化因素,如民族認同、消費觀念與心理動因如何相互作用?三是企業宣發優化問題,“企業一平臺—消費者一彈幕\"四要素構成的社交媒體傳播鏈條中,如何利用情感分析優化傳播鏈條四要素賦能企業發展?
研究目的:本研究旨在深入剖析B站平臺彈幕文本中公眾情感表達的深層次特征;通過解決以上研究問題,更全面地理解用戶在品牌宣發中的情感反應模式,為品牌傳播策略的優化提供實證依據,為企業宣發提供對策和建議。
數據收集與處理:通過八爪魚采集器獲取2023—2024年總計3002條彈幕數據,總字數超11萬字,并進行高頻詞分析。
匹配情感詞典:本研究針對現有情感詞庫在情感領域覆蓋不足的問題并基于中文情感詞匯本體庫人工篩選4070個基礎詞匯,結合企業特色補充447個涵蓋產品設計、企業家精神等維度的專屬詞匯,構建了娃哈哈情感專屬詞庫。
2.2 高頻詞特征詞分析
高頻詞特征詞的分析包括提取分詞、過濾停用詞和分析詞頻。過濾停用詞可減少語句混亂,提高分析的精準度。詞頻可以生動地反映網民關注度和情感,高頻詞集中體現群眾對娃哈哈企業宣發的情感表達。本研究利用ROSTCM6中的詞頻分析功能進行提取,選取排名前50的高頻詞進行展示(見表1),并利用詞圖云進行可視化(見圖1)。由表1可見,娃哈哈以1205次頻數領先,彰顯品牌強大影響力。愛國、宗慶后分別位列第二、第三,體現觀眾對品牌文化、企業家精神的高度關注。民族、國家等詞頻復現,反映民族情感與國家認同。宗慶后被高頻提及,顯示人們對其個人形象的認可。
2.3 情感分析
彈幕情感分析旨在判定文本情感積極性和強烈程度,綜合所有評論判定整體態度(見表2和表3)。娃哈哈B站彈幕反映群眾對企業宣發的情感,包括積極評價如企業家精神、產品設計等,以及消極評價如民粹主義、產品銷售等問題。情感分析深入挖掘文字價值,探索群眾深層情感。
B站網民在發布彈幕時情感復雜多變,因此在進行情感分析前,需要對評論數據進行二分化處理,分界積極、中性和消極評論。ROSTCM6軟件能挖掘用戶情感傾向并進行系統打分.因此,本研究用ROSTCM6軟件中的情感分析功能對彈幕評論文本進行分類和統計并進行對比分析(見表4)。
由表2可知,在娃哈哈愛國情感表達中,產生積極情緒的用戶占比為 77.90% ,產生中性情緒和消極情緒的用戶占比分別為 0.53% 和 21.57% ,二者之和為 22.1% ,占比較大。結合表4具體分析,能夠發現群眾對娃哈哈的情感積極情緒較高,且積極情緒中的高度積極情緒占比較高,為 39.30% ,說明娃哈哈品牌在一定程度上獲得了消費者的喜愛,但消極情緒中的一般情緒和中度情緒之和為 13.54% ,說明娃哈哈在企業宣發過程中存在一定問題,仍有進步空間。




2.4社會語義網絡分析
為進一步分析娃哈哈彈幕文本中各要素之間的關系所呈現關鍵詞和主要話題,解讀不同概念的屬性和連接關系,基于高頻詞統計,建立了共現矩陣和社會語義網絡圖(見圖2)。


由圖2可以看出,以“娃哈哈”為中心的共現矩陣圖中二級關聯詞“企業\"“企業家\"“宗慶后\"“社會(企業家精神)\"“細節\"“飲料(產品設計)\"“愛國”“民族”“國家(品牌形象)\"為社會語義網絡圖中的重要節點,周圍其他節點基本是從這幾個節點發出或者指向這幾個節點。這說明娃哈哈彈幕文本中的情感基本圍繞這幾方面展開的,觀察到引發群眾情感的彈幕文本主要為:企業家精神、品牌形象、產品設計。
3結論
首先,數據集建立。本研究將愛國企業娃哈哈作為研究對象,利用社交媒體平臺數據爬蟲工具八爪魚采集器收集彈幕文本,并結合情感分析工具ROSTCM6、ROSTEA、哈工大停用詞表stopwords,將采集到的數據進行預處理,共采集了3000多條情感彈幕文本,字數總計超11萬。
其次,構建了情感詞庫。采用中文情感詞匯本體庫作為基礎詞庫,人工篩選4070個基礎詞匯,結合企業特色補充447個涵蓋產品設計、企業家精神等維度的專屬詞匯,構建了企業愛國情感專屬詞庫。
再次,本文利用ROSTCM6中過濾詞表、中文詞頻統計、情感計算和社會語義網絡等功能進行個案分析娃哈哈企業宣發過程,并通過細致劃分情感表達的分類特征,從高頻詞特征詞分析、情感分析和社會語義網絡分析三個層面,對公眾話語進行解讀。
最后,本研究基于娃哈哈彈幕文本情感分析,構建\"企業—平臺—消費者—彈幕\"情感傳播鏈路并提出以下三點建設措施:
第一,企業賦能。企業應在制定宣發策略時,提升社交媒體情感分析的作用以貼近消費者的情感期待。利用情感分析定位企業改進產品設計,并通過語義網絡分析識別輿情風險,提升危機響應效率。第二,平臺優化,雙維內容升級。基于高頻詞分析,一方面提升媒體豐富度,宣傳時具象化產品細節,增加話語的信息量和可信度2;另一方面進行內容動態優化,在視頻發布的不同時間,持續關注用戶反應,滿足用戶訴求并回應用戶疑慮。通過可視化信息縮短用戶心理距離,提升品牌可信度與情感共鳴。第三,顧客契合,雙向互動。通過提升企業生成內容與顧客契合度以實現雙方關系的正向發展,有針對性地發布適合不同情景的宣發內容。當推出新產品時,企業應立足顯意識內容,如產品設計、功能介紹和促銷信息,激發顧客購買意愿;在日常互動時,則應發布潛意識內容,如品牌故事、慈善公益和社群互動,加深與消費者的情感聯系,形成情感互動。第四,彈幕生態構建。通過關鍵詞引導,如“匠心”“國貨\"等,提升正向彈幕比例,利用B站圈層特性強化群體共識。當相互支持的情感不斷匯聚,情感得以升華,更進一步促進了企業的發展。
4結束語
本研究通過情感分析技術實現非結構化數據的結構化轉換,對公眾愛國情感話語進行了系統解讀,為企業在社交媒體語境下的企業宣發策略提供了實證依據。未來可對國內外社交媒體平臺數據進行對比分析,探究不同類型企業的情感分析,進一步挖掘企業宣發的影響機制,豐富NLP理論。
參考文獻
[1]劉亞瓊.彈幕空間青年愛國情感的激發與展現:基于B站“爆款\"短視頻及其彈幕的分析[J].中國青年社會科學,2024,43(4):82-92.
[2]蔣翠清,郭軼博,劉堯.基于中文社交媒體文本的領域情感詞典構建方法研究[J].數據分析與知識發現,2019,3(2):98-107.
[3]姜杰.社交媒體文本情感分析[D].南京:南京理工大學,2017.
[4]車萬翔,竇志成,馮巖松,等.大模型時代的自然語言處理:挑戰、機遇與發展[J].中國科學:信息科學,2023,53(9):1645-1687.
[5]楊立公,朱儉,湯世平.文本情感分析綜述[J].計算機應用,2013,33(6):1574-1578,1607.
[6]鐘佳娃,劉巍,王思麗,等.文本情感分析方法及應用綜述[J].數據分析與知識發現,2021,5(6):1-13.
[7]邵明星,田夢影,范靜.企業生成內容與顧客契合:基于雙重編碼理論的實證研究[J/OL].軟科學,1-12[2025-02-20].http://kns.cnki.net/kcms/detail/51.1268.G3.20241012.1004.010.html.
[8]EVANIAS,LISTIANAE,ROSNANI T,etal. Theeffectofinfluencer marketing and content marketing on customerengagement and purchase decisions on followers [J].Asianjournal of economics,business and accounting,2023,23(2):12-20.
[9]王科,夏睿.情感詞典自動構建方法綜述[J].自動化學報,2016,42(4) :495-511.
[10]陳建美.中文情感詞匯本體的構建及其應用[D].大連:大連理工大學,2009.
[11]王飛飛.基于游客網絡評價的煙臺張裕葡萄酒旅游體驗研究[D].煙臺:魯東大學,2023.
[12]屈思淼.我國官方社交媒體國際傳播力影響因素研究[D]武漢:華中科技大學,2022.