

摘要:該文探討了Robust Sentiment Analysis(RSA) 模型在細(xì)粒度情感分類中的有效性,使用SST-5數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。本研究利用預(yù)訓(xùn)練模型的logits輸出作為句子特征向量,隨后通過支持向量機(jī)(SVM) 和多層感知機(jī)(MLP) 進(jìn)行二次訓(xùn)練。在實(shí)驗(yàn)中,對數(shù)據(jù)進(jìn)行了詳細(xì)的預(yù)處理,并對特征提取、模型訓(xùn)練和參數(shù)調(diào)優(yōu)進(jìn)行了系統(tǒng)性探索。同時(shí),比較了支持向量機(jī)(SVM) 和多層感知機(jī)(MLP) 在情感識(shí)別任務(wù)中的表現(xiàn)。實(shí)驗(yàn)結(jié)果表明,RSA模型提取的特征具有較強(qiáng)的判別能力,經(jīng)過SVM和MLP的訓(xùn)練后,分類性能顯著提高。研究驗(yàn)證了預(yù)訓(xùn)練語言模型在細(xì)粒度情感分析中的應(yīng)用價(jià)值,并為社交媒體輿情監(jiān)測等實(shí)際場景提供了有益的實(shí)踐指導(dǎo)。此外,文章還討論了模型在誤差、噪聲處理及局限性方面的挑戰(zhàn),并提出了未來優(yōu)化的方向。
關(guān)鍵詞:情感分析;SST-5數(shù)據(jù)集;預(yù)訓(xùn)練語言模型;微調(diào)技術(shù);自然語言處理
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2025)09-0038-04"開放科學(xué)(資源服務(wù)) 標(biāo)識(shí)碼(OSID) :
0 引言
首先,本文的基本概念有:1) 預(yù)訓(xùn)練模型是指在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練,以學(xué)習(xí)通用的知識(shí)和特征的機(jī)器學(xué)習(xí)模型。通過在大量的無標(biāo)簽或有標(biāo)簽的數(shù)據(jù)上預(yù)先進(jìn)行訓(xùn)練,模型能夠捕捉到語言、圖像或其他任務(wù)領(lǐng)域中的普遍規(guī)律和模式。預(yù)訓(xùn)練模型通常在完成基礎(chǔ)訓(xùn)練后,會(huì)針對特定任務(wù)進(jìn)行微調(diào),以適應(yīng)特定應(yīng)用場景。2) 情感分析是一個(gè)用于情感分析的標(biāo)準(zhǔn)數(shù)據(jù)集,它由斯坦福大學(xué)開發(fā),主要用于評估情感分類模型的性能。SST-5數(shù)據(jù)集是基于電影評論的文本數(shù)據(jù),包含五種情感類別:非常負(fù)面(verynegative) 、負(fù)面(negative) 、中性(neutral) 、正面(posi?tive) 和非常正面(very" positive) 。這個(gè)數(shù)據(jù)集的特點(diǎn)是每個(gè)句子都有人工標(biāo)注的情感標(biāo)簽,能夠幫助研究者訓(xùn)練和評估情感分析模型。3) 自然語言處理是計(jì)算機(jī)科學(xué)和人工智能的一個(gè)重要領(lǐng)域,旨在使計(jì)算機(jī)能夠理解、解釋、生成和與人類語言進(jìn)行交互。它涉及計(jì)算機(jī)與人類語言之間的橋梁,其目標(biāo)是讓計(jì)算機(jī)能夠像人類一樣理解和使用自然語言。
近年來,深度學(xué)習(xí)技術(shù)的飛速發(fā)展顯著推動(dòng)了自然語言處理(NLP) 領(lǐng)域在文本分類、機(jī)器翻譯和情感分析等多個(gè)任務(wù)中的進(jìn)步。情感分析是NLP的重要分支,核心任務(wù)是從文本中提取和判別隱含的情感信息。這對于理解用戶情緒、產(chǎn)品評價(jià)以及網(wǎng)絡(luò)輿情監(jiān)控具有重要意義。傳統(tǒng)情感分類方法主要依賴于人工設(shè)計(jì)的特征或基于詞典規(guī)則的情感詞表,這些方法在面對復(fù)雜語義表達(dá)及多樣化語言現(xiàn)象時(shí)常顯不足[1-2]。與此同時(shí),近年來興起的預(yù)訓(xùn)練語言模型(例如 BERT、DistilBERT 等) 通過大規(guī)模無監(jiān)督預(yù)訓(xùn)練學(xué)習(xí)到豐富的語義知識(shí),展現(xiàn)出了強(qiáng)大的上下文語義捕捉能力[3]。尤其值得注意的是,Robust Sentiment Analysis(RSA) 模型通過利用合成數(shù)據(jù)進(jìn)行訓(xùn)練,成功地解決了標(biāo)注數(shù)據(jù)稀缺的問題,同時(shí)在應(yīng)對各種語言變體、語法錯(cuò)誤以及噪聲干擾時(shí)表現(xiàn)出較高的魯棒性[4]。這種在多樣化應(yīng)用場景下均能保持較高準(zhǔn)確率的模型,為情感分類任務(wù)提供了全新的方法論和實(shí)現(xiàn)路徑。因此,探討如何充分利用該模型提取的深層語義特征,并結(jié)合傳統(tǒng)機(jī)器學(xué)習(xí)方法進(jìn)行情感分類,不僅具有理論創(chuàng)新意義,更具備廣泛的實(shí)際應(yīng)用前景,能夠?yàn)閺?fù)雜情感信息的準(zhǔn)確識(shí)別和高效處理提供技術(shù)支撐。
1 相關(guān)研究
1.1 研究現(xiàn)狀
當(dāng)前情感分析領(lǐng)域的研究主要分為基于傳統(tǒng)機(jī)器學(xué)習(xí)方法和基于深度神經(jīng)網(wǎng)絡(luò)方法兩大類。傳統(tǒng)方法(如支持向量機(jī) SVM 和樸素貝葉斯) 主要依賴低維人工設(shè)計(jì)特征,這類方法在一定程度上能實(shí)現(xiàn)情感極性的劃分,但由于無法充分捕捉文本中潛在的上下文信息,其性能在處理復(fù)雜語義和細(xì)粒度情感分類任務(wù)時(shí)受到較大限制[5]。另一方面,深度神經(jīng)網(wǎng)絡(luò)方法,特別是基于預(yù)訓(xùn)練語言模型的方法,利用 Transformer 等先進(jìn)架構(gòu)實(shí)現(xiàn)了多層次的語義表示,顯著提升了情感識(shí)別的準(zhǔn)確性[6]。然而,單純依賴深層神經(jīng)網(wǎng)絡(luò)在面對小樣本或特定領(lǐng)域數(shù)據(jù)時(shí),可能會(huì)因過擬合等問題而影響模型的泛化能力。近年來,一種兼具傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)優(yōu)點(diǎn)的混合方法逐漸受到研究者關(guān)注:先利用預(yù)訓(xùn)練模型提取深層語義特征,再通過傳統(tǒng)分類器(如 SVM、MLP) 對提取的特征進(jìn)行二次訓(xùn)練。相關(guān)文獻(xiàn)表明,基于 BERT 提取的向量特征不僅能顯著提高分類精度,還能在樣本數(shù)據(jù)較少的情況下展現(xiàn)出良好的魯棒性和泛化能力[7]。因此,如何在當(dāng)前混合方法基礎(chǔ)上進(jìn)一步優(yōu)化模型結(jié)構(gòu)、參數(shù)調(diào)優(yōu)以及數(shù)據(jù)預(yù)處理策略,以提升情感分類任務(wù)的整體性能,成為學(xué)術(shù)界和工業(yè)界亟待解決的關(guān)鍵問題之一[8]。本文所提出的基于 RSA 模型的特征提取與二次訓(xùn)練方法,正是在這一研究背景下應(yīng)運(yùn)而生,并有望為細(xì)粒度情感分類任務(wù)提供全新的解決方案。
1.2 研究目的
本論文實(shí)驗(yàn)的主要目標(biāo)是探討并驗(yàn)證利用 RSA 模型作為特征提取器,在細(xì)粒度情感分類任務(wù)中的應(yīng)用效果。為實(shí)現(xiàn)這一目標(biāo),我們采用了 RSA 模型的分類頭 logits 輸出作為句子的特征向量,通過該特征向量來捕捉文本中的深層語義信息。在此基礎(chǔ)上,我們構(gòu)建了兩種傳統(tǒng)機(jī)器學(xué)習(xí)分類器——支持向量機(jī)(SVM) 和多層感知機(jī)(MLP) ,對 SST-5數(shù)據(jù)集進(jìn)行情感分類任務(wù)的二次訓(xùn)練與評估。通過比較兩種后續(xù)分類器在利用 RSA 模型提取的深層特征進(jìn)行情感判斷時(shí)的表現(xiàn),我們希望揭示預(yù)訓(xùn)練語言模型在細(xì)粒度情感識(shí)別任務(wù)中所蘊(yùn)含的語義信息優(yōu)勢與局限性。具體而言,我們將分析兩種傳統(tǒng)機(jī)器學(xué)習(xí)算法在處理情感分類任務(wù)時(shí)的準(zhǔn)確率、魯棒性和訓(xùn)練效率,以便深入理解深層語義特征如何影響情感判斷的效果。通過系統(tǒng)性的實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析,本研究不僅期望驗(yàn)證所提出方法的有效性,同時(shí)也為復(fù)雜情感信息處理問題提供新的解決思路。最終,我們希望本研究能夠推動(dòng)情感分析技術(shù)的進(jìn)一步發(fā)展,為實(shí)際應(yīng)用場景中的情感信息處理提供更為精準(zhǔn)和高效的技術(shù)支持,并拓展該領(lǐng)域的應(yīng)用范圍。
2 情感分析實(shí)驗(yàn)
2.1 實(shí)驗(yàn)技術(shù)方案
本實(shí)驗(yàn)旨在通過結(jié)合預(yù)訓(xùn)練的 RSA 模型與傳統(tǒng)算法提高情感分類性能。本研究采用基于DistilBERT-base-uncased 架構(gòu)的預(yù)訓(xùn)練模型 RSA。該模型通過知識(shí)蒸餾技術(shù)有效壓縮了原始 BERT 模型的參數(shù)量,在保持高性能的同時(shí),顯著提高了推理效率。模型結(jié)構(gòu)如圖 1 所示。
本實(shí)驗(yàn)采用兩階段混合方法,將預(yù)訓(xùn)練的 RSA 模型與傳統(tǒng)機(jī)器學(xué)習(xí)算法相結(jié)合,以提高情感分類性能,旨在提升細(xì)粒度情感分類任務(wù)的表現(xiàn)。實(shí)驗(yàn)的第一階段,利用預(yù)訓(xùn)練的 RSA 模型提取文本的深層語義特征。RSA 模型的核心思想是使用模型分類頭輸出的 logits 作為句子的向量表示。具體來說,本實(shí)驗(yàn)采用 DistilBERT-base-uncased 架構(gòu),這是一種通過大規(guī)模無監(jiān)督預(yù)訓(xùn)練的深度學(xué)習(xí)模型,能夠捕捉文本中的豐富上下文信息。由于 DistilBERT 是基于 BERT 模型的輕量化版本,它不僅保留了 BERT 的高效語義理解能力,還在計(jì)算上更加高效且具備較高的魯棒性,能夠處理復(fù)雜的情感分析任務(wù)。
在特征提取階段完成后,實(shí)驗(yàn)進(jìn)入第二階段,使用兩種傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行二次訓(xùn)練:支持向量機(jī)(SVM) 和多層感知機(jī)(MLP) 。首先,SVM 采用 hinge 損失函數(shù),通過最大化類別間的間隔,實(shí)現(xiàn)對高維特征的有效線性劃分。為了獲得最佳性能,使用網(wǎng)格搜索來確定SVM模型的超參數(shù)配置,包括 C 值和核函數(shù)等。其次,MLP 采用一個(gè)簡單的神經(jīng)網(wǎng)絡(luò)架構(gòu),包含一層隱藏層(64 個(gè)節(jié)點(diǎn)) 和一層批歸一化層。使用交叉熵?fù)p失函數(shù),通過反向傳播優(yōu)化網(wǎng)絡(luò)權(quán)重,并結(jié)合 AdamW優(yōu)化器進(jìn)行優(yōu)化。為了進(jìn)一步提升訓(xùn)練效果,還采用了余弦退火策略來調(diào)整學(xué)習(xí)率。
整個(gè)實(shí)驗(yàn)流程由這兩個(gè)階段構(gòu)成:首先從RSA模型提取深層特征,然后利用 SVM 和 MLP 兩種傳統(tǒng)算法進(jìn)行分類訓(xùn)練,以期達(dá)到更好的分類效果。該方法能夠有效融合深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)的優(yōu)勢,在情感分類任務(wù)中取得較好的性能。
2.2 訓(xùn)練
訓(xùn)練損失函數(shù):SVM部分采用 hinge 損失函數(shù),通過最大化類別間的間隔實(shí)現(xiàn)高維特征的線性劃分;MLP部分同樣采用交叉熵?fù)p失函數(shù),通過反向傳播不斷調(diào)整網(wǎng)絡(luò)權(quán)重,優(yōu)化模型的分類性能。
實(shí)驗(yàn)訓(xùn)練過程分為以下幾個(gè)主要步驟,1) 模型加載:首先調(diào)用 Hugging Face Transformers 庫加載預(yù)訓(xùn)練的RSA 模型,并初始化相應(yīng)的 tokenizer 與配置參數(shù);2) 特征提取:將預(yù)處理后的訓(xùn)練文本輸入模型,記錄分類頭輸出的 logits 特征,并保存為特征矩陣;3)SVM 訓(xùn)練:利用 scikit-learn 庫實(shí)現(xiàn) SVM 分類器,在驗(yàn)證集上進(jìn)行超參數(shù)網(wǎng)格搜索;4) MLP 訓(xùn)練:設(shè)計(jì)包含一層隱藏層以及一層批歸一化層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),采用 AdamW 優(yōu)化器和適當(dāng)?shù)膶W(xué)習(xí)率進(jìn)行訓(xùn)練,同時(shí)記錄每個(gè) epoch 的損失變化,使用余弦退火學(xué)習(xí)率算法調(diào)整學(xué)習(xí)率;5) 模型保存:在模型訓(xùn)練結(jié)束后,將SVM 與 MLP 模型分別保存,以便后續(xù)在測試集上進(jìn)行評估。
損失函數(shù)變化曲線圖如圖2 所示。
2.3 實(shí)驗(yàn)與分析
1) 超參數(shù)和訓(xùn)練:在SVM部分,通過網(wǎng)格搜索確定最佳參數(shù)配置為:C=1.0,核函數(shù)采用 RBF;而MLP 部分采用一層隱藏節(jié)點(diǎn)為 64 的隱藏層和一層批歸一化層,激活函數(shù)為ReLU,學(xué)習(xí)率設(shè)為 0.001,訓(xùn)練ep?och數(shù)設(shè)為 20。
2) 實(shí)驗(yàn)結(jié)果:表1列出了在 SST-5 數(shù)據(jù)集上各方法的測試結(jié)果,包括準(zhǔn)確率、精度、召回率和F1分?jǐn)?shù),采用不同方法進(jìn)行情感分類實(shí)驗(yàn)的性能對比結(jié)果。整體來看,直接使用 RSA 模型提取的深層特征進(jìn)行分類所獲得的各項(xiàng)指標(biāo)均低于采用二次訓(xùn)練方法的結(jié)果。RSA 模型:單獨(dú)使用預(yù)訓(xùn)練模型的logits作為特征,其準(zhǔn)確率僅為 36.88%,精度和召回率分別為42.14% 和38.81%,F(xiàn)1 分?jǐn)?shù)為 37.55%。這些結(jié)果表明,僅依賴 RSA 模型的特征提取在細(xì)粒度情感分類任務(wù)中效果有限。RSA+SVM 方法:結(jié)合 SVM 進(jìn)行二次訓(xùn)練后,各項(xiàng)指標(biāo)均有明顯提升。準(zhǔn)確率提高到46.47%,精度達(dá)到48.59%,召回率和 F1 分?jǐn)?shù)分別為40.91% 和 40.32%。這說明 SVM 在利用深層特征進(jìn)行線性劃分時(shí),能夠更有效地區(qū)分情感類別。RSA+MLP方法:采用 MLP 進(jìn)行二次訓(xùn)練的結(jié)果顯示,準(zhǔn)確率達(dá)到了 47.29%,精度為 48.34%,召回率和 F1 分?jǐn)?shù)分別上升到 43.13% 和 43.22%。相較于 RSA+SVM,MLP 在召回和 F1 分?jǐn)?shù)上有更進(jìn)一步的提升,表明其在捕捉復(fù)雜特征關(guān)系上具有一定優(yōu)勢。
2.4 與其他基線模型的比較
圖3 展示了本文方法與其他基線模型(Emo2Vec[9],GloVe+Emo2Vec[9],MV-RNN[10],Joined Model[11],GRU-RNN[12]) 在 SST-5 數(shù)據(jù)集上的對比情況,可以直觀地看出本文方法在準(zhǔn)確率等指標(biāo)上具備一定優(yōu)勢。
2.5 消融實(shí)驗(yàn)
表2 列出了在 SST-5 數(shù)據(jù)集上各方法的測試結(jié)果,使用停用詞,包括準(zhǔn)確率、精度、召回率和 F1 分?jǐn)?shù)。在消融實(shí)驗(yàn)中,筆者通過對比在移除停用詞(來自 NLTK) 與保留停用詞兩種預(yù)處理策略下模型的表現(xiàn),進(jìn)一步探討了停用詞對情感分類模型性能的影響。實(shí)驗(yàn)結(jié)果如表 1 所示(未去除停用詞) ,同時(shí)對比了不同預(yù)處理策略下的模型效果。
在實(shí)驗(yàn)中,保留停用詞的策略普遍帶來了性能上的提升,尤其是在一些細(xì)粒度情感分類任務(wù)中,保留停用詞能夠更好地幫助模型捕捉文本中的細(xì)微語義信息。具體來看,在單獨(dú)使用 RSA 模型的情況下,保留停用詞時(shí)模型的準(zhǔn)確率為 36.88%,而移除停用詞后的準(zhǔn)確率僅為 33.44%,差距明顯。這一結(jié)果表明,停用詞的存在可能在情感表達(dá)中起到了潛在的作用,尤其是對某些情感表達(dá)的準(zhǔn)確捕捉。
進(jìn)一步分析,結(jié)合 SVM 的 RSA 模型在保留停用詞情況下準(zhǔn)確率達(dá)到了 46.47%,相比移除停用詞時(shí)的 42.67%,提升了約 3.8 個(gè)百分點(diǎn),這一差距進(jìn)一步證明了停用詞的有效性。類似地,在 RSA+MLP 方法中,保留停用詞時(shí)準(zhǔn)確率為 47.29%,遠(yuǎn)高于去除停用詞后的 43.36%。
這些數(shù)據(jù)表明,停用詞(例如,否定詞、程度副詞等) 在情感分類任務(wù)中可能發(fā)揮了關(guān)鍵作用。停用詞往往能夠幫助模型更好地理解句子的情感傾向,尤其是在復(fù)雜句式和細(xì)微情感變化的情況下,停用詞的作用不容忽視。移除停用詞雖然可以減少噪聲,但可能也忽略了一些對情感判別有價(jià)值的語義信息。因此,保留停用詞有助于模型更全面地捕捉語義信息,提升情感分類的性能,特別是在細(xì)粒度情感分析任務(wù)中。
3 結(jié)論
本研究基于 RSA 模型,探討了細(xì)粒度情感分類的有效方法。具體而言,首先提取了 RSA 模型分類頭輸出的 logits 作為句子特征向量,這些深層特征能夠更好地捕捉文本中的細(xì)微情感信息。接著,結(jié)合傳統(tǒng)的機(jī)器學(xué)習(xí)方法,使用支持向量機(jī)(SVM) 和多層感知機(jī)(MLP) 對提取的特征進(jìn)行二次訓(xùn)練,進(jìn)一步提升了情感分類的性能。實(shí)驗(yàn)對象為 SST-5 數(shù)據(jù)集,該數(shù)據(jù)集包含多類別情感標(biāo)簽,是情感分類任務(wù)中的經(jīng)典數(shù)據(jù)集。
實(shí)驗(yàn)結(jié)果表明,RSA模型在挖掘深層語義特征的過程中表現(xiàn)出了較強(qiáng)的判別能力,在SVM和MLP兩種分類器的訓(xùn)練下,分類性能得到了顯著提升。此外,論文還對數(shù)據(jù)預(yù)處理、特征提取、模型訓(xùn)練以及參數(shù)調(diào)優(yōu)等多個(gè)環(huán)節(jié)進(jìn)行了詳細(xì)探討。這些細(xì)致的探索不僅有助于提升模型的性能,也為后續(xù)的情感分析研究提供了有益的思路和實(shí)踐參考。
通過實(shí)驗(yàn),本文驗(yàn)證了深度學(xué)習(xí)模型與傳統(tǒng)機(jī)器學(xué)習(xí)方法結(jié)合的潛力,并為情感分析在社交媒體輿情監(jiān)測、客戶反饋分析等實(shí)際應(yīng)用場景中提供了理論依據(jù)和應(yīng)用指導(dǎo)。研究還對模型可能存在的誤差、噪聲以及局限性進(jìn)行了深入分析,并提出了未來優(yōu)化的方向,為情感分析技術(shù)的發(fā)展開辟了新的研究路徑。