999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度記憶網絡的特定目標情感分類研究

2019-02-07 05:32:15張玲劉臣
軟件導刊 2019年12期

張玲 劉臣

摘要:特定目標情感分類不僅依賴于上下文信息,還需結合特定目標的特征信息,是一種細粒度的情感分析。針對特定目標情感分類提出了一種基于深度記憶網絡的分類模型。該模型以雙向LSTM和注意力機制為主干框架,從雙向LSTM中抽取出目標的特征表示,將目標特征信息加入句子表示中,并加入多計算層(Hops)結構,用以挖掘句子和目標更深層次的情感特征信息,每個計算層的結構類似,共享參數。最后在SemEval2014和SemEval2016數據集上進行實驗,取得了比其它基準模型更好的效果。關鍵詞:特定目標情感分類;雙向LSTM網絡;注意力機制;多計算層結構

DOI:10.11907/rjdk.191222

中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2019)012-0040-04

0引言

情感分類是情感分析技術的核心,是對具有情感色彩的主觀文本進行分析并將文本分為積極、中立和消極3種類型的過程。情感分析研究一般可以分為3個層次:文件、句子和目標。特定目標情感分類是一種細粒度的情感分析,研究句子針對特定目標的情感極性。

特定目標情感分類的一個重要特征表現為:同一個句子針對不同的目標所表達的情感有可能是完全相反的。比如,句子“I came here with my friends last week,the food isgreat,but the service need to be improved。”針對“food”的情感是積極的,而針對“service”的情感卻是消極的。由此可見,句子所表達的情感極性與特征目標的特征信息緊密相關。因此在作特定目標情感分類時,如果忽略句子中包含的特定目標信息,就很可能導致出錯。

許多學者都對特定目標情感分類進行了研究,使用較多的方法是先利用特征提取工具,比如TF-IDF、n-gram、bag ofwords以及情感詞典等,對句子進行特征提取,然后用分類器(如支持向量機等)進行分類。盡管這些方法能夠取得不錯的分類效果,但所用到的特征提取工程需要耗費大量勞動力,而且分類器的效果很大程度上依賴于人工提取特征的效果。深度神經網絡在很多領域都取得了良好效果,包括特定目標情感分類任務。情感分類任務中,使用較多的深度神經網絡模型是長短期記憶網絡(LSTM)和卷積神經網絡(cNN)。LSTM非常適合用于學習時間序列的分類、處理和預測,CNN因局部感知和參數共享而被廣泛使用。

特定目標情感分類效果不僅與上下文的文本信息相關,還依賴于特定目標的特征信息,因此在作特定目標情感分類時有兩個需要特別注意的問題。

(1)如何合理表示包含多個詞的目標。為了完成特定目標情感分類,首先要高效地表示目標,特別是當目標包含多個詞時。比較常用的方法是取這幾個詞詞向量的平均值作為目標特征表示。但是這種表示方法會導致目標的特征信息被遺漏,甚至會因為平均值向量指向其它向量空間而導致分類錯誤。

(2)如何充分利用目標的特征信息。特定目標情感分類的目的是分析出句子針對某一目標的情感極性,而不是整個句子的情感極性。因此需要充分利用目標特征信息挖掘出對特定目標有情感傾向的上下文信息。

本文針對上述兩個問題,提出一個基于深度雙向LSTM的情感分類模型。該模型在兩個公開的數據集上都取得了較優效果。

1相關工作

1.1基于CNN的特定目標情感分類

Gu等在2017年提出了一個兩級級聯CNN(c-CNN模型共同完成目標映射任務和情感分類任務。在第l級,他們使用多層卷積網絡檢測輸入句子是否屬于預先定義的目標類別;在第2級,他們使用單一卷積網絡對屬于預先定義的目標類別句子的情感極性進行分類。這種C-CNN模型雖然取得了良好效果,但當一個句子包含兩個目標,并且兩個目標的情感極性相反時,C-CNN模型就無法處理了。梁斌等于2018年提出一種基于CNN的分類模型,用CNN提取句子特征信息,引入多種注意力機制抓取目標特征信息。該模型效果良好,但容易出現過擬合現象。

1.2基于RNN的特定情感分類

循環神經網(RNN)非常適合從經驗中學習時間序列的分類、處理和預測。但是,標準RNN在消失梯度或爆炸梯度問題上存在不足。因此前人在作目標情感分類時,更多使用的是長期短期記憶(LSTM)和門控循環單位(GRU)。Soufian等先將詞向量、情感向量和詞性標簽向量的拼接向量傳人一個雙向GRU以提取、表示目標,再使用一個類似結構,不同的是在連接向量上添加了一個距離嵌入向量,預測句子對目標的情感極性。結果表明,從情感詞典(senticnet)獲得的情感相關特征有助于提升該模型的性能;陳思遠等首先使用CNN提取句子完整信息,然后對句子進行區域劃分,將CNN提取的句子特征信息和目標特征信息傳人區域LSTM,通過注意力機制調整句子特征信息和目標特征信息對分離的影響力;孟威等先用BiLSTM處理單詞信息,然后用CNN從BiLSTM處理結果中提取特征信息,并引入CRT機制將CNN和LSTM的優勢加以整合。

1.3基于注意力機制的特定目標情感分類

注意力機制最先在圖像處理領域取得了卓越成效,其在序列建模中也很有效,因為它可以模擬組件之間的依賴關系,而不管它們之間的距離如何。在情感分類相關研究中,注意力機制大部分都是與深度神經網絡結合起來使用。Wang等于2016年提出了一個基于注意力機制的LSTM模型,他們將句子的詞向量傳送給LSTM,然后將LSTM的輸出與目標詞向量結合計算出合適的注意力權重,最后得到包含目標特征信息的句子表示進行情感預測;Tan等于2016年提出的模型中舍棄了循環神經網絡,提出了一種基于注意力機制的多計算層(Hop)結構模型。每個計算層的結構類似,包含一個注意力模塊和一個線性轉換模塊,每一層的輸出作為下一層的輸入,將最后一個計算層的輸出作為句子表示,然后作出情感預測。實驗證明,多計算層結構在任務中是起作用的。

1.4基于左中右結構的特定目標情感分類

為了更好地模擬出目標和上下文的依賴關系,一些學者將句子切分成3部分:目標、目標左邊的上下文和目標右邊的上下文。Tang等提出了TD-LSTM模型和TC-LSTM模型,他們用一個正向傳遞的LSTM處理目標左邊的上下文和目標,用一個反向傳遞的LSTM處理目標右邊的上下文和目標,然后對兩個LSTM最后一個隱藏單元的輸出進行拼接,從而得到句子的特征表示,作出情感分類;Liu等提出了一個BILSTM-ATT-G模型,他們將詞向量傳給一個雙向LSTM,然后分別用注意力機制處理目標左右兩邊的上下文,最后加人門控機制控制決定使用句子的哪部分信息,該模型的創新點在于門控思想的創新使用;Zheng等在2018年提出,分別用3個雙向LSTM處理目標以及左右上下文3個部分,將3個部分的最后輸出拼接起來,作為句子特征表示,從而進行情感分類。

這些模型雖然取得了良好效果,但仍有很大的改善空間。搭建一個能夠充分利用目標特征信息的模型,更好地完成特定目標情感分類值得研究。

2模型提出

2.1模型概述

本文使用一個基于注意力機制的雙向LSTM作為模型的基本框架。雙向LSTM將正向傳遞與反向傳遞相結合,能夠學習到上下文的完整信息。注意力機制能夠幫助模型合理分配注意力,在編譯句子信息時更加高效。此外,本文還引入情感詞典(senticNet),通過Senticnet常識可以暗示目標和情感的語義聯系。為了將句子的情感分類與目標特征信息相結合,本文將目標從雙向LSTM中提取出來,在句子表示中重新加入目標特征信息。

為了挖掘句子和目標更深層次的信息,本文引人多計算層結構(Hops)。每個計算層的結構類似,包含一個注意力模塊和一個線性轉換模塊,每一層的輸出作為下一層的輸人。最終模型如圖2所示。

3實驗驗證

3.1實驗數據

將本文提出的模型在兩個基準數據集上進行評估。本文采用SemEval2014和SemEval2016的Restaurant評論數據集,以及SemEval2014的Laptop評論數據集。原始數據集里的情感分類有4項,分別是積極、中立、消極和對立。本文剔除情感為對立的數據,因為此類數據較少,會導致不同類型數據分布不均勻,增加培訓難度。分別取90%和10%的數據作為訓練集和驗證集,數據分布狀況如表1所示。

3.2參數與指標

實驗中的參數設定如表2所示。詞向量的維度為300維,隱藏層的LSTM單元為256個,句子的最大長度為190,不足的在句子左邊補零,64個句子為一個批次。

3.3對比實驗

將本文提出的模型與以下幾個模型在上述兩個數據集上進行實驗。為了方便說明,將本文提出的模型命名為ASAM-BiLSTM模型。①BiLSTM,本文提出模型的最簡化,沒有額外加入目標特征信息和多計算層(Hops)結構;②Ba-sicmodel,本文提出模型的簡化,考慮了額外的目標特征信息,但是沒有加入多計算層(Hops)結構;③ATAE-LSTM,Wang等提出的模型;④Deep memory network,Tang等提出的模型;⑤Variants,在本文提出模型的基礎上,改變Hops數,從1到8。

3.4實驗結果

實驗結果如表3所示。

3.5結果分析

如表3所示,本文提出的ASAM-BiLSTM模型較ATAE-LSTM模型和Deep memory network具有更好的效果。具有5個計算層的ASAM-BiLSTM模型在Restaurant數據集上的最高準確率為80.8%。

3.5.1目標特征信息的必要性

從實驗結果可以看出,Basic Model在兩個數據集上的表現均優于BiLSTM,這一結果并不意外。特定目標情感分類效果不僅與上下文的文本信息相關,還依賴于目標的特征信息。BiLSTM在信情感分類時僅僅考慮了上下文,而沒有考慮特定目標的特征信息,因此模型的準確率不高,而加入特定目標的特征信息的Basic Model在兩個數據集上的表現都得到了提高。在作特定目標情感分類時,充分考慮到特定目標的特征信息很有必要。

3.5.2多計算層結構(Hops)的必要性

實驗結果顯示,具有不同Hops數的ASAM-BiLSTM模型具有不同的分類效果,這說明多計算層結構確實對模型效果有一定影響。在Restaurant數據集上,具有5個計算層的ASAM-BiLSTM模型的準確率為80.8%,比沒有多計算層結構的Basic Model高出6.6%,模型效果明顯提高。

但是該研究并不確定多計算層結構在所有分類任務中都有效果,因為從實驗結果看,ASAM-BiLSTM在Laptop數據集上,并沒有Basic Model的效果好。原因可能在于Laptop數據集太小,多計算層結構無法發揮作用,因為越復雜的模型需要的訓練數據越多。但在本文實驗中,多計算層結構在Restaurant數據集上確實是有效的。

4結語

本文充分考慮如何合理表示包含多個詞的目標和如何充分利用目標的特征信息后,提出了一個基于深度雙向LSTM的情感分類模型。實驗中并沒有直接用雙向LSTM最后隱層單元的輸出作為句子特征表示,而是引人注意力機制,取所有單元的加權平均進行句子表示,這樣可以盡可能地保留句子的完整信息。特定目標特征信息的加入和多計算層(Hops)結構都能使模型取得良好效果。實驗結果表明,本文提出的模型在兩個數據集上效果良好。下一步將繼續改進模型,嘗試輸出句子的情感極性和情感所指向的特定目標。

主站蜘蛛池模板: 日本在线亚洲| 欧美日韩免费观看| 美女免费精品高清毛片在线视| 亚洲人成在线免费观看| 成人午夜视频在线| 国产乱人乱偷精品视频a人人澡| 国产一在线| 日韩欧美国产区| 亚洲不卡影院| 久久国产成人精品国产成人亚洲| 欧美日韩动态图| 毛片大全免费观看| 97色伦色在线综合视频| 国产人成在线视频| 无码国产偷倩在线播放老年人 | 一级福利视频| 2020精品极品国产色在线观看| 国产一区二区三区夜色| 日韩在线第三页| 午夜一区二区三区| 91精品专区| 亚洲天堂免费| 99久久这里只精品麻豆| 国产精品欧美在线观看| 91在线精品免费免费播放| 精品黑人一区二区三区| 一本大道香蕉久中文在线播放 | 精品人妻AV区| 制服丝袜国产精品| 国产午夜小视频| 在线视频亚洲色图| 国产午夜福利在线小视频| 99精品在线看| 国模极品一区二区三区| 欧美日本一区二区三区免费| 少妇露出福利视频| 一级全黄毛片| 精品无码一区二区在线观看| jijzzizz老师出水喷水喷出| 女人18一级毛片免费观看| 毛片免费在线视频| 香蕉色综合| 国产成人乱无码视频| 精品国产自在在线在线观看| 亚洲成A人V欧美综合天堂| 久久人妻xunleige无码| 午夜福利视频一区| 久久99国产视频| 六月婷婷综合| 国产精品一区二区国产主播| 国产精品自在拍首页视频8| 999福利激情视频| 在线无码av一区二区三区| 国产伦精品一区二区三区视频优播| 欧美啪啪一区| 欧美性猛交一区二区三区| 天天爽免费视频| 热99re99首页精品亚洲五月天| 91精品国产一区自在线拍| jizz亚洲高清在线观看| 无套av在线| 乱系列中文字幕在线视频| 国产亚洲欧美日韩在线观看一区二区| 久久这里只精品国产99热8| 国产肉感大码AV无码| 国产成人在线小视频| 国产精品亚洲va在线观看| 亚洲国产日韩一区| 国产午夜不卡| 久久一本日韩精品中文字幕屁孩| 亚洲精品视频免费| 毛片一区二区在线看| 尤物特级无码毛片免费| 婷婷色中文| 午夜影院a级片| 国产女人爽到高潮的免费视频| 国产哺乳奶水91在线播放| 国产性猛交XXXX免费看| 伊人色在线视频| 国产成人综合欧美精品久久| 99人妻碰碰碰久久久久禁片| 91久久国产综合精品|