999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種結(jié)合情感詞頻和主題拓展的情感分析方法

2017-04-25 06:34:06蘇開益余詩慧
關(guān)鍵詞:情感實驗方法

◆蘇開益 江 偉 余詩慧

(武漢理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 湖北 430070)

一種結(jié)合情感詞頻和主題拓展的情感分析方法

◆蘇開益 江 偉 余詩慧

(武漢理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 湖北 430070)

本文針對傳統(tǒng)基于統(tǒng)計學(xué)的情感分析方法的不足,提出情感詞頻和主題拓展相結(jié)合的方法(FETE方法)。該方法關(guān)注用戶評論的完整性,提高了情感詞極性分類的準(zhǔn)確率,相對于傳統(tǒng)的方法,效果有一定提升。

情感分析;FETE;極性分類

0 前言

傳統(tǒng)的基于統(tǒng)計學(xué)的情感特征提取方法受到漢語“一詞多義”的干擾較大,無法結(jié)合用戶評論的上下文,并且在某些數(shù)據(jù)較為稀疏的樣本中,很難用統(tǒng)計學(xué)的方法提取其特征。本文提出一種融合情感詞頻和主題拓展的情感分析方法(FETE)。FETE方法首先對數(shù)據(jù)集進(jìn)行分詞預(yù)處理,然后統(tǒng)計得到褒義、貶義詞頻,再將主題特征進(jìn)行拓展,并與情感詞頻結(jié)合,最后得到樣本的特征向量。該方法有效地改善了通過統(tǒng)計學(xué)方法提取特征而將評論整體性忽略模式。

1 數(shù)據(jù)預(yù)處理

先進(jìn)行分詞,然后去停用詞是對自然語言文字序列的一般預(yù)處理方法,我們使用漢語分詞系統(tǒng) NLPIR對原數(shù)據(jù)進(jìn)行分詞,具體處理步驟見圖1。

圖1 處理步驟流程圖

2 FETE算法介紹

在該算法中,首先對原數(shù)據(jù)進(jìn)行分詞、去停詞,然后通過事先定義好的褒義詞典和貶義詞典來統(tǒng)計數(shù)據(jù)集中的情感詞詞頻,再將情感詞頻和主題維數(shù)拓展融合。

具體的算法步驟如下:

(1)對原數(shù)據(jù)集進(jìn)行分詞,去停詞。

(2)分詞結(jié)果事先準(zhǔn)備好的褒義詞典、貶義詞典進(jìn)行匹配,統(tǒng)計出數(shù)據(jù)集中褒義詞和貶義詞的詞頻,記錄為Cn和Pn。

(3)主題數(shù)K從5開始,以5為步長,增加到50,對每一個K值,使用主題模型對樣本的主題特征進(jìn)行提取。

(4)將每個K值下的主題特征作為文檔集的特征向量,再通過LIBSVM進(jìn)行二分類。

(5)把K值按照準(zhǔn)確率進(jìn)行排序,取最高的兩維向量a和b,將b的最后一維連接在a的第一維,得到向量c。

(6)再將Cn和Pn作為兩個一維向量與c向量結(jié)合,得到融合了主題維數(shù)拓展和情感詞頻的特征向量。

(7)對融合后的特征向量進(jìn)行歸一化,再使用LIBSVM進(jìn)行二分類。

圖2 融合情感詞頻和主題拓展的情感分析方法(FETE)

本文使用LDA主題模型進(jìn)行實驗和分析。LDA的參數(shù)估計分為兩種,Gibbs采樣和EM最大熵,本文使用Gibbs采樣方法。

3 實驗驗證

3.1 數(shù)據(jù)集

本文使用某 VR公司的用戶對某款內(nèi)容的評論作為數(shù)據(jù)集(http://www.datatang.com/data/11857)進(jìn)行實驗,一共有 2317條評論,包括1158條正面評論和1159條負(fù)面評論。

3.2 評價指標(biāo)

本文采用精確度(Precision)、召回率(Recall)、F值(F-mean)和準(zhǔn)確率(Accuracy)四個評價指標(biāo)作為評價算法效果的指標(biāo)。具體計算公式見表1。

表1 評價指標(biāo)的計算公式和描述

3.3 實驗驗證

使用該算法在3.1中數(shù)據(jù)集上進(jìn)行實驗,如圖3所示,當(dāng)K等于15和30時,Accuracy取得極大值,實驗結(jié)果最好,當(dāng)K持續(xù)增大時,Accuracy呈下降趨勢。

圖3 實驗結(jié)果對比圖

從表2中可以看出,實驗中FETE-LDA方法比傳統(tǒng)的特征提取方法具有更高的MacroP、MacroR和F1值,取得了更好的實驗效果;在融合情感詞頻和主題維數(shù)拓展的情感分析方法上LDA作為主題提取方法取得了很好的分類效果。

表2 各分析方法對比實驗

4 總結(jié)

本文提出了一種結(jié)合了情感詞頻和主題拓展的情感分析方法,在傳統(tǒng)的分析方法的基礎(chǔ)上,更加注重評論的完整性,對上下文的把握更精準(zhǔn)。

[1]周哲,商琳.一種基于動態(tài)詞典和和三支決策的情感分析方法[J].山東大學(xué)學(xué)報:工學(xué)版,2015.

[2]陳婷.基于上下文感知的個性化信息服務(wù)系統(tǒng)的研究與設(shè)計[D].北京郵電大學(xué),2013.

[3]李致.知識庫系統(tǒng)中的用戶興趣挖掘與推薦[D].北京交通大學(xué),2013.

[4]萬源.基于語義統(tǒng)計分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D].武漢理工大學(xué), 2012.

猜你喜歡
情感實驗方法
記一次有趣的實驗
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
做個怪怪長實驗
如何在情感中自我成長,保持獨立
NO與NO2相互轉(zhuǎn)化實驗的改進(jìn)
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 波多野结衣国产精品| 亚洲三级视频在线观看| 亚洲精品色AV无码看| 黄色一级视频欧美| 综合色区亚洲熟妇在线| 国产97视频在线| 91福利在线观看视频| 波多野吉衣一区二区三区av| 激情无码字幕综合| 成人午夜福利视频| 3D动漫精品啪啪一区二区下载| 精品国产成人av免费| 亚洲熟女偷拍| 国产成人在线无码免费视频| 日韩欧美国产三级| 亚洲天堂免费| 久久综合丝袜日本网| 亚洲国产清纯| 久久久久久尹人网香蕉| 国内精品九九久久久精品| 亚洲人成在线精品| yjizz视频最新网站在线| 久久情精品国产品免费| 欧美区国产区| 亚洲综合精品香蕉久久网| 婷婷亚洲视频| 波多野结衣一区二区三区AV| 国产欧美一区二区三区视频在线观看| 亚洲精品中文字幕午夜| 欧美全免费aaaaaa特黄在线| 国产麻豆精品手机在线观看| 欧美中文字幕一区二区三区| 国产精品视频系列专区| 国产亚洲现在一区二区中文| 国产制服丝袜91在线| 国产成人精品一区二区三区| 美女被操91视频| 国产精品白浆无码流出在线看| 思思热精品在线8| 国产在线观看91精品| 国产永久免费视频m3u8| 玖玖精品视频在线观看| 国产福利大秀91| 国产亚洲高清在线精品99| 狼友视频一区二区三区| 国产96在线 | 国产福利小视频在线播放观看| 中文字幕无码制服中字| 2022精品国偷自产免费观看| 老司机久久99久久精品播放| 欧美日韩在线观看一区二区三区| 亚国产欧美在线人成| 尤物特级无码毛片免费| 重口调教一区二区视频| 黄色网在线免费观看| 在线精品亚洲国产| 午夜天堂视频| 国产资源免费观看| 亚洲高清在线播放| 亚洲午夜18| 九九免费观看全部免费视频| 久久免费看片| 国产又黄又硬又粗| 四虎国产精品永久一区| 日韩大片免费观看视频播放| 综合社区亚洲熟妇p| 五月天久久综合| 欧美激情网址| 一区二区午夜| 国产内射在线观看| 美女亚洲一区| 亚洲欧美综合另类图片小说区| 国产高清在线精品一区二区三区| 91毛片网| 国产亚洲欧美日韩在线观看一区二区| 在线免费看片a| 国产成人综合日韩精品无码不卡 | 欧美国产在线一区| 欧美影院久久| 黄色网址手机国内免费在线观看| 精品人妻一区二区三区蜜桃AⅤ| 99伊人精品|