999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情感字典擴展的中文情感傾向性研究

2018-11-23 06:16:14
福建質量管理 2018年21期
關鍵詞:文本情感實驗

(蘭州財經大學信息與工程學院 甘肅 蘭州 730000)

一、引言

隨著互聯網的普及,海量的主觀性的評論文本出現在網絡上,這些評論中包含了豐富的情感信息和主觀觀點。有效地挖掘此類文本的信息可以更方便地理解用戶的消費習慣,分析熱點事件的輿情,為企業、政府等機構提供科學的決策依據。本文針對情感分析中情感詞典質量和覆蓋度問題提出了解決辦法。主要是提出了擴展的情感詞典的方法,最后基于情感分析方法來計算句子的情感極性,并用實驗來檢驗詞典改進方法的有效性,最后總結了基于字情感典的中文文本情感分析的研究難點與未來的研究方向。

二、相關研究

基于情感詞典的情感傾向識別主要是根據情感詞典中的詞語或短語的情感極性和強度信息來對文本進行情感劃分。在基于詞典的無監督方法中,Turney 等[1]提出了點互信息(Point Mutual Information,PMI)的方法判別某個詞語是否是評價詞語,但是較依賴種子情感詞集合。Alina Andreevskaia和Sabine Bergler[2]在文中將情感詞典與機器學習的方法相結合構造了兩個分類器進行情感分析,第二個分類器是在第一個分類器分類出現錯誤時進行工作的,該種方法取得了好的分類效果。

三、詞典構造

我們所構建的詞典包括基礎情感詞典和輔助情感詞典。其中基礎情感詞典為由正向情感詞和負向情感詞組成情感詞典,輔助情感詞典及其權重是在網上搜集的公開的情感詞典,由否定詞詞典、程度副詞詞典、連詞詞典、反問詞詞典和停用詞詞典構成。下面對基礎情感詞典的構建以及擴展進行詳細的介紹。

基礎情感詞典的構建是直接選用臺灣大學詞典、知網詞典以及褒貶義詞典中情感詞并集組成的。本文對情感詞典的擴展主要是基于近義詞和規則來擴展情感詞,用來提升情感詞典的準確性和完備性。本文提出根據個人經驗發現的規則來識別情感新詞。比如“!”前面往往是情感詞,名詞后面的形容詞往往是情感詞等等。識別的新詞根據點互信息來確定其情感極性。最后實驗得到的情感詞典包括20673個積極情感詞,30478個消極情感詞。

四、基于情感詞典的情感分析過程

本章主要說明如何將改進后情感詞典用于情感分析,提高情感詞典的覆蓋度[3],改善情感分析的效果,為后文的實驗部分做好鋪墊。其情感分析過程主要有獲取情感詞典、文本預處理和計算句子的情感極性。

情感詞典的獲取在第2章已介紹,這里不多贅述;文本預處理是為了文本便于分析,去除沒有意義的詞語,將句子轉化為可處理的形式。經過中文分詞以及去停用詞,對情感極性無影響的詞語和標點都已去除。此外,如果文本中如果有臟數據,需要進行清洗操作;計算句子的情感極性就是通過情感詞典查找句子中所包含的情感極性詞語以及輔助情感詞典中的情感詞語,并給各自的詞乘以相應的權重,最后累加,假如最后的得分大于0,也就是積極情感得分減去消極情感得分的分值大于0,那么該句的情感傾向則判定為積極的,反之則為消極的。

五、實驗結果及分析

本文實驗數據集采用的是公開的帶有標簽的餐飲評論數據集。使用的情感詞典是第二章介紹的。實驗環境采用Python平臺,其中運用到NLTK、sklearn、gensim、jieba等類庫。實驗采用的評測指標是情感分析領域常用的幾個指標:精度、召回率、F1值以及AUC面積。分別用改進前后的情感詞典來進行實驗。兩個實驗方法分別命名為RLS、1RLS。實驗步驟按照第三章介紹的進行,實驗結果如下。

積極消極總體方法精度召回率F1值精度召回率F1值精度召回率F1值AUCRLS0.690.760.710.620.700.700.6950.730.7150.7221RLS0.700.780.720.640.700.700.700.740.740.734

從結果中,我們可以看出使用擴展以后情感詞典比使用擴展以前的情感詞典來進行情感分析效果稍好,也說明了本文對情感詞典改善的有效性;但是從結果中也可以看出,提升效果并不大,因為基于情感詞典的情感分析方法沒有考慮語義的復雜性,只是簡單的統計情感詞語,便獲得情感極性。同時由于實驗采用的數據集較小,拓展的情感詞語并不多,所以提升效果不明顯。

六、總結與展望

本文針對字典質量及覆蓋度的問題,提出了擴展情感詞典覆蓋來提高情感分析的效果。最近研究人員研究基于機器學習的方法進行完善情感詞典[4]及改進現有詞向量模型,創建情感詞向量模型[5]都是非常有潛力的研究方向。因此,在以后的研究學習中有以下展望:提出一種機器學習的方法拓展情感詞典,使情感詞典不斷完善;可以改進現有的詞向量模型,在生成詞向量的同時考慮情感信息和極性轉移因素在里面,然后將生成的詞向量作為特征輸入,用來訓練分類器。

總體來說,目前階段,情感分析技術還處于比較初級的階段,但是隨著大數據技術、人工智能技術的進展,大規模的語料庫[11]處理將變得更加容易,情感分析等自然語言處理問題終將會得以解決。

猜你喜歡
文本情感實驗
記一次有趣的實驗
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
做個怪怪長實驗
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 在线不卡免费视频| 中文字幕日韩欧美| 97在线国产视频| 国产成人乱无码视频| 亚洲欧美日韩高清综合678| 999国产精品永久免费视频精品久久 | 国产三区二区| 国产激情无码一区二区免费| 中国一级特黄视频| 国产在线精品99一区不卡| av在线人妻熟妇| 激情综合网激情综合| 中国国语毛片免费观看视频| 91国内视频在线观看| 亚洲欧美另类中文字幕| 亚洲国产看片基地久久1024| 亚洲色婷婷一区二区| 一本色道久久88亚洲综合| 国产精品成人啪精品视频| 欧美一区二区人人喊爽| 青青操视频在线| 亚洲网综合| 毛片免费网址| 亚洲天堂网在线播放| 岛国精品一区免费视频在线观看| 日本福利视频网站| 亚洲综合亚洲国产尤物| 欧美激情伊人| 国产一区二区三区在线无码| 99热国产这里只有精品9九| 五月六月伊人狠狠丁香网| 久久这里只有精品66| 亚洲成A人V欧美综合天堂| 亚洲视频无码| 国产极品美女在线| 欧美在线视频不卡第一页| 日韩乱码免费一区二区三区| 99中文字幕亚洲一区二区| 国产美女在线免费观看| 亚洲国产清纯| 国产福利免费视频| 美女国内精品自产拍在线播放| 天天做天天爱夜夜爽毛片毛片| 成人第一页| 色播五月婷婷| 久久综合亚洲鲁鲁九月天| 成人免费一级片| 国产在线观看99| 国产真实乱子伦精品视手机观看| 成年女人18毛片毛片免费| 精品伊人久久久香线蕉 | 97国产精品视频人人做人人爱| 国产成人三级| 免费在线一区| 99视频在线免费观看| 日韩人妻无码制服丝袜视频| 国产第一页免费浮力影院| 国产精品专区第一页在线观看| 国产成人三级在线观看视频| 亚洲人成网线在线播放va| 欧美一区二区精品久久久| 国内黄色精品| 91啪在线| 精品国产一区二区三区在线观看 | 99久久性生片| 日本精品一在线观看视频| 激情综合图区| 中文成人在线| 国产对白刺激真实精品91| 91亚洲免费视频| 国产一区二区丝袜高跟鞋| 国产精品欧美日本韩免费一区二区三区不卡 | 伊人久久大香线蕉影院| 午夜啪啪网| 亚洲伊人电影| 久久大香香蕉国产免费网站| 97在线观看视频免费| 免费av一区二区三区在线| 欧美天堂久久| 99久久无色码中文字幕| 青草国产在线视频| 怡红院美国分院一区二区|