999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新聞情感傾向性識別算法的研究與應用

2015-11-10 07:10:30周邦定曹海鵬
網絡安全與數據管理 2015年14期
關鍵詞:關鍵情感分析

周邦定,曹海鵬,張 彥

(中國科學技術大學 信息科學技術學院,安徽 合肥 230026)

0 引言

網絡上的負面新聞有很高的利用價值,銀行、保險和風險投資機構通過分析這些負面新聞來決定是否與該客戶或者企業開展合作。

目前主要有兩種情感傾向性識別方法:基于統計的方法[1-3]和基于規則的方法[4-6]。 林政等人[1]在設計關鍵句抽取算法時考慮了3個特征,分別是情感特征、位置特征和關鍵詞特征。這種方法處理結構復雜的句子時容易產生丟失句子信息的情況,比如丟失否定前綴或者丟失程度前綴。劉永丹等人[4]提出一種基于語義分析的方法,從待分析的句子中提取出相應的格,然后通過事先設定好的規則和詞表來判定分析單元的傾向性。但是這種方法提取出的格的準確率非常低,而且判斷規則的設計也很困難。

本文提出給單個傾向詞分配傾向性、強度、極性和標志4個屬性,通過人工確定情感詞相應屬性的值,將一系列情感詞制成特定的情感詞典。然后,通過依存句法找出情感詞之間的依存關系,通過本文提出的情感判定算法得出整個句子的情感值,最后將整篇新聞中關鍵句的情感值疊加,得到整篇新聞的情感值。

1 傾向詞語料庫

1.1 傾向詞

對人或事表達態度或者情感傾向的語句叫作情感語句。情感語句中體現態度或者情感傾向的詞叫作情感詞。情感詞、否定詞和強度詞這三類詞統稱為傾向詞。

對真實的負面新聞語料進行分析發現,有些傾向詞可以直接判斷出情感傾向性,如 “倒閉”、“破產”、“違法”等,這些傾向詞稱為獨立傾向詞;有些傾向詞單獨分析時得不出情感傾向性,只有與搭配詞搭配起來,才能表達一定的情感傾向性,如單獨分析“凈利潤”情感傾向性時,它的情感傾向性為中立的,但是當“凈利潤”與搭配詞“下降”搭配時,其表達的情感傾向性即為負面的,這類傾向詞稱為搭配傾向詞。

1.2 傾向詞的數據結構

本文給傾向詞設定4個屬性:傾向性、強度、極性和標志。

(1)傾向性(orientation):指出傾向詞是正面的、負面的還是中立的。正面取1,負面取-1,中立取0。

(2)強度(intensity):指該傾向詞對情感句子的情感傾向性有增強或者減弱的作用。增強取2,減弱取0.5,既不增強也不減弱取1。

(3)極性(polarity):指該傾向詞是否逆轉了句子的情感傾向性。一般否定詞會逆轉句子的情感傾向性。

(4)標志(flag):指出該傾向詞是獨立傾向詞還是搭配傾向詞。flag取0代表該傾向詞是獨立傾向詞;flag取正整數i,代表該傾向詞是搭配傾向詞,該正整數i指出該搭配傾向詞的搭配詞只能取自搭配詞詞表的第i類記錄中的值。

2 淺層語義分析

2.1 依存句法簡介

依存句法由法國語言學家TESNIERE L最先提出。它將句子分析成一棵依存句法樹,描述句子內部各個詞之間的依存關系[7]。

為了便于本文后續的描述,在此給出3個定義:

定義1節點詞:可作為句子某種確定成分 (主/謂/賓/定/狀/補)的簡單詞語或詞組。

定義2依存邊:如果句子中兩節點詞g與d之間存在依存關系,其中 g是支配詞,d是從屬詞,則 g與d間構成一個依存對,用一條由從g指向d的有向邊l來表示,記為。

圖1給出一個包含節點詞、依存邊的簡單的依存語法樹示例。由圖可知,節點詞“凈利潤”的第一個后繼節點是節點詞“下降”;節點詞“公司”的第二個后繼節點是節點詞“凈利潤”,第三后繼節點是節點詞“下降”。

圖1 依存語法樹

2.2 依存句法分析器

本文利用復旦大學自然語言處理實驗室開發的FNLP對句子進行依存句法分析[8]。使用FNLP對句子進行依存句法分析時,用4個數組表示分析結果:數組words表示句子分詞結果,數組pos表示詞語對應的詞性,數組relations表示詞與詞之間的依存關系,數組heads表示詞語的第一后繼節點詞的下標。對句子“今年公司的凈利潤大幅下降。”進行依存句法分析,得到的結果如表1所示。

表1 FNLP進行依存句法分析的結果

3 情感識別算法

設 S={x1,…,xn}為句子,xi(1≤i≤n)是句子中第 i個字;K={y1,…,ym}為關鍵詞,yj(1≤j≤m)為關鍵詞的第 j個字,文本中句子與關鍵詞集相似度計算公式如式(1)所示。

其中,⊕的含義是:當 yj與 xi相同,則 yj⊕xi=1;否則,yj⊕xi=0。

當計算出的相似度大于或等于閾值時,該句子就是關鍵句。新聞文本中所有的關鍵句構成了關鍵句群。

設關鍵句 S中的第i個詞為wi,S的情感值為 score,句子對應的傾向性值為ORIENTATION,句子對應的強度值為INTENSITY,句子對應的極性值為POLARITY。如果wi是獨立傾向詞,則計算式(2)、(3)、(4):

如果wi是搭配傾向詞,則通過句子的依存關系尋找詞 wi的后繼節點詞 wj,計算式(2)、(3)、(5):

整個句子所有的情感傾向詞掃描完之后,計算式(6):

score的值即為句子的情感值。

設整篇文章的關鍵群中的句子數為n,整篇文章的情感值為SCORE,則:

score(i)為第i個情感句子的情感值。

具體的算法偽代碼如下:

算法1情感傾向性識別主算法

從目標新聞T提取關鍵句群S;

算法2搭配詞查找算法

4 試驗及結果

本文實驗數據取自某銀行2012年度人工收集的2 362條情感傾向性新聞。人工選取了比較有代表性的936條新聞作為訓練語料,從這些語料中人工抽取傾向詞和搭配詞,制成傾向詞詞典和搭配詞詞典。另外取1 426條新聞作為測試語料。

使用準確率(Precision)、召回率(Recall)和 F 值(F-measure)作為實驗結果的評估指標:

圖2給出了算法實驗結果的圖形展示。

圖2 算法實驗結果

5 結論

本文以企業新聞的情感傾向性分析為應用背景,利用依存語法分析和通過給傾向詞分配屬性值為基礎,提出了一個識別新聞情感傾向性的算法。實驗表明,該方法具有很好的準確率和召回率。但是,該算法的性能與傾向詞語料庫密切相關,語料庫中的語料的存儲格式和語料庫中語料的豐富程度,都對準確率和召回率有很大的影響。因此,如何構建高性能、完備的語料庫值得深入研究。

[1]林政,譚松波,程學旗.基于情感關鍵句抽取的情感分類研究[J].計算機研究與發展,2012,49(11):2376-2381.

[2]Fan Xinghua, Wang Peng, Zhou Peng.Two step text orientation identification based on feature extension[J].Computer Engineering and Applications, 2012,48(1):162-165.

[3]SAJIB D, VINCENT N.Mine the easy, classify the hard:a semi-supervised approach to automatic sentiment classification[C].Proceedings of the 47th Annual Meeting of the ACL and the4th IJCNLP oftheAFNLP, Singapore,2009:701-709.

[4]劉永丹,曾海泉,李榮陸,等.基于語義分析的傾向性文本過濾[J].通信學報,2004,25(7):78-85.

[5]Ye Qiang, Shi Wen, Li Yijun.Sentiment classification for movie reviews in Chinese by improved semantic oriented approach[C].Proceedings of the 39th Hawaii International Conference on System Sciences, 2006,3:1-5.

[6]曹歡歡.負面新聞判斷算法的研究與應用[D].合肥:中國科學技術大學,2014.

[7]鄧欣.面向依存文法的漢語語法分析[D].長沙:國防科學技術大學,2000.

[8]Qiu Xipeng, Zhang Qi, Huang Xuanjing.FudanNLP: a toolkit for Chinese natural language processing[C].Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (ACL), Sofia, 2013:49-54.

猜你喜歡
關鍵情感分析
高考考好是關鍵
隱蔽失效適航要求符合性驗證分析
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
如何在情感中自我成長,保持獨立
電力系統及其自動化發展趨勢分析
獲勝關鍵
NBA特刊(2014年7期)2014-04-29 00:44:03
生意無大小,關鍵是怎么做?
中國商人(2013年1期)2013-12-04 08:52:52
主站蜘蛛池模板: 99久久精品国产综合婷婷| 亚洲日韩高清在线亚洲专区| 日韩亚洲高清一区二区| 精品国产免费人成在线观看| 在线观看无码av五月花| 国产精品毛片一区| 欧美中文一区| 天天摸夜夜操| 黄色网址免费在线| 婷婷色在线视频| 亚洲国产精品无码AV| 亚洲AV永久无码精品古装片| 男女男免费视频网站国产| 2020最新国产精品视频| 在线看免费无码av天堂的| 久久精品最新免费国产成人| 精品久久久无码专区中文字幕| 中日韩一区二区三区中文免费视频| 四虎在线观看视频高清无码 | 国产微拍一区二区三区四区| 色哟哟国产精品一区二区| 国产成人精品高清不卡在线| 97视频精品全国免费观看| 国产哺乳奶水91在线播放| 亚洲精品视频在线观看视频| 国产成人综合亚洲欧美在| 人妻丰满熟妇αv无码| 视频一区亚洲| 五月天久久综合| 91在线激情在线观看| 久久特级毛片| 福利小视频在线播放| 免费a级毛片视频| 中国一级毛片免费观看| 亚洲国产欧美国产综合久久| 园内精品自拍视频在线播放| 亚洲三级电影在线播放| 成人在线天堂| 亚洲无线视频| 亚洲无码91视频| 国产视频入口| 日韩在线第三页| 在线五月婷婷| 真实国产精品vr专区| 少妇被粗大的猛烈进出免费视频| 国产精品黄色片| 国产视频大全| 毛片在线播放网址| 久热re国产手机在线观看| 久久久久国产精品嫩草影院| 国产香蕉在线视频| 91啪在线| 91久久国产成人免费观看| 美女视频黄又黄又免费高清| av天堂最新版在线| 国产福利影院在线观看| 国产无遮挡猛进猛出免费软件| 亚洲欧美日韩中文字幕在线一区| 国产va欧美va在线观看| 国产成熟女人性满足视频| 亚洲成人动漫在线| 欧美日韩在线亚洲国产人| 国产无人区一区二区三区| 成年A级毛片| 亚洲精品黄| 成人午夜视频网站| 精品日韩亚洲欧美高清a| 永久天堂网Av| 亚洲国产中文精品va在线播放| 好吊色国产欧美日韩免费观看| 国产网站一区二区三区| 精品国产成人国产在线| 亚洲天堂区| 萌白酱国产一区二区| 91人人妻人人做人人爽男同| 成人精品亚洲| 国产亚洲一区二区三区在线| 尤物视频一区| 国产精品男人的天堂| 色综合五月婷婷| 中字无码av在线电影| 亚洲一级无毛片无码在线免费视频|