999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

微博立場檢測研究綜述

2017-02-23 06:50:18周耘立李珊珊
現代計算機 2017年2期
關鍵詞:監督文本情感

周耘立,李珊珊

(四川大學計算機學院,成都 610065)

微博立場檢測研究綜述

周耘立,李珊珊

(四川大學計算機學院,成都 610065)

微博立場檢測是一個新興的研究課題,具有很大的研究價值和應用價值。鑒于此,該研究課題受到越來越多國內外研究機構的重視。首先針對立場檢測主流方法和前沿進展進行介紹;接著介紹國內外主流的評測會議;最后,總結并展望立場檢測技術的發展趨勢。

情感傾向性分析;立場檢測;微博

0 引言

立場檢測任務就是自動的檢測一段文本的作者對于給定的目標對象他的立場是支持、反對還是中立。近幾年,已經在立場檢測建模方面進行了積極的研究工作[4-5,10]。Faulkne[4]使用目標信息和維基百科鏈接關系來自動的識別學生論文中的目標立場。由于微博文本簡短、非正式、充滿錯誤拼寫、簡寫以及俚語等特點,給研究界帶來了新的機遇和挑戰[2,5]。微博立場檢測任務旨在從一段微博中檢測作者對于給定目標的立場,而不依賴于在線討論中經常出現的會話結構。

立場檢測與情感分析研究相關,但是兩者有著顯著的差別。立場檢測通常可以看做是觀點挖掘和情感分析的一個子任務。在情感分析中,我們通過對文本中的觀點、態度的分析來判斷文本所表達的情感是正面的還是負面的。然而,在立場探測中,系統需要確定作者對于給定目標的偏好,是支持還是反對,或者是中立。這個目標可能并沒有在文本中顯式的出現,而是被暗指。同時這個文本可能對其他實體對象表達觀點或者情感[6]。例如,考慮表1中的目標和微博文本。

微博中并沒有直接提及目標對象,也沒有直接表對目標表達情感傾向,但是我們可以推斷出微博作者很可能是不支持目標對象的。立場檢測系統需要能自動識別出不存在于焦點文本中的相關信息。自動的立場檢測技術有著多方面的應用,如信息檢索、文本摘要和文本蘊涵等[11]。

表1 樣本數據

1 技術方法

針對微博進行情感傾向性分析研究技術主要有三大類:第一類是采用情感詞典與規則結合的方法[1,3],根據文本中所包含的情感詞的個數與情感詞的傾向來進行立場檢測;第二類是采用機器學習的方法,選擇文本中的一些特征,標準訓練集和測試集,使用樸素貝葉斯、SVM[7,11]等分類器進行立場檢測;第三類是規則與機器學習結合的方法。

微博立場檢測主要是考慮對于給定的目標對象微博作者的立場傾向,這個對象可能是事件、人或者物體。目前主要的研究方法是基于機器學習的方法。按照機器學習類型劃分,我們可以將機器學習方法分為兩類:第一類是有監督學習方法;第二類是無監督學習方法。

1.1 有監督方法

有監督方法將立場檢測問題看做是一個分類問題,使用機器學習方法從標注數據中學習分類器。當前大多數的語言學研究者把有監督的立場檢測問題看做是文檔水平的立場分類問題,使用各種詞匯、語法和語義特征來識別特定目標的立場。針對微博文本的特點,Patra[12]使用了SentiWordNet、NRC Emotion Lexicon、Hashtag Emotion Lexicon三個情感詞典來提取詞級別的特征,同時借助于RitaWordNet外部詞典資源來創建目標相關主題詞袋此外,還結合依存分析和手工規則構建特征,最后使用支持向量機來訓練分類器。Krejzl[13]通過使用hashtags的情感極性、n元語法、微博長度以及強烈表明一個特定立場的立場領域詞典等構造特征,訓練一個最大熵分類器。Elfardy[14]試圖探究詞法和語法特征能多大程度上來幫助識別微博立場,提出在有監督框架下,使用詞匯、語義字典和潛在語義情感來識別情感立場。

1.2 無監督方法

有監督方法主要缺點是依賴于人手工標注數據,這是一項十分費時費力的工作。當沒有辦法獲取大規模的標注語料時,人們提出了無監督學習方法,僅使用非標注數據進行建模。Turney通過計算文中候選單詞與種子情感詞之間的點互信息來計算文本的情感傾向性[7]。由于在線辯論語言使用上的復雜性,辯論雙方常常使用先褒后貶的方式來表達自己的觀點,Somasundaran[9]提出通過構建約束條件利用整數線性規劃進行建模,幫助識別作者的立場。立場檢測中目標對象很可能并沒有出現在微博中,Augenstein[13]等人通過從無標注的微博數據中使用詞袋自編碼模型學習特征,提高模型在目標對象未出現微博上的泛化能力從而提高了立場檢測的效果。

2 評測數據和評測指標

微博用戶產生的大量評論性數據潛藏著巨大的研究價值和商業價值[7]。微博立場檢測首先引起國際語義評估研討會(SemEval-20161)的關注,2016年發布了“Detecting Stance in Tweets”評測任務。國內第五屆自然語言處理與中文計算會議(NLPCC20162),發布了“中文微博立場檢測”評測任務。國內外研究機構都關注在兩個任務上,第一個任務是有監督方法的立場探測;第二個是無監督方法的立場檢測。下面針對SemEval-2016評測數據進行介紹。

SemEval-2016立場檢測任務中,評測數據包含五個目標對象分別是“Atheism”,"Climate Change is a Real Concern","Feminist Movement","Hillary Clinton", "Legalization of Abortion",所有的數據都標注了立場。表2所示是訓練集上樣本的統計。

表2 訓練集上樣本數據統計

精確率、召回率和F度量值三種評價指標在自然語言處理領域被廣泛使用。其中精確率和召回率從不同的角度度量了分類器的好壞,F度量值綜合了精確率和召回率兩種指標[3]。

表3 分類器輸出結果

精確率(P)、召回率(R)、F值定義如下:

3 結語

微博作為主流的社交媒體具有重大的研究價值和商業價值,微博立場探測作為新興的研究課題,得到國內外研究學者的廣泛重視,并成為研究熱點。本文主要從立場檢測前沿進展、主流方法以及相關評測進行介紹。目前基于神經網絡的方法也開始在立場檢測任務中展露光芒,相信在未來會有更多的進展。由于微博文本本身的一些隨意性、不規范表達增加了立場檢測的

[1]趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學報,2010,21(8):1834-1848.

[2]張劍峰,夏云慶,姚建民,等.微博文本處理研究綜述[J].中文信息學報,2012,26(4):21-27.

[3]奉國和.文本分類性能評價研究[J].情報雜志,2011(8):66-70.

[4]Faulkner A.Automated Classification of Stance in Student Essays:An Approach Using Stance Target Information and the Wikipedia Link-Based Measure[C]//2014.

[5]Kiritchenko S,Zhu X,Mohammad S M.Sentiment Analysis of Short Informal Text[J].Journal of Artificial Intelligence Research,2014, 50:723-762..

[6]Mohammad S M,Sobhani P,Kiritchenko S.Stance and Sentiment in Tweets[J],2016.

[7]楊經,林世平.基于SVM的文本詞句情感分析[J].計算機應用與軟件,2011,28(9):225-228.

[8]陳淵,林磊,孫承杰,等.一種面向微博用戶的標簽推薦方法[J].智能計算機與應用,2011,01(5):21-26.

[9]Somasundaran S,Wiebe J.Recognizing Stances in Online Debates[J],2009.

[10]Mohammad S,Kiritchenko S,Sobhani P,et al.SemEval-2016 Task 6:Detecting Stance in Tweets[C].International Workshop on Semantic Evaluation,2016.

[11]Patra B G,Das D,Bandyopadhyay S.JU_NLP at SemEval-2016 Task 6:Detecting Stance in Tweets using Support Vector Machines [C].Semeval,2016.

[12]Krejzl P,Steinberger J.UWB at SemEval-2016 Task 6:Stance Detection[C].International Workshop on Semantic Evaluation,2016.

[13]Augenstein I,Vlachos A,Bontcheva K.USFD at SemEval-2016 Task 6:Any-Target Stance Detection on Twitter with Autoencoders [C].International Workshop on Semantic Evaluation,2016.

[14]Elfardy H,Diab M.CU-GWU Perspective at SemEval-2016 Task 6:Ideological Stance Detection in Informal Text[C].International Workshop on Semantic Evaluation,2016.

Summary of Micro-Blog Stance Detection

ZHOU Yun-li,LI Shan-shan

(College of Computer Science,Sichuan University,Chengdu 610065)

Micro-blog stance detection is gaining importance due to various academic and commercial perspectives.For that reason,the subject of research receives increasingly attention at home and abroad in research institutions.Summarizes the author first the main stream stance detection approaches and the most recently research progress.Then introduces the main stream of evaluation meetings at home and abroad,finally,summarizes and forecasts the development trend of stance detection technology.

Sentiment Analysis;Stance Detection;Micro-blog

1007-1423(2017)02-0032-03

10.3969/j.issn.1007-1423.2017.02.008

周耘立(1990-),男,四川成都人,碩士研究生,研究方向為數據挖掘

2016-11-15

2017-01-05

李珊珊(1989-),女,江蘇徐州人,碩士研究生,研究方向為自然語言處理

猜你喜歡
監督文本情感
如何在情感中自我成長,保持獨立
突出“四個注重” 預算監督顯實效
人大建設(2020年4期)2020-09-21 03:39:12
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
監督見成效 舊貌換新顏
人大建設(2017年2期)2017-07-21 10:59:25
夯實監督之基
人大建設(2017年9期)2017-02-03 02:53:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: a级毛片免费在线观看| 国产日本一线在线观看免费| 国产精品一线天| 天堂中文在线资源| 国产一区免费在线观看| 成人在线天堂| 首页亚洲国产丝袜长腿综合| 久久这里只精品国产99热8| 成人在线不卡| 精品人妻无码中字系列| 午夜福利无码一区二区| 影音先锋丝袜制服| 91无码视频在线观看| 爽爽影院十八禁在线观看| 欧亚日韩Av| 国产成人乱无码视频| 国模粉嫩小泬视频在线观看| 91精品专区| 国产精品视频第一专区| 精品夜恋影院亚洲欧洲| 久久免费视频播放| www亚洲精品| 久久综合丝袜日本网| 在线永久免费观看的毛片| 91精选国产大片| 国产无遮挡猛进猛出免费软件| 99在线视频免费| 伊人久久久大香线蕉综合直播| 日韩欧美高清视频| 国产精品欧美日本韩免费一区二区三区不卡 | 欧洲熟妇精品视频| 日韩午夜福利在线观看| 波多野结衣一区二区三区四区视频| 国产好痛疼轻点好爽的视频| 视频一本大道香蕉久在线播放| 91小视频在线播放| 色婷婷视频在线| 亚洲国产精品VA在线看黑人| 国产精品嫩草影院视频| 亚洲swag精品自拍一区| 精品撒尿视频一区二区三区| 免费看a毛片| 自偷自拍三级全三级视频| 99热免费在线| 青青草原国产免费av观看| 国产福利微拍精品一区二区| 国产91精品久久| 国产屁屁影院| 国产一区二区精品福利| 亚洲香蕉伊综合在人在线| 四虎精品黑人视频| 免费看久久精品99| 日韩欧美国产精品| 国产第一页屁屁影院| 国产精欧美一区二区三区| 国产91特黄特色A级毛片| a级毛片网| 伊人网址在线| 国产成人精品视频一区视频二区| 亚洲高清在线播放| www亚洲精品| 尤物精品国产福利网站| 欧美精品伊人久久| 欧美色图久久| 亚洲午夜国产精品无卡| 国产在线一区视频| 中文一级毛片| 国产91丝袜| 久久精品亚洲热综合一区二区| 欧美不卡二区| 久久久精品无码一区二区三区| a级毛片免费网站| 久草视频精品| 日本在线国产| 国产内射一区亚洲| 欧美在线国产| 国内老司机精品视频在线播出| 特级精品毛片免费观看| 中文字幕乱码中文乱码51精品| 国产成人麻豆精品| 一级毛片免费的| 中文字幕乱码中文乱码51精品|