999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漢語情感問題類型分類研究

2011-06-28 02:18:40李婷玉葛正榮姚天昉
中文信息學報 2011年2期
關鍵詞:語義分類情感

李婷玉,葛正榮,姚天昉

(上海交通大學 計算機科學與工程系,上海 200240)

1 概述

網絡技術的高速發展,宣告了信息時代的到來。如何將自己需要的信息從網絡上海量的數據中抽取出來,已經成為一個熱點研究方向。傳統搜索引擎的方法往往是依靠關鍵字的搜索,通過匹配來檢索出用戶所需要的信息和內容。但是,關鍵字的匹配并不能很好地獲取用戶所需要的內容,往往會夾雜著大量的無用信息,需要用戶人工篩選。而問答系統(Question Answering)的出現有望代替原有的信息檢索技術,使用戶能夠更方便地找到所要的信息。

傳統的問答系統一般只針對比較簡單的、基于事實的問句,而隨著大量評論性信息的出現,傳統的問答系統回答這些情感問題不再顯得有效。對此,Wiebe和Cardie等人首先實現了一個MPQA(Multi-Perspective Question Answering)系統,它沒有專門對問題進行分類,而只是簡單地采用人工的方法對情感問題和基于事實的問題進行手工標識, 構建了一個主觀性文本語料庫,通過分析和抽取語料庫中的情感信息片段,回答情感問題。Someasundaran和Wilson[1]等人在此基礎上,進一步對情感的類型體系進行細分。 接著,Yu和Hatzivassibloglou[2]分別在篇章層和句子層對情感分類做了研究。針對一個情感問題,他們試圖在文本中尋找與問題具有相同情感傾向的句子,然后根據這些情感句子產生答案,但是在情感問題分析方面,僅僅只是對情感問題的極性進行了分類。Kim和Hovy[3]專門對情感問答系統中句子的情感持有者識別做了研究。Lun-Wei Ku和Hsin-His Chen[4]等人基于TREC-11和NTCIR等語料實現了一個簡單的情感問答系統。

情感問題分析是情感問答系統中第一個處理步驟,它對于理解問題的關鍵信息、提高檢索速度、縮小答案范圍等具有重要的意義。由于對漢語的搜索技術研究開展地比較晚,再加上中文的復雜性,所以西方研究者所提出的一些方法與技術往往會“水土不服”。本文將重點研究非特定領域的情感問題分類,從語法、語義、領域等不同層面分析并定義情感問題的類型。在語法層面,采用漢語語法的疑問句式的分類標準;在語義層面,利用關鍵字等特征進行分類;在領域層面,采用本體等工具確定領域。在此基礎上建立情感問題類型體系。接著篩選區分情感問題和非情感問題的敏感特征,這些特征可以來源于不同的語言層面。在完成情感問題和非情感問題分類以后,針對情感問題,采用情感問題類型體系對它進行進一步分類,確定問題的關鍵信息(如命名實體)與預期候選答案的關系。

2 情感問題類型分類

一般采用基于示例的指導性學習進行問題分類時,都按照疑問短語來進行[5],其主要方法有以下幾種:統計方法、規則學習、樹方法以及神經網絡方法等。其中最常用的是統計方法,其次是規則學習和樹方法,而神經網絡方法較少用。

在本次實驗中,我們考慮從語法、語義、領域等層面分析并定義情感問題的類型。在語法層面,采用漢語語法的疑問句式的分類標準;在語義層面,利用關鍵字等特征進行分類;在領域層面,可以采用本體等工具確定領域。并在此基礎上建立情感問題類型體系。針對情感問題,采用情感問題類型體系對它進一步分類,確定問題的關鍵信息和與預期候選答案的關系。

所以,總的來說,對于問題的分析,最終將有三部分組成:

a) 語義層面的一些關鍵詞;

b) 語法層面的不同疑問句類型的分類;

c) 領域層面領域的確定。

2.1 語義層面

對于一般的文本來說,往往可以通過一些關鍵詞的搜索來進行語義層面的分類。但是問題分類有其特殊性,由于篇幅較小,一個問題不超過20個語素,所以往往其語義不容易判斷。而對于情感問題來說,它的問題覆蓋面更狹窄,情感問題往往是圍繞著一個情感表達事件來進行提問。因此只要將關于這個情感表達事件描述的關鍵詞抽取出來,那么,就可以了解整個情感表達事件的大致意思。通過對大量情感問題的觀察,我們認為主要有以下幾個關鍵詞:

(1) 情感詞(sentiment word)

對于絕大多數情感問題來說,帶有極性的形容詞或者動詞往往是表達情感和看法用的最多的語素。因為它帶有一定的情感傾向,而這些傾向則往往用來表達人對于事物的態度。本次實驗利用《知網》(HowNet)情感詞辭典來判斷情感詞。

值得一提的是,大多數情感詞具有兩種詞性,一為形容詞,另一為動詞。由于這兩種詞在句中的語法作用不同,所以往往要分開標記。

(2) 主題詞(target)

在情感問題中,情感詞是用來修飾主題詞的,是為了對該主題表達一定的情感。在本次實驗中,主要利用我們實驗室已有的汽車主題庫進行搜索[6]。

(3) 持有者(holder)

在情感問題中,不同的人和團體對于相同的主題可能抱有不同的情感和看法,因此持有者也應該作為一個關鍵詞。

由于持有者可以是任何人、組織或者團體,范圍很大,所以利用辭典不可能囊括。因此,還要加上語法上的判斷,比如動詞前面很有可能就是情感的持有者,特別是建議性動詞和情感動詞。所以對于這兩者前面的名詞、代詞,和一些專有名詞,都認為是情感持有者并提取出來。要注意的是,很多句子中會缺少情感持有者。

例如:吉普車安全嗎?

問題的情感持有者被省略了。通過分析,本次實驗中把情感持有者省略的狀況認為是對于“你”的提問。對于上例即看作“你認為吉普車安全嗎?”

2.2 語法層面

在本次實驗中對于情感問題分類的語法層面研究主要向英語語法借鑒[7],將其分成兩大類,即一般疑問句和特殊疑問句。鑒于一般疑問句的回答比較簡單,所以不再細分。而特殊疑問句首先與上一節抽取到的三個關鍵詞相對應。用英語來表示即為:情感詞對應“how”,主題詞對應“what”,持有者對應“who”。同樣問原因“why”的特殊疑問句也可以放在情感問題的分類里面,但是對于“where”和“when”這兩個問地點和時間的特殊疑問詞,則將它們舍去,因為它們總是出現在非情感問題當中,不在我們所討論的情感問題范疇之內。

情感問題分類如表1所示。

表1 情感問題分類表

情感詞類:這類問題是詢問人或者團體對于某一事件或事物的看法,而這類問題回答的要點總是在于情感詞,表2是幾種基本的問句類型。

表2 情感詞類句式規則表

主題詞類:這類問題是詢問人或者團體什么事物或事件持有特定的看法,而這類問題回答的要點總是在于主題詞,表3是幾種基本的問句類型。

持有者類:這類問題是詢問哪些人或團體對某些事物或事件持有某種看法,而這類問題回答的要點總是在于持有者,表4是幾種基本的問句類型。

表3 主題詞類句式規則表

表4 持有者類句式規則表

原因類:這類問題是詢問情感事件表達的原因,而這類問題的回答要點總是在于理由,表5是幾種基本的問句類型。

表5 原因類句式規則表

一般疑問句類:在情感問題中,一般疑問句常常詢問某一情感表達事件的正確與否,而這類問題的答案一般只有兩種:正確或錯誤。表6是幾種基本的問句類型。

從上述五種疑問句類型中可以總結出幾點情感問題句式規律:

(1) 一般來說主題詞和情感詞的位置可以互換,且不影響句子的表達。

(2) 一般來說句子帶有持有者和建議性動詞的,兩者可以省略,不影響句子的表達。

(3) 疑問詞的不同和某種關鍵詞的缺失往往決定了句子的類型。

表6 一般疑問句句式規則表

2.3 領域層面

對情感問題的分析來看,決定這個問題是屬于哪個領域最關鍵的是主題詞。主題詞往往決定了情感所針對的對象,這個對象屬于哪個領域則這個情感問題也屬于該領域。在本次實驗中,利用Google來進行相關性的搜索。比如主題是“奔馳”,那么在Google中輸入“奔馳 汽車”,記錄其相關網頁數量,同時也輸入“奔馳 食物”,記錄其相關網頁數量,“汽車”和“食物”為領域。當將主題詞和不同的領域的搜索引擎相關網頁數得到后,其中數值最大的領域便是這個主題的領域。對于問題的領域,并不是說要將其限定在某個領域中,而是將其歸納到某個領域中方便以后對答案進行篩選等步驟,對于問題本身沒有影響。

例如:對于主題“寶馬”的領域判斷,以下數據來源于www.google.com。

約有 19 100 000項符合 寶馬 汽車 的查詢結果

約有 9 730 000項符合 寶馬 食物 的查詢結果

約有 1 570 000項符合 寶馬 mp3 的查詢結果

可見寶馬與汽車的相關網頁最多,所以判斷寶馬屬于汽車領域。

3 系統介紹及實驗分析

從圖1來看,在語義、語法、領域三個方面,語義層次的分析最重要,它是一切的基礎,關鍵詞的標注是另外兩步的基礎。而語法層面和領域層面在拿到語義分析的結果后則可以分別獨立執行,最后將三個部分的結果整合輸出。

圖1 情感問題分類流程圖

本次實驗對于每種疑問句類型準備20句左右的測試語料,并按難度將其分成三等,對整個情感問題分類系統進行測試,并且手工判斷其結果正確與否。最后的結果如表7所示。

從表7看來,本次實驗的結果一開始不是十分理想,仔細觀察一些錯位的句子,發現主要有以下幾個主要問題:

例1:哪些人覺得寶馬車是最舒適的跑車?

這句問題,系統的類型判斷正確,但是對于情感詞的提取則不夠精確,系統提取了“舒適”而不是“最舒適”,而“最”、“不”、“比較”這類副詞對于后續研究中對于答案的搜索有著至關重要的作用,所以應該將情感形容詞前的副詞一并加入情感詞輸出。

例2: 為什么人們覺得奧迪漂亮安全?

該句疑問句分類正確,但是對于情感詞的提取不夠全面,系統提取了“漂亮”,但是“安全”則被忽略了。在情感問題中,常常有這一類問題,其主題擁有多個情感詞。應該將并列的情感詞一起輸出。

表7 情感問題分類系統實驗結果

修改了以上一些問題之后,用新的系統來進行測試,結果有了很大的改善,對于簡單和中等的情感問題處理得比較理想。但是,對于困難的情感問題,處理起來仍有些吃力,主要是由于漢語隨意性較強,句型、詞性等在不同的情況下都可以有不同的變化。

4 結束語

本文對情感問題分類進行研究,從語義、語法和領域三個方面對其進行分類。語義上挑選出三種關鍵詞;在語法上,將問題分成五種類型,并制定相應的規則,對其進行分類;在領域上,利用網絡搜索引擎得到結果進行分類。實驗的結果比較理想。經過實驗,我們認為漢語情感問題分類最關鍵的部分還是在語法層面,如果能將每個詞在句子中所起到的作用分析清楚并且在系統中很好地加以識別,分類會方便很多。

綜上所述,可以看出:漢語情感問答系統作為一個新興的搜索引擎發展方向,對其的研究才剛剛起步,不管是理論上還是工程上,仍有很大的提升空間。

[1] SOMASUNDARAN S, WILSON T, WIEBE J, et al. QA with attitude: exploiting opinion type analysis for improving question answering in on-line discussions and the news[C]//Proceedings of the International Conference on Weblogs and Social Media. Boulder, Colorado,USA, 2007.

[2] YU H, HATZIVASSILOGLOU V. Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences[C]//Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. Sapporo, Japan, 2003: 129-136.

[3] Kim, S-M and Hovy, E. Identifying Opinion Holders for Question Answering in Opinion Texts[C]//Proceedings of AAAI-05 Workshop on Question Answering in Restricted Domains.2005.

[4] Lun-Wei Ku etc. Question Analysis and Answer Passage Retrieval for Opinion Question Answering Systems[C]//Computational Linguistics and Chinese Language Processing Vol.13,No.3, September 2008: 307-326.

[5] 鄭實福,劉挺,秦兵,等.自動問答綜述[J].中文信息學報,2002,16(6):46-52.

[6] 姚天昉,聶青陽,李建超,等. 一個用于漢語汽車評論的意見挖掘系統[C]//中文信息處理前沿進展-中國中文信息學會二十五周年學術會議論文集. 北京:清華大學出版社,2006,260-281.

[7] 張剛,劉挺,鄭實福,等.開放域中文問答系統的研究與實現[C]//哈爾濱工業大學信息檢索研究室論文集,第一卷,2003.

猜你喜歡
語義分類情感
分類算一算
如何在情感中自我成長,保持獨立
語言與語義
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
分類討論求坐標
如何在情感中自我成長,保持獨立
數據分析中的分類討論
教你一招:數的分類
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
主站蜘蛛池模板: 国产一区二区三区夜色| 国产成+人+综合+亚洲欧美| 亚洲国产精品日韩专区AV| 国产女人水多毛片18| 欧美日韩一区二区在线播放| 欧美日韩免费| 欧美区一区| 欧美中文字幕在线视频| 一级片免费网站| 欧美福利在线播放| 亚洲精品国产日韩无码AV永久免费网 | 国产精品女在线观看| 91在线丝袜| 国产99久久亚洲综合精品西瓜tv| 亚洲狼网站狼狼鲁亚洲下载| 97成人在线视频| 欧美高清国产| 免费国产高清视频| 伊人久久大香线蕉综合影视| 国产美女91视频| 欧美三级日韩三级| 国产精品毛片一区视频播| 国产成人无码久久久久毛片| 国产毛片基地| 国产免费精彩视频| 国产亚洲欧美在线人成aaaa| 亚洲国产系列| 国产一区二区三区免费| 91av国产在线| 国产日本欧美在线观看| 亚洲不卡无码av中文字幕| 男人天堂亚洲天堂| 成人精品视频一区二区在线| 中文字幕欧美日韩高清| 中文字幕精品一区二区三区视频| 91精品啪在线观看国产91| 2020极品精品国产| 丝袜无码一区二区三区| 91久久精品日日躁夜夜躁欧美| 无码中字出轨中文人妻中文中| 国产亚洲精品在天天在线麻豆| 色悠久久久| 91九色国产在线| 久久久久国产精品熟女影院| 日本高清成本人视频一区| 国产精品xxx| 亚洲国产日韩一区| 被公侵犯人妻少妇一区二区三区| 人妖无码第一页| 成人国产小视频| 国产欧美日韩综合在线第一| 在线精品亚洲国产| 久久99精品久久久久纯品| 亚洲精品桃花岛av在线| 国产毛片高清一级国语| 精品国产自| 91视频日本| 激情乱人伦| 九九视频免费在线观看| 亚洲精品无码抽插日韩| 亚洲欧美日韩动漫| 久青草网站| 自拍偷拍欧美日韩| 多人乱p欧美在线观看| 91成人试看福利体验区| 国产探花在线视频| 欧美成人午夜影院| 亚洲欧美成人在线视频| 欧美www在线观看| 天天色天天综合| 亚洲三级电影在线播放| 四虎国产在线观看| 尤物午夜福利视频| 毛片免费高清免费| 五月婷婷激情四射| 亚洲天堂精品在线| 亚洲人成网站在线播放2019| 国产丰满成熟女性性满足视频| 女人av社区男人的天堂| 激情综合激情| 亚洲国产中文欧美在线人成大黄瓜| 91丝袜在线观看|