摘要:情感評價單元的抽取是情感分析的基礎任務之一,目前大部分的抽取方法都基于句法路徑等扁平化的特征,區分中文評價文本中噪聲的能力不強。提出了一種基于短語句法的樹型結構來表示情感評價單元模式,并使用近似卷積樹核的方法來計算這種結構的相似度;在此基礎上,采用基于相似度計算的模式匹配方法進行情感評價單元抽取。在中文商品評論上進行實驗,該方法比基于句法路徑的方法準確率提高了13.4%,召回率提高了9.2%。實驗證明提出的方法對中文商品評價的情感評價單元抽取效果較好。
關鍵詞:情感分析;情感評價單元;句法樹;卷積樹核;相似度計算;商品評價
中圖分類號:TP391 文獻標志碼:A 文章編號:1001—3695(2011)09—3229—06