吳 菲, 徐姍姍
(1.南京工業大學浦江學院,江蘇 南京 210000;2.南京林業大學信息科學與技術學院,江蘇 南京 21000)
互聯網在給人們帶來信息獲取便利性的同時,也出現了一些負面影響,如:網絡上存在大量虛假信息。在當今的互聯網+時代,目前大多數人們首先通過聯網設備獲取或發布信息。如何更好地了解群眾的情緒或觀點并精準地得到觀點傾向性,就成了目前輿情分析領域最需要解決的主要問題。而目前政府等部門進行輿情監控的主要手段是觀察情感的流向從而提供優秀的戰略建議。根據此戰略建議去安撫、疏導人們,防止部分人產生暴力行為從而導致人群的恐慌。
因此,針對評論獲得情感的傾向性對于輿論的監督或商品評論的統計都有著至關重要的作用。以往的方法:通過人工統計分析,其效率極低。因此提出一種利用機器來自動分析情感傾向的方法是十分必要的。
IG算法是一種有效的特征選擇算法,目前已在文本分類研究領域中得到了廣泛的應用。
傳統的IG算法描述如下:

傳統算法在信息增益上無法區分其特征,即情感詞。即便原有算法能夠擇出一些特征,但是算法分析后得到的結果并不是非常理想。對于情感分析這一重要問題,不難看出得到評論的極性最有效率的方式是判斷情感詞。所以在提取特征詞的時候,情感詞所占的比例應當得到大量增加從而提高判定的準確度。……