999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的網絡輿情情感監測系統設計

2021-03-07 07:57:50許學添鄒同浩肖楓
電子技術與軟件工程 2021年24期
關鍵詞:深度特征文本

許學添 鄒同浩 肖楓

(廣東司法警官職業學院 廣東省廣州市 510520)

1 引言

輿情是指在一定的社會空間內,圍繞社會事件的發生、發展和變化,作為主體的民眾對作為客體的社會管理者、企業、個人及其他各類組織及其政治、社會、道德等方面的取向產生和持有的社會態度,是較多群眾關于社會中各種現象、問題所表達的信念、態度、意見和情緒等等表現的總和。隨著信息技術的發展和互聯網媒體的興起,截至2021年2月,我國的網民數量已經達到9.89 億,網絡已經成為輿情產生與傳播的主要途徑,特別是社會生活中的熱點事件或問題,更是會有大量網民通過評論表達出自己的情感態度,通過對這些網絡輿情進行情感分析[1],可以有效掌握和解讀民意,科學、高效地做好輿情監控和引導工作。

網絡輿情一般是以文本作為表現形式,隨著自然語言處理技術的發展與成熟,利用其來對網絡輿情進行分析處理,成為目前網絡輿情自動監測的一種主流方法,其中對網絡輿情的情感傾向分析是一個重要的研究方向。XingMou 等[2]結合了知網HowNet 情感詞典和其他領域詞典對微博上關于電影的評論進行了情感分析;劉志明等[3]使用了三種特征選取方法和三種特征值權重計算方法,通過訓練SVM 分類模型、貝葉斯分類模型、n 元語言模型進行情感分類的研究;Xiao Sun 等[4]通過擴展的卷積神經網絡,完成對微博內容的情感識別;李洋等[5]提出一種卷積神經網絡和雙向長短時記憶特征融合的模型,利用卷積神經網絡提取文本向量的局部特征,利用BiLSTM 提取與文本上下文相關的全局特征,將兩種互補模型提取的特征進行融合,提高了文本情感識別的準確率。

本文所設計的是基于深度學習的網絡輿情情感分析系統,利用爬蟲技術獲取網絡上的輿情文本數據,在標注后,由深度學習模型對句子中詞向量的情感特征進行學習,訓練后的模型可以對新采集的輿情數據進行情感分析,統計出網民們的情感傾向,并通過Web系統進行管理和數據顯示。

2 系統整體設計

系統整體設計包括數據采集、數據存儲、情感分析和系統管理四個模塊,如圖1所示,數據采集采用分布式爬蟲,由IP 代理池和Cookie 池實現多IP 地址的訪問偽裝和多用戶模擬登錄,由Scrapy 爬蟲框架實現數據抓取,Scrapy 是Python 開發的一個快速Web 信息抓取框架,用于抓取Web 站點并從頁面中提取結構化的數據,獲取的數據以文檔的形式存儲在MongoDB 數據庫。

圖1:系統整體結構

情感分析模塊主要完成對獲取的文本輿情數據進行情感分析,實現的方法主要有幾種,包括基于情感詞典的情感分析方法、基于傳統機器學習的情感分析方法和基于深度學習的情感分析方法等[6]?;谇楦性~典的情感分析方法,主要依賴情感詞典的構建,在信息爆炸的今天,各種網絡流行語、諧音語、雙關語等新詞語層出不窮,這就要求情感詞典不斷擴充才能保證分析的正確率;而基于傳統機器學習的情感分析方法,使用統計機器學習算法,抽取文本情感特征,輸出情感分析結果,往往過度依賴文本情感特征的提取方法以及分類器的設計,也不能充分考慮上下文的語境信息,也存在一定的缺陷。本系統主要采用基于深度學習的情感分析方法,該方法可以有效解決情感詞典擴充和文本情感特征提取的問題,由深度學習的模型自主學習文本信息高維度的、深層次的情感特征信息,可以進一步提高分析的準確度。

情感分析模塊首先要對輿情文本數據進行預處理,包括:

(1)數據清洗,去除文本含有的“噪聲”;

(2)分詞處理,利用jieba 分詞工具包將語句進行中文分詞;

(3)去除停用詞,借助已有的停用詞詞典,過濾掉文本中的停用詞,降低停用詞對分析結果的影響。

預處理之后進行詞向量轉換[7],通過算法模型將文本轉化為一系列能夠表示文本的語義向量,本文借助Gensim 工具包中Word2Vec 模型完成詞向量訓練。最后,詞向量作為input,輸入一個長短期記憶網絡(Long Short-Term Memory, LSTM)[8]和卷積神經網絡(Convolution Neural Network, CNN)[9]組成的深度學習模型,在完成調參、訓練后對文本進行情感分析。

系統管理模塊作為系統的用戶接口模塊,包括用戶管理和對輿情情感分析結果進行可視化顯示,系統采用瀏覽器/服務器(B/S)結構,為了方便調用深度學習模型,采用Flask Web 框架,用戶數據和情感分析結果數據存儲在MySQL 數據庫,按照事件、時間、情感傾向等因素進行結果展示,可視化工具采用Echarts 庫。

3 文本情感分析模型

基于深度學習的情感分析模型是本系統的核心模塊,主要采用LSTM+CNN 建立網絡輿論數據的情感分類模型。

卷積神經網絡是一種流行的深度學習模型,通過多維的卷積核可以獲取信息對象不同層次的多維特征,再通過池化操作來取得局部的關鍵信息。詞嵌入層(Word Embedding)[10]是一層可學習的神經網絡,基于CBOW 和Skip-gram 兩種模型,將高維度稀疏的特征向量映射為低維度稠密的詞向量,并且詞向量之間具有較高的主義相關性;CNN 用一維卷積核就可以抽取不同粒度的短文本特征,可以高效地挖掘數據的局部特征,但是CNN 在處理文本信息時,比較依賴卷積核長度,對語序不敏感,CNN 的公式如下:

LSTM 網絡是遞歸神經網絡(RNN)的一種變體,它能解決RNN 的梯度消失問題,更重要的是相對于RNN,其增加了3 個特殊的門:輸入門、輸出門和遺忘門,這樣其記憶單元就具有了保存、更新和重置功能,具有兼顧長距離歷史信息的能力,應用在文本信息處理中,可以有效提取上下文語義信息,LSTM 的計算公式如下,其中σ 為Sigmod 激活函數,代表了門開關,it為輸入門的輸出,ot輸出門的輸出,ft為遺忘門輸出,W 為對應的權重,b 為對應的偏置,LSTM 的更新公式為:

本文基于深度學習的文本情感分類模型如圖2所示,每個句子分詞后,每個詞的詞向量作為輸入(Input),通過詞嵌入層(Word embeding)重新映射為長度128 的詞向量,再分別獨立經過CNN 層和LSTM 層進行特征提取,其中CNN 層卷積核長度為512,數量為36,LSTM 層單元數量為64,之后通過RuLU 激活函數進行非線性變換,再進行dropout 處理,按照一定的概率p 將神經網絡單元暫時從網絡中丟棄,再分別通過最大值池化操作(Max pooling),將特征進行降采樣,以減少運算量和防止過擬合,池化操作后的CNN 層特征和LSTM 層特征再進行特征融合,輸入全連接層神經網絡(Full connection)進一步特征提取,最后通過Softmax 分類器輸出文本情感分類結果。

圖2:文本情感分類模型

本文采用第二十六屆全國信息檢索學術會議評測大賽提供的網民情緒數據集(https://www.datafountain.cn/competitions/423/datasets)進行測試,該數據集是230 個主題關鍵詞進行采集的數據,其中10 萬條已經人工標注(積極、中性和消極)的數據70%作為訓練集,30%作為驗證集,在驗證集上可以得到70.4%的準確率,F1 值為73.1。

4 總結

本文提出了一種基于深度學習的輿情情感監測系統,通過爬蟲技術抓取網絡中的評論文本數據,再調用基于CNN 和LSTM 融合的深度學習模型進行情感分類,訓練后的模型可以充分考慮句子不同粒度的短文本特征和上下文信息,因此能夠獲得較好情感分類效果,最后系統將情感傾向按照事件、時間等因素進行可視化展示。該系統可以及時監測廣大網民對某一事件的態度,實現科學、高效的輿情分析和引導,具有較高的應用價值。

猜你喜歡
深度特征文本
深度理解一元一次方程
如何表達“特征”
在808DA上文本顯示的改善
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
深度觀察
深度觀察
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
深度觀察
抓住特征巧觀察
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 女人爽到高潮免费视频大全| 国产 在线视频无码| 久久午夜夜伦鲁鲁片无码免费 | 亚洲视频一区在线| 精品乱码久久久久久久| 在线观看热码亚洲av每日更新| 日本久久久久久免费网络| 亚洲毛片网站| 亚洲天堂视频在线观看免费| 免费看的一级毛片| 2021国产在线视频| 幺女国产一级毛片| 久久久国产精品免费视频| 91人妻在线视频| 伊人丁香五月天久久综合| 国产精品免费久久久久影院无码| 亚洲无码精品在线播放| 久久综合结合久久狠狠狠97色| 无码'专区第一页| 无码中文字幕乱码免费2| 欧美19综合中文字幕| 国产高清免费午夜在线视频| 亚洲天堂视频网| 免费一级毛片在线观看| 成人在线欧美| 国产精品高清国产三级囯产AV| 丰满少妇αⅴ无码区| 蜜桃视频一区二区三区| 国产素人在线| 日韩精品一区二区三区中文无码| 色悠久久久| 色综合成人| 国产成人在线小视频| 四虎AV麻豆| 国产主播一区二区三区| 国产草草影院18成年视频| 亚洲色图综合在线| 尤物精品视频一区二区三区| 国产无遮挡猛进猛出免费软件| 亚洲色精品国产一区二区三区| 免费在线a视频| 蜜桃视频一区二区| 亚洲91精品视频| JIZZ亚洲国产| 国产1区2区在线观看| 国产亚洲精品精品精品| 制服丝袜国产精品| 青青久在线视频免费观看| 在线亚洲精品自拍| 亚洲国产欧美自拍| 成人在线观看不卡| 欧美成a人片在线观看| 午夜电影在线观看国产1区| 亚洲欧美国产五月天综合| 日韩无码视频播放| 青草视频免费在线观看| 欧美精品一区在线看| 四虎影视国产精品| 日韩精品久久久久久久电影蜜臀| 91成人在线免费观看| 欧美成人国产| aaa国产一级毛片| 亚洲av综合网| 高清无码不卡视频| 99re精彩视频| 亚洲高清中文字幕| 亚洲一区网站| 成人韩免费网站| 日韩在线观看网站| 国产精品色婷婷在线观看| 国国产a国产片免费麻豆| 九九热精品视频在线| 人与鲁专区| 伊人久热这里只有精品视频99| 国产一二视频| 国产精品第一区| 国产99精品视频| 免费国产无遮挡又黄又爽| 亚洲男人的天堂久久香蕉网| 久久青青草原亚洲av无码| 色欲色欲久久综合网| 99精品福利视频|