999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡輿情信息挖掘關鍵技術分析

2021-04-04 09:25:35郝云強尹雪雪
信息記錄材料 2021年3期
關鍵詞:詞匯文本情感

劉 娟,郝云強,尹雪雪

(山東醫學高等專科學校 山東 臨沂 276000)

1 引言

網絡輿情信息挖掘是指借助相關信息處理技術,識別、提取輿情文本中的熱點詞匯、傾向性詞匯,為輿情引導工作提供依據的信息挖掘活動。借助挖掘活動配套關鍵技術,能夠增強信息挖掘質量,提高輿情工作效果,因此,應對關鍵技術予以深入分析,并總結出優質的技術應用方案,促進輿情工作水平的發展。

2 TFIDF權重計算法

TFIDF權重計算法的應用常見于搜索引擎的信息挖掘,但在網絡輿情信息挖掘中,則一般用于信息檢索權重計算。其中,TFIDF中的TF代表詞頻、IDF代表反文檔頻率,由此可以看出,該項關鍵技術的主要思想為,若某一詞、字在某一篇文本中的詞頻較高,而在其他文章中出現頻率明顯減少,那么即可認為該字、詞,具備良好的區分能力,可以用于分類文章。基于此,在網絡輿情信息挖掘中,該項技術的應用原理為,利用統計的形式,評估某個字、詞,在一份網絡文件內容中的重要程度,以便于工作者識別該篇文本的輿情關鍵字、詞,實現網絡輿情信息的收集、提取,為輿情引導工作提供依據。在輿情信息挖掘中,TFIDF權重計算法會按照字詞出現的具體位置,來評估其的重要性,例如:在詞匯重要性評估中,該算法會認定標題、首尾處出現的詞匯,其重要性高于正文段落中出現的詞匯,以準確找出表現該文章輿情傾向的關鍵詞,達到輿情信息挖掘的目的。

3 文本聚類法

在網絡輿情信息挖掘中,文本聚類法是一項常用的信息挖掘關鍵技術,其應用機理為,基于文本數據的不同特征,將文本群劃分為不同數據類型的小文本群,以達到數據挖掘的效果,使同類輿情內容、傾向的文本被歸納到一起,方便工作者全面了解網絡輿情狀態,促進輿情工作決策活動的準確開展。從本質上來說,該項技術的運行方式,類似于無監督的學習機,無需工作者對算法程序進行訓練,也不用提前標注文檔類別,因此,其在實際的信息挖掘應用中,呈現出了較高的靈活性與自動化水平,提高了網絡輿情信息挖掘效率。就目前來看,該算法的運行步驟為,首先,收集網絡輿情信息文檔。其次,采用詞頻統計、停用詞去除等方法,構建出所收集文檔的文本表示。第三,基于文本表示,結合對相似度的衡量,搭建聚類模型,對文本加以分類。第四,對分類結果進行驗證分析,得出最終的輿情信息聚類挖掘結果。

4 ICTCLAS分詞法

該技術是由中國科學院計算機技術研究所研發的,其運行主要依賴于ICTCLAS系統,該系統作為當前在網絡輿情信息挖掘中,應用比較廣泛的中分詞系統,使ICTCLAS分詞法逐漸成為了網絡輿情信息挖掘關鍵技術。其中,該技術的信息挖掘機理為,利用層疊型隱式馬爾科夫模型,對本文信息進行切分、標注、命名等操作,以達到詞匯識別的效果,為后續的深度挖掘奠定基礎。目前,已經有專家對該系統進行了測評,結果顯示,該系統的分詞準確率可達97.58%,分詞與標注處理速度可達534.5KB/S,由此可見,ICTCLAS分詞法具有良好的使用性能,有助于網絡輿情信息挖掘水平的提升。此外,該技術的應用系統,以及動態鏈接庫、概率詞典,都能在官網上找到免費下載鏈接,因此,基于該技術的信息挖掘工作成本也比較低。

5 粗粒度情感傾向性分析技術

在網絡輿情信息挖掘中,粗粒度情感傾向性分析技術主要用于文本的輿情傾向分析,相較于上述信息挖掘關鍵技術,該技術的挖掘層次更深。在此過程中,該技術的信息挖掘機理為使用語義角色標注對文本中的各個句子進行語義識別,得出句子中情感詞的布局狀態、句子與主題的關聯程度,最終得出文本的輿情情感傾向信息,實現信息挖掘。在此過程中,該技術會借助相應的算法與程序,將文本中所有的干擾句、客觀句進行篩除,然后針對剩下的句子,按照上述信息挖掘機理,進行逐句的輿情傾向分析,整合出整篇文本的輿情傾向狀態,幫助工作者快速地了解網絡輿情狀態,以便于其采取相應的輿情引導措施,來改善網絡輿情情況,凈化網絡輿論環境[1]。

6 細粒度情感傾向性分析技術

細粒度情感傾向性分析技術也屬于一種網絡輿情傾向信息挖掘關鍵技術,該技術的信息挖掘程序為,首先,基于常規的領域,建立相應的領域特征庫,然后采用相似度計算的方法,結合現有同義詞資源,充實每個特征下的相關詞匯庫。若所提出領域非常規,那么則需要對基本特征類進行自定義,再對其配套詞匯庫,予以詞匯擴充。其次,以句子為單位,定位每個特征類的輿情傾向,再基于此,計算出文本信息中每句話的情感傾向值。最后,得出文本整體的情感傾向值,實現情感傾向的挖掘,實現對網絡輿情信息的深度挖掘。從整體上來看,該項技術的信息挖掘過程,相較于粗粒度情感傾向性分析技術更加復雜,但該技術能夠分析出更加精細的輿情信息,因此,現階段該技術的應用更為廣泛[2]。

7 結論

綜上所述,增強信息挖掘技術應用效果,有助于網絡輿情工作的穩健推進。在網絡輿情方面,采取網絡輿情信息挖掘關鍵技術措施可以找準輿情關鍵詞、實現輿情信息分類、降低信息挖掘成本、提高輿情現狀掌握效率、精細化輿情傾向分析結果,從而確保網絡輿情工作得以順利達到預期效果。

猜你喜歡
詞匯文本情感
本刊可直接用縮寫的常用詞匯
如何在情感中自我成長,保持獨立
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
本刊可直接用縮寫的常用詞匯
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 91在线视频福利| 欧美亚洲一二三区| 中文字幕亚洲乱码熟女1区2区| 欧美国产精品拍自| 啊嗯不日本网站| 成人国内精品久久久久影院| 国产精品爆乳99久久| 99在线视频网站| 自拍偷拍欧美| 五月婷婷综合在线视频| 亚洲欧美日韩中文字幕在线| 日韩毛片免费观看| 伊人久久综在合线亚洲2019| 国产好痛疼轻点好爽的视频| 国产成人福利在线视老湿机| 亚洲国产中文综合专区在| 国产网站免费| 国产99久久亚洲综合精品西瓜tv| 久久综合伊人 六十路| 亚洲国产精品无码AV| 香蕉蕉亚亚洲aav综合| 国产精品刺激对白在线| 午夜视频在线观看区二区| 国产三级韩国三级理| 免费又爽又刺激高潮网址| 动漫精品中文字幕无码| 免费女人18毛片a级毛片视频| 国产成人91精品免费网址在线| 深夜福利视频一区二区| 亚洲永久色| 婷婷伊人五月| 狠狠做深爱婷婷久久一区| 伊人色在线视频| 欧美全免费aaaaaa特黄在线| 香蕉在线视频网站| 内射人妻无码色AV天堂| 久久美女精品| 久久精品一卡日本电影| 欧美一级黄片一区2区| 欧美在线伊人| 91国语视频| 国产一区二区三区在线观看视频 | 欧美日韩国产精品va| 毛片免费在线视频| 国产97视频在线| 欧美自慰一级看片免费| 国产精品无码翘臀在线看纯欲| 二级特黄绝大片免费视频大片| 国外欧美一区另类中文字幕| 亚洲欧美日韩中文字幕在线一区| 国产在线观看人成激情视频| 一级香蕉人体视频| 中文字幕在线一区二区在线| 91亚瑟视频| 中国美女**毛片录像在线| 午夜三级在线| 亚洲精品第一在线观看视频| 国产大全韩国亚洲一区二区三区| 亚洲天堂网视频| 日韩在线永久免费播放| 人人爽人人爽人人片| 国产玖玖玖精品视频| 久久五月天综合| 99在线国产| 中字无码av在线电影| 亚洲天堂精品在线| 热re99久久精品国99热| 久久久久久久久18禁秘| 2020国产免费久久精品99| 亚洲一区二区约美女探花| 91九色最新地址| 国产美女无遮挡免费视频网站| 免费观看三级毛片| 亚洲日韩久久综合中文字幕| 91免费国产在线观看尤物| 999精品免费视频| 激情网址在线观看| JIZZ亚洲国产| 97一区二区在线播放| 国产剧情国内精品原创| 欧美无专区| 中文字幕有乳无码|