999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于樸素貝葉斯的新冠疫情新聞分類研究

2020-10-26 08:55:40馬亞州侯益明王紫薇
無線互聯科技 2020年14期
關鍵詞:分類疫情

馬亞州,張 勇,侯益明,王紫薇

(山西農業大學 信息科學與工程學院,山西 太谷 030801)

0 引言

2020年,新冠病毒來勢洶洶,席卷全球。隨著新型冠狀病毒性肺炎疫情的蔓延,防控工作越來越艱巨,面臨的問題也越來越嚴峻。在這沒有硝煙的“戰場”上,普通民眾能做的就是保護好自己,因此,能夠正確接收正規新聞報道,清楚地認清當下疫情情勢和防控措施,才可以更好地保護自己,對社會有所貢獻。

為了能夠快速閱讀到關于疫情的新聞,本文基于樸素貝葉斯算法來對當前一些實時新聞進行分類,將實時新聞分為疫情類與非疫情類。該算法用于分類的準確率較高且有一定使用意義,值得進一步研究。

1 樸素貝葉斯算法

樸素貝葉斯(Naive Bayes,NB)是基于“特征之間是獨立的”[1]這一樸素假設,應用貝葉斯定理的監督學習算法。對應給定的樣本X的特征向量x1,x2, ...,xm;該樣本X的類別y的概率可以由貝葉斯公式得到:

(1)

特征之間是相互獨立的,可得:

(2)

在給定樣本的情況下,P(x1,x2, ...,xm)是常數:

(3)

要求得到最終的模型為:

(4)

計算出新聞分類中用于訓練的每個新聞標題的每個單詞在詞匯表中出現的概率,之后對于待分類的新聞可分別計算其屬于兩個類別的概率,然后比較其大小,最終予以分類[2]。算法流程如圖1所示。

2 數據準備

(1)通過Java爬蟲代碼分別從中國日報網英文版(http://www.chinadaily.com.cn/)、人民網英文版(http://english.peopledaily.com.cn/)、中國日報英文版(http://europe.chinadaily.com.cn/ )、新浪英文版(http://english.sina.com/ )等各大權威網站搜集近一個月以來的新聞報道標題,從中共篩選得到1 085條關于新冠疫情的新聞報道標題,從中隨機選取200條用于測試錯誤率,其余用于訓練,另外,選取同樣數目的其他新聞標題也用于訓練。將每個樣本分別單獨放到一個文本文檔中,構成訓練數據集和測試數據集[3]。

(2)訓練數據時,將所有訓練數據集和測試數據集構成一個詞匯表并且將其向量化,將得到包含所有單詞的單詞表及向量表,如表1所示。

表1 樣本數量

3 實驗過程

3.1 構造分類器

根據樸素貝葉斯算法的原理,首先,需要針對所有樣本集構造一個詞匯表;其次,根據詞匯表將訓練樣本集向量化[4];最后,構造一個帶有兩個參數的分類器:訓練文檔矩陣和訓練類別標簽向量。將依次求得在整個數據集中,文檔分別屬于疫情類以及非疫情類的概率、詞匯表中各個單詞分別在疫情類以及非疫情類的概率,分類流程如圖2所示。

圖2 分類流程

3.2 新聞識別

進行新聞識別前,根據在“構造分類器”部分得到的詞匯表將待分類的200個新聞標題向量化[5],各自形成文本文檔。

根據之前構造分類器輸出返回的結果,可用于對新聞文檔來進行分類。對每一個待分類新聞,首先使用split函數將其內部單詞且分開,然后去除沒意義的部分(長度小于3),之后將該文檔使用于式(3),求出該文檔分別屬于各個類別的概率,最后取概率大的類別為最終分類類別。將測試結果與其真實類別進行比較,若不相等,則分類錯誤,錯誤次數加1,錯誤率為式(5):

(5)

其中,X為錯誤分類的數據個數,N為進行測試的數據個數。可以得到新聞分類的錯誤率,以此來評價分類的效果。

4 結果分析

經過對隨機抽取的200條新聞進行分類測試,平均正確率可達到95.94%,分類準確率較高,如表2所示。

表2 每一次分類準確率

5 結語

將該分類器應用于實際的新聞分類將有實際意義,使民眾能夠快速接收到關于新冠肺炎疫情的消息,更好地保護自己和保護別人。

猜你喜歡
分類疫情
戰疫情
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
疫情當前 警察不退
北極光(2020年1期)2020-07-24 09:04:04
待疫情散去 春暖花開
文苑(2020年4期)2020-05-30 12:35:48
疫情期在家帶娃日常……
37°女人(2020年5期)2020-05-11 05:58:52
分類討論求坐標
數據分析中的分類討論
主站蜘蛛池模板: 精品综合久久久久久97超人| 亚洲国产一区在线观看| 亚洲香蕉久久| 亚洲精品在线91| 国产一区二区三区在线观看视频| 日本高清免费不卡视频| 一级毛片免费观看不卡视频| 毛片在线播放网址| 午夜久久影院| 97超碰精品成人国产| 亚洲国产成人麻豆精品| 国产亚洲视频中文字幕视频 | 欧美一区精品| 国产精品成| 国产在线91在线电影| 超薄丝袜足j国产在线视频| 国产欧美日韩精品综合在线| 中国国产一级毛片| 国产亚洲成AⅤ人片在线观看| 干中文字幕| 天天做天天爱天天爽综合区| 久久99精品久久久久久不卡| 中文字幕精品一区二区三区视频| 国产一区二区在线视频观看| av手机版在线播放| 国产区精品高清在线观看| 精品久久久久成人码免费动漫| 婷婷亚洲最大| 亚洲,国产,日韩,综合一区| 又黄又湿又爽的视频| 婷婷久久综合九色综合88| 亚洲制服丝袜第一页| 欧美国产日韩一区二区三区精品影视| 国产精品香蕉在线| 毛片视频网址| 久久久久亚洲AV成人网站软件| 日韩国产 在线| AV在线麻免费观看网站| 久久伊人操| 欧美国产精品拍自| 国产成人精品一区二区三在线观看| 欧美狠狠干| 亚洲国产日韩视频观看| 九色在线观看视频| 成人国产精品一级毛片天堂| 久久久久国产一区二区| 国产夜色视频| 青青青国产精品国产精品美女| 欧美成人区| 538国产在线| 久久五月天综合| 国模沟沟一区二区三区| 美女无遮挡免费视频网站| 色欲国产一区二区日韩欧美| 久久久久亚洲精品无码网站| 青青热久麻豆精品视频在线观看| 国产精品视频免费网站| 美女被躁出白浆视频播放| 日韩高清成人| 日韩色图区| 久久久成年黄色视频| 久久久久青草线综合超碰| 欧美日韩午夜| 免费国产高清视频| 国产成人精品2021欧美日韩| 国产一区二区福利| 日韩无码黄色| 欧美福利在线| 久操线在视频在线观看| 伊人久久青草青青综合| 91色在线观看| 国产香蕉在线| 日韩精品毛片| 色综合天天视频在线观看| 最新国语自产精品视频在| 一级毛片网| 日韩国产亚洲一区二区在线观看| 熟妇丰满人妻| 色综合天天视频在线观看| 国产精品自在自线免费观看| 国产精品3p视频| 国产在线精品99一区不卡|