999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向新聞的文本分類研究

2019-08-12 01:27:59嚴石
電腦知識與技術 2019年16期

嚴石

摘要:隨著網絡的普及以及互聯網的飛速發展,在網上獲取信息已經成了一種重要的方式,互聯網充斥著大量的新聞數據,如何有效的獲取利用這些數據已經成為當務之急。本文介紹了文本分類的原理,以及解決文本分類問題的流程,通過真實新聞數據集對相關算法進行測試,并給出了實驗結果。

關鍵詞:新聞數據;文本分類;算法; 測試

中圖分類號:TP311? ?文獻標識碼:A

文章編號:1009-3044(2019)16-0283-02

開放科學(資源服務)標識碼(OSID):

Abstract: With the popularity and the rapid development of the Internet, it has become an important way to obtain information on the Internet. The Internet is full of a large number of news data. How to effectively obtain and use these data has become an urgent matter. This paper introduces the principle of text categorization and the flow of solving the problem of text categorization. The related algorithms are tested by real news datasets, and the experimental results are given.

Key words: news data; text classification; algorithms; test

文本分類,就是利用計算機相關技術將具有相同特征的文本信息根據一定的規則劃分到事先預定好的類別之中。樸素貝葉斯方法是一種基于貝葉斯定理和特定條件獨立性假設的分類方法。相關研究的實驗表明,這種方法應用到文本分類的任務上效果較好[1]。

1 文本分類的流程

文本是一種非結構化的數據,在進行分類之前,先要進行分詞、去停用詞,并通過一定的方式將文本用向量表示出來,將處理過后的數據輸入到分類模型中才能到的結論[2]。為了測評分類器的效果,我們采用通用的準確率P(Precision)、召回率R(Recall)、以及F值(F-score)作為實驗的評價指標[3]。

2 樸素貝葉斯算法

1) 設D是訓練元組和它們相關聯的類標號的集合,每一個元組用一個n維屬性向量[X={x1,x2,…,xn}]表示,描述由n個屬性[A1,A2,…,An]對元組的n個測量。

2) 假設有m個類[C1,C2,…,Cm]。給定元組X,樸素貝葉斯分類法預測X屬于[Ci]類,當且僅當

3 實驗結果及分析

我們準備了科技、汽車、娛樂、軍事、體育五類新聞數據,并選取五組不同數目的樣本,把樣本的75%用作訓練集,剩下的25%用作測試集。下圖為測試后平均精度最高的一組數據:

我們發現不同類別的新聞在同一次測試中,其準確率、召回率、F值也有細微的差別,而分類的精度隨著測試樣本數目的增大會有一定的提高,同時,在樣本數目不變的情況下,分類的精度會隨著特征值的數目增大而提高。

4 結語

本文分析了新聞文本分類的流程,并用樸素貝葉斯算法構造分類器,通過大量的分組實驗,獲取了在不同樣本數目、不同特征值數目下的精度,在下一步實驗中,我們將測試該方法應用于其他的類型分類下的精度問題。

參考文獻:

[1] 靳小波.文本分類綜述[J].自動化博覽, 2006 (S1) :24, 26, 28, 29.

[2] 劉測,韓家新.面向新聞文本的分類方法的比較研究[J].智能計算機與應用,2018,8(5):38-41.

[3] 楊娟,王未央.幾種文本分類算法性能比較與分析[J].現代計算機(專業版),2016(25):12-16.

[4] 劉冬瑤,劉世杰,陳宇星,張文波,周振.新聞文本自動分類技術概述[J].電腦知識與技術,2017,13(35):87-91.

【通聯編輯:梁書】

主站蜘蛛池模板: a级免费视频| 亚洲综合中文字幕国产精品欧美| 色综合成人| 亚洲三级色| 国产一在线| 综合色婷婷| 国产精品无码制服丝袜| av在线人妻熟妇| 这里只有精品国产| 亚洲精品午夜无码电影网| 亚洲永久色| 自慰高潮喷白浆在线观看| 色爽网免费视频| 2048国产精品原创综合在线| 99er这里只有精品| 欧美另类视频一区二区三区| 中文字幕2区| 四虎成人精品在永久免费| 国产永久在线视频| 男女猛烈无遮挡午夜视频| 亚洲国产理论片在线播放| 欧美人人干| 亚洲成a人片在线观看88| 激情六月丁香婷婷四房播| 一本视频精品中文字幕| 伊人中文网| 99久久免费精品特色大片| 婷婷色一二三区波多野衣| 福利在线不卡| 亚洲第一网站男人都懂| 欧美国产在线精品17p| 国产人碰人摸人爱免费视频| 国产亚洲精品无码专| 国产成人久久综合777777麻豆| 东京热高清无码精品| 久久综合一个色综合网| 97国产在线观看| 亚洲欧美自拍视频| 熟妇无码人妻| 欧美在线天堂| 国产一级做美女做受视频| 亚洲av无码久久无遮挡| 欧美伊人色综合久久天天| 色综合手机在线| 日本午夜影院| 日韩无码视频播放| 久久精品丝袜| 亚洲高清无码精品| 久久精品嫩草研究院| 国产精品区网红主播在线观看| аⅴ资源中文在线天堂| 国产av一码二码三码无码| 五月六月伊人狠狠丁香网| 理论片一区| 久久黄色影院| 欧美日本视频在线观看| 色老二精品视频在线观看| 欧美日韩精品一区二区在线线| 国产凹凸视频在线观看| 久久久久人妻精品一区三寸蜜桃| 成人福利在线观看| 色网在线视频| 亚洲天堂网2014| 国产一级二级在线观看| 国产精品区视频中文字幕| 性色生活片在线观看| AV无码国产在线看岛国岛| 国产夜色视频| 香蕉久久国产超碰青草| 国产91导航| 色哟哟精品无码网站在线播放视频| 极品av一区二区| 激情在线网| 国产成年女人特黄特色大片免费| 亚洲性视频网站| 久草中文网| 国产自在线拍| 无码电影在线观看| 综合色亚洲| 毛片在线看网站| 亚洲无限乱码一二三四区| 国产美女精品在线|