999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

樸素貝葉斯分類(lèi)算法淺析

2017-10-23 06:35:27
福建質(zhì)量管理 2017年17期
關(guān)鍵詞:分類(lèi)

(山東科技大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院 山東 青島 266590)

樸素貝葉斯分類(lèi)算法淺析

秦懷強(qiáng)

(山東科技大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院山東青島266590)

貝葉斯分類(lèi)是一類(lèi)分類(lèi)算法的總稱(chēng),這類(lèi)算法均以貝葉斯定理為基礎(chǔ),故統(tǒng)稱(chēng)為貝葉斯分類(lèi)。而樸素樸素貝葉斯分類(lèi)是貝葉斯分類(lèi)中最簡(jiǎn)單和常見(jiàn)的一種分類(lèi)方法。它之所以叫樸素貝葉斯分類(lèi),關(guān)鍵在于它的假設(shè)條件:一個(gè)實(shí)例的特征屬性值在給定類(lèi)別值的條件下是相互獨(dú)立的。

樸素貝葉斯;分類(lèi);訓(xùn)練集;特征屬性值1分類(lèi)問(wèn)題綜述

一、對(duì)于分類(lèi)問(wèn)題可以做如下的定義

已知集合C={y1,y2,…,yn}和I={x1,x2,…,xm,…},確定映射規(guī)則y=f(x),使得任意的xi∈I有且僅有一個(gè)yi∈C使得yj=f(xi)成立。其中C叫做類(lèi)別集合,每一個(gè)元素是一個(gè)類(lèi)別,而I叫做項(xiàng)集合,其中每一個(gè)元素是一個(gè)待分類(lèi)項(xiàng),f叫做分類(lèi)器。分類(lèi)算法的任務(wù)就是構(gòu)造分類(lèi)器f。

這里要著重強(qiáng)調(diào),分類(lèi)問(wèn)題往往采用經(jīng)驗(yàn)性方法構(gòu)造映射規(guī)則,即一般情況下的分類(lèi)問(wèn)題缺少足夠的信息來(lái)構(gòu)造完全正確的映射規(guī)則,而是通過(guò)對(duì)經(jīng)驗(yàn)數(shù)據(jù)的學(xué)習(xí)實(shí)現(xiàn)一定概率意義上正確的分類(lèi),因此所訓(xùn)練出的分類(lèi)器并不是一定能將每個(gè)待分類(lèi)項(xiàng)準(zhǔn)確映射到其分類(lèi),分類(lèi)器的質(zhì)量與分類(lèi)器構(gòu)造方法、待分類(lèi)數(shù)據(jù)的特性以及訓(xùn)練樣本數(shù)量等諸多因素有關(guān)[1]。

二、樸素貝葉斯分類(lèi)的基礎(chǔ)-貝葉斯定理

首先,P(A|B)表示事件B已經(jīng)發(fā)生的前提下,事件A發(fā)生的概率,其基本的求解公式為(1)。

(1)

貝葉斯定理之所以有用,是因?yàn)樯钪薪?jīng)常遇到這種情況:可以很容易直接得出P(A|B),而P(B|A)則很難直接得出,而有時(shí)后者則是需要的,貝葉斯定理就打通了從P(A|B)獲得P(B|A)的道路。下面給出貝葉斯定理如公式(2)所示。

(2)

三、樸素貝葉斯分類(lèi)

(一)樸素貝葉斯分類(lèi)的原理

樸素貝葉斯分類(lèi)算法是貝葉斯分類(lèi)算法的一種,之所以是樸素的很大程度上是因?yàn)樗募僭O(shè)條件:一個(gè)實(shí)例在給定類(lèi)別值的條件下各特征屬性值間是相互獨(dú)立的[2]。樸素貝葉斯分類(lèi)算法的定義如下所示:

給定一個(gè)訓(xùn)練集D={X1,X2,…,Xt},它里面有t個(gè)訓(xùn)練實(shí)例,針對(duì)于每個(gè)訓(xùn)練實(shí)例X={a1,a2,…,an},它里面有n個(gè)屬性值,并且被類(lèi)別標(biāo)簽y∈Y所標(biāo)記。則一個(gè)測(cè)試實(shí)例X,它的類(lèi)別標(biāo)簽為y的概率為公式(3)。

(3)

又因?yàn)闃闼刎惾~斯定理的假設(shè)條件:一個(gè)訓(xùn)練實(shí)例在給定類(lèi)別值的條件下特征屬性值間是相互獨(dú)立的。可以得到公式(4)。

(4)

結(jié)合公式(3)和(4)可以得到樸素貝葉斯分類(lèi)器的公式如(5)所示。

(5)

(二)估計(jì)類(lèi)別下特征屬性劃分的條件概率和拉普拉斯平滑

由(一)節(jié)可以看出,計(jì)算各個(gè)劃分的條件概率

P(ai|y)是樸素貝葉斯分類(lèi)的關(guān)鍵性步驟,當(dāng)特征屬性為離散值時(shí),只要很方便的統(tǒng)計(jì)訓(xùn)練樣本中各個(gè)劃分在每個(gè)類(lèi)別中出現(xiàn)的頻率即可用來(lái)估計(jì)P(ai|y),下面重點(diǎn)討論特征屬性是連續(xù)值的情況。

當(dāng)特征屬性為連續(xù)值時(shí),通常假定其服從高斯分布即公式(6)。

(6)

因此只要計(jì)算出訓(xùn)練集中各個(gè)類(lèi)別中此特征項(xiàng)劃分的各均值和標(biāo)準(zhǔn)差,代入公式(6)即可得到需要的估計(jì)值。

另一個(gè)需要討論的問(wèn)題是當(dāng)P(ai|y)=0時(shí),這會(huì)令分類(lèi)器質(zhì)量大大降低。為了解決這個(gè)問(wèn)題,可以引入拉普拉斯校準(zhǔn),如公式(7)和(8)所示。

(7)

(8)

其中F(ai,y)指的是訓(xùn)練集中,有特征屬性值ai和類(lèi)別值y的訓(xùn)練實(shí)例的數(shù)目,N(Y)指的是類(lèi)別值Y的種類(lèi)數(shù)。

[1]袁梅宇.數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)WEKA應(yīng)用技術(shù)與實(shí)踐[M].北京,清華大學(xué)出版社2014:64-64

[2]Friedman N,Geiger D,Goldszmidt M.Bayesian network classifiers[J].Machine Learning,1997,29:131-163

秦懷強(qiáng)(1992-),男,漢,山東省棗莊,碩士,山東科技大學(xué),方向數(shù)據(jù)挖掘。

猜你喜歡
分類(lèi)
2021年本刊分類(lèi)總目錄
分類(lèi)算一算
垃圾分類(lèi)的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類(lèi)
我給資源分分類(lèi)
垃圾分類(lèi),你準(zhǔn)備好了嗎
分類(lèi)討論求坐標(biāo)
數(shù)據(jù)分析中的分類(lèi)討論
按需分類(lèi)
教你一招:數(shù)的分類(lèi)
主站蜘蛛池模板: 亚洲成人一区二区| www.91在线播放| 日本欧美在线观看| 亚洲区一区| 欧美成一级| 亚洲黄色网站视频| 亚洲综合狠狠| 综合人妻久久一区二区精品 | 色精品视频| 久久黄色视频影| 国产麻豆另类AV| 中文字幕不卡免费高清视频| 国产精品三区四区| 九色综合伊人久久富二代| 福利在线免费视频| 精品无码视频在线观看| 国产大片喷水在线在线视频| 日韩欧美视频第一区在线观看| 免费啪啪网址| 亚洲综合久久一本伊一区| 91精品伊人久久大香线蕉| 国产欧美日韩专区发布| 一级成人a毛片免费播放| 国产资源免费观看| 91精品国产麻豆国产自产在线| 国产精品视频导航| 激情无码视频在线看| 国产91无码福利在线| 99热国产在线精品99| 亚洲国产日韩欧美在线| 精品丝袜美腿国产一区| 成人亚洲视频| 精品国产毛片| 亚洲欧美日韩成人在线| 自拍中文字幕| 国产成人综合日韩精品无码首页| 亚洲资源在线视频| 日本三级欧美三级| 波多野结衣一二三| 毛片免费网址| 天堂岛国av无码免费无禁网站| 国产成人在线小视频| 香蕉色综合| 国产精品免费电影| 亚洲二三区| 国产区福利小视频在线观看尤物| 激情视频综合网| 人妻丰满熟妇av五码区| 日韩av在线直播| 国产91视频免费观看| 免费国产高清精品一区在线| 男女性色大片免费网站| 国产三区二区| 国产www网站| 99激情网| 亚洲天堂色色人体| 成人在线观看一区| 国产精品内射视频| 免费在线看黄网址| 伊人久久精品亚洲午夜| 五月丁香伊人啪啪手机免费观看| 国产精品无码AⅤ在线观看播放| 中文字幕精品一区二区三区视频| 97人妻精品专区久久久久| 91福利免费| 一本大道东京热无码av| 久久精品人人做人人爽电影蜜月| 无码免费的亚洲视频| 国产精品久久久久久久久久久久| 在线观看热码亚洲av每日更新| 日韩a在线观看免费观看| 天天综合网色中文字幕| 伊伊人成亚洲综合人网7777| 亚洲永久视频| 日韩精品欧美国产在线| 亚洲区一区| 在线精品亚洲国产| 亚洲AV无码久久天堂| 日韩123欧美字幕| 欧美色图久久| 国产浮力第一页永久地址| 老熟妇喷水一区二区三区|