999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于樸素貝葉斯與半樸素貝葉斯圖像識(shí)別比較

2018-12-25 02:32:28
關(guān)鍵詞:分類

劉 闖

(南京郵電大學(xué) 計(jì)算機(jī)學(xué)院、軟件學(xué)院、網(wǎng)絡(luò)空間安全學(xué)院,江蘇 南京 210023)

0 引言

圖像識(shí)別技術(shù)[1]指的是使用計(jì)算機(jī)對(duì)圖像進(jìn)行相應(yīng)處理、分析以及理解,以此來識(shí)別出不同模式的目標(biāo)和對(duì)象的一種技術(shù)。根據(jù)對(duì)圖像的觀測,對(duì)圖像中的事物分辨其所屬類別,做出清晰的判斷。通過利用現(xiàn)代信息處理以及計(jì)算技術(shù)的方式,來模擬和完成人腦對(duì)于外物的認(rèn)識(shí)以及理解的過程。一般來說,常見的圖像識(shí)別系統(tǒng)主要由三個(gè)模塊組成,分別是:圖像切割、提取圖像特征以及選擇分類器。

貝葉斯分類算法[2]是統(tǒng)計(jì)學(xué)中一種常用的分類方法,其主要是利用概率論統(tǒng)計(jì)里的知識(shí)進(jìn)行分類的算法。而基于條件獨(dú)立性假設(shè)情況下的樸素貝葉斯分類器(Naive Bayes Classifier,NBC)有著堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)以及相對(duì)穩(wěn)定的對(duì)事物的分類效率。樸素貝葉斯分類算法在某些場景下可以與決策樹算法以及神經(jīng)網(wǎng)絡(luò)分類算法相媲美,該算法也能夠運(yùn)用到大型數(shù)據(jù)庫中,并且其擁有方法簡單、分類準(zhǔn)確率相對(duì)較高、執(zhí)行速度快等優(yōu)點(diǎn)。同時(shí),NBC模型所需估計(jì)的參數(shù)相對(duì)較少,對(duì)某些缺失的數(shù)據(jù)不太敏感,從理論上來說,NBC模型與其他一些分類方法相比較而言,其具有最小的誤差率。

本質(zhì)上來說,圖像識(shí)別同樣是一個(gè)分類問題,通過使用樸素貝葉斯分類器將包含人體行為的圖像進(jìn)行識(shí)別分類,從而能夠有效地識(shí)別出所測圖像中的個(gè)體行為。而半樸素貝葉斯分類器(SEMI-NBC)[3]是在樸素貝葉斯分類器的基礎(chǔ)之上對(duì)其的一種改進(jìn),由于樸素貝葉斯分類器對(duì)于屬性條件獨(dú)立性[4]進(jìn)行了前提假設(shè),但是在現(xiàn)實(shí)生活中,這類前提假設(shè)往往是難以成立的,因此人們嘗試對(duì)這種前提假設(shè)進(jìn)行一定程度上的放松,由此產(chǎn)生了半樸素貝葉斯分類器。半樸素貝葉斯分類器的基本設(shè)想是適當(dāng)?shù)乜紤]部分屬性之間的相互依賴信息,從而既不需要計(jì)算其完全聯(lián)合概率,又不至于完全忽略相對(duì)較強(qiáng)的屬性之間的依賴關(guān)系,其中半樸素貝葉斯分類器最常用的一種思路是獨(dú)依賴估計(jì)(One-Dependent Estimator)[5]。本文討論了NBC和SEMI-NBC分類技術(shù),將NBC和SEMI-NBC應(yīng)用到圖像識(shí)別上,對(duì)兩種算法的準(zhǔn)確率判定和執(zhí)行時(shí)間進(jìn)行比較。

1 樸素貝葉斯分類器NBC

樸素貝葉斯分類器是一類以貝葉斯定理與條件獨(dú)立性假設(shè)為前提的分類方法,對(duì)于所給定的訓(xùn)練集,首先基于特征條件獨(dú)立性的假設(shè)計(jì)算出輸入/輸出的聯(lián)合概率分布,然后基于所得到的數(shù)據(jù),對(duì)于所給定的輸入數(shù)據(jù)x,再利用貝葉斯定理計(jì)算出后驗(yàn)概率為最大的輸出y。樸素貝葉斯分類器實(shí)現(xiàn)起來相對(duì)簡單,學(xué)習(xí)與預(yù)測出正確的結(jié)果的概率都很高。

設(shè)輸入空間x∈Rn是n維向量的一個(gè)集合,輸出空間是類標(biāo)記集合y={c1,c2,…,ck}。輸入是特征向量x∈x,輸出為類標(biāo)記y∈y。X是定義在輸入空間x中的隨機(jī)變量,Y是定義在輸出空間y中的隨機(jī)變量,其中P(X,Y)是X與Y的聯(lián)合概率分布。

(1)

j=1,2,…,n;l=1,2,…,Sj;k=1,2,…,K

(2)

k=1,2,…,K

(3)

然后再根據(jù)公式確定輸入x的類別:

(4)

但是當(dāng)使用極大似然估計(jì)法時(shí),可能會(huì)出現(xiàn)所需估計(jì)的概率值為0的情況,這時(shí)會(huì)影響到接下來后驗(yàn)概率的計(jì)算結(jié)果,從而使分類結(jié)果產(chǎn)生偏差,而解決這種情況的方法是采用貝葉斯估計(jì),具體操作為:先計(jì)算條件概率的貝葉斯估計(jì):

P(X(j)=ajl|Y=ck)=

(5)

其中,λ≥0,等價(jià)于在隨機(jī)變量各個(gè)取值的頻數(shù)上賦一個(gè)正數(shù)值λ≥0。當(dāng)λ=0時(shí)就被稱為極大似然估計(jì)。常取λ=1,這時(shí)這個(gè)等式稱為拉普拉斯平滑,從而,對(duì)任何l=1,2,…,Sj;k=1,2,…,K,有:

Pλ(X(j)=ajl|Y=ck)>0

(6)

(7)

表明上式所計(jì)算的條件概率貝葉斯估計(jì)確實(shí)為一種概率分布。同樣地,先驗(yàn)概率的貝葉斯估計(jì)調(diào)整為:

(8)

從而得到分類函數(shù)為:

(9)

最終將輸入x分到后驗(yàn)概率最大的類y中,后驗(yàn)概率最大與0-1損失函數(shù)的期望風(fēng)險(xiǎn)最小化是相等價(jià)的。假設(shè)選擇0-1損失函數(shù):

(10)

式中f(X)是分類決策函數(shù),此時(shí),得到的期望風(fēng)險(xiǎn)函數(shù)為:

Rexp(f)=E[L(Y,f(x))]

(11)

其中期望是對(duì)聯(lián)合分布函數(shù)P(X,Y)所取的,由此可以得出條件期望為:

(12)

為了最小化期望風(fēng)險(xiǎn),只需要對(duì)X=x的值逐個(gè)極小化,由此得到:

(13)

因此,通過期望風(fēng)險(xiǎn)最小化準(zhǔn)則轉(zhuǎn)化也就得到了后驗(yàn)概率最大化的準(zhǔn)則:

(14)

這就是樸素貝葉斯分類器所采用的基本原理[6]。

2 半樸素貝葉斯分類器SEMI-NBC

由于樸素貝葉斯分類器是基于屬性條件獨(dú)立性為前提的假設(shè),然而,在現(xiàn)實(shí)生活中,這種假設(shè)往往是很難成立的,所以,人們試著對(duì)屬性條件獨(dú)立性這一假設(shè)進(jìn)行某種程度上的放松,因此產(chǎn)生了半樸素貝葉斯分類器這一類型。

半樸素貝葉斯分類器的基本思路是,首先適當(dāng)考慮部分屬性之間的相互依賴關(guān)系,從而既不需要先計(jì)算完全的聯(lián)合概率,也不會(huì)徹底忽視了較強(qiáng)的相關(guān)屬性之間的依賴關(guān)系[7]。而獨(dú)依賴估計(jì)是在半樸素貝葉斯分類器中的一種比較常用的策略,即首先假設(shè)在類別之外,每個(gè)屬性最多僅依賴于另外一個(gè)其他屬性,即:

(15)

其中,px(j)表示為屬性x(j)所依賴的屬性,為x(j)的父屬性。接下來,對(duì)于每個(gè)屬性x(j),假如其父屬性px(j)都是已知的,即可以求出相對(duì)應(yīng)的概率值,那么,接下來的問題就是如何確定每一個(gè)屬性的父屬性,而采用不同的策略會(huì)產(chǎn)生不同的獨(dú)依賴分類器,如圖1所示。

圖1 樸素貝葉斯與兩種半樸素貝葉斯分類器屬性依賴關(guān)系

其中,最直觀的做法是首先假設(shè)所有的屬性都通通依賴于同一個(gè)屬性,這種做法稱之為超父(Super-Parent),接下來使用交叉驗(yàn)證等模型方法來確定其超父屬性,這就是所謂的SPODE(Super-parent ODE)方法。而TAN(Tree Augments Naive Bayes)則是在最大帶權(quán)生成樹(Maximum Weighted Spanning Tree)算法的基礎(chǔ)之上,通過下述步驟將不同屬性之間的相互依賴關(guān)系構(gòu)建成如圖1所示的樹形結(jié)構(gòu)。

(1)計(jì)算任意兩個(gè)屬性節(jié)點(diǎn)之間的條件互信息[8]:

I(xi,xj|y)=

(16)

(2)把屬性作為節(jié)點(diǎn)構(gòu)建完全圖,任意兩個(gè)節(jié)點(diǎn)間的權(quán)重設(shè)為I(xi,xj|y);

(3)以所構(gòu)建的完全圖構(gòu)建最大帶權(quán)生成樹,然后挑選根變量,將邊置為有向;

(4)加入分類節(jié)點(diǎn)y,增加從y節(jié)點(diǎn)到每個(gè)屬性節(jié)點(diǎn)間的有向邊。

由上述表明,條件互信息I(xi,xj|y)這一定義刻畫了在已知類別情況下的屬性xi和xj間的相關(guān)性,所以,通過最大生成樹這一算法,TAN產(chǎn)生的結(jié)果是留下了強(qiáng)相關(guān)性屬性間的相互依賴性。本文采用SPODE方法作為此半樸素貝葉斯分類器核心思想[9]。

3 圖像識(shí)別方法流程

使用NBC的圖像識(shí)別方法與使用其他機(jī)器學(xué)習(xí)方法流程基本上是一樣的,它們都是利用對(duì)訓(xùn)練數(shù)據(jù)先進(jìn)行學(xué)習(xí)得到其分類模型,再利用所得到的分類模型來對(duì)待分類的數(shù)據(jù)進(jìn)行判斷。不同的是,某些分類器所輸出的結(jié)果是一個(gè)數(shù)值,比如決策樹、SVM等。而有些分類算法輸出的結(jié)果是一個(gè)概率值,比如樸素貝葉斯(NBC)、神經(jīng)網(wǎng)絡(luò)(NN)等。不管是哪種分類器都可以將數(shù)據(jù)進(jìn)行分類。本文將利用樸素貝葉斯對(duì)圖像中的人體行為進(jìn)行四分類識(shí)別,即輸出值是{0,1,2,3}。基于NBC與SEMI-NBC的圖像識(shí)別方法如圖2所示。

圖2 基于NBC與SEMI-NBC的圖像識(shí)別

在此方法中,首先對(duì)獲取的圖像進(jìn)行預(yù)處理,包括將圖像數(shù)值化、特征選擇提取等。數(shù)據(jù)特征選擇的目的是為了降低維數(shù),有利于提高計(jì)算效率。

常見的模式識(shí)別[10]流程主要包含樣本采集、數(shù)據(jù)預(yù)處理、特征選擇與提取、特征變換與分類器。而實(shí)驗(yàn)樣本采用了KTH activity數(shù)據(jù)庫的圖像,該數(shù)據(jù)庫包含6個(gè)動(dòng)作,分別為走、慢跑、揮手、打拳、拍手、快跑,每個(gè)動(dòng)作有25個(gè)樣本。本文選取其中四組動(dòng)作,對(duì)每種動(dòng)作視頻中截取25張圖片關(guān)鍵幀,共100張圖像作為樣本訓(xùn)練集,另外再截取50張圖像作為樣本測試集。

4 圖像預(yù)處理與特征提取

首先截取每個(gè)視頻樣本中的一些關(guān)鍵幀圖像,然后對(duì)圖像做高斯模糊、灰度化、二值化、閉操作等處理后,再使用直方統(tǒng)計(jì)函數(shù)對(duì)圖像進(jìn)行特征提取。最后再使用樸素貝葉斯算法與半樸素貝葉斯算法作為分類器進(jìn)行分類比較。對(duì)圖片進(jìn)行高斯模糊處理后,會(huì)使得圖片變得模糊,目的是去除與圖像識(shí)別不相關(guān)的干擾噪聲,為接下來的Sobel算子圖像處理步驟做準(zhǔn)備。接著再對(duì)圖像進(jìn)行灰度化處理、二值化處理,以及對(duì)圖像進(jìn)行閉操作,取其最小外接矩形,最后獲取僅包含人體動(dòng)作行為的最小矩形塊圖像。

特征提取的目的是為了提取出對(duì)分類預(yù)測有幫助的信息,并且忽略不重要的信息與噪聲。而數(shù)據(jù)特征選擇能夠有效提高數(shù)據(jù)的測試效率,若直接采用圖像所有的像素點(diǎn)作為輸入特征值,則會(huì)導(dǎo)致特征屬性過大,從而不利于對(duì)信息的篩選與模型的預(yù)測。直方統(tǒng)計(jì)函數(shù)是圖像特征提取的一種重要統(tǒng)計(jì)方式,其可以近似被認(rèn)為是圖像灰度密度函數(shù)。當(dāng)圖片的對(duì)比度較小時(shí),其灰度直方圖特征只在灰度軸上較小的一小段區(qū)域上為非零值,而相對(duì)較暗的圖片因?yàn)槠湎袼鼗叶戎档偷膮^(qū)域較大,所以它的直方圖的主體特征出現(xiàn)在低值的灰度區(qū)間上,在高值灰度區(qū)間上,其幅度較小或者為零,這反映出圖片像素矩陣中行與列之間的相關(guān)性和圖像之間的特點(diǎn)。通過上述所做的預(yù)處理獲取30×20像素的人體圖像,將圖像二值化后,統(tǒng)計(jì)每一行以及每一列中元素為1的數(shù)目,構(gòu)成屬性維度為50的特征向量,即為所需要的特征數(shù)據(jù)。

5 實(shí)驗(yàn)結(jié)果和分析

本實(shí)驗(yàn)采用Spyder作為編程環(huán)境,實(shí)驗(yàn)數(shù)據(jù)來自KTH數(shù)據(jù)庫,通過隨機(jī)選取的四組動(dòng)作(走、跑、拳擊、揮手)視頻樣本,從各視頻中進(jìn)行每隔5幀圖片提取取樣。每個(gè)視頻樣本選取25張圖像,共獲取100張圖片作為訓(xùn)練數(shù)據(jù)。再另取四組動(dòng)作圖像共50張圖像作為測試數(shù)據(jù)。

本實(shí)驗(yàn)對(duì)于四種動(dòng)作進(jìn)行了預(yù)測判斷識(shí)別,實(shí)驗(yàn)中先通過對(duì)圖像作高斯模糊、灰度化、二值化、閉操作等前期處理,從而將圖像數(shù)據(jù)轉(zhuǎn)化為一組向量數(shù)據(jù),再分別利用樸素貝葉斯分類器與半樸素貝葉斯分類器對(duì)這包含四組動(dòng)作的圖片進(jìn)行預(yù)測,計(jì)算其分類識(shí)別率。實(shí)驗(yàn)結(jié)果如表1所示。通過對(duì)比發(fā)現(xiàn),采用半樸素貝葉斯分類器的準(zhǔn)確率更高,而相對(duì)地其花費(fèi)的時(shí)間也更多。究其原因,主要緣由是樸素貝葉斯分類器是以屬性條件獨(dú)立性假設(shè)作為前提條件,而這個(gè)假設(shè)在現(xiàn)實(shí)生活中很難成立,因條件過于苛刻,從而導(dǎo)致識(shí)別率較低,而半樸素貝葉斯分類器在一定程度上對(duì)這一條件進(jìn)行松動(dòng),增加屬性之間的依賴性,雖然增加了計(jì)算的復(fù)雜度,但也使得識(shí)別率有所提高。

表1 兩種分類器的性能比較

6 結(jié)束語

樸素貝葉斯分類器是以屬性條件獨(dú)立性假設(shè)作為前提條件,而這個(gè)假設(shè)在現(xiàn)實(shí)生活中其實(shí)往往難以成立,但奇妙的是,在很多情況下樸素貝葉斯分類器都能夠獲取相當(dāng)好的性能。而半樸素貝葉斯分類器是以對(duì)屬性之間的部分依賴關(guān)系作出各種假設(shè)和約束來進(jìn)行建模的。利用弱化條件獨(dú)立性這一假設(shè)來提高樸素貝葉斯分類器預(yù)測的準(zhǔn)確性。如果訓(xùn)練數(shù)據(jù)足夠充分,且選擇合適的父屬性,其算法的泛化性能則會(huì)提升,但其缺點(diǎn)同樣很明顯,在有限的樣本條件下,往往會(huì)導(dǎo)致其計(jì)算時(shí)間的開銷過大。如何挑選能夠使分類器產(chǎn)生較好的泛化性的屬性作為父屬性,是目前研究的重點(diǎn)。

雖然樸素貝葉斯分類器在很多情況下都能獲得相當(dāng)好的性能,但其應(yīng)用的場景更多的是在信息檢索領(lǐng)域以及文本分類領(lǐng)域。在圖像識(shí)別方面受限于數(shù)據(jù)的特征維度以及特征值間的復(fù)雜依賴關(guān)系,而得不到很準(zhǔn)確的識(shí)別效果。目前圖像識(shí)別主流更多采用深度學(xué)習(xí)方法,并且能獲得很好的識(shí)別率。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準(zhǔn)備好了嗎
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 国产亚洲精品97AA片在线播放| 欧美伦理一区| 美女毛片在线| 国产精品视频a| 青青草国产一区二区三区| 久久香蕉欧美精品| 久久这里只有精品免费| www亚洲精品| 国产欧美视频一区二区三区| 国产一二三区在线| 毛片久久久| 国产香蕉在线| 在线视频一区二区三区不卡| 五月天丁香婷婷综合久久| 日韩a级片视频| 五月天久久综合国产一区二区| 国产小视频a在线观看| 欧美特黄一免在线观看| 欧美日韩国产在线观看一区二区三区| 在线网站18禁| 国产人人射| 中文字幕 91| 福利小视频在线播放| 久草中文网| 久久久久久高潮白浆| 国产裸舞福利在线视频合集| 亚洲人成网站在线播放2019| 久久网综合| 亚洲国产成人精品青青草原| 国产精品毛片一区| 美女扒开下面流白浆在线试听| 成人va亚洲va欧美天堂| 国产精品亚洲欧美日韩久久| 日本免费新一区视频| 亚洲国产成人超福利久久精品| 精品少妇人妻无码久久| 欧美一区二区福利视频| 特级aaaaaaaaa毛片免费视频| 2021国产精品自产拍在线观看| 国产女人在线观看| 99视频免费观看| 99尹人香蕉国产免费天天拍| 四虎成人免费毛片| 91麻豆精品视频| 婷婷午夜影院| 亚洲日韩图片专区第1页| 性色生活片在线观看| 三上悠亚一区二区| 久久精品国产精品青草app| 欧美成人综合在线| 人人澡人人爽欧美一区| 天天摸天天操免费播放小视频| 99在线观看国产| 香蕉久久国产超碰青草| 一区二区理伦视频| 久久青草免费91观看| www.狠狠| 成年女人a毛片免费视频| 青青草原偷拍视频| 日韩专区第一页| 国产成人高清精品免费5388| 久久视精品| 亚洲swag精品自拍一区| 老汉色老汉首页a亚洲| 日本人妻丰满熟妇区| 亚洲国产欧洲精品路线久久| 久久免费成人| 国产一区二区三区夜色| AV无码无在线观看免费| 国产美女精品在线| 亚洲综合九九| 国产又爽又黄无遮挡免费观看| 欧美日韩一区二区在线免费观看| 呦女亚洲一区精品| 亚洲IV视频免费在线光看| 中文无码伦av中文字幕| 国产经典在线观看一区| 欧美在线三级| 少妇高潮惨叫久久久久久| 日本免费一区视频| 色综合天天视频在线观看| 国产一区二区三区日韩精品 |