999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

NAiVEBAYES和ADABOOST提升算法應用于葡萄酒的品質(zhì)測定

2017-05-20 08:52:10周泉錫
中國科技縱橫 2017年8期
關(guān)鍵詞:分類

周泉錫

摘 要:葡萄酒品質(zhì)測定是數(shù)據(jù)挖掘、信息處理的一個重要應用,本文將結(jié)合樸素貝葉斯算法和Adaboost算法,通過二分類手段解決多分類問題,并參考相關(guān)文獻對該問題進行詳細的探究和解決,并呈現(xiàn)該算法得到的結(jié)果。

關(guān)鍵詞:NA VE bayes;Adaboost提升算法;應用二分類分類器處理多分類問題

中圖分類號:TP391 文獻標識碼:A 文章編號:1671-2064(2017)08-0037-01

1 背景,應用二分類的分類器處理多分類問題

關(guān)于二分類處理多分類問題,目前主要有兩種手段:一種為“一對多”方法,即把一個問題分為“是”或者“不是”,通過對n個元素進行n-1次處理,將其進行分類;另一種為“多對一”方法,即n個元素,對每一個元素之間比較,逐對分類,進行Cn2次,達到實驗目的。目前還有一些其他的方法正在進行研究和學習,希望得到優(yōu)化算法。

2 推導分析

2.1 算法思想

二分類的算法是解決分類的一個重要手段,在解決多分類問題時,正如上文所述分為兩種主要的方法(“一對多”方法,“多對一”方法),本課題研究著重于前者,“一對多”的問題解決方法。簡單來說,算法本身要處理多組數(shù)據(jù),我們將數(shù)據(jù)依次分為不同的兩類,“是”或者“否”,選擇后將“是”的樣本數(shù)據(jù)留下,將“否”的數(shù)據(jù)繼續(xù)重復上述的循環(huán)操作,進而遞推篩選,得到需要的結(jié)果。

2.2 算法內(nèi)容

這是一個運用NAIVE BAYES算法對問題的解決。NAIVE算法主要體現(xiàn)在概率的精確求法,用該數(shù)據(jù)的最大概率來對數(shù)據(jù)進行分類從而達到減小誤差的功能。因此這里運用NaiveByes算法來計算品質(zhì)概率,具體的算法應用貝葉斯定理而推導得出。定理的具體內(nèi)容即有一系列待分類數(shù)據(jù)xi(i=1、2……m)和一系列分類項yj(j=1、2……n)用上述公式求得概率P(yj|xi)。我們把xi組成的集合叫做訓練樣本集。依次計算統(tǒng)計各個特征屬性即xi的條件概率估計。P(y1|xi),P(y2|xi),……,P(yn|xi),如果各個xi是獨立的,那么由貝葉斯定理可得:

因為分母P(x)對于所有類別均為常數(shù),所以我們只要將分子最大化皆可。又因為xi是條件獨立的,因而可以得到以下公式:

根據(jù)上述分析,我們可以導出貝葉斯分類的流程:

如果有P(yk|xi)=max{P(y1|xi),P(y2|xi),……,P(yn|xi)}則有xi∈yk。進而將數(shù)據(jù)分類,類此將葡萄酒的品質(zhì)進行處理。

同時該算法應用Adaboost提升算法,對所處理的數(shù)據(jù)進行精確分類。該算法的內(nèi)容主要在于將n個數(shù)據(jù)賦予相同的權(quán)值1/n,然后將數(shù)據(jù)樣本通過弱分類器處理,如果該樣本已經(jīng)被準確的分類則權(quán)數(shù)增加,否則權(quán)數(shù)降低。每次添加新的弱分類器通過下一輪迭代,逐步確立分類函數(shù)。其應用的方式為通過對閾值的加權(quán)求平均比重,進而對數(shù)據(jù)的分類進行優(yōu)化。具體的操作如下:首先確立一個樣本的集合X:(am,n|m,n=1,2,3……)∈X(其中m代表迭代的輪數(shù),n代表個體的標號數(shù))和一個分類集合Y,(y1,y2……yk)∈Y。其次我們確立一個選擇函數(shù)F(x),來使F(x)→{-1,1}從而作為基本的分類器。令F(x)的誤差率為a,a為誤分類的樣本權(quán)數(shù)的和,然后我們計算F(x)的重要程度用w表示w=(1/2)×log[(1-a)/a] 有上述表達式可以發(fā)現(xiàn)伴隨誤差的減小,w增大,即F(x)的權(quán)增大。我們從而進行下面的循環(huán)操作,逐步對分類的方法進行優(yōu)化選擇,從而達到降低誤差的目的。此時我們移入一個量Zm作為規(guī)范化因子,Zm=∑am,nexp[-wykF(xk)],從而使得整體的概率和保持為1,從而運用Zm規(guī)范化因子可以使數(shù)據(jù)形成概率分布。最后我們設(shè)計組合各個弱處理器,設(shè)其為g(x),g(x)=∑wF(x)。我們從而得到最終的處理器d(x)=sign(g(x))=sign(∑wF(x)),進而通過此sign函數(shù)對數(shù)據(jù)進行準確的二分類,評定算法的優(yōu)缺的重要依據(jù)為誤差的大小,該算法成功的利用合理規(guī)范閾值,合理選擇等手段有效的降低了分類的誤差。

3 算法構(gòu)架和流程

3.1 算法構(gòu)架

Initialization→ Data Imput→ Valuable Intializati→ Function Naive bayes→ Training Data→ Testing Data→ Dada Output

3.2 實驗步驟

具體的操作和流程如下:Data采winequalityred,在Function Nave Bayes中,Input為Training_Data,Testing_Data and Training_Data density matrix D.在各類的先驗概率密度估算中采用每一類的先驗概率密度估計采用的是極大似然估計法,總體密度以及類條件密度估計采用的是窗寬為1的parzen窗估計法;以f=@(u,h)exp(u*u/((-2)*h^2))作為Windows Function,其中u是輸向量,h是窗寬,我們把次問題的默認值定為1;output由Naive Bayes對Testing_Data的預測變量的輸出來決定,也就是通過此進行分類,成為n*1的個向量,Y_hat(i)屬于{+1,-1}。在主體程序中,以前1500個數(shù)據(jù)作為Training _Data,后99個數(shù)據(jù)作為Testing_Data。面對多分類問題,本程序采用一對多思想,提取Training_Data中的類標號+1,其他類標號-1,從而進Naive_Bayes決策。決策的過程是運用和通過Adaboost提升算法,我們利用最多5個弱分類器的加權(quán)投票進而產(chǎn)生結(jié)果。等待程序結(jié)束后,標號-1的樣本集合將作為新的Training_Data,繼續(xù)實現(xiàn)上述的步驟,直至最后只剩下兩類為止。由此將一個多分類問題逐步轉(zhuǎn)化為二分類問題。

程序運行的結(jié)果如下:Error_Rate=0.0202

4 總結(jié)評定

評定一個算法的優(yōu)劣重要的參數(shù)是算法的錯誤率,該算法的錯誤率較小,在0.0202。因而從結(jié)果而言這是一個相對準確而且可以規(guī)模化應用的算法。其各項指標的處理也是十分科學。但該算法也有一些局限性,比如分類依然存在少量的誤差,原因主要集中在樸素貝葉斯分類的思想具有一定的概率性和偶然性,ADABOOST提升算法對于不同數(shù)據(jù)的誤差值不同。如果我們能運用更為科學的概率求法以及更為準確的加權(quán)分類算法的準確率還會提升。

參考文獻

[1]基于樸素貝葉斯的文本分類算法.

[2]《統(tǒng)計學習方法》.

[3]算法雜貨鋪——分類算法之樸素貝葉斯分類(Naive Bayesian classification).

[4]樸素貝葉斯分類器及其改進算法研究.

[5]關(guān)于樸素貝葉斯分類算法的改進.

[6]An Evaluation of Statistical Approaches to Text Categorization.

[7]一種改進的AdaBoost算法——AD AdaBoost.

[8]Revised AdaBoost algorithm - AD AdaBoost.

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 久久人搡人人玩人妻精品一| 人妻丰满熟妇av五码区| 一区二区三区国产精品视频| 精品福利网| 人妻无码一区二区视频| 少妇精品久久久一区二区三区| 国产男人天堂| 久久永久视频| 先锋资源久久| 在线日本国产成人免费的| 亚洲成人黄色在线观看| 久久久久久久97| 2021最新国产精品网站| 国产激情第一页| 欧美成a人片在线观看| 亚洲伊人电影| 精品伊人久久久久7777人| 日韩精品无码免费专网站| 狠狠色噜噜狠狠狠狠奇米777| 亚洲va视频| 久久鸭综合久久国产| 久久黄色影院| 露脸真实国语乱在线观看| 久久国产高潮流白浆免费观看| 波多野吉衣一区二区三区av| 国产新AV天堂| 五月六月伊人狠狠丁香网| 国产精品黑色丝袜的老师| 2022精品国偷自产免费观看| yy6080理论大片一级久久| 999国内精品视频免费| 婷婷激情亚洲| 欧美成人A视频| 日本黄色a视频| 女人18毛片久久| 一区二区偷拍美女撒尿视频| 久久精品人妻中文系列| 在线观看精品自拍视频| 国产高清免费午夜在线视频| 亚洲国产精品日韩av专区| 伊人久久婷婷五月综合97色| 欧美激情综合| 香蕉精品在线| 91久久偷偷做嫩草影院免费看 | 中国国产A一级毛片| 午夜福利无码一区二区| 亚洲一级色| 国产视频入口| 99er精品视频| 国产精品流白浆在线观看| 青青久视频| 四虎综合网| av大片在线无码免费| 久久96热在精品国产高清| 91免费国产在线观看尤物| 一级成人a做片免费| 嫩草影院在线观看精品视频| 在线观看精品自拍视频| 亚洲国产精品日韩专区AV| 成人a免费α片在线视频网站| 一区二区偷拍美女撒尿视频| 日韩成人在线视频| 国产毛片网站| 伊在人亚洲香蕉精品播放| 久久久久国产一区二区| 色偷偷一区二区三区| 四虎在线高清无码| 成人伊人色一区二区三区| 99青青青精品视频在线| 日韩 欧美 小说 综合网 另类| 美女一级毛片无遮挡内谢| 在线播放国产99re| 9999在线视频| 人人91人人澡人人妻人人爽 | 成人国产一区二区三区| 欧美成人精品欧美一级乱黄| 亚洲成人网在线播放| 国产日韩欧美在线视频免费观看| 91九色视频网| 亚洲三级成人| 国产一级毛片高清完整视频版| 成人免费网站久久久|