999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于密度函數的高斯樸素貝葉斯集成算法研究

2021-06-11 09:36:07張留決
計算機時代 2021年3期

張留決

摘? 要: 本文針對數據挖掘算法中的分類問題,針對連續性數據,提出了基于密度函數的高斯樸素貝葉斯集成算法。首先假設各特征值符合正態分布,計算出各特征值的均值和方差,也就是正態分布的密度函數。然后通過定義的密度函數,計算出其概率密度函數,利用高斯樸素貝葉斯分類器得到預測結果。在對某公司實際分類問題中應用該算法,結果表明該算法的預測能力有很大程度的提升。

關鍵詞: 密度函數; 高斯樸素貝葉斯; 集成算法; 預測能力

中圖分類號:TP391? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)03-20-03

Research on Gaussian Naive Bayes ensemble algorithm based on density function

Zhang Liujue

(Fuzhou University, Fuzhou, Fujian 35000, China)

Abstract: Aiming at the classification problem in data mining algorithms, this paper proposes a Gaussian Naive Bayes ensemble algorithm based on density function for continuous data. First, assuming that each eigenvalues conforms to a normal distribution, calculate the mean and variance of each eigenvalues, which is the density function of the normal distribution. Then calculate the probability density function through the defined density function, and use the Gaussian Naive Bayes classifier to get the prediction result. The algorithm is applied to an actual classification problem of a company, and the result show that the predictive ability of the algorithm has been greatly improved.

Key words: density function; Gaussian Naive Bayes; ensemble algorithm; predictive ability

0 引言

近年來,隨著數據科學的不斷進步,樸素貝葉斯算法(Native Bayes,NB)被工業企業、互聯網行業、證券分析領域、電子信息產業等廣泛應用。樸素貝葉斯算法在數據挖掘領域得到廣泛應用,此算法屬于監督學習,主要用于解決算法中的分類問題。由于該算法在使用時先要假設變量(特征)值之間是相互獨立的,這在一定程度上影響了該算法運用的隨機性。

本文針對多個變量都是連續的問題,利用密度函數,計算出各特征的均值和方差,也就是正態分布的密度函數,然后計算出概率密度函數,融合代入高斯樸素貝葉斯分類器實現算法,實現了較好的預測效果。

1 基于密度函數的高斯樸素貝葉斯集成

1.1 貝葉斯算法的理論基礎

1.1.1 條件概率

已知事件B發生的條件下,事件A發生的概率稱為事件A關于事件B的條件概率,記為[P(A|B)]。對于任意事件A和B,若[P(B)≠0],則“在事件B發生的條件下事件A發生的條件概率”記為[P(A|B)],定義為:

[PA|B=P(AB)P(B)] ⑴

1.1.2 全概率公式

若事件組(A1,A2,…,An)滿足以下關系。

⑴ [Ai(i=1,2,…,n)]兩兩互斥,且[PAi>0]。

⑵ [i=1nAi=Ω,Ω]為樣本空間。

則稱事件組(A1,A2,…,An)是樣本空間[Ω]的一個劃分[1]。

全概率公式:設(A1,A2,…,An)是樣本空間[Ω]的一個劃分,B為任一事件,則有:

[P(B)=i=1nPAiP(B|Ai)]? ⑵

1.1.3 貝葉斯公式

設(A1,A2,…,An)是樣本空間[Ω]的一個劃分,B為任一事件,則有:

[PAi|B=P(AiB)P(B)=P(Ai)P(B|Ai)j=1nPAjP(B|Aj)] ⑶

式⑶中的[Ai]常被視為導致實驗結果B發生的“原因”,[P(Ai)=(i=1,2,…,n)]表示各種原因的可能性大小,故稱先驗概率[2];[PAi|B (i=1,2,…,n)]則反映當實驗產生了結果B之后再對各種原因概率的新認識,故稱后驗概率[3]。

1.2 樸素貝葉斯分類

定義貝葉斯分類準則如下:

如果[p(c1|x,y)>p(c2|x,y)],那么屬于類別[c1];如果[p(c1|x,y)

樸素貝葉斯分類器實現過程相對比較簡單,這里給出離散型數據集的樸素貝葉斯分類器的實現原理。對于樣本量為[m]、維度為[d]、類別數目為[c]的訓練集[D={(xi,yi)}],其中[yi∈{c1,c2,…,cc},xi=(xi1,xi2,…,xid)](i=1,2,…,m)。給定一個待測樣本x[=(x1,x2,…,xd)],判斷其類別標簽[xlabel∈{c1,c2,…,cc}]。

⑴ 計算每個類別的概率

[P(Y=cj),j=1,2,…,c] ⑷

⑵ 計算每個類別下每個特征的條件概率

[P(X=xi|Y=cj)] [⑸]

⑶ 計算

[argmaxP(Y=cj)i=1dP(X=xi|Y=cj)] ⑹

⑷ 計算值最大的類別[cj]值就是待測樣本的類別標簽。

1.3 密度函數集成

針對連續性變量,在實際應用上大體有兩種方法可以處理,一是對數據進行離散化處理,以區間的形式進行劃分;二是利用密度函數,計算出各特征值的均值和方差,也就是正態分布的密度函數。其具體算法如下:

⑴ 計算出各特征值的均值。

[X=x1+x2+…+xnn=1ni=1nxi] ⑺

⑵ 計算出各特征值的方差。

[δ2=(x1-X)2+(x2-X)2+(x3-X)2+…+(xn-X)2n] ⑻

⑶ 得到概率密度函數。

[fx=12πσ2e(-(x-μ)22σ2)] ⑼

1.4 高斯樸素貝葉斯集成密度函數算法

為了在采用樸素貝葉斯分類算法提升預測模型精度的同時,進一步提高模型泛化能力,本文融入了密度函數和高斯樸素貝葉斯的思想,提出了基于密度函數的高斯樸素貝葉斯集成算法,具體流程如圖1所示。

算法具體步驟如下。

⑴ 根據具體應用場景提取特征屬性,并針對每個特征值進行一定程度的劃分,然后由人工對一部分待分類項進行詳細分類,最后形成訓練樣本集合。

⑵ 利用密度函數與高斯樸素貝葉斯算法集成,計算每個類別在訓練樣本中的出現概率及每個特征屬性劃分對每個類別的條件概率估計,并記錄結果。這一階段由Python程序完成。

⑶ 使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系,這一階段主要也是由Python程序完成[4]。

2 實驗結果與分析

本文數據集樣本量采集于某制漿造紙企業生產現場的數據,該數據集包括:反應溫度、反應壓力、漿濃度、氧化白液用量、O2用量、NaOH用量、漿粘度、氣體壓力、水用量、電用量等共32個特征。對數據進行分類后,所得預測結果精度對比如圖2所示。

由此結果可知,通過對連續性變量數據利用密度函數模型計算,并經高斯樸素貝葉斯分類器集成后,整體的預測能力得到了提升。

3 結束語

本文通過Python語言中sklearn模塊中的高斯樸素貝葉斯(Gaussian Naive Bayes)集成密度函數實現算法。除此之外,還有多項式樸素貝葉斯(Multinomial Naive Bayes)、伯努利樸素貝葉斯(Bernoulli Naive Bayes)算法[5]。不管采用哪種算法,其運行結果都會有一定的差異,我們要根據實際情況來對算法予以改進,并使預測結果更符合生產經營的需要。

參考文獻(References):

[1] 周志華.機器學習[M].清華大學出版社,2015.

[2] 范明,范宏建.數據挖掘導論[M].人民郵電出版社,2006.

[3] 于祥雨,李旭靜等.人工智能算法與實踐論[M].清華大學出版社,2020.

[4] 鄭秋生,夏敏捷.Python項目案例開發從入門到實踐[M].清華大學出版社,2019.

[5] 蔡天新.數學與人類文明[M].浙江大學出版社,2008.

主站蜘蛛池模板: 精品福利一区二区免费视频| 精品国产一二三区| 无码日韩精品91超碰| 国产a在视频线精品视频下载| 亚洲国产成人久久77| 亚洲美女一区二区三区| 亚洲日本www| 中文字幕在线看视频一区二区三区| 国产高潮流白浆视频| 国产午夜在线观看视频| 日韩乱码免费一区二区三区| 精品亚洲国产成人AV| 91色综合综合热五月激情| 手机精品福利在线观看| 欧美一区二区三区国产精品| 国产欧美日韩另类| 国产精品亚洲片在线va| 四虎永久免费地址| 在线中文字幕网| 人妻丝袜无码视频| 亚洲欧洲日韩久久狠狠爱| 制服丝袜国产精品| 成·人免费午夜无码视频在线观看| 日韩无码黄色网站| 国产伦精品一区二区三区视频优播 | 国产特级毛片aaaaaa| av午夜福利一片免费看| 久久狠狠色噜噜狠狠狠狠97视色 | 婷婷中文在线| 国产高清国内精品福利| 国产91熟女高潮一区二区| 午夜福利免费视频| 热99re99首页精品亚洲五月天| 欧美伊人色综合久久天天| 日韩美一区二区| av在线无码浏览| 91毛片网| 毛片基地美国正在播放亚洲 | 久久九九热视频| 996免费视频国产在线播放| 欧美激情视频一区| 亚洲精品卡2卡3卡4卡5卡区| 女人18毛片一级毛片在线 | 亚洲区第一页| 在线亚洲精品自拍| 国产在线一区视频| 天堂网亚洲系列亚洲系列| 久久婷婷五月综合97色| 亚洲欧美另类专区| 久久久久免费精品国产| 在线观看视频一区二区| 午夜欧美在线| 国产在线精品网址你懂的| 自拍偷拍一区| 一区二区自拍| 无码免费的亚洲视频| 丁香五月激情图片| 亚洲日韩高清在线亚洲专区| 成人在线天堂| 国内精品91| 国内精自视频品线一二区| 国产欧美成人不卡视频| 久久国产乱子| 欧美另类第一页| 99草精品视频| 亚洲欧美人成电影在线观看| 日本免费新一区视频| 亚洲一区二区成人| 国产幂在线无码精品| 亚洲国产日韩在线成人蜜芽| 日韩无码黄色| 最新亚洲人成网站在线观看| 亚洲综合在线网| 亚洲—日韩aV在线| 国产99在线| 99视频精品在线观看| 亚洲Av激情网五月天| 992Tv视频国产精品| 久久综合色天堂av| 亚洲v日韩v欧美在线观看| 国产尤物视频网址导航| 91久久偷偷做嫩草影院精品|