999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于樸素貝葉斯分類方法對公民身體健康狀況的研究

2019-05-12 09:00:20張旭光
市場周刊 2019年3期
關鍵詞:數據挖掘分類

摘要:肥胖問題一直是人類難以擺脫的健康問題。為了更深入了解肥胖問題,本文從KDD Dataset下載有關公民身體各項指標的有關調查數據,選擇的主要指標有性別(Gender)、種族(Race_Ethnicity)、婚姻狀況(Marital_Status)、身體質量指數(BMI)、腰圍(Waist)共5項指標來反映公民健康情況。本文使用數據挖掘分類規則中的樸素貝葉斯分類進行分析,對樣本所屬分類進行預測。

關鍵詞:數據挖掘;樸素貝葉斯;分類

中圖分類號:G254.11文獻標識碼:A文章編號:1008-4428(2019)03-0126-02

一、 引言

數據挖掘(Data Mining),是數據庫中知識發現(KDD, Knowledge Discovery in Databases)的步驟之一,是從大型數據庫或數據倉庫中提取人們感興趣的知識的過程,這些知識是隱含的、實現未知的、潛在有用的信息。數據挖掘作為一門交叉學科,涉及機器學習、模式識別、歸納推理、統計學、智能數據庫、數據可視化高性能計算等多個領域。

數據挖掘的主要任務是從大量數據中提取出可信的、新穎的、有效的并能被人們理解的模式,挖掘數據背后蘊含的許多重要的信息以便充分利用這些數據。數據挖掘的兩個高層次目標是預測和描述。前者是根據一些變量或數據庫的若干已知字段預測其他感興趣的變量或字段的未知的未來的值;后者是找到描述數據的可理解模式。根據發現知識的不同,可以將數據挖掘人為歸納為特征規則、序列模式、分類、關聯規則、聚類、預測、變化和偏差分析。

在數據挖掘的各種方法中,分類是一種主要的分析手段,旨在生成一個分類函數或分類模型,由該模型把數據庫中的數據映射到某一給定類別中,從而實現對數據的分類。目前研究的分類模型主要有決策樹、貝葉斯分類、神經網絡、粗糙集、統計方法、遺傳算法等。

近年來,隨著人民生活水平的普遍提高,人民的身體健康問題越來越被得到重視。在國家發布“健康中國”的號令后,健身、慢走等運動成了百姓們更熱衷的休閑方式。為了探究什么因素對人類肥胖有影響,本文從KDD Dataset下載有關公民身體各項指標的有關調查數據,使用分類方法中的樸素貝葉斯分類進行分析,對樣本所屬分類進行預測,這能對人們有效地關注人類健康問題提供建議。

二、 貝葉斯理論背景

(一)條件概率和乘法定理

已知事件A發生的條件下,事件B發生的概率,叫作事件B在事件A發生下的條件概率,記為P(B|A),其中P(A)叫作先驗概率,P(B|A)叫作后驗概率,

計算條件概率的公式為:P(B|A)=P(B∩A)P(A)

條件概率公式通過變形得到乘法公式:P(B∩A)=P(B|A)×P(A)

(二)事件的獨立性

設A,B為兩個隨機事件,如果有P(AB)=P(A)×P(B)成立,則稱事件A和B相互獨立,此時有P(A|B)=P(A),P(AB)=P(A)P(B)成立。

設A1,A2,…,An為n個隨機事件,如果對其中任意m個(2≤m≤n)個事件Ak1,Ak2,…,Akm,都有P(Ak1,Ak2,…,Akm)=P(Ak1)P(Ak2)…,P(Akm)成立,則稱事件Ak1,Ak2,…,Akm相互獨立。

(三)貝葉斯公式

設B1,B2,…,Bn為互不相容事件,P(Bi)>0,i=1,2,…,n,P(A)>0,則在事件A發生的條件下,事件Bi發生的概率為,P(Bi|A)=P(BiA)P(A)=P(Bi)×P(A|Bi)∑ni=1P(Bi)×P(A|Bi)則該公式稱為貝葉斯公式。

(四)極大后驗假設和極大似然假設

首先介紹先驗概率。先驗概率(prior probability)表示的是還沒有訓練數據前,某一假設所擁有的初始概率,它反映了這一假設是正確假設的背景知識多少。令P(C)是假設C的先驗概率,X為訓練樣本,P(X)為將要觀察的訓練樣本X的先驗概率。P(X|C)表示在假設C正確的條件下樣本X出現的概率,根據貝葉斯公式可以得到后驗概率的計算公式:P(C|X)=P(X|C)P(C)P(X),它反映了訓練樣本X出現后假設C成立的置信度。

設C為待選的假設集合,在給定訓練樣本X時,通過計算找到可能性最大的假設(或存在多個這樣的假設時選擇其中之一)c∈C,具有最大可能性的假設被稱為極大后驗假設(maximum a posteriori),記cmap=argmaxc∈CP(c|X)=argmaxc∈CP(X|c)P(c)P(X)。由于P(C)與假設C無關,上式可變為:cmap=argmaxc∈CP(X|c)P(c)。確定極大后驗假設的方法是用貝葉斯公式計算每個候選假設的后驗概率。

如果沒有給定類別概率的情形下,假設C中每個假設都有相等的先驗概率(即對C中任意的ci,cj∈C(i≠j),有 P(ci)=P(cj)),進一步簡化后,計算使P(X|c)達到最大的假設,這時P(X|c)被稱為極大似然假設(maximum likelihood),記為cml=argmaxc∈CP(X|c)。

三、 樸素貝葉斯分類模型

樸素貝葉斯分類器(Naive Bayes Classifier, NBC)是貝葉斯分類模型中一種最簡單、有效而且易于實現的分類器,多用于文本分類,比如垃圾郵件過濾。其基本思想是:對于待分類的樣本,求解在此項出現的條件下各個類別出現的概率,將此待分類項歸類為概率最大的類別。求解樸素貝葉斯分類的工作過程如下:

1. 設待分類樣本為X={x1,x2,…,xn}。

2. 設類別集合為C={c1,c2,…,cm},預測X屬于某一類的過程即為求解P(ci|X)最大值的過程。

3. 根據貝葉斯定理,要使得P(ci|X)最大化,需要P(X|ci)P(ci)最大化。其中ci類的先驗概率P(ci)用頻率Si/S去估計,Si是給定類別Ci中訓練樣本的個數,S是訓練樣本的總數。

4. 對待分類樣本進行劃分,如果有:P(ci|X)=max{P(c1|X),P(c2|X),…,P(cm|X)},則X∈Ci。

四、 樸素貝葉斯分類模型

(一)實驗平臺

本實驗是在WEKA 3.6平臺上完成的。WEKA(Waikato Environment for Knowledge Analysis)是一種具有全面功能的機器學習和數據挖掘應用程序平臺。該軟件集成了許多能完成數據挖掘任務的機器學習算法,其中包括對數據進行預處理、聚類、分類、關聯規則挖掘等,它還能夠提供豐富的可視化功能。

(二)數據來源及預處理

本文數據來源于KDD Dataset中的分類數據,通過刪除一些不相關因素和缺失數據,再進行規約后,得到10149個公民的身體狀況表。

(三)分析過程與結果

本次實驗分為兩次進行,第一次實驗隨機選擇70%的數據作為訓練集,剩余30%作為測試集。WEKA的分類結果展示如表1:

五、 總結

本文從KDD Dataset下載有關公民身體各項指標的有關調查數據,選擇的主要指標有性別(Gender)、種族(Race_Ethnicity)、婚姻狀況(Marital_Status)、身體質量指數(BMI)、腰圍(Waist)共5項指標來反映公民健康情況。本文使用分類規則中的樸素貝葉斯分類進行分析,對樣本所屬分類進行預測。預測結果顯示,基于樸素貝葉斯算法分類對結果的預測準確率很高,一個人是否肥胖,確實和性別、種族、婚姻狀況、身體質量指數相關,但文中并沒有指出他們之間的具體關系,這是本文的不足之處。

參考文獻:

[1]王峻.樸素貝葉斯分類模型的研究與應用[D].合肥:合肥工業大學,2006.

[2]韓家煒,Kamber.M.數據挖掘:概念與技術[M].北京:機械工業出版社,2001.

[3]蔣良孝.樸素貝葉斯分類器及其改進算法研究[D].武漢:中國地質大學,2009.

[4]段晶.樸素貝葉斯分類及其應用研究[D].大連:大連海事大學,2011.

作者簡介:

張旭光,男,河南商丘人,新疆財經大學統計與信息學院碩士研究生,研究方向:大數據應用。

猜你喜歡
數據挖掘分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
給塑料分分類吧
主站蜘蛛池模板: 天天综合网色中文字幕| 四虎综合网| 在线精品亚洲国产| 久久久波多野结衣av一区二区| 一本无码在线观看| 日本手机在线视频| 91成人在线免费视频| 欧美亚洲国产日韩电影在线| 亚洲 欧美 中文 AⅤ在线视频| 在线观看精品自拍视频| 久久久久无码精品| 日本欧美中文字幕精品亚洲| 伊人五月丁香综合AⅤ| 国产激爽大片在线播放| 国产日本欧美在线观看| 国产精品视频猛进猛出| av免费在线观看美女叉开腿| www.91中文字幕| 伊在人亚洲香蕉精品播放| 综合色在线| 免费又黄又爽又猛大片午夜| 国产女人喷水视频| 亚洲青涩在线| 久久www视频| 不卡无码网| 精品无码国产一区二区三区AV| 成年看免费观看视频拍拍| 香蕉eeww99国产在线观看| 国产不卡一级毛片视频| 亚洲伊人天堂| 欧美自慰一级看片免费| 91久久国产成人免费观看| 人妻无码一区二区视频| 在线免费观看AV| 日韩小视频网站hq| 亚洲最大在线观看| 91福利片| 成人字幕网视频在线观看| 国产视频自拍一区| 亚洲v日韩v欧美在线观看| 欧美日韩在线国产| 精品视频福利| 免费看美女毛片| 国产在线精彩视频二区| 波多野结衣一级毛片| 国产爽妇精品| 久久伊人久久亚洲综合| 亚洲精选高清无码| 亚洲精品动漫| 91年精品国产福利线观看久久| 免费看a级毛片| 污视频日本| 久久狠狠色噜噜狠狠狠狠97视色 | 99手机在线视频| 中文字幕亚洲电影| 女人av社区男人的天堂| 国产精品尤物在线| 91网站国产| 久久精品最新免费国产成人| 在线观看亚洲精品福利片| 国产v精品成人免费视频71pao | 免费国产高清精品一区在线| 成人亚洲国产| 青青青国产视频手机| 美美女高清毛片视频免费观看| 激情成人综合网| 青青操国产视频| 97视频免费在线观看| 精品一区二区无码av| 青草视频网站在线观看| 9久久伊人精品综合| 日韩一区二区在线电影| 中文字幕欧美成人免费| 中文字幕在线免费看| 无码网站免费观看| 国产精品久久国产精麻豆99网站| 欧美亚洲欧美区| 青草91视频免费观看| 亚洲精品第一页不卡| 日韩av高清无码一区二区三区| 在线观看91精品国产剧情免费| 青草国产在线视频|