999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

貝葉斯公式在數據挖掘中的應用

2017-07-21 11:48:03王文相
數學學習與研究 2017年13期
關鍵詞:數據挖掘

王文相

【摘要】簡單介紹了貝葉斯公式和數據挖掘的相關概念,并舉例說明了貝葉斯公式在數據挖掘中的應用.

【關鍵詞】貝葉斯公式;數據挖掘;條件概率;先驗概率

數據挖掘是從現實生活中收集數據,對實際問題進行科學分析研究進而解決,共分為三個部分,分別是數據收集部分、模型設計部分和問題解決部分.數據收集是通過查閱文獻資料、網絡搜索等途徑尋找解決問題所需要的各種原始數據,進而通過對原始數據內容的甄別、過濾,獲取有效信息并最終運用到自己設計的模型中.模型設計需要針對實際問題進行建模,并利用已收集的數據進行問題求解.可以利用已有的數學算法、數據挖掘技術或者設計新的方法來解決問題,其中可能需要一定程度的數學推導和計算機編程.數據挖掘通常通過數學、統計、在線分析處理、情報檢索分類等諸多方法來實現上述目標.

在貝葉斯法則中,每個名詞都有約定俗成的名稱:P(A)是A的先驗概率或邊緣概率.P(A|B)是已知B發生后A的條件概率,也由于得自B的取值而被稱作A的后驗概率.P(B|A)是已知A發生后B的條件概率,也由于得自A的取值而被稱作B的后驗概率.P(B)是B的先驗概率或邊緣概率,也作標準化常量.按這些術語,貝葉斯法則可表述為:后驗概率=似然度×先驗概率標準化常量.P(B|A)P(B)稱為可能性函數,這是一個調整因子,使得預估概率更接近真實概率.所以,條件概率可以理解成這樣的式子:后驗概率=先驗概率×調整因子.

這就是貝葉斯推斷的含義.我們先預估一個“先驗概率”,然后加入實驗結果,看這個實驗到底是增強還是削弱了“先驗概率”,由此得到更接近事實的“后驗概率”.在這里,如果“可能性函數”P(B|A)P(B)>1,意味著“先驗概率”被增強,事件A的發生的可能性變大;如果“可能性函數”=1,意味著B事件無助于判斷事件A的可能性;如果“可能性函數”<1,意味著“先驗概率”被削弱,事件A的可能性變小.

貝葉斯公式看起來很簡單,但是在自然科學領域應用范圍極其廣泛.同時理論本身蘊含了深刻的思想.在大數據時代,從海量的數據中進行數據挖掘進而解決相關問題,貝葉斯公式也有著廣泛的應用.比如,要設計一款疾病自我預診斷系統,從自己身體的各種不舒適體征來判斷是否患有某種疾病,那么要從面對龐大的各種疾病數據中,尋找自己需要的數據并設計模型進行判斷.下面我們以發燒為例,用貝葉斯公式建立簡單自我肺炎自我預診斷判斷系統.

數據挖掘主要有數據準備、規律尋找和規律表示3個步驟.首先,是數據準備階段.數據準備是從相關的數據源中選取所需的數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含的規律找出來;規律表示是盡可能以大眾可理解的方式將找出的規律表示出來.數據挖掘牽涉了大量的準備工作與規劃工作,事實上許多專家都認為整套數據挖掘的過程中,有80%的時間和精力是花費在數據預處理階段,其中包括數據的凈化、數據格式轉換、變量整合,以及數據表的鏈接.可見,在進行數據挖掘技術的分析之前,還有許多準備工作要完成.

首先,要盡可能找到所有會引起發燒的疾病,這個難度比較大,不過現在計算機網絡發達,使得大數據的處理成為可能.為了方便敘述,我們不妨把從網上查找到的有關發燒的資料以模型的方式簡單化處理,設所有引起發燒的疾病有A1,A2,A3,…,An種,并且這n種病相互之間是獨立的互不影響的.通過數據挖掘得知,n種疾病的發病率分別為P(A1),P(A2),P(A3),…,P(An),發燒表示為事件S,n種疾病發病時發燒的概率分別為P(S|A1),P(S|A2),P(S|A3),…,P(S|An),根據貝葉斯公式可知發燒是由A1疾病引起的概率為

同樣可以算出發燒是由其他疾病引起的概率,最可能的當然就是概率最大的那個.僅僅有一個癥狀判斷疾病是不準確的,對于其他癥狀,比如,咳嗽事件W,我們用同樣方法可以算出P(A1|W),根據P(S∪W)=P(S)+P(W)-P(SW)等相關公式,可以算出同時發燒咳嗽時患A1疾病的概率,當多個癥狀同時計算時,顯著性一定會增大,判斷當然也會更準確.最后,還可以對判斷結果給出置信區間,做相關的假設檢驗,這里就不再一一累述.

【參考文獻】

[1]茆詩松.貝葉斯統計[M].北京:中國統計出版社,2012:18-54.

[2]祝東進,郭大偉.概率論與數理統計[M].北京:國防工業出版社,1996:132-178.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 午夜少妇精品视频小电影| 国产免费人成视频网| 国产一级毛片yw| 国产成人无码AV在线播放动漫| 日韩精品免费一线在线观看| 国产激情无码一区二区APP| 亚洲免费黄色网| 日韩精品资源| 国产精品偷伦视频免费观看国产| 丝袜无码一区二区三区| 人人91人人澡人人妻人人爽| 免费三A级毛片视频| 欧美三级不卡在线观看视频| 无码内射在线| 成人欧美在线观看| 免费观看国产小粉嫩喷水| 国产亚洲视频播放9000| 国产免费好大好硬视频| 国产欧美又粗又猛又爽老| 免费一级毛片完整版在线看| 91精品亚洲| 四虎永久免费地址在线网站| 国产成人凹凸视频在线| 一级一级一片免费| 亚洲无码在线午夜电影| 国产精品自在线天天看片| 国产成人91精品| 性色生活片在线观看| 91国内视频在线观看| 一区二区三区精品视频在线观看| 国产69囗曝护士吞精在线视频| 亚洲色婷婷一区二区| 成人夜夜嗨| 精品国产免费观看一区| 国产主播福利在线观看| 亚洲侵犯无码网址在线观看| 激情五月婷婷综合网| AV无码一区二区三区四区| 亚洲男女天堂| 欧美成人a∨视频免费观看| 六月婷婷精品视频在线观看| 天天综合色网| 久久亚洲精少妇毛片午夜无码| 久久精品欧美一区二区| 久久亚洲日本不卡一区二区| 99福利视频导航| 亚洲香蕉在线| 亚洲欧美日韩中文字幕一区二区三区 | 九九热视频在线免费观看| 日本在线视频免费| 99久久精品免费观看国产| 久久a毛片| 国产免费羞羞视频| 精品国产福利在线| 亚洲日本韩在线观看| 国产精品亚洲一区二区三区z| 亚洲天堂网站在线| Aⅴ无码专区在线观看| 欧美精品综合视频一区二区| 国产精品自在线拍国产电影 | 欧美午夜网站| 中字无码av在线电影| 免费观看精品视频999| 亚洲国产综合自在线另类| 尤物成AV人片在线观看| 欧美日韩激情| 国产精品太粉嫩高中在线观看| 97成人在线视频| 欧美在线视频a| 久久这里只有精品66| 国产99精品视频| 99热亚洲精品6码| 亚洲国产综合精品一区| 欧美一区二区福利视频| 亚洲国产清纯| 高潮毛片免费观看| 国产亚洲精品91| 天天躁夜夜躁狠狠躁躁88| 亚洲大学生视频在线播放| 成人免费网站久久久| 波多野结衣亚洲一区| 高清免费毛片|