趙 越,茹婷婷
(吉林建筑工程學院 a.計算機科學與工程學院;b.基礎(chǔ)科學部,長春 130118)
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習方法新探
趙 越a,茹婷婷b
(吉林建筑工程學院 a.計算機科學與工程學院;b.基礎(chǔ)科學部,長春 130118)
從大型數(shù)據(jù)庫中學習網(wǎng)絡(luò)結(jié)構(gòu)一直是貝葉斯網(wǎng)絡(luò)學習的研究熱點.針對此問題提出了一種基于預測能力的學習算法,通過預測能力建立并調(diào)整貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),把變量之間弧的存在性與方向有機地結(jié)合在一起。
貝葉斯網(wǎng)絡(luò);結(jié)構(gòu)學習;預測能力
0引言
貝葉斯網(wǎng)絡(luò)是近幾年發(fā)展起來的處理不確定信息和進行概率推理最有力的工具,是一種對概率關(guān)系的有向圖解描述。它結(jié)合了數(shù)據(jù)信息和真實世界的信息(先驗信息),具有描述事件多態(tài)性和信號邏輯關(guān)系非確定性的能力。貝葉斯網(wǎng)絡(luò)使用概率理論來描述不同信號之間的條件相關(guān)性,運用貝葉斯定理計算出后驗概率,并可應用于有條件地依賴多種控制因素的決策,它已成為人工智能領(lǐng)域處理不確定性問題的主要方法。
貝葉斯網(wǎng)絡(luò)學習主要包括參數(shù)學習和結(jié)構(gòu)學習兩部分內(nèi)容。結(jié)構(gòu)學習比參數(shù)學習要難得多,實際中由專家給出貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)是費時、費力的,在很多情況下甚至是不可能的,因此貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習方法是一項有益的研究。
貝葉斯網(wǎng)絡(luò)數(shù)學描述為:給定一個有向無環(huán)圖G和一個在離散變量集合V={v1,v2,…,vn}上的聯(lián)合概率分布P,如果在V中的變量和G節(jié)點之間存在一一對應關(guān)系,并滿足P(v1,v2,…,vn)=∏ip(vi|pai)。其中,Pai是G中Vi的直接祖先節(jié)點,將圖G和概率P的聯(lián)合稱為貝葉斯網(wǎng)絡(luò),要求P(v1,v2,…,vi|ζ)= ∏ip(vi|v1,v2,…vi-1,ζ),且各變量需滿足馬爾科夫獨立性條件 P(vi|v1,v2,…,vi-1,ζ)=p(vi|pa(vi),ζ)[1-2]。
在數(shù)據(jù)完備情況下,結(jié)構(gòu)學習算法可以分為基于統(tǒng)計測試的方法和基于搜索記分的方法。統(tǒng)計測試尤其是指條件獨立性測試;搜索記分的方法是選定一個適當?shù)挠浄趾瘮?shù),通過不斷地改變網(wǎng)絡(luò)結(jié)構(gòu)計算出相應的記分值,結(jié)合一些優(yōu)化算法在結(jié)構(gòu)空間進行啟發(fā)搜索,直至搜索到的結(jié)構(gòu)具有最高記分為止[3]。由于貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)是一個組合空間,找到一個最高記分的網(wǎng)絡(luò)結(jié)構(gòu)已證實為NP難問題,因此需要進行啟發(fā)式搜索。




本文在對貝葉斯網(wǎng)絡(luò)的原理和學習方法等進行介紹的基礎(chǔ)上,著重對貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學習機制進行了研究。對基于預測能力的離散貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習方法進行探討。由于預測能力就是預測正確率,預測能力相同是條件獨立性的充分必要,這樣通過預測能力的引入把變量之間弧的存在性與方向有機地結(jié)合在一起,得到了良好的效果。
[1]許麗佳,黃建國,王厚軍,龍兵.混合優(yōu)化的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習[J].計算機輔助設(shè)計與圖形學學報,2009(5):634-636.
[2]胡學鋼,胡春玲.一種基于依賴分析的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習算法[J].模式識別與人工智能,2006(4):446-448.
[3]張什永,彭云,王曉蒲.一種改進的貝葉斯網(wǎng)絡(luò)知識合成算法[J].中國科學技術(shù)大學學報,2011(1):88-92.
[4]楊善林,胡笑旋,毛雪岷.融合知識和數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)構(gòu)造方法[J].模式識別與人工智能,2006(1):32-33.
責任編輯:吳旭云
Research on structure learning of Bayesian network
ZHAO Yuea,RU Ting-tingb
(a.School of Computer Science and Technology;b.Department of Basic Science,Jilin Institute of Architecture and Civil Engineering,Changchun 130118,China)
Learning structure from large database has been a research focus of learning Bayesian Network.A learning algorithm is presented based on prediction ability,and through which Bayesian network structure is built and adjusted.The existence and direction of arcs among variables are combined organically.
Bayesian Network;structure learning;prediction ability
TP391
A
1009-3907(2011)06-0032-03
2011-05-10
吉林省教育廳“十一五”科學技術(shù)研究項目(吉教科合字2010第314號)
趙越(1982-),男,吉林通化人,講師,碩士,主要從事機器學習方面的研究。