摘要:針對K2算法依賴最大父節(jié)點(diǎn)數(shù)和節(jié)點(diǎn)順序的不足,提出了一種改進(jìn)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法(MWST-CS-K2)。該算法先通過構(gòu)造最大支撐樹(MWST)得到最大父節(jié)點(diǎn)數(shù);再利用變量間的關(guān)聯(lián)度和更新系數(shù)對加邊、減邊和反轉(zhuǎn)邊進(jìn)行規(guī)則設(shè)定,通過改進(jìn)的布谷鳥算法對鳥巢位置進(jìn)行尋優(yōu),應(yīng)用廣度優(yōu)先搜索策略搜索遍歷得到節(jié)點(diǎn)順序;最后將最大父節(jié)點(diǎn)數(shù)和節(jié)點(diǎn)順序作為K2算法的輸入搜索得到最終網(wǎng)絡(luò)。實(shí)驗(yàn)表明,所提出的MWST-CS-K2算法在標(biāo)準(zhǔn)的ASIA、SACHS和CHILD網(wǎng)絡(luò)數(shù)據(jù)測試中的平均正確邊比率分別達(dá)到了97.3%、87.7%和95.6%,學(xué)習(xí)效果優(yōu)于其他對比算法,獲得的網(wǎng)絡(luò)結(jié)構(gòu)和標(biāo)準(zhǔn)的網(wǎng)絡(luò)結(jié)構(gòu)最為相似。
關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);布谷鳥算法;K2算法;最大支撐樹
中圖分類號:TP301文獻(xiàn)標(biāo)志碼:A文章編號:1001-3695(2023)01-026-0160-05
doi: 10.19734/j.issn.1001-3695.2022.06.0281
Bayesian network structure learning algorithm based on MWST-CS-K2
Liu Jia,b, Xiong Yuexiaa, Li Leia,b
(a.School of Statistics amp; Data Science, b.Xinjiang Social amp; Economic Statistics amp; Big Data Application Research Center, Xinjiang University of Finance amp; Economics, Urumqi 830012, China)
Abstract:
Aiming at the deficiency that K2 algorithm depends on the maximum number of parent nodes and node of order, this paper proposed an improved Bayesian network structure learning algorithm(MWST-CS-K2). The algorithm firstly obtained the maximum number of parent nodes by constructing the maximum support tree(MWST). Then it used the correlation degree and updated coefficient between variables to set rules for adding, subtracting and reversing edges. The paper used improved cuckoo algorithm to optimize the nest location, and applied the breadth first search strategy to search and traverse to get the node order. Finally, the paper used maximum number of parent nodes and the order of nodes as the input of K2 algorithm to get the final network. Experiments show that in the standard ASIA,SACHS and CHILD network data tests, the average correct edge ratio of MWST-CS-K2 algorithm reaches 97.3%,87.7 %and 95.6% respectively. The learning effect is better than other corresponding comparison algorithms, and the network structure obtains the most similar to the standard network structure.
Key words:Bayesian network; cuckoo algorithm; K2 algorithm; maximum weight spanning tree
0引言
貝葉斯網(wǎng)絡(luò)(BN)是將圖論與概率論有效結(jié)合且對未知不確定的知識(shí)表達(dá)和有效推理具有顯著的優(yōu)勢,在許多新興領(lǐng)域都得到了廣泛的應(yīng)用,如臨床醫(yī)學(xué)[1]、視覺識(shí)別[2]、數(shù)據(jù)挖掘[3]、信息檢索[4]、自然語言處理[5]和故障診斷[6,7]等。
貝葉斯網(wǎng)絡(luò)學(xué)習(xí)主要可分為結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩大類。參數(shù)學(xué)習(xí)必須在結(jié)構(gòu)已知的條件下進(jìn)行,且網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)劣將直接影響參數(shù)學(xué)習(xí)結(jié)果的好壞,因此,結(jié)構(gòu)學(xué)習(xí)在BN學(xué)習(xí)中一直占據(jù)核心地位,但通過觀測數(shù)據(jù)自動(dòng)學(xué)習(xí)BN結(jié)構(gòu)該類方法被證明是NP-Hard[8]問題。專家學(xué)者針對這一問題展開了大量研究,提出了三類主要學(xué)習(xí)算法,分別為基于約束的方法、基于評分搜索的方法和混合學(xué)習(xí)的方法。
基于約束的方法是通過計(jì)算節(jié)點(diǎn)間的互信息和條件獨(dú)立性來找出各個(gè)節(jié)點(diǎn)之間的因果指向關(guān)系,進(jìn)而找到一種滿足該關(guān)系的網(wǎng)絡(luò)結(jié)構(gòu),如SGS[9]和TPDA算法[10]等,但當(dāng)網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)較多時(shí),該類約束方法的可靠性會(huì)隨著CI測試次數(shù)的指數(shù)級增加而下降。基于評分搜索的方法是把所有可能的結(jié)構(gòu)視為定義域,將評分函數(shù)視為目標(biāo)函數(shù)以此尋找在定義域內(nèi)滿足目標(biāo)函數(shù)的最優(yōu)解問題,如改進(jìn)細(xì)菌覓食算法[11]、水循環(huán)算法[12]、飛蛾—螢火優(yōu)化算法[13]等。該類方法可以學(xué)習(xí)到較為準(zhǔn)確的網(wǎng)絡(luò)結(jié)構(gòu),但是隨著變量數(shù)的增加,其搜索空間將呈現(xiàn)出指數(shù)級增長,學(xué)習(xí)效率顯著下降。混合學(xué)習(xí)方法將以上兩種方法的優(yōu)點(diǎn)進(jìn)行了結(jié)合,先利用約束方法使搜索的網(wǎng)絡(luò)結(jié)構(gòu)空間得到縮小,再利用評分搜索方法在其網(wǎng)絡(luò)空間中搜索得到一個(gè)最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。該方法在一定程度上避免了約束方法和評分搜索方法的缺陷,如WMIFS[14]和MWST-EA算法[15]。
K2算法[16]是貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)中經(jīng)典的評分搜索算法,因該算法在搜索前需輸入節(jié)點(diǎn)順序這一約束,進(jìn)而能夠有效避免似然等價(jià)帶來的節(jié)點(diǎn)間模糊性問題,同時(shí)也大大縮小了搜索空間,在性能上優(yōu)于很多經(jīng)典算法。但是由于在一般情形下節(jié)點(diǎn)順序是未知的,需要專家知識(shí)來予以判斷,在節(jié)點(diǎn)數(shù)量較少、節(jié)點(diǎn)間關(guān)系較為簡單時(shí),基本上可以通過專業(yè)經(jīng)驗(yàn)或領(lǐng)域知識(shí)直接給出節(jié)點(diǎn)間的因果關(guān)系;但隨著節(jié)點(diǎn)數(shù)量的不斷增加、節(jié)點(diǎn)間關(guān)系變得越來越錯(cuò)綜復(fù)雜時(shí),僅依靠專家知識(shí)理清各節(jié)點(diǎn)之間因果關(guān)系的可能性較小,因此,研究人員對節(jié)點(diǎn)順序的尋優(yōu)進(jìn)行了多方探討。文獻(xiàn)[17]提出一種新的NOK2算法,該算法利用孤立點(diǎn)處理機(jī)制和一系列策略獲得節(jié)點(diǎn)順序,但搜索時(shí)間較長且適用范圍有一定的限制。文獻(xiàn)[18]提出一種直接從數(shù)據(jù)中提取圖的強(qiáng)連通分量進(jìn)行節(jié)點(diǎn)排序,將原本呈超指數(shù)增長的搜索空間簡化為只需搜索較小的節(jié)點(diǎn)排序空間,使搜索時(shí)間得到了極大壓縮,但算法過于依賴節(jié)點(diǎn)父本集質(zhì)量。考慮到以上問題,文獻(xiàn)[19]提出了MWST-T-K2算法,該算法通過計(jì)算變量間的MI值來構(gòu)建MWST得到有向樹,對其進(jìn)行正序排列得到節(jié)點(diǎn)順序,但不適用于變量過多的網(wǎng)絡(luò)且算法學(xué)習(xí)效果的準(zhǔn)確率較低。
針對文獻(xiàn)[19]所提的MWST-T-K2算法的啟發(fā),本文提出了一種改進(jìn)的結(jié)構(gòu)學(xué)習(xí)算法(MWST-CS-K2),該算法將布谷鳥算法與K2算法的優(yōu)點(diǎn)有效結(jié)合起來,先通過構(gòu)造MWST得到最大父節(jié)點(diǎn)數(shù)和初始網(wǎng)絡(luò);其次在不產(chǎn)生環(huán)路的限制條件下,應(yīng)用改進(jìn)后的布谷鳥算法對鳥巢進(jìn)行搜索尋優(yōu),通過對鳥巢位置進(jìn)行廣度優(yōu)先搜索策略[20]搜索遍歷得到節(jié)點(diǎn)順序,從而較好地解決了K2算法依賴最大父節(jié)點(diǎn)數(shù)和節(jié)點(diǎn)順序的問題。與此同時(shí)設(shè)計(jì)了加邊、減邊和反轉(zhuǎn)邊規(guī)則,使其搜索機(jī)制得到了極大簡化,增強(qiáng)了布谷鳥算法全局最優(yōu)搜索能力,增加了節(jié)點(diǎn)順序的準(zhǔn)確度,為構(gòu)造貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)提供了一種新的研究思路,具有一定的實(shí)用價(jià)值。
1相關(guān)基本理論
1.1貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)可表示為BN={S,P},其中S代表有向無環(huán)圖(directed acyclic graph,DAG);P代表?xiàng)l件概率表(conditional probability table,CPT)。給定集合V={X1,X2,…,Xn},根據(jù)數(shù)理統(tǒng)計(jì)中學(xué)習(xí)到的概率鏈?zhǔn)揭?guī)則,貝葉斯網(wǎng)絡(luò)的聯(lián)合概率分布可表示為
P(X1,X2,…,Xn)=∏ni=1P(Xi|X1,X2,…,Xi-1)(1)
由局部馬爾可夫性,式(1)可表示為
P(X1,X2,…,Xn)=∏ni=1P(Xi|πi)(2)
其中:πi表示節(jié)點(diǎn)Xi的父節(jié)點(diǎn)集。下面介紹貝葉斯網(wǎng)絡(luò)中的幾個(gè)重要定義。
定義1條件獨(dú)立。設(shè)有隨機(jī)變量x、y和z,如果滿足式(3),就稱在z已知的條件下,x和y相互條件獨(dú)立,記為x⊥y|z。
P(x,y|z)=P(x|z)P(y|z)(3)
定義2連接方式。如果變量Z與X和Y相連,一般分為順連、匯連、分連三種連接情況。如圖1所示,分別表示了這三種連接情況。
定義3局部馬爾可夫性。在一個(gè)BN中,給定變量z的父節(jié)點(diǎn)π(z),則該變量z條件獨(dú)立于它的所有非后代節(jié)點(diǎn)nd(z),即z⊥[nd(z)\π(z)]|π(z)。
定義4鏈規(guī)則。對于含有n個(gè)變量的聯(lián)合分布P(X1,X2,…,Xn),有
P(X1,X2,…,Xn)= P(X1)P(X2|X1)…P(Xn|X1,…,Xn-1)(4)
1.2互信息
互信息(mutual information,MI)用于表示隨機(jī)變量間的相互依賴關(guān)系,對于任意兩個(gè)隨機(jī)變量X和Y,互信息I(X;Y)可表示為
I(X;Y)=∑XYP(X,Y)logp(x,y)p(x)p(y)(5)
其中:P(X,Y)表示變量X和Y的聯(lián)合概率,變量X的概率表示為p(x)。由于I(X;Y)≥0,這里分兩種情況進(jìn)行討論:a)當(dāng)I(X;Y)gt;0時(shí),說明變量X和Y之間存在相互依賴關(guān)系,但是這里不能確定是X依賴Y還是Y依賴X,故無法判斷X和Y誰是因誰是果,故用一條無向邊來連接變量X和Y,I(X;Y)的值越接近于1,說明變量X和Y之間的依賴關(guān)系就越強(qiáng);b)當(dāng)I(X;Y)=0時(shí),說明變量X和Y相互獨(dú)立,X和Y之間沒有任何聯(lián)系。
1.3最大信息系數(shù)
2011年Reshef等人[21]首次提出最大信息系數(shù)(maximal information coefficient,MIC)。最初提出MIC思想就是為了探討任意兩個(gè)隨機(jī)變量之間的關(guān)系。給定有限數(shù)據(jù)集D與變量對〈xi,yi〉,其中i=1,2,…,n,先對其在二維空間中進(jìn)行離散化處理,并對X和Y軸分別進(jìn)行格子劃分,得到一個(gè)x×y的網(wǎng)格G,同時(shí)網(wǎng)格G將數(shù)據(jù)集中所有的變量對都包含進(jìn)來。MIC的基本原理是利用互信息的概念。
考慮到不同維數(shù)的數(shù)據(jù)集之間不能進(jìn)行有效比較,故需對最大互信息值進(jìn)行歸一化處理,進(jìn)而得到互信息值的特征矩陣:
M(D)(x,y)=I(D,X,Y)lg(min{x,y})(6)
則最大信息系數(shù)[17]可表示為
MIC(D)=maxxylt;B(n){M(D)x,y}=max|X‖Y|lt;B I(D,X,Y)lg(min{x,y})(7)
顯而易見,MIC的取值為[0,1]。因MI具有對稱性,故MIC同樣具有對稱性。
1.4最大支撐樹
通過計(jì)算變量間的MI并將其進(jìn)行降序排列,依據(jù)不產(chǎn)生環(huán)路的原則,將數(shù)據(jù)集中包含的所有隨機(jī)變量都進(jìn)行一一遍歷,只保留具有最大MI值所對應(yīng)的變量對,并將其變量對用無向邊進(jìn)行連接,即可完成MWST的構(gòu)建[15]。具體步驟如下:
a)在數(shù)據(jù)集D中,計(jì)算隨機(jī)變量Xi與其他變量Xj之間的聯(lián)合概率分布:
P(Xi=xi,Xj=xj)=count(Xi=xi,Xj=xj)N-1(8)
其中:count(Xi=xi,Xj=xj)表示在Xi=xi和Xj=xj同時(shí)成立的條件下的樣本點(diǎn)數(shù)目,N-1表示樣本點(diǎn)的總數(shù)目減1。
b)求變量間邊的權(quán)重e(Xi,Xj),即求變量Xi與Xj的最大互信息:
e(Xi,Xj)=maxxylt;B(n){I(X;Y)}(9)
c)構(gòu)造的無向樹里面要包含權(quán)重最大的邊。
d)依次考慮下一個(gè)最大的e(Xi,Xj),若將該權(quán)重對應(yīng)的無向邊加入到無向樹中未形成環(huán),則添加這條邊;否則就不添加。
e)循環(huán)步驟d)直到樹中包含n-1條邊停止。
1.5K2算法
K2算法[16]是一種利用節(jié)點(diǎn)順序和最大父節(jié)點(diǎn)數(shù)作為輸入并從數(shù)據(jù)中學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的貪心算法。因節(jié)點(diǎn)順序的存在有效避免了似然等價(jià)帶來的節(jié)點(diǎn)間模糊性的問題,且極大地縮小了算法的搜索空間,所以K2算法長期以來都被認(rèn)為是一種非常高效的結(jié)構(gòu)學(xué)習(xí)算法。該算法的思想是根據(jù)數(shù)據(jù)集D中的多個(gè)變量之間的潛在隱藏特征構(gòu)建多個(gè)網(wǎng)絡(luò)結(jié)構(gòu),在這些結(jié)構(gòu)中選擇出一個(gè)使后驗(yàn)概率最大的結(jié)構(gòu),即有
maxBS P[(BS,D)]=c∏ni=1max[∏qij=1(ri-1)!(Nij+ri-1)!]∏rik=1Nijk!(10)
其中:常數(shù)c代表結(jié)構(gòu)的先驗(yàn)概率P(BS);ri表示節(jié)點(diǎn)Xi的狀態(tài)個(gè)數(shù);Nijk表示節(jié)點(diǎn)Xi的狀態(tài)取k時(shí),其對應(yīng)的父節(jié)點(diǎn)狀態(tài)取j時(shí)的樣本個(gè)數(shù);Nij表示節(jié)點(diǎn)Xi的父節(jié)點(diǎn)狀態(tài)取j的所有類別的樣本數(shù)的總和。Nij與Nijk之間的關(guān)系為
Nij=∑rik=1Nijk(11)
由式(10)可知,K2算法是可以進(jìn)行分解的,所以式(10)可以分解出式(12):
g(Xi,πi)=∏qij=1(ri-1)!(Nij+ri-1)!∏rik=1Nijk!
(12)
要想保證式(10)的后驗(yàn)概率最大,只需要保證式(12)取到最大值即可。
2MWST-CS-K2算法的設(shè)計(jì)原理
先通過計(jì)算MI構(gòu)建MWST確定最大父節(jié)點(diǎn)數(shù)μ;再通過改進(jìn)的布谷鳥算法對初始鳥巢進(jìn)行迭代尋優(yōu)獲得最優(yōu)鳥巢;然后應(yīng)用搜索策略進(jìn)行遍歷搜索得到節(jié)點(diǎn)順序ρ;最后,在已知μ和ρ的前提下,結(jié)合K2算法搜索獲得最終的BN結(jié)構(gòu)。
2.1確定最大父節(jié)點(diǎn)數(shù)
由于MWST構(gòu)造的無向樹中的無向邊表示的是兩個(gè)隨機(jī)變量之間相互關(guān)聯(lián)的程度,所以它在有向無環(huán)圖中對應(yīng)的就是父節(jié)點(diǎn)與子節(jié)點(diǎn)之間的因果關(guān)系。故構(gòu)造MWST就可以確定網(wǎng)絡(luò)的最大父節(jié)點(diǎn)數(shù)μ。
2.2改進(jìn)的布谷鳥算法
布谷鳥(CS)算法是一種通過對生物布谷鳥的寄生育雛行為進(jìn)行模擬的群智能算法,它具有參數(shù)少、通用性好、魯棒性強(qiáng)以及極易與其他算法結(jié)合等優(yōu)點(diǎn)。但其一般適用于連續(xù)型優(yōu)化問題的求解,故對其尋窩方式進(jìn)行改進(jìn):a)基于MIC對變量間的關(guān)聯(lián)度進(jìn)行檢測,根據(jù)變量間的關(guān)聯(lián)度構(gòu)建初始網(wǎng)絡(luò)結(jié)構(gòu)骨骼圖,并通過碰撞識(shí)別獲得初始網(wǎng)絡(luò),將初始網(wǎng)絡(luò)表示成鄰接矩陣的形式,對其進(jìn)行二進(jìn)制編碼獲得初始鳥巢;b)將變量間的關(guān)聯(lián)度作為節(jié)點(diǎn)間的權(quán)重,根據(jù)權(quán)重和更新系數(shù)設(shè)計(jì)加邊、減邊和反轉(zhuǎn)邊規(guī)則,通過加邊、減邊和反轉(zhuǎn)邊操作更新鳥巢。經(jīng)CS算法的多次迭代得到最高BIC值對應(yīng)的鳥巢位置,應(yīng)用廣度優(yōu)先搜索策略搜索遍歷得到節(jié)點(diǎn)順序。
1)構(gòu)建初始網(wǎng)絡(luò)
MIC相較于MI有更高的準(zhǔn)確度,在一定數(shù)據(jù)集下,MIC具有良好的廣泛性和均勻性。故使用最大信息系數(shù)(MIC)對節(jié)點(diǎn)間關(guān)聯(lián)度進(jìn)行檢測,構(gòu)造MWST得到網(wǎng)絡(luò)骨骼圖,通過碰撞識(shí)別獲得初始網(wǎng)絡(luò)。以ASIA網(wǎng)絡(luò)為例,如圖2所示。
2)鳥巢編碼
假設(shè)有一個(gè)由n個(gè)節(jié)點(diǎn)組成的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),將其結(jié)構(gòu)表示為一個(gè)n×n維的鄰接矩陣形式。采用文獻(xiàn)[22]提出的矩陣編碼方式進(jìn)行編碼,如果把鳥巢位置定義為一個(gè)有向無環(huán)圖,則鳥巢的當(dāng)前位置可以用矩陣M表示,M={dij},其中dij定義如下:
dij=1節(jié)點(diǎn)j是i的父節(jié)點(diǎn)0其他 (13)
文中所提算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的個(gè)體可表示為g11g12…g1ng21g22…g2n…gn1gn2…gnn,其BN結(jié)構(gòu)的個(gè)體即為一個(gè)鳥巢。圖2是ASIA網(wǎng)絡(luò)的初始網(wǎng)絡(luò)結(jié)構(gòu),將初始網(wǎng)絡(luò)表示成鄰接矩陣的形式,如下所示。
根據(jù)上述所說的編碼方式進(jìn)行編碼,鄰接矩陣中的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)編碼為000001000000010000001000000001000000000 1000000110000000000000000。
3)更新操作
對CS算法中的鳥巢進(jìn)行更新操作,具體如下:將變量間的關(guān)聯(lián)度作為節(jié)點(diǎn)間的權(quán)重,根據(jù)權(quán)重和更新系數(shù)設(shè)計(jì)加邊、減邊和反轉(zhuǎn)邊規(guī)則。需要說明的是,權(quán)重是帶有位置標(biāo)簽的,每一個(gè)位置標(biāo)簽都與鳥巢中的某一當(dāng)前位置一一對應(yīng)。為了使鳥巢更新更具有針對性,設(shè)計(jì)了加邊、減邊和反轉(zhuǎn)邊規(guī)則,分別如式(14)~(16)所示。
PR=wrandom(node_num,node_num)gt;20×rupdate∑node_numi=1wi(14)
PM=wrandom(node_num,node_num)lt;0.1×rupdate(15)
PI=wrandom(node_num,node_num)gt;100×rupdate(16)
在MIC對稱矩陣中,主對角線上的元素為0,即MIC(X,X)=0,上三角與下三角呈對稱形式,只取上三角元素或下三角元素稱為有效權(quán)重,有效權(quán)重個(gè)數(shù)為N=C2n。
對應(yīng)網(wǎng)絡(luò)的節(jié)點(diǎn)不同,需要對加邊、減邊和反轉(zhuǎn)邊公式的系數(shù)進(jìn)行調(diào)整,本文加邊、減邊和反轉(zhuǎn)邊公式是以ASIA網(wǎng)絡(luò)為基礎(chǔ)展示的。random(node_num,node_num)表示根據(jù)權(quán)重的大小進(jìn)行的位置選擇,該操作減小了位置選擇的隨機(jī)性,增加了算法效率。以ASIA網(wǎng)絡(luò)進(jìn)行說明,有效權(quán)重個(gè)數(shù)有(8×7/2)=28個(gè),將這28個(gè)權(quán)重進(jìn)行降序排列,加邊、減邊和反轉(zhuǎn)邊位置的選取必出現(xiàn)在具有較大權(quán)重變量對對應(yīng)的位置上。例如0.329 1表示在MIC矩陣中變量bronc和dysp之間的關(guān)聯(lián)度,在這里將bronc定義為5,dysp定義為8,則權(quán)重0.329 1的位置標(biāo)簽為(5,8),對應(yīng)鳥巢中的第40位。
4)非法結(jié)構(gòu)環(huán)移除操作
對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行迭代尋優(yōu)過程中,大概率會(huì)產(chǎn)生非法結(jié)構(gòu),采用文獻(xiàn)[23]提出的去環(huán)操作。首先根據(jù)網(wǎng)絡(luò)計(jì)算出其對應(yīng)的傳遞閉包矩陣A,對網(wǎng)絡(luò)是否合法進(jìn)行判斷。若對角線元素全為0,表示合法;否則,需對網(wǎng)絡(luò)進(jìn)行去環(huán)操作,在環(huán)結(jié)構(gòu)中任意刪除一條邊或等概率地反轉(zhuǎn)一條邊的方向,使其成為合法網(wǎng)絡(luò)。不斷循環(huán)上述操作,直到矩陣A對角線元素全為0為止。
5)評分函數(shù)
由數(shù)據(jù)集D和隨機(jī)變量V={v1,v2,v3,…,vn}組成的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)G,選用貝葉斯信息標(biāo)準(zhǔn)(Bayesian information criterion,BIC)作為布谷鳥算法的適應(yīng)度函數(shù),適應(yīng)度值越大表明數(shù)據(jù)集D與網(wǎng)絡(luò)結(jié)構(gòu)G的匹配程度越高。因此,基于網(wǎng)絡(luò)結(jié)構(gòu)G和數(shù)據(jù)集D的BIC評分函數(shù)可表示為
BIC(G|D)=∑ni=1 ∑qij=1 ∑rik=1MijklgMijkMij-∑ni=1qi(ri-1)2lg m
(17)
其中:ri是節(jié)點(diǎn)vi的取值個(gè)數(shù);qi是節(jié)點(diǎn)vi對應(yīng)的父節(jié)點(diǎn)的組合數(shù)目;Mijk表示節(jié)點(diǎn)vi對應(yīng)的父節(jié)點(diǎn)取j、k時(shí)的樣本數(shù)目;Mij為節(jié)點(diǎn)vi取j時(shí)與其父節(jié)點(diǎn)集的所有取值對應(yīng)的樣本個(gè)數(shù)。
6)節(jié)點(diǎn)順序ρ
采用廣度優(yōu)先搜索策略[21]進(jìn)行搜索和遍歷,得到節(jié)點(diǎn)順序ρ,具體如下:首先需要說明一個(gè)原則,如果某一個(gè)頂點(diǎn)先被訪問,那么該頂點(diǎn)對應(yīng)的鄰居節(jié)點(diǎn)也要優(yōu)先被訪問,依據(jù)該原則進(jìn)行節(jié)點(diǎn)順序排列;給定一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)G,隨機(jī)選擇一個(gè)入度為0的頂點(diǎn)V,依據(jù)原則訪問該頂點(diǎn)V對應(yīng)的所有鄰居節(jié)點(diǎn),并將已被訪問過的頂點(diǎn)V和其鄰居節(jié)點(diǎn)進(jìn)行標(biāo)記,然后對所有尚未被訪問到的頂點(diǎn)展開地毯式搜索,直至該網(wǎng)絡(luò)G中的每個(gè)節(jié)點(diǎn)均被訪問過,搜索結(jié)束。
2.3算法流程描述
首先利用MI構(gòu)建MWST確定最大父節(jié)點(diǎn)數(shù)μ。其次,基于MIC對變量間的關(guān)聯(lián)度進(jìn)行檢測,并根據(jù)關(guān)聯(lián)度構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)的骨骼圖,通過碰撞識(shí)別獲得初始網(wǎng)絡(luò),將初始網(wǎng)絡(luò)表示成鄰接矩陣的形式,并對其進(jìn)行二進(jìn)制編碼獲得初始鳥巢。將變量間的關(guān)聯(lián)度作為節(jié)點(diǎn)間的權(quán)重,根據(jù)權(quán)重和更新系數(shù)之間的關(guān)系定義加邊、減邊和反轉(zhuǎn)邊規(guī)則(加邊、減邊和反轉(zhuǎn)邊位置的選擇根據(jù)權(quán)重的大小確定),通過加邊、減邊和反轉(zhuǎn)邊操作達(dá)到更新鳥巢的目的。經(jīng)CS算法的多次迭代得到最高BIC值對應(yīng)的鳥巢位置,然后應(yīng)用搜索策略進(jìn)行遍歷搜索得到節(jié)點(diǎn)序ρ。最后,在已知μ和ρ的情況下,結(jié)合K2算法搜索獲得最終的網(wǎng)絡(luò)結(jié)構(gòu)。具體算法流程如圖3所示。
3MWST-CS-K2算法的仿真實(shí)驗(yàn)
3.1數(shù)據(jù)集
仿真實(shí)驗(yàn)在硬件環(huán)境Intel Core i7-1087H CPU @ 2.20 GHz、32 GB DDR4內(nèi)存和Windows 10操作系統(tǒng)下運(yùn)行,利用Python語言進(jìn)行算法編程。
為了驗(yàn)證所提算法的有效性,以經(jīng)典的ASIA、SACHS小型網(wǎng)絡(luò)和CHILD中型網(wǎng)絡(luò)為例進(jìn)行仿真實(shí)驗(yàn)。對這三個(gè)網(wǎng)絡(luò)進(jìn)行模擬生成多組樣本,樣本數(shù)量分別為500、2 000、5 000、10 000、20 000,將實(shí)驗(yàn)結(jié)果與文獻(xiàn)[19]提出的MWST-T-K2、MWST-CR-K2(該算法通過計(jì)算變量間的MI值來構(gòu)建MWST碰撞識(shí)別得到初始網(wǎng)絡(luò)結(jié)構(gòu)并通過廣度優(yōu)先搜索策略搜索遍歷得到節(jié)點(diǎn)順序)和HC算法進(jìn)行對比分析。
3.2參數(shù)設(shè)置及評價(jià)指標(biāo)
在仿真實(shí)驗(yàn)中,設(shè)置布谷鳥個(gè)數(shù)為28,算法的參數(shù)設(shè)置如下:拋棄率pa=0.25,更新系數(shù)rupdate=0.002,迭代次數(shù)為t=100。根據(jù)每個(gè)網(wǎng)絡(luò)的節(jié)點(diǎn)個(gè)數(shù)不同,相應(yīng)參數(shù)需進(jìn)行參數(shù)調(diào)優(yōu)。對于主要參數(shù)pa、n、rupdate的取值,楊新社等人[24]通過模擬實(shí)驗(yàn)發(fā)現(xiàn)收斂速度在一定程度上對所使用的參數(shù)不敏感,對于大多數(shù)優(yōu)化問題,n取15~40,pa取0.25即可解決問題,經(jīng)實(shí)驗(yàn)測試,n取15~40的中值28,pa取0.25。對于更新系數(shù)rupdate考慮到學(xué)習(xí)效率的問題,這里需要使更新系數(shù)rupdate盡量小,使得生成的邊不多;否則更新系數(shù)過大,將導(dǎo)致計(jì)算效率較低無法收斂等問題。根據(jù)實(shí)驗(yàn)測試,rupdate取0.002較為合理。
實(shí)驗(yàn)采用的評價(jià)指標(biāo)是正確邊比率(correct edge rate,CER)和漢明距離(Hamming distance,HD),以這兩個(gè)指標(biāo)來評價(jià)各個(gè)算法所學(xué)到的最優(yōu)結(jié)構(gòu)與基準(zhǔn)結(jié)構(gòu)之間的差異程度。
a)正確邊比率用來度量基于數(shù)據(jù)運(yùn)用算法學(xué)習(xí)到的網(wǎng)絡(luò)結(jié)構(gòu)中邊的正確程度,用學(xué)習(xí)到的正確邊數(shù)除以總邊數(shù)。
CER=CECE+RE+IE(18)
其中:CE為正確邊數(shù)(correct edge),指學(xué)習(xí)到的邊和真實(shí)邊一致的邊的條數(shù);RE為冗余邊數(shù)(redundant edge);IE為反轉(zhuǎn)邊數(shù)(inverted edge)。
b)漢明距離用來度量通過數(shù)據(jù)運(yùn)用各種算法學(xué)習(xí)得到的網(wǎng)絡(luò)結(jié)構(gòu)與真實(shí)基準(zhǔn)網(wǎng)絡(luò)結(jié)構(gòu)之間的差異程度,用網(wǎng)絡(luò)結(jié)構(gòu)中的冗余邊數(shù)、反向邊數(shù)和丟失邊數(shù)三者之和來表示,即
HD=RE+ME+IE(19)
其中:ME為丟失邊數(shù)(missing edge)。HD的值越小,說明算法學(xué)習(xí)到的BN結(jié)構(gòu)與真實(shí)結(jié)構(gòu)之間的差異越小,其學(xué)習(xí)得到的網(wǎng)絡(luò)結(jié)構(gòu)的準(zhǔn)確率越高效果越好,學(xué)習(xí)到的網(wǎng)絡(luò)越接近于真實(shí)網(wǎng)絡(luò)。
3.3實(shí)驗(yàn)結(jié)果分析
布谷鳥算法在更新操作過程中具有隨機(jī)性,因此在實(shí)驗(yàn)過程中隨機(jī)運(yùn)行十次取結(jié)果中最大的BIC值對應(yīng)的鳥巢位置,應(yīng)用廣度優(yōu)先搜索策略對其位置進(jìn)行遍歷搜索得到節(jié)點(diǎn)序。在已知μ和ρ的情況下,結(jié)合K2算法搜索得到最終的網(wǎng)絡(luò)結(jié)構(gòu)。記錄ASIA、SACHS和CHILD網(wǎng)絡(luò)在四種算法中的正確邊數(shù)(CE)、丟失邊數(shù)(ME)、反向邊數(shù)(IE)和冗余邊數(shù)(RE)。為了便于表示,MWST-CS-K2算法用MCK表示、MWST-T-K2算法用MTK表示、MWST-CR-K2算法用MCRK表示。ASIA、SACHS、CHILD網(wǎng)絡(luò)的正確邊數(shù)仿真對比如圖4~6所示,各算法的漢明距離比較如表1所示。
A網(wǎng)絡(luò)是含有8個(gè)節(jié)點(diǎn)、8條邊的基準(zhǔn)網(wǎng)絡(luò)。如圖4仿真對比所示,在樣本數(shù)量為5 000和10 000時(shí),相比于其余三種算法,MCK算法學(xué)習(xí)到的正確邊數(shù)最多,更貼合真實(shí)網(wǎng)絡(luò)結(jié)構(gòu);在樣本數(shù)為500~2 000時(shí),MCK與HC算法學(xué)習(xí)到的正確邊數(shù)相同,分別為6條和7條正確邊,說明在正確邊數(shù)的仿真對比中,樣本數(shù)量為500和2 000時(shí),MCK與HC算法學(xué)習(xí)到的正確邊數(shù)相同,無法比較兩算法學(xué)習(xí)性能優(yōu)劣,下一步將兩算法進(jìn)行漢明距離的比較;在樣本數(shù)量為20 000時(shí),MCK和HC算法都學(xué)習(xí)到了完全正確的網(wǎng)絡(luò)結(jié)構(gòu)。其中MCK算法學(xué)習(xí)到貝葉斯網(wǎng)絡(luò)邊的平均正確邊比率達(dá)到了97.3%,MTK算法學(xué)習(xí)到的平均正確邊比率達(dá)到了67.4%,MCRK算法學(xué)習(xí)到的平均正確邊比率達(dá)到了51.2%,HC算法學(xué)習(xí)到的平均正確邊比率達(dá)到了73.2%。整體來說,MCK算法的正確邊數(shù)隨著樣本量的增加呈上升趨勢。
SACHS網(wǎng)絡(luò)是含有11個(gè)節(jié)點(diǎn)、17條邊的小型網(wǎng)絡(luò)。如圖5所示,在樣本數(shù)量為500、2 000、5 000、10 000、20 000時(shí),HC算法學(xué)習(xí)到的正確邊數(shù)不夠穩(wěn)定,呈下V型趨勢,MTK和MCRK算法正確邊數(shù)沒有隨著樣本數(shù)量的增加而顯著增加,其原因在于其節(jié)點(diǎn)順序沒有一個(gè)動(dòng)態(tài)變化,使其學(xué)習(xí)性能不如MCK算法,MCK算法學(xué)習(xí)到貝葉斯網(wǎng)絡(luò)邊的平均正確邊比率達(dá)到了87.7%,MTK算法學(xué)習(xí)的平均正確邊比率達(dá)到了76.9%,MCRK算法學(xué)習(xí)到的平均正確邊比率達(dá)到了62.1%,HC算法學(xué)習(xí)到的平均正確邊比率達(dá)到了52.7%,且正確邊數(shù)隨著樣本量的增加呈上升趨勢。
CHILD網(wǎng)絡(luò)是含有20個(gè)節(jié)點(diǎn),25條邊的基準(zhǔn)網(wǎng)絡(luò)。如圖6所示,MTK算法的正確邊數(shù)隨著樣本量的增加,呈逐步上升的趨勢;MCRK和HC算法的正確邊數(shù)學(xué)習(xí)效果都沒有MTK算法好;所提算法MCK在樣本量為500時(shí),學(xué)習(xí)到了17條正確邊數(shù),在樣本數(shù)量為5 000和10 000時(shí),學(xué)習(xí)到的網(wǎng)絡(luò)結(jié)構(gòu)與真實(shí)網(wǎng)絡(luò)結(jié)構(gòu)只相差1條邊。在樣本數(shù)量不斷增加的情況下,MCK算法學(xué)習(xí)到貝葉斯網(wǎng)絡(luò)邊的平均正確邊比率達(dá)到了95.6%,MTK算法學(xué)習(xí)的平均正確邊比率達(dá)到了76.9%,MCRK算法學(xué)習(xí)到的平均正確邊比率達(dá)到了53%,HC算法學(xué)習(xí)到的平均正確邊比率達(dá)到了81.1%,且正確邊數(shù)整體呈上升趨勢。
表1是不同算法在不同網(wǎng)絡(luò)規(guī)模下的HD值。在對圖4的分析中發(fā)現(xiàn),在樣本量為500和2 000時(shí),MCK與HC算法學(xué)習(xí)到的正確邊數(shù)相同,這里以漢明距離來進(jìn)行兩算法學(xué)習(xí)性能的比較。在樣本數(shù)量為500時(shí),MCK和HC算法的漢明距離分別為3和4;在樣本數(shù)量為2 000時(shí),MCK和HC算法的漢明距離分別為1和2。漢明距離越小,表示學(xué)習(xí)到的網(wǎng)絡(luò)越接近真實(shí)網(wǎng)絡(luò),故在樣本數(shù)量為500和2 000時(shí),MCK算法的性能優(yōu)于HC算法的性能。在不同網(wǎng)絡(luò)和不同樣本量中,MCK算法的HD值都小于MCRK、MTK和HC算法,表明MCK算法具有較好的學(xué)習(xí)性能。
通過對ASIA、SACHS小型網(wǎng)絡(luò)和CHILD中型網(wǎng)絡(luò)的仿真實(shí)驗(yàn)可知,MWST-CS-K2算法實(shí)現(xiàn)了較好的效果。MWST-CS-K2算法使用MIC構(gòu)建初始網(wǎng)絡(luò),提高了初始網(wǎng)絡(luò)的準(zhǔn)確性;又因設(shè)計(jì)了加邊、減邊和反轉(zhuǎn)邊規(guī)則,使鳥巢在一定范圍內(nèi)進(jìn)行更新操作,減少了算法搜索的隨機(jī)性,增加了網(wǎng)絡(luò)的準(zhǔn)確度。在小型網(wǎng)絡(luò)ASIA、SACHS和中型網(wǎng)絡(luò)CHILD中,隨著樣本量的增加,MWST-CS-K2算法的正確邊數(shù)在增加、冗余邊數(shù)在減少,相比于其他三種算法,MWST-CS-K2算法可以學(xué)習(xí)得到最接近真實(shí)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步說明了MWST-CS-K2算法的有效性。
4結(jié)束語
針對K2算法依賴最大父節(jié)點(diǎn)數(shù)和節(jié)點(diǎn)順序的不足,將布谷鳥算法和K2算法的優(yōu)點(diǎn)進(jìn)行有效結(jié)合,提出了一種新的BN結(jié)構(gòu)學(xué)習(xí)算法(MWST-CS-K2),該算法先通過計(jì)算節(jié)點(diǎn)間的MI構(gòu)建MWST,進(jìn)而獲得最大父節(jié)點(diǎn)數(shù)μ;其次通過改進(jìn)布谷鳥算法設(shè)計(jì)了一種新的系數(shù)即更新系數(shù),根據(jù)更新系數(shù)和節(jié)點(diǎn)關(guān)聯(lián)度設(shè)計(jì)了加邊、減邊和反轉(zhuǎn)邊規(guī)則,這一操作使其算法的搜索機(jī)制得到了極大簡化、搜索空間得到了高度壓縮、增加了節(jié)點(diǎn)順序的準(zhǔn)確度;最后將μ和ρ作為K2算法的輸入,經(jīng)不斷迭代尋優(yōu)得到最終的BN結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,MWST-CS-K2算法獲得了較好的學(xué)習(xí)效果,為BN結(jié)構(gòu)學(xué)習(xí)算法的構(gòu)造提供了一種新的研究思路。考慮到部分父子節(jié)點(diǎn)聯(lián)系較為緊密,影響布谷鳥算法的有效識(shí)別,下一步研究的重點(diǎn)將放在如何將節(jié)點(diǎn)優(yōu)先度融合進(jìn)算法中,進(jìn)一步提高節(jié)點(diǎn)序的準(zhǔn)確度。
參考文獻(xiàn):
[1]婁楚月,李祥順,Amine A M. 基于自適應(yīng)閾值方案的貝葉斯網(wǎng)絡(luò)故障監(jiān)測和分類 [J]. 工業(yè)與工程化學(xué)研究,2020,59(34): 15155-15164.(Lou Chuyue,Li Xiangshun,Amine A M. Bayesian network based on an adaptive threshold scheme for fault detection and classification [J]. Industrial and Engineering Chemistry Research,2020,59(34): 15155-15164.)
[2]Taghi-Molla A,Rabbani M,Gavareshki M H K,et al. Safety improvement in a gas refinery based on resilience engineering and macro-ergonomics indicators: a Bayesian network-artificial neural network approach [J]. International Journal of System Assurance Engineering and Management,2020,11(3): 641-654.
[3]李昡熠,周鋆. 基于頻繁項(xiàng)挖掘的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法BNSL-FIM [J].計(jì)算機(jī)應(yīng)用,2021,41(12):3475-3479.(Li Xuan-yi,Zhou Yun. Bayesian network structure learning algorithm BNSL-FIM based on frequent item mining [J]. Journal of Computers Application,2021,41(12): 3475-3479.)
[4]鄭偉,侯宏旭,武靜. 貝葉斯網(wǎng)絡(luò)在信息檢索中的應(yīng)用 [J]. 情報(bào)科學(xué),2018,36(6): 136-141.(Zheng Wei,Hou Hongxu,Wu Jing. Application of Bayesian network in information retrieval [J]. Information Science,2018,36(6): 136-141.)
[5]上官明霞,朱珊珊,陳曉亮,等. 基于融合自然語言處理的語義分析方法研究 [J]. 計(jì)算機(jī)與網(wǎng)絡(luò),2018,44(20): 65-67.(Shangguan Mingxia,Zhu Shanshan,Chen Xiaoliang,et al. Research on semantic analysis method based on fusion natural language processing [J]. Computer and Network,2018,44(20): 65-67.)
[6]黃詩雯,劉朝暉,羅凌云,等. 融合行為和遺忘因素的貝葉斯知識(shí)追蹤模型研究 [J]. 計(jì)算機(jī)應(yīng)用研究,2021,38(7): 1993-1997.(Huang Shiwen,Liu Zhaohui,Luo Lingyun,et al. Research on Baye-sian knowledge tracking model integrating behavior and forgetting factors [J]. Application Research of Computers,2021,38(7): 1993-1997.)
[7]唐倫,廖皓,曹睿,等. 基于深度動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的服務(wù)功能鏈故障診斷算法 [J]. 電子與信息學(xué)報(bào),2021,43(1): 3588-3596.(Tang Lun,Liao Hao,Cao Rui,et al. Fault diagnosis algorithm of service function chain based on deep dynamic Bayesian network [J]. Journal of Electronics and Information,2021,43(1): 3588-3596.)
[8]Chickering D M. Learning Bayesian networks is NP-complete [J]. Networks,1996,112(2): 121-130.
[9]Spirtes P,Glymour C,Scheines R. From probability to causality [J]. Philosophical Studies,1991,64(1): 1.
[10]Cheng Jie,Bell D A,Liu Weiru. Learning belief networks from data: an information theory based approach [C]// Proc of the 6th International Conference on Information and Knowledge Management. New York: ACM Press,1997: 325-331.
[11]Yang Cuicui,Ji Junzhong,Liu Jiming,et al. Structural learning of Bayesian networks by bacterial foraging optimization [J]. International Journal of Approximate Reasoning,2016,69: 147-167.
[12]Wang Jingyun,Liu Sanyang. Novel binary encoding water cycle algorithm for solving Bayesian network structures learning problem [J]. Knowledge-Based Systems,2018,150: 95-110.
[13]包義釗,殷保群,曹杰,等. 基于飛蛾—燭火優(yōu)化算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí) [J]. 計(jì)算機(jī)工程,2018,44(1): 187-192.(Bao Yizhao,Yin Baoqun,Cao Jie,et al. Bayesian network structure lear-ning based on moth candle optimization algorithm [J]. Computer Engineering,2018,44(1): 187-192.)
[14]Qi Xiaolong,F(xiàn)an Xiaocong,Gao Yang,et al. Learning Bayesian network structures using weakest mutual-information-first strategy [J]. International Journal of Approximate Reasoning,2019,114:84-98.
[15]郭文強(qiáng),毛玲玲,黃梓軒,等. 改進(jìn)進(jìn)化算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)及其應(yīng)用 [J]. 河南科技大學(xué)學(xué)報(bào): 自然科學(xué)版,2022,43(2): 34-40,6-7.(Guo Wenqiang,Mao Lingling,Huang Zixuan,et al. Bayesian network structure learning based on improved evolutio-nary algorithm and its application [J]. Journal of Henan University of Science and Technology: Natural Science Edition,2022,43(2): 34-40,6-7.)
[16]Behjati S,Beigy H. Improved K2 algorithm for Bayesian network structure learning [J]. Engineering Applications of Artificial Intelligence,2020,91(5): 103617.
[17]劉彬,王海羽,孫美婷,等. 一種通過節(jié)點(diǎn)序?qū)?yōu)進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的算法 [J]. 電子與信息學(xué)報(bào),2018,40(5): 1234-1241.(Liu Bin,Wang Haiyu,Sun Meiting,et al. An algorithm for Bayesian network structure learning through node order optimization [J]. Journal of Electronics and Information Technology,2018,40(5): 1234-1241.)
[18]Cooper G F,Herskovits E. A Bayesian method for the induction of probabilistic networks from data [J]. Machine Learning,1992,9(4): 309-347.
[19]趙高長,王欣,張仲華,等. 基于MWST+T-K2結(jié)構(gòu)學(xué)習(xí)算法的貝葉斯分類器 [J]. 復(fù)旦學(xué)報(bào): 自然科學(xué)版,2017,56(1): 48-56.(Zhao Gaochang,Wang Xin,Zhang Zhonghua,et al. Bayesian classifier based on MWST+T-K2 structure learning algorithm [J]. Journal of Fudan University: Natural Science Edition,2017,56(1): 48-56.)
[20]王豫中,范磊,李建華. 基于廣度優(yōu)先搜索的局部社區(qū)發(fā)現(xiàn)算法 [J]. 計(jì)算機(jī)工程,2015,41(10): 37-41.(Wang Yuzhong,F(xiàn)an Lei,Li Jianhua. Local community discovery algorithm based on breadth first search [J]. Computer Engineering,2015,41(10): 37-41.)
[21]Reshef D N,Reshef Y A,F(xiàn)inucane H K,et al. Detecting novel associations in large data sets [J]. Science,2011,334(6062): 1518-1524.
[22]Larranaga P,Poza M,Yurramendi Y. Structure learning of Bayesian networks by genetic algorithms: a performance analysis of control parameters [J]. IEEE Trans on Pattern Analysis and Machine Intelligence,1996,18(9): 912-926.
[23]許麗佳,黃建國,王厚軍,等. 混合優(yōu)化的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí) [J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2009,21(5): 633-639.(Xu Lijia,Huang Jianjun,Wang Houjun,et al. Hybrid optimized algorithm for learning Bayesian network structure [J]. Journal of Computer-Aided Design and Computer Graphics,2009,21(5): 633-639.)
[24]楊新社,趙玉新,劉利強(qiáng). 新興元啟發(fā)式優(yōu)化方法 [M]. 北京: 科學(xué)出版社,2013.(Yang Xinshe,Zhao Yuxin,Liu Liqiang. Emerging meta heuristic optimization methods [M]. Beijing: Science Press,2013.)
收稿日期:2022-06-05;修回日期:2022-07-28基金項(xiàng)目:國家自然社科基金資助項(xiàng)目(72164034,71762028);新疆財(cái)經(jīng)大學(xué)研究生科研項(xiàng)目(XJUFE2022K10)
作者簡介:劉繼(1974-),男,四川達(dá)州人,教授,碩導(dǎo),博士,主要研究方向?yàn)閿?shù)據(jù)智能分析(liuji5000@126.com);熊月霞(1996-),女,安徽滁州人,碩士研究生,主要研究方向?yàn)閿?shù)據(jù)智能分析;李磊(1973-),女,河南堰城人,教授,碩導(dǎo),博士,主要研究方向?yàn)閿?shù)據(jù)挖掘.