999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于評分緩存的節點序空間下BN結構學習

2024-01-18 00:00:00高曉光閆栩辰王紫東劉曉寒馮奇
系統工程與電子技術 2024年12期

關鍵詞:貝葉斯網絡;結構學習;節點序;局部搜索;迭代重啟

中圖分類號:TP181 文獻標志碼:A DOI:10.12305/j.issn.1001-506X.2024.12.18

0引言

貝葉斯網絡(Bayesiannetwork,BN)是一種結合概率論與圖論的數學模型,是目前不確定知識表達和推理領域最有效的工具[1],現已被廣泛應用于故障診斷[23]、可靠性評估[45]、醫學診斷[67]、行為決策[8]等方面。目前,BN 憑借其良好的噪聲數據處理能力和模型可解釋性在基因調控領域[9]備受關注,但是基因調控的動態性導致BN 應用受限。BN學習分為結構學習和參數學習,而參數學習[10]的精度依賴于準確的BN結構。在實際中,僅依靠專家知識建模具有主觀性和局限性,因此充分利用數據學習BN 結構是至關重要的[11]。

根據方法策略的不同,BN 結構學習(BN structurelearning,BNSL)方法[12]主要分為基于依賴分析的方法、基于評分搜索的方法和混合方法。基于依賴分析的方法[1314]從BN 的語義出發,利用統計或信息論的方法定量地分析變量之間的獨立關系來確定網絡結構。基于評分搜索的方法[1516]則將BNSL視為組合優化問題,確定合適的評分函數和搜索策略,尋找評分最高的網絡結構。混合方法[1718]融合了前兩類算法的優勢,通過條件獨立性測試縮小搜索空間,然后采用評分搜索找到最優的網絡結構。基于依賴分析的方法和混合方法均需要大量的條件獨立性測試,存在誤差傳播問題。

根據搜索空間的不同,基于評分搜索的方法又分為基于有向無環圖(directedacyclicgraph,DAG)空間[1820]、基于等價類空間[15]和基于節點序空間[2125]的搜索方法。基于節點序空間的搜索方法與前兩類方法相比,搜索空間縮小,計算成本降低,全局搜索步驟增加,避免了大量無環檢測[21],進一步簡化了搜索復雜度。基于節點空間的搜索方法通常采取迭代局部搜索(iteratedlocalsearch,ILS)的啟發式策略[26],在可行時間內找到更優的網絡結構,尤其在大規模網絡中,具有出色的學習效率。因此,基于節點序空間的評分搜索算法是當前BNSL算法的前沿方向[2732]。

近年來,基于節點序空間的評分搜索算法得到眾多國內外學者的關注,許多算法也隨之應運而生。Teyssier 等[21]首次提出脫離傳統的DAG空間、在節點序空間搜索的定向搜索(orderingbasedsearch,OBS)算法。該算法在節點序的交換鄰域內使用爬山搜索策略。交換算子盡管簡單高效,卻對搜索鄰域有所限制,存在評分低的弱點。Scanagatta等[22]提出的ASOBS (acyclicselectiveOBS)算法放松節點序的一致性準則,只要不引入有向環,就允許引入節點間的有向邊。Lee等[23]提出的插入算子和Scanagatta等[24]提出的窗口算子,試圖進一步擴大搜索鄰域,但是漫無目的地搜索遍歷具有隨機性,產生大量的計算浪費問題。王海羽等[25]提出基于節點塊序列的NCSC (nodechunksequenceconstraints)的BN 構建算法構建評分定向支撐樹結構,得到節點塊序列,通過K2 算法確定網絡結構后完成非法結構修正。Wang 等[32]提出的PSCOBS (priorityinascorecacheOBS)算法通過基于評分緩存的直接插入算子,逐個遍歷搜索固定深度的候選父集合,耗時長且缺少優化機制。

基于節點序空間的評分搜索算法通常使用ILS方法,雖已在評分和時間方面取得卓越成效,但仍存在局部最優和收斂緩慢等問題。產生這些問題的主要原因有:

(1)局部搜索策略采用遍歷插入的方式,搜索半徑小,調整節點少。搜索算子的隨機性和盲目性,將限制局部搜索鄰域,容易使算法陷入局部最優解,且造成大量的計算浪費。

(2)迭代重啟策略通常采用隨機擾動,擾動程度將直接影響跳出局部最優的效果。該策略不能保證搜索進度被不斷推進,且過度擾動有時會產生負面效果,獲得質量更差的解,無法優化當前解。

針對以上問題,本文的主要貢獻如下:

(1)受評分緩存的無損刪減特性啟發,提出一種基于評分緩存(guidedbyscorecache,GBSC)的OBS算法(以下簡稱GBSC算法),采取定向優先搜索策略和次優解的容忍策略,在評分緩存指引下,有效避免搜索的盲目性,使節點序向更高質量的方向更新收斂。基于評分緩存的優先級順序,選擇性地插入候選父集合,通過自適應的局部搜索深度參數,搜索其縱向插入鄰域,獲得評分最高的候選節點序。

(2)受DAG空間、等價類空間與節點序空間相通的啟發,提出一種基于等價類深度優先(depth-firstandequivalentclass,DFEC)的重啟算法,采取轉換搜索空間策略。結合DAG空間、等價類空間與節點序空間的三重優勢,確保局部最優節點序都能得以優化提升。將所得局部最優節點序對應的網絡結構轉化為其等價結構,再使用深度優先搜索遍歷該等價結構,得到新的節點序,并以此為始,重新迭代搜索。

(3)以GBSC 算法為局部搜索過程,使用軟啟動下的DFEC算法,得到兩者結合的ILS算法GBSC-DFEC (簡稱GB-DF),進一步優化評分結果和加快收斂速度。

在運行時間方面,表中算法運行時間小于0.1s,均記為0。OBS算法的運行時間均值最小,這是由于OBS算法操作簡單,復雜性小。對于小規模的Asia網絡,少量的局部操作就可以尋得最優節點序,因此所有算法的運行時間均為0。而對于中、大、特大規模網絡,GBSC 算法的運行時間均值僅次于OBS 算法和INOBS 算法,這是由于OBS、INOBS和WINOBS算法的搜索算子通過規律性地遍歷搜索鄰域,在評估候選節點序時,可以避免部分節點的多次家庭評分計算,節省大量的時間開銷。在樣本大小不同時,與同為插入多個節點的WINOBS 算法相比,GBSC 算法的運行時間均值分別最多縮短88.1%、77.1%、79.8%,分別最少縮短27.0%、24.1%、36.9%。與評分優勢相媲美的PSCOBS算法相比,GBSC算法的運行時間均值分別最多縮短41.3%、34.9%、29.5%,分別最少縮短0.9%、4.4%、1.7%。隨著節點數目增加,網絡規模越大,GBSC 算法運行時間改善越顯著。因此,GBSC 算法具有明顯的時間優勢,大大降低了搜索過程的時間復雜度。

本文從綜合評分和時間兩個方面,說明了GBSC 算法在明顯改善搜索速度的同時,小幅提高了評分結果,可以在更短時間內找到評分更高的節點序。這驗證了該算法的可行性和高效性,提供了解決評估候選節點序搜索成本高和搜索算子盲目性強的問題的新方向。

3.5迭代算法的結果分析

圖7~圖9分別給出3 種樣本大小下現有迭代算法與DFEC算法隨迭代次數變化的BIC 評分均值曲線及其標準差。分析4種算法的BIC評分變化趨勢可知,在整個迭代過程中,DFEC 算法的評分曲線均位于IOBS、IASOBS 和ESTOBS算法曲線的上方,這說明DFEC 算法收斂穩定性強,而且優勢明顯。在樣本大小不同的所有網絡中,DFEC算法在1~10次迭代過程中,評分增長迅速,而在10~100次迭代過程中,評分僅在小范圍內提高,處于穩定狀態。IASOBS算法最少需要20次迭代才可達到穩定狀態,而多數情況為在1~50次迭代過程中評分緩慢提高,最終收斂到穩定狀態。對于3 種樣本大小下的中/小規模網絡,IASOBS和ESTOBS 算法的評分變化趨勢相近,而隨著節點數目增加,ESTOBS 算法變得難以收斂,明顯差于IASOBS算法。IOBS算法則是在1~100次迭代過程中評分不斷攀升,難以收斂。隨著網絡規模增大,IOBC算法的收斂速度減小。在不同樣本大小下,DFEC算法前10次迭代的評分均值增量最多分別為IASOBS算法的1.7、1.5、1.4倍,最少分別為1.4、1.3、1.4 倍。DFEC 算法進一步跳出局部最優,促使局部搜索過程快速收斂,趨于評分更高的穩定狀態。

分析4種算法的最終BIC 評分及標準差可知,DFEC算法評分曲線的終值明顯優于其他3 種算法。在多數中/小規模網絡中,IASOBS 和ESTOBS 算法評分曲線的終值相交,具有相近的評分結果。而在多數大規模網絡中,IASOBS算法評分結果明顯優于ESTOBS 算法。除Child網絡外,IASOBS算法的評分曲線均高于IOBS 算法,這說明IASOBS算法采用ASOBS算法優化局部搜索結果,在一定程度跳出局部最優,評分結果優于IOBS算法。在樣本大小不同時,與IASOBS算法相比,DFEC 算法學到最優節點序與初始節點序的評分均值增量分別最多提高20.1%、20.1%、16.2%,分別最少提高9.9%、11.0%、12.5%。隨著網絡規模增大,DFEC 算法的評分優勢尤為明顯。尤其對于Win95pts、Pathfinder和Andes網絡,DFEC 算法最終評分優勢格外明顯。DFEC 算法采用等價類轉換策略和DFS 法優化局部搜索結果,使得最終評分結果均高于IOBS、IASOBS和ESTOBS算法,且魯棒性強,對于初始節點序的依賴性低。對于Asia網絡,4 種算法評分的標準差最大,這是由于該網絡規模小,節點數目少,隨機生成的初始節點序以極大概率與真實網絡一致。隨著網絡規模增加,整體標準差減小。

本文從綜合收斂速度和最終評分兩個方面,驗證了DFEC算法在較少迭代次數內,可尋得更高評分的節點序,收斂速度更快,明顯優于現有的迭代重啟算法,提供了解決推動局部搜索進度難的問題的新方向。

3.6迭代局部搜索算法的結果分析

表4和表5列出了3種樣本大小和9個基準網絡下7種算法的BIC評分均值、標準差。根據加粗數據可以直觀地看出,在22種類型數據集下,GB-DF 算法取得更高的評分均值,具有明顯的評分優勢。在樣本大小不同時,與最著名的近似學習算法PC-Stable、GFCI、MMHC 相比,GB-DF 算法均有更高的評分均值和更低的標準差,評分均值分別最多提高43.2%、50.1%、52.7%。在樣本大小不同時,與現有主流的近似學習算法SaiyanH、FGES、MAHC 相比,在大多數類型數據集下,GB-DF算法均有更高的評分均值和更低的標準差,評分均值分別最多提高12.1%、12.0%、12.8%。雖然GB-DF 算法在3種樣本的Andes網絡中評分均值比MAHC算法分別低169.3、5529.7、18297.2,但是整體的評分優勢依然明顯。表4 和表5 中,“'”表示GB-DF 算法的評分結果與該算法相比具有顯著改善;NA 表示該算法在相同類型數據集下有大于10組實例無法輸出結果。

對于Andes網絡,SaiyanH 算法復雜度高導致內存不足,無法完成尋優。與之不同的是,對于大規模的網絡,GB-DF算法總是可以高效地給出最優解,克服內存不足的問題。從統計測試的角度分析,GB-DF算法與現有的6 種結構學習算法相比,分別在27、24、27、14、24 和17種類型數據集中評分顯著改善,評分明顯提高的比例達到了至少58.3% 。這說明GB-DF 算法具有超強的學習效率,不易受樣本數據集的影響,具有極強的魯棒性和評分優勢。

表6列出3種樣本大小和9 個基準網絡下7 種算法的TPR 均值和標準差。根據加粗數據可以直觀地看出,GB-DF算法在中/小規模網絡和樣本量較少情況下,TPR指標具有一定的優勢,可以較好地找到真實網絡中存在的有向邊。在樣本大小不同時,GB-DF算法分別在其中6、7和5個網絡中取得最高的TPR 均值,說明GB-DF 算法學到的網絡結構的精度極高,學到的有向邊與真實網絡的匹配度最優。與基于評分搜索的方法MAHC 相比,在樣本大小不同時,GB-DF 算法除Win95pts、Andes網絡外大多具有更優的TPR 均值。尤其在Child、Insurance、Pathfinder網絡中,GB-DF算法更是優于基于依賴分析的方法和混合方法。TPR 值高,表示真實網絡的有向邊被學到的比例大,與真實網絡的結構匹配程度更優。

表7列出3種樣本大小和9個基準網絡下7種算法的犉1分數均值和標準差。根據加粗數據可以直觀地看出,GB-DF算法在中/小規模網絡下,犉1分數具有一定的優勢。在樣本量大小為1000和5000時,GB-DF算法在其中6個網絡中取得最高的犉1 分數均值,說明GB-DF 算法學到的網絡結構的精度極高,與真實網絡的擬合程度最高。在樣本量大小為10000時,GB-DF算法在其中4個網絡中取得最高的犉1分數均值,雖然沒有明顯的絕對優勢,但與6 種對比算法相比,保持了中等偏上的水平。與現有主流的SaiyanH、FGES、MAHC 算法相比,分別在20、22、19 種類型數據集中,GBDF算法的犉1分數均值更高,分別最多提高了57.0%、134.8%、31.8%,最少提高了0.9%、1.0%、1.2%。這是由于基于評分搜索的方法以評分作為唯一評價指標,追求的是與數據的擬合程度。與基于評分搜索的方法不同,基于依賴分析的方法以結構差異性作為主要評價指標,更側重于與真實網絡的差異性。這類算法通過條件獨立性測試確定出節點之間是否存在邊,從而構建出學到的網絡結構。同樣地,大多數混合學習方法也采用條件獨立性測試確定出初始網絡的骨架。但是,在實驗中采樣生成的數據集并不能完全反映真實網絡的情況,實際生活中的數據集大多都沒有公認的基準網絡,更需要從數據中挖掘出變量之間潛在的相關性。因此,與基于依賴分析的方法和混合方法相比,大多數基于評分搜索的方法在圖精度指標上效果較差,評分結果更優。

總體而言,GB-DF 算法在大多數數據集中具有更高的BIC評分,在樣本量少或中/小規模網絡中具有更優的圖精度結果。同時,在大規模網絡中,GB-DF 算法可以有效地給出最優解,解決了從數據中學習大規模BN 的實際難題。

4結束語

針對盲目搜索造成計算浪費和評分低的問題,本文采取定向優先搜索策略和次優解的容忍策略,提出GBSC算法。通過一種選擇插入算子,在評分優先級指引下,通過自適應的局部搜索深度,搜索縱向插入鄰域,確保局部搜索朝著質量更高的最優節點序前進。針對搜索陷入局部最優和收斂速度慢的問題,本文采取轉換搜索空間策略,提出基于等價類深度優先的迭代算法DFEC。結合BN 特有的結構等價性,將搜索到的局部最優結構轉化為其等價結構,通過DFS法遍歷為新的節點序,重新迭代搜索,累積每次搜索的進度,加快收斂速度,提高學習效率。實驗結果表明,GBSC算法在小幅提高評分的基礎上,搜索速度明顯改善。DFEC迭代算法在顯著提高評分的基礎上,收斂速度加快。與現有主流的結構學習算法相比,結合兩者的GB-DF 算法具有明顯的評分優勢。

雖然本文的算法已經具有出色的學習效率,但是仍然存在待改進的問題:本文隨機選取初始節點序,未加以優化設定;本文的圖精度優勢并不明顯,如何進一步改善基于評分搜索方法的圖精度結果,將是未來主要的兩個研究方向。

作者簡介

高曉光(1957—),女,教授,博士,主要研究方向為貝葉斯網絡學習、航空火力控制與作戰效能。

閆栩辰(1999—),女,碩士研究生,主要研究方向為貝葉斯網絡結構學習。

王紫東(1997—),男,博士研究生,主要研究方向為貝葉斯網絡結構學習、因果發現。

劉曉寒(1997—),男,博士研究生,主要研究方向為貝葉斯網絡結構學習。

馮奇(1999—),男,碩士研究生,主要研究方向為時空數據建模。

主站蜘蛛池模板: 成年人视频一区二区| 毛片网站在线看| 日本久久免费| 国产熟睡乱子伦视频网站| 美女国内精品自产拍在线播放| 亚洲视频无码| 国产精欧美一区二区三区| 色哟哟国产精品一区二区| 亚洲女同欧美在线| 国产噜噜噜| 69视频国产| 新SSS无码手机在线观看| 先锋资源久久| 国产网站一区二区三区| 国产精品免费露脸视频| 欧美日韩动态图| 亚洲精品动漫| 国产成人精品免费视频大全五级 | 99久久精品免费看国产免费软件| 成人伊人色一区二区三区| 成人国产免费| 丁香五月激情图片| 久久国产高潮流白浆免费观看| 亚洲日本中文字幕天堂网| 国产一级妓女av网站| 久久国产精品电影| 精品精品国产高清A毛片| 国产高清不卡视频| 欧美综合在线观看| 精品色综合| 国产91小视频在线观看| 欧美a级完整在线观看| 欧美高清国产| 高清色本在线www| 99久久国产综合精品2023| 成人免费网站久久久| 亚洲第一极品精品无码| 99国产精品一区二区| 噜噜噜久久| 亚洲中文制服丝袜欧美精品| 亚洲不卡影院| 女高中生自慰污污网站| 中文字幕在线观| 午夜视频免费一区二区在线看| 国产精品漂亮美女在线观看| 久久国产成人精品国产成人亚洲| 国产主播在线一区| 日韩无码视频播放| 青草视频免费在线观看| 一本二本三本不卡无码| 福利小视频在线播放| 久久久久无码国产精品不卡| 亚洲天堂精品在线| 男人天堂亚洲天堂| 国产成人无码AV在线播放动漫 | 中文字幕不卡免费高清视频| 亚洲va视频| 中文毛片无遮挡播放免费| 91 九色视频丝袜| 亚洲日本一本dvd高清| 国产玖玖视频| 热伊人99re久久精品最新地| 国产超碰一区二区三区| 亚洲自拍另类| 欧美一区二区三区香蕉视| 91国内在线观看| 亚洲欧洲日产无码AV| 国产又粗又爽视频| 久久成人18免费| 免费人成在线观看成人片| 色噜噜在线观看| 天天综合网站| www成人国产在线观看网站| 无码AV高清毛片中国一级毛片| 国产成人高清亚洲一区久久| 为你提供最新久久精品久久综合| a欧美在线| 欧美成人日韩| 久久毛片免费基地| 超碰aⅴ人人做人人爽欧美 | 日韩在线网址| 欧美日韩在线国产|