摘要:提出了一個從同構數據集中學習貝葉斯網絡結構的分布式算法。該算法首先使用搜索評分的方法學習每個局部貝葉斯網絡結構,然后取節點對互信息變量和條件互信息變量的數學期望作為全局學習的評價標準,融合所有局部結構得到全局結構。由于只使用了數據集中變量間的互信息和條件互信息,沒有直接獲取局部個體數據信息,從而可以實現有效的隱私保護。該算法在Alarm數據集上進行測試,邊的誤差率小于6%,運行時間比集中學習的算法的運行時間短,驗證了算法的有效性。
關鍵詞:分布式數據挖掘;隱私保護;模型融合;貝葉斯網絡;互信息
中圖分類號:TP3016文獻標志碼:A
文章編號:1001-3695(2010)01-0060-04
doi:10.3969/j.issn.10013695.2010.01.017