馬從鋰 黃飛虎 弋沛玉 王琳娜 彭艦



摘 要: 因果關系發現是因果推斷的重要部分,其目標是揭示數據內在的生成機制,并以有向無環圖的形式表示. 然而關于因果關系發現,現有方法很少考慮到觀察數據存在缺失值的情況. 在實際場景中,大量數據集存在缺失值,因此估計缺失數據集中的因果關系成為一個亟需解決的問題. 本文提出了一種新的基于因果反饋的算法實現關于缺失數據集的因果關系發現,其中生成對抗網絡被用于估計缺失數據集的分布,并利用基于Actor-Critic 的因果關系發現模塊搜索最優因果圖,設計了一個基于擴展貝葉斯信息準則的自定義獎勵函數,引入分類誤差引導模型加速探索過程,提升模型穩定性. 在模擬數據和真實數據上進行的大量實驗結果表明,本文提出的方法在不同數據缺失率下優于現有方法.
關鍵詞: 深度學習; 缺失數據補全; 因果關系發現; 有向無環圖
中圖分類號: TP183 文獻標志碼: A DOI: 10. 19907/j. 0490-6756. 2024. 022002
1 引言
因果推斷被用來揭示事物的內在生成機制、發現事物的運行規律,在統計學、醫學、經濟學、法學等眾多領域中都有應用[1]. 因果關系發現是因果推斷領域非常重要的分支,旨在從數據中推導出一個因果關系模型,以揭示數據的內在生成機制[2].