劉少杰,文斌?,王澤旭
(1.海南師范大學數據科學與智慧教育教育部重點實驗室,海南 海口 571158;2.海南師范大學信息科學技術學院,海南 ???571158;3.中山大學軟件工程學院,廣東 珠海 519082)
數據保護的約束使得數據被限制在不同企業和組織之間,形成了眾多“數據孤島”,難以發揮其蘊含的重要價值,而傳統的數據交易方式往往存在數據所有權混亂以及缺乏透明性等問題[1]。聯邦學習(FL)的模型訓練機制有效地實現了“數據不出門,可用不可見”,在打破“數據孤島”的同時滿足了數據隱私和安全性規約[2],使得數據被合規交易和共享成為可能。聯邦學習對未來人工智能等技術的發展和數據安全保護有著重要的推動作用,但缺乏獎勵分配機制、存在惡意攻擊、網絡通信開銷大等問題對聯邦學習應用于數據交易場景有著顯著的影響[3]。因此,對聯邦學習框架的設計和完善成為學術界和工業界亟待解決的熱點問題,其研究需求也應運而生。
當聯邦學習實際應用在數據交易場景中時,需要模型聚合服務端與各個數據供給方訓練端間進行不間斷的模型權重數據同步,這帶來了巨大的通信開銷[4-6],并隨著數據供給方的數量和迭代次數增加而陡增,不適用于多方參與的復雜數據交易場景。此外,聯邦學習中缺少用于數據供給方貢獻度評估的方法,存在各方利益分配策略不明確、缺少有效的激勵機制的問題[7-8]。同時,利益分配數據依賴中心化的存儲或任務需求的發布者,缺少透明性和可信性,從而降低了參與方的積極性[9]。……