劉少杰,文斌?,王澤旭
(1.海南師范大學(xué)數(shù)據(jù)科學(xué)與智慧教育教育部重點(diǎn)實(shí)驗(yàn)室,海南 海口 571158;2.海南師范大學(xué)信息科學(xué)技術(shù)學(xué)院,海南 ???571158;3.中山大學(xué)軟件工程學(xué)院,廣東 珠海 519082)
數(shù)據(jù)保護(hù)的約束使得數(shù)據(jù)被限制在不同企業(yè)和組織之間,形成了眾多“數(shù)據(jù)孤島”,難以發(fā)揮其蘊(yùn)含的重要價值,而傳統(tǒng)的數(shù)據(jù)交易方式往往存在數(shù)據(jù)所有權(quán)混亂以及缺乏透明性等問題[1]。聯(lián)邦學(xué)習(xí)(FL)的模型訓(xùn)練機(jī)制有效地實(shí)現(xiàn)了“數(shù)據(jù)不出門,可用不可見”,在打破“數(shù)據(jù)孤島”的同時滿足了數(shù)據(jù)隱私和安全性規(guī)約[2],使得數(shù)據(jù)被合規(guī)交易和共享成為可能。聯(lián)邦學(xué)習(xí)對未來人工智能等技術(shù)的發(fā)展和數(shù)據(jù)安全保護(hù)有著重要的推動作用,但缺乏獎勵分配機(jī)制、存在惡意攻擊、網(wǎng)絡(luò)通信開銷大等問題對聯(lián)邦學(xué)習(xí)應(yīng)用于數(shù)據(jù)交易場景有著顯著的影響[3]。因此,對聯(lián)邦學(xué)習(xí)框架的設(shè)計和完善成為學(xué)術(shù)界和工業(yè)界亟待解決的熱點(diǎn)問題,其研究需求也應(yīng)運(yùn)而生。
當(dāng)聯(lián)邦學(xué)習(xí)實(shí)際應(yīng)用在數(shù)據(jù)交易場景中時,需要模型聚合服務(wù)端與各個數(shù)據(jù)供給方訓(xùn)練端間進(jìn)行不間斷的模型權(quán)重數(shù)據(jù)同步,這帶來了巨大的通信開銷[4-6],并隨著數(shù)據(jù)供給方的數(shù)量和迭代次數(shù)增加而陡增,不適用于多方參與的復(fù)雜數(shù)據(jù)交易場景。此外,聯(lián)邦學(xué)習(xí)中缺少用于數(shù)據(jù)供給方貢獻(xiàn)度評估的方法,存在各方利益分配策略不明確、缺少有效的激勵機(jī)制的問題[7-8]。同時,利益分配數(shù)據(jù)依賴中心化的存儲或任務(wù)需求的發(fā)布者,缺少透明性和可信性,從而降低了參與方的積極性[9]?!?br>