沈文旭,張繼軍,毛 重
(空軍航空大學 教研保障中心,長春 130022)
由于用于模型訓練的樣本數量越多、質量越高,模型的性能越強,因此多個數據擁有方希望共同訓練模型的需求日趨強烈.在這種需求下,由于訓練的樣本來自多個數據擁有者,因此數據的隱私保護問題至關重要[1].如何在多個數據方間安全、可靠、高效地開展機器學習建模任務,已逐漸成為該領域的研究熱點[2-3].目前,該類研究統稱為隱私保護機器學習(privacy-preserving machine learning,PPML).
邏輯回歸是目前常用的一種機器學習算法,常用于醫(yī)療輔助診斷和金融分析等領域.當多個數據方想共同訓練一個邏輯回歸模型時,可借助安全多方計算(secure multi-party computation,MPC)[4-5]的相關技術完成聯合建模工作.安全多方計算能保證輸入隱私性與計算的正確性,是用于聯合建模的一種潛在技術.近年來,由于混淆電路(garbled circuits,GC)與不經意傳輸(oblivious transfer,OT)的快速發(fā)展,使得在實際問題中應用安全多方計算成為可能.
基于MPC的安全推理框架可在保證模型參數與客戶輸入數據隱私性的前提下,客戶獲得模型的預測結果.在該類框架中,服務器與客戶端之間運行安全多方計算的相關協議,完成模型的預測過程.CryptoNets[6]是一種基于同態(tài)加密(homomorphic encryption,HE)的隱私保護方案,其使用平方函數近似ReLU和Sigmoid函數,影響了模型的準確性.GAZELLE[7]優(yōu)化了同態(tài)計算,并使用加法同態(tài)加密完成部分計算.Delphi[8]設置了一個預處理階段,在該階段集中進行GAZELLE中繁重的同態(tài)加密計算.CrypTFlow2[9]使用不經意傳輸實現比較運算,解決了已……