對抗訓練驅動的惡意代碼檢測增強方法

2022-10-09 12:48:46劉延華李嘉琪歐振貴高曉玲劉西蒙MENGWeizhi劉寶旭

通信學報 2022年9期

劉延華，李嘉琪，歐振貴，高曉玲，劉西蒙，MENG Weizhi，劉寶旭

（1.福州大學計算機與大數據學院，福建福州 350108；2.福建省網絡計算與智能信息處理重點實驗室，福建福州 350108；3.丹麥科技大學應用數學和計算機系，哥本哈根 2800；4.中國科學院信息工程研究所，北京 100093）

0 引言

根據我國互聯網網絡安全監測數據分析報告，在2021 年上半年，我國境內感染計算機惡意程序的主機約有446 萬臺，同比增長46.8%，發現新增移動互聯網惡意程序86.6 萬余個。隨著惡意代碼及其變種數量的增加，惡意代碼檢測面臨著巨大的挑戰[1]。基于特征碼的檢測技術無法應對新型惡意代碼，以人工分析為主要方式的檢測技術存在檢測效率低等明顯問題，無法適應當前的網絡安全環境，自動化和智能化的惡意代碼檢測具有一定的必要性。

在智能化惡意代碼檢測中，相關特征（如任務、意圖、應用編程接口調用、系統調用以及字節特征等）被提前提取并用于惡意代碼檢測器的訓練，取得了較好的結果[2-3]。然而，機器學習本身存在一些安全性問題[4]。機器學習模型的有效性取決于訓練數據和測試數據遵循相同分布的假設，這種假設很可能遭到攻擊者的破壞，損害模型的安全性。攻擊者在輸入樣本上施加微小的擾動便能迫使分類模型輸出錯誤的預測，這種方式稱為對抗樣本攻擊[5]。在惡意代碼領域，攻擊者利用模型的不足，生成惡意代碼樣本，達到繞過惡意代碼檢測器的目的[6-7]。

隨著惡意代碼反檢測能力的提高，增強惡意代碼檢測器識別對抗樣本的能力，提高檢測器的穩健性，是現階段提升惡意代碼檢測水平的關鍵。防御蒸餾[8]、對抗訓練[9]和對抗樣本拒絕[10]等是常見的對抗樣本防御措施。其中，對抗訓練被認為是抵抗對抗攻擊的最佳解決方案，它利用訓練好的模型來生成對抗樣本，然后將它們添加到訓練集中以重新訓練模型，從根本上增強目標分類器的穩健性[11]。Wang 和Liu 等[12]通過對抗訓練方法提升面向惡意軟件C2 流量的檢測能力。Wang 和Zhang 等[13]提出了一個用于生成對抗樣本進行對抗訓練的框架，通過重訓練提高分類器在安卓惡意軟件檢測和家庭分類中的有效性。這些研究證明了對抗訓練增強惡意代碼檢測器的可行性。

在惡意代碼檢測器對抗訓練的過程中，對抗樣本的生成是一個重要環節。如何利用對抗樣本知識，以較小攻擊成本和較高攻擊成功率生成具有現實意義的惡意代碼對抗樣本是惡意代碼領域的一個重要問題。Goodfellow 等[14]提出的生成對抗網絡（GAN,generative adversarial network）在樣本生成上具有一定的優勢。GAN 由生成器和判別器構成，通過生成器和判別器之間的博弈，生成器將學習到數據的潛在規律并生成新的數據。Kim 等[15]利用GAN 生成基于灰度圖像的惡意代碼樣本。之后，Kim 等[16]在文獻[15]的基礎上利用深度卷積GAN 模型生成惡意代碼樣本，并基于圖像結構相似性模擬零日惡意代碼的生成。文獻[17]利用輔助分類生成對抗網絡生成惡意代碼灰度圖像，但沒有考慮生成器生成的惡意代碼質量。由于惡意代碼的相鄰字節之間存在結構上的相互依賴關系，對于惡意代碼文件的任何更改都可能破壞可執行文件的功能，影響惡意代碼的惡意功能[18]。惡意代碼對抗樣本與對抗性圖像不同，即使成功地欺騙了檢測模型，這些對抗樣本在現實世界中也是不可行的。

在惡意代碼的執行性問題上，Hu 等[19]提出了一種基于GAN 的惡意軟件生成算法，通過引入一個替代檢測器，對惡意代碼檢測器實現黑盒攻擊，并通過在導入表中添加擾動應用程序接口（API,application programming interface）實現惡意代碼對抗樣本的生成。但是，基于原始GAN 模型的惡意代碼生成，容易面臨梯度消失以及訓練不穩定等問題[20]。而且該研究在對抗生成的過程中并未考慮到攻擊成本的問題。唐川等[21]提出了一種基于最小修改成本的對抗樣本生成算法，利用深度卷積GAN 模型生成良性擾動，通過修改反編譯文件并對安卓應用程序包（APK,Android application package）進行重打包，生成可執行的惡意軟件對抗樣本，成功繞過目標檢測器的檢測。但是該方法只考慮到了惡意代碼特征的修改成本，未考慮到對抗樣本生成過程中惡意代碼檢測器的查詢次數。由于檢測器的多次重復查詢，容易引起安全人員的察覺，攻擊者在對檢測器進行攻擊時，需要考慮到目標檢測器查詢效率問題。

針對上述問題，本文提出了一種對抗訓練驅動的惡意代碼檢測增強方法。首先，基于沃瑟斯坦生成對抗網絡[22]（WGAN,Wasserstein generative adversarial network）和擾動刪減方法，生成低擾動數量、高查詢效率的惡意代碼對抗樣本。然后，利用生成的對抗樣本對目標檢測器進行再訓練，增強惡意代碼檢測器性能。本文的主要研究工作包含以下幾個方面。

1) 提出一種基于WGAN 的良性樣本生成算法，構建面向API 調用的良性樣本庫。利用WGAN在一定程度上解決原始GAN 訓練不穩定的問題。通過生成器和判別器之間的博弈訓練，模擬良性樣本的分布，構建良性樣本庫，進而為惡意代碼對抗提供更加豐富的擾動組合。

2) 提出一種基于對數回溯法的擾動刪減算法，構造惡意代碼對抗樣本。將生成的良性樣本以擾動的形式添加到惡意代碼，利用對數回溯法對添加的擾動進行刪減，以較少的擾動數量和目標檢測器查詢次數繞過惡意代碼檢測器。

3) 基于對抗訓練對目標檢測器進行增強。利用生成的惡意代碼對抗樣本對惡意代碼檢測器進行重訓練，提高惡意代碼檢測器對于對抗樣本的檢測率。最后，選取不同的惡意代碼檢測器進行實驗，驗證了本文方法的有效性和通用性。

1 相關理論

1.1 WGAN

WGAN 是GAN 的一種變體，不同于GAN 使用具有突變性的詹森香農散度作為生成數據與真實數據間的距離衡量標準，WGAN 引入沃瑟斯坦距離作為損失函數，能夠對GAN 模型梯度消失以及訓練不穩定問題進行優化。沃瑟斯坦距離更加平滑，即使2 個分布互不重疊，也能夠很好地反映二者的遠近。沃瑟斯坦距離的計算方法如式(1)所示。

其中，Pr和Pg分別表示真實樣本的分布和生成器生成樣本的分布，K表示利普希茨常數。||f||L≤K等價于若f的定義域為實數集合，則||f||L≤K表示f的導函數絕對值不超過K。

將判別器表示為函數f，設定一個固定常數c（c〉0），以c的絕對值截斷判別器的參數ω，限制判別器的最大局部變動幅度，使其滿足在判別器和生成器雙方的博弈中，判別器的目標是盡可能正確地區分真實樣本與生成器生成的假樣本，即最大化沃瑟斯坦距離。相反地，生成器的目標是最小化沃瑟斯坦距離，盡可能輸出與真實樣本相似的樣本以欺騙判別器。判別器的損失函數、生成器的損失函數以及WGAN 的目標函數分別如式(2)～式(4)所示。

其中，G和D分別表示生成模型和判別模型，θ表示生成器的參數，ω表示判別器的參數。Pr、Pg和Pz分別表示真實樣本分布、生成器生成樣本分布和隨機噪聲分布。

WGAN 的訓練是一個零和博弈的過程，生成器和判別器通過交替迭代訓練，最終達到納什均衡。訓練判別器時，固定生成器的參數，將生成器生成的樣本和真實樣本作為判別器的輸入，根據損失函數LD，更新判別器的參數并將梯度反向傳播給生成器。每次判別器參數ω更新后將其按固定常數c的絕對值截斷，將判別器的參數限制在固定范圍內，即ω∈[-c,c]。訓練生成器時，固定判別器的參數，輸入一批隨機噪聲向量，然后輸出虛擬數據，由判別器對生成的虛擬數據進行評估，根據損失函數LG更新參數和反傳梯度。

1.2 API 調用特征表示

本文主要研究面向API 調用的惡意代碼檢測，通過獲取應用程序的API 調用特征判斷應用程序是否具有盜取隱私信息、惡意刪除文件等惡意行為。定義一個應用程序API 特征集合S={s1,s2,…,sn}。將應用程序的API 調用特征映射為一個二值特征向量，若該應用程序包含API 調用si，則對應位置的特征向量元素值為1；若該應用程序未調用sj，則對應位置的特征向量元素值為0。

2 模型構建

為了增強惡意代碼檢測模型的穩健性和對抗樣本識別能力，本文提出了對抗訓練驅動的惡意代碼檢測增強方法。模型框架如圖1 所示，主要由數據預處理、良性樣本庫構建、對抗樣本生成和對抗訓練組成。

圖1 對抗訓練驅動的惡意代碼檢測增強模型框架

2.1 數據預處理

首先，使用反匯編工具對應用程序進行反編譯，獲取應用程序的API 調用特征。由于總體API數量較多，使用從惡意樣本數據中提取的API 調用構建特征。同時，參考安卓開發者官網提供的API包索引名對提取的API 調用特征進行過濾。最后，采用卡方檢驗法降低特征維度，為每一個應用程序樣本生成二值特征向量。

2.2 良性樣本庫的構建

WGAN 模型在一定程度上能夠解決GAN 訓練不穩定和模式崩潰導致生成數據多樣性不足的問題。在構建良性樣本庫的過程中，基于WGAN 模型學習真實良性樣本的特征分布，在滿足真實樣本分布的前提下，實現在真實良性樣本基礎上細微的變化，在一定程度上模擬良性樣本的變種生成，進而提供更加豐富的擾動組合。

為了區分不同模塊生成的樣本，本文定義了不同的樣本名稱，具體描述如表1 所示。

表1 各模塊生成樣本的詳細描述

在模型的結構設計方面，使用多層全連接網絡構建WGAN 生成模型和判別模型，網絡結構分別如圖2 和圖3 所示。

圖2 生成模型的網絡結構

圖3 判別模型的網絡結構

生成模型由一個輸入層、2 個隱藏層和一個輸出層組成。輸入層的輸入向量為服從標準正態分布的隨機噪聲向量。隱藏層使用非線性函數ReLU 作為激活函數，能夠減少計算量和降低過擬合。輸出層使用的激活函數為Sigmoid。

判別模型由一個輸入層、2 個隱藏層和一個輸出層組成。輸入層的輸入來自真實樣本。不同于生成模型使用的激活函數為ReLU，判別模型的隱藏層使用的激活函數為LeakyReLU。并且，在每個隱藏層后各添加一個Dropout 層，防止模型過擬合。

2.3 對抗樣本生成和對抗訓練

本文采用模擬對抗樣本攻擊的方式，通過對惡意代碼添加擾動生成對抗樣本，達到繞過目標檢測器檢測的目的。其中，攻擊者的能力設定為攻擊者掌握了目標檢測器所使用的算法和特征集合，但是無法獲取檢測器的訓練數據；攻擊者通過增加API調用的方式修改惡意軟件；攻擊者只能查詢目標檢測器預測的類別。

由于惡意代碼的特殊性，直接從原始惡意代碼中刪除一個特征可能會導致惡意功能消失，甚至程序崩潰。為了保留惡意代碼的原始功能，只對原始樣本添加API 調用，不刪除或修改原本存在的特征。對抗樣本的生成流程如圖4 所示。

圖4 惡意代碼對抗樣本生成流程

首先，將良性樣本庫中的樣本以擾動的形式添加進惡意樣本中，以躲避惡意代碼檢測器的檢測。擾動方式如式(5)所示。

其中，X為原始惡意樣本，B(i)為良性樣本庫中的第i個樣本，X'(i) 為對應的添加擾動后的擾動樣本，n為良性樣本庫的規模。max(·) 代表2 個特征向量間逐元素的或運算，若X的某一元素值為1，則X'(i)對應位置的元素值也為1，即保留惡意樣本中的原始API 調用；若X的某一元素值為0，而B(i)對應位置的元素值為1，則X'(i) 對應位置的元素值也為1，即添加良性擾動。

其次，為了更加真實地模擬惡意代碼制作者的攻擊思路，本文從攻擊者的角度出發，使用對數回溯法進行擾動刪減，實現以較少的查詢次數和較少的擾動數量生成惡意代碼對抗樣本。

最后，通過將生成的惡意代碼對抗樣本標注為惡意，擴充惡意代碼檢測器訓練數據，完成檢測器再訓練，達到增強惡意代碼檢測器的目的。

3 基于WGAN 的良性樣本生成算法

本文提出基于WGAN 的良性樣本生成算法，WGAN 模型通過生成器和判別器之間的博弈訓練，生成近似真實良性樣本的數據。良性樣本生成過程如算法1 所示。

首先，通過選擇生成器生成的數據和真實樣本來訓練判別器，更新判別器的參數。然后，利用生成器生成的數據欺騙判別器，將判別器的判斷結果反饋給生成器，并更新生成器的參數。通過生成器和判別器之間的博弈訓練，生成器可以生成更真實的樣本。

總之，在以后的工作中，輔導員老師不僅要加強對學生的心理關注，安全意識的灌輸與教育，更要加強對重大事件危機應對措施的正確引導，使學生能夠正確處理好自己的極端情緒，提升自身理性思考能力和調試能力，客觀、正確地面對困難，解決困難！

由于樣本數據是由0 和1 構成的二進制特征向量，而生成樣本的數值介于0～1，需要對生成器的輸出進行二值化處理。二值化處理如式(6)所示。

其中，oi為生成網絡的輸出向量的第i個特征值，bi為對應特征二值化結果。算法2 展示了二值化處理的過程。

運用算法1 和算法2，能夠生成近似良性樣本的生成樣本，構建良性樣本庫，為惡意樣本提供良性擾動。

4 基于對數回溯法的擾動刪減算法

由于攻擊者在攻擊的過程中需要對檢測器的結果進行查詢，以判斷攻擊的有效性。減少查詢目標檢測器的次數可以防止被目標檢測器發現其攻擊行為而拒絕提供服務。攻擊者在制作對抗樣本時傾向于降低攻擊成本、減少擾動數量和提高查詢效率。為了從攻擊者的角度模擬對抗樣本的生成，提出基于對數回溯法的擾動刪減算法，實現以較少的查詢次數和較少的擾動數量生成惡意代碼對抗樣本。基于對數回溯法的擾動刪減算法如算法3 所示。

對數回溯法是一種與二分查找思路相似的方法。二分查找法假定原始數據是一個有序的狀態，通過數據的中間值與目標值的對比選取執行方向。而在本文中，對數回溯法面向的數據是API 調用列表，是一種無序的數據。本文模仿二分查找的思路，在迭代過程中，將原始數據隨機減少一半。

首先，選取可以躲避惡意代碼檢測器的擾動樣本，計算擾動集。然后，隨機減少一半的擾動，加入惡意樣本進行查詢，并記錄當前刪除的擾動集。如果查詢結果為良性，則重復進行此過程，直至檢測器結果為惡意，交換刪除數據和當前保留數據，重復上述迭代過程。若交換數據后查詢結果仍為惡意，則恢復移除數據的一半數據進行查詢，重復迭代，直至檢測器結果為良性。當前數據集為刪減后所得API。

5 實驗

5.1 數據集

實驗使用了2 個數據集，一個是安卓平臺應用程序的數據集（后文簡稱為安卓數據集），一個是Windows 可執行應用程序的數據集（后文簡稱為Windows 數據集）。

安卓平臺應用程序的數據集包含2 932 個惡意樣本和2 165 個良性樣本。其中，惡意樣本來自開源惡意程序樣本庫VirusShare。良性樣本來自小米應用商店，并且所有的良性樣本都經過VirusTotal 平臺的檢測。VirusTotal 是一個在線檢測平臺，它通過將文件分發給多種反病毒引擎進行掃描，掃描結果準確率優于單一產品掃描，具有較高的可靠性。

Windows可執行應用程序的數據集為天池阿里云安全惡意程序檢測比賽數據，包含8 909 個惡意樣本和4 978 個良性樣本。數據來自文件（Windows可執行程序）經過沙箱程序模擬運行后的經過脫敏處理的API 指令序列。

5.2 實驗設置

實驗選取隨機森林（RF,random forest）、邏輯回歸（LR,logistic regression）、決策樹（DT,decision tree）、支持向量機（SVM,support vector machine）和多層感知器（MLP,multilayer perceptron）作為目標檢測器，驗證本文提出的對抗訓練驅動的惡意代碼檢測增強方法的有效性。首先通過對良性樣本和對抗樣本進行評估，驗證對抗樣本生成方法的有效性；然后通過對抗訓練前后的檢測器對比，驗證對抗訓練的有效性。

在生成對抗網絡模型的構建中，生成模型的節點數設置為100-128-128-196，判別模型的節點數設置為196-128-128-1。WGAN 模型的實驗參數如表2 所示。

表2 WGAN 實驗參數

5.3 評價指標

5.3.1 生成模型的有效性評估

對于生成模型的有效性評估，使用模型生成樣本的良性樣本檢測率作為評估指標，即生成樣本被檢測器判斷為良性的概率，記作GEN_TPR，定義如式(7)所示。

其中，num(·) 為樣本的數量，f(·) 為目標檢測器對樣本的預測結果。G為WGAN 的生成器，z為從標準正態分布的隨機噪聲向量。

5.3.2 對抗樣本的有效性

對抗樣本的評估包含攻擊成功率和攻擊成本這2 個方面。

攻擊成功率也稱為繞過率，即對抗樣本成功躲避目標惡意代碼檢測器檢測，被檢測器識別為良性的概率，記作ASR，計算方法如式(8)所示。

其中，num(·) 為樣本的數量，f(·) 為目標檢測器對樣本的預測結果；x為惡意樣本，x' 為x經過擾動后的樣本。

對于攻擊成本，本文綜合考慮了添加的擾動數量和檢測器查詢次數，計算方法如式(9)所示。

其中，cost 為攻擊成本；p為擾動數量，即添加的API 調用數量；q為惡意代碼檢測器的查詢次數，α和β分別為p和q的權重，本文設定擾動數量與查詢次數占相等權重，即α=β=0.5。

5.3.3 對抗訓練的有效性

惡意代碼檢測器性能的評估，采用模型準確率來衡量檢測器的檢測率，通過對抗訓練前后的準確率對比，驗證對抗訓練的有效性。準確率的計算方法如式(10)所示。

其中，TP 表示正確檢測的惡意樣本數量，TN 表示正確檢測的良性樣本數量，FN 表示被判斷為良性的惡意樣本數量，FP 表示被判斷為惡意的良性樣本數量。

5.4 生成模型的有效性評估

在訓練WGAN 模型的過程中，將生成器的輸出樣本進行二值化處理后，作為目標檢測器的輸入，計算良性樣本檢測率。

在安卓數據集中，實驗選取5.2 節中的5 種目標檢測器，計算不同訓練次數下的良性樣本檢測率，實驗結果如圖5 所示。

圖5 安卓數據集下WGAN 生成樣本的良性檢測率

在Windows 數據集中，實驗選取DT、MLP 和LR 這3 種目標檢測器，計算不同訓練次數下的良性樣本檢測率，實驗結果如圖6 所示。

圖6 Windows 數據集下WGAN 生成樣本的良性檢測率

由于WGAN 的訓練過程是生成器和判別器的博弈過程，在迭代初始階段，生成器還沒有學習真實樣本的分布，良性樣本檢測率較低，且存在較大波動，當生成器和判別器進行了多次博弈后，生成器模型生成更加滿足真實樣本分布的數據。

從圖5 和圖6 可以看出，安卓數據集在經過約12 500 次訓練后，在不同的目標檢測器下，良性樣本檢測率均在趨近100%處保持穩定。Windows 數據集在經過16 000 次訓練后，生成樣本的良性檢測率維持在97%以上。基于WGAN 的生成樣本較好地學習了真實良性樣本的分布特征，在構建良性樣本庫上具有一定的有效性。

5.5 對抗樣本生成結果評估

5.5.1 攻擊成功率評估

在攻擊成功率評估的實驗中，對2 個數據集選取與5.4 節中相同的目標檢測器進行實驗。實驗設置不同的良性樣本庫規模，評估惡意代碼對抗樣本的攻擊成功率。圖7 和圖8 分別為面向安卓數據集和Windows 數據集的攻擊成功率結果。其中，橫坐標表示良性樣本庫的規模，縱坐標為惡意代碼對抗樣本攻擊成功率。

圖7 安卓數據集下不同良性樣本庫規模的攻擊成功率

圖8 Windows 數據集下不同良性樣本庫規模的攻擊成功率

在安卓數據集中，當良性樣本庫規模大于2 000 個時，攻擊成功率維持在一個相對穩定的狀態，對抗樣本具有較高攻擊成功率。

在Windows 數據集中，MLP 的攻擊成功率較低，但在良性樣本庫規模大于2 000 個時，仍達到60%以上的攻擊成功率。在4 000～10 000 個的良性樣本庫規模中，攻擊成功率呈現出一定的增長趨勢。當良性樣本庫規模達到10 000 時，攻擊成功率取得了較好的結果。

實驗結果發現，當良性樣本庫規模為1 000 個時，2 個數據集下不同的目標檢測器的攻擊成功率均最低，過少的良性樣本會影響當前對抗樣本攻擊方法的效果。當目標檢測器為DT 時，2 種數據集都具有最高攻擊成功率。決策樹算法通過對訓練數據進行分析，對特征生成規則，利用規則對新數據進行判斷。本文的攻擊方法通過向惡意樣本添加擾動，容易對基于生成規則的決策產生干擾，達到攻擊效果。

5.5.2 攻擊成本評估

為了驗證基于對數回溯法的擾動刪減在擾動成本和查詢效率上的有效性，本文對安卓數據集進行3 組實驗，即實驗1、實驗2 和實驗3，分別計算安卓數據集惡意代碼對抗樣本在不同良性樣本庫規模的攻擊成本。實驗1 按照擾動數量從小到大的順序選取擾動樣本，進行檢測器查詢，直到樣本成功躲避惡意代碼檢測器的檢測。實驗2 按照擾動數量從小到大的順序選取擾動樣本，進行檢測器查詢，并對成功躲避惡意代碼檢測器的樣本進行擾動刪減。實驗3 隨機選取擾動樣本，對成功躲避惡意代碼檢測器的樣本執行基于對數回溯法的擾動刪減。3 組實驗統一使用RF 算法作為惡意代碼目標檢測器，評估在不同規模的良性樣本庫下，對抗樣本生成的攻擊成本，采用箱型圖展示攻擊成本結果，如圖9～圖11 所示，其中，▲表示數據平均值，●表示數據異常值。

圖9 不同良性樣本庫規模的擾動數量

圖10 不同良性樣本庫規模的查詢次數

圖11 不同良性樣本庫規模的攻擊成本

在擾動數量上，3 組實驗均受良性樣本庫規模的大小影響不大。實驗1 是在文獻[21]的對抗樣本生成算法的基礎上增加擾動樣本的排序操作，擾動數量與文獻[21]一致。實驗2 在實驗1 的基礎上進行擾動刪減，擾動數量最少。實驗3 采取隨機選取擾動樣本的方式，擾動數量不穩定，跨度較大。從整體擾動數量的平均值看，3 組實驗的擾動數量差距在5 個以內。

在目標檢測器查詢次數上，實驗3 的查詢次數最少。實驗1 和實驗2 的查詢次數隨著良性樣本庫規模的增加而增加，實驗3 的擾動數量受良性樣本庫規模影響不大，始終保持較低查詢次數。

本文通過理論分析，計算基于對數回溯法的擾動刪減方法的查詢次數。在進行擾動刪減時，基于對數回溯法從最大的擾動集開始，不斷從擾動樣本中刪除一半添加的擾動，直到樣本被目標檢測器錯誤分類，實現在盡可能少的查詢次數內減少擾動數，當刪減到只剩一個擾動且刪減過程中每次迭代都需要交換保留集和刪除集時，所需查詢次數最多，設原擾動數為p，特征維度為k，則查詢次數為2logp≤2logk。而在文獻[21]的對抗樣本生成算法中，對抗樣本生成只關注擾動數量，并不關注查詢次數，檢測器查詢次數等于良性樣本庫規模大小。

為了綜合考慮擾動數量和惡意代碼檢測器查詢次數，采用式(9)的攻擊成本計算方法，實驗結果如圖11 所示。從圖11 中可知，當良性樣本庫規模為100 個時，由于良性樣本庫規模較小，實驗3 在查詢次數上的優勢并沒有得到體現。并且，由于實驗3 在選擇擾動樣本時具備一定的隨機性，擾動數量存在一定的浮動，在良性樣本庫規模為100 個時，攻擊成本的平均值略大于實驗1 和實驗2。在其他良性樣本庫規模中，實驗3 的攻擊成本最小，且實驗3 的攻擊成本不受良性樣本庫規模的影響。

在安卓數據集中，當良性樣本庫規模大于2 000時，攻擊成功率維持在一個相對穩定的狀態，對抗樣本具有較高攻擊成功率。為了驗證本文方法對于不同分類器具有通用性，選取5.2 節中的目標檢測器進行實驗，在良性樣本庫規模為2 000 個的條件下，計算對抗樣本生成的擾動數量與查詢次數，結果如圖12 和圖13 所示。

圖12 不同目標檢測器的擾動數量

圖13 不同目標檢測器的查詢次數

實驗結果表明，本文提出的基于對數回溯法的擾動刪減算法能夠以較小的擾動數量和查詢次數，躲避多種惡意代碼檢測器的檢測，對不同的惡意代碼檢測器具有一定的通用性。

結合圖7 和圖12 中安卓數據集不同目標檢測器的攻擊成功率和擾動數量實驗結果可以發現，具有最高攻擊成功率的DT 檢測器對應的平均擾動數量最少，而具有最低攻擊成功率的SVM 檢測器對應的平均擾動數量最多。檢測器的對抗攻擊難度與對抗樣本擾動數量具有一定的正相關性。

在查詢次數方面，各目標檢測器模型沒有體現出明顯的差距，攻擊過程中的檢測器查詢次數集中在5～10 次，具有較高的查詢效率。

5.5.3 對抗樣本的有效性評估

對于安卓應用程序，本文通過在反匯編文件中文件中插入擾動API，并利用工具對文件進行重打包和重簽名。

以惡意 APK“VirusShare_ffb376be1e8d8311d 320f7a107caee9a”為例，利用本文提出的對抗樣本生成算法，得到擾動API，在反匯編文件中添加擾動API 調用代碼，并進行重打包和重簽名。最后，利用VirusTotal 對擾動生成的APK 進行檢測，實驗結果表明，與原始惡意樣本相比，將擾動生成的對抗樣本識別為惡意文件的反病毒引擎數量減少了10 個，驗證了本文所提出的對抗樣本生成的有效性。

5.6 對抗訓練結果評估

為了驗證對抗訓練對惡意代碼檢測器的增強作用，本文對2 組數據集分別進行4 組實驗。首先，計算原始目標檢測器的準確率，并對目標檢測器進行對抗攻擊。然后，將生成的對抗樣本加入惡意代碼檢測器進行對抗訓練。最后，再次攻擊對抗訓練后的檢測器。

2 個數據集對抗訓練前后檢測器的準確率如表3 和表4 所示。其中，D 為初始檢測器，DAT為對抗訓練后的檢測器。對D 和DAT檢測器進行對抗樣本攻擊模型分別表示為AE1和AE2。表5 和表6為對D 和DAT檢測器進行對抗攻擊的攻擊成功率，即AE1和AE2的攻擊成功率。

表3 對抗訓練前后檢測器的準確率（安卓數據集）

表4 對抗訓練前后檢測器的準確率（Windows 數據集）

表5 對抗訓練前后對抗攻擊成功率（安卓數據集）

表6 對抗訓練前后對抗攻擊成功率（Windows 數據集）

從表3 和表4 可知，對于不同的目標檢測器，在經過對抗訓練后，檢測器的準確率大都得到了一定的提升。結果表明，通過加入生成的惡意代碼對抗樣本進行對抗訓練，提升了目標檢測器的惡意代碼識別能力。

從表5 和表6 可知，對抗訓練后的惡意代碼檢測其攻擊成功率明顯低于原始惡意代碼檢測器。結果表明，通過對抗訓練，惡意代碼檢測器識別對抗樣本的能力有明顯提高，提高了模型的抗干擾能力，增強了模型的穩健性。

6 結束語

針對機器學習模型的脆弱性問題，對惡意代碼檢測模型的增強方法展開了研究，提出了對抗訓練驅動的惡意代碼檢測增強方法。首先，基于WGAN構建面向API 調用的良性樣本庫，以擾動的形式添加進惡意樣本。然后，基于對數回溯法進行擾動刪減以降低攻擊成本。最后，基于主動防御思想將生成的對抗樣本用于惡意代碼檢測器的重訓練，提高惡意代碼檢測器防御對抗性攻擊的能力。實驗表明，本文提出的惡意代碼對抗樣本生成方法能夠以較低的擾動成本和較少的查詢次數生成具有較高躲避率的惡意代碼對抗樣本。通過生成的惡意代碼對抗樣本來豐富惡意樣本庫，重訓練惡意代碼檢測模型，能夠達到增強模型穩健性和提高模型檢測率的效果。

在未來研究工作中，將進一步對本文方法進行改進和完善。一方面，針對對抗樣本生成攻擊成本最小化問題進行優化，考慮多個因素對攻擊成本的影響并賦予合適的權重。另一方面，進一步探索基于代碼混淆技術和躲避動態惡意代碼檢測模型的對抗樣本生成方法。