GAN-TM：一種基于生成對抗網絡的流量矩陣推斷機制

2022-03-16 03:58:30章樂貴邢長友

計算機技術與發展 2022年2期

關鍵詞：模型

章樂貴，邢長友，余航，鄭鵬

(陸軍工程大學指揮控制工程學院，江蘇南京 210007)

0 引言

流量矩陣(traffic matrix，TM)是網絡內源(origin)節點和目的(destination)節點對之間流量的具體描述，矩陣中的每個元素都表示某一源和目的對之間的流量大小。作為網絡態勢的一種重要表現形式，流量矩陣能夠給網絡管理員提供許多關于當前網絡狀態有價值的全局信息，是解決網絡中很多問題不可或缺的組成部分，如網絡規劃、流量計費、流量工程、負載均衡、異常檢測和網絡性能分析等。由于流量矩陣在解決網絡問題中的極端重要性，近二十年來，關于流量矩陣的研究受到了國內外學者的高度關注，各類流量矩陣測量與推斷技術不斷發展。

雖然準確獲取流量矩陣對網絡運營者來說至關重要，各類研究人員也對如何準確獲取流量矩陣提出了許多不同的方法，包括統計方法、最優化方法和時間序列方法等，但現實條件下想要準確獲取流量矩陣始終存在困難?，F有的流量矩陣測量方法主要可分為直接測量法和估計推斷法。由于當前計算機網絡快速發展，網絡規模不斷擴張，網絡結構日趨復雜，通過部署大量節點直接進行測量的方法既受限于缺乏有效的測量框架，又因測量耗費無法承受逐漸失去了其現實意義。而對于現有的利用流量矩陣其內在聯系進行分析計算的推斷法而言，又因流量矩陣推斷問題在線性求解上固有的高度病態特性難以有效解決而時常陷入困難。

1 背景

目前在相關領域已經有學者做出了相當有創新性的一些工作，如Luong等人提出了一種基于監控鏈路流量吞吐量的解決方案和一種針對控制平面的新轉發算法。它基于SDN控制器的兩個模塊，吞吐量監控器模塊著重于穿過交換機的數據包和字節數，分組轉發模塊實現轉發算法，吞吐量監控器模塊提供的統計信息可供任何監控應用程序使用。Silv等人提出了OFQuality，一種基于OVSDB協議的QoS配置模塊，該模塊得益于TM的生成來管理OF交換機上的QoS策略。Y. Tian等提出了一個新的基于SDN的IP網絡中TM估計的框架。該項工作表明，如果流量的流量可以從網絡中的其他流量中獲取，則為此流量添加新條目以進行流量測量不會提供有關TM的新信息。除此之外，胡煜雪也同樣基于SDN網絡進行了相關研究，提出了基于壓縮感知的流量估計算法，該算法的有效實現需要滿足RIP原則以及稀疏信號的前提條件。同樣使用壓縮感知方法的還有M. Malboubi等人，通過建立iStamp機制，使用壓縮好的聚集流量測量結果和

個最有用的流量來推斷TM。其中，iStamp將流表分為兩部分：第一部分用于匯總測量，第二部分用于對選定流進行逐流監視。使用這兩個不同的部分，iStamp可以估算流量矩陣。同時，D Jiang等人開發了一種算法，可以從采樣的流量跟蹤中以細粒度的時間估計和恢復網絡流量矩陣。他們的算法基于分形插值，三次樣條插值和加權幾何平均算法。王昌鈺從矩陣本身出發，使用歐氏距離作為最優化度量，解決了流量矩陣中的病態性問題，但并未考慮網絡流量矩陣本身的時間性和空間性。此外，Azzouni和Pujolle提出了NeuTM，它是基于長期短期記憶遞歸神經網絡的TM預測框架。實驗證明，NeuTM可以使用歷史數據來訓練神經網絡以預測未來的TM。在機器學習領域，Choudhury等人描述了機器學習在SDN賦能的IP /光網絡中用于TM預測的應用。在他們的工作中，使用機器學習來對流量矩陣的所有元素進行短期和長期預測是一未來的趨勢。2014年Ian Goodfellow等人提出了生成對抗網絡(generative adversarial networks，GAN)，給出了生成對抗網絡的框架及理論收斂性分析。生成對抗網絡是一種無監督機器學習的人工智能算法，通過兩個神經網絡在二人零和博弈中相互競爭實現。生成對抗網絡包括兩個子網絡模型，一個是生成網絡，也叫生成器(generator，

)，它的作用是使生成的數據盡可能與真實數據的分布盡可能一致；另一個是判別網絡，也叫判別器(discriminator，

)，它的作用是在生成的數據與真實的樣本數據之間能夠做出正確判斷，可以理解為一個二分類器。GAN的訓練過程可以理解為一個極小極大化博弈過程，生成器的模仿能力與判別器的鑒別能力二者相互促進、共同進步，最終達到一個納什均衡，使得生成器對原數據分布的模擬近乎逼真。

根據GAN網絡對于數據分布強大的學習能力，已經有許多基于GAN進行數據恢復的研究取得了重大進展，因此該文針對如何將GAN用于流量矩陣推斷進行了研究。

考慮到流量矩陣的低秩性，其內部存在大量的冗余，一些研究將流量矩陣估計推斷問題轉化成壓縮感知問題來進行解決。除了這些技術之外，基于張量的方法，在多維空間的矩陣推斷中，已被證明是一種用來估算缺失數據更有效的工具。但是，這些完成方法并未明確說明異常值，并且可能在數據嚴重損壞的情況下導致性能顯著下降。另一方面，由于流量矩陣內部各元素之間存在強相關性，為了盡可能地挖掘、利用流量矩陣內部這一空間特性，該文使用了卷積神經網絡對生成器、判別器兩大神經網絡進行了改進。根據相關研究表明，理論上深度神經網絡能夠實現任意功能的函數。為了使模型具有更強的學習能力，盡可能模擬出真實數據的分布，該文使用深度卷積網絡作為GAN結構中生成器和判別器的架構。通過設置大小不同的卷積核，獲取不同大小范圍感受野的特征，可以更好地學習到數據分布。使用深度卷積神經網絡的另一個優勢在于能有效利用流量矩陣的低秩特性，減少中間變量和參數的設置，進一步優化網絡結構。

盡管GAN有著許多優秀的特性，但是與此同時也陷入了和其他機器學習方法相同的問題——完整數據依賴性。原生GAN在訓練過程中需要包含完整數據的數據集進行輔助，這意味著需要預先獲取大量整個目標流量矩陣——包括矩陣中每個位置上元素的歷史數據，以此完成對損失函數的構建，而構建合理的損失函數是對模型參數進行訓練優化的基礎，這樣一來，就使得GAN一旦離開了完整的數據集將無法工作。事實上，對于現代大型網絡而言，想要獲取完整的流量矩陣數據是一件幾乎不可能的事情，包括該文所研究的流量矩陣推斷問題，同樣也是為了更好地獲得流量矩陣數據。完整流量矩陣數據的缺乏，成為了研究推進的瓶頸。為了消除模型的完整數據依賴，該文引入了掩碼矩陣作為構建損失函數的依據，并以此為依據獲得了優化函數。這種做法有效地避開了完整數據依賴問題，使得模型可以在沒有任何完整數據的前提下解決流量矩陣推斷的機器學習解法，降低了問題解決的門檻和耗費。

2 方法建模

生成對抗網絡(GAN)的數學模型描述如下：

(

～[log

(

)]+

～[log(1-

(

))]

(1)

其中，

表示輸入判別器的向量，

表示期望值，

表示真實數據的分布，

表示

生成數據的分布。這個式子的好處在于，固定生成器(

)之后，max

(

)就表示

和

之間的差異，只需要找到一個參數最“完美”的

，使得它的最大值最小化，也就是

和

兩個分布之間差異最小，即收斂在：

(2)

假設目標網絡有

個節點，則該網絡中共有

個OD流，它的流量矩陣應該是一個

的方陣，因此假設

是該網絡中第

個節點到第

個節點之間的OD流，目標網絡的流量矩陣就可以表示為：=(

)×

(3)

接下來引入掩碼矩陣(mask matrix，MM)的概念。文中掩碼矩陣的作用是標明矩陣中各個位置元素是否有真實值的一個01矩陣，掩碼矩陣的規模與對應的流量矩陣一致，文中掩碼矩陣同樣也是一個

的方陣。其中，如果

的數據是真實測得的數據，那么對應的

=1；否則如果

的數據是缺失的，那么相應的

=0，即：

(4)

模型的基本架構如圖1所示。

圖1 模型基本架構

在圖1所示的模型中，

和

分別是生成器和判別器。為只含有部分測量數據信息的缺失矩陣，根據矩陣，由公式(4)可以獲得該流量矩陣對應的掩碼矩陣，二者共同作為生成器的輸入。生成器

利用已知的和作為輸入，輸出作為對原矩陣的一個推斷結果。是一個提示矩陣，由生成，含有部分信息。作為一個輔助輸入，用于輔助判別器

判別其主輸入中各個元素是否是原始數據，是原始輸入的打個標記“1”，不是的打個標記“0”，從而獲得一個對的估計。

的能力越強，生成的就越接近于真實情況，

的判別結果就越容易判為全真(即

為全1矩陣)，這顯然是在相對條件下弱化了

，因此與

努力判別出

真實情況構成博弈，在訓練過程中正是利用了這一點使得兩者的能力都不斷得到強化，最終到達平衡時獲得一個強大的生成器

，

能夠對原數據中缺失的部分以較高的準確率推斷出來。

圖1中的G_loss和D_loss分別是生成器和判別器的損失函數，通常被用于優化模型參數，同時也被用于檢驗生成器/判別器能力強弱。

通過訓練

來最大化正確預測的概率，訓練

來最小化

預測的概率。定義要量化的

(

)為：

(

,,[log

(,)+(1-)log(1-

(,))]

(5)

根據Goodfellow在原始GAN中的推導，目標函數可以寫成：

(6)

2.1 生成器

生成器的作用是利用所有已知的信息，學習含有缺失的流量矩陣的數據分布，根據學習成果對原矩陣缺失的數據進行填充，使得輸出的流量矩陣接近于真實網絡中的情況。在該文所構建的模型中，生成器的輸入為原流量矩陣及其對應的掩碼矩陣。但并不是直接進入生成器中開展運算的，需要經過一個填充過程，將其缺失部分元素用隨機噪聲進行填充，即：=⊙+⊙(1-)

(7)

其中，為規模和一致的隨機生成的噪聲。圖2中，“G_”表示模型參數，在本模型中共設置了三個卷積層，“G_w2”，“G_w3”，“G_w4”分別為相對應的三個卷積核，卷積核大小分別為 “7×7”，“5×5”和 “3×3”?！癎_b1”，“G_b2”，“G_b3”，“G_b4”分別表示各層的偏置。將最后一個卷積層輸出的結果矩陣命名為，為保證原有數據不被更改，以免引入新的誤差，在最后的輸出層將原始數據重新賦回，即：

圖2 生成器(G)結構

=⊙+⊙(1-)

(8)

最終輸出的就是對原數據的一個推斷結果。

2.2 判別器

判別器的作用是利用輸入數據(,)所提供的信息，判斷矩陣中哪些元素是矩陣中原本就有的真實數據，哪些是由生成器生成的，判斷的結果用一個掩碼矩陣

來表示，因此也可以認為是對掩碼矩陣中位置部分的推斷。圖3中，“D_”表示模型參數，在本模型中共設置了三個卷積層，“D _w2”，“D _w3”，“D _w4”分別為相對應的三個卷積核，卷積核大小分別為 “7×7”，“5×5”和 “3×3”?！癉 _b1”，“D _b2”，“D _b3”，“D _b4”分別表示各層的偏置。將最后一個卷積層輸出的結果矩陣命名為

，即判別器的輸出。

圖3 判別器(D)結構

2.3 模型訓練

在信息論中，香農(Shannon)提出使用交叉熵(cross entropy)來度量兩個分布之間的差異程度，給出

間的交叉熵公式：

(

)=∑[

log

+(1-

)log(1-

)]

(9)

該文使用交叉熵函數來計算損失函數，結合公式(5)和公式(6)，可以得到判別器的損失函數：

[

(,)]

(10)

考慮生成器的損失函數時，急需要使生成器最后一次卷積得到的結果中原數據保留位置的元素盡可能保持不變，又要使生成器生成的部分不被判別器判別出來。

對于原有數據而言，在圖2中，經過生成器

處理之后輸出的應該盡可能使原始數據保持不變，和之間的差異帶來的損失可以用均方差來體現，這個損失同時也是衡量整個模型準確率的關鍵指標：

(11)

從博弈的角度出發，

要盡量使

不能判別出來哪些數據是由

生成的，因此這部分的損失可以由圖3中和的交叉熵來表示：

2=∑(1-)log(1-)

(12)

將關于

的兩個誤差加權和作為生成器的損失函數：

=∑(1-)log(1-)+

(13)

其中，

是一個正常數，用于平衡生成器損失函數所考慮的兩個方面損失相互之間的重要性。

3 實驗與分析

實驗所使用的數據集來源于美國Abilene骨干網絡上的真實數據，為了便于計算分析，實驗中所使用的數據均已做歸一化處理。在Abilene骨干網絡中，共有12個IP網絡節點，因此對應的流量矩陣規模為“12×12”(即

=12)。為了正確測試模型的泛化性能，從數據集中隨機抽取10%作為驗證集，剩余90%作為訓練集。為驗證模型在流量矩陣推斷上的表現，在實驗中對模型參數配置如下：將數據缺失率設為20%；每輪訓練128個樣本，即mini_batch = 128，每訓練完10個mini_batch計算一次誤差和損失函數；訓練過程中學習率設為3×10；計算G_loss1所用的權值

=10；掩碼矩陣對提示矩陣的提示率為0.9。圖4顯示了在2 000輪次訓練過程中本模型進行流量矩陣推斷的誤差，即公式(11)計算的

_loss1。圖4表明，在整個訓練過程中，

_loss1在訓練開始階段下降明顯，在500輪訓練后逐漸趨于平穩，約1 000輪次的訓練后

_loss1達到約0.10，隨后開始圍繞均衡點震蕩。由此可見，模型在無完整數據的條件下，對于缺失流量矩陣的推斷仍然能夠保證較高的準確率。

圖4 訓練過程中模型對流量矩陣推斷誤差曲線

圖5顯示了整個訓練階段中判別器和生成器的損失函數變化情況。根據圖5可以看到，在訓練開始階段(0～250輪)，判別器和生成器的損失都在不斷減小，

圖5 訓練過程中判別器(D)/生成器(G)損失曲線

這表明兩者的能力都在不斷增強。而后判別器的損失繼續下降，但生成器的損失開始上升，這是由于生成器在計算損失時同時考慮了流量矩陣和掩碼矩陣兩個方面的損失所產生的，到模型最后階段，兩個損失函數都趨于穩定，模型訓練完成。

圖6顯示了在其他參數保持不變的情況下，在1 000輪次的訓練過程中，當缺失率取不同的值時的模型誤差曲線(G_loss1)。根據圖6可以得出結論，測量得到的流量矩陣數據信息越多，模型的誤差就越小，反之則誤差越大，這與主觀經驗是完全一致的。如圖6所示，當缺失率低于30%時，模型都能夠以較高的準確率(

_loss1≈0

10)得到推斷結果。當缺失率高于50%時，模型的推斷結果開始逐漸變差，當缺失率達到90%時，模型的推斷功能將徹底失效，無法再起到任何作用。

圖6 不同缺失率下的推斷誤差

根據實驗驗證可以得出結論，本模型具備在缺少完整數據的情況下，僅僅利用缺失的流量矩陣數據就能以較低的誤差水平推斷得到完整的流量矩陣。并且本模型在缺失率低于50%的條件下都能有較好的表現，在缺失率低于90%的條件下也能起到一定的效果，但無法保證較低的誤差水平。

4 結束語

該文研究了如何在缺少完整流量矩陣數據集的條件下，解決流量矩陣推斷問題，并結合Goodfellow教授提出的生成對抗網絡技術，給出了一種新的推斷方法，建立了基于掩碼矩陣評估的卷積生成對抗網絡(BM-DCGAN)模型。通過利用深度卷積神經網絡強大的建模功能，實現了在不使用完整流量矩陣數據的前提下，僅利用測量獲取的部分流量矩陣數據，在模型的輔助下將位置部分的流量矩陣數據推斷出來。該模型可以實現在容忍低于30%數據缺失的情況下，以0.10左右的誤差將缺失的流量矩陣還原。

與以前的方法相比，該方法具有以下優勢：

(1)無需大量的完整數據用于訓練，減少了測量耗費，降低了網絡測量成本，從而降低了問題解決的代價，使模型更具有實際意義；

(2)使用卷積神經網絡，利用卷積特性，有效捕捉了流量矩陣的空間特征；

(3)模型收斂速度快，推斷誤差小，實現了高效使用的目的。