999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)游戲流識別*

2021-10-09 08:33:44瞿志宇鄭學(xué)智
計算機與數(shù)字工程 2021年4期
關(guān)鍵詞:信息

瞿志宇 鄭學(xué)智

(武漢郵電科學(xué)研究院 武漢 430074)

1 引言

隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)游戲作為依賴互聯(lián)網(wǎng)產(chǎn)生的網(wǎng)絡(luò)應(yīng)用,也得到了很好的發(fā)展[1],如今也成為社交的一種重要手段[2]。根據(jù)CNNIC(中國互聯(lián)網(wǎng)信息中心)第42次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2018年6月,我國網(wǎng)絡(luò)游戲用戶規(guī)模達到4.86億,占總體網(wǎng)民的60.6%,較去年末增長4391萬人。手機網(wǎng)絡(luò)游戲用戶規(guī)模明顯提升,達到4.58億,較去年末增長5123萬人,占手機網(wǎng)民的58.2%。不僅如此,網(wǎng)絡(luò)游戲也得到了社會更多的認可,2019年4月人社部正式確認了電子競技員正式成為一門職業(yè),同月在國家統(tǒng)計局《體育產(chǎn)業(yè)統(tǒng)計分類(2019)》中,電子競技被正式歸為體育競技項目。用戶規(guī)模的增大導(dǎo)致對網(wǎng)絡(luò)游戲服務(wù)質(zhì)量的要求越來越高[3]。

周銳等[4]利用IP過濾、數(shù)據(jù)包大小信息熵、下上行包數(shù)目之比和PPS(Packets Per Second)等特征組合有效地提高網(wǎng)絡(luò)游戲數(shù)據(jù)流識別準確率。畢夏安等[5]通過提取出識別游戲流量的特征數(shù)據(jù)庫,并基于EGT-PC算法提出了一種高效的游戲流量分類方法,該算法在時間和空間上有很大的改進。Han Young-Tae等[6]在傳輸層提出一種基于簡單決策樹的ADT算法對游戲數(shù)據(jù)流進行精確分類。Mark Claypool等[7]通過對數(shù)據(jù)包大小、IP和比特率等信息對“瘦”客戶端游戲進行研究。

BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種模仿人類神經(jīng)網(wǎng)絡(luò)工作方式而演化出的一種按誤差反向傳播的多層前饋網(wǎng)絡(luò),其結(jié)構(gòu)包括輸入層、隱含層、輸出層三部分。具有較好的自適應(yīng)學(xué)習(xí)能力,能以任意精度逼近非線性函數(shù),在解決非線性問題上得到了廣泛的應(yīng)用[8]。但BP神經(jīng)網(wǎng)絡(luò)存在容易陷入局部極小的缺點,造成算法的精度和速度降低[9]。

遺傳算法(Genetic Algorithms)是一種模擬自然界遺傳機制和生物進化論而成的一種并行隨機搜索最優(yōu)化方法[10]。該算法通過遺傳學(xué)中的選擇、交叉、變異對個體進行篩選,保留適應(yīng)度好的個體,淘汰適應(yīng)度差的個體,不斷反復(fù)循環(huán),直至滿足需求。通過遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始結(jié)構(gòu),能夠很好地解決BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小的缺點[11]。

本文提出利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)來識別網(wǎng)絡(luò)游戲流數(shù)據(jù),選取多維度信息作為輸入,并通過仿真驗證方法的有效性。

2 BP神經(jīng)網(wǎng)絡(luò)基本原理

BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),信號從輸入層到隱含層,再到輸出層得到期望輸出。期望輸出同實際值做比較,若得不到所期望的值,則誤差反向傳播,調(diào)節(jié)網(wǎng)絡(luò)的權(quán)值和閾值[12]。如此反復(fù)訓(xùn)練,優(yōu)化網(wǎng)絡(luò)參數(shù),使誤差逐漸變小,滿足需求。

圖1為BP神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖,X1,X2,…,Xn表示輸入數(shù)據(jù),Y1,Y2,…,Ym表示輸出數(shù)據(jù),ωij和ωjk表示網(wǎng)絡(luò)的連接權(quán)值,aj和bk分別表示隱含層閾值和輸出層的閾值。BP神經(jīng)網(wǎng)絡(luò)主要包括訓(xùn)練和識別兩個過程,訓(xùn)練過程是通過多組樣本數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò),優(yōu)化其參數(shù),使其具有聯(lián)想能力和識別能力,識別過程則是把訓(xùn)練好的網(wǎng)絡(luò)用于對未知數(shù)據(jù)的識別。整個網(wǎng)絡(luò)可以看成一個非線性系統(tǒng),權(quán)值和閾值相當于系統(tǒng)參數(shù),網(wǎng)絡(luò)的訓(xùn)練過程相當于調(diào)節(jié)系統(tǒng)參數(shù)的過程,當有n個輸入,m個輸出時,整個系統(tǒng)相當于一個n輸入m輸出的非線性系統(tǒng)。

圖1 BP神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖

3 遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)

3.1 遺傳算法基本原理

遺傳算法是一種模擬自然界優(yōu)勝劣汰規(guī)則的算法,通過對種群進行選擇、交叉和變異操作,從而獲得種群最優(yōu)個體的方法[13]。其核心是依照所選的適應(yīng)度函數(shù),通過遺傳操作,不斷的將適應(yīng)度好的個體保留,淘汰適應(yīng)度差的個體,直至得到滿足需求的最優(yōu)個體。每一代新的群體既繼承上一代的特性,又優(yōu)于上一代,因此經(jīng)過多代的遺傳淘汰操作之后,能夠得到理想的種群。遺傳算法的遺傳操作主要包括以下三種。

1)選擇操作。依據(jù)個體的適應(yīng)度值,從舊種群中選擇部分個體到新種群中,個體的適應(yīng)度值越好,其被選取的概率越大。以此使優(yōu)秀的個體得到保留,不斷繁育出更優(yōu)的子代,最終滿足需求。

2)交叉操作。首先從種群中隨機選取兩個個體,然后對兩個個體染色體中的一點或多點進行交叉,來得到新的個體。

3)變異操作。從種群中隨機選取一個個體,然后對其染色體中的一點進行變異,以期得到更優(yōu)的個體。

3.2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法模型

算法流程如圖2所示。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法主要包括三部分:初始化BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、遺傳算法優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)識別。其中初始化BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括:確定輸入層、隱含層和輸出層節(jié)點個數(shù),以及初始化網(wǎng)絡(luò)的權(quán)值和閾值等參數(shù)。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)是將一個網(wǎng)絡(luò)中的所有權(quán)值和閾值看作種群中的一個個體,然后通過選擇、交叉和變異的操作得到最優(yōu)的個體,即最優(yōu)權(quán)值和閾值,并將該組權(quán)值閾值賦給BP神經(jīng)網(wǎng)絡(luò)作為初始的權(quán)值和閾值[14]。最后的BP神經(jīng)網(wǎng)絡(luò)識別部分,是利用遺傳算法優(yōu)化的初始權(quán)值和閾值來訓(xùn)練網(wǎng)絡(luò),再利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進行識別。

圖2 遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)算法流程

4 網(wǎng)絡(luò)游戲數(shù)據(jù)流識別模型

4.1 數(shù)據(jù)來源

傳統(tǒng)的網(wǎng)絡(luò)游戲識別都基于端口號和包長分布等一維信息進行網(wǎng)絡(luò)游戲識別[15]。本文提出利用多維度信息作為輸入,進行網(wǎng)絡(luò)游戲流識別。通過Wireshark進行抓包,獲取原始數(shù)據(jù)包,通過提取這些數(shù)據(jù)包中的有用信息作為識別模型的輸入。提取的信息包括:五元組信息(源ip,目的ip,源端口,目的端口,協(xié)議類型),以及報文長度,利用網(wǎng)絡(luò)游戲數(shù)據(jù)報文中的多維信息來進行識別,提取五元組和報文長度這六種維度信息作為輸入的原因如下。

1)五元組信息。五元組在傳輸過程中能區(qū)別不同的會話,且對應(yīng)的會話是唯一的,可以實現(xiàn)區(qū)分不同的應(yīng)用;

2)ip信息。ip在網(wǎng)絡(luò)傳輸中的用于實現(xiàn)主機之間的通信,提供不同網(wǎng)絡(luò)應(yīng)用的互聯(lián)網(wǎng)公司擁有ip不同,因此提供網(wǎng)絡(luò)游戲服務(wù)的公司ip是有別于提供其他網(wǎng)絡(luò)服務(wù)公司的ip,可通過ip做簡單區(qū)分;

3)端口號。利用端口號識別網(wǎng)絡(luò)游戲是一種很重要的識別方法,早期擁有著較高準確性[16]。雖然隨著新興網(wǎng)絡(luò)應(yīng)用的大量出現(xiàn),使用了大量的隨機端口,導(dǎo)致其效率和識別效果變差,但端口號仍然能為識別網(wǎng)絡(luò)游戲提供重要信息;

4)協(xié)議類型。網(wǎng)絡(luò)游戲數(shù)據(jù)流在傳輸過程中采用的主要傳輸協(xié)議為TCP協(xié)議,部分采用UDP協(xié)議,或者兩種協(xié)議混合使用,以TCP協(xié)議為主,UDP協(xié)議為輔;

5)報文長度。網(wǎng)絡(luò)游戲的包長一般小于1000字節(jié)的小包,包長分布非常整齊且大多數(shù)是40字節(jié)~159字節(jié)的小包,其特征有別于其他網(wǎng)絡(luò)應(yīng)用。

綜上所述,選取的六種維度輸入信息,其包含的信息,能夠很有效地區(qū)分不同的網(wǎng)絡(luò)應(yīng)用,因此所選取的信息作為輸入建立的識別模型,能夠很有效地區(qū)分網(wǎng)絡(luò)游戲數(shù)據(jù)流和其他數(shù)據(jù)流。

4.2 數(shù)據(jù)量化

對于輸入信息,按表1所示進行量化處理。為避免ip過大,導(dǎo)致對原始數(shù)據(jù)處理復(fù)雜和算法計算量過大,在不影響結(jié)果的情況下,選擇ip的后兩字節(jié)作為輸入。協(xié)議類型為TCP的標記為1,UDP的標記為2。端口號和報文長度則直接用獲取到的數(shù)據(jù),不做處理。

表1 輸入數(shù)據(jù)量化處理

本實驗選取的數(shù)據(jù)樣本包括8款手機網(wǎng)絡(luò)游戲的1600組數(shù)據(jù),以及占用網(wǎng)絡(luò)帶寬較大的下載、視頻、網(wǎng)絡(luò)直播業(yè)務(wù)的1600組數(shù)據(jù)。將游戲的報文歸為第一類,其他業(yè)務(wù)的報文歸為第二類。實驗的總體數(shù)據(jù)樣本為3200組,每次試驗中隨機選取2400組數(shù)據(jù)作為訓(xùn)練樣本,用以訓(xùn)練識別模型,800組數(shù)據(jù)作為測試數(shù)據(jù),用來驗證識別模型的性能。

4.3 識別模型

如圖3所示,為網(wǎng)絡(luò)游戲數(shù)據(jù)流識別模型,整體識別分以下幾步。

圖3 網(wǎng)絡(luò)游戲識別模型

1)首先從數(shù)據(jù)流中的報文獲取所需的六維信息,源ip,目的ip,協(xié)議類型,源端口號,目的端口號以及報文長度;

2)對獲取的六維信息分別進行量化處理,使其滿足識別模型的輸入格式,并將量化后的數(shù)據(jù)作為輸入傳入識別模型;

3)利用識別模型,即遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)來對數(shù)據(jù)流進行識別,將結(jié)果分為網(wǎng)絡(luò)游戲數(shù)據(jù)流和其他應(yīng)用數(shù)據(jù)流兩類。

5 實驗分析

5.1 參數(shù)設(shè)置

BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點數(shù)對BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度有較大的影響:節(jié)點數(shù)太少,網(wǎng)絡(luò)不能很好地學(xué)習(xí),需要增加訓(xùn)練次數(shù),訓(xùn)練的精度也受影響;節(jié)點數(shù)太多,訓(xùn)練時間增加,網(wǎng)絡(luò)容易過擬合。通常節(jié)點個數(shù)的選取可以參考如下公式:

式(1)中,n為輸入層節(jié)點個數(shù),m為輸出層節(jié)點個數(shù),x為隱含層節(jié)點個數(shù),a為0~10之間的常數(shù)。本實驗中n的取值為6,m的取值為2,節(jié)點個數(shù)x的取值為5。遺傳算法中,進化代數(shù)選擇為20(即迭代20次),種群規(guī)模為10,交叉概率為0.2,變異概率為0.1。

5.2 結(jié)果分析

實驗中,為避免受隨機參數(shù)和訓(xùn)練數(shù)據(jù)選取偶然性的影響,本實驗共進行10次,對10次結(jié)果進行比較分析。將游戲的數(shù)據(jù)流作為第一類,將其在神經(jīng)網(wǎng)絡(luò)識別模型的輸出層定義為1,其他類型的數(shù)據(jù)流作為第二類,將其在神經(jīng)網(wǎng)絡(luò)識別模型的輸出層定義為2。因此將輸出層預(yù)測結(jié)果在0.5~1.5之間的歸為第一類,1.5~2.5之間的歸為第二類。

式(2)中,pvalue表示通過神經(jīng)網(wǎng)絡(luò)預(yù)測模型得到的預(yù)測值,output表示樣本的真實值,error是誤差值,當error介于-0.5~0.5之間時,認為本組數(shù)據(jù)的測試結(jié)果是正確的。

式(3)中,total為總的測試數(shù)據(jù)數(shù)800,num表示實驗中正確判斷的個數(shù),correct表示實驗的正確率。

圖4中,分別利用BP神經(jīng)網(wǎng)絡(luò)和GEN-BP神經(jīng)網(wǎng)絡(luò)(遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò))進行10次實驗,并對兩者的結(jié)果做線性擬合。從圖中可以看出,GEN-BP神經(jīng)網(wǎng)絡(luò)的擬合線明顯高于BP神經(jīng)網(wǎng)絡(luò)的擬合線,說明GEN-BP神經(jīng)網(wǎng)絡(luò)識別的正確率更好,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。結(jié)合表2中可以看出,GEN-BP神經(jīng)網(wǎng)絡(luò)的平均正確率高于BP神經(jīng)網(wǎng)絡(luò)約0.7%。BP神經(jīng)網(wǎng)絡(luò)正確率的范圍在95.00%~98.25%之間,GEN-BP神經(jīng)網(wǎng)絡(luò)的正確率96.13%~98.75%,GEN-BP神經(jīng)網(wǎng)絡(luò)的最低正確率和最高正確率均高于BP神經(jīng)網(wǎng)絡(luò),同時GEN-BP神經(jīng)網(wǎng)絡(luò)正確率的波動范圍在2.62%之間,BP神經(jīng)網(wǎng)絡(luò)正確率的波動范圍在3.25%,GEN-BP神經(jīng)網(wǎng)絡(luò)相比BP神經(jīng)網(wǎng)絡(luò)擁有更高的精度,同時波動范圍更小,識別更準確,穩(wěn)定性更好。因此,GEN-BP神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)游戲數(shù)據(jù)流識別中比BP神經(jīng)網(wǎng)絡(luò)擁有更優(yōu)秀的性能。

表2 BP網(wǎng)絡(luò)和GEN-BP網(wǎng)絡(luò)正確率對比

圖4 BP網(wǎng)絡(luò)和GEN-BP網(wǎng)絡(luò)正確率擬合線

圖5為遺傳算法個體適應(yīng)度隨進化代數(shù)變化曲線,個體適應(yīng)度值為訓(xùn)練數(shù)據(jù)的絕對誤差,因此個體適應(yīng)度越低個體越優(yōu)。遺傳算法通過不斷的迭代,個體適應(yīng)度隨進化次數(shù)增加不斷減小,性能越來越優(yōu),當進化次數(shù)到達16次后,適應(yīng)度值趨于穩(wěn)定且適應(yīng)度值最小,網(wǎng)絡(luò)性能最好。

圖5 最優(yōu)個體適應(yīng)度值

表3中,BP時間表示BP神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)訓(xùn)練和對測試樣本進行識別的總時間;GEN-BP時間表示將遺傳算法求得的最優(yōu)權(quán)值閾值賦予給BP神經(jīng)網(wǎng)絡(luò)后,BP神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)訓(xùn)練和對測試樣本進行識別的總時間;GENETIC時間表示遺傳算法迭代求取BP神經(jīng)網(wǎng)絡(luò)最優(yōu)權(quán)值閾值的時間。從圖表結(jié)果中可以看出BP神經(jīng)網(wǎng)絡(luò)的平均識別時間明顯高于GEN-BP神經(jīng)網(wǎng)絡(luò)的識別時間,高出約27.85%,且識別時間的方差也高于GEN-BP神經(jīng)網(wǎng)絡(luò),說明遺傳算法優(yōu)化過的BP神經(jīng)網(wǎng)絡(luò),收斂速度更快,具有更優(yōu)的收斂性,同時波動小擁有更好的穩(wěn)定性,其神經(jīng)網(wǎng)絡(luò)性能更優(yōu)。但GEN-BP神經(jīng)網(wǎng)絡(luò)中遺傳算法在迭代求取最優(yōu)適應(yīng)度時,消耗太多時間,導(dǎo)致整個網(wǎng)絡(luò)的執(zhí)行過長,實時性存在不足,需要改進。

表3 BP神經(jīng)網(wǎng)絡(luò)和GEN-BP神經(jīng)網(wǎng)絡(luò)識別時間對比

圖7為遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的多維和一維信息十次實驗結(jié)果的正確率擬合線對比圖,其中一維信息為源端口號和報文長度兩種,并將神經(jīng)網(wǎng)絡(luò)中的輸入?yún)?shù)設(shè)為1,隱含層節(jié)點個數(shù)設(shè)為3。從圖中可以看出,多維正確率擬合要遠高于兩種一維正確率擬合線很多,說明本文提出的六維輸入信息相對于傳統(tǒng)的一維信息,其識別正確率要更高,識別性能更優(yōu)。

圖6 BP神經(jīng)網(wǎng)絡(luò)和GEN-BP神經(jīng)網(wǎng)絡(luò)識別時間

圖7 多維和一維正確率擬合線

6 結(jié)語

針對網(wǎng)絡(luò)游戲數(shù)據(jù)流識別問題,本文提出利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)進行識別,相對于傳統(tǒng)的一維輸入信息識別,提出利用多維輸入信息進行識別。通過仿真分析,將BP神經(jīng)網(wǎng)絡(luò)和GEN-BP神經(jīng)網(wǎng)絡(luò)的識別結(jié)果進行對比,說明GEN-BP神經(jīng)網(wǎng)絡(luò)相比BP神經(jīng)網(wǎng)絡(luò)不僅正確率更高,而且波動更小,穩(wěn)定性更好,性能更優(yōu)。同時多維信息的識別率遠高于一維信息的識別率。說明本文選取的多維信息,利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)能夠很好地識別網(wǎng)絡(luò)游戲流。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息超市
展會信息
展會信息
展會信息
展會信息
展會信息
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲—日韩aV在线| 狠狠色丁香婷婷综合| 久久毛片免费基地| 日韩激情成人| 欧美精品二区| 久久国产成人精品国产成人亚洲| 久久a毛片| 久久精品波多野结衣| 99在线视频网站| 天天干伊人| 色综合久久无码网| 成人一级黄色毛片| 成人午夜免费观看| 欧美国产日产一区二区| 波多野结衣一区二区三区88| 欧美亚洲国产一区| 免费a在线观看播放| 久久久久久久久久国产精品| 亚洲日韩精品无码专区| 日韩a级毛片| 成人欧美在线观看| 精品91自产拍在线| 91在线播放免费不卡无毒| 九九精品在线观看| 国产成人精品2021欧美日韩| 精品少妇人妻一区二区| yy6080理论大片一级久久| 91美女在线| 国产精品深爱在线| 极品私人尤物在线精品首页| 国产va欧美va在线观看| 国产精品自拍露脸视频| 女人天堂av免费| 欧美狠狠干| 久久亚洲国产最新网站| 在线免费无码视频| 亚洲Av激情网五月天| 亚洲激情区| 国产18在线播放| 在线视频精品一区| 国产另类视频| 国产福利小视频高清在线观看| 国产精品19p| 久久无码免费束人妻| 欧美在线视频不卡| 久久国产精品国产自线拍| 欧美第一页在线| 欧美黑人欧美精品刺激| 一级毛片免费观看久| 久久天天躁狠狠躁夜夜2020一| 亚洲中文精品人人永久免费| 亚洲精品在线观看91| 国产极品美女在线播放| 丰满人妻中出白浆| 久久久91人妻无码精品蜜桃HD| 久久亚洲日本不卡一区二区| 欧美午夜在线观看| 日韩欧美国产中文| 视频二区国产精品职场同事| 亚洲无码精彩视频在线观看 | 久久青青草原亚洲av无码| 99ri精品视频在线观看播放| 国产综合另类小说色区色噜噜| 亚洲妓女综合网995久久| 女人18毛片一级毛片在线 | 欧美日韩国产一级| 精品综合久久久久久97超人| 一区二区理伦视频| 国产免费黄| 特级毛片8级毛片免费观看| 欲色天天综合网| 国产色图在线观看| 国产欧美视频综合二区 | 激情在线网| 玖玖免费视频在线观看| 欧美成人免费午夜全| 国产精品一老牛影视频| 大香伊人久久| 国产真实二区一区在线亚洲| 亚洲日本在线免费观看| 亚洲国产精品无码AV| 国产精品播放|