魏 丹,楊春琴,李國元,賈文龍,于興忠
(1.中國石油化工股份有限公司西北油田分公司,新疆烏魯木齊 830011;2.南京天技通信技術(shù)實業(yè)有限公司,江蘇南京 210019)
遺傳算法不具備直接處理問題空間參數(shù)的能力,因此,在求解過程中,需要轉(zhuǎn)化待求解問題為既定遺傳空間內(nèi)的獨立個體,而該轉(zhuǎn)換操作常被稱為數(shù)據(jù)信息編碼。與其他執(zhí)行算法不同,遺傳算法具備完備性、健全性與非冗余性。完備性是問題空間可以將所有候選解完全包含在內(nèi)[1];健全性是每一個候選解能在原問題空間中找到與之相關(guān)的編碼節(jié)點的關(guān)鍵;非冗余性是任何一個編碼節(jié)點只能與一個候選解保持對應(yīng)關(guān)系。為準確編碼問題空間內(nèi)的信息節(jié)點,在執(zhí)行遺傳算法時,建立完整的適應(yīng)度函數(shù),一方面判斷編碼個體與候選解之間的數(shù)值對應(yīng)關(guān)系,另一方面按需評估求取目標函數(shù)[2]。
在互聯(lián)網(wǎng)環(huán)境中,由初始節(jié)點指向目標節(jié)點的數(shù)據(jù)反饋行為可稱為數(shù)據(jù)傳輸,而隨著網(wǎng)絡(luò)運行時間的延長,會出現(xiàn)一些表現(xiàn)行為明顯異于標準數(shù)據(jù)的異常信息參量[3]。網(wǎng)絡(luò)傳輸異常數(shù)據(jù)與標準數(shù)據(jù)之間存在一定的相對誤差,該誤差影響網(wǎng)絡(luò)主機對于傳輸異常數(shù)據(jù)的精準檢測能力,并且導(dǎo)致數(shù)據(jù)信息的傳輸完整性下降。
為避免上述情況的發(fā)生,基于改進生成式對抗網(wǎng)絡(luò)的識別方法在分析異常數(shù)據(jù)與標準數(shù)據(jù)之間差異性的同時,分別統(tǒng)計兩種不同信息參量的目標傳輸節(jié)點,并通過實時對比的方式,突出兩者之間的相對誤差水平[4]。但是該方法的實用能力有限,并不能完全滿足精準檢測網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實際應(yīng)用需求。
為解決上述問題,以遺傳算法為基礎(chǔ),結(jié)合相關(guān)性檢測閾值等,設(shè)計一種新型的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法。以期提高網(wǎng)絡(luò)傳輸?shù)男阅埽瑸榫W(wǎng)絡(luò)的發(fā)展做出貢獻。
網(wǎng)絡(luò)傳輸異常數(shù)據(jù)處理始終以遺傳網(wǎng)絡(luò)為基礎(chǔ),在遺傳適應(yīng)度函數(shù)條件的支持下,定義數(shù)據(jù)編碼標簽,具體操作流程如下。
遺傳網(wǎng)絡(luò)負責處理傳輸異常信息參量,并通過過渡節(jié)點將數(shù)據(jù)信息整合成滿足網(wǎng)絡(luò)應(yīng)用需求的輸出形式。為準確檢測傳輸異常數(shù)據(jù)信息,在布置遺傳網(wǎng)絡(luò)時,選取過渡節(jié)點、輸出節(jié)點[5-6]。完整的遺傳網(wǎng)絡(luò)布局形式如圖1 所示。
為避免其他傳輸節(jié)點消耗網(wǎng)絡(luò)傳輸異常數(shù)據(jù),在部署遺傳網(wǎng)絡(luò)時,將過渡節(jié)點直接連接到輸出節(jié)點。
遺傳適應(yīng)度函數(shù)決定了遺傳算法的應(yīng)用進化方向,主要作用是評估網(wǎng)絡(luò)環(huán)境中數(shù)據(jù)信息個體的優(yōu)劣程度。在遺傳網(wǎng)絡(luò)中,適應(yīng)度函數(shù)的選取影響網(wǎng)絡(luò)主機檢測和判別傳輸異常信息參量的能力[7-8]。
設(shè)計遺傳適應(yīng)度函數(shù),計算遺傳算法中網(wǎng)絡(luò)傳輸各個個體的概率:
式中,fi表示網(wǎng)絡(luò)傳輸數(shù)據(jù)個體i的適應(yīng)度;N表示網(wǎng)絡(luò)傳輸數(shù)據(jù)種群的規(guī)模;計算各個體的累計概率為:
選擇操作后網(wǎng)絡(luò)數(shù)據(jù)群體中的最差個體,交叉操作其與最優(yōu)個體的副本,從而加速尋優(yōu)的速度,保證了設(shè)計算法的收斂性。設(shè)Q1和Q2為準備交叉的兩個網(wǎng)絡(luò)傳輸數(shù)據(jù)個體,在Q1和Q2的第i位進行交叉,則兩個體交叉運算后所產(chǎn)生的新個體的第i位分別為:
式中,λ表示[0,1]之間的隨機數(shù)。
設(shè)J1、J2表示兩個隨機選取的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)定標值,且J1≠J2的不等式條件恒成立。a表示遺傳適應(yīng)系數(shù)的初始值,ΔS表示遺傳應(yīng)用網(wǎng)絡(luò)在單位時間內(nèi)承載的數(shù)據(jù)信息傳輸總量,β表示遺傳算法的數(shù)據(jù)判別系數(shù)。聯(lián)立上述物理量,可將遺傳網(wǎng)絡(luò)的適應(yīng)度函數(shù)定義為:
在遺傳網(wǎng)絡(luò)中,以遺傳適應(yīng)度函數(shù)為基礎(chǔ)判別條件,定義傳輸異常數(shù)據(jù)編碼標簽。
對于網(wǎng)絡(luò)傳輸異常數(shù)據(jù)而言,數(shù)據(jù)編碼標簽的定義需要同時具備信息編碼特征、數(shù)據(jù)篩選系數(shù)兩項物理條件[9-10]。信息編碼特征常表示為f,該項物理量的實際取值越大,表示定義標簽的延伸能力越強。數(shù)據(jù)篩選系數(shù)表示為χ,該項物理量的最小取值始終大于自然數(shù)“1”。在上述物理量的支持下,聯(lián)立上述公式,定義遺傳算法的傳輸異常數(shù)據(jù)編碼標簽為:
式中,δ表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的編碼常值;dδ表示與δ相關(guān)的標簽項目指標;d0表示標簽項目指標的初始值表示待編碼的網(wǎng)絡(luò)異常數(shù)據(jù)傳輸均值。為實現(xiàn)對于網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的精準檢測,在提取傳輸異常數(shù)據(jù)參量時,需要遵循編碼標簽定義原則。
在遺傳算法的支持下,按照異常簇點定義、數(shù)據(jù)傳輸密度確定、相關(guān)性檢測閾值計算的處理流程,完成網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法的設(shè)計與應(yīng)用。
異常簇點定義了傳輸異常數(shù)據(jù)在遺傳網(wǎng)絡(luò)所處的存儲位置。遺傳網(wǎng)絡(luò)異常簇點的分布密度水平越小,消耗的時間越長[11-12]。設(shè)l1、l2表示兩個不相等的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)遺傳特征向量,?表示遺傳網(wǎng)絡(luò)的異常數(shù)據(jù)信息參量差值,表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的檢測校正系數(shù),g表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實時排列系數(shù)。在上述物理量的支持下,聯(lián)立公式(5),可定義遺傳算法的異常簇點的表達式為:
規(guī)定在遺傳網(wǎng)絡(luò)中,異常簇點定義的表達式直接影響異常數(shù)據(jù)信息參量的實時傳輸密度水平。
待執(zhí)行檢測指令與信息參量一一對應(yīng),因此,控制數(shù)據(jù)傳輸密度指標的數(shù)值水平在既定標準區(qū)間內(nèi)[13-14]。設(shè)φ表示檢測指令的初始執(zhí)行頻率,w表示網(wǎng)絡(luò)異常數(shù)據(jù)的傳輸定義系數(shù),uw表示w條件下的數(shù)據(jù)信息檢測標量,umax表示數(shù)據(jù)信息檢測標量最大值,η表示網(wǎng)絡(luò)主機對于傳輸異常數(shù)據(jù)的感應(yīng)系數(shù)。聯(lián)立上述物理量,可定義網(wǎng)絡(luò)異常數(shù)據(jù)的傳輸密度表達式為:
在遺傳算法的作用下,數(shù)據(jù)傳輸密度指標的取值始終處于(0,1] 的物理區(qū)間。
式中,R表示既定檢測向量;表示遺傳應(yīng)用網(wǎng)絡(luò)對于傳輸異常數(shù)據(jù)的干預(yù)向量;表示遺傳應(yīng)用網(wǎng)絡(luò)對于傳輸異常數(shù)據(jù)的檢測向量。在遺傳應(yīng)用網(wǎng)絡(luò)中,相關(guān)性檢測閾值將異常數(shù)據(jù)與標準數(shù)據(jù)間的相對誤差控制在既定數(shù)值標準之內(nèi),以此保障網(wǎng)絡(luò)主機檢測傳輸異常數(shù)據(jù)的精準度。
在Windows 10 系統(tǒng)中,利用Linux 虛擬機分流處理網(wǎng)絡(luò)傳輸數(shù)據(jù)。首先,輸入混合信息參量至網(wǎng)絡(luò)應(yīng)用主機;其次,分別分流處理異常傳輸數(shù)據(jù)、常規(guī)傳輸數(shù)據(jù);然后,分別存儲異常傳輸數(shù)據(jù)、常規(guī)傳輸數(shù)據(jù)于不同的數(shù)據(jù)庫主機;最后,屏蔽常規(guī)傳輸信息存儲數(shù)據(jù)庫,將異常數(shù)據(jù)庫主機中存儲的傳輸信息參量作為該次實驗的研究對象。
表1 記錄了該次實驗過程中采用主機元件的設(shè)備名稱。

表1 實驗用主機元件
為保證實驗結(jié)果的公平性,除采用檢測方法不同外,實驗組(基于遺傳算法的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法)、對照組(改進生成式對抗網(wǎng)絡(luò)的識別方法)其他參數(shù)配置情況始終保持一致。具體實驗流程如下:
步驟一:按需連接網(wǎng)絡(luò)主機、CPU 設(shè)備、外存設(shè)備、內(nèi)存設(shè)備等多個實驗元件;
步驟二:提取存儲于數(shù)據(jù)庫主機的網(wǎng)絡(luò)傳輸異常數(shù)據(jù),作為實驗待檢信息參量;
步驟三:將遺傳算法指令輸入實驗主機中,并定義實驗數(shù)據(jù)為實驗組變量;
步驟四:輸入改進生成式對抗網(wǎng)絡(luò)識別算法至實驗主機,并定義實驗數(shù)據(jù)為對照組變量。
異常數(shù)據(jù)校正誤差指標的數(shù)值水平,能夠反映網(wǎng)絡(luò)主機檢測異常性傳輸數(shù)據(jù)的能力。異常數(shù)據(jù)校正誤差與標準數(shù)據(jù)校正誤差之間的物理差值越小,表示網(wǎng)絡(luò)主機對于異常性傳輸數(shù)據(jù)的檢測準確性越強。
幾個周末過去后,一個中午,阿花在車上甩給我一個紅包,一千塊。我明白她的意思,卻裝著不懂,問什么意思。阿花說有付出就有回報,你每次來作指導(dǎo),這是你的勞動所得。我開廠也是賺錢的,不能讓你白幫。我把紅包放在車上,我說我只做你的朋友,收了錢,我就成你的員工了。她佯裝生了氣,說你不收錢,以后就別來幫我了。她的眸子里流露幽怨的光。
圖2 反映了實驗組、對照組異常數(shù)據(jù)校正誤差指標的數(shù)值變化情況。

圖2 異常數(shù)據(jù)校正誤差
實驗組:對于實驗組異常數(shù)據(jù)信息參量而言,校正誤差指標數(shù)值呈現(xiàn)出先增大,再減小,最后來回波動的變化情況。在數(shù)據(jù)傳輸量等于3.0 MB 時,實驗組校正誤差指標達到最大值1.87×10-3MB。整個實驗過程,實驗組異常數(shù)據(jù)校正誤差與標準數(shù)據(jù)校正誤差之間的物理數(shù)值差的最大值達到了0.25×10-3MB。
對照組:對于對照組異常數(shù)據(jù)信息參量而言,校正誤差指標數(shù)值呈現(xiàn)先上升再下降,然后連續(xù)上升,最后呈現(xiàn)小幅下降的變化狀態(tài)。在數(shù)據(jù)傳輸量等于7.0 MB 時,對照組校正誤差指標達到其最大值2.42×10-3MB。整個實驗過程中,對照組異常數(shù)據(jù)校正誤差與標準數(shù)據(jù)校正誤差之間的物理數(shù)值差的最大值為0.80×10-3MB,與實驗組極值差相比,上升了0.55×10-3MB。
綜合上述實驗研究結(jié)果,可知該次實驗結(jié)論如下:
1)標準數(shù)據(jù)校正誤差指標呈現(xiàn)出明顯波動的數(shù)值變化狀態(tài);
2)在基于改進生成式對抗網(wǎng)絡(luò)的識別方法的作用下,異常數(shù)據(jù)校正誤差指標數(shù)值的變化趨勢并不能與標準數(shù)據(jù)校正誤差指標數(shù)值的變化趨勢保持一致,且前者的均值水平明顯更高,不符合精準檢測網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實際應(yīng)用需求;
3)在基于遺傳算法的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法的作用下,異常數(shù)據(jù)校正誤差指標數(shù)值的變化趨勢大體上與標準數(shù)據(jù)校正誤差指標數(shù)值的變化趨勢保持一致,且二者均值水平相差較小,提高了網(wǎng)絡(luò)主機對異常性傳輸數(shù)據(jù)的檢測精度。
新型網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法,在基于改進生成式對抗網(wǎng)絡(luò)的識別方法的基礎(chǔ)上,聯(lián)合遺傳算法理論,建立完整的適應(yīng)度函數(shù)條件,通過數(shù)據(jù)編碼標簽結(jié)構(gòu),計算數(shù)據(jù)傳輸密度指標的具體數(shù)值。驗證可知,該方法有效控制了異常數(shù)據(jù)校正誤差指標的數(shù)值水平,并且對于網(wǎng)絡(luò)主機而言,有效提高了異常性傳輸數(shù)據(jù)的精準檢測能力。