◆崔丹丹
(開封大學信息工程學院 河南 475000)
對于校園網(wǎng)來說,P2P流量控制系統(tǒng)的兼容性較好,能夠讓技術與設備、設備與設備之間兼容性提升,可以加強系統(tǒng)的擴展要求,在此后的使用中可以進行設備方面的擴展,同時網(wǎng)絡應該是開放的,這已經(jīng)成為流量識別系統(tǒng)的一個主要的發(fā)展方向,系統(tǒng)的相關集成開發(fā)商可以有效的利用提供的端口來進行進一步的開發(fā),我們也可以采用國外的設備來對其進行改造與升級,這也是我國流量識別技術的發(fā)展趨勢,采用國際通用的協(xié)議與端口,可以加強其兼容性,這樣就能使得其重構性增強,成本降低。我們主要考慮校園網(wǎng)系統(tǒng)的技術性與先進性,同時要加強系統(tǒng)的穩(wěn)定性,考慮在流量發(fā)生故障或出現(xiàn)問題時,能夠讓數(shù)據(jù)進行有效的保存,同時能夠讓數(shù)據(jù)的精確度提升,并且短時間內(nèi)可以恢復到原始的狀態(tài),能夠有不錯的抗擾動能力。在P2P流量識別系統(tǒng)設計時,主要保證技術上可行,同時經(jīng)濟成本不能過高,在我們的科技高速發(fā)展的同時,市場上的高新技術越來越多,因此我們應當在滿足要求的情況下,盡量的選用可以長期使用的設備,根據(jù)可行性與經(jīng)濟性,同時能夠盡量的配合周圍一些設備的工作,兼容性強一些,能夠在此基礎上建立較好的整體化系統(tǒng)設計方案,滿足國家相關部門的要求。
基于IP地址與端口的分類技術由于僅利用UDP/TCP端口號來分類流量,計算開銷小,所以可擴展性好。另一方面,基于端口的分類技術僅使用單一數(shù)據(jù)包就分類流量,若數(shù)據(jù)包丟失勢必影響分類,所以健壯性就差。同時,基于端口的分類技術的準確性也為差。基于深層數(shù)據(jù)包檢測的分類由于負載加密和隱私等因素的考慮,其分類的準確性正在逐漸下降。而基于流量統(tǒng)計特征的分類技術和基于網(wǎng)絡行為模式的分類技術需要采集和分析大量的數(shù)據(jù),計算開銷很大,可擴展性也因之就差。但隨著分析數(shù)據(jù)的不斷增多,這兩種分類技術的準確性也不斷提高,并且由于需要分析大量的數(shù)據(jù),個別的數(shù)據(jù)包丟失,亂序等因素對流量分類的影響不大,由此健壯性就較好。基于人工智能的流量分類技術和分布式協(xié)同分類技術具有一定的網(wǎng)絡環(huán)境自適應能力,所以健壯性和準確性均好,但其可擴展性相對于基于端口的分類技術,則較差。
實際網(wǎng)絡中不同的節(jié)點有著不同的網(wǎng)絡直徑與功能:有的節(jié)點起著服務器的功能,向網(wǎng)絡其他節(jié)點提供資源傳輸服務;有的節(jié)點起著客戶端的功能,接收服務器提供的各項服務。選取P2P流量的行為特征時,需要考慮如下情況:P2P網(wǎng)絡中的節(jié)點既可以作為服務器向其他對等節(jié)點提供服務,又可以作為客戶端接收其他對等節(jié)點提供的服務,因此,具有P2P節(jié)點和非P2P節(jié)點呈現(xiàn)出有差異的行為特征。本文關注的多流行為特征主要包括:多流會話時間的變化,多流大小的變化,多流上下行速度對比,多流IP地址與端口數(shù)目對比等。
人工神經(jīng)網(wǎng)絡是一種通過模仿人類的思考方式來進行流量識別的數(shù)學模型,它們的結構是極為復雜的,可以通過節(jié)點之間的相互連接來進行信息的處理與傳遞,人工神經(jīng)網(wǎng)絡對于新事物可以進行學習和自適應,通過之前的訓練數(shù)據(jù),來對于P2P流量進行分類識別,對于被訓練的對象以及需要計算的對象進行分析,判斷兩者之間的差距,同時根據(jù)權值來對于輸出結果進行計算,神經(jīng)網(wǎng)絡是一種極為重要的運算模型,主要有非常多的神經(jīng)元來進行構成的,每個輸出函數(shù)都和一個節(jié)點相連接,叫做激勵函數(shù),兩個節(jié)點間的連接權值反映了信號的傳輸強度,這和人類自身的細胞是類似的,同時網(wǎng)絡的輸出和連接方式有著極為重要的關系,并且也會受到激勵函數(shù)和權重的影響,網(wǎng)絡自身的計算和逼近方法可以對于最優(yōu)策略進行有效的計算和表達。人工神經(jīng)網(wǎng)絡是模仿生物的實際細胞來進行訓練的,它可以進行單輸入但輸出和多輸入多輸出,同時具有非線性的特點,激活函數(shù)F主要是由輸入分量和權值分量相乘得出的,可以對于P2P流量進行分析,輸出信號要受到神經(jīng)元本身以及F函數(shù)的影響,同時還應該有一定的限制叫做閾值,神經(jīng)網(wǎng)絡主要是通過訓練的方式來進行學習,從而進行P2P流量的識別與分類,對于內(nèi)部的權重進行改變,在實際的分類識別當中,可以使得誤差盡量的減少,達到模仿人類思考的目的。
自適應 P2P流量識別是極為重要的一個發(fā)展方向,自適應P2P流量識別以流量特征為基礎,同時實現(xiàn)了最優(yōu)控制和自動控制的問題,它主要是根據(jù)貝爾曼的優(yōu)化方式,來使得非線性系統(tǒng)和約束性較多的系統(tǒng),都能夠?qū)崿F(xiàn)最優(yōu)識別,不管初始狀態(tài)是如何的,經(jīng)過這樣的優(yōu)化都可以得到最優(yōu)的策略。但是,對于實際的P2P流量識別來說,可能會存在一些問題,在這樣的情況下,就需要采用神經(jīng)網(wǎng)絡的方式對其進行學習與訓練,使得P2P流量識別能夠?qū)崿F(xiàn)強化學習,同時,可以近似的構造帶代價函數(shù)來進行規(guī)劃,使得最后的結果更加滿足于實際的需求。自適應的規(guī)劃方式可以有效的對于無法確定相關數(shù)學表達式的優(yōu)化問題進行解決,可以對于系統(tǒng)的輸入輸出來對其進行模擬與仿真,建立相關的最優(yōu)化模型,但是這個模型還是存在一些不確定的因素的,因此要將狀態(tài)與變量之間進行解耦運算,使得維度高的系統(tǒng)得以簡化,便于計算,同時對于離散化的系統(tǒng),要將其轉(zhuǎn)換為連續(xù)系統(tǒng)進行求解,這樣就可以使得復雜 P2P流量識別能夠?qū)崿F(xiàn)最優(yōu)化。
對分布式P2P流量識別進行有效的分析,可以將其的技術優(yōu)勢完全的發(fā)揮出來,分布式的流量控制決定了其傳輸需要依靠一定的內(nèi)外部條件才能執(zhí)行,同時這些流量必須通過相關裝置的配合才能進行傳輸,同時也無法進行調(diào)度,分布式P2P流量識別使得潮流分布進行了改變與優(yōu)化,對于P2P流量識別來說,分布式管理可能會帶來多個方向的信號潮流,給其中的管理與調(diào)度帶來了其他的問題,所以在發(fā)生故障時,一些分布式信號需要進行退出,這樣就可能讓系統(tǒng)的暫態(tài)平衡更難實現(xiàn),對于系統(tǒng)來說它的危害較大,這樣會導致系統(tǒng)的安全性受到影響,同時大量的分布信號可能會使得系統(tǒng)管理人員的調(diào)度負擔變得非常大,分布信號管理在運行時具有隨機性,故障具有不可知性,這樣就可能會使得整個系統(tǒng)的穩(wěn)定性有所偏差,因此對于并網(wǎng)的分布式信號運行,一定要進行相關的規(guī)定,施加一定的規(guī)則來對其調(diào)度運輸進行統(tǒng)一,這樣就有利于其運行時可以科學化規(guī)范化,避免出現(xiàn)更加嚴重的問題,造成事故隱患與風險。分布式P2P流量識別技術對于設備的要求是非常高的,因為其會直接影響到用戶的使用質(zhì)量,同時對于信號的管理方面有著極大的問題,需要依靠計算機等相關來技術來對其進行管理,同時,分布式P2P流量識別沒有得到廣泛應用的原因,主要在于技術方面出現(xiàn)問題,而且傳統(tǒng)的網(wǎng)絡智能化程度不夠,無法進行自動化的管理,但是分布式信號管理的優(yōu)勢也是非常明顯的,它可以把流量之間進存儲與供給,使得信息網(wǎng)絡可以根據(jù)負荷的實際情況來進行調(diào)整,就讓系統(tǒng)的內(nèi)部成本與效益更加的平衡。
隨著計算速度和準確率的不斷提升,P2P流量識別技術處理的應用越來越普遍,同時推動了網(wǎng)絡技術的發(fā)展速度,其雖然有很多無法克服的缺點,但是借助科技發(fā)展的趨勢,也在一步一步推動各行業(yè)蓬勃發(fā)展,讓生活更加智能化。P2P流量處理大大的減少了人力的成本,提升了網(wǎng)絡傳輸?shù)臏蚀_性,智能識別是重要的技術基礎,它在工業(yè)生產(chǎn)領域有著深遠的影響。
[1]于明,朱超.利用半監(jiān)督近鄰傳播聚類算法實現(xiàn)P2P流量識別[J].哈爾濱工程大學學報,2013.
[2]袁雪美,王暉,張鑫,劉亞杰. P2P流量識別技術綜述[J].計算機應用,2009.
[3]陳云菁. P2P流量識別技術的研究[D].揚州大學,2009.
[4]趙瑞.基于特征串的 P2P流量識別研究與實現(xiàn)[D].電子科技大學,2009.