999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

使用機器學習算法分類P2P流量的方法研究

2022-04-29 16:48:37羅遠軍
計算機應用文摘 2022年2期
關鍵詞:研究分析

關鍵詞:機器學習算法;算法分類;P2P流量;智能算法;研究分析

中圖法分類號:TP181 文獻標識碼:A

1 P2P流的定義和特征產生概述

1.1 P2P流的定義和表示

本文將互聯網上P2P通信節點之間產生的流量依據協議通信的五元組(IP、源Prot、目的IP、目的Prot及IP協議)定位為流。

1.2流特征的產生

我們將流的特征主要分為兩種,分別是前向和后向的雙向特征,前向流和后向流的定義如下——前向流:源節點→目的節點;后向流:目的節點→源節點。

經過均方差的計算和分析之后可以發現,雙向報文的個數、長度等可以形成36個候選特征,對于本文進行的機器學習算法分類P2P流量方面的研究具有重要的意義和作用。

2基于ReliefF?CFS方法的流的特征選擇

流的特征選擇對于最終的研究成果會產生直接影響。所謂的特征選擇,需要相關工作人員去掉相關度不高或者是冗余特征,進而實現最優的特征得以脫穎而出。后續依據評估函數與分類器之間的聯系,將特征選擇方法主要分為兩種模式,分別是過濾器模式和封裝器模式,其中過濾器模式評估函數與分類器無關,而封裝器模式主要采用分類錯誤率或者是正確率作為評價函數,選擇的速度比較慢,同時還需要交叉認證和大量的計算資源。因此,于流的特征選擇方面需要采用過濾器模式,并且使用基于ReliefF算法和基于相關性的方法結合的方式選擇特征子集,這就是所謂的ReliefF?CFS方法,能夠取得很好的效果和作用。

2.1基于ReliefF?CFS方法的初步P2P特征選擇方法

ReliefF其實是一種有監督特征的算則算法,是傳統Relief算法的一種改進算法,其能夠在多類特征分類中進行對應的運用,并且可以取得很好的效果和作用。基于ReliefF?CFS方法的初步P2P特征選擇基本思想為:需要從每一個不同的類別流樣本集合中選擇G個最近鄰樣本流,并且相關工作人員需要對每一個樣本流的特征權重進行對應的計算,經過計算就能夠得到流的不同特征與類別的相關性情況。其中,選擇相關性比較大的特征就能夠作為流量分類的特征。后續經過基于ReliefF?CFS方法所得到的按權值還需要按照從大到小的順序進行排列,同時設定一個閾值,其中大于閾值的特征被選為基于相關性的特征選擇方法的初始特征集。

2.2基于CFS方法的特征選擇

前文提及,由于ReliefF算法只考慮特征與類別的相關性,而沒有考慮特征自身具備的相關性,因此經過ReliefF算法選擇的特征相關性可能存在一定的缺失。因此需要在經過ReliefF算法選擇得到初步的流的特征子集之后,在原有的基礎之上通過相關性特征選擇方法繼續進行特征的選擇,以此提升特征的相關性,相關性的計算公式如下所示。

在上式中,s表示含有q個特征的特征子集,Rs則是對特征子集相關度的一個評估結果。從上述公式中也可以看出,當分類與特征之間的相關度越高,而特征與特征之間的相關度比較小的情況下,特征子集的分類效果就會越好。在本文進行的研究中,主要采取BestFirst搜索策略結合正向搜索方向的方式,搜索得到結果優化程度比較高的特征子集,并且將其作為最后的特征選擇結果。

3基于機器學習算法的P2P流量分類器

機器學習是人工智能技術中最為重要的一個分支,也是一個最重要的研究方向。在研究和分析的過程中,主要需要從樣本中尋找一定的規律,并且利用這一規律對未知的數據信息進行對應的預測工作。目前來看,機器學習過程主要由以下兩個部分組成,分別是分類模型的建立和分類。相關工作人員首先需要利用訓練數據建立起分類模型,并且在建立好的模型基礎之上,產生一個分類器,針對物質數據信息進行分類處理。本文主要應用基于支持向量機、C4.5決策樹以及K?最鄰近單中機器學習算法的分類器。

3.1基于支持向量機的P2P網絡流量分類器

支持向量機是由Boser等人在統計學習原理和結構風險最小化原則基礎之上提出的一種機器學習算法。基于支持向量機的P2P網絡流量分類器主要是針對兩類分類問題而提出的,其主要原理是運用分類超平面實現空間中兩類樣本點的正確分割,并且保持兩類樣本的間隔最大。

而且,如果處于線性不可分的情況下,可以通過選擇好的非線性映射函數,也就是所謂的核函數選擇,將訓練樣本流映射到一個高維特征空間中,并且在這一空間中構造線性判別函數,進而實現原空間中非線性判別函數,這樣有利于確保機器具備比較好的推廣能力,同時在核函數的作用下,可以解決原本存在的維數災難問題,其算法的復雜程度與樣本維數無關。另外,對網絡中的P2P流量進行識別,接著對經典1?vs?all多分類SVM算法進行改進,我們提出了一個新的基于MC?SVM(多分類支持向量機)的分類判別方法,用來把之前所識別出的未知具體應用層分類的P2P流量進行應用層分類,最后通過真實的網絡流量數據實驗,證明其可行性。

3.2基于C4.5決策樹的P2P網絡流量分類器

決策樹模型是一種比較簡單同時適用性也比較強的非參數分類器,其不僅不需要對數據進行假設,同時還可以在分類過程中具備比較強的計算速度,分類結果的穩健性也較強。基于C4.5決策樹的P2P網絡流量分類器,其中每一個分支所代表的都是一個測試輸出,而每一個葉節點代表的是類別,而且C4.5算法還是D3算法的一種拓展,有利于分類達到較好的效果和作用。

并且在生成決策樹之后,可以采用剪枝技術進行優化和完善,使得糾正過度的擬合問題可以得到有效的處理。簡單來說,剪枝技術是剪去樹中不能提高預測準確率的分,進而提升分類結果的科學合理性。此外,相關工作人員還需要通過每個葉節點最少實例數設置的方式,進而對決策樹的規模進行有效控制,而置信因子的設置則用來確定樹的修建程序。

4結論

從文中闡述內容中不難看出,基于ReliefF?CFS的特征選擇方法與傳統特征選擇具有較大的區別。本文提出的幾種使用機器學習算法分類P2P流量分類器能夠取得很好的效果和作用,同時其優勢在于實時流的分類應用,因此后續也可以著重進行這一方面的持續優化和完善,這對于國內網絡通信領域的發展具有重要的現實意義,需要予以高度重視。

作者簡介:

羅遠軍(1971—),碩士,講師,研究方向:移動互聯網、大數據、網絡體系結構。

猜你喜歡
研究分析
耕地質量長期定位監測點技術分析
基于互聯網金融與小微企業融資模式創新分析
幼兒園體育活動中滲透安全教育的實踐及研究
基于低年級小學語文的識字教學分析
感染性眼內炎病因及治療效果分析
淺談高中數學新課改教學
新時期我國商業銀行轉型發展研究
網絡犯罪的刑事管轄權研究
商情(2016年39期)2016-11-21 10:06:08
校園網絡安全的體系研究
信息化條件下武警部隊通信保障探析
主站蜘蛛池模板: 国产杨幂丝袜av在线播放| 精品一區二區久久久久久久網站| 成人欧美在线观看| 亚洲成年人网| 中国成人在线视频| 三区在线视频| 在线精品亚洲国产| 亚洲人成人伊人成综合网无码| 精品久久香蕉国产线看观看gif| 国产福利免费视频| 国产成人夜色91| 欧美性猛交一区二区三区| 亚洲二区视频| 亚洲AV无码久久精品色欲| AⅤ色综合久久天堂AV色综合| 亚洲全网成人资源在线观看| 国产精品久久精品| 久久综合亚洲色一区二区三区| 丁香五月激情图片| jizz国产视频| 国产成人福利在线视老湿机| 国产精选小视频在线观看| Jizz国产色系免费| 亚洲福利视频网址| 一本大道视频精品人妻| 久久www视频| 亚洲人成网站色7799在线播放| 特级欧美视频aaaaaa| 青青草91视频| 国产精品一区二区久久精品无码| 久久黄色毛片| 另类综合视频| 亚洲男人的天堂久久香蕉网| 成人免费网站久久久| 精品国产免费观看| 欧美日韩精品一区二区在线线 | 国产永久在线观看| 国产欧美在线观看视频| 中文字幕首页系列人妻| 国产欧美日韩综合一区在线播放| 欧美19综合中文字幕| 老司机精品99在线播放| 日韩一级毛一欧美一国产| 免费无码AV片在线观看中文| 蜜桃视频一区二区三区| 国产综合欧美| 2021亚洲精品不卡a| 国产99久久亚洲综合精品西瓜tv| 日韩在线第三页| 欧美国产日韩一区二区三区精品影视| 一区二区三区四区日韩| 国产精品分类视频分类一区| 日韩小视频在线播放| 国产女人在线视频| 国模私拍一区二区 | 日韩毛片在线播放| 亚洲三级影院| 国产女人18水真多毛片18精品| 福利国产微拍广场一区视频在线| 欧美啪啪一区| 18禁不卡免费网站| 色偷偷综合网| 午夜激情婷婷| 男人天堂亚洲天堂| 日本午夜三级| 日韩专区第一页| 欧美在线国产| 日韩在线欧美在线| 操国产美女| 日韩AV无码免费一二三区 | 国产成人区在线观看视频| 99热免费在线| 99re在线视频观看| 中文国产成人精品久久一| 国产va视频| 中文无码精品A∨在线观看不卡| 91欧美亚洲国产五月天| 亚洲天堂在线免费| 亚洲欧美一区二区三区麻豆| 亚洲国产综合精品一区| 国产午夜不卡| 久99久热只有精品国产15|