摘要:P2P流量逐漸成為互聯(lián)網(wǎng)流量的重要組成部分,精確分類P2P流量對于有效管理網(wǎng)絡和合理利用網(wǎng)絡資源都具有重要意義。近年來,利用機器學習方法處理P2P流量分類問題已成為流量識別領域的一個新興研究方向。利用決策樹中的C4.5算法和P2P流量的特征屬性來構建決策樹模型,進而完成P2P流量分類問題。實驗結果表明,基于決策樹模型的方法能有效避免P2P網(wǎng)絡流分布變化所帶來的不穩(wěn)定性;與SVM(support vector machine,支持向量機)、NBK(naive Bayes using kerrlel deflsity estimation,改進的樸素貝葉斯)方法相比,其平均分類準確率能提高至少3.83個百分點。
關鍵詞:對等網(wǎng);流量特征;決策樹;流量分類;C4.5
中圖分類號:TP393 文獻標志碼:A 文章編號:1001-3695(2009)12-4690-04