999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KNN?SVM的垃圾郵件過濾模型

2017-01-12 09:28:01林蔭
現代電子技術 2016年23期
關鍵詞:特征提取

林蔭

摘 要: 垃圾郵件具有特征維數高、樣本不平衡等特點,針對近鄰算法(KNN)或支持向量機(SVM)存在虛警率高等難題,基于組合優化理論,提出基于KNN?SVM的垃圾郵件過濾組合模型。首先提取垃圾郵件的特征項,并構建垃圾郵件過濾模型的輸入向量,然后采用KNN對垃圾郵件訓練樣本進行選擇,將訓練樣本縮減到k個,并采用支持向量機對[k]個樣本訓練和建模進行垃圾郵件過濾,最后采用中文郵件集對KNN?SVM的性能進行分析。結果表明,KNN?SVM提高了垃圾郵件過濾的準確率,大幅度降低了虛警率,而且垃圾郵件的過濾速度可以滿足郵件處理的在線需求。

關鍵詞: 垃圾郵件; 模式識別提取; K近鄰算法; 特征提取

中圖分類號: TN915.08?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2016)23?0090?03

Spam mail filtering model based on K nearest neighbor algorithm

and support vector machine

LIN Yin

(Changzhou University Huaide College, Changzhou 213016, China)

Abstract: The spam mail has the characteristics of high feature dimension, unbalance sample, etc. To overcome the high false alarm rate existing in K nearest neighbor (KNN) algorithm or support vector machine (SVM), a spam mail filtering combination model based on KNN?SVM is proposed according to the combinatorial optimization theory. The feature items of spam mail are extracted to construct the input vector of the spam mail filtering model. And then the KNN algorithm is used to select the training samples of spam mail, so as to reduce the quantity training samples to k. The support vector machine is used to train and model the k samples for spam mail filtering. The Chinese mail set is used to analyze the performance of KNN?SVM. The results show that the KNN?SVM based model improved the accuracy of spam mail filtering, reduced the false alarm rate greatly, and the filtering speed of spam mail can meet the online demand of mail processing.

Keywords: spam mail; pattern recognition and extraction; K nearest neighbor algorithm; feature extraction

0 引 言

電子郵件(Email)是包含文字、圖像、視頻的特殊文本,已經成為網絡上交流、溝通的工具[1]。大量統計與研究報告表明,垃圾郵件占了全世界郵件的50%以上,對人們生活、工作帶來了干擾,而且浪費了大量的網絡帶寬[2]。提高垃圾郵件過濾的準確率,保證信息安全,引起了人們的廣泛關注[3]。

垃圾郵件過濾的實質是對郵件進行分類,將其識別為合法郵件或者垃圾郵件,若為垃圾郵件則過濾掉,否則讓其通過[4]。垃圾郵件過濾是一種分類問題,分類器的構建直接影響過濾效果,當前常采用K近鄰算法(K Nearest Neighbor Algorithm,KNN)和支持向量機(Support Vector Machine,SVM)[5?7]建立垃圾郵件過濾的分類器,對于英文郵件,它們獲得了理想的過濾效果,垃圾郵件過濾的虛警率低[8]。對于中文郵件,過濾效果卻很差,這是因為中文垃圾郵件是一種超文本,不僅具有一般文本的特征,而且樣本極不平均、特征維數高,采用KNN進行處理,易出現“維數災”難題,過濾速度慢;SVM雖然不存在“維數災”難題,但是對于大規模垃圾郵件,訓練時間長,無法滿足垃圾郵件在線過濾要求[9?11]。

為了提高垃圾郵件過濾的準確率,加快垃圾郵件的過濾速度,提出了KNN?SVM的垃圾郵件過濾組合模型,并采用中文郵件數據集對KNN?SVM的性能進行測試,以驗證其有效性,同時與當前經典垃圾郵件過濾模型進行對比分析,驗證其優越性。

1 提取郵件特征

垃圾郵件的建模與過濾過程中,無法直接對垃圾郵件進行過濾操作,首先需要對郵件內容進行分析,找出一些關鍵元素,如詞、字或短詞等,從而提取郵件特征。通常采用有向圖描述郵件內容,結構見圖1,S表示郵件中的句子,NP表示郵件中的名詞,VP表示郵件中的動詞,PP表示郵件的介詞短語。

4 結 語

在垃圾郵件過濾過程中,分類器的設計直接影響過濾效果,針對當前單一KNN和SVM的缺陷,提出了基于KNN?SVM的垃圾郵件過濾模型,結果表明,KNN?SVM能夠改善垃圾郵件的過濾效率,而且可以獲得較高的過濾準確率,具有良好的實際應用價值。

在未來的工作中將引入更優的SVM參數優化方法,對SVM分類能力進行改善以獲得更好的垃圾郵件過濾結果。

參考文獻

[1] 王斌,潘文鋒.基于內容的垃圾郵件過濾技術綜述[J].中文信息學報,2005,19(5):4?5.

[2] 李國明,湯文亮.反垃圾郵件技術及其最新展望[J].網絡通訊與安全,2007(16):959.

[3] 梁志文,楊金民,李元旗.基于多項式模型和低風險的貝葉斯垃圾郵件過濾算法[J].中南大學學報(自然科學版),2013,44(7):2787?2792.

[4] 李瀟,羅軍勇,尹美娟.基于結構特征分析與文本分類的郵件篩選[J].計算機工程與設計,2010,31(21):4555?4558.

[5] 鄭煒,沈文,張英鵬.基于改進樸素貝葉斯算法的垃圾郵件過濾器的研究[J].西北工業大學學報,2010,28(4):622?627.

[6] 李雯,劉培玉.基于貝葉斯的垃圾郵件過濾算法的研究[J].計算機工程與應用,2007,43(23):174?177.

[7] 陳琴,梁家榮.基于遺傳算法和發送行為的垃圾郵件檢測模型[J].廣西大學學報(自然科學版),2010,35(6):1007?1010.

[8] 張俊麗,張帆.改進KNN算法在垃圾郵件過濾中的應用[J].現代圖書情報技術,2007(4):75?78.

[9] 鄒漢斌,雷紅艷,鄧衛紅.支持向量機在反垃圾郵件過濾中的應用[J].計算機工程與設計,2007,28(9):2015?2017.

[10] 強永妍,楊庚.中文垃圾郵件的索引分詞法的研究與設計[J].計算機應用,2007,27(9):2234?2236.

[11] 雷劍剛,孫細斌.一種智能垃圾郵件過濾模型的仿真研究[J].計算機仿真,2013,30(5):370?373.

[12] 閆鵬,鄭雪峰,朱建勇,等.一種基于嵌入式特征選擇的垃圾郵件過濾模型[J].小型微型計算機系統,2009,30(8):1616?1620.

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
淺析零件圖像的特征提取和識別方法
機電信息(2015年3期)2015-02-27 15:54:46
基于CATIA的橡皮囊成形零件的特征提取
主站蜘蛛池模板: 亚洲男人天堂网址| 欧美激情视频二区| 国产精品视频导航| 亚洲黄色片免费看| 国产粉嫩粉嫩的18在线播放91| 青青青草国产| 全部无卡免费的毛片在线看| 色成人亚洲| 亚洲一级毛片| jizz亚洲高清在线观看| 久996视频精品免费观看| 四虎永久在线| 亚洲日韩在线满18点击进入| A级全黄试看30分钟小视频| 国产爽歪歪免费视频在线观看 | 永久在线精品免费视频观看| 美女内射视频WWW网站午夜 | 日本一区二区三区精品国产| 国产精品自在拍首页视频8| 日韩激情成人| 成人一级免费视频| 亚洲男人的天堂视频| 在线观看国产小视频| 国产凹凸一区在线观看视频| 国产a v无码专区亚洲av| 欧美A级V片在线观看| 国产特级毛片aaaaaa| 国产在线97| 日韩免费毛片| 国产人在线成免费视频| 高清码无在线看| 99青青青精品视频在线| 婷婷亚洲最大| 黄色网在线| 亚洲精品天堂自在久久77| 久久人人爽人人爽人人片aV东京热| 少妇精品在线| 国产麻豆va精品视频| 国产精品午夜福利麻豆| 女人18一级毛片免费观看 | 日本欧美午夜| 久久久波多野结衣av一区二区| 精品国产乱码久久久久久一区二区| 亚洲AV无码不卡无码| 最新国语自产精品视频在| 国产精品3p视频| 少妇极品熟妇人妻专区视频| 亚洲欧洲自拍拍偷午夜色| 国产精品无码作爱| 中文字幕无线码一区| 人人爽人人爽人人片| 国产真实乱子伦视频播放| 欧美专区在线观看| 99久久精品国产综合婷婷| 欧美日韩免费在线视频| 国产成人区在线观看视频| 在线日韩一区二区| 无码视频国产精品一区二区| 欧美国产综合视频| 国产成人精品高清在线| 国产女同自拍视频| 自偷自拍三级全三级视频| 色天堂无毒不卡| 一级毛片在线播放免费| 91青青草视频| 在线观看欧美国产| 鲁鲁鲁爽爽爽在线视频观看| 欧美成人一级| 18禁影院亚洲专区| 看国产毛片| 欧美人与性动交a欧美精品| 免费毛片视频| 亚洲中字无码AV电影在线观看| 伊大人香蕉久久网欧美| 欧美成人国产| 最新国产麻豆aⅴ精品无| 一本久道久综合久久鬼色| 国产一国产一有一级毛片视频| 激情五月婷婷综合网| 91精品国产无线乱码在线| 欧美日韩国产高清一区二区三区| 国国产a国产片免费麻豆|