(1.南京工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院 南京 210009; 2.南京大學(xué) 軟件新技術(shù)國家重點(diǎn)實(shí)驗(yàn)室 南京 210093)
摘 要:垃圾郵件過濾是一種主動(dòng)安全防御技術(shù)。首先概述了垃圾郵件過濾的發(fā)展歷史及其基本概念;然后根據(jù)不同的標(biāo)準(zhǔn)對(duì)垃圾郵件過濾技術(shù)進(jìn)行了分類,并評(píng)述了各種垃圾郵件過濾方法和技術(shù);最后展望了垃圾郵件過濾技術(shù)及其產(chǎn)品的發(fā)展方向。
關(guān)鍵詞:垃圾郵件; 貝葉斯過濾; 人工免疫; 發(fā)送方策略框架
中圖分類號(hào):TP393文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2009)05-1612-04
Survey on spam filtering technology
CHEN Zhixian1,2
(1.College of Information Science Engineering Nanjing University of Technology Nanjing 210009 China; 2.State Key Laboratory for Novel Software Technology Nanjing University Nanjing 210093 China)
Abstract:Spam filtering is an important technology of active security defense. This paper firstly introduced the development of spam filtering technology and its basic concept. And then classified spam filtering technology according to different standards meanwhile analyzed and evaluated the popular and major spam filtering methods and technologies. Finally forecasted the development direction of spam filtering technology and its products.
Key words:spam; Bayesian filtering; artificial immune; SPF(sender policy framework)
1 垃圾郵件的發(fā)展歷史和基本概念
1978年,史上首封垃圾電子郵件產(chǎn)生了。這是由美國DEC公司的一名市場(chǎng)銷售代表,向所有西海岸ARPANET用戶發(fā)送的關(guān)于DEC20新型計(jì)算機(jī)的廣告郵件[1]。
1994年4月,Canter和Siegel的律師事務(wù)所把一封郵件發(fā)送到6 000多個(gè)新聞組,宣傳獲得美國國內(nèi)綠卡的法律支持。Spam(垃圾郵件)一詞首次被使用,用來描述新聞或電子郵件的主動(dòng)性發(fā)布。
1995年5月,第一個(gè)垃圾郵件發(fā)送程序Floodgate面世,通過該程序可以一次自動(dòng)發(fā)送大量郵件。
同年8月,市面上出現(xiàn)數(shù)百萬個(gè)電子郵件地址公開出售。自此垃圾郵件開始逐漸充斥在人們的生活中。
直到1996年3月,人們才第一次提出用SpamBlock的方法來防范垃圾郵件,如使用REMOVE.TO.REPLY的工具來過濾郵件地址。
1997年第一個(gè)反垃圾郵件組織——CAUCE正式成立。
通常意義上的垃圾郵件是指未經(jīng)主動(dòng)請(qǐng)求的、帶有商業(yè)性或政治性目的的大批量的電子郵件。2003年2月26日,中國互聯(lián)網(wǎng)協(xié)會(huì)在《中國互聯(lián)網(wǎng)協(xié)會(huì)反垃圾郵件規(guī)范》中是這樣定義垃圾郵件的[2]:
a)收件人事先沒有提出要求或者同意接收的廣告、電子刊物、各種形式的宣傳品等宣傳性的電子郵件;
b)收件人無法拒收的電子郵件;
c)隱藏發(fā)件人身份、地址、標(biāo)題等信息的電子郵件;
d)含有虛假的信息源、發(fā)件人、路由等信息的電子郵件。
2 垃圾郵件過濾技術(shù)的分類
垃圾郵件問題已經(jīng)引起人們的高度重視,目前已有不少垃圾郵件過濾技術(shù)的研究工作。垃圾郵件過濾技術(shù)可以從不同的角度進(jìn)行分類,主要有以下幾種分類方法。
2.1 根據(jù)郵件系統(tǒng)的角色結(jié)構(gòu)劃分
根據(jù)郵件系統(tǒng)的角色結(jié)構(gòu)不同劃分,可將垃圾郵件過濾技術(shù)分為兩類:a)基于服務(wù)器端的過濾;b)基于客戶端的過濾。
基于服務(wù)器端的過濾通常運(yùn)行于郵件服務(wù)器或者一臺(tái)單獨(dú)的機(jī)器上,檢查信頭、信體及附件并且阻止那些垃圾信息。通常基于服務(wù)器端的過濾均參考了一個(gè)眾所周知的垃圾郵件制造者或來源地的列表,并最終把來自這些地方的信息篩除。最常用的列表是在郵件濫用預(yù)防系統(tǒng)(MAPS)中的黑洞列表。MAPS可以刪除其DNS列表中的垃圾郵件制造者的服務(wù)提供商的地址,以阻止垃圾郵件對(duì)后端系統(tǒng)的干擾。這種過濾技術(shù)可以在信息通過之前,根據(jù)MAPS的域名服務(wù)器來檢查入境信息的頭信息,查看基于服務(wù)器端的垃圾過濾軟件的列表[3]。
基于客戶端的過濾軟件是反垃圾郵件的最后一道屏障,用戶可以采用客戶端過濾軟件,利用其分揀和過濾功能來設(shè)定規(guī)則,把接收下來的郵件進(jìn)行檢查和匹配,從發(fā)件地址、主題、正文內(nèi)容中的關(guān)鍵詞,對(duì)那些符合垃圾郵件特征的郵件執(zhí)行特定操作[3]。目前較常用的客戶端郵件過濾技術(shù)有內(nèi)容過濾和安全列表兩種。
2.2 根據(jù)垃圾郵件過濾技術(shù)劃分
從垃圾郵件過濾技術(shù)上劃分,目前主要有基于規(guī)則的過濾和基于統(tǒng)計(jì)的過濾兩類。
基于規(guī)則的過濾就是在郵件內(nèi)容中尋找特定的模式,包括信頭分析、群發(fā)過濾和關(guān)鍵詞精確匹配等。這類方法效率較高,規(guī)則庫可以共享,推廣性很強(qiáng),但不足之處在于規(guī)則需要用戶手工創(chuàng)建和維護(hù),更新速度慢,且新規(guī)則的產(chǎn)生速度往往跟不上新垃圾郵件出現(xiàn)的速度,即它的時(shí)效性較差。基于規(guī)則的過濾方法有Ripper方法[4]、決策樹方法[5]、Boosting方法[5,6]和粗糙集方法[7]等。
基于統(tǒng)計(jì)的過濾指使用統(tǒng)計(jì)方法來解決郵件的二元分類問題,其中分類器是根據(jù)垃圾郵件和正常郵件的樣本集訓(xùn)練出來的。這類方法的優(yōu)點(diǎn)就是分類器由程序自動(dòng)訓(xùn)練出來,算法性能較好,通過及時(shí)更新樣本訓(xùn)練集就可以使分類器更新的速度和垃圾郵件出現(xiàn)的速度相匹配,時(shí)效性較強(qiáng)。然而該方法的缺點(diǎn)是計(jì)算復(fù)雜度很高,同時(shí)分類器不能共享,某個(gè)用戶用自己的郵件樣本集訓(xùn)練出來的分類器對(duì)其他用戶可能效果不佳,因此該方法的推廣性較差?;诮y(tǒng)計(jì)的過濾方法有Bayesian分類算法[8]、SVM方法[9]等。
3 垃圾郵件過濾方法和技術(shù)
3.1 黑/白名單
黑/白名單技術(shù)是一種被廣泛應(yīng)用的垃圾郵件過濾技術(shù)[10]。黑名單是一組郵件服務(wù)器的IP地址、域名或者email地址列表,來自黑名單列表中的任何郵件都被認(rèn)為是垃圾郵件;相對(duì)于黑名單,來自白名單列表中的任何郵件都被認(rèn)為是合法郵件。后來由這個(gè)機(jī)制,各家安全廠商逐漸將其演化為實(shí)時(shí)更新的黑名單(realtime blackhole list,RBL)機(jī)制。
由于垃圾郵件經(jīng)常會(huì)改變其IP地址和ISP[11],或者通過不在黑名單上的open relay來轉(zhuǎn)發(fā),這種技術(shù)在實(shí)際應(yīng)用中的表現(xiàn)往往不盡如人意,漏報(bào)率和誤報(bào)率較高,同時(shí)黑/白名單的實(shí)時(shí)更新和維護(hù)也比較困難。
3.2 簡單模式匹配
研究人員Bass等人[12]早期嘗試從他們的SMTP服務(wù)器轉(zhuǎn)發(fā)的郵件中濾除掉大量的垃圾郵件,為此他們成立了一個(gè)研究小組Tiger Team,提出了一個(gè)基于簡單模式匹配的過濾器的模型并實(shí)現(xiàn)了原型系統(tǒng)。該模型在今天看來也許有點(diǎn)過于簡單,但是在后來卻被幾乎所有的垃圾郵件過濾軟件所采用。
簡單模式匹配基本上是通過對(duì)郵件信頭、信體進(jìn)行多項(xiàng)過濾,如結(jié)合內(nèi)容掃描識(shí)別帶有垃圾郵件內(nèi)容的關(guān)鍵詞,對(duì)此類郵件進(jìn)行特殊處理。但是,在經(jīng)過了一段時(shí)間的應(yīng)用后,大部分的使用者都發(fā)現(xiàn)了它們致命的缺陷:誤報(bào)率高、處理性能很低、語言依賴性強(qiáng)、抗干擾能力差,非常不適合在網(wǎng)關(guān)處使用。其主要原因在于模式匹配過濾的技術(shù)局限性,它們需要將郵件完整接收下來后,對(duì)郵件按照指定語言進(jìn)行分詞處理,并與一個(gè)有著數(shù)以百萬計(jì)的詞庫進(jìn)行逐一匹配,從而判斷該郵件是否為垃圾郵件。由于人類語言變通連貫性極強(qiáng),隨意修改關(guān)鍵詞內(nèi)容,原先的詞庫里就找不到匹配的關(guān)鍵詞,從而就無法判斷出垃圾郵件。同時(shí),由于這種技術(shù)需要進(jìn)行大量的匹配運(yùn)算,對(duì)CPU和內(nèi)存的占用率極高,很容易成為處理的瓶頸。3.3 SPF
SMTP協(xié)議存在一個(gè)很大的安全缺陷,即任何客戶端可以聲稱任意的信源地址。這個(gè)缺陷被眾多的垃圾郵件發(fā)送者利用來偽造信源地址[13]。
SPF的提出就是為了解決這個(gè)問題。作為SMTP協(xié)議的一個(gè)補(bǔ)充,SPF是一種源頭認(rèn)證的技術(shù),防止發(fā)件人假冒。在傳統(tǒng)的郵件系統(tǒng)中,域名服務(wù)器只有收件服務(wù)器的記錄,主要記錄這個(gè)域中哪幾臺(tái)服務(wù)器是用來收郵件的,但是沒有發(fā)件服務(wù)器的記錄。而SPF則在DNS中加入發(fā)件服務(wù)器的記錄。系統(tǒng)對(duì)收到的郵件的源IP地址采用反向DNS查找驗(yàn)證其真實(shí)性,如果該郵件的來源IP地址不在反向DNS查找提供的域的發(fā)件服務(wù)器的列表中,則該郵件被判定為偽造發(fā)件人,這樣該郵件就會(huì)被系統(tǒng)攔截掉。
目前看來,SPF技術(shù)從發(fā)件的源頭上進(jìn)行判斷,是非??茖W(xué)和合理的。但困擾SPF的是,這種技術(shù)要求所有的反垃圾郵件廠商需要支持同一個(gè)標(biāo)準(zhǔn),也要求全球所有電子郵件系統(tǒng)的域名系統(tǒng)都要進(jìn)行改造和升級(jí)。換句話說,SPF技術(shù)很好,但實(shí)施起來的難度和成本太高,涉及面太廣,因此進(jìn)一步普及還有難度。
3.4 基于簡單貝葉斯分類器的過濾
有兩組研究人員首先嘗試用貝葉斯算法來解決垃圾郵件問題:一組人員是來自曼尼托巴大學(xué)的Pantel和Lin;另一組是斯坦福大學(xué)的Sahami和三名來自微軟公司的研究人員[14]。隨后Graham在他們的研究基礎(chǔ)上編寫了開放源碼加以實(shí)現(xiàn)。
貝葉斯分類器現(xiàn)在被廣泛用于郵件過濾軟件,它被證明是非常有效的,特別是在誤報(bào)率的處理方面。在文獻(xiàn)[15]中,貝葉斯分類器在不丟棄任何合法郵件的情況下檢測(cè)出了91.7%的垃圾郵件。貝葉斯分類器的工作原理[8]是把每封郵件表示為一向量x=〈x1,x2,…,xn〉。其中xi是屬性Xi的取值,每個(gè)屬性都代表一個(gè)特定的過濾關(guān)鍵詞出現(xiàn)與否。當(dāng)給定關(guān)鍵詞出現(xiàn)時(shí)該屬性被設(shè)置為1,即xi=1;否則設(shè)置為0,即xi=0。因此,一封郵件里的單詞和類c中的單詞是否匹配就可以用向量x=〈1,0,0,0,1,1,1,1,0〉表示。這里n=9。根據(jù)貝葉斯理論,x屬于類c的概率可以表示為
P(c|x)=[P(c)×P(x|c)]/[∑kk∈{spam,legitimate}P(k)×P(x|k)]
(1)
簡單貝葉斯分類器與傳統(tǒng)意義上的貝葉斯分類器有所不同,它假設(shè)屬性X1,X2,…,Xn和類c是條件獨(dú)立的。因此,式(1)可改寫成
P(c|x)=[P(c)×∏ni=1P(xi|c(diǎn))]/
[∑kk∈{spam,legitimate}P(k)×∏ni=1P(xi|k)](2)
由于計(jì)算P(xi|c(diǎn))比計(jì)算P(xi|c(diǎn))要簡單得多,通過設(shè)置概率的閾值,如0.9,即可把郵件加以分類,則P(spam|x)≥0.9的郵件被認(rèn)為是垃圾郵件;P(spam|x)<0.9的郵件則認(rèn)為是合法郵件。閾值的取值通常是綜合考慮漏報(bào)率和誤報(bào)率而定的。
3.5 基于規(guī)則評(píng)分系統(tǒng)的過濾
基于規(guī)則的評(píng)分系統(tǒng)也被稱為人工智能系統(tǒng),是比較復(fù)雜的垃圾郵件過濾技術(shù)。其規(guī)則的合適評(píng)分是通過對(duì)大量的正常郵件和垃圾郵件的綜合分析得出的。在對(duì)每封郵件應(yīng)用了各項(xiàng)規(guī)則之后,計(jì)算出一個(gè)分值來表示其為垃圾郵件的可能性。這種評(píng)分系統(tǒng)的規(guī)則處理的對(duì)象包括信頭、信體以及郵件結(jié)構(gòu)等。每條規(guī)則都對(duì)應(yīng)一個(gè)分值。每封郵件的分值就是所匹配規(guī)則的分值之和。當(dāng)郵件的得分超過了某個(gè)設(shè)定的閾值,該郵件就會(huì)被標(biāo)志為垃圾郵件,然后交由用戶作出最終抉擇。
盡管基于規(guī)則評(píng)分系統(tǒng)的過濾盡量實(shí)現(xiàn)了自動(dòng)識(shí)別垃圾郵件的功能,但它依然存在一些問題,如規(guī)則的產(chǎn)生、規(guī)則分值的確定等,同時(shí)為了防止垃圾郵件發(fā)送者學(xué)習(xí)并適應(yīng)這些規(guī)則,需要定期對(duì)系統(tǒng)中的規(guī)則進(jìn)行動(dòng)態(tài)調(diào)整和修改。
3.6 基于行為模式識(shí)別的過濾
垃圾郵件行為模式識(shí)別是在對(duì)大量垃圾郵件樣本進(jìn)行統(tǒng)計(jì)、分析和計(jì)算的基礎(chǔ)上,建立垃圾郵件行為模式數(shù)學(xué)模型。其中發(fā)信行為特征包括時(shí)間、頻度、發(fā)送IP、協(xié)議聲明特征、發(fā)送指紋等。這種模型采用概率統(tǒng)計(jì)數(shù)學(xué)模型對(duì)垃圾郵件進(jìn)行分析和統(tǒng)計(jì),在理論計(jì)算上有著90%以上的垃圾郵件區(qū)分度。
這種技術(shù)在實(shí)際應(yīng)用中不僅可以提高垃圾郵件的識(shí)別率,而且不需要對(duì)信件的全部內(nèi)容進(jìn)行掃描,從而極大地提高了計(jì)算處理能力;同時(shí),由于行為模式識(shí)別技術(shù)對(duì)郵件的判定準(zhǔn)則與郵件內(nèi)容無關(guān),可最大限度地確保其正常通信不受影響[16]。
3.7 其他新技術(shù)
此外,還有基于欄桿技術(shù)的過濾技術(shù)[17]、基于人工免疫的分類算法[18~21]、基于神經(jīng)網(wǎng)絡(luò)的過濾技術(shù)[22]等。其中文獻(xiàn)[18]提出了一種基于人工免疫的多層垃圾郵件過濾算法,利用分層檢測(cè)的思想來過濾垃圾郵件。文獻(xiàn)[19]中采用人工免疫系統(tǒng)來進(jìn)行郵件的分類,提出了AISEC算法來連續(xù)地將郵件分為感興趣和不感興趣兩類。文獻(xiàn)[20,21]也采用人工免疫的方法,以正則表達(dá)式為抗體來檢測(cè)垃圾郵件。文獻(xiàn)[22]中采用人工神經(jīng)網(wǎng)絡(luò)的方法來進(jìn)行垃圾郵件的過濾。限于篇幅,這里就不再一一討論。
表1為上述大多數(shù)方式在識(shí)別率、誤報(bào)率、可擴(kuò)展性和實(shí)施難度方面的一個(gè)基本比較。
4 反垃圾郵件的發(fā)展趨勢(shì)
4.1 安全技術(shù)綜合集成
垃圾郵件過濾技術(shù)將與數(shù)據(jù)身份認(rèn)證、傳輸加密、郵件病毒過濾、安全審計(jì)等多項(xiàng)安全技術(shù)逐漸融合,形成一個(gè)綜合的信息安全保障體系,共同促進(jìn)郵件服務(wù)器綜合安全防護(hù)水平的提高。
4.2 多層次的立體防御
采用分層攔截、網(wǎng)關(guān)桌面相互配合策略,通過互聯(lián)網(wǎng)云內(nèi)拓?fù)洹W(wǎng)關(guān)設(shè)備攔截—桌面防護(hù)三個(gè)層次的相互配合,構(gòu)建起一個(gè)多層次的立體防御網(wǎng)絡(luò)模型。模型的三個(gè)層次互為補(bǔ)充,在不同層次使用不同的防范技術(shù)來攔截和阻斷垃圾郵件威脅。其中在桌面層還涉及到與反病毒軟件的互動(dòng)。
4.3 支持多語言環(huán)境
雖然標(biāo)準(zhǔn)化有利于不同類型垃圾郵件過濾技術(shù)之間的數(shù)據(jù)融合及與其他安全產(chǎn)品之間的互動(dòng),但是在實(shí)際過程中往往難以實(shí)現(xiàn)。例如單單中文就存在若干字符集,如GB18030、GB2312、Big5等,無法做到統(tǒng)一所有的郵件客戶端。所以,支持多語言環(huán)境的郵件服務(wù)器和客戶端產(chǎn)品將是未來的發(fā)展方向之一。
4.4 性能評(píng)估
近幾年來垃圾郵件過濾技術(shù)得到了極大的發(fā)展,各種各樣的過濾手段層出不窮。但是,對(duì)垃圾郵件過濾系統(tǒng)和相關(guān)算法的評(píng)估工作卻表現(xiàn)平淡,這就難以提高反垃圾郵件系統(tǒng)的穩(wěn)健性。目前,反垃圾郵件評(píng)估還沒有工業(yè)標(biāo)準(zhǔn)可以參考,評(píng)估指標(biāo)一般包括:a)可靠性。系統(tǒng)具有容錯(cuò)能力,可以不間斷地運(yùn)行。b)可用性。系統(tǒng)開銷小,不會(huì)嚴(yán)重降低網(wǎng)絡(luò)系統(tǒng)性能。c)可擴(kuò)展性。系統(tǒng)具有模塊化結(jié)構(gòu),易于添加新的功能,能夠隨時(shí)適應(yīng)系統(tǒng)環(huán)境的改變。d)實(shí)時(shí)性。系統(tǒng)能夠?qū)崟r(shí)地發(fā)現(xiàn)垃圾郵件,并采取相應(yīng)的響應(yīng)措施。e)準(zhǔn)確性。系統(tǒng)具有較低的誤報(bào)率和漏報(bào)率。f)抗攻擊性。反垃圾郵件產(chǎn)品本身應(yīng)具備防范拒絕服務(wù)攻擊及分布式拒絕服務(wù)攻擊、大量非法連接請(qǐng)求攻擊、字典算法攻擊等多方面的抗攻擊能力,能夠很好地保護(hù)自身的安全。
未來,反垃圾郵件系統(tǒng)的過濾技術(shù)與評(píng)估方法研究將是一個(gè)熱點(diǎn)。
4.5 法律的完善
美國政府于2003年率先立法。傳送色情電子郵件、快速致富法等垃圾電子郵件者將面對(duì)最高入獄1年和罰款100萬美元的處罰,罪行嚴(yán)重者可能會(huì)面臨5年的監(jiān)禁。此外,英國、法國、加拿大、澳大利亞、印度、日本、韓國等不少國家都制定了反垃圾郵件法案。只有政府盡快地對(duì)反垃圾郵件立法,在法律上嚴(yán)懲那些販賣電子郵件地址、非法盜取電子郵件數(shù)據(jù)庫的行為,才能從根本上杜絕垃圾郵件。
5 結(jié)束語
本文討論了垃圾郵件的發(fā)展過程和基本概念,研究分析了各種垃圾郵件過濾方法和技術(shù),同時(shí),就反垃圾郵件技術(shù)的發(fā)展趨勢(shì)進(jìn)行了概括總結(jié)。經(jīng)過了十幾年的發(fā)展,盡管從法律到技術(shù),人們都已經(jīng)提出多種反垃圾郵件的方法和思路,但新興的反垃圾郵件技術(shù)也層出不窮,無論哪一種技術(shù),都無法完全應(yīng)對(duì)多變的垃圾郵件。因此,要想徹底遏制這一互聯(lián)網(wǎng)的衍生變種,還有很長的路要走。垃圾郵件和反垃圾郵件的技術(shù)演進(jìn)必將長期存在,反垃圾郵件技術(shù)的發(fā)展將日益趨向于全面包含最有效垃圾郵件阻斷技術(shù)的整體解決方案。
參考文獻(xiàn):
[1]TEMPLETON B. Reaction to the DEC spam of 1978[EB/OL]. [2008-10-07]. http://www.templetons.com/brad/spamreact.html.
[2]中國互聯(lián)網(wǎng)協(xié)會(huì).中國互聯(lián)網(wǎng)協(xié)會(huì)反垃圾郵件規(guī)范[EB/OL].(2003-03-26) [2008-10-07]. http://www.isc.org.cn/20020417/ca134119.htm.
[3]李云春.反垃圾郵件技術(shù)的措施及主流技術(shù)[J].計(jì)算機(jī)教育,2005(1):67-70.
[4]COHEN W. Learning rules that classify email[C]//Proc ofAAAI Spring Symposium of Machine Learning in Information Access. Stanford CA: AAAI Press 1996: 18-25.
[5]CARRERAS X MARQUEZ L. Boosting trees for antispam email filtering[C]//Proc of the 4th International Conference on Recent Advances in Natural Language Processing. 2001:58-64.
[6]NICHOLAS T. Using AdaBoost and decision stumps to identify spam email[R]. [S.l.]:Stanford University 2003.
[7]王德文,趙文清,朱永利.一個(gè)基于粗糙集理論的郵件分類模型[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(18):167-170.
[8]ANDROUTSOPOULOS I KOUTSIAS J CHANDRINOS K V et al. An evaluation of naive Bayesian antispam filtering[C]//Proc of the 11th European Conference on Machine Learning. Barcelona Spain: SpringerVerlag 2000:9-17.
[9]DRUCKER H WU Donghui VAPNIK V N. Support vector machines for spam categorization[J]. IEEE Trans on Neural Networks 1999 20(5): 1048-1054.
[10]PELLETIER L ALMHANA J CHOULAKIAN V. Adaptive filtering of spam[C]//Proc of the 2nd Annual Conference on Communication Networks and Services Research. Fredericton N B: IEEE Computer Society 2004: 218-224.
[11]McFEDRIES P. Technically speaking: slicing the ham from spam[J]. IEEE Spectrum 2004 41(4): 72.
[12]BASS T COL L WATT G. A simple framework for filtering queued SMTP mail (cyberwar countermeasures)[C]//Proc of IEEE MILCOM’97. Monterey CA: IEEE Computer Society 1997:1140-1144.
[13]LI Cheng WANG Weinong. Internet mail transfer and check system based on intelligence mobile agents[C]//Proc ofSymposium on Applications and the Internet. Nara City: IEEE Computer Society 2002: 2-3.
[14]VAUGHANNICHOLS S J. Saving private email[J]. IEEE Spectrum 2003 40(8): 40-44.
[15]O’BRIEN C VOGEL C. Spam filters:Bayes vs Chisquared; letters vs words[C]//Proc of the 1st International Symposium on Information and Communication Technologies. Dublin Ireland: Trinity College Dublin 2003: 291-296.
[16]張志華.反垃圾郵件行為模式識(shí)別技術(shù)的應(yīng)用[J].肇慶學(xué)院學(xué)報(bào),2007,28(5):23-26.
[17]InfoWorld. Mirapoint RazorGate deftly returns spam to senders[EB/OL]. [2008-10-07]. http://www.mirapoint.com/pdfs/reviews/infoworld_mirapoint_excellent.pdf.
[18]張澤明,羅文堅(jiān),王煦法.一種基于人工免疫的多層垃圾郵件過濾算法[J].電子學(xué)報(bào),2006,34(9):1616-1620.
[19]SECKER A FREITAS A A,TIMMIS J. AISEC: an artificial immune system for email classification[C]//Proc ofCongress on Evolutionary Computation. Canberra: IEEE Press 2003: 131-138.
[20]ODA T WHITE T. Increasing the accuracy of a spamdetecting artificial immune system[C]//Proc ofCongress on Evolutionary Computation. Canberra: IEEE Press 2003: 390-396.
[21]ODA T WHITE T. Developing an immunity to spam[C]//Proc of Genetic and Evolutionary Computation Conference. Chicago: SpringerVerlag 2003: 231-242.
[22]CAO Yukun LIAO Xiaofeng LI Yunfeng. An email filtering approach using neural Network[C]//Proc of International Symposium on Neural networks. Dalian: SpringerVerlag 2004: 688-694.