999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于變長(zhǎng)指令序列與粗糙集屬性約簡(jiǎn)的惡意代碼檢測(cè)技術(shù)

2013-08-22 01:35:10馮本慧
科技視界 2013年23期
關(guān)鍵詞:指令數(shù)據(jù)挖掘分類

馮本慧

(湖南工學(xué)院,湖南 衡陽(yáng) 421002)

0 引言

隨著計(jì)算機(jī)的普及和Internet的發(fā)展,各種類型的惡意代碼,如木馬、蠕蟲、病毒、僵尸程序等出現(xiàn)和傳播的速度與周期也越來越快,根據(jù)國(guó)家互聯(lián)網(wǎng)應(yīng)急中心的7月底安全周報(bào)顯示[1],國(guó)內(nèi)感染惡意代碼的主機(jī)數(shù)量達(dá)到了64.9萬,被篡改的網(wǎng)站達(dá)到了5875,惡意代碼的防范形式非常的嚴(yán)峻。

傳統(tǒng)的惡意代碼檢測(cè)技術(shù)主要有基于特征碼的檢測(cè)方法與啟發(fā)式的檢測(cè)方法,基于特征碼的檢測(cè)方法過于依賴特征庫(kù),無法檢測(cè)出未知惡意代碼;啟發(fā)的檢測(cè)方法又過于依賴專家的經(jīng)驗(yàn),檢測(cè)效率低且容易誤報(bào),因此亟需一種新的惡意代碼檢測(cè)技術(shù),解決傳統(tǒng)檢測(cè)技術(shù)的缺陷,基于數(shù)據(jù)挖掘的檢測(cè)技術(shù)屬于其中之一,該技術(shù)相對(duì)傳統(tǒng)的檢測(cè)技術(shù)而言,具有快速、智能化的特點(diǎn),無須依賴專家經(jīng)驗(yàn)并且對(duì)未知惡意代碼具有很好的檢測(cè)能力。本文在研究當(dāng)前基于數(shù)據(jù)挖掘的惡意代碼檢測(cè)技術(shù)基礎(chǔ)之上,提出了一種基于變長(zhǎng)指令序列與粗糙集屬性約簡(jiǎn)的惡意代碼檢測(cè)技術(shù)。

1 相關(guān)工作

首次將數(shù)據(jù)挖掘技術(shù)應(yīng)用到惡意代碼檢測(cè)中的學(xué)者當(dāng)屬Schultz[2],他利用從PE文件中獲得的字符串序列、字節(jié)序列、導(dǎo)入表中API調(diào)用函數(shù)作為特征,利用PIPPER、樸素貝葉斯、多重樸素貝葉斯算法進(jìn)行分類學(xué)習(xí),在實(shí)驗(yàn)數(shù)據(jù)集上取得了很高的檢測(cè)精度,遠(yuǎn)高于當(dāng)時(shí)的商業(yè)防病毒軟件。沿著Schultz的開拓性工作,基于數(shù)據(jù)挖掘的惡意代碼檢測(cè)技術(shù)成為惡意代碼檢測(cè)領(lǐng)域研究的熱點(diǎn),研究的重點(diǎn)主要集中在兩個(gè)方面:(1)特征的表示與選擇;(2)分類算法的選擇。其中常用的惡意代碼特征包括:文件結(jié)構(gòu)特征、字節(jié)特征、指令特征等,分類算法主要采用貝葉斯、決策樹、支持向量機(jī)等算法。本文主要關(guān)注于惡意代碼的指令特征,由于惡意代碼與正常文件其行為模式的不同,則其匯編指令也會(huì)存在區(qū)別,Bilar[3]通過研究證實(shí)了這一點(diǎn),他發(fā)現(xiàn)惡意代碼與正常文件之間的某些指令的統(tǒng)計(jì)特征存在很大的區(qū)別,因此指令特征可以作為區(qū)分惡意代碼與正常文件的特征之一。基于此思想,國(guó)外的Santos[4]利用指令序列作為特征進(jìn)行檢測(cè),由于采用了n-gram滑動(dòng)窗口技術(shù),最終獲得的特征維數(shù)非常高,于是他利用互信息進(jìn)行降維,最后利用K鄰近、決策樹、支持向量機(jī)算法進(jìn)行分類檢測(cè),實(shí)驗(yàn)取得的很高的檢測(cè)精度。國(guó)內(nèi)的張健飛[5]等也是利用指令特征進(jìn)行檢測(cè),與Santos不同的是,他采用的是變長(zhǎng)的指令序列作為特征,并且采用了一種分家族的逐層精華的特征選擇方法,他最后通過實(shí)驗(yàn)指出,該方法具有很好的檢測(cè)迷惑代碼的能力。

2 檢測(cè)技術(shù)的創(chuàng)新點(diǎn)與具體步驟

通過以上的研究,本文發(fā)現(xiàn),Santos的檢測(cè)方式,由于獲取的是所有指令所構(gòu)成的指令序列,因此特征的規(guī)模非常大,不便于后續(xù)的學(xué)習(xí),同時(shí)采用了定長(zhǎng)的方式,又可能出現(xiàn)分割特征的問題,而張健飛的檢測(cè)方式,雖然考慮到了指令特征的規(guī)模與特征分割的問題,采用了變長(zhǎng)指令序列并使用層次化的特征選擇方式,但其特征選擇方式過于復(fù)雜,因此本文提出了一種基于變長(zhǎng)指令序列與粗糙集屬性約簡(jiǎn)的惡意代碼檢測(cè)技術(shù),其主要的創(chuàng)新點(diǎn)如下:

(1)采用變長(zhǎng)的常用指令序列作為特征。變長(zhǎng)的方式可以避免分割特征的問題,同時(shí)只考慮常用的匯編指令即所構(gòu)成的指令序列,可以有效的降低最終獲得的特征規(guī)模。

(2)采用粗糙集理論進(jìn)行特征約簡(jiǎn)。由于粗糙集理論具有在不改變分類能力的前提下有效刪除冗余特征的優(yōu)勢(shì),因此將獲得特征再利用粗糙集理論進(jìn)行特征約簡(jiǎn),排除冗余特征的干擾,從而大大加快后續(xù)學(xué)習(xí)算法的分類時(shí)間。

本文提出的檢測(cè)技術(shù)的步驟主要分為兩個(gè)階段。第一個(gè)階段:訓(xùn)練階段;第二個(gè)階段,檢測(cè)階段。訓(xùn)練階段主要完成特征的獲取與約簡(jiǎn)并且完成分類器的訓(xùn)練。檢測(cè)階段,主要利用已獲得的分類器對(duì)測(cè)試樣本進(jìn)行分類并評(píng)估最終的分類結(jié)果。

3 實(shí)驗(yàn)設(shè)置及結(jié)果分析

3.1 實(shí)驗(yàn)設(shè)置

本文的正常文件從干凈的XP系統(tǒng)的系統(tǒng)目錄獲得,共計(jì)308個(gè)樣本,惡意代碼文件來自網(wǎng)絡(luò)收集的86個(gè)PE型的惡意代碼,然后將獲得的樣本分為2等份,一份做訓(xùn)練集,一份做測(cè)試集。實(shí)驗(yàn)平臺(tái)為一臺(tái)安裝XP系統(tǒng)的機(jī)器,CPU為AMD Athlon 64 X2,內(nèi)存為3G。實(shí)驗(yàn)工具包括反匯編工具IDA Pro,數(shù)據(jù)挖掘平臺(tái)Weka。指令序列主要關(guān)注常用的 13 個(gè)指令即 mov、push、call、pop、cmp、jz、lea、test、jmp、add、jnz、retn、xor所構(gòu)成的序列,其長(zhǎng)度基于 Moskovitch[6]的研究本文限定為2~3,粗糙集屬性約簡(jiǎn)算法采用啟發(fā)式的約簡(jiǎn)算法,具體算法可參考文獻(xiàn)[7],由于本文獲得樣本規(guī)模不大,分類算法采用在小樣本上表現(xiàn)很好的支持向量機(jī)算法。

3.2 結(jié)果分析

基于本文的特征提取與處理方法,在訓(xùn)練集上獲得的初始特征維數(shù)只有1150維,約簡(jiǎn)后的特征維數(shù)僅8維,其原因在于,由于只考慮了常用的指令所構(gòu)成的指令序列,而忽略了其它的指令,降低了特征的規(guī)模,因此獲得的初始特征維數(shù)并不是很高,然后再次利用粗糙集理論進(jìn)行特征約簡(jiǎn)后,刪除了其中大量的冗余特征,特征降維幅度非常明顯,僅僅剩余8維,維數(shù)非常低,這樣會(huì)大大降低后續(xù)學(xué)習(xí)算法的分類時(shí)間。

所有的訓(xùn)練集的樣本經(jīng)過特征處理之后,然后利用支持向量機(jī)算法訓(xùn)練分類器,最后在測(cè)試集上進(jìn)行分類測(cè)試,其分類精度與漏報(bào)率如表1所示,

表1 不同指令序列的檢測(cè)精度與漏報(bào)率

從表1可以看出,本文采用的變長(zhǎng)指令序列的方式相對(duì)定長(zhǎng)的方式而言其分類精度更高而且漏報(bào)率更低,因此在實(shí)際應(yīng)用中更具有應(yīng)用價(jià)值。

4 結(jié)論

本文在研究現(xiàn)有的基于數(shù)據(jù)挖掘的惡意代碼檢測(cè)技術(shù)基礎(chǔ)之上,提出了一種基于變長(zhǎng)指令序列與粗糙集屬性約簡(jiǎn)的惡意代碼檢測(cè)技術(shù),該技術(shù)只考慮常用的指令特征構(gòu)成的序列并利用粗糙集理論進(jìn)行屬性約簡(jiǎn),因此最終獲得的序列特征的規(guī)模維數(shù)非常低,僅僅只有8維,同時(shí)本文采用了變長(zhǎng)的指令序列模式,降低了分割特征的風(fēng)險(xiǎn),相對(duì)定長(zhǎng)的指令序列特征而言,其分類精度更高,漏報(bào)率也相對(duì)更低。

[1]國(guó)家互聯(lián)網(wǎng)應(yīng)急響應(yīng)中心.國(guó)家互聯(lián)網(wǎng)應(yīng)急中心的7月底安全周報(bào)[EB/OL].[2012-7-22].http://www.cert.org.cn/publish/main/upload/File/20130731CNCERT30.pdf.

[2]Schultz M G,Eskin E,Zadoc E.Data Mining Methods for Detection of New Malicious Executables[C]//Proceedings of the IEEE Symposium On Security And Privacy.Oakland:IEEE,2001,38-49.

[3]Bilar D.Opcodes as predictor for malware[J].International Journal of Electronic Security and Digital Forensics,2007,1(2):156-168.

[4]Santos I,Brezo F,Nieves J,et al.Idea:Opcode-sequence-based malware detection[M]//Engineering Secure Software and Systems.Springer Berlin Heidelberg,2010:35-43.

[5]張健飛,陳黎飛,郭躬德.檢測(cè)迷惑惡意代碼的層次化特征選擇方法[J].計(jì)算機(jī)應(yīng)用,2012,32(10):2761-2767.

[6]Moskovitch R,Feher C,Tzachar N,et al.Unknown Malcode Detection Using Opcode Representation[M].Intelligence and Security Informatics.Springer Berlin Heidelberg,2008:204-215.

[7]葛浩,李龍澍,楊傳健.改進(jìn)的快速屬性約簡(jiǎn)算法[J].小型微型計(jì)算機(jī)系統(tǒng),2009,30(2):308-312.

猜你喜歡
指令數(shù)據(jù)挖掘分類
聽我指令:大催眠術(shù)
分類算一算
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
分類討論求坐標(biāo)
ARINC661顯控指令快速驗(yàn)證方法
LED照明產(chǎn)品歐盟ErP指令要求解讀
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 色成人综合| 伊人久热这里只有精品视频99| 99视频在线精品免费观看6| 永久在线精品免费视频观看| 久久婷婷色综合老司机| 亚洲欧洲日韩国产综合在线二区| 找国产毛片看| 91娇喘视频| 99资源在线| 99尹人香蕉国产免费天天拍| 日韩在线播放中文字幕| 国产精品污视频| 丰满的熟女一区二区三区l| 九九久久精品免费观看| 欧美中文字幕在线视频| 国产成人免费高清AⅤ| 欧美伊人色综合久久天天| 亚洲人成人无码www| 久久精品午夜视频| 91精品aⅴ无码中文字字幕蜜桃| 日韩欧美在线观看| 一级毛片免费播放视频| 在线观看视频99| 日韩高清一区 | 99久久精品无码专区免费| 国产成人a在线观看视频| 99草精品视频| 五月六月伊人狠狠丁香网| 黄色福利在线| a国产精品| 91在线精品麻豆欧美在线| 999精品色在线观看| 中文字幕欧美日韩| 亚洲黄网在线| 色网在线视频| 亚洲AV无码乱码在线观看裸奔| 色综合中文综合网| 亚洲另类色| 91丝袜美腿高跟国产极品老师| 成人a免费α片在线视频网站| 欧美一级99在线观看国产| 亚洲欧美极品| 18禁不卡免费网站| 婷婷99视频精品全部在线观看| 欧美黑人欧美精品刺激| 国产丝袜无码精品| 99热这里只有精品久久免费| 亚洲色图在线观看| 好紧好深好大乳无码中文字幕| 国产视频入口| 亚洲中文精品人人永久免费| 真实国产精品vr专区| 亚洲经典在线中文字幕 | 国产香蕉一区二区在线网站| 国产全黄a一级毛片| www中文字幕在线观看| 欧美精品色视频| 国产国拍精品视频免费看| 欧美在线视频不卡第一页| 欧美一级高清免费a| 精品成人一区二区三区电影| 在线观看亚洲天堂| 日本高清有码人妻| 婷婷色中文网| 性色一区| 一级毛片在线免费视频| 色综合国产| 国产精品冒白浆免费视频| 欧美色视频在线| 亚洲色图欧美在线| 久久精品一卡日本电影| 亚洲一级毛片| 日本在线国产| 国产精品永久在线| 国产青青草视频| 无码网站免费观看| 久久www视频| 免费三A级毛片视频| 九九这里只有精品视频| 日韩精品专区免费无码aⅴ| 国产精品露脸视频| 97亚洲色综久久精品|