999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分類算法在手機取證中的應用

2017-12-01 00:33:44肖程望盧軍余力耕
電子設計工程 2017年22期
關鍵詞:分類模型

肖程望,盧軍,余力耕

(武漢郵電科學研究院湖北武漢430074)

分類算法在手機取證中的應用

肖程望,盧軍,余力耕

(武漢郵電科學研究院湖北武漢430074)

在當今社會,手機犯罪越來越引起人們的重視,對研究人員來說需要馬上研究相應的對策加以應對,智能手機的使用率越來越高也促使了手機取證技術的研究發展。同時采用Android系統的智能手機越來越多,針對Android系統手機取證的電子證據進行相應的數據分析,能更方便和直觀的發現手機信息中的重點與需要關注的目標對象。在本文中應用了樸素貝葉斯分類算法對數據中各聯系人進行分類,而樸素貝葉斯分類算法的條件獨立性假設是非??量痰?,很難在正常情況下滿足,本文中提出了一種基于變異系數法的加權樸素貝葉斯分類模型,克服這個問題關鍵在于利用各項指標間所包含的信息的差異,通過計算得到指標的權重。有效地提高了樸素貝葉斯算法的分類性能,并且也繼承了貝葉斯分類算法的簡單性,本文首先對算法原理進行了分析與證明,然后描述了相應的算法,在最后給出了基于變異系數法的屬性權值求解方法。

手機取證;取證方法;分類算法;樸素貝葉斯;變異系數

手機等各類電子產品中的電子證據,包括:短信、通訊錄、通話記錄和瀏覽記錄等逐漸成為新的訴訟證據之一,例如通過短信和通話記錄可以了解嫌疑人與外界的聯系,查看嫌疑人的手機GPS記錄來確定嫌疑人的活動軌跡,而且QQ聊天記錄、郵件、上網記錄等都有很大的可能記錄著犯罪份子的犯罪行為[1]。手機的取證對于一個案件的偵破有著十分重大的意義,手機取證這一概念也隨之提出。

同時,最近三年中使用Android系統的手機所占市場份額正在快速上升,通過市場調查機構報告顯示,在全球手機智能操作系統中所占份額最高的是Android,達到了72.1%,IOS排第二,占據了24.4%的份額,剩下的就是WP等等其他操作系統了。Android操作系統已經成為當今全球第一大操作系統,并且其增長沒有任何衰減的趨勢[2]。大量利用手機進行誹謗、詐騙等的犯罪活動也在最近兩發頻頻發生,這與Android系統手機的迅猛發展不無關系。面對這種情況,對智能手機,包括使用Android系統的,進行取證技術與分析方面的相關研究必須要盡快發展起來。

對提取數據的分析與分類也顯得更加的重要,本文提出了一種貝葉斯分類優化算法,基于變異系數,介紹了算法詳情、原理與相應的實現步驟。

1 取證信息分析

手機取證是一個對目標手機中的與案件有關的數據進行提取的過程。通過一些技術分析,確保原始手機未被損壞、篡改,并且收集的數據不可被修改,并且最終獲得具有法律效力的證據能夠幫助公安機關人員破案[3]。

重要證據源主要保存在Android系統手機中的手機內存和sim卡中。提取出的信息大致有聯系人、短信息、通話記錄、瀏覽歷史記錄、多媒體信息、GPS信息、目標手機上的app內信息等[4],具體如圖1所示。

2 手機取證分析

通過分析從數據庫中提取出的位置信息和時間,可以得知手機使用者的行為與活動規律。通過分析通訊錄與短信數據庫中的信息,可以分析出使用者與某個人或某幾人聯系比較密切[5]。同時,通過查看瀏覽器歷史記,可以看到使用者的愛好與興趣。

同時在分析和監控團伙的各個手機時,使用基于Apriori算法的信息歸納總結,通過分析提取出的通訊錄和短信數據來分析出團伙中的主要人物或關鍵人物。各個手機使用者之間的關系和它們之間的相互影響能夠很快的求出。在經過了這么多年的研究后,只是把數據從手機中取出并不是一個十分困難的事情,現在主要是要對取出數據進行分析和歸類。在眾多分類方法和理論中,樸素貝葉斯(na?ve Bayes,NB)由于精確度高、計算高效、算法不復雜并且計算原理簡單易懂,而且具有堅實的理論基礎,使得它在不同領域得到了廣泛應用[5]。然而樸素貝葉斯分類有一個前提就是:屬性值之間是相互獨立的在給定分類特征條件下。通常情況下,這種基于獨立性的假設是很難滿足的。樸素的貝葉斯分類最大的缺陷是它無法處理特征符合所產生的變化(即前面提到過的實際上難以滿足的相互獨立)[6]。

本文就是在提取出數據的基礎上,利用樸素貝葉斯算法對信息進行分類,并針對樸素貝葉斯算法中的不足之處進行了優化與研究。引入了變異系數來對不同特征的屬性進行權重分析,以獲得更加客觀和精確的分類結果。

表1 提取信息表

3 算法分析

3.1 基本介紹

數據分類主要分為兩個階段:學習階段(構造分類模型)、分類階段(使用模型預測給定數據的類標號)。而其中的的關鍵是構造分類器。其中樸素貝葉斯分類模型(NBC)已被廣泛使用,主要是因為它有著堅實的數學基礎,以及穩定的分類效率[7]。樸素貝葉斯模型有以下幾大優點:所需參數少、算法也比較簡單、缺失數據不太敏感。

同時還有一種貝葉斯分類器也有很多人在進行研究,那就是貝葉斯網絡(BayesNet),它是一個有向的無環圖,上面帶有概率注釋,并且沒一個節點表示了一個隨機變量,并且可以在其上進行學習[8]。而經過研究學習后發現這會增加貝葉斯算法的復雜性,這主要是因為特征值之間的相互依賴。因此,當應用于實踐,它往往需要被簡化。這就給我們提出了一個問題:如何來提高其分類性能而又不會增加計算的復雜性呢。閱讀各種文獻資料后,發現了有基于信息增益和利用爬山算法等方法、還有提出了采用粗糙集技術來確定屬性權值的方法[9]。然而經過實驗后,我們發現在上述方法中雖然有一定的提高,但是在分析手機取證提取出的數據時改進的效果并不是十分理想。

變異系數法(Coefficient of variation method)是一種客觀賦權的方法,在很多場合也有利用,它是直接利用各個特征項所包含的信息大小,來決定各個特征項的權重值[10]。這主要是因為在評價一類事物時,相互間差別越大的特征項越能表達這些事物的不同之處,更能反映相互之間的差距。因此本文利用變異系數對貝葉斯分類模型進行了優化,并對算法的原理進行了說明。

3.2 加權樸素貝葉斯分類模型

3.2.1 樸素貝葉斯分類

P(A|B)表示了在B發生的前提下,A發生的概率。這是個條件概率。然而在實際生活中,我們可以很輕易的知道P(A|B),但是P(B|A)卻很難知道,而貝葉斯定律就是幫助我們獲得P(B|A)的。首先給出貝葉斯定理[11]。

貝葉斯分類在所有分類算法中是十分簡單的主要有以下幾步組成[12]:

1)設一個待分類項為X=[a1,a2,…,an]表示,分別描述在n個屬性A1,A2,…,An上的值;

2)假定有m個類,用C=[b1,b2,…,bn]表示;

3)計 算 出P(C1|x),P(C2|x),P(C3|x),…,P(Cn|x);

4)如果P(Ck|x)是所有概率中最大的,那么這個待分類項就屬于Ck類。其中先驗概率p(x1|Ci),p(x2|Ci),…,p(xn|Ci)可以從之前收集的數據中求得。

3.2.2 加權樸素貝葉斯分類

樸素貝葉斯模型(NBC)認為所有條件都是互不影響并且對分類結果的權重都是1,然而并非如此,在同一個問題中時,據常理所知,有的條件可能更重要些,而有的對結果可能影響較小。為了解決這個問題,需要給不容的條件附上不同的權重值,則可以得到經過了加權的樸素貝葉斯模型為:

其中,wk代表了屬性Ai的權重值。對應的屬性的權值越大,那么它對分類結果的影響就越大。而如何確定不同屬性的權值,那又產生了一個新的問題了。

3.3 變異系數

將各屬性視為隨機變量Mi,任一隨機變量Mi的標準差與平均數的比值稱為其對應的變異系數,記為CVi。把所有的屬性對應的變異系數相加后,對各個變異系數進行歸一化處理后就可以得到對應的權重了[13]。在評價手機聯系人的親密度關系時,有多種評價標準,例如:通話次數、通話時長、短信次數、短信中關鍵字詞的出現頻率、郵件聯系次數等等。而由于各個指標的量綱不同,自然是不能直接拿來比較的,還需要進行歸一化和利用到變異系數來進行處理,然后才能得到各個指標的權重系數。

下面來進行一個實例分析:用變異系數法去計算手機中各個指標對親密度關系的權重大小。下列數據是調查了10余部手機中的所有相關數據,計算出各個對應指標的變異系數,這些指標所對應的權重系數反應出了對親密度分類結果的影響大小,并作為確定各項指標權重的依據。具體計算數據見表2:

表2 各指標的權重

計算過程如下:

1)分別計算這些數據的平均數和標準差,這主要依靠之前提取的各個數據;

2)計算出變異系數(均值與標準差的比值);

3)將每一個指標所對應的變異系數相加求出總和;

4)計算出每一個指標所對應的權重。

上面求出的權重系數表明了不同指標對最后分類結果的影響大小,所以是可作權重系數應用在加權貝葉斯分類模型中的。

3.4 算法實現

基于變異系數的加權樸素貝葉斯分類算法的實現關鍵在于求解各條件屬性的變異系數,并確定各條件屬性的權重值,具體算法如下:

1)提取數據處理:將提取出的數據和預先準備的數據進行相應的處理,例如一些缺失數據的補充和數據之間的離散處理;

2)判斷:如果是分類任務,則到(6),如果是訓練任務則到(3);

3)概率表學習(構造分類模型):按照預先準備的練習數據,針對每一個屬性Ai的屬性值xik,每個分類的類別Ci、以及各個Ci的出現概率,計算在Ci發生的前提下,aik的出現概率p(xki|Ci)[14];

4)變異系數計算:計算出變異系數=對應的均值/對應的標準差,然后經過歸一化處理后得出對應的權重系數;

5)生成經過了加權的樸素貝葉斯分類器,并且吧加權樸素貝葉斯概率表已經各個對應屬性權值表保存下來以供分類使用;

6)分類:利用保存了的概率表以及屬性權值列表,并且使用之前生成的樸素貝葉斯分類器,得出分類結果。

4 實驗測試

在提取了10部手機內的信息進行了加權貝葉斯分類算法的概率表和變異系數的學習后,對新取得的手機內信息進行分類后可知道手機內聯系人與此人的親密度關系。下表列出了集合名稱、各個屬性名稱以及分類結果。

圖1 加權貝葉斯分類結果

同時,利用樸素貝葉斯算法對相同數據進行處理后,可以發現加上由變異系數得出的權重之后,能更準確吧手機使用者內的聯系人進行親密度分類。原因在于權重計算考慮到了特征項在類間的分布,類間的分布的越不均勻,對類的貢獻能力越大,同時對分類結果的影響也就越大,因此它的權重就越大。

5 結 論

現今,有很多犯罪分子通過手機進行交流、預謀犯罪等等行為,所以對手機提取數據的分析與提取數據的分類也顯得更加的重要,本文提出了一種基于變異系數的貝葉斯分類算法,并給出了相應的算法實現步驟。并提取了某部手機中的測試數據,通過實驗比較了樸素貝葉斯分類與基于變異系數的貝葉斯分類的效果,實驗表明本算法在分類性能上有一定的優越性。

樸素貝葉斯分類的分類能力受到了特征項間獨立性這一假設的很大影響。本文提出的這樣一種新的分類方法,引入了權重的計算來克服這一問題,生成了更加精確并且有效的條件屬性權重,考慮到在類內分布越均勻、類間分布越不均勻的特征項,權重越大,對分類結果的影響越大,對獲得更精確地分類結果十分有利[15]。同時,可以利用本文提出的方法和更多別的方法進行組合來繼續優化本算法。同時可以考慮新的變異系數的度量方法以便更進一步的提高分類性能,以及是否還要考慮各屬性的其他特征以及各屬性間的相關性是下一步的研究方向。

[1]杜江,褚帥.智能手機取證研究[J].電腦知識與技術,2011(9):2120-2121.

[2]Y Yao,Y Zhao.Attribute reduction in decisiontheoretic rough set models[J].Information Sciences,2013.

[3]LS Huang,A Moshchuk,HJ Wang.Clickjacking:attacks and defenses[J].Usenix Conference on Security Symposium,2012.

[4]賈嫻,劉培玉,公偉.基于改進屬性加權的樸素貝葉斯入侵取證研究[J].計算機工程與應用,2013,49(7):81-84.

[5]劉磊,陳興蜀,尹學淵,等.基于特征加權樸素貝葉斯分類算法的網絡用戶識別[J].計算機應用,2011,31(12):3268-3270.

[6]王行甫,杜婷.基于屬性選擇的改進加權樸素貝葉斯分類算法[J].計算機系統應用,2015,24(8):149-154.

[7]寧榮.基于粗糙集貝葉斯分類的供應商評價研究[J].物流科技,2013,36(5):124-126.

[8]徐光美,劉宏哲等.基于特征加權的多關系樸素貝葉斯分類模型[J].計算機科學,2014,41(10):283-285.

[9]梁天超,荊曉遠.基于加權RFE-Bayes方法的軟件缺陷預測模型[J].計算機技術與發展,2015(10):131-134.

[10]饒麗麗,劉雄輝,張東站.基于特征相關的改進加權樸素貝葉斯分類算法[J].廈門大學學報:自然科學版,2012,51(4):682-685.

[11]李翔,程玉勝.基于粗糙集理論的貝葉斯網絡分類算法[J].安慶師范學院學報:自然科學版,2014(1):36-40.

[12]夏燕,徐娜,舒健等.加權樸素貝葉斯模型在高校學科評價中的應用[J].微型電腦應用,2016,32(1):15-18.

[13]楊敏.基于貝葉斯方法的空間數據分析及應用[D].西安:西安工程大學,2012.

[14]王小麗,遠俊紅.基于加權樸素貝葉斯分類法的成績預測模型[J].電子技術與軟件工程,2013(19):225-226.

[15]劉牛.基于屬性加權的樸素貝葉斯分類算法改進[J].網絡安全技術與應用,2011(6):72-74.

Application and optimization of algorithm in mobile phone forensics

XIAO Cheng?wang,LU Jun,YU Li?geng
(Wuhan Research Institute of Posts and Telecommunications,Wuhan430074,China)

In modern society,mobile phone crime phenomenon as a high?technology crime,need to study and the corresponding counter?measures to deal with,the popularity of intelligent mobile phone make the mobile phone on evidence research to a new height,wherein more and more intelligent mobile phone use Android system.this paper mainly introduces the Android system mobile phone forensics elec?tronic sources of evidence and forensic analysis method,finally puts forward using Android system should solve the problem of mobile phone forensics.Naive Bayes is based on an assumption of conditional independence and the assumption can scarcely be satisfied.A weighted naive Bayes classification algorithm based on Coefficient of Variation is proposed.By computing Coefficient of Variation between condition attributes and decision attribute,different condition attributes are weighted differently.With a new method offered first to solve the weights of attributes on the basis of Coefficient of Variation discusses the operation principle of the algorithm,as well as its implementation.

mobile phone forensics;method of forensics;classification algorithm;Na?ve Bayes;coefficient of variation

TP301

A

1674-6236(2017)22-0049-05

2016-09-13稿件編號:201609138

肖程望(1992—),男,湖南岳陽人,碩士。研究方向:通信與信息系統。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 久久久久久尹人网香蕉| 中国一级特黄视频| 国产不卡网| 一级片免费网站| 亚洲全网成人资源在线观看| 国产在线精彩视频论坛| 国产白丝av| 国产人成在线视频| 看你懂的巨臀中文字幕一区二区| 日本91在线| av在线无码浏览| 中文字幕免费在线视频| 亚洲一区无码在线| 久久这里只精品热免费99| 日本在线国产| 亚洲三级网站| 久久久91人妻无码精品蜜桃HD| 亚洲经典在线中文字幕| 欧美国产在线一区| 国产永久免费视频m3u8| 亚洲 欧美 日韩综合一区| 国产精品中文免费福利| 免费一级全黄少妇性色生活片| 88av在线| 国内嫩模私拍精品视频| 国内丰满少妇猛烈精品播| 91免费国产在线观看尤物| 呦女亚洲一区精品| 日本三级精品| 91在线精品免费免费播放| 国产第一色| 亚洲国模精品一区| 亚洲va在线观看| 99一级毛片| 欧美一区二区啪啪| 国产农村1级毛片| 国内精品久久久久鸭| 99精品免费欧美成人小视频| 欧美午夜视频在线| 亚洲最猛黑人xxxx黑人猛交| 天天综合网在线| 国产日本欧美在线观看| 国产偷国产偷在线高清| 免费一级成人毛片| 色噜噜狠狠色综合网图区| 69视频国产| 伊人久久婷婷五月综合97色| 国产成人亚洲精品蜜芽影院| 福利在线一区| 狼友av永久网站免费观看| 2021无码专区人妻系列日韩| 日韩福利在线观看| 成人午夜在线播放| 欧美a在线| 久草视频精品| 免费av一区二区三区在线| 操美女免费网站| 日韩欧美中文字幕在线精品| 欧美精品aⅴ在线视频| 精品国产香蕉伊思人在线| 九九香蕉视频| 午夜国产精品视频| 亚洲欧洲天堂色AV| 久久国产精品嫖妓| 国产99在线| 亚洲午夜福利精品无码| 日韩欧美中文在线| 国产乱子精品一区二区在线观看| 亚洲三级影院| 四虎永久在线精品国产免费| 亚洲日本韩在线观看| 青青青伊人色综合久久| 色综合国产| 一级毛片在线播放| 免费国产一级 片内射老| 女人爽到高潮免费视频大全| 亚洲丝袜中文字幕| 欧美日韩亚洲综合在线观看| 欧美精品一区在线看| 欧美亚洲综合免费精品高清在线观看 | 国产人人乐人人爱| 成年看免费观看视频拍拍|