999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的全球恐怖主義數據庫數據分析

2019-07-05 11:20:37李永群應萬明袁飛韓玉春
經濟數學 2019年2期
關鍵詞:數據挖掘

李永群 應萬明 袁飛 韓玉春

摘 要 運用數據挖掘的方法,對全球恐怖主義數據庫(以下簡稱GTD)進行了量化分析.建立了基于KNN鄰近算法的恐怖襲擊事件量化分級模型和基于Kmeans聚類算法的恐怖襲擊事件分類模型.此外,對近三年來恐怖襲擊事件發生的主要原因、時空特性、蔓延特性以及級別分布規律進行了分析.最后,基于建立的模型和分析結論,對未來全球和某些重點地區的反恐態勢進行了預測分析,給出了具有針對性的建議.

關鍵詞 應用統計數學;恐怖襲擊;數據挖掘;KNN;Kmeans

中圖分類號 F063.3; O213?????????? 文獻標識碼 A

Data Analysis of GTD Based on Data Mining

LI Yongqun1, YING Wanming2, YUAN Fei3,HAN? Yuchun3

(1.College of Mathematics and Econometrics, Hunan University, Changsha, Hunan 410082, China;

2.College of Finance and Statistics, Hunan University, Changsha, Hunan 410082, China;

3.College of Electrical and Information Engineering, Hunan University, Changsha, Hunan 410082, China)

Abstract Use data mining methods to investigate the Global Terrorism Database (GTD). Quantitative grading model based on KNN algorithm and classification model based on Kmeans clustering algorithm about terrorist attacks are established respectively. Furthermore, the main reasons, time and space characteristics, spread features and level distributions of terrorist attacks in the past three years are studied and analyzed. According to this papers models and conclusions, the global and some key regions antiterrorism situations in the future are researched and judged, and recommendations for the fight against? terrorism are given.

Key words applied statistical mathematics;terrorist attack; data mining; KNN; Kmeans

1 引 言

恐怖襲擊是指極端分子或組織人為制造的、針對但不僅限于平民及民用設施的、不符合國際道義的攻擊行為.它不僅具有極大的殺傷性與破壞力,能直接造成巨大的人員傷亡和財產損失,而且還給人們帶來巨大的心理壓力,造成一定程度的社會動蕩,妨礙正常的工作與生活秩序,進而極大地阻礙經濟的發展.如“9.11”事件,遇難者總數高達2996人,給美國及全球經濟帶來巨大震蕩及損失.

自從20世紀90年代以來,尤其是2001年美國“9.11”事件之后,反恐形勢日益嚴峻.恐怖主義是人類的共同威脅,打擊恐怖主義是每個國家都應該承擔的責任.各國政府及聯合國等國際組織也不斷加強合作,采取多種手段和措施防范和打擊一切形式的恐怖主義.恐怖分子策劃實施的每一次襲擊,雖然表面上看具有偶然性,但也是經過預謀和計劃的.所以,對恐怖襲擊事件相關數據的深入分析和挖掘有助于加深人們對恐怖主義的認識,為反恐防恐提供有價值的信息支持.

當前,有關數據挖掘方法在恐怖襲擊領域中的研究和應用越來越受到專家學者的關注和重視.在識別恐怖分子方面,鐘磊(2014)[1]針對傳統算法的不足,提出了基于人工免疫算法和網絡信息的潛在恐怖分子挖掘方法,該方法能對潛在的恐怖分子進行準確的識別.吳紹忠(2016)[2]提出將聚類分析應用到反恐情報分析中,從而發現和識別潛在的恐怖分子或恐怖組織.扈翔(2017)[3]研究了樸素貝葉斯算法與K-means算法在反恐情報分析中的應用.在恐怖襲擊預警方面,戰兵和韓銳(2015)[4]將隱馬爾科夫模型與貝葉斯網絡相結合,實現了對可能發生的恐怖襲擊事件的預測.傅子洋等(2016)[5]基于貝葉斯網絡,建立了恐怖襲擊預警模型,為反恐行動提供了有效的預警信息.在恐怖襲擊風險預測與評估方面,龔偉志等(2015)[6]提出了基于大數據分析的恐怖襲擊風險預測方法.項寅(2018)[7]利用遺傳算法優化的BP神經網絡構建了恐怖襲擊風險的預測模型,并利用GTD中的數據驗證了模型的預測準確性.劉明輝(2018)[8]運用K-means聚類對民航系統恐怖主義風險進行了評估,實驗結果表明該方法的評估結果比較可靠.

美國馬里蘭大學的專家學者搜集并構建的全球恐怖主義數據庫(Global Terrorism Database, GTD)記錄了1970年至2017年全球發生的恐怖襲擊事件(數據庫網址:https://www.start.umd.edu/gtd/).以2018年全國研究生數學建模競賽C題為背景,基于GTD數據庫的部分信息(1998年~2017年),主要解決了以下三個問題.

1)建立量化分級模型,根據危害程度對恐怖襲擊事件分級,并列出近二十年來危害程度最高的十大恐怖襲擊事件.

2)針對2015、2016年發生的、尚未有組織或個人宣稱負責的恐怖襲擊事件,依據事件特征,將可能是同一個恐怖組織或個人制造的恐怖襲擊事件歸為一類,從而為進一步確定恐怖襲擊事件的制造者提供了幫助.

3)通過分析近三年來恐怖襲擊事件發生的主要原因、時空特性、蔓延特性、級別分布等規律,進而分析下一年全球或某些重點地區的反恐態勢,并給出有針對性的反恐建議.

2 量化分級模型的建立與求解

由于恐怖襲擊事件的危害性不僅取決于人員傷亡和經濟損失這兩個方面,還與發生的時機、地域、針對的對象等諸多因素有關,因而采用災難性事件的主觀分級方法難以形成統一標準.對GTD中的數據進行數據挖掘,建立基于數據分析的量化分級模型,將GTD給出的事件危害程度從高到低分為一至五級,并列出近二十年來危害程度最高的十大恐怖襲擊事件.

2.1 數據預處理

GTD數據庫中記錄了1998年~2017年全球共發生114183起恐怖襲擊事件,每一起事件有134個特征變量,數據量極大.在進行事件分級之前,需要對數據進行預處理.首先,刪除變量缺失值太多的事件,然后選取特征變量用于建立分級模型.考慮到每起恐怖襲擊事件對應有134個特征變量,且變量分為數值型變量、文本型變量及分類型變量三類,不可能將所有變量作為輸入特征用于分級.因此,在考慮人員傷亡、經濟損失、發生地域等與事件危害性緊密相關的主要變量后,刪除無關的變量.

2.2 基于KNN鄰近算法的量化分級模型

恐怖襲擊事件的危害性不僅與其造成的人員傷亡和經濟損失有關,事件發生的地域及針對的對象也會對危害程度產生影響.在經過數據預處理后,選擇死亡總數(nkill)、受傷總數(nwound)、財產損害程度(propextent)、城市(city)及超出國際人道主義法律范圍(crit3)這5個變量作為描述恐怖襲擊事件危害性的代理特征變量.根據每個變量對恐怖襲擊危害性影響的重要程度,分配給不同變量以不同的權重,從而可以得到不同恐怖襲擊事件危害性的描述.按照危害性的大小從高到低將GTD中所有事件的危害程度分為一至五級.選取80%的事件作為訓練集樣本,20%的事件作為測試集樣本,采用K-鄰近分類算法(KNearest Neighbor,以下簡稱KNN)對上述的分級進行訓練和測試,建立基于危害性大小的恐怖襲擊事件的量化分級模型.

KNN是一種比較成熟的算法,是數據挖掘分類方法之一,算法簡單,易于實現.其核心思想是:如果一個樣本在特征空間中的K個最相鄰的樣本中的大多數屬于某一個類別,那么該樣本也屬于這個類別,并且與這個類別上樣本的特征相似.

2.3 模型的求解

在KNN算法中,K值的確定至關重要,K值的不同會對分類結果產生很大的影響.通過Python編程,分別取不同的K值進行訓練,得到最優取值為1,此時恐怖襲擊測試集樣本的分級準確率達到了95%,這表明此時的量化分級模型具有比較好的分級效果.基于此模型給出了近二十年來危害程度最高的十大恐怖事件編號(按危害性從高低排序):201406150063、200109110004、200109110005、201408090071、201406100042、201710140002、200403210001、201408200027、201612100011、201408150057.從級別來看,這十起事件均為一級恐怖襲擊事件.

3 恐怖襲擊事件制造者的確定

GTD中有多起恐怖襲擊事件尚未確定作案者,需要確定隱藏的恐怖分子.不管某一恐怖襲擊事件的制造者是個人還是組織,其襲擊的時間、地點、目標等事件特征總會存在相似性和聯系.因此,將同一個恐怖組織或個人在不同時間、不同地點多次作案的多起案件聯系起來統一進行偵查,必將有利于找到事件的制造者.基于此分析,可以采用聚類算法,對2015年和2016年發生的、尚未有組織或個人宣稱負責的恐怖事件進行分類,每一類即對應一個未知的恐怖組織或個人.

3.1 數據預處理

在對案件進行分類之前,先對數據進行預處理.在2015年和2016年發生的恐怖襲擊事件中,首先選擇claimed變量值為0的事件,確定了22746起沒有確定制造者的恐怖襲擊事件.然后刪除其中變量缺失值太多的事件.最后,根據能反映嫌疑人和事件特征的原則,選取月(imonth)、日(iday)、國家(country)、地區(region)、政治、經濟、宗教或社會目標(crit1)、意圖脅迫、恐嚇或煽動更多群眾(crit2)、超出國際人道主義法律范圍(crit3)、自殺式襲擊(suicide)、攻擊類型(attacktype1)、目標/受害者類型(targtype1)、目標/受害者子類型(targsubtype1)、目標/受害者的國籍(natlty1)、第一可疑/涉嫌犯罪集團(guncertain1)、武器類型(weaptype1)、武器子類型(weapsubtype1)、國際后勤(INT_LOG)、國際意識形態(INT_IDEO)、國際雜類(INT_MISC)這18個變量用于建立事件分類模型.

3.2 基于Kmeans聚類算法恐怖襲擊制造者的確定

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产在线小视频| 成人av手机在线观看| 久久性视频| 亚洲精品无码av中文字幕| 999国产精品| 99久久精品视香蕉蕉| 亚洲美女操| 亚洲精品午夜无码电影网| 婷婷中文在线| 亚洲无码精品在线播放| 亚洲成人精品| 免费一级毛片在线播放傲雪网| 国产传媒一区二区三区四区五区| 一级毛片中文字幕| 美女无遮挡免费视频网站| 亚洲码一区二区三区| 中文字幕伦视频| 日本日韩欧美| 无码国内精品人妻少妇蜜桃视频 | 日韩一区精品视频一区二区| 中文字幕亚洲综久久2021| 自偷自拍三级全三级视频| 四虎成人精品| 亚洲首页在线观看| 999精品在线视频| 制服丝袜 91视频| 真人高潮娇喘嗯啊在线观看| 久久国产V一级毛多内射| 91福利在线观看视频| 亚洲欧美色中文字幕| 日韩av无码精品专区| 亚洲精品国产成人7777| 国产不卡在线看| 激情综合网址| 一区二区日韩国产精久久| 国产精品欧美日本韩免费一区二区三区不卡 | 国产精品内射视频| 亚洲最新在线| 国产91熟女高潮一区二区| 亚洲国语自产一区第二页| 色哟哟国产精品| 亚洲码在线中文在线观看| 亚洲天堂高清| 成人在线第一页| 青青网在线国产| 免费又黄又爽又猛大片午夜| 免费中文字幕在在线不卡| 男女男免费视频网站国产| 女人av社区男人的天堂| 免费一级α片在线观看| 丁香亚洲综合五月天婷婷| 精品超清无码视频在线观看| 亚洲精品制服丝袜二区| 丰满人妻被猛烈进入无码| 日韩精品久久无码中文字幕色欲| 成人噜噜噜视频在线观看| 国产成人精品第一区二区| 免费黄色国产视频| 国产精品福利尤物youwu | 国产浮力第一页永久地址| 久久伊人操| 亚洲午夜国产精品无卡| 不卡无码h在线观看| 亚洲男人的天堂视频| 久久久精品无码一区二区三区| 成人免费一级片| 国产在线自揄拍揄视频网站| 亚洲日本韩在线观看| 人妻夜夜爽天天爽| 97在线公开视频| 亚洲国产一区在线观看| 色老头综合网| 国产精品大白天新婚身材| 成人午夜在线播放| 国产簧片免费在线播放| 国产精品三区四区| 亚洲精品人成网线在线| 人妻少妇乱子伦精品无码专区毛片| 欧美高清日韩| 亚洲A∨无码精品午夜在线观看| 中文字幕自拍偷拍| 亚洲第一成年网|