999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云變換的突發(fā)事件屬性概念樹(shù)的構(gòu)建

2016-02-15 07:07:11張艷瓊鄧三鴻
現(xiàn)代情報(bào) 2016年2期
關(guān)鍵詞:概念模型

張艷瓊鄧三鴻

(1.南京特殊教育師范學(xué)院信息科學(xué)學(xué)院,江蘇南京210038;2.南京大學(xué)信息管理學(xué)院,江蘇南京210023;3.江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)),江蘇南京210023)

基于云變換的突發(fā)事件屬性概念樹(shù)的構(gòu)建

張艷瓊1,2,3鄧三鴻2,3

(1.南京特殊教育師范學(xué)院信息科學(xué)學(xué)院,江蘇南京210038;2.南京大學(xué)信息管理學(xué)院,江蘇南京210023;3.江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)),江蘇南京210023)

針對(duì)突發(fā)事件屬性具有模糊性、隨機(jī)性等特點(diǎn),將云變換理論引入到突發(fā)事件屬性概念樹(shù)構(gòu)建研究中,在原有算法基礎(chǔ)上,引入梯形云模型,提出一種基于多類(lèi)型云的概念提取方法,不僅較好地解決了突發(fā)事件屬性的模糊性、隨機(jī)性等不確定性問(wèn)題,而且在提高擬合數(shù)據(jù)分布曲線精度的同時(shí)減少云模型的個(gè)數(shù)。以全球恐怖主義研究數(shù)據(jù)庫(kù)為例,正確有效地構(gòu)建nkill屬性概念樹(shù),為高質(zhì)量地進(jìn)行數(shù)據(jù)挖掘提供科學(xué)而有效的數(shù)據(jù)預(yù)處理方法。

突發(fā)事件;概念樹(shù);云變換;梯形云

突發(fā)事件是指突然發(fā)生,造成或者可能造成嚴(yán)重社會(huì)危害,需要采取應(yīng)急處置措施予以應(yīng)對(duì)的自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會(huì)安全事件[1]。隨著人口、環(huán)境和能源等方面問(wèn)題的日益突出,全球范圍內(nèi)的突發(fā)事件頻繁發(fā)生,多年來(lái),積累了海量的各類(lèi)突發(fā)事件案例,以恐怖事件為例,僅全球恐怖主義研究數(shù)據(jù)庫(kù)(Global Terrorism Database,GTD)就收錄了125 000多項(xiàng)案例[2]。突發(fā)事件案例是重要的數(shù)據(jù)資源,如何對(duì)這些數(shù)據(jù)資源進(jìn)行分析和處理,發(fā)現(xiàn)其中潛在、未知的知識(shí)和規(guī)律,為突發(fā)事件管理決策服務(wù),是目前急需解決的問(wèn)題。一方面,直接面對(duì)數(shù)據(jù)庫(kù)中原始概念層的海量細(xì)節(jié)信息,往往無(wú)法得到有意義的知識(shí),而對(duì)原始較低粒度的概念進(jìn)行提升,抽象出較高的概念層,可以發(fā)現(xiàn)更普遍、更有指導(dǎo)意義的知識(shí);另一方面,對(duì)于在論域上不同概念之間的關(guān)系,人們習(xí)慣劃分層次,從宏觀、中觀、微觀上理解概念之間的層次關(guān)系,形成概念的樹(shù)狀結(jié)構(gòu),所謂的宏觀、中觀、微觀又涉及到概念的粒度表征,概念粒度越大,涵蓋的數(shù)據(jù)范圍越廣,概念越抽象和宏觀,概念粒度越小,涵蓋的數(shù)據(jù)范圍越窄,概念越具體和精細(xì)[3]。因此,如何表示不同粒度的概念以及概念之間的層次關(guān)系,即構(gòu)建概念樹(shù),成為知識(shí)發(fā)現(xiàn)研究面臨的一個(gè)基礎(chǔ)問(wèn)題。

突發(fā)事件具有事發(fā)突然、隨機(jī)性、模糊性等不確定性特點(diǎn),如何在構(gòu)建突發(fā)事件屬性概念樹(shù)的過(guò)程中體現(xiàn)層次之間的不確定性呢?等距離和等頻率區(qū)間法等傳統(tǒng)的概念提取方法對(duì)論域?qū)嵭杏矂澐郑辉试S概念中有模糊性,不符合人的認(rèn)知規(guī)律,而且傳統(tǒng)概念樹(shù)的形成也無(wú)法反映數(shù)據(jù)的實(shí)際分布情況[3],因此,傳統(tǒng)構(gòu)建方法無(wú)法滿足突發(fā)事件屬性概念樹(shù)的構(gòu)成。李德毅、蔣嶸、杜 等在結(jié)合概率論和模糊數(shù)據(jù)學(xué)理論的基礎(chǔ)上提出的云模型能統(tǒng)一刻畫(huà)概念中的隨機(jī)性、模糊性及其關(guān)聯(lián)性,并在云模型的基礎(chǔ)上提出云變換(Cloud Transformation)思想實(shí)現(xiàn)概念的軟劃分,此方法不僅較好地體現(xiàn)出概念的不確定性,而且能夠根據(jù)數(shù)據(jù)的實(shí)際分布實(shí)現(xiàn)概念的劃分[4-5]。用云變換實(shí)現(xiàn)概念劃分的方法,具有一定的優(yōu)勢(shì),得到不少學(xué)者的關(guān)注。Liu等采用數(shù)據(jù)場(chǎng)與云模型相結(jié)合的方法構(gòu)建范概念樹(shù),用于空間數(shù)據(jù)挖掘[6];Weng等將基于云變換構(gòu)建的概念樹(shù)用于電價(jià)的預(yù)測(cè)[7];秦昆等針對(duì)云變換過(guò)程中,用云模型對(duì)頻率分布函數(shù)進(jìn)行擬合部分進(jìn)行算法改進(jìn),提出了一種新的云變換曲線擬合方法[8];孟暉等對(duì)原有的概念躍升算法進(jìn)行改進(jìn),在進(jìn)行概念云合并時(shí)考慮幅度系數(shù)的影響[9];蔣建兵等在分析現(xiàn)有正態(tài)云的概念劃分和概念提升方法的基礎(chǔ)上,提出了引入梯形云后新的云變換和軟或操作方法,但文章中并沒(méi)有給出實(shí)例論證[10];Z Wang提出基于梯形云模型的數(shù)值關(guān)聯(lián)規(guī)則的挖掘方法[11];馬政朝等運(yùn)用梯形云概念提升算法對(duì)物聯(lián)網(wǎng)安全數(shù)據(jù)的定義域進(jìn)行劃分,并對(duì)劃分結(jié)果進(jìn)行合理提升[12]。趙會(huì)園等對(duì)傳統(tǒng)的云變換算法中熵的估計(jì)步驟進(jìn)行改進(jìn),并應(yīng)用到農(nóng)業(yè)領(lǐng)域本體概念的構(gòu)建中[13];劉玉超提出用云模型中數(shù)字特征構(gòu)建概念含混度作為概念外延共識(shí)程度的衡量,設(shè)計(jì)并實(shí)現(xiàn)了高斯云變換算法,將問(wèn)題域中的數(shù)據(jù)分布自動(dòng)轉(zhuǎn)換為多粒度的不同概念,構(gòu)建出人類(lèi)概念認(rèn)知中的泛概念樹(shù)[14]。

本文借鑒上述的算法思想,針對(duì)突發(fā)事件屬性特征,提出一種基于多類(lèi)型云的云變換的算法,對(duì)突發(fā)事件屬性實(shí)現(xiàn)原子概念的歸納提取,通過(guò)對(duì)原子概念的提升,逐層構(gòu)建出突發(fā)事件屬性概念樹(shù)。這種突發(fā)事件屬性概念樹(shù)的構(gòu)建方法,避免了傳統(tǒng)概念劃分邊界過(guò)硬的問(wèn)題,較好地解決突發(fā)事件存在的模糊性和隨機(jī)性等不確定性問(wèn)題,為更好地進(jìn)行突發(fā)事件知識(shí)發(fā)現(xiàn)提供了一種科學(xué)而有效的數(shù)據(jù)預(yù)處理的方法。

1 相關(guān)理論簡(jiǎn)介

1.1 云模型概念

云模型是用自然語(yǔ)言值表示的定性概念與其定量數(shù)據(jù)表示之間的不確定性轉(zhuǎn)換模型,主要反映客觀世界中事物或人類(lèi)知識(shí)中概念的模糊性和隨機(jī)性,并把兩者完全集成在一起,構(gòu)成定性概念和定量數(shù)據(jù)相互間的轉(zhuǎn)換,深刻揭示了客觀對(duì)象具有的模糊性和隨機(jī)性[3]。云模型用期望Ex、熵En、超熵He 3個(gè)數(shù)字特征整體表征一個(gè)概念,見(jiàn)圖1。期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點(diǎn),或者說(shuō)是這個(gè)概念量化的最典型樣本。熵En是定性概念不確定性的度量,由概念的隨機(jī)性和模糊性共同決定。一方面,熵En是定性概念隨機(jī)性的度量,反映了能夠代表這個(gè)定性概念的云滴的離散程度;另一方面,又是定性概念亦此亦彼性的度量,反映了在論域空間可被概念接受的云滴的取值范圍。超熵He是熵的不確定性度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定[3]。云分為完整云、左半云和右半云,半云表示單側(cè)特性,見(jiàn)圖2。

圖1 正態(tài)云模型(25,3,0.3)的云圖[15]

1.2 梯形云模型

從圖1中可以看出,在正態(tài)云圖中,只有當(dāng)定量值x取值為期望Ex時(shí),x的確定度才為1,而在現(xiàn)實(shí)生活中,描述某一類(lèi)概念時(shí),經(jīng)常是不止一個(gè)元素完全屬于此概念,而是一個(gè)區(qū)間的元素都屬于此概念,因此,期望為一數(shù)值區(qū)間的時(shí)候更具一般性。當(dāng)期望取值為數(shù)值區(qū)間時(shí),便成為梯形云模型。梯形云較正態(tài)云更具有一般性,正態(tài)云是梯形云中一特殊類(lèi)型,見(jiàn)圖3。梯形云模型的數(shù)字特征由4個(gè)特征值來(lái)表示,即C(Exl,Exr,En,He),其中Ex1≤Ex2,期望區(qū)間為[Exl,Exr],當(dāng)Exl=Exr時(shí),C表示正態(tài)云模型。

當(dāng)通過(guò)梯形云期望和熵可以確定梯形云期望曲線方程:

從圖3中可以看出,梯形云期望曲線光滑地穿過(guò)云滴“中間”,勾畫(huà)出梯形云的整體輪廓,是云滴集合的骨架,所有云滴都在期望曲線附近做隨機(jī)的波動(dòng)[6]。圖4是左半梯形云和右半梯形云圖,只表示單側(cè)特性。

圖2 半云(25,3,0.3)的云圖[15]

圖3 梯形云模型(20,25,3,0.3)與期望曲線

1.3 云變換的簡(jiǎn)介

給定論域中某個(gè)數(shù)據(jù)屬性X的頻率分布函數(shù)f(x),根據(jù)X的屬性值頻率的實(shí)際分布自動(dòng)生成若干個(gè)粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散的定性的概念,這種從連續(xù)的數(shù)值區(qū)間到離散的概念的轉(zhuǎn)換過(guò)程,稱(chēng)為“云變換”[3]。

其數(shù)學(xué)表達(dá)式為:

其中,ai為幅度系數(shù);n為變換后生成離散概念的個(gè)數(shù);ε(x)為誤差曲線。

圖4 半梯形云(20,25,3,0.3)

從數(shù)據(jù)挖掘的角度看,云變換是從某個(gè)粗粒度概念的某一屬性的實(shí)際數(shù)據(jù)分布中抽取更細(xì)粒度概念,出現(xiàn)頻率高的數(shù)據(jù)值對(duì)定性概念的貢獻(xiàn)率大于出現(xiàn)頻率低的數(shù)據(jù)值[3]。

2 突發(fā)事件屬性概念樹(shù)的構(gòu)建

突發(fā)事件種類(lèi)繁多,每一類(lèi)型的突發(fā)事件由不同的屬性進(jìn)行描述,具有不同的知識(shí)范疇,即使是屬于同一大類(lèi)別的突發(fā)事件的屬性也不盡相同,如,同屬于自然災(zāi)害的火災(zāi)和地震。因此,很難用統(tǒng)一的模型來(lái)描述所有的突發(fā)事件的屬性。但經(jīng)分析發(fā)現(xiàn),突發(fā)事件的屬性特征的類(lèi)型是有限的。本文將這些屬性類(lèi)型分為:字符型、數(shù)值型和語(yǔ)言值型。字符型是指精確的文本字符值,如突發(fā)事件發(fā)生的地點(diǎn)、突發(fā)事件所屬的類(lèi)別等。數(shù)值型是指通過(guò)觀察、統(tǒng)計(jì)可以得到的數(shù)值,如死亡人數(shù)、財(cái)產(chǎn)損失值等,語(yǔ)言值型是指用語(yǔ)言值表達(dá)某定性值,如恐慌程度等。一般字符型和語(yǔ)言值型的屬性概念樹(shù)的構(gòu)建需要領(lǐng)域?qū)<业膮⑴c,不在本文的討論范圍內(nèi),因此本文只對(duì)數(shù)值型屬性概念樹(shù)進(jìn)行研究。

2.1 概念提取

概念提取就是從連續(xù)的數(shù)據(jù)中提取出離散的概念的過(guò)程。傳統(tǒng)的方法主要有:等距離區(qū)間法和等頻率區(qū)間法。等距離區(qū)間法是將論域主觀劃分為多個(gè)寬度相等的子區(qū)間。等頻率區(qū)間法是依據(jù)屬性值發(fā)生的頻率,將論域劃分為頻率寬度相同的子區(qū)間。這些方法都沒(méi)有考慮實(shí)際的數(shù)據(jù)分布情況,也不能反映從實(shí)際的連續(xù)數(shù)據(jù)中抽取定性概念的不確定性。為解決上述問(wèn)題,在云模型表示定性概念的基礎(chǔ)上,引入云變換的思想,可以實(shí)現(xiàn)連續(xù)數(shù)據(jù)的離散化[3]。

設(shè)突發(fā)事件某屬性X的頻率分布函數(shù)f(x),根據(jù)X的實(shí)際頻率分布情況,自動(dòng)生成若干粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散、定性的概念,實(shí)現(xiàn)從連續(xù)數(shù)值區(qū)間到離散概念的轉(zhuǎn)換過(guò)程。文獻(xiàn)[5]提出一種基于峰值法的云變換方法,即數(shù)據(jù)頻率分布中的局部極大值點(diǎn)是數(shù)據(jù)的匯聚中心,可作為概念的中心,云模型的數(shù)學(xué)期望;峰值越高,表示數(shù)據(jù)匯聚越多,優(yōu)先考慮其反映的定性概念,在原分布中減去該定性概念對(duì)應(yīng)的數(shù)值部分,再尋找局部極大值,依次類(lèi)推。但此方法就如何擬合變化的頻率分布曲線沒(méi)有做具體說(shuō)明,對(duì)于峰值波動(dòng)不大的情況,擬合精度較高時(shí),就會(huì)出現(xiàn)較多的擬合云模型,增加計(jì)算復(fù)雜度。文獻(xiàn)[8]用梯形云模型代替正態(tài)云模型進(jìn)行曲線擬合進(jìn)行了改進(jìn),本文借鑒文獻(xiàn)[8]的思想,提出一種基于多類(lèi)型云模型的云變換算法,此算法對(duì)擬合云模型的類(lèi)型進(jìn)行擴(kuò)充,針對(duì)不同曲線段應(yīng)用不同類(lèi)型的云模型進(jìn)行擬合,既減少了擬合云模型的個(gè)數(shù),又有利于提高擬合精度,此算法思路見(jiàn)圖5。

圖5 基于多類(lèi)型云模型的云變換算法流程圖

具體算法步驟如下:

算法1:基于多類(lèi)型云模型的云變換

輸入:屬性X的數(shù)據(jù)集合D;變換允許的誤差閾值ε;波峰差閾值θ;

輸出:n個(gè)離散的不同類(lèi)型的原子概念的云模型集合Clounds。

算法步驟:

(1)對(duì)屬性X的論域中每個(gè)可能屬性值X,計(jì)算其在數(shù)據(jù)集合D中含有該屬性值的記錄個(gè)數(shù)y,得到屬性X的頻率分布函數(shù)f(x)。

(2)尋找頻率分布函數(shù)f(x)的波峰值所在位置,將其屬性值定義為云模型的中心點(diǎn)g。

(3)初始值設(shè)l=g,r=g;在中心點(diǎn)g的左右邊尋找最相鄰的波峰值,l=左波峰值,r=右波峰值。

(4)根據(jù)l和r的值,判斷云模型的類(lèi)型,并確定云模型期望Exli,Exri。

a.若l=g,則云模型為右半梯形云,Exli=g;若abs(r-l)≤θ,則繼續(xù)尋找下一個(gè)右波峰點(diǎn),直到abs(r-l)>θ,Exri=r;

b.若r=g,則云模型為右半梯形云,Exri=g;若abs(r-l)≤θ,則繼續(xù)尋找下一個(gè)左波峰點(diǎn),直到abs(r-l)>θ,Exli=l;

c.若l≠g且r≠g,如果abs(r-l)>θ,則云模型為正態(tài)云Exli=Exri=g;否則,從左右兩邊繼續(xù)尋找下一個(gè)波峰點(diǎn),直到abs(r-l)>θ,Exli=l,Exri=r。

(5)計(jì)算用于擬合f(x)的、以Exli,Exri為期望的云模型的熵,計(jì)算云模型的分布函數(shù)fi(x)。

(6)從f(x)中減去已知云模型的數(shù)據(jù)分布fi(x),得到新的數(shù)據(jù)分布函數(shù)f′(x),并在此基礎(chǔ)上重復(fù)步驟(2)~(4),得到多個(gè)基于云的數(shù)據(jù)分布函數(shù)。

(7)根據(jù)已有的f(x),最后得到的擬合誤差函數(shù)f′(x)及各個(gè)云模型的分布函數(shù),計(jì)算基于云模型的定性概念的3個(gè)特征值。

2.2 概念躍升及概念樹(shù)的生成

算法1根據(jù)突發(fā)事件屬性域中數(shù)據(jù)值的分布情況,自動(dòng)生成一系列由云模型表示的基本概念,實(shí)現(xiàn)對(duì)論域的軟劃分。概念躍升就是在這些云模型表示的基本概念的基礎(chǔ)上,通過(guò)合并相鄰云概念,生成更高層次的云概念,達(dá)到概念提升來(lái)提升知識(shí)的粒度。概念躍升主要有3種策略:(1)用戶預(yù)先指定躍升的概念粒度,即用戶指定概念個(gè)數(shù);(2)自動(dòng)躍升,不預(yù)先由用戶指定,而是根據(jù)具體情況,自動(dòng)將概念躍升到合適的概念粒度;(3)人機(jī)交互式地躍升,即用戶干預(yù)并具體指導(dǎo)概念的躍升[3]。本文采用第(2)種策略進(jìn)行概念躍升。概念粒度提升主要是通過(guò)云綜合來(lái)完成,即將兩朵或多朵相同類(lèi)型的子云進(jìn)行綜合,生成有朵新的高層概念的父云。可以使用“軟或”云綜合法和“積分”云綜合法。“軟或”云綜合法簡(jiǎn)單易于計(jì)算,本文采用“軟或”云綜合法。一般,只會(huì)在頻率分布曲線的兩端才會(huì)出現(xiàn)半云模型,因此,兩類(lèi)云模型進(jìn)行云綜合只會(huì)出現(xiàn)3種情形:(1)右半云與全云;(2)全云與全云;(3)全云與左半云;其中,全云包括正態(tài)云和梯形云。

算法2:“軟或”云綜合法

輸入:給定2個(gè)云模型C1(Exl1,Exr2,En1,He1,type1),C2(Exl2,Exr2,En2,He2,type2)

輸出:綜合云模型C(Exl,Exr,En,He,type)

算法步驟:

(1)若type1為右半云,type2為全云,則根據(jù)下列公式計(jì)算:

(2)若type1,type2同為全云,則根據(jù)下列公式計(jì)算:

(3)若type1為全云,type2同為左半云,則根據(jù)下列公式計(jì)算:

通過(guò)對(duì)原子云模型運(yùn)用云綜合算法進(jìn)行概念躍升可以得到較粗的粒度的概念,但不是距離最近的任何兩個(gè)相鄰的云模型都可以進(jìn)行云綜合算法,必須滿足一定的條件。本文在軟或操作中引入距離閾值δ,即距離函數(shù)d(C1,C2)=Exr1-Exl2/(En1+En2)≤δ,根據(jù)3En規(guī)則,δ的取值一般小于3。

算法3:概念樹(shù)的生成

輸入:云變換生成的原子概念集合C,距離閾值δ

輸出:概念樹(shù)Clay

算法步驟:

3 實(shí) 例

本文實(shí)驗(yàn)數(shù)據(jù)來(lái)源于全球恐怖主義研究數(shù)據(jù)庫(kù)(簡(jiǎn)稱(chēng)數(shù)據(jù)庫(kù))[2],該數(shù)據(jù)庫(kù)包含了從1970-2013年全球超過(guò)125 000例恐怖襲擊的相關(guān)信息,每個(gè)案例至少包含45個(gè)特征屬性變量,其中最近發(fā)生的事件包含有120多個(gè)特征屬性變量。本文以nkill(死亡人數(shù))這一屬性為例進(jìn)行概念樹(shù)的構(gòu)建。由于各種原因,數(shù)據(jù)庫(kù)中存在字段缺失現(xiàn)象,將nkill字段數(shù)據(jù)缺失的記錄刪除后,得到106 099例數(shù)據(jù)。從理論上說(shuō),nkill的取值范圍nkill∈[0,∞),但從實(shí)際情況來(lái)看,隨著nkill取值越高,數(shù)據(jù)的分布越稀疏,從本數(shù)據(jù)庫(kù)的分布情況來(lái)看,nkill取值大于100,共有114例,其中nkill取值最大為1 382,由此可以看出:本數(shù)據(jù)nkill取值范圍較廣,數(shù)據(jù)分布非常稀疏,為了清晰的展示下文的效果圖,100以后的這段數(shù)據(jù)不在示圖中顯示,但參與計(jì)算。另外,需要說(shuō)明的是,nkill取值為0的記錄共有57 363例,占總數(shù)的54.07%,nkill的取值從“0”到“1”,雖然數(shù)值之間只相差1,但是從概念意義實(shí)現(xiàn)了從“無(wú)”到“有”的飛躍,在突發(fā)事件的數(shù)值分類(lèi)上一般把“0”值單獨(dú)劃分為一類(lèi),在本文的處理中,“0”不參與計(jì)算,如果處于別的考慮也可以將其加入計(jì)算,計(jì)算方法不變。

3.1 不確定性概念提取

圖6是恐怖主義研究數(shù)據(jù)庫(kù)中nkill字段數(shù)據(jù)的頻率分布圖。從圖6中可以看出,nkill數(shù)據(jù)的分布具有非常嚴(yán)重的偏倚現(xiàn)象,為了更好地進(jìn)行概念提取,必須對(duì)頻率進(jìn)行對(duì)數(shù)變換,令頻率′=log2(頻率+1),經(jīng)轉(zhuǎn)換后nkill數(shù)據(jù)分布曲線如圖7所示。

圖6 原始數(shù)據(jù)曲線分布圖

圖7 變換后數(shù)據(jù)的曲線分布圖

經(jīng)過(guò)對(duì)nkill數(shù)據(jù)進(jìn)行算法1運(yùn)算,得到一系列由半云、梯形云和正態(tài)云組成的原子概念。圖8給出了這些定性概念所對(duì)應(yīng)的云模型,以及這些云模型的期望曲線的疊加。從圖7可以看出,通過(guò)云變換得到的定性概念所對(duì)應(yīng)的云模型的期望曲線的疊加非常好地反映了實(shí)際的數(shù)據(jù)分布情況。為了說(shuō)明此算法的優(yōu)越性,本文將其與基于正態(tài)云擬合的云變換算法進(jìn)行比較。在相同參數(shù)設(shè)置環(huán)境下,相同數(shù)據(jù)經(jīng)過(guò)基于正態(tài)云擬合的云變換算法運(yùn)算后,得到的原子概念所對(duì)應(yīng)的云模型如圖9所示。本文算法共得到44個(gè)不同類(lèi)型的云模型,而基于正態(tài)云的云變換算法得出59個(gè)云模型,前者的殘差方差值為0.1231,后者的殘差方差值為0.1577。由此可以本文改進(jìn)的算法不僅提高了擬合的精度,而且減少了云模型的個(gè)數(shù)。

圖8 基于多類(lèi)型云模型的數(shù)據(jù)分布圖

圖9 基于正態(tài)云模型的數(shù)據(jù)分布圖

3.2 概念躍升及概念樹(shù)的構(gòu)建

按照概念云綜合算法,對(duì)原子概念進(jìn)行第一輪合并,得到12個(gè)較細(xì)粒度的不確定概念,見(jiàn)圖10。然后對(duì)這12個(gè)較細(xì)度的不確定型概念進(jìn)行近一步的合并,最后得到5個(gè)粗粒度的不確定型概念,其對(duì)應(yīng)的云模型,見(jiàn)圖11,圖12表示概念云的合并過(guò)程,圖12中每個(gè)方框表示一個(gè)概念云,格式為C(Ex1,Ex2,En,He,Type),其中,Type表示概念云的類(lèi)型,1表示右半梯形云,2表示左半梯形云,3表示完整梯形云,4表示完整正態(tài)云。

圖10 經(jīng)過(guò)概念合并后得到的12個(gè)不確定性概念

圖11 經(jīng)過(guò)概念合并后得到的5個(gè)不確定性概念

圖12 概念云的合并過(guò)程

最終得到的5個(gè)不確定性概念較為客觀地反映了突發(fā)事件nkill數(shù)據(jù)的分布情況。從最初的44個(gè)概念躍升至最終的5個(gè)概念的過(guò)程,就是突發(fā)事件屬性nkill概念樹(shù)的構(gòu)建過(guò)程。該方法不需要人為參與干預(yù),可以直接從數(shù)據(jù)庫(kù)中抽取概念,構(gòu)建概念層次關(guān)系,形成概念樹(shù)。

4 結(jié)束語(yǔ)

本文通過(guò)分析現(xiàn)有的概念提取和概念躍升方法,將梯形云模型引入到突發(fā)事件屬性的概念提取和概念躍升的過(guò)程中,對(duì)現(xiàn)有的云變換算法進(jìn)行適當(dāng)?shù)母倪M(jìn),提出一種基于多類(lèi)型云模型的云變換算法。此算法主要的特點(diǎn)是能根據(jù)數(shù)據(jù)分布曲線,自動(dòng)選用合適的云模型類(lèi)型去擬合數(shù)據(jù)分布函數(shù),既能提高擬合精度,又能減少云模型的個(gè)數(shù)。

基于云變換構(gòu)建的突發(fā)事件屬性概念樹(shù)充分考慮了原始數(shù)據(jù)的分布情況,較好地體現(xiàn)了概念的不確定性,而且還能隨著數(shù)據(jù)庫(kù)中數(shù)據(jù)的和誤差閾值的不斷變化進(jìn)行相應(yīng)的調(diào)整,為高質(zhì)量地進(jìn)行數(shù)據(jù)挖掘提供了一種行之有效的數(shù)據(jù)預(yù)處理方法,更有利于突發(fā)事件管理決策。

[1]國(guó)家突發(fā)公共事件總體應(yīng)急預(yù)案[EB/OL].http:∥www.gov.cn/yjgl/2005-08/07/content-21048.htm,2013-07-22.

[2]National Consortium for the Study of Terrorism and Responses to Terrorism(START).(2015).Global Terrorism Database[Data file].Retrieved from http:∥www.start.umd.edu/gtd.

[3]李德毅,杜 .不確定性人工智能(第2版)[M].北京:國(guó)防工業(yè)出版社,2014.5.

[4]蔣嶸,李德毅.?dāng)?shù)值型數(shù)據(jù)的泛概念樹(shù)的自動(dòng)生成方法[J].計(jì)算機(jī)學(xué)報(bào),2000,23(5):471-477.

[5]杜 ,李德毅.基于云的概念劃分及其在關(guān)聯(lián)采掘上的應(yīng)用[J].軟件學(xué)報(bào),2001,12(2):196-203.[6]Liu.YF,He.Q,Liu.W..Cloud Segmentation of Spatial Concept Hierarchy Based on Data Field[C].2008 4th International Conference on Wireless Communications,Networking and Mobile Computing,2008:12-17.

[7]Weng.YL,Shi.LD,zhao.JH.Price Spike Forecasting Using Concept-tree Approach based on Cloud Model[C].2nd ISECS International Colloquium on Computing,Communication,Control and Management(CCCM 2009),2009:8-9.

[8]秦昆,王佩.基于云變換的曲線擬合新方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,23:56-58,74.

[9]孟暉,王樹(shù)良,李德毅.基于云變換的概念提取及概念層次構(gòu)建方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2010,(3):782-787.

[10]蔣建兵,梁家榮,江偉,等.梯形云模型在概念劃分及提升中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,(5):1235-1237,1240.

[11]Z Wang.Quantitative Association Rules Mining Method Based on Trapezium Cloud Model[C].Database Technology and Applications(DBTA),2010 2nd International Workshop on.IEEE,2010:1-4.

[12]馬政朝,鄭瑞娟,吳慶濤,等.一種物聯(lián)網(wǎng)安全屬性概念提取方法[J].計(jì)算機(jī)仿真,2014,(3):303-307.

[13]趙會(huì)園,李紹穩(wěn),劉超,等.基于云變換的農(nóng)業(yè)領(lǐng)域本體概念構(gòu)建方法研究[J].安徽師范大學(xué)學(xué)報(bào):自然科學(xué)版,2015,(2):123-128.

[14]劉玉超.一種自適應(yīng)的多粒度概念提取方法——高斯云變換[J].計(jì)算機(jī)工程與應(yīng)用,2015,(9):1-8.

[15]張艷瓊,陳祖琴,蘇新寧,等.基于云模型的突發(fā)事件分級(jí)模型研究[J].情報(bào)學(xué)報(bào),2015,(1):76-84.

(本文責(zé)任編輯:孫國(guó)雷)

The Building of Emergency Concept Tree based on Cloud Transformation

Zhang Yanqiong1,2,3Deng Sanhong2,3
(1.School of Information Science,Nanjing Normal University of Special Education,Nanjing 210038,China;2.School of Information Management,Nanjing University,Nanjing 210023,China;3.Jiangsu Key Laboratory of Data Engineering and Knowledge Service(Nanjing University),Nanjing 210023,China)

According to the emergency characteristics,such as fuzziness,randomness,the cloud transformation was used to build concept tree of emergency attribute.Including Trapezium cloud,a new concept extracting method based on multiple types of clouds is proposed in this paper,which not only solved the fuzziness,randomness problem,but only improved the accuracy of fitting the data distribution curve while reducing the number of cloud model.A test was given on Global Terrorism Database(GTD),the result showed that the algorithm can build concept tree of nkill property.

emergency;concept tree;cloud transformation;trapezium cloud

10.3969/j.issn.1008-0821.2016.02.009

TP393

A

1008-0821(2016)02-0046-07

2015-11-24

國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報(bào)體系研究”(項(xiàng)目編號(hào):13&ZD174);地震科技星火計(jì)劃攻關(guān)項(xiàng)目“面向地震應(yīng)急的空間智能決策方法”(項(xiàng)目編號(hào):XH15019)。

張艷瓊(1982-),女,講師,在讀博士,研究方向:數(shù)據(jù)挖掘、智能信息處理。

猜你喜歡
概念模型
一半模型
Birdie Cup Coffee豐盛里概念店
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
幾樣概念店
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
3D打印中的模型分割與打包
論間接正犯概念之消解
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 99在线观看国产| 亚洲天堂网在线播放| 国产精品55夜色66夜色| 91久久国产综合精品女同我| 日韩国产黄色网站| 精品無碼一區在線觀看 | 欧美一区二区三区不卡免费| 黑人巨大精品欧美一区二区区| 波多野吉衣一区二区三区av| 国产精品成人AⅤ在线一二三四| 国产无码网站在线观看| 日韩精品欧美国产在线| 亚洲伊人天堂| 国产尤物jk自慰制服喷水| 欧美啪啪网| 亚洲精品成人福利在线电影| 国产99视频精品免费视频7| 九色免费视频| 亚洲国产中文精品va在线播放| 色综合国产| 99视频精品在线观看| 国产成人你懂的在线观看| 亚洲欧美精品一中文字幕| 欧美精品啪啪一区二区三区| 首页亚洲国产丝袜长腿综合| 国产区免费精品视频| 日本少妇又色又爽又高潮| 国产亚洲现在一区二区中文| 婷婷六月色| 99青青青精品视频在线| 91视频青青草| 欧美日韩国产综合视频在线观看| 天堂亚洲网| 国产高清在线丝袜精品一区| 国产精品尤物在线| 国产欧美日韩综合在线第一| 久久精品丝袜高跟鞋| 色国产视频| 国产欧美精品专区一区二区| 午夜限制老子影院888| 国产精品福利在线观看无码卡| 国产精品蜜芽在线观看| 国产亚洲第一页| 亚洲美女高潮久久久久久久| 一级毛片基地| 国产99免费视频| 麻豆国产精品视频| 国产成人精品午夜视频'| 国产黄网永久免费| 97av视频在线观看| 成人另类稀缺在线观看| 在线国产91| 成人福利在线视频免费观看| 影音先锋亚洲无码| 成人亚洲视频| 免费无码又爽又黄又刺激网站| 国产亚洲精久久久久久无码AV| 91在线激情在线观看| 国产国语一级毛片| 高清无码不卡视频| 亚洲精品在线观看91| 国内老司机精品视频在线播出| 青青青视频91在线 | 国产嫖妓91东北老熟女久久一| 国产AV毛片| 71pao成人国产永久免费视频| 免费全部高H视频无码无遮掩| 999精品在线视频| 人妻中文久热无码丝袜| 精品超清无码视频在线观看| 天堂岛国av无码免费无禁网站 | 国产精品天干天干在线观看| 伊人天堂网| 亚洲人成网站色7777| 欧美亚洲国产精品久久蜜芽 | 99精品高清在线播放| 国产精品综合久久久| 久久香蕉欧美精品| 一级片一区| 午夜天堂视频| 亚洲精品自产拍在线观看APP| 亚洲日韩AV无码精品|