999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法①

2020-03-18 07:55:16李曉峰王妍瑋
關(guān)鍵詞:深度數(shù)據(jù)庫(kù)檢測(cè)

李曉峰,王妍瑋,李 東

1(黑龍江外國(guó)語(yǔ)學(xué)院 信息工程系,哈爾濱 150025)

2(普渡大學(xué) 機(jī)械工程系,西拉法葉市 IN47906)

3(哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,哈爾濱 150001)

1 引言

數(shù)據(jù)庫(kù)管理系統(tǒng)和信息技術(shù)在近年來(lái)得以快速發(fā)展,人們收集和產(chǎn)生數(shù)據(jù)的能力不斷提高,醫(yī)療數(shù)據(jù)庫(kù)中存在的數(shù)據(jù)量呈直線(xiàn)增長(zhǎng).過(guò)去對(duì)數(shù)據(jù)的檢測(cè)分析主要通過(guò)分析員完成,在專(zhuān)家意見(jiàn)的基礎(chǔ)上通過(guò)數(shù)據(jù)分析在醫(yī)療數(shù)據(jù)庫(kù)中獲取和查詢(xún)數(shù)據(jù),由分析員決定數(shù)據(jù)分析的結(jié)果.但由于數(shù)據(jù)庫(kù)中的數(shù)據(jù)急劇膨脹,數(shù)據(jù)的復(fù)雜性和時(shí)效性也不斷增強(qiáng),傳統(tǒng)方法已經(jīng)不能滿(mǎn)足人們的要求.為了從醫(yī)療數(shù)據(jù)庫(kù)中獲取有用的信息,需要改進(jìn)現(xiàn)有的數(shù)據(jù)檢測(cè)技術(shù).

在醫(yī)療數(shù)據(jù)庫(kù)中存在一些與其他數(shù)據(jù)行為不同,或是與其他數(shù)據(jù)差異較大的數(shù)據(jù),被稱(chēng)為離群數(shù)據(jù).離群數(shù)據(jù)中通常存在有用的信息,因此需要對(duì)醫(yī)療數(shù)據(jù)庫(kù)中存在的離群數(shù)據(jù)進(jìn)行檢測(cè),眾多學(xué)者進(jìn)行了相關(guān)研究,并取得了一定的成果.

Hauskrecht M 等[1]通過(guò)對(duì)數(shù)據(jù)離群點(diǎn)檢測(cè)實(shí)現(xiàn)異?;颊吖芾?該方法通過(guò)使用EMR 存儲(chǔ)庫(kù)來(lái)學(xué)習(xí)將患者狀態(tài)與病人管理操作相關(guān)聯(lián)的統(tǒng)計(jì)模型,使用電子病歷保存患者信息,通過(guò)與以往病歷的異常分析,獲取異?;颊咝袨?但該方法的計(jì)算代價(jià)較大;Yu YW 等[2]提出了一種新的基于鄰域軌跡離群點(diǎn)的分類(lèi)方法,對(duì)研究對(duì)象真實(shí)數(shù)據(jù)集進(jìn)行理論分析和實(shí)證研究,驗(yàn)證了本文方法在捕獲不同類(lèi)型數(shù)據(jù)的有效性,但該方法的離群點(diǎn)檢測(cè)率不高,且誤差率較高;Jobe JM 等[3]提出一種基于計(jì)算機(jī)的數(shù)據(jù)集群方法,將Rousseuw 的最小協(xié)方差行列式方法的重加權(quán)版本與最初基于多步聚類(lèi)的算法結(jié)合起來(lái),找出離群點(diǎn),實(shí)驗(yàn)結(jié)果表明,該方法穩(wěn)健性較好,但是離群點(diǎn)檢測(cè)率較低,計(jì)算代價(jià)大;鄒云峰等[4]提出基于局部密度的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法,該算法將弱k近鄰點(diǎn)和強(qiáng)k近鄰點(diǎn)概念引入離散數(shù)據(jù)檢測(cè)中,對(duì)鄰近數(shù)據(jù)點(diǎn)在數(shù)據(jù)庫(kù)中的離群相關(guān)性進(jìn)行分析,根據(jù)分析結(jié)果區(qū)別對(duì)待數(shù)據(jù)點(diǎn),通過(guò)數(shù)據(jù)點(diǎn)離群性預(yù)判方法完成醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)的檢測(cè),該算法檢測(cè)離散數(shù)據(jù)的執(zhí)行時(shí)間較長(zhǎng),存在檢測(cè)效率低的問(wèn)題.李少波等[5]提出基于密度的數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法,該算法在離群數(shù)據(jù)檢測(cè)過(guò)程中引入滑動(dòng)時(shí)間窗口,通過(guò)滑動(dòng)時(shí)間窗口劃分?jǐn)?shù)據(jù),計(jì)算數(shù)據(jù)的信息熵,根據(jù)計(jì)算結(jié)果對(duì)數(shù)據(jù)進(jìn)行篩選和剪枝,通過(guò)離群因子對(duì)篩選后的數(shù)據(jù)進(jìn)行判斷,完成數(shù)據(jù)庫(kù)離散數(shù)據(jù)的檢測(cè),該算法計(jì)算得到的離群因子存在誤差,不能準(zhǔn)確的對(duì)醫(yī)療數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行判斷,存在離散點(diǎn)誤差率高的問(wèn)題.魏暢等[6]提出基于約簡(jiǎn)策略的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法,該算法在馬氏距離標(biāo)準(zhǔn)的基礎(chǔ)上對(duì)數(shù)據(jù)集進(jìn)行簡(jiǎn)約處理,通過(guò)數(shù)據(jù)流時(shí)間相關(guān)性和數(shù)據(jù)分布密度準(zhǔn)則構(gòu)建決策模型,通過(guò)決策模型對(duì)數(shù)據(jù)庫(kù)中存在的離散數(shù)據(jù)進(jìn)行檢測(cè),該算法構(gòu)建的決策模型精準(zhǔn)度較低,導(dǎo)致離散點(diǎn)檢測(cè)率低.尹娜等[7]提出了一種基于混合式聚類(lèi)算法的離群點(diǎn)挖掘在異常檢測(cè)中的應(yīng)用方法,該方法通過(guò)k-中心點(diǎn)算法找出簇中心,在此基礎(chǔ)上去除其中較隱秘的數(shù)據(jù)樣本,再結(jié)合基于密度的聚類(lèi)算法計(jì)算出離群數(shù)據(jù)的異常度,從而判斷出離群點(diǎn).但是該算法在挖掘隱秘樣本時(shí)出錯(cuò)率較高,致使最終的檢測(cè)結(jié)果存在較大誤差.

針對(duì)目前現(xiàn)有方法中存在的離群數(shù)據(jù)檢測(cè)過(guò)程執(zhí)行時(shí)間較長(zhǎng)、檢測(cè)效率低、離群點(diǎn)檢測(cè)率低的問(wèn)題,提出基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法.在對(duì)空間中的稀疏區(qū)域和稠密區(qū)域進(jìn)行劃分再合并,實(shí)現(xiàn)數(shù)據(jù)過(guò)濾,通過(guò)層次化深度學(xué)習(xí)過(guò)程融合專(zhuān)家知識(shí)增強(qiáng)對(duì)離群數(shù)據(jù)的多層感知,實(shí)現(xiàn)對(duì)離群數(shù)據(jù)的檢測(cè),達(dá)到降低算法計(jì)算代價(jià)、降低耗時(shí)、提高檢測(cè)率和準(zhǔn)確率的目的.

2 動(dòng)態(tài)網(wǎng)格劃分與合并

醫(yī)療數(shù)據(jù)庫(kù)中存在海量的數(shù)據(jù),在對(duì)其中的離群點(diǎn)檢測(cè)之前,本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法首先使用動(dòng)態(tài)網(wǎng)格劃分方法對(duì)醫(yī)療數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行篩選,構(gòu)建候選離群數(shù)據(jù)集,以此來(lái)達(dá)到縮小檢測(cè)規(guī)模、減少檢測(cè)執(zhí)行時(shí)間的目的.

動(dòng)態(tài)網(wǎng)格劃分方法是根據(jù)醫(yī)療數(shù)據(jù)庫(kù)中數(shù)據(jù)流的密度特點(diǎn)對(duì)數(shù)據(jù)做網(wǎng)格分裂及合并處理,按照密度大小對(duì)數(shù)據(jù)庫(kù)空間中的數(shù)據(jù)進(jìn)行分類(lèi),劃分為稀疏區(qū)域和稠密區(qū)域,對(duì)稠密區(qū)域中存在的大量主體數(shù)據(jù)進(jìn)行分析,存儲(chǔ)有較大概率成為離群點(diǎn)的數(shù)據(jù)并構(gòu)建候選離群點(diǎn)集合[8,9].

將較小的權(quán)重賦予給歷史數(shù)據(jù),降低歷史數(shù)據(jù)對(duì)網(wǎng)格劃分的影響,使當(dāng)前數(shù)據(jù)在數(shù)據(jù)庫(kù)中的分布情況能夠更好的通過(guò)網(wǎng)格進(jìn)行反應(yīng)[10].

式中,ri代 表的是數(shù)據(jù)點(diǎn).網(wǎng)格統(tǒng)計(jì)信息元素的計(jì)算公式如下:

設(shè)tc代表的是當(dāng)前時(shí)間.根據(jù)上述性質(zhì),增量更新數(shù)據(jù)在網(wǎng)格C中對(duì)應(yīng)的統(tǒng)計(jì)信息如下:

在初始化處理時(shí),對(duì)數(shù)據(jù)的網(wǎng)格進(jìn)行分割,獲得初始網(wǎng)格,根據(jù)網(wǎng)格統(tǒng)計(jì)信息可以計(jì)算得到數(shù)據(jù)在網(wǎng)格中對(duì)應(yīng)的平均值 μi和標(biāo)準(zhǔn)偏差σi:

如果網(wǎng)格的密度達(dá)到設(shè)定的閾值時(shí),分割網(wǎng)格.將數(shù)據(jù)聚集并劃分到對(duì)應(yīng)的網(wǎng)格中是網(wǎng)格分裂合并的原則[11].所以保存每個(gè)維度上網(wǎng)格對(duì)應(yīng)的方差和均值,選擇最大方差相應(yīng)的維度,在均值處做劃分處理,可以在兩個(gè)新生成的網(wǎng)格中劃入數(shù)據(jù).

式中,m inj代 表的是第j維度上在網(wǎng)格中存在的最小值;maxj代表的是第j維度上在網(wǎng)格中存在的最大值.

通過(guò)對(duì)網(wǎng)格進(jìn)行劃分再合并,能夠去除數(shù)據(jù)集中的非離群數(shù)據(jù),保證剩余的數(shù)據(jù)均為離群數(shù)據(jù),從而實(shí)現(xiàn)數(shù)據(jù)過(guò)濾,有效降低算法計(jì)算代價(jià)和復(fù)雜度,節(jié)約耗時(shí)提高醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)的效率.

3 醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)層次深度學(xué)習(xí)檢測(cè)

醫(yī)療數(shù)據(jù)庫(kù)中,針對(duì)數(shù)據(jù)類(lèi)別的確定有多種方式,可依據(jù)不同設(shè)備采集到的數(shù)據(jù)進(jìn)行分類(lèi),可依據(jù)不同種類(lèi)疾病進(jìn)行數(shù)據(jù)分類(lèi),還可依據(jù)不同身體部位進(jìn)行數(shù)據(jù)分類(lèi)等,只有依據(jù)同一分類(lèi)方式獲取得到的醫(yī)療數(shù)據(jù)才具有實(shí)際意義.因此,本文提出了基于深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)分類(lèi)和檢測(cè)框架,在每一分類(lèi)層次上都能夠?qū)崿F(xiàn)數(shù)據(jù)檢測(cè),即采用層次化深度學(xué)習(xí)方法對(duì)醫(yī)療數(shù)據(jù)庫(kù)中存在的離群數(shù)據(jù)進(jìn)行檢測(cè).

現(xiàn)有的離群數(shù)據(jù)檢測(cè)算法一般都是根據(jù)專(zhuān)家經(jīng)驗(yàn)設(shè)定對(duì)象鄰域半徑,結(jié)果隨機(jī)性和主觀(guān)性較大[13].本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法中,深度學(xué)習(xí)是基于模擬人腦進(jìn)行學(xué)習(xí)的一種神經(jīng)網(wǎng)絡(luò),本文采用一種基于卷積神經(jīng)網(wǎng)絡(luò)的深度網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行離群數(shù)據(jù)檢測(cè);層次化是指包含了專(zhuān)家知識(shí)層次和數(shù)據(jù)屬性取值分布信息層次兩部分,依據(jù)這兩者構(gòu)建深度網(wǎng)絡(luò)分類(lèi)器,有效感知離群數(shù)據(jù),提高離群數(shù)據(jù)檢測(cè)結(jié)果的準(zhǔn)確率.基于層次化深度學(xué)習(xí)的離群數(shù)據(jù)檢測(cè)結(jié)構(gòu)框架如圖1 所示.

根據(jù)圖1 可知,層次化深度學(xué)習(xí)檢測(cè)框架中,基于專(zhuān)家知識(shí)和數(shù)據(jù)屬性取值分布信息這兩個(gè)層次分類(lèi),構(gòu)建了深度網(wǎng)絡(luò)分類(lèi)器.接下來(lái)主要通過(guò)對(duì)數(shù)據(jù)差異度量來(lái)訓(xùn)練分類(lèi)器,從而實(shí)現(xiàn)離群數(shù)據(jù)檢測(cè),具體過(guò)程如下:

圖1 層次化深度學(xué)習(xí)檢測(cè)框架

醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)存在混合型屬性值和數(shù)據(jù)型屬性值,為了有效的對(duì)兩者之間存在的差異進(jìn)行度量,主要通過(guò)度量鄰域距離實(shí)現(xiàn)[13,14].設(shè)HEOMB(x,y)代表的是重疊度量值,其計(jì)算公式如下:

式中,參數(shù)dc ji(x,y)的計(jì)算公式如下:

通過(guò)式(22)確定鄰域半徑 εc j:

式中,std(cj)代 表的是屬性cj取值時(shí)對(duì)應(yīng)的標(biāo)準(zhǔn)差,可以通過(guò)該標(biāo)準(zhǔn)差對(duì)屬性均值的分散程度進(jìn)行衡量[15].如果標(biāo)準(zhǔn)差std(cj)的 值較大時(shí),表明在屬性cj上大部分?jǐn)?shù)據(jù)的均值和取值之間存在的差異較大;如果std(cj)的值較小時(shí),表明在屬性cj上大部分?jǐn)?shù)據(jù)的均值和取值之間存在的差異較小[16,17].

λ代表的是專(zhuān)家設(shè)定的參數(shù),鄰域半徑的大小可以通過(guò)參數(shù)λ 進(jìn)行調(diào)整[18].

設(shè)VDM(x,y)代表的是差異度量值,其計(jì)算公式為:

式中,x,y為對(duì)象集中存在的對(duì)象;P代表的是對(duì)象集對(duì)應(yīng)的特征集;df(xf,yf)代 表的是xf、yf之間存在的距離.

為了確定數(shù)據(jù)在數(shù)據(jù)庫(kù)中的離群程度,離群度量數(shù)據(jù)型屬性的取值[19,20].用NVDM(xi,xj)代表某存在對(duì)象xi和yi之 間的鄰域值差異度量值,設(shè)NOF代表的是鄰域離群因子,其計(jì)算公式如下:

設(shè) μ代表的是預(yù)設(shè)的離群點(diǎn)判定閾值,對(duì)比鄰域離群因子NOF與閾值μ 的大小.如果滿(mǎn)足如下條件,則該數(shù)據(jù)為離群數(shù)據(jù),否則為離群數(shù)據(jù).對(duì)所有的數(shù)據(jù)判斷完,即完成了對(duì)醫(yī)療數(shù)據(jù)庫(kù)中離群數(shù)據(jù)的檢測(cè).

4 實(shí)驗(yàn)分析與結(jié)果

為了驗(yàn)證基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的整體有效性,需要對(duì)其進(jìn)行測(cè)試.

實(shí)驗(yàn)條件設(shè)置如表1 所示.

表1 實(shí)驗(yàn)條件設(shè)置情況

實(shí)驗(yàn)數(shù)據(jù):本文使用UCI 機(jī)器學(xué)習(xí)庫(kù)中的Annealing和Wisconsin Breast Cancer 數(shù)據(jù)集(網(wǎng)址:http://archive.ics.uci.edu/ml/).為增強(qiáng)實(shí)驗(yàn)說(shuō)服力,將本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法(算法1)與文獻(xiàn)[2](算法2)、文獻(xiàn)[3](算法3)、文獻(xiàn)[4]中的基于局部密度的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法(算法4)、文獻(xiàn)[5]中的基于密度的數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法(算法5)、文獻(xiàn)[6]中的基于約簡(jiǎn)策略的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法(算法6)、文獻(xiàn)[7]中的基于混合式聚類(lèi)算法的離群點(diǎn)挖掘在異常檢測(cè)中的應(yīng)用方法(算法7)進(jìn)行對(duì)比測(cè)試.

實(shí)驗(yàn)選取的評(píng)價(jià)指標(biāo)及計(jì)算方式如下:

(1)計(jì)算代價(jià):數(shù)據(jù)在實(shí)際應(yīng)用中,由于過(guò)濾不佳或其他問(wèn)題,易導(dǎo)致錯(cuò)誤率增加,加大計(jì)算代價(jià),本實(shí)驗(yàn)以計(jì)算代價(jià)為指標(biāo)進(jìn)行分析,選取代價(jià)權(quán)值體現(xiàn)不同算法的計(jì)算代價(jià)情況,代價(jià)權(quán)值越高,計(jì)算代價(jià)越大.

(2)檢測(cè)時(shí)間:在迭代次數(shù)相同的條件下,測(cè)試本文算法和算法4、算法5、算法6、算法7 等5 種不同算法檢測(cè)離群數(shù)據(jù)的執(zhí)行時(shí)間,執(zhí)行時(shí)間越短證明檢測(cè)效率越高.

(3)離群點(diǎn)檢測(cè)率:為了進(jìn)一步驗(yàn)證本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的整體有效性,將離群點(diǎn)檢測(cè)率作為對(duì)比指標(biāo)進(jìn)行實(shí)驗(yàn),計(jì)算方法如下:

設(shè)L代表的是離群點(diǎn)檢測(cè)率,其計(jì)算公式如下:

式中,Nl代 表的是檢測(cè)出正確的離群點(diǎn)總數(shù);Nz代表的是數(shù)據(jù)集中存在的離群點(diǎn)總數(shù).

(4)離群點(diǎn)誤差率:將離群點(diǎn)誤差率作為對(duì)比指標(biāo),對(duì)基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法、算法2、算法5、算法6、算法7 進(jìn)行測(cè)試.

設(shè)W代表的是離群點(diǎn)誤差率,其計(jì)算公式如下:

式中,M1代 表的是輸出的離群點(diǎn)總數(shù);M2代表的是正確離群點(diǎn)總數(shù);S代表的是數(shù)據(jù)集總數(shù).

4.1 計(jì)算代價(jià)對(duì)比

對(duì)本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法與算法2、算法3、算法4 進(jìn)行對(duì)比,結(jié)果如圖2 所示.

圖2 計(jì)算代價(jià)對(duì)比

分析圖2 可以看出,本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的計(jì)算代價(jià)明顯較低,代價(jià)權(quán)值不超過(guò)1.5,而算法2、算法3、算法4 的代價(jià)權(quán)值集中在1.0~3.0 之間,算法2 最高,代價(jià)權(quán)值多在2.5 以上,由此可以看出,本文算法的計(jì)算代價(jià)小,具有一定的優(yōu)勢(shì).因?yàn)楸疚乃惴ㄍㄟ^(guò)對(duì)網(wǎng)格進(jìn)行劃分再合并,去除了數(shù)據(jù)集中的非離群數(shù)據(jù),即進(jìn)行了數(shù)據(jù)過(guò)濾,有效提高了數(shù)據(jù)質(zhì)量,降低了計(jì)算代價(jià).

4.2 檢測(cè)時(shí)間對(duì)比

在迭代次數(shù)相同的條件下,5 種不同算法檢測(cè)離群數(shù)據(jù)的執(zhí)行時(shí)間測(cè)試結(jié)果如圖3 所示.

圖3 5 種不同算法的執(zhí)行時(shí)間對(duì)比

分析圖3 可知,隨著迭代次數(shù)的不斷增加,不同算法的在檢測(cè)離群數(shù)據(jù)時(shí)的執(zhí)行時(shí)間也在不斷發(fā)生變化.其中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法在多次迭代中的最多執(zhí)行時(shí)間為200 s,其執(zhí)行時(shí)間折線(xiàn)僅在迭代次數(shù)為300 次時(shí)與基于混合式聚類(lèi)算法的離群點(diǎn)挖掘在異常檢測(cè)中的應(yīng)用方法的執(zhí)行時(shí)間折線(xiàn)相交,證明該算法的執(zhí)行時(shí)間明顯少于基于局部密度的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法、基于密度的數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法、基于約簡(jiǎn)策略的數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法、基于混合式聚類(lèi)算法的離群點(diǎn)挖掘在異常檢測(cè)中的應(yīng)用方法的執(zhí)行時(shí)間.這是主要因?yàn)榛趯哟位疃葘W(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法采用動(dòng)態(tài)網(wǎng)格劃分方法對(duì)數(shù)據(jù)進(jìn)行篩選,有效縮小了數(shù)據(jù)檢測(cè)的范圍和規(guī)模,因此節(jié)省了檢測(cè)數(shù)據(jù)所用的時(shí)間,大大提高了檢測(cè)效率.

4.3 離群點(diǎn)檢測(cè)率對(duì)比

對(duì)基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法、算法2、算法3、算法6、算法7 進(jìn)行測(cè)試.

基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法、算法2、算法3、算法6、算法7 的離群點(diǎn)檢測(cè)率計(jì)算結(jié)果如表2 所示.

表2 5 種不同算法的離群點(diǎn)檢測(cè)率測(cè)試結(jié)果(%)

為了更直觀(guān)、清晰地對(duì)比不同算法的離群點(diǎn)檢測(cè)率,將表2 中的數(shù)據(jù)用折線(xiàn)圖的形式表現(xiàn),如圖4 所示.

圖4 5 種不同算法的離群點(diǎn)檢測(cè)率對(duì)比

分析表2 和圖4 中的數(shù)據(jù)可知,在5 次不同迭代中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的平均離群點(diǎn)檢測(cè)率為97.6%,算法4 的平均離群點(diǎn)檢測(cè)率為83.0%,算法5 的平均離群點(diǎn)檢測(cè)率為75.8%,算法6 的平均離群點(diǎn)檢測(cè)率為69.4%,算法7 的平均離群點(diǎn)檢測(cè)率為82.2%.對(duì)比5 種不同算法的離群點(diǎn)檢測(cè)率可知,基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的離群點(diǎn)檢測(cè)率始終高于另外4 種算法,進(jìn)一步證明了本文所提算法的有效性.究其原因,是因?yàn)楸疚乃惴ɑ诙鄬哟紊疃葘W(xué)習(xí)進(jìn)行離群數(shù)據(jù)檢測(cè),融合了卷積神經(jīng)網(wǎng)絡(luò)和層次分類(lèi)兩者的優(yōu)勢(shì),有效提高了算法的離群點(diǎn)檢測(cè)率.

4.4 離群點(diǎn)誤差率對(duì)比

基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法、算法2、算法5、算法6、算法7 的離群點(diǎn)誤差率計(jì)算結(jié)果如表3 所示.

表3 5 種不同算法的離群點(diǎn)誤差率計(jì)算結(jié)果

為了更直觀(guān)地對(duì)比不同算法的離群點(diǎn)誤差率,將表3 中的數(shù)據(jù)用折線(xiàn)圖的形式表現(xiàn),如圖5 所示.

分析表3 和圖5 可知,在五次不同迭代中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的平均離群點(diǎn)誤差率為0.12%;算法2 的平均離群點(diǎn)誤差率為0.288%;算法5 的平均離群點(diǎn)誤差率為0.292%;算法6 的平均離群點(diǎn)誤差率為0.35%,算法7 平均離群點(diǎn)誤差率為0.316%.對(duì)比5 種不同算法的平均離群點(diǎn)誤差率可知,基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的離群點(diǎn)誤差率始終低于另外4 種算法,證明了本文所提算法的有效性.本文算法融合專(zhuān)家知識(shí)和數(shù)據(jù)的屬性取值分布信息,從多個(gè)層次感知離群數(shù)據(jù)信息,從而降低了離群數(shù)據(jù)檢測(cè)誤差.

圖5 5 種不同算法的離群點(diǎn)誤差率對(duì)比

綜上所述,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離散數(shù)據(jù)檢測(cè)算法的離群點(diǎn)檢測(cè)率較高、離群點(diǎn)誤差率較低.這主要是因?yàn)榛趯哟位疃葘W(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法在過(guò)濾離群數(shù)據(jù)時(shí),采用動(dòng)態(tài)網(wǎng)格劃分法降低數(shù)據(jù)檢測(cè)的計(jì)算代價(jià),縮短了檢測(cè)執(zhí)行時(shí)間,而在計(jì)算鄰域半徑時(shí),融合專(zhuān)家知識(shí)和數(shù)據(jù)的屬性取值分布信息,降低了檢測(cè)誤差,大大提高了基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法的有效性.

5 結(jié)語(yǔ)

醫(yī)療信息量的不斷增長(zhǎng)以及信息技術(shù)的飛速進(jìn)步,使醫(yī)療數(shù)據(jù)庫(kù)中積累了大量數(shù)據(jù).如何在醫(yī)療數(shù)據(jù)庫(kù)中及時(shí)、高效、準(zhǔn)確的獲取信息,是目前亟需解決的問(wèn)題之一.針對(duì)當(dāng)前醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法存在檢測(cè)效率低、離群點(diǎn)檢測(cè)率低和離群點(diǎn)誤差率高的問(wèn)題,本文提出基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法,可以精準(zhǔn)的在短時(shí)間內(nèi)完成醫(yī)療數(shù)據(jù)庫(kù)中離群數(shù)據(jù)的檢測(cè),解決了當(dāng)前醫(yī)療數(shù)據(jù)庫(kù)離群數(shù)據(jù)檢測(cè)算法中存在的問(wèn)題,具有計(jì)算代價(jià)小、檢測(cè)耗時(shí)短、離群點(diǎn)檢測(cè)率高、離群點(diǎn)誤差率低的優(yōu)點(diǎn),為數(shù)據(jù)檢測(cè)、挖掘技術(shù)的發(fā)展奠定了基礎(chǔ).在未來(lái)的研究階段,將深入對(duì)不同屬性的離群數(shù)據(jù)進(jìn)行精細(xì)檢測(cè),進(jìn)一步提高檢測(cè)效果.

猜你喜歡
深度數(shù)據(jù)庫(kù)檢測(cè)
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
深度理解一元一次方程
深度觀(guān)察
深度觀(guān)察
深度觀(guān)察
數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)
小波變換在PCB缺陷檢測(cè)中的應(yīng)用
主站蜘蛛池模板: 91精品啪在线观看国产| 日韩欧美中文字幕一本| 免费高清毛片| 91久久夜色精品| 欧美激情视频一区二区三区免费| 狠狠色综合久久狠狠色综合| 久久人妻xunleige无码| 不卡网亚洲无码| 激情无码字幕综合| 国产丝袜无码一区二区视频| 亚洲妓女综合网995久久| 亚洲无码高清视频在线观看| av天堂最新版在线| 女高中生自慰污污网站| 国产色伊人| 久久精品电影| 久久久久九九精品影院| 四虎影视无码永久免费观看| 在线国产91| 亚洲一本大道在线| 国产黄网永久免费| 免费国产一级 片内射老| 国产美女免费| 国产在线视频导航| 97在线公开视频| 国产福利观看| 日韩久草视频| 国产在线98福利播放视频免费| 色精品视频| 日韩精品一区二区三区大桥未久| 丝袜久久剧情精品国产| 国产在线视频欧美亚综合| 亚洲区视频在线观看| 韩日午夜在线资源一区二区| 国产精品hd在线播放| 国产一区二区三区在线观看视频 | 精品在线免费播放| 久久久久免费看成人影片| 国产精品亚洲一区二区在线观看| 午夜老司机永久免费看片| 高潮毛片无遮挡高清视频播放| 欧美特级AAAAAA视频免费观看| 国产精欧美一区二区三区| 中文字幕资源站| 成人亚洲国产| 日本一区中文字幕最新在线| 国产精品欧美在线观看| 日韩精品无码一级毛片免费| 亚洲欧洲日韩综合| 国产日韩欧美在线播放| 国产欧美日韩另类| 欧美精品三级在线| 久久综合九九亚洲一区| 播五月综合| 亚洲第七页| 亚洲成a∧人片在线观看无码| 国产精品极品美女自在线| 国产精品久久自在自线观看| 国产伦片中文免费观看| 一级毛片在线免费视频| 久久精品国产免费观看频道| 国产美女人喷水在线观看| 国产精品久久久久久影院| 国产精品第5页| 亚洲第一视频区| 91网在线| 久久99精品国产麻豆宅宅| 国产精品污污在线观看网站| 91福利免费| 国产永久在线视频| h网站在线播放| 亚洲狼网站狼狼鲁亚洲下载| 2021国产精品自拍| 亚洲日韩第九十九页| 国产va视频| 国产精品亚洲欧美日韩久久| 亚洲精品无码高潮喷水A| 一本久道热中字伊人| 超碰91免费人妻| 亚洲第一色视频| 麻豆国产精品| 性视频一区|