999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用

2017-10-12 07:20:28郝惠惠
關(guān)鍵詞:信息

王 林,雷 佳,郝惠惠

(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安 710048)

基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用

王 林,雷 佳,郝惠惠

(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安 710048)

針對(duì)模糊聚類(lèi)算法在運(yùn)算大數(shù)據(jù)量時(shí)性能差的問(wèn)題,提出基于Hadoop分布式平臺(tái)的改進(jìn)算法進(jìn)行圖像修復(fù)。對(duì)于受損圖像信息,首先將Canopy算法和模糊聚類(lèi)相結(jié)合在Hadoop平臺(tái)上進(jìn)行并行化,然后進(jìn)行字典訓(xùn)練獲得修復(fù)圖像。實(shí)驗(yàn)結(jié)果表明,該算法在均方誤差和峰值信噪比上均優(yōu)于改進(jìn)前的圖像修復(fù)算法,提高了圖像修復(fù)質(zhì)量并且減少了算法的運(yùn)行時(shí)間,適合修復(fù)海量圖像。

圖像修復(fù);聚類(lèi);Hadoop

Abstract: Aiming at the problem that the fuzzy clustering algorithm is poor in computing large data volume, an improved algorithm based on Hadoop distributed platform is proposed for image restoration. For the damaged image information, the Canopy algorithm and the fuzzy clustering are combined on the Hadoop platform for parallelization, and then the dictionary is trained to obtain the repaired image. The experimental results show that the algorithm is superior to the previous image restoration algorithm in terms of mean square error and peak signal to noise ratio, which improves the quality of image restoration and reduces the running time of the algorithm. It is suitable for repairing massive image.

Key words:image inpainting; clustering; Hadoop

0 引言

圖像技術(shù)在各個(gè)方面都得到廣泛應(yīng)用[1],但在圖像獲取過(guò)程中往往會(huì)造成圖像信息丟失。利用受損圖像信息恢復(fù)出原始圖像信息,即圖像復(fù)原技術(shù)。

2011年,SAHOO S K等人[2]利用局部圖像塊的稀疏近似來(lái)解決圖像修復(fù)問(wèn)題,提出了一個(gè)用于局部稀疏近似的自適應(yīng)窗口選擇步驟來(lái)影響底層圖像全局恢復(fù)的框架,此框架提供了一個(gè)基于選擇窗口大小的群集圖像,接著利用稀疏近似算法分別修復(fù)每一個(gè)群集,從而達(dá)到理想的修復(fù)結(jié)果。此外,研究學(xué)者在文獻(xiàn)[3-7]中都對(duì)圖像修復(fù)算法進(jìn)行改進(jìn),不同程度地提高了修復(fù)效果。但這些算法沒(méi)有考慮到圖像之間存在相似性,而且對(duì)于樣本數(shù)據(jù)大的情況,沒(méi)有提出有效地提高算法效率的解決方案。

針對(duì)以上缺陷,提出一種運(yùn)行在Hadoop分布式平臺(tái)上的改進(jìn)聚類(lèi)的字典學(xué)習(xí)算法。首先對(duì)圖像數(shù)據(jù)集中的多類(lèi)圖像運(yùn)用改進(jìn)的模糊聚類(lèi)算法(FCM)進(jìn)行分類(lèi),同時(shí)在Hadoop分布式平臺(tái)進(jìn)行并行化計(jì)算,然后對(duì)每一類(lèi)圖像數(shù)據(jù)進(jìn)行字典訓(xùn)練,得到每類(lèi)圖像的字典再指導(dǎo)圖像修復(fù)。

1 理論基礎(chǔ)

聚類(lèi)是一種數(shù)據(jù)挖掘算法,基于信息之間的相似性對(duì)數(shù)據(jù)進(jìn)行分類(lèi),與分類(lèi)算法不同的是,聚類(lèi)在算法開(kāi)始之前并不知道要將數(shù)據(jù)分為幾類(lèi)。Canopy算法和FCM都是聚類(lèi)算法,只是聚類(lèi)方式不同。兩個(gè)聚類(lèi)算法各有優(yōu)缺點(diǎn),本文將兩種算法結(jié)合,充分利用兩個(gè)聚類(lèi)的優(yōu)勢(shì)對(duì)圖像信息進(jìn)行聚類(lèi)分析。

1.1 Canopy-FCM算法

Canopy-FCM算法的思路是利用Canopy算法產(chǎn)生聚類(lèi)中心,從而彌補(bǔ)了 FCM聚類(lèi)算法對(duì)初始聚類(lèi)中心敏感的問(wèn)題。Canopy-FCM算法的基本思路是:首先使用Canopy算法產(chǎn)生若干個(gè)初始聚類(lèi)中心,然后再刪除那些聚類(lèi)中心中小于特定閾值的值;之后根據(jù)第一步已經(jīng)產(chǎn)生的聚類(lèi)中心,再進(jìn)行模糊C均值聚類(lèi)[7]。

因此可以先使用Canopy算法粗聚類(lèi),產(chǎn)生初始聚類(lèi)中心,再使用FCM算法細(xì)聚類(lèi),從而提高算法效率,改善模糊C均值算法的不足。

1.2基于K-SVD字典訓(xùn)練的圖像修復(fù)算法

基于K-SVD字典訓(xùn)練的圖像修復(fù)算法主要是從受損圖像中提取有用信息,然后選擇初始字典D,使用K-SVD算法對(duì)分塊后的圖像進(jìn)行訓(xùn)練,得到新的字典,并計(jì)算出稀疏系數(shù),再更新對(duì)應(yīng)的圖像,如此便能修復(fù)受損圖像。

具體步驟為:

(1)對(duì)圖像進(jìn)行稀疏編碼。

(2)更新第k類(lèi)圖像字典Dk。

(3)重復(fù)執(zhí)行步驟(1)和步驟(2),直到滿(mǎn)足迭代次數(shù),字典Dk更新完成。

(4)選擇對(duì)應(yīng)的字典Dk(k∈1,…,I)作為基字典,進(jìn)行K-SVD字典訓(xùn)練,計(jì)算稀疏系數(shù),并利用更新的字典乘以稀疏系數(shù),修復(fù)受損圖像。

2 本文算法

考慮到圖像之間的相似性,因此修復(fù)圖像之前,首先對(duì)圖像數(shù)據(jù)進(jìn)行聚類(lèi),然后將已聚類(lèi)的圖像進(jìn)行K-SVD字典訓(xùn)練。傳統(tǒng)FCM對(duì)初始值敏感[8],本文針對(duì)此問(wèn)題進(jìn)行了改進(jìn),應(yīng)用Hadoop分布式平臺(tái)并行化算法來(lái)提高聚類(lèi)速率。

Canopy-FCM算法的并行化過(guò)程分為兩個(gè)步驟:第一步是對(duì)Canopy算法進(jìn)行Map-Reduce化;第二步是對(duì)FCM算法進(jìn)行Map-Reduce化。

Canopy-FCM算法框架如圖1所示。

圖1 Canopy-FCM算法的Map-Reduce框架圖

(1)對(duì)Canopy算法進(jìn)行Map-Reduce化

Canopy算法的并行化分為map過(guò)程和reduce過(guò)程。Canopy算法的并行化首先將原始數(shù)據(jù)分為若干數(shù)據(jù)分片,并復(fù)制到執(zhí)行任務(wù)的map節(jié)點(diǎn)上,而且所有的map節(jié)點(diǎn)獨(dú)立完成分配的任務(wù)。map過(guò)程主要是使用Canopy算法思想對(duì)該節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行串行處理,然后獲得形式的Canopy中心集合。

在串行化的Canopy過(guò)程中,需要輸入兩個(gè)閾值T1和T2,因此在map階段和reduce階段要分別設(shè)置兩個(gè)閾值(T1,T2)和(T3,T4),且T3>T1,T4>T2,然后按照Canopy算法思想設(shè)置filter值。

(2)對(duì)FCM算法進(jìn)行Map-Reduce化

(1)

(2)

式中Nk表示第k個(gè)map節(jié)點(diǎn)的數(shù)量,在reduce階段計(jì)算聚類(lèi)中心,如公式(3)所示:

(3)

其中p表示map節(jié)點(diǎn)數(shù)。

FCM的Map-Reduce化分為五個(gè)階段,分別是map階段、combine階段、reduce階段、迭代過(guò)程及數(shù)據(jù)對(duì)象分類(lèi)的過(guò)程。

并行化的Canopy-FCM算法分為Canopy算法時(shí)間復(fù)雜度和FCM算法時(shí)間復(fù)雜度兩部分,設(shè)數(shù)據(jù)集的數(shù)據(jù)量為N,map階段的節(jié)點(diǎn)數(shù)量為m,reduce階段的節(jié)點(diǎn)數(shù)量為r,迭代次數(shù)用i表示,聚類(lèi)中心的數(shù)量用c表示,k表示對(duì)象維數(shù)。

map過(guò)程的執(zhí)行總時(shí)間為:

(4)

Combine過(guò)程執(zhí)行時(shí)間為:

(5)

reduce過(guò)程執(zhí)行時(shí)間為:

t3=mck

(6)

迭代過(guò)程的執(zhí)行時(shí)間為:

(7)

對(duì)象劃分過(guò)程是計(jì)算集合中的數(shù)據(jù)對(duì)簇中心的隸屬程度,并依據(jù)隸屬度的大小將數(shù)據(jù)數(shù)據(jù)對(duì)象歸到合適的類(lèi),所以時(shí)間復(fù)雜度與map過(guò)程同為:

(8)

綜上所述,并行化的FCM過(guò)程執(zhí)行時(shí)間為:

t6=(2ckN/m+mck)i+ckN/m

(9)

因此并行化的FCM算法復(fù)雜度約為O(ckNi/m)。

Canopy算法產(chǎn)生的Canopy個(gè)數(shù)與聚類(lèi)中心的個(gè)數(shù)同為c,則并行化的Canopy計(jì)算時(shí)間為:

(10)

則并行化的Canopy-FCM算法的總運(yùn)行時(shí)間為:

t8=(2ckN/m+mck)i+ckN/m+cN/m+cmc

(11)

因此Canopy-FCM算法時(shí)間復(fù)雜度為O(ckNi/m)。

單機(jī)模式下的FCM算法過(guò)程分為屬度計(jì)算過(guò)程、迭代過(guò)程和數(shù)據(jù)對(duì)象分類(lèi)三部分,數(shù)據(jù)對(duì)象分類(lèi)可以通過(guò)最后的模糊矩陣計(jì)算。因此總的計(jì)算時(shí)間為:

tsingle=ckNi+cN

(12)

由理論推導(dǎo)得出,單機(jī)模式的FCM算法復(fù)雜度為O(ckNi),是并行化的m倍。并行化的FCM是在計(jì)算機(jī)集群上并行運(yùn)行,所以加快了算法的運(yùn)行速度。

3 實(shí)驗(yàn)分析

仿真平臺(tái)是Apache Mahout,它是運(yùn)行在Hadoop平臺(tái)下的針對(duì)大數(shù)據(jù)集的一個(gè)機(jī)器學(xué)習(xí)庫(kù),通過(guò)MapReduce模型進(jìn)行實(shí)現(xiàn)。算法采用的數(shù)據(jù)集是由加州理工學(xué)院提供的Caltech 101,圖像修復(fù)過(guò)程采用其中5組數(shù)據(jù)。

3.1改進(jìn)聚類(lèi)算法實(shí)驗(yàn)

聚類(lèi)實(shí)驗(yàn)部分,使用查準(zhǔn)率(Precision)、查全率(Recall)和簇間距離評(píng)估結(jié)果。

(13)

(14)

TP是指在當(dāng)前簇中被正確聚類(lèi)的數(shù)據(jù)對(duì)象的個(gè)數(shù),F(xiàn)P是指在當(dāng)前簇中被誤聚到該簇的數(shù)據(jù),F(xiàn)N是指該簇實(shí)際包含的對(duì)象的數(shù)目。n表示整個(gè)數(shù)據(jù)集的類(lèi)別,則平均查準(zhǔn)率和平均查全率可以表示為:

(15)

(16)

從表1可以看出,Canopy-FCM算法不論是在聚類(lèi)效果上還是在運(yùn)算速度上都優(yōu)于FCM算法。如表2所示,該算法比FCM簇間最大距離、簇間最小距離和歸一化距離都降低,可見(jiàn)Canopy-FCM改善了FCM算法的聚類(lèi)質(zhì)量。

表1 算法的聚類(lèi)質(zhì)量

表2 簇間距離結(jié)果

3.2改進(jìn)的聚類(lèi)圖像修復(fù)算法

實(shí)驗(yàn)的圖像修復(fù)部分,采用均方誤差(MSE)和峰值信噪比(PSNR)評(píng)估算法。均方誤差的數(shù)值越小,說(shuō)明與原圖像越接近,修復(fù)效果越好;峰值信噪比越大,說(shuō)明圖像復(fù)原的效果越好。

分析三種不同算法在圖像隨機(jī)丟失50%和70%的信息時(shí)的仿真圖和評(píng)價(jià)指標(biāo)對(duì)比結(jié)果,驗(yàn)證算法的有效性和可行性,如表3和表4所示。

表3 實(shí)驗(yàn)圖像丟失50%信息

表4 實(shí)驗(yàn)圖像丟失70%信息

以上實(shí)驗(yàn)的分析結(jié)果表明,本文算法在均方誤差、峰值信噪比和運(yùn)行速度上均優(yōu)于DCT算法和K-SVD算法。

4 結(jié)論

本文提出一種基于Hadoop的改進(jìn)聚類(lèi)算法,并將其應(yīng)用于受損圖像,盡可能還原圖像信息。首先基于圖像相似性使用Canopy-FCM聚類(lèi)算法對(duì)圖像進(jìn)行分類(lèi),同時(shí)在Hadoop分布式平臺(tái)進(jìn)行并行化處理,然后對(duì)每類(lèi)圖像進(jìn)行字典訓(xùn)練,并使用獲得的字典來(lái)修復(fù)受損。實(shí)驗(yàn)結(jié)果證明,本文算法在速度、均方根誤差和峰值信噪比上,均優(yōu)于僅僅利用待修復(fù)圖像進(jìn)行字典訓(xùn)練的圖像修復(fù)算法。

[1] OLSHAUSEN B A, FIELD D J. Emergence of simple-cell receptive field properties by learning a sparse code for natural images[J]. Nature, 1996, 381(6583): 607-609.

[2] SAHOO S K, Lu Wenmiao. Image denoising using sparse approximation with adaptive window selection[C]. Information Communication Signal Processing, 2011: 1-4.

[3] ELAD M, AHARON M. Image denoising via sparse and redundant representations over learned dictionaries[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2006, 15(12):3736-3745.

[4] 何埜,李光耀,肖莽,等.基于深度信息的圖像修復(fù)算法[J].計(jì)算機(jī)應(yīng)用,2015, 35(10): 2955-2958.

[5] 陳澤墅. 基于稀疏表示的圖像修復(fù)算法研究[D]. 杭州:浙江工業(yè)大學(xué), 2015.

[6] 常晨, 何建農(nóng). 改進(jìn)的基于樣本塊的圖像修復(fù)方法[J]. 微型機(jī)與應(yīng)用, 2015, 34(23):45-47.

[7] 楊茹, 秦振濤, 楊武年. 基于字典學(xué)習(xí)的古建筑圖像修復(fù)研究[J]. 電子技術(shù)應(yīng)用, 2016, 42(12):51-53.

[8] 余長(zhǎng)俊,張燃.云環(huán)境下基于Canopy聚類(lèi)的FCM算法研究[J].計(jì)算機(jī)科學(xué), 2014, 41(s2):316-31.

Application of improved clustering algorithm based on Hadoop in image inpainting

Wang Lin, Lei Jia, Hao Huihui

(School of Automation and Information Engineering, Xi’an University of Technology, Xi’an 710048, China)

TP391

A

10.19358/j.issn.1674- 7720.2017.18.015

王林,雷佳,郝惠惠.基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用[J].微型機(jī)與應(yīng)用,2017,36(18):49-51.

2017-03-29)

王林(1963-),男,博士,教授,主要研究方向:復(fù)雜網(wǎng)絡(luò)、圖像處理。

雷佳(1991-),通信作者,女,碩士研究生,主要研究方向:圖像處理。E-mail:754438195@qq.com。

郝惠惠(1989-),女,碩士,主要研究方向:圖像處理。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會(huì)信息
信息超市
展會(huì)信息
展會(huì)信息
展會(huì)信息
展會(huì)信息
展會(huì)信息
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 欧美人与动牲交a欧美精品| 国产小视频a在线观看| 亚洲男人天堂久久| 五月激情综合网| 久久久噜噜噜久久中文字幕色伊伊| 天堂在线www网亚洲| 国产老女人精品免费视频| 99人体免费视频| 国模沟沟一区二区三区| 黄色网址免费在线| 精品五夜婷香蕉国产线看观看| 国产91在线免费视频| 人妻无码AⅤ中文字| 国产真实乱人视频| 国产美女无遮挡免费视频网站| vvvv98国产成人综合青青| 色综合综合网| 亚洲中文字幕av无码区| 欧美日本在线一区二区三区| 91成人在线免费视频| 亚洲欧美人成人让影院| 99精品国产电影| 色综合热无码热国产| 日本免费a视频| 国产成人av一区二区三区| 四虎在线高清无码| 国产一国产一有一级毛片视频| 国产一级裸网站| 又爽又大又黄a级毛片在线视频 | 亚洲国产欧洲精品路线久久| 久久久久久久久久国产精品| 免费观看三级毛片| 久久精品无码一区二区国产区| 无遮挡国产高潮视频免费观看| 人妻无码一区二区视频| www.亚洲天堂| 国产精品综合久久久| 国产91成人| 欧美日本中文| 性色一区| 国产女人爽到高潮的免费视频 | 先锋资源久久| 欧美19综合中文字幕| 免费一级毛片在线观看| 国产成人久久综合一区| 亚洲男人天堂2020| 国产一区二区人大臿蕉香蕉| 五月婷婷中文字幕| 亚洲免费黄色网| 无码aaa视频| 成人韩免费网站| 欧美中文一区| 久久天天躁狠狠躁夜夜2020一 | 中文字幕日韩久久综合影院| 夜夜操狠狠操| 亚洲AV永久无码精品古装片| 欧美精品成人| 国产精品99在线观看| 亚洲欧美一区二区三区图片| 91精品亚洲| 91麻豆精品国产高清在线| 国产在线观看人成激情视频| 三区在线视频| 毛片久久网站小视频| 成人在线观看一区| 国产www网站| 中文字幕在线看| 欧洲在线免费视频| 伊人久久婷婷五月综合97色| 乱人伦99久久| 国产激情无码一区二区APP| a毛片免费看| 色成人亚洲| 嫩草国产在线| 91精品国产一区| 色综合久久88色综合天天提莫| 亚欧成人无码AV在线播放| 亚洲精品色AV无码看| 欧美精品v| 亚洲无码视频图片| 欧美亚洲国产一区| 996免费视频国产在线播放|