999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度強化學習的圖像修復算法設計

2019-07-29 01:12:33崔小洛欒曉飛
物聯網技術 2019年6期
關鍵詞:機器學習大數據

崔小洛 欒曉飛

摘 要:日前,圖像修復技術已經越來越成熟,出現了各種機器學習算法來填充圖片中缺失信息區域的紋理和結構。文中將圖像修復過程轉化為一個離散的強化學習問題,并設計了一種基于深度強化學習的可以漸進填充缺失區域圖像的算法,通過圖像修復算法設計出一套修復策略,使得整個修復過程更貼近人類的工作效果。

關鍵詞:圖像修復;機器學習;深度強化學習;大數據;自相似;關聯性

中圖分類號:TP39 文獻標識碼:A 文章編號:2095-1302(2019)06-00-03

0 引 言

大數據時代,人們對圖像信息的需求越來越多,同時也越來越注重圖像信息的質量。通常由于圖像數據采集設備或傳輸設備的不足,圖像數據往往伴隨著大量噪聲。由于圖像儲存設備技術存在瑕疵,導致圖像可能出現數據丟失等問題。去除圖像中存在的噪聲,還原圖像中缺失的部分被稱為圖像修復。目前,圖像修復技術被廣泛用于遙感、天文、軍事以及民用領域[1],作用不可忽視。隨著圖像數據的海量增長,如何使用快速穩定的算法進行圖像修復已成為業界研究的重點。

通常我們把圖像修復目標定義為在已有圖像上覆蓋一部分區域Ω,在該部分區域中的每一個像素點輸入像素值,由此凸顯了恢復和修改圖像或視頻工作的重要性。但這也是使用圖像修復來理解不同圖像模型有效性的結果。從圖像模型結構入手,現有的圖像修復技術可以分為如下3大類[2]:

(1)當圖像中有大量重復片段時就可以使用自相似理論。假設給定一個像素的空間鄰域亮度值的概率分布獨立于圖像其余部分,則該紋理被建模,之后利用近鄰劃窗,當檢測到符合之前紋理特征的Ω時,便進行機械化填充,填充的像素點值會受填充起止數值的影響。

(2)在填充區域Ω時,考慮圖像色區空間的相似性,在保證填充區域與圖像全局空間分布基本一致的前提下進行圖像修復,通過使用紋理合成技術以提高色塊填充的精確程度。

(3)第三種則是基于微分方程(PDE)來觀察圖像紋理的擴散規律,建模與空間信息相關的變分模型指導圖像修復工作。這類算法在處理分段圖像和較小Ω時,效果顯著。

但此類算法都基于人工尋找相應的特征來挑選填充色素。近年來,隨著深度學習技術的興起,通過監督訓練神經網絡來減小算法生成圖像與原圖像之間的差異,以替代人工特征選擇,效果明顯[3-4]。圖像的重復信息、空間信息、紋理特征都可以在黑箱中被更好地囊括,甚至可以通過發掘深度學習算法得到更好的深層特征來指導圖像修復工作。生成對抗網絡[5]等先進的深度學習算法都在圖像修復的問題上取得了極好的成果。然而這類算法的生成圖像規律通過訓練求得,無法學習到一個完整的圖像修復過程,只是單純的端到端學習。

本文基于覆蓋區域Ω與圖像其他完整部分紋理之間存在的關聯性圖像修復理論基礎,考慮構建一種基于深度強化學習的漸進過程的圖像修補方法,通過迭代運算方法,讓圖像修補過程成為一個策略學習過程,智能體可以在每一步修補過程中進行新的修補路徑規劃。

1 相關算法

1.1 強化學習

強化學習是機器學習中的一個重要分支,強化學習智能體的訓練基于其自身在環境中的探索,而非人為提供的訓練樣本[6]。環境返回的回報信息使得智能體可以不斷優化策略,強化學習算法的目標就是最大化折扣回報,即:

式中0≤γ≤1為折扣因子。當智能體處于狀態St時,根據策略π來選擇一個動作at,Q學習算法是強化學習算法的一種,智能體根據環境中的狀態St+1,返還一個回報值rt??梢詫學習算法表達為:

式中α為算法的學習率。此算法在強化學習的過程中,被證明可以收斂得到最優的值函數。

1.2 深度強化學習DQN更新公式:

2015年Deep mind將Double-Q算法引入深度強化學習的策略迭代過程:

2016年Deep mind提出了DDPG。不同于之前的Double-DQN,DDPG將動作選擇從值函數網絡的學習任務中脫離出來,利用ac框架,將動作選擇算法由貪心算法轉換為輸入為值函數的期望和,輸出為動作值,損失函數為最大化動作回報的神經網絡。actor網絡更新梯度為:

Critic網絡更新梯度為:

在更新兩網絡參數時,使用以τ為參數的迭代式:

Double-DQN概率引入前第n步的值函數來求取最大值,減小了由最大值函數引起的算法系統誤差。DDPG的網絡更新則是對多個之前的網絡進行加權,以保證計算網絡更新梯度中所用的值函數為之前所有值函數的數學期望,削弱負向的更新向量對網絡更新的影響。

1.3 圖像差異

為了衡量兩個圖像之間的差異,文中使用kl散度作為衡量兩個圖像之間相似度的方法。定義kl距離為:

2 算法思路

算法思路:將圖像修復工作轉化為一個強化學習任務,且賦予其相應的數據處理能力。

學習目標:智能體處理圖像,改變圖像像素點的顏色,使得最終生成的圖像與目標圖像之間的差異逐漸變小。

當且僅當上述不等式取等且均等于0時,則認為完成了學習任務。由此,我們可以定義強化學習回報公式:

當且僅當兩者相等時有最大的回報。由于智能體將一直在環境中進行修改圖像的探索,所以二者之間總有差值,最后會在最優解上下波動,得到最優策略。動作值見表1所列。

為簡化強化學習任務,我們選擇按照圖像坐標遞增的原則,選定用于填充的像素點。選擇VGG16提取圖像特征,經典的VGG16即16層卷積神經網絡模型及設計流程如圖1所示。

圖像提取出的VGG特征將作為強化學習算法的狀態輸入,以進一步簡化圖像,使智能體更好地分辨狀態的變化。

經智能體策略生成的新像素點值會改變圖像狀態,將前后狀態、回報和相應的像素點變化動作存入經驗緩存區,歷經大量探索后讓智能體進行訓練,完善AC網絡參數,形成相應策略后再進行新一輪探索,即離線訓練。整個過程計算量較大,建議進行異步探索,以減少算法對硬件的壓力和訓練時間。

3 結 語

本文提出了一種全新的基于強化學習的圖像修復算法思路,通過定義相應的強化學習環境,使智能體按照一定順序遍歷缺失圖片區域時可自行補齊相應的像素點,修補圖片。與以往算法不同的是,將圖像修復過程離散化的修補策略使得算法可以實時跟蹤圖像相應的狀態變化,并根據這些變化實時更新圖像補齊策略,解決了傳統修復算法存在的一步更新,無法實時跟蹤圖像修復的問題。通過增強圖像修復算法的智能性,將整個圖像的修復過程精確到像素級。

參 考 文 獻

[1] BERTALMIO,MARCELO,SAPIRO,et al.Image inpainting[J].Siggraph,2005,4(9):417-424.

[2] BUGEAU A, BERTALM?O M, CASELLES V, et al.A comprehensive framework for image inpainting[J].IEEE transactions on image processing,2010,19(10):2634-2645.

[3] ZHU X, QIAN Y, ZHAO X, et al.A deep learning approach to patch-based image inpainting forensics[J].Signal processing image communication,2018,67(9):90-99.

[4] HSU C, CHEN F, WANG G.High-Resolution Image Inpainting through Multiple Deep Networks[C]// International Conference on Vision, Image and Signal Processing.IEEE,2017:76-81.

[5] WANG W,HUANG Q, YOU S,et al.Shape Inpainting Using 3D Generative Adversarial Network and Recurrent Convolutional Networks[C] //IEEE International Conference on Computer Vision.IEEE,2017:2317-2325.

[6] SUTTON R S,BARTO A G.Reinforcement learning:an introduction[J].Machine learning,1992,8(3-4):225-227.

[7]支周,屈肅.一種基于遷移極速學習機的人體行為識別模型[J].物聯網技術,2015,5(9):18-20.

[8]鄧志龍,張琦瑋,曹皓,等.一種基于深度強化學習的調度優化方法[J].西北工業大學學報,2017,35(6):147-153.

[9]宋海聲,劉岸果,呂耕耕.基于深度學習的空間變換情景感知模型研究[J].物聯網技術,2017,7(3):22-24.

[10]姚君延.基于深度增強學習的路徑規劃算法研究[D].成都:電子科技大學,2018.

猜你喜歡
機器學習大數據
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
機器學習理論在高中自主學習中的應用
主站蜘蛛池模板: 日韩美毛片| 欧类av怡春院| 97在线观看视频免费| 日韩欧美亚洲国产成人综合| 大香伊人久久| 国产不卡一级毛片视频| 丁香亚洲综合五月天婷婷| 中文字幕日韩欧美| 国产精品13页| a级毛片一区二区免费视频| 精品久久高清| 重口调教一区二区视频| 手机成人午夜在线视频| 97视频免费看| 欧美精品啪啪| 亚洲最大福利视频网| 国产一区二区丝袜高跟鞋| 在线免费无码视频| 久久精品亚洲热综合一区二区| 人妻无码中文字幕第一区| 国产成年女人特黄特色毛片免| 欧美一区二区自偷自拍视频| 91探花在线观看国产最新| 国产91麻豆视频| 免费中文字幕一级毛片| 国产精品高清国产三级囯产AV| 亚洲欧美日韩色图| 久久窝窝国产精品午夜看片| 婷婷亚洲天堂| 国产成年女人特黄特色大片免费| 99这里只有精品免费视频| 波多野结衣一区二区三区四区视频 | 欧美精品色视频| 人妻丰满熟妇av五码区| 2022国产91精品久久久久久| 国产精品成人AⅤ在线一二三四| 日韩无码黄色| 亚洲色欲色欲www网| 欧美亚洲国产日韩电影在线| aa级毛片毛片免费观看久| 精品三级网站| 91成人在线免费视频| 国产亚洲欧美在线人成aaaa| 亚洲综合狠狠| 天堂在线www网亚洲| 欧美激情视频二区| 亚洲精品中文字幕无乱码| 九九九久久国产精品| 国产精品无码一二三视频| 欧美成人h精品网站| 欧美日韩动态图| av在线无码浏览| 亚洲高清中文字幕在线看不卡| 亚洲AⅤ永久无码精品毛片| 丁香六月激情综合| 久久久久亚洲精品成人网| 最新国产精品鲁鲁免费视频| 亚洲日本中文字幕天堂网| 欧美亚洲日韩中文| 日韩精品无码免费一区二区三区| 国产视频一二三区| 欧美特黄一级大黄录像| 国产精品极品美女自在线看免费一区二区| 亚洲一区二区日韩欧美gif| 国产精品午夜福利麻豆| 国产91全国探花系列在线播放| 日本久久网站| 国产一区二区三区在线精品专区| 国产福利微拍精品一区二区| 国产精品刺激对白在线| 波多野结衣在线一区二区| 国产高清不卡视频| 无码aⅴ精品一区二区三区| 亚洲国内精品自在自线官| 午夜少妇精品视频小电影| 亚洲无限乱码| 亚洲男人的天堂在线观看| 免费又爽又刺激高潮网址 | 国产H片无码不卡在线视频 | 国产精品成人免费综合| 国产成人久久综合777777麻豆 | 日韩激情成人|