陳順成 梁志軍 申啟訪


摘 ?要:圖像素描化在激光雕刻領域中發揮著極其重要的作用,傳統的圖像素描處理方法是不同的圖像采用同一種算法進行處理,存在適用率不高和部分參數不通用問題。文章提出一種基于機器學習的素描圖像處理技術,通過搭建素描圖像處理神經網絡系統,使用構建的素描圖片數據庫對模型進行多次迭代訓練,最后達到預期素描處理效果,提高了圖片素描化處理的普適性。
關鍵詞:圖像素描化;圖像處理;機器學習;神經網絡
中圖分類號:TP391 文獻標志碼:A 文章編號:2095-2945(2019)22-0152-02
Abstract: Image sketching plays an extremely important role in the field of laser engraving. The traditional image sketch processing method is that different images are processed by the same algorithm, which has the problems of low application rate and incompatibility ofsome parameters. In this paper, an image sketch processing technology based on machine learning is proposed. By building a sketch image processing neural network system, the sketch image database is used to give the model the iterativetraining for many times, and finally the expected sketch processing effect is achieved. The universality of image sketch processing is improved.
Keywords: image sketching; image processing; machine learning; neural network
1 概述
近年來,隨著相關激光技術理論研究的深化以及激光器件的不斷發展,使其應用領域也不斷得到拓寬[1],工藝品制作領域就是其中之一,如應用激光內雕技術生產的水晶產品,使用激光打標機來進行名片的個性化制作[2]。激光加工技術與數控技術相結合,從而能加工更復雜的形狀,使很多用常規方法不能解決的加工難題得以解決[3]。圖像激光雕刻應用越來越廣泛,對圖像素描化的要求越來越高。
經過幾十年的發展,機器學習衍生出很多理論模型,應用于自然語言處理、圖像識別處理以及語音識別分析等各類問題。機器視覺作為人工智能的一個主要構成部分,前人在圖片處理方面做了很多機器學習相關的研究。
本文采用機器學習進行素描圖像處理,通過建立模型訓練數據庫、搭建模型、訓練模型和模型測試與分析,驗證了通過機器學習來處理素描圖片方法的可行性。
2 方法
因圖片具有多樣性,所以不能使用單一線性模型來訓練,而CNN(卷積神經網絡)由于使用的卷積核具有參數共享以及稀疏連接等優點,能較高效的對圖片進行有效處理,并且在各卷積隱藏層能捕捉圖片的一些細節。
2.1 數據準備
本文使用Labeled Faces in the Wild(LFW)dataset[4],LFW圖片數據庫包含了13233張含有背景的尺寸為3×250×250的人像照,而這些包含多種姿勢表情、圖片光線質量以及各種復雜背景的圖片是由Erik Learned-Miller等人在網上尋找并通過神經網絡系統處理出來的。
2.2 模型搭建
訓練數據庫中圖片是單通道的尺寸大小為1×250×250的灰度圖片,根據需要模型輸出的圖片尺寸也為1×250×250。參照Deepak Pathak在其論文中DNN搭建思路(如圖1),也將圖片處理神經網絡模型分成“編碼器”網絡與“解碼器”網絡。
在“解碼器”網絡中,通過借鑒DCGAN模型的搭建思路,使用反卷積的方法將“編碼器”網絡輸出的4000×1×1隱藏層經過六個類似的卷積層還原成1×250×250原圖尺寸進行輸出。
3 實驗
在訓練過程中,由于圖片數據庫較大,模型參數較多,運算量大,所以我們使用配備GTX1080Ti顯卡的主機來訓練模型。
3.1 模型訓練
本模型訓練流程:前期是圖片數據庫的建立和加載,為了使導入圖片與目標圖片相對應,我們要編寫相應數據加載函數,使其在每次迭代時返回對應的一組圖片;模型加載以及相應參數的設定;接著將批量的圖片導進神經網絡模型進行多次迭代訓練,算法過程如表1。
3.2 模型數據測試與分析
在測試時,我們選取了6個不同階段的模型參數來進行測試,分別是epoch=1、50、150、300、600、1000時對應的模型。圖2第一行分別是原圖和人工處理的目標素描圖。
當epoch=1時,模型輸出的素描圖片只有一個模糊的輪廓;epoch=50時,圖像細節增多,相片黑框邊界較清晰;epoch=300時,處理圖可顯示出大概的人像。當epoch=1000時,圖片素描效果已經十分接近人工處理的目標素描圖。因此在一定范圍內,隨著迭代次數越來越大,素描圖片效果越明顯。
4 結束語
本文采用機器學習進行素描圖像處理,通過建立模型訓練數據庫、搭建模型、訓練模型和模型測試與分析,最后解決自動化圖片處理時調參問題以及圖片處理時局部優化問題,達到預期素描處理效果,提高了圖片素描化處理的普適性。
參考文獻:
[1]鄭錦生,陳松青.激光雕刻技術的發展[J].機床與液壓,2005,(8):228-231.
[2]曹雪璐,鄭志軍,楊林豐.激光打標的幾種PS圖像處理方法[J].實驗室研究與探索,2015,34(5):228-231.
[3]趙靜.木質材料激光雕刻加工技術的研究[D].北京:北京林業大學,2007.
[4]E. Learned-Miller, G. B. Huang, A. RoyChowdhury, H. Li, and G. Hua, “Labeled faces in the wild: A survey,” in Advances in Face Detection and Facial Image Analysis, pp. 189-248, Springer Science + Business Media, 2016.
[5]Deepak Pathak,Phillip Krhenbühl,Jeff Donahue,Trevor Darrell,Alexei A. Efros. Context Encoders: Feature Learning by Inpainting. arXiv:1604.07379v2 [cs.CV].2016.