999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

移動端實時人像分割算法研究

2018-04-24 07:58:48王澤榮
現代計算機 2018年8期
關鍵詞:語義分類實驗

王澤榮

(四川大學計算機學院,成都 610065)

0 引言

圖像語義分割的目標是給輸入圖像的每個像素分配一個類別,從而獲得逐像素的稠密分類圖。從2007年起,圖像語義分割或者場景解析已經成為計算機視覺的重要部分,和其他計算機視覺任務一樣,圖像語義分割的重大突破在2014年,Long[1]等人首次提出利用全卷積來訓練一個端到端的網絡。

FCN8結構在Pascal VOC2012數據集上達到了62.2%的平均IOU,相對提高了20%。這個網絡結構是語義分割的基礎,在這個基礎上提出了一些更新更好的網絡結構。全卷積網絡被用于自然圖像的語義分割,用于多模醫學圖像分析和多光譜衛星圖像分割。與AlexNet、VGG、ResNet等深度分類網絡非常相似,還有大量的深層網絡執行語義分割。

針對圖像語義分割的網絡結構有FCN、SegNet[2]、U-Net[3]、FC-Densenet[4]、E-Net[5]、RefineNet[6]、PSPNet、Mask-RCNN,還有一些半監督的方法有DecoupledNet和GAN-SS。本文考慮了各種網絡模型結構,最后在FCN的基礎上提出了一種的簡潔的網絡結構C-seg?net,在 320×240圖像上單張的分割時間 2ms(Titan-X)。在模型簡化方面,采用了Face++提出的Shuf?fleNet網絡結構模型,對C-segnet中的兩個3×3的卷積操作添加了點組卷積和通道打亂操作,一定程度上減少了網絡模型的參數和計算的FLOPS,能夠在移動端做實時的肖像分割。

本文實驗采用的數據集由Camera360提供命名Cdataset。

1 數據預處理

本次實驗室的數據集來源于手機照片服務提供商Camera360,圖片數據是手機用戶自拍照片,主要是上半身圖像。本次實驗的groudtruth采用俄羅斯摳圖軟件fabby制作,包含前景和背景信息,一共10萬張訓練集,300張驗證集,100張測試集。

Cdataset數據集合中的數據如圖1所示。

1.1 人像語義分割

本次實驗采用語義分割,給輸入圖像的每一個像素點分配一個類別,本次實驗室做的是二分類,前景和背景。前景是人像這種語義信息,背景是非人像的語義信息。本次實驗的目的是在移動端做到實時,通過網絡模型運算量計算想要在移動端做到實時,在Ti?tan-X上的分割速度必須大于125fps,也即是單幀分割時間小于8ms。本次實驗的數據集都轉換到相同的尺度,長寬分別是320和240。為了避免網絡復雜帶來的過擬合做了一定的數據增強,這些數據增強手段包括圖像旋轉、圖像翻轉、圖像伽馬濾波,最后增強后的數據一共10萬張作為訓練數據。

本次實驗的平臺是Ubuntu,GPU是Titan-X,深度學習框架是Pytorch。

1.2 訓練網絡

第1小節中介紹了訓練本文網絡所用的數據集。訓練集中包含10萬張320×240大小的圖像,并通過fabby生成所有訓練圖像的GroundTruth。一個通過的語義分割網絡結構可以看成是一個編碼器連接一個解碼器,編碼器部分可以從一個預訓練的分類網絡上做遷移學習,例如子ImageNet上面訓練好的VGG或者ResNet等。編碼器的機制與VGG或者ResNet這些體系結構最大的不同在于解碼器的任務是將編碼器學習到的語義特征映射到像素空間,從而得到一個稠密的分類。分割任務和分類任務最大的不同在于分割最后要得到的是一個稠密的像素級別的分類,網絡的輸出是一張heatmap而不是一個vector,如下圖2所示。與分類網絡最大的不同在于,分割網絡里面沒有全連接層,只有卷積層在解碼階段做的是一個不斷上采樣的操作,常用的方法有去卷積和插值。

圖1

常用的全卷積網絡的Pipeline如圖3所示。

如何選擇上采樣的featuremap,在圖片分辨率下采樣到什么程度才進行上采樣?這是全卷積網絡遇到的最大難題。如果上采樣的feature map分辨率低那么得到的heatmap會比較粗糙,如果過早地進行上采樣那么得到的heatmap包含的語義信息將會比較少。FCN[1]的作者采用了一種如圖4所示的融合方式。

圖2

圖3

圖4

將下采樣到原圖長寬分別是原來的1/32feature map上采樣到原圖size一樣的圖用FCN-32表示,同理有FCN-16、FCN-8,將各層的heatmap進行融合得到最后的結果,假設最后的網絡輸出用h表示h=FCN-32+FCN-16+FCN-8,這樣的融合方式一定程度上解決了最后的結果過于粗糙。本文的融合方式不同于FCN,本文的融合方式是每次上采樣2倍,然后與上一層的Score-Map融合,從而形成一個金字塔的融合方式。本文最后沒有采用ImageNet上預訓練好的VGG網絡進行Fine-tuning,主要因為(1)VGG網絡太深,沒法做到實時,雖然一定程度上可以提升IOU。(2)本次實驗數據集全是人像,并且主要是上半身,ImageNet提取的語義信息對本次實驗的幫助并不大。因此需要設計自己的網絡結構,并且把圖像都resize到320×240,這樣的處理一定程度上減小了數據的方差,使得網絡更容易訓練,也減少了一次卷積計算所用時間,本文在FCN的基礎上設計的精簡網絡模型參數如表1所示。

表1

在訓練階段,在conv5_3和conv5_7之后分別添加了dropout操作,一定程度上可以防止過擬合,本次實驗的 batchsize是 1,學習率 lr=0.0001。添加了一個shufflenet對比實驗,將兩個3×3的conv都換成shuf?flenet的 bottleneck。

2 結果分析

首先在驗證集上選擇訓練好的網絡模型,旋轉IOU最好的模型在測試集上測試網絡模型的泛化能力,本次實驗用到的數據集包括訓練集、驗證集、和測試集,其中訓練集10萬張照片,驗證集300張,測試集100張。網絡性能的好壞通過IOU衡量,其定義如下:IOU=(predict&&target)/(predict||target)。

本次實驗的學習曲線如圖5所示。

圖5

從圖5中我們可以看到添加shufflenet之后的網絡有了一定的IOU下降,原因在于點組卷積之后網絡可訓練參數有所減少,網絡的表達能力不如之前,在不添加chanel shuffle和點組卷積之前網絡的大小為1.2MB,添加之后訓練的網絡大小為864KB,并且網絡計算機的FLOPS比之前少了一些,單幀分割速度有所提升但并不明顯。

3 結語

本次實驗在FCN的基礎上提出了一個精簡的網絡模型,可以在移動端做到實時的人像分割。并對比實驗驗證了shufflenet在模型復雜度降低方面的有效性。本次實驗依然存在很多的不足:(1)當用戶的手移動過快,有fast motion存在的時候分割比較模糊;(2)當背景和前景模式差別不大的時候分割效果不好,并且在頭發絲附近的分割還是比較粗糙。針對以上兩個問題,是未來研究工作的重點內容。本次實驗將移動端的視頻分割,當成了單幀的靜態圖像分割,一定程度上丟失了時間維度上的信息,未來的工作考慮在時間序列上做相關的工作。

參考文獻:

[1]Jonathan Long,Evan Shelhamer,Trevor Darrell.The IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2015:3431-3440.

[2]Kendall,Alex;Cipolla,Roberto.SegNet:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation.Badrinarayanan,Vijay,2015.

[3]Olaf Ronneberger,Philipp Fischer,Thomas Brox.U-Net:Convolutional Networks for Biomedical Image Segmentation,2015.

[4]Simon Jégou,Michal Drozdzal,David Vazquez,Adriana Romero,Yoshua Bengio.The One Hundred Layers Tiramisu:Fully Convolutional DenseNets for Semantic Segmentation(CVPR),2016.

[5]Adam Paszke,Abhishek Chaurasia,Sangpil Kim,Eugenio Culurciello.ENet:A Deep Neural Network Architecture for Real-Time Semantic Segmentation,2016.

[6]LIN Guo-sheng,Anton Milan,SHEN Chun-hua,Ian Reid.RefineNet:Multi-Path Refinement Networks for High-Resolution Semantic Segmentation,2016.

猜你喜歡
語義分類實驗
記一次有趣的實驗
分類算一算
語言與語義
做個怪怪長實驗
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
主站蜘蛛池模板: 国产在线一区二区视频| 国内精品视频| 911亚洲精品| 国产成人高清精品免费5388| 亚洲精品无码成人片在线观看| 暴力调教一区二区三区| 亚洲经典在线中文字幕| 美女毛片在线| 日韩精品无码免费一区二区三区| 亚洲国产成人久久精品软件| 99久久人妻精品免费二区| 97国产精品视频自在拍| 国产95在线 | AV天堂资源福利在线观看| 欧美激情二区三区| 亚洲综合婷婷激情| 成人无码一区二区三区视频在线观看| 欧美丝袜高跟鞋一区二区| 丁香六月激情婷婷| 伊人蕉久影院| 日韩国产精品无码一区二区三区| 中文字幕人成乱码熟女免费| 狠狠久久综合伊人不卡| 97人人做人人爽香蕉精品| 亚洲不卡影院| 四虎国产精品永久一区| 亚洲一区二区三区国产精华液| 欧美日韩一区二区三区在线视频| 亚洲欧美日韩色图| 国产精品成人免费视频99| 国产成人免费手机在线观看视频 | 久久综合国产乱子免费| 欧美日韩免费观看| 99热免费在线| 中文字幕在线永久在线视频2020| 色婷婷在线影院| 国产成人综合亚洲欧洲色就色| 第九色区aⅴ天堂久久香| 国产欧美在线| 亚洲第一区在线| 三级视频中文字幕| 2022国产91精品久久久久久| 欧洲av毛片| 国产精欧美一区二区三区| 亚洲视频免| 国产香蕉在线| 亚洲综合色在线| 久久人搡人人玩人妻精品| 亚洲午夜天堂| 久久美女精品国产精品亚洲| 国产粉嫩粉嫩的18在线播放91| 精品视频福利| 91一级片| 亚洲热线99精品视频| 亚洲欧美另类日本| 国产网站一区二区三区| 免费国产黄线在线观看| 国产午夜福利在线小视频| 91日本在线观看亚洲精品| 免费无码又爽又黄又刺激网站| 久久香蕉国产线看观看精品蕉| 精品欧美一区二区三区久久久| 免费一级无码在线网站| 国产成人精品优优av| 国产人成午夜免费看| 国产精品香蕉在线观看不卡| 国产高潮流白浆视频| 国产综合精品一区二区| 国产高颜值露脸在线观看| 狠狠色成人综合首页| 天天综合色网| 91丝袜乱伦| 国产精品第一区| 国产精品流白浆在线观看| 99ri精品视频在线观看播放| 国产黄色爱视频| 红杏AV在线无码| 青青草原国产精品啪啪视频| 国产95在线 | 亚洲人成色在线观看| 一区二区影院| 国产在线观看高清不卡|