999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義分割與深度估計的行車環境實時解析

2020-01-03 01:24:44
計算機測量與控制 2019年12期
關鍵詞:語義深度特征

(同濟大學 道路與交通工程教育部重點實驗室,上海 201800)

0 引言

道路行車環境的感知與解析是車輛輔助駕駛與自動駕駛的關鍵技術,同時也是車輛進行判斷和決策的基礎。在目前實現道路行車環境感知的眾多技術中,計算機視覺技術憑借其設備安裝簡單、操作方便的優點,一直以來都是研究的熱點。它通過車輛前方攝像頭獲取的圖像信息,利用設計的算法對圖像中的場景進行語義分割和深度估計,實現行車環境的解析。

不過由于場景復雜、光線陰影變化大、物體遮擋等原因,使得語義分割和深度估計這兩個基礎的計算機視覺任務極富挑戰。近年來隨著深度學習的迅速發展,使得關于兩個任務的研究取得了極大的進展。目前已經有不少學者提出實現語義分割和實現深度估計的神經網絡,并且能達到良好的精度,但由于其網絡結構過于龐大,導致模型計算量過大,無法達到實時計算和落地使用。針對該問題,不少研究者通過精簡網絡結構,減小網絡的深度和寬度,希望能達到實時計算的目的。但由于網絡結構的精簡,導致了精度的下降,因此在實時計算和精度這兩方面的權衡,成為了時下研究的難點。另外在道路場景的解析中,語義信息和深度信息缺一不可,目前大部分工作仍將二者當做兩個獨立的任務分別處理,導致在實時性上再打折扣。

考慮到語義信息和深度信息具有一定相關性,即相同的語義要素具有相近的深度信息,本文提出了一個輕量級的網絡模型,同時完成語義分割和深度估計兩個任務,并且實現端到端的訓練與推測。在保持一定精度的情況下,實現實時計算(30 fps 以上)。本文的主要工作如下:

1)設計了一個輕量化、高效的特征提取模塊。在保持模型精度的情況下,大大減少了模型的參數量,提高了模型計算速度;

2)設計了一個基于多尺度卷積和注意力機制的解碼模塊,用于捕捉特征間的語義信息或深度信息;

3)根據前兩點設計的編碼和解碼模塊,搭建了一個端到端實現語義分割和深度估計的神經網絡,實現單個網絡同時解決兩個任務,并且達到實時性的要求。

1 相關工作

圖1 網絡結構圖

語義分割是對圖像中每一個像素進行分類的任務。文獻[1] 開創性地提出了全卷積神經網絡實現圖像的語義分割,拋棄了后處理的步驟,使得語義分割結束了多階段處理的時代,實現了語義分割端到端的訓練與預測。在此基礎上,文獻[2-3]等網絡提出了高效的深度卷積編碼器-解碼器框架,并通過編碼器和解碼器中部分網絡結構層的直接連接,一方面使得網絡的訓練更加容易、提高網絡的訓練效率,另一方面使得解碼器能夠獲得低階的物體特征細節,從而改善物體邊緣的預測效果,整體上提高了預測的精度。文獻[4-5]等提出的空洞卷積和金字塔池化,增大了特征提取過程的感受野,考慮了圖像中的上下文關系,進一步提高了預測精度。盡管上述網絡能取得良好的分割效果,卻是建立在結構復雜、模型龐大的神經網絡基礎上,無法滿足實時性計算的需求。文獻[6-7]等通過減少網絡層數、減少特征圖通道數目、精簡網絡結構等措施,在犧牲一定精度的情況下,將預測的速度提高到了30FPS以上。本文通過設計了一個高效的特征提取結構,減少了模型的計算量,在取得與文獻[7]相近的精度下,將預測速度提高到了60FPS以上。

深度估計也是一個逐像素考慮的任務,旨在估計圖像中每一個像素到觀測位置的距離。文獻[8]將深度估計作為一個回歸問題,首先提出使用卷積神經網絡估算圖像深度。得益于CNN 強大的特征提取能力,針對單張RGB圖像的深度估計研究涌現了諸多成果,相比于傳統的方法,在精度上取得了長足的進展。在監督學習方面有文獻[9-11] 等,無監督學習方面有文獻[12-13 ]等,半監督學習方面有文獻[14]。本文提出的模型與上述模型存在較大差異,一是在模型結構上做了精簡優化,使得深度的預測速度能達到實時的效果; 二是模型不僅完成深度估計,同時也完成了語義分割任務,二者在模型訓練時,能相互借鑒各自的信息,使得模型精度更高,泛化能力更強。

深度估計與語義分割的結合,一定程度上是基于二者任務特點的相似性和物體深度與語義的相關性,使得二者結合既能減少計算量,又能相互增益、提高精度。在深度估計與語義分割結合方面,文獻[15]提出了一個遞歸處理語義信息和深度信息的網絡結構,盡管能充分利用深度信息和語義信息之間的關系,但網絡在深層時大量使用了大卷積核的卷積運算,導致計算量爆炸增長網絡參數量更是達到350 M,導致無法達到實時計算的要求。在處理語義分割與深度估計兩項任務的關系方面,本文提出的網絡結構中,語義分割和深度估計任務共享了大部分的權重,使得模型能夠捕捉二者之間的相關性;同時對于深度估計和語義分割,又有各自的注意力機制模塊,使得網絡能學習各自任務的差異性。在網絡計算量和實時性方面,本文提出的網絡結構能在保持一定精度的情況下達到65FPS的速度,模型參數僅為1.2 M。

2 模型結構

2.1 總體結構

模型的總體是一個編碼器-解碼器的結構,編碼器用于提取圖像的特征,解碼器用于對提取到的特征進行處理,預測像素點所屬的類別和深度。網絡的總體結構如圖1所示,輸入的圖片依次經過編碼器和解碼器,然后得到深度預測和語義分割預測的結果。

2.2 編碼器

編碼器部分共包含三個子層,每個子層由一個降采樣單元和若干個改進的殘差單元組成,各子層的組成分布如表1所示。隨著層數的加深,改進的殘差單元模塊增加、輸入的特征圖尺寸減小、通道數目增加。

表1 編碼器結構圖

降采樣單元。降采樣單元設置的目的在于減小特征圖尺寸同時增大通道的數目,從而達到擴大感受野和生成高階特征的目的。文中所使用的降采樣單元包含兩個分支,一個是卷積核大小為3×3、步長為2 的卷積操作,另一個是池化大小為2×2、步長為2 的最大池化操作。這兩個操作都能將特征圖的大小縮小到原來的一半,達到降采樣單元的目的之一——減小特征圖尺寸。通過級聯兩個分支的輸出,整個降采樣單元輸出的通道數則變成輸入的兩倍,實現了通道數的增加。

改進的殘差單元。本文針對文獻[16] 中提出的殘差單元改進思路在于減少單元中的參數量和計算量,從而達到減少模型參數量、加速計算的目的。對于輸入通道數為Nin、輸出通道數為Nout、輸出特征圖尺寸為h·w、卷積核大小為fh·fw的卷積操作來說,參數量大小Np為:

Np=Nin·fh·fw·Nout

(1)

計算量大小No為:

No=Nin·fh·fw·Nout·h·w

(1)

圖2 改進的殘差單元結構圖

另外在改進的殘差單元左右兩個分支中,會各自使用兩個空洞卷積。空洞卷積相比于普通的卷積操作而言,能獲得更大的感受野,提取得到的特征更具有全局性。對于語義分割和深度估計這種細粒度的任務而言,對單一像素的預測很大程度上可以借鑒于周圍的像素點,因此當感受野較大時,提取得到的特征更有利于對像素點的語義和深度作出更準確的預測。

2.3 解碼器

解碼器的結構如圖1所示,共包含兩大部分。第一部分是中間兩個分支,用于捕捉語義信息與深度信息的共同點。這兩個分支分別是多尺度卷積模塊(Multi-scale Convolution Module)分支和普通的卷積運算分支。兩個分支輸出的通道個數均為C+1, 其中C個通道為語義通道,1個通道為深度通道。由于深度特征和語義特征在一定程度上具有很大的相似性,一般而言具有相同語義的像素也具有相近的深度值。對于車、行人等交通參與者,其本身的深度和周圍像素點之間會發生突變,而這變化可以通過語義的邊緣捕捉到。因此,這兩部分通道在分支內計算時,相互融合,從而達到捕捉語義信息和深度信息共同點的目的。兩個分支的輸出通過點積運算合并后,再將通道拆分成兩部分,分別是包含C個通道的語義部分和包含1個通道的深度部分,再參與后續的計算。

多尺度卷積模塊的結構如圖3所示。編碼器的輸出依次進行了三個不同尺度卷積運算, 分別是7×7,5×5,3×3。不同尺寸的卷積感受野大小不一樣,尺度大的卷積可捕捉距離較遠像素間的語義和深度信息,尺度小的卷積則可捕捉距離較近像素的語義和深度信息,綜合不同大小的卷積核,就能解析不同尺度的特征。不同尺寸卷積提取到的信息,均通過1×1的卷積操作進行特征的整合,而后小尺寸卷積分支的輸出通過上采樣與大尺度卷積分支輸出相加,將不同尺度卷積提取到的信息融合,最終輸出結果。總共有兩次融合、三個上采樣操作,得到和輸入相同特征圖大小和通道數的輸出。

圖3 多尺度卷積模塊結構圖

第二部分是旁路的兩個分支,用于捕捉語義和深度各自獨特的信息。分支上的操作依次是全局平均池化、1×1的卷積和上采樣。語義分支輸出了特征圖大小不變、通道數為C的語義信息,深度分支輸出了特征圖大小不變、通道數為1的深度信息。

解碼器最后融合兩部分分支的輸出,即綜合考慮了語義和深度的相關信息和各自提取的獨特信息,分別輸出了模型的語義預測結果和深度預測結果。

2.4 損失函數

對于深度估計,我們使用文獻[17] 中提出的損失函數,定義為:

(3)

式中,di是像素i預測值和實際值的差值,c為所有差值最大值的1/5,即c=max(di)/5。該損失函數對于差值較大的像素點,具有較大的梯度,使得模型在訓練的時候,對于預測結果較差的部分,權重更新幅度更大,更有利于模型的收斂,加快了模型的訓練。

對于語義分割,使用的是交叉熵損失函數,定義為:

(4)

(5)

3 實驗結果與分析

3.1 實驗設置

數據集本文實驗所使用的數據集為Cityscapes 數據集[18], 包含了歐洲50個城市在不同季節、不同天氣條件下的街道場景。其中語義標注數據包括19 個類別,深度標注數據為視差值。整個數據集共包含5 000張圖像,訓練集為2 975張,驗證集為500張,測試集為1 525張。

評價指標語義分割結果采用的評價指標為平均交并比(mIoU, mean intersection-over-union),計算19 個類別的IoU的平均值,其中IoU的反映了預測區域和實際區域的重疊程度,是實際區域和預測區域的交集比上二者的并集計算方法如下:

式中,TP、FP、FN分別表示實際為真預測也為真、實際為假預測為真、和實際為假預測為假的像素點的個數。

對數空間均方根誤差(rms(log)):

3.2 實驗結果分析

定量分析如表2所示,在語義分割效果方面,本文取取了幾個在語義分割任務重具有代表性的網絡作為對比,如SegNet、ENet、PSPNet和ICNet。相比于SegNet,本文提出的網絡不僅具有更高的分割精度,并且在計算速率上提升了四倍;相比于ENet,本文提出的網絡在同樣達到高實時性的基礎上,在語義分割精度上提升了10.7%;相比于ICNet,語義分割的精度相近,但參數量更少,并在實時性上實現了翻倍;盡管精度不及PSPNet, 但在實時計算性能上提升了83倍。

在深度估計方面,各項評價指標均好于DepthNet。在深度估計與語義分割同時完成方面,本文提出的網絡在語義分割和深度估計精度上均優于HybridNet,且能達到實時的效果。

定性分析圖4是CityScapes測試集圖片深度估計和語義分割預測結果的可視化。對比深度估計的真實值和預測值,可以發現算法能很好地捕捉場景中出現的行人、車輛等使空間距離分布發生突變的物體,這得益于網絡中深度分割和語義分割共享的解碼模塊,使得在深度信息預測時,得以借鑒語義信息。對比語義分割的真實值和預測值,可以發現網絡能將路、天空、建筑、綠化等環境要素和行人、車輛、非機動車、交通標志等交通要素完整且清晰地分割出來和ENet,并且在成塊的分割結果中不會出現其他錯誤的分類。

整體而言,提出的網絡在深度估計和語義分割任務中能達到良好的精度,并且能滿足高實時性的要求,說明改進殘差模塊在參數量降低的情況下仍有很高的特征提取能力,整個編碼器模塊具有較高的編碼效率;同時也說明了解碼器能很好地解析出編碼器提取的特征。特別是在語義任務中,無論是大物體還是小物體,都具有良好的分割精度,說明解碼器中的多尺度模塊能有效解析大小不同物體的特征,完成預測。

表2 實驗結果對比表

圖4 深度估計與語義分割結果

4 結束語

道路行車環境的實時解析是智能駕駛的關鍵技術,隨著關于神經網絡研究的迅速發展,在實現單目圖像的語義分割和深度估計上已經能實現一定的精度,但仍存在模型參數多、計算量大、難以實時計算等問題,導致無法真正落地使用。針對該問題,本研究提出了一個輕量化、高效的特征提取模塊和一個綜合考慮語義信息和深度信息的特征解碼模塊,在一個網絡中同時完成語義分割和深度估計兩個任務。在CityScapes數據集中,語義分割預測結果的mIOU為65.0%、深度估計結果的誤差為0.21, 并且在單個GPU 上推斷速度達到了65 fps,滿足實時性要求。

猜你喜歡
語義深度特征
深度理解一元一次方程
語言與語義
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
深度觀察
深度觀察
深度觀察
抓住特征巧觀察
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 一本久道久久综合多人| 一区二区理伦视频| 日本91在线| 国产成人综合久久精品尤物| 黄色污网站在线观看| 亚洲欧美日韩成人在线| 久热中文字幕在线观看| 玖玖精品视频在线观看| 又黄又湿又爽的视频| 美女被躁出白浆视频播放| 精品久久久久无码| 欧美精品在线视频观看| 国产成人1024精品下载| 国产美女主播一级成人毛片| 欧美一区国产| 制服丝袜一区| 国产凹凸视频在线观看| 日本手机在线视频| 免费xxxxx在线观看网站| 国产男人天堂| 国产午夜看片| 国产成人久久综合777777麻豆| 国产免费a级片| 亚洲精品成人福利在线电影| 欧美精品亚洲精品日韩专| 国产在线专区| 九九视频在线免费观看| 午夜国产大片免费观看| 一级毛片中文字幕| 日韩资源站| 无码日韩视频| 亚洲香蕉久久| 中文字幕66页| 无码日韩人妻精品久久蜜桃| 色精品视频| 色婷婷狠狠干| 她的性爱视频| 亚欧成人无码AV在线播放| 永久成人无码激情视频免费| 久久五月视频| 国产农村精品一级毛片视频| 亚洲精品另类| 亚洲91在线精品| 日韩欧美国产精品| aⅴ免费在线观看| 国产欧美专区在线观看| 91美女视频在线| 三级视频中文字幕| 美女视频黄频a免费高清不卡| 国产91精品调教在线播放| 国产一二三区在线| 激情综合五月网| 亚洲免费毛片| 免费99精品国产自在现线| 在线另类稀缺国产呦| 国产 日韩 欧美 第二页| 国产主播在线观看| 伊人查蕉在线观看国产精品| 伊人久久精品无码麻豆精品| 免费在线看黄网址| 国产精品精品视频| 国产呦精品一区二区三区下载| 欧洲极品无码一区二区三区| 黄色成年视频| 国产导航在线| 亚洲一级毛片| 国产真实乱子伦精品视手机观看 | 国产免费高清无需播放器| 久久久久人妻一区精品色奶水 | 日日噜噜夜夜狠狠视频| 在线一级毛片| 91欧美亚洲国产五月天| 高潮毛片免费观看| 精品色综合| 欧美精品1区2区| 在线观看欧美国产| 四虎影视库国产精品一区| 五月婷婷精品| 日韩天堂网| 国产AV无码专区亚洲精品网站| 国产乱论视频| aa级毛片毛片免费观看久|