999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于像素注意力的雙通道立體匹配網絡*

2020-06-02 00:19:00桑海偉熊偉程
計算機工程與科學 2020年5期
關鍵詞:特征提取特征

桑海偉,徐 孩,熊偉程,左 羽,趙 勇,

(1.貴州師范學院數學與大數據學院,貴州 貴陽 550018;2.北京大學深圳研究生院信息工程學院,廣東 深圳 518055;3.貴州大學計算機科學與技術學院,貴州 貴陽 550025)

1 引言

立體匹配是指從立體彩色圖像對中計算對應點偏差,獲取稠密視差圖的過程,在自動駕駛[1]、三維重建[2]、機器人導航[3]等領域有著廣泛的應用。Scharstein等[4]將立體匹配算法進行歸納總結,并分為4個步驟:匹配值計算、匹配值累積、視差選擇與優化以及視差精確化。傳統的立體匹配算法可分為局部[5 - 7]、全局[8]和半全局[9]3種類型,其中全局立體匹配算法準確性最高,代表性全局立體匹配算法有圖割[10]、信念傳播[11]等。傳統算法將立體匹配問題分解成若干個子問題,存在求解子問題最優并不代表全局最優的問題。另外,傳統算法需要手工設計特征描述算子和代價聚合策略。

卷積神經網絡具有強大的特征表示能力,能夠直接從視覺圖像中有效地學習和理解高級語義,在目標識別[12]、目標檢測[13]、語義分割[14]等計算機視覺領域取得較大突破[15]。立體匹配算法也受到越來越多的關注,?bontar等[16]利用CNN來預測左圖與右圖的匹配程度,并使用CNN來計算立體匹配值。Luo等[17]采用平滑目標分布來學習所有視差值的概率分布,隱含地捕獲不同視差之間的相關性。上述方法僅用神經網絡替代立體匹配中的一部分步驟,Mayer等[18]首次提出完全采用神經網絡實現端到端的立體匹配、編解碼結構和跳躍連接恢復特征細節。跳躍連接是將低層的特征圖連接到高層特征圖,從而保留圖像細節。但是,低層特征圖包含一些無用甚至對最終匹配效果造成負面影響的信息,因而有必要進行特征選擇,過濾掉低層特征中的無用信息和負面信息。

Figure 1 PASNet structure圖1 PASNet結構

2 基于像素注意力的立體匹配網絡

深度學習中注意力機制與人類選擇性視覺注意力機制類似,讓網絡可以選擇某些特征,抑制一些無用或負面的特征。引入注意力機制可以讓其自適應地選擇有用的特征,抑制那些無用的或者負面的特征。本文引入像素級注意力機制,用于篩選像素粒度的特征,提出了基于像素注意力的立體匹配模型PASNet(Pixel Attention Siamese neural Network)。該模型由2部分組成:雙通道注意力沙漏型紋理特征提取子網絡和注意力U型上下文代價聚合子網絡,具體結構如圖1所示。

2.1 PASNet網絡結構

給定2幅立體圖像,即左彩色圖IL和右彩色圖IR,網絡的目的是輸出對應的視差圖DG。先通過CNN對立體圖像對進行初步的特征提取,CNN包含6個卷積層(Conv),并將圖像降采樣到原來圖像尺寸的1/4大小,減少參數,提升運算速度。利用不同步長(stride)和大小的卷積(Conv)和反卷積(Decnv)操作,引入像素注意力進一步提取特征,實現雙通道注意力沙漏型網絡,輸出高層語義特征圖FL和FR。接著,匹配代價(Cost Volume)則是通過對應層,將左特征圖FL和右特征圖FR級聯,獲得代價矩陣C。隨后,基于不同步長(stride)卷積、高層次引導和跳躍連接等方式實現注意力U型網絡(Attention U-Net),其主要目的是進行代價調整,重新調整像素間的匹配關系,調整后的代價矩陣為C′。最后,通過視差回歸層計算并輸出的視差圖DG。

2.2 雙通道注意力沙漏型網絡

Brandao等[20]將研究目標聚焦于立體匹配的特征提取上,研究表明,標準的卷積神經網絡結構可以用來提升特征提取的質量。對于立體匹配任務而言,特征提取的目的是提取像素之間的對應關系。文獻[20]通過池化操作和反卷積操作來增大感受野,但是池化操作會丟失大量細節信息,作者使用跳躍連接可以彌補一定的細節損失。本文采用設定卷積步長的方式來對特征圖降采樣,盡可能減少細節特征的丟失。

注意力可以解釋為重要性權重的向量,在文本處理領域為了預測一個元素,例如句子中的單詞,使用注意力向量來估計它與其他元素的相關程度,并將其值的總和作為目標的近似值。在圖像處理領域,將當前目標隱藏狀態與所有先前的源狀態一起使用,以導出注意力權重,用于給先前序列中的信息分配不同的注意力大小[21]。SE-net[19]利用全局池化獲得通道注意力向量,對各層輸出的特征圖進行通道選擇。不同通道的特征是不同的濾波器輸出的,對于像素級預測的任務來說,理論上應該考慮像素級的特征。像素級的特征包含像素粒度的信息,因此有必要對像素粒度信息進行精確篩選。

雙通道注意力沙漏型子網絡基于文獻[20],將其中的池化層,用步長(stride)為2、卷積核大小為3×3的卷積層替代。PASNet結構如圖1所示,包括1個主分支和2個輔分支。主分支先通過2組卷積模塊,將輸入圖像尺寸降采樣到當前的1/4,再經過3個核大小為3×3的卷積層,得到引導特征圖的輸出。引導特征圖具有較大感受野和高層語義信息的特點。再通過2個步長為2的轉置卷積,將圖像恢復到原來大小。2個輔分支用于像素注意力機制的引入,第1個輔分支的輸入為低層特征圖,目的是補充豐富的細節信息;第2個輔分支的輸入為引導特征圖,通過像素注意力跳躍模塊PAS(Pixel Attention Skip),輸出具有像素注意力作用的特征。

PAS模塊的2個輸入分別為高層特征圖和低層特征圖,具體結構如圖2所示。

Figure 2 PAS structure圖2 PAS結構

高層特征圖經過卷積層、批量歸一化層BN(Batch Normalization)和非線性層ReLU之后,進行Sigmoid變換,如式(1)所示:

(1)

其中,x表示輸入特征。Sigmoid的物理意義在于輸出1個決定每個特征權重的概率圖。概率圖與經過了1個卷積層后的低層特征圖相乘,再與輸入的低層特征圖相加,即可得到在像素注意力下的低層特征圖。

2.3 級聯對應

MC-CNN[15]通過級聯左彩色圖和右彩色圖的特征圖,使深度神經網絡自動學習代價估計。借鑒文獻[22]的思想,本文使用注意力U型子網絡,在最大視差范圍內,通過級聯對應像素的左特征圖和右特征圖,得到一個四維的代價矩陣。設左、右彩色圖分別為IL和IR,大小為W×H,最大視差為D,經過特征提取子網絡后特征圖的尺寸是(H,W,c),其中c為通道數,2個特征向量經過級聯操作后的尺寸為(H,W,2c),則最終獲得的代價矩陣尺寸為(D+1,H,W,2c)。

2.4 注意力U型子網絡

注意力U型子網絡通過像素注意力機制和跳躍連接,提高了立體匹配紋理特征提取的精度。為了同時在視差維度和空間維度進行代價調整,本文基于三維卷積設計一個U型網絡,如圖1所示,U型子網絡結構有3個層級,分別對應原圖大小的1/8,1/16,1/32 3種不同尺度的圖像,每一個尺度都基于上一層的輸出,通過3層三維卷積組合得到。三維卷積組合包括1個核大小為3×3×3、步長為2的三維卷積和2個核大小為3×3×3、步長為1的三維卷積。上采樣過程均通過1個核大小為3×3×3、步長為2的三維轉置卷積實現。

為了在四維的特征圖上同樣使用像素注意力,本文設計了三維像素注意力跳躍連接模塊SDPAS(Simplified 3D Pixel Attention Skip),具體結構如圖3所示。SDPAS的2個輸入分別為高層特征圖和低層特征圖。高層特征圖經過三維卷積層、三維量歸一化BN和非線性層ReLU之后,進行Sigmoid變換,輸出1個概率圖,自動優化每個特征層中像素的權重。概率圖與使用卷積層后的低層特征圖相乘,獲得在像素注意力下的低層特征圖。網絡模型使用SDPAS模塊得到所有尺度,將該模塊的輸出與來自上一層的反卷積結果級聯到一起,從而完成像素級注意力特征的引入與融合。

Figure 3 SDPAS structure圖3 SDPAS結構

注意力U型子網絡的所有尺度都會輸出1個視差圖,由于每層的視差圖尺度不一樣,本文通過三線性插值,將得到的視差圖上采樣到與原圖大小一致。由于這個網絡有3個輸出,因而對應地有3個損失,分別是Loss1、Loss2、Loss3。在訓練階段,視差匹配最終損失由3個損失加權求和得到。在測試階段,左右圖最終視差圖是圖1中最上面一層的輸出,如圖1所示。

2.5 視差回歸

(2)

其中,D為最大視差,表示對應點可能出現在右圖中的位置的最大偏移量。

2.6 損失函數

本文利用具有標準視差圖的數據集KITTI,通過隨機初始化的方式訓練整個網絡。由于KITTI數據集的標準視差圖是稀疏的,因此需要在有標簽的像素集合內平均所有像素的損失。本文提出的網絡有3個視差輸出,采用絕對值誤差訓練整個網絡:

(3)

3 實驗與分析

3.1 實驗條件及評價指標

為了測試本文網絡的效果,本文在KITTI2015立體視覺數據集上進行評估。KITTI2015數據集是從汽車視角采集的真實圖像數據,包含200對訓練立體圖像對和對應的稀疏視差圖,以及200對測試圖像對,其中測試圖像對不包含對應的視差圖。圖像寬為1 240像素,高為376像素。本文取80%的訓練圖像作為訓練集,20%的圖像作為驗證集。網絡基于PyTorch實現,采用Adam優化方法,其中β1取0.9,β2取0.999。訓練時對整個數據集進行顏色歸一化預處理,圖像尺寸隨機裁剪成256×512大小,最大視差數D取192。訓練階段網絡采用相同的學習率,前200次迭代過程中,學習率設為0.001,后續迭代過程中,學習率降為0.000 1。網絡訓練的最大迭代數為1 000,在一塊NVIDIA 1080Ti GPU上訓練耗時約36 h。

所有實驗使用像素誤差(Pixel Error)作為評價指標。像素誤差是預測視差值與標準視差值的誤差,超過某個閾值的像素所占的百分比。本文將閾值分別設為2,3,5,分別對應2px-error,3px-error,5px-error。

3.2 實驗結果

3.2.1 網絡結構實驗對比分析

為了驗證本文提出的網絡結構的有效性,本文設置4種不同的結構進行消融實驗,在KITTI驗證集上進行對比。實驗結果如表1所示,表中‘All’表示在計算錯誤率時考慮所有的像素,‘Non-Occ’表示在計算錯誤率時僅考慮非遮擋區域的像素。特征提取階段和代價聚合階段分別采用雙通道注意力沙漏型子網絡和注意力U型子網絡。實驗結果如表1所示,代價聚合階段采用注意力U型子網絡,3px-error降低了4.2%,說明了U型網絡用于代價聚合可以提高立體匹配的精度。在特征提取階段,引入像素注意力機制,錯誤率進一步降低,證明了注意力機制的引入,能在像素粒度進行特征篩選,最終提升立體匹配的效果。

3.2.2 網絡對比分析

本文與MC-CNN-acrt[16]、Content-CNN[17]、Siamese-CNN[20]、DDR[23]4種網絡進行比較,訓練集與驗證集的比例均為4∶1。其中,MC-CNN網絡是沒有進行視差后處理的實驗結果。本文網絡以及Content-CNN和Siamese-CNN都沒有進行視差后處理。實驗結果如表2所示,與其他網絡相比,本文網絡的3px-error、5px-error錯誤率最低,2px-error錯誤率低于前3種網絡。DRR是在MC-CNN的基礎上進行視差后處理的網絡。本文的網絡在3px-error和5px-error錯誤率上,低于加了后處理的結果。

Table 1 Comparison of different structures on KITTI validation set

Table 2 Performance comparison on KITTI validation set

Figure 4 Results on test set圖4 測試集效果圖

對KITTI2015中的200對立體圖像對進行視差圖計算,并將結果提交至KITTI評估網站,結果如表3所示,表中“D1-bg”“D1-fg”“D1-all”分別表示背景、前景、所有區域的像素,即“D1-bg”表示計算錯誤率時只考慮背景部分的像素。PSANet的3px-error是3.97%,優于大部分網絡。

圖4是利用本文提出的PSANet生成的視差圖樣例。從圖4中可以看出,PASNet能夠生成平滑的視差圖,尤其是路面區域具有重復紋理,屬于比較常見的病態區域,是立體匹配中的難點之一,但PASNet的像素誤差很低。圖4中第1行圖像存在反光路面,幾乎沒有明顯的紋理特性能夠輔助尋找對應匹配點,屬于病態區域中的反射表面問題,但是本文的網絡得到了較好的視差圖。第4行圖像中,中間的草叢由于存在重復紋理的病態區域情況,誤匹配率較高,誤差較大,本文提出的網絡在重復紋理下具有較低的誤差。本文提出的網絡在上述幾種病態區域得到了精確的測試結果,一方面驗證了本文提出的網絡具有魯棒性,另一方面驗證了本文提出的網絡能更好地描述匹配點之間的相關性,能有效改善立體匹配精度,特別是在病態區域,能夠得到精度較高的視差圖。

Table 3 Performance on KITTI test set

4 結束語

本文提出的基于像素注意力的雙通道立體匹配卷積神經網絡PASNet,將注意力機制引入到特征提取與代價聚合步驟中。首先,通過雙通道注意力沙漏型子網絡對輸入圖像進行特征提取,實驗驗證了注意力機制可以提取有效特征并抑制無效特征;其次,根據特征提取得到的特征圖,通過關聯層得到代價矩陣,獲取初步視差圖;最后,利用注意力U型子網絡對代價矩陣進行代價聚合,實驗表明該子網絡可以優化輸出結果,最終輸出高精度的視差圖。在KITTI立體視覺數據集上的實驗結果表明,所提出的網絡能更好地描述匹配點之間的相關性,有效地解決病態區域精度較低等問題,提高立體匹配精度。PAS和SDPAS模塊還可以應用到其它利用像素級預測的網絡模型中,以提高匹配精度。

猜你喜歡
特征提取特征
抓住特征巧觀察
特征提取和最小二乘支持向量機的水下目標識別
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
抓住特征巧觀察
Bagging RCSP腦電特征提取算法
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 久久久久免费看成人影片| 欧美笫一页| 国产精品分类视频分类一区| 欧美一级高清免费a| 在线看AV天堂| 亚洲第一极品精品无码| 最近最新中文字幕在线第一页 | 亚洲精品波多野结衣| 色综合日本| 久久综合亚洲鲁鲁九月天| 久久免费看片| 日韩免费中文字幕| 亚洲精品波多野结衣| 嫩草在线视频| 思思99热精品在线| 欧美午夜一区| 国产在线视频欧美亚综合| 蜜桃臀无码内射一区二区三区| 无码日韩精品91超碰| 久久无码高潮喷水| 99热这里只有精品久久免费| 在线播放国产一区| 欧美日本在线播放| 国产不卡一级毛片视频| 制服丝袜无码每日更新| 91亚洲精选| 在线观看无码av免费不卡网站| 台湾AV国片精品女同性| 久久婷婷六月| 广东一级毛片| 色一情一乱一伦一区二区三区小说| 在线精品亚洲国产| 国内精品免费| 亚洲中文无码av永久伊人| 国产精品亚洲专区一区| 久久成人免费| 无码精品国产dvd在线观看9久| 亚洲黄色网站视频| 欧美另类视频一区二区三区| 精品一区二区无码av| 毛片手机在线看| 国产精鲁鲁网在线视频| 亚洲视频四区| 久草视频精品| 色网站在线免费观看| 亚洲精品中文字幕无乱码| 国产成人精品免费视频大全五级| 亚洲国产精品不卡在线| 内射人妻无码色AV天堂| 国产成人成人一区二区| 亚洲第一页在线观看| 18禁黄无遮挡免费动漫网站| 视频一本大道香蕉久在线播放 | 国产亚洲高清视频| 亚洲av无码专区久久蜜芽| 九九热视频精品在线| 久久免费成人| 99ri精品视频在线观看播放| 欧美成人免费一区在线播放| 红杏AV在线无码| 欧美国产另类| 国产麻豆va精品视频| 在线精品欧美日韩| 久久性妇女精品免费| 二级毛片免费观看全程| 欧美国产综合色视频| 日本欧美在线观看| 亚洲欧美人成人让影院| 在线看片中文字幕| 日韩123欧美字幕| 久久影院一区二区h| 欧美日韩91| 国产精品成人免费综合| 国产在线第二页| 欧美成人日韩| 国产女人水多毛片18| 国产成人精品男人的天堂| 中文字幕在线看| 午夜国产理论| 国产成人av一区二区三区| 欧美日韩亚洲国产| 亚洲成a∧人片在线观看无码|