歐明華,李 翔
(桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004)
不同于GPS等衛星導航技術,視覺導航技術能夠在城市信號阻塞、樓宇眾多等不利環境下實現導航。視覺里程計[1](Visual Odometry,VO)已經成為智能系統導航的最佳選擇,是SLAM(Simultaneous Localization and Mapping)技術[2]重要的組成部分,也是計算機視覺的一個重要應用。VO僅使用圖像作為輸入即可確定系統位置,不需要有關環境的任何先驗知識。因此視覺導航已成為當下移動機器人導航[3]的研究熱點。
現有視覺定位系統包括雙目(立體)視覺系統、單目視覺系統及深度相機定位系統。主流的視覺定位系統研究主要集中在雙目視覺定位,但是雙目視覺系統設備安裝、相機標定等環節過于繁瑣;另一方面,雙目系統計算量大,難以達到實時效果。單目視覺定位系統安裝便捷、計算量較小,但單目有其固有缺點,即定位精度較低。基于特征點方法進行視覺運動估計是視覺SLAM的主要方法。
文獻[4]提出的基于Surf的單目視覺里程計在一定程度上提高了定位精度,但是其應用于特征較為豐富的場景時會出現實時性不足的問題。文獻[5]提出的視覺里程計具有一定的實時性,但缺少對定位過程的優化,導致精度不夠。文獻[6]提出了一種基于卷積神經網絡的算法,通過優化神經網絡結構,從卷積神經網絡的每一層去圖像描述子,進行動態環境的位置識別,在一定程度上提高了定位的準確性,但該算法時間復雜度較高、實時性不足。針對以上問……