張旭東 趙柏淦 吳國慶 姚建南



摘要:針對自動駕駛領域現有方法在處理動態、遮擋等復雜實際場景時存在的估計不準確問題,提出了一種以多掩膜技術為基礎的無監督深度與光流估計方法,通過無監督學習從單目視頻序列中提取目標深度、相機運動位姿和光流信息。根據不同外點類型設計了多種特定掩膜,以有效抑制外點對光照一致性損失函數的干擾,并在位姿估計和光流估計任務中起到剔除外點的作用。引入預訓練的光流估計網絡,協助深度和位姿估計網絡更好地利用三維場景的幾何約束,從而增強聯合訓練性能。最后,借助訓練得到的深度和位姿信息,以及計算得到的掩膜,對光流估計網絡進行了優化訓練。在KITTI 數據集上的實驗結果表明,該策略能夠顯著提升模型的性能,并優于其他同類型方法。
關鍵詞:無監督學習;深度估計;位姿估計;三維重建
中圖分類號:TP 391 文獻標志碼:A