王小玉 李志斌



摘要:針對實時語義分割任務中需要同時兼顧位置信息和語義信息的問題,提出一種改進特征融合的實時語義分割方法。該方法由卷積神經網絡、輕量級注意力模塊(light attention module, LAM)和雙通道特征融合模塊(bilateral feature fusion module, BFFM)組成。首先,使用卷積神經網絡結合輕量級注意力模塊快速提取圖像的位置信息和語義信息。然后,使用雙通道特征融合模塊指導位置信息和語義信息的特征圖融合。所提方法在CamVid上,平均交并比達到678%,分割速度可達到526幀/s。在Cityscapes上,平均交并比達到735%,分割速度可達到318幀/s。實驗結果表明,提出的分割方法滿足分割的準確性和實時性要求,能夠適用于實時語義分割任務中。
關鍵詞:圖像處理;卷積神經網絡;實時語義分割;特征融合;注意力機制