曹之君 張 良
中國民航大學電子信息與自動化學院,天津 300300
目標檢測在計算機視覺領域是一個重要的研究方向,對于提取和挖掘感興趣的區域非常重要。目標檢測是計算機視覺中一個核心問題[1],在行人跟蹤、車牌識別、無人駕駛等領域都具備重要的研究價值。傳統算法大致可分為目標實例檢測與傳統目標類別檢測2類。傳統算法提取的特征基本都是低層次、人工選定的簡單特征,針對特定對象更有針對性,但是不能很好地表達大量、多類目標。且需要一定的先驗知識來設置相應的手工特征,具有魯棒性不高,不能廣泛應用的缺點。近年來,隨著深度學習對圖像分類準確度的大幅提高,基于深度學習的目標檢測算法逐漸成為主流。
傳統的目標檢測算法,多是基于滑動窗口的經典框架或是根據特征點進行匹配。AlexNet在2012年度ImageNet大規模視覺識別挑戰賽中一舉奪冠[2],并且效果遠超傳統算法,將大眾的視野帶到卷積神經網絡。基于深度學習的目標檢測方法才開始在計算機視覺領域嶄露頭角。基于深度學習的目標檢測大致分為2個流派:1)基于回歸的檢測算法;2)基于分類的檢測算法。前者的代表是YOLO系算法。文獻[3]提出了YOLO模型,YOLO將圖片劃分成S×S的網格,各網格負責檢測中心落在該網格的目標。YOLO采取以單元格為中心的多尺度區域取代區域目標建議網絡,舍棄了一些精確度以換取檢測速度的提升,該方法直接在原始圖像上訓練,速度較快,精度略差。……