宋俊芳 聞江



摘 要:局部圖像特征描述是計算機視覺的一個基本研究問題,在尋找圖像中的對應點以及物體特征描述中有著重要的作用。本文簡要介紹在機器視覺發展過程中常用的圖像特征點描述子,并展示各特征描述子在同一圖片中的檢測結果,分析它們的特點及優缺點。
關鍵詞:計算機視覺;特征點描述子;檢測結果
中圖分類號: TP391.4 文獻標識碼: A 文章編號: 1673-1069(2016)21-158-2
0 引言
圖像特征點描述子是很多實際應用的基礎,在多幅圖像的配準利用多幅二維圖像進行三維重建、恢復場景三維結構,這些應用在建立圖像之間點與點之間的對應關系通常都依賴于一個優秀的局部圖像特征點描述子。尤其是近年來對復雜場景沖目標跟蹤的應用中,基于目標圖像特征點的跟蹤能夠有效解決目標被遮擋、形變等比較復雜的情況,受到越來越多研究者的關注。
1 第一類圖像特征點描述子
1.1 SIFT
SIFT(尺度不變特征轉換),此算法由David Lowe在1999年所發表,2004年完善總結。是一種計算機視覺的算法,用來偵測與描述影像中的局部性特征,它在空間尺度中尋找極值點,并提取出其位置、尺度、旋轉不變量。自它提出以來,很快在物體識別、寬基線圖像匹配、三維重建、圖像檢索中得到了應用,局部圖像特征描述子在計算機視覺領域內也得到了更加廣泛的關注,涌現了一大批各具特色的局部圖像特征描述子。
1.2 SURF
SURF(加速穩健特征)是Hebert Bay在ECCV2006年提出的SIFT算法加速版,在適中的條件下完成兩幅圖像中物體的匹配基本實現了實時處理。它的速度是SIFT的3-7倍,大部分情況下它和SIFT的性能相當,因此它在很多應用中得到了應用,尤其是對運行時間要求高的場合。
1.3 BRISK/SBRISK
BRISK(二進制魯棒的不變尺度關鍵點),是ICCV2011年提出的圖像特點點描述子,2014年提出加速版SBRISK。它具有較好的旋轉不變性、尺度不變性及魯棒性。在對有較大模糊的圖像配準時,BRISK算法在其中表現最為出色。
1.4 KAZE/AKAZE
KAZE是ECCV2012提出的一種比SIFT更穩定的特征檢測算法,KAZE的取名是為了紀念尺度空間分析的開創者——日本學者Iijima。KAZE是日語‘風的諧音,寓意是就像風的形成是空氣在空間中非線性的流動過程一樣,KAZE特征檢測是在圖像域中進行非線性擴散處理的過程。AKAZE 是加速版KAZE特征,即Accelerated KAZE Features。
1.5 檢測結果
其中,圖1左上角原圖為1920*1080的高清圖像,從檢測結果可以看出,第一類圖像特征點描述子中,BRISK是速度最快的,在時間效率上依次是BRISK>SURF> AKAZE>SIFT>KAZE,SURF則是特征點最豐富的。
2 第二類圖像特征點描述子
2.1 MSER
MSER(最大穩定極值區域)是一種用于在圖像中進行斑點檢測的方法。這個方法由Matas等人于BMVC2002年提出,用于在兩個不同視角的圖片中尋找對應關系。這種方法從圖像中提取全面的元素對應關系,有助于寬基線匹配,以及更好的立體匹配和物體識別算法。該特征點描述子在具有相同閾值范圍內所支持的區域才會被選擇;無需任何平滑處理就可以實現多尺度檢測,即小的和大的結構都可以被檢測到。
2.2 ORB/ORBSLAM
ORB(ORiented Brief)是ICCV2011年提出的新的特征點描述子, 它是在BRIEF基礎上引入了方向的計算方法,并在點對的挑選上使用貪婪搜索算法,挑出了一些區分性強的點對用來描述二進制串。主要解決了BRIEF在噪聲敏感、旋轉不變性方面的問題。BRIEF (Binary Robust Independent Elementary Features) 則是ECCV2010年提出,利用局部圖像鄰域內隨機點對的灰度大小關系來建立局部圖像特征描述子,得到的二值特征描述子不僅匹配速度快,而且存儲要求內存低,因此手機應用中具有很好的應用前景。優點在于速度,缺點也相當明顯:不具備旋轉不變性;對噪聲敏感;不具備尺度不變性。ORBSLAM是2015年提出的比較完備的單目slam算法,主要是一個基于特征點地圖的應用。它對關鍵幀做了半稠密場景重建。
2.3 檢測結果
檢測結果顯示,MSER、ORB特征描述子均有很高的檢測效率,相對于第一類特征描述子,更容易滿足對于實時性要求高的應用,在特定的場合應用中,這兩類描述子應用廣泛,例如在點匹配的目標跟蹤上,由于幀率的高速,目標在當前幀和下一幀中的尺度變化很小,利用ORB特征點來實現跟蹤相對于其它所有特征點來說,具有不容忽視的巨大優勢。
3 第三類圖像特征點描述子
3.1 第三類特征點描述子總述
第三類特征點是一些不具有尺度變換或方向變換不變性的描述子,它們主要1994年提出的GFTT(Good Features To Track)、2006年FAST(Features From Accelerated Segment Test)、2008年Star,以及SimpleBlob特征點描述子等等。它們的提出時間都較早,隨著對圖像特征點描述子研究的深入,不少研究者在此基礎上不斷改良這些特征描述,提高它們的功能。當然,計算的時間復雜度也隨之提高,在具體表現上,性能仍不及上述的第一類、第二類描述子。不過值得注意的是,它們的優勢主要體現在運算速度上,在先驗知識比較豐富的具體應用中,這些圖像特征描述子在時間效率上往往占有極大優勢。
3.2 檢測結果
圖2檢測結果顯示,FAST特征點檢測速度快,且數量豐富,SimpleBlob則數量稀少。GFTT以及STAR速度快,在特征點的跟蹤上有著極好的性能。
4 總結
在實際應用中,根據不同場景的具體情況,不同的特征點都有不同的優勢,例如第一類圖像特征點描述子在對精度要求較高而不要求實時性的要求中表現出極好的性能;第二類特征描述子則在特定場合能夠很好的協調精度與速度之間的關系;而第三類特征描述子則主要在時間效率上占有極大優勢,適合于對實時性要求較高的場景應用。隨著研究的不斷深入,已有的圖像特征點描述子不斷的被改良,新的圖像特征點描述子也不斷被提出,在實際應用中也發揮著越來越重要的作用。