圖像特征點提取與匹配的算法分析

2021-08-16 11:17:28晏細蘭楊震倫

科學技術創新 2021年22期

晏細蘭楊震倫

（廣州番禺職業技術學院信息工程學院，廣東廣州 511483）

1 圖像的空間關系

在攝像機拍攝時，可以用一個坐標空間來描述這個攝像機，其中包括攝像機的位置信息、拍攝視野范圍、拍攝焦距、拍攝方位角度等信息。全景圖像的目的就是通過對攝像機的校正，把所有攝像機統一到一個相同的坐標空間中。兩個帶有一定重疊區域的圖像，可以利用重疊區域的信息計算出一個投影變換矩陣來描述圖像的空間關系，把一個圖像的坐標空間映射到另一個坐標空間中，計算過程如圖1。

圖1 圖像投影過程

圖像投影包括四個步驟：

第一步對圖像進行特征點提取，找到具有明顯限量特征的坐標點；

第二步對提取出來的特征點進行匹配，選出具有對應關系的匹配點對；

第三步利用匹配點對的關系，計算出投影變換矩陣；

第四步利用投影變換矩陣把一個圖像投影到另外一個圖像中。

其中由一個平面坐標空間投影到另外一個平面坐標空間可以由式（1）實現，其中(x,y)為目標坐標，（X,Y）為源坐標，H為投影變換矩陣。

由于該方程組為具有8個未知參數帶約束方程組，至少需要提供4組匹配特征點來求解。

2 特征點匹配方法

特征點匹配方法有很多種，其中基于圖像局部灰度特征描述來提取特征點的辦法在實際使用中有較好的使用效果，如2004年Lowe提出的SIFT算法。

2.1 SIFT特征點匹配算法

尺度不變特征轉換(Scale-invariant feature transform或SIFT)算法提取的特征點是具有旋轉尺度不變性，并且對亮度和視角都有較好的魯棒性，該算法流程如圖2。

圖2 SIFT算法流程

該算法利用高斯函數對圖像做卷積，通過改變σ值獲得不同尺度等級的多分辨圖像，然后對相鄰尺度圖像像素點等級相減求出高斯差分金字塔：

其中：

將圖像中每個像素點和本尺度8領域的8個點、上一尺度空間的9個點和下一尺度空間的9個點共26個點做比較，如果該點為這26領域點中的極大值或極小值，那么就認為該點為當前尺度下的極值點。進一步求得所有尺度空間上的極值點，然后剔除特征樣本中的底對比度點和邊緣響應點。在每一個極值點所在的尺度空間中，計算該極值點周圍經高斯加權的鄰域點的梯度的強度m及方向θ，將坐標軸旋轉到特征點的主梯度方向，并以關鍵點為中心做16×16的領域為窗口，按4×4把窗口分成16塊，分別計算每塊從8個梯度方向的梯度方向直方圖，統計每個方向上梯度強度的累加值，形成一個包含8個方向梯度信息的種子點，這樣一個關鍵點就可以用一個16×8=128維特征向量來描述。

SIFT具有比較穩定的特征匹配能力，128維的特征向量能非常準確的描述一個特征點局部特性，但是高維數也使SIFT的計算和匹配速度較慢，所以SIFT對于大規模、高分辨率全景參數的計算顯得并不合適。尋找一種能快速提取并且具有較好特征描述能力的特征點提取方法成為了解決大規模高分辨率全景參數計算的迫切問題。

2.2 SURF特征點匹配算法

Speeded Up Robust Features（SURF）算法對特征點的檢測利用了速度更快、精度更高的Hessian矩陣，利用積分圖像算法取代SIFT算法中構建高斯金字塔的過程，計算效率得到了很大的提高。在特征點描述階段，先將極值點周圍領域分成4×4的16個小塊，然后計算每塊的Haar小波響應，生成一個4維向量V：

從而生成了一個16×4=64維的特征描述向量，最后對特性描述向量做歸一化處理，使得該特征描述同時對亮度也具有了一定的魯棒性。

3 SIFT算法和SURF算法對比

相對于SIFT算法，由于采用的是積分圖像方法，SURF特征檢測和描述的效率得到了提高，并且SURF采用的是64維的特征描述向量，特征匹配的速度也得到了極大的提升。對于特征點的匹配，SIFT采用k-d樹結構的BBF算法進行匹配，SURF采用的是快速索引匹配和歐式距離匹配。從匹配方法來說，SURF的匹配速度也要比SIFT具有更高的效率。

歸納對比SIFT和SURF的算法過程，如表1。

表1 SIFT算法和SURF算法對比

通過對比可以發現SURF采用了各種提高特征點提取和匹配速度的方法，很大程度上提高了特征點提取匹配的效率，實驗證明SURF在特征點提取和匹配效率是SIFT的3倍，這使得SURF在大規模、高分辨率圖像特征點提取匹配中有了天然的優勢。SIFT比SURF具有更高的精度，適合小目標的準確匹配，而SURF適合做大規模高分辨率全景拼接。

4 結論

本文研究了在大規模陣列參數學習過程中提升計算精度和計算效率的算法，實驗證明SURF在特征點提取和匹配效率是SIFT的3倍，這使得SURF在大規模、高分辨率圖像特征點提取匹配中有了天然的優勢。SIFT比SURF具有更高的精度，適合小目標的準確匹配，而SURF適合做大規模高分辨率全景拼接。