賈永鑫



摘要:圖像檢索是在圖像數據庫中快速查找用戶需求目標圖像的有效方法。為了提高圖像檢索效率,針對單主體圖像的感興趣區域進行研究,提出了一種基于超像素分割與區域聚類相結合的圖像感興趣區域提取方法,首先對所給圖像做灰度化處理,對灰度圖像進行超像素分割,再對分割后的各超像素進行處理,形成超像素均值矩陣,最后對超像素均值矩陣進行聚類,提出感興趣區域。此法可快速而精確地提取出圖像的感興趣區域,且相較于其他感興趣區域提取方法,此算法在提取結果方面更優,感興趣區域的提取結果更完整。
關鍵詞:圖像檢索;超像素分割;單主體圖像;區域聚類
中圖分類號:TP391? ? ?文獻標識碼:A
文章編號:1009-3044(2022)22-0080-03
1 概述
圖像檢索[1]是在圖像庫中通過檢索圖像標注的文本或者內容特征,為用戶提供相關圖像資料檢索服務的搜索技術。隨著大數據時代的來臨,圖像數據呈指數增長。傳統的基于圖像全局處理的檢索方法,處理海量數據的效率大大降低[2-3]。如何有效地提高圖像檢索的能力,加快檢索效率,已成為當下圖像檢索研究的熱點話題。
人類視覺通過快速掃描全局圖像,注意力焦點會落在重點關注的目標區域,而后對這一區域投入更多注意力資源,以獲取更多關注目標的細節信息,并抑制其他無用信息。針對此現象,一些學者提出了感興趣區域的概念[4],感興趣區域首先使用在機器人研究領域,并取得較好發展。隨后感興趣區域便被引入圖像檢索領域,用于圖像預處理。對感興趣區域進行識別,忽略掉圖像不感興趣區域,只保留感興趣的部分,便于更好地提取圖像感興趣區域的相關特征,提高圖像檢索的效率。
如何在一幅圖像中快速準確地找到感興趣區域,超像素分割(simple linear iterative clustering,SLIC) [5]方法有較為明顯的優勢。利用超像素分割方法可以將圖像分割成一個個相對規則的超像素塊,超像素塊內部像素點特征相似,超像素塊之間邊界明顯且連接緊密,之后利用聚類方法即可實現對圖像感興趣區域的提取。
近年來,許多國內外學者對利用超像素方法提取感興趣區域進行了研究。姜全春等人[6]提出一種基于密度的聚類方法對超像素分割的結果進行聚類,提高感興趣區域提取的準確性。郭偉等人[7]針對圖像多個主體的分割問題提出一種基于超像素的DBSCAN[8](Density-Based Spatial Clustering of Applications with Noise) 自適應圖像感興趣區域分割算法。劉洋等人[9]針對Grab Cut分割算法時間復雜度高且分割效果較差的問題提出了一種基于超像素的Grab Cut分割方法。蘇建菖等人[10]針對傳統的超像素聚類算法做圖像分割時造成的欠分割現象進行研究,提出了一種基于超像素和k均值聚類算法相結合的圖像感興趣區域提取方法。目前由于圖像內容的復雜性及感興趣區域提取方法的不完善,使得感興趣區區域提取效果欠佳,無法令人滿意。
圖像本身具有直觀、生動的特點。從圖像中主體數量的特點出發對圖像進行劃分,可以將圖像分為無主體、單主體和多主體圖像三類。例如圖1~圖3中,圖1前后背景無明顯的差異,因此沒有明確的主體,屬于無主體圖像;圖2中花朵相較于其他部分顏色較為突出,且主體輪廓邊界明顯,屬于單主體圖像;圖3中馬匹作為圖像主體,但是在圖像中多個位置都有分布,且較為分散,屬于多主體圖像。通常,用戶主要的關注點就是圖像的主體,主體也是我們要提取感興趣區域的核心部分。
單主體圖像主體明確,易于發現,主體像素點更為集中,與圖像的背景色差較大,與多主體圖像相比,更容易找出圖像的感興趣區域。鑒于此,本文僅針對單主體圖像,研究感興趣區域的提取方法。
2 基于超像素分割與區域聚類相結合的圖像感興趣區域提取方法
本文針對圖像感興趣區域提取不精確的問題,利用圖像感興趣區域的特點提出一種區域聚類方法,并將其與超像素分割方法結合,提出一種針對單主體圖像的基于超像素及區域聚類相結合的圖像感興趣區域提取方法。具體流程如下:首先對讀入的單主體圖像進行超像素分割,形成超像素塊;再對分割后的超像素塊進行整合處理,將其轉化成數字矩陣;然后利用區域聚類的方法對數字矩陣進行聚類;最后在聚類的結果中選出感興趣區域部分,算法結構如圖4所示。
算法思想:
從圖像顏色特征的角度看,單主體圖像的感興趣區域部分與其他區域相比,色差較大,像素點相對集中,且與背景之間有明顯的輪廓邊界。針對圖像感興趣區域的這些特性,可以采用超像素分割方法將圖像分成多個緊密且各自獨立的小區域——超像素塊。超像素塊內部像素點特征相似,可用像素均值代替超像素塊。超像素塊之間邊界明確,便于感興趣區域與非感興趣區域的區分。對處理后的超像素塊通過合適的距離度量方法進行聚類,必定可以實現圖像感興趣區域的精確提取。
2.1 超像素分割
超像素分割將圖像分成多個相對規則的如細胞狀的超像素塊,這些超像素塊連接緊密,特征相對明顯,超像素間的界限比較明確。在進行分割操作時,只需規定超像素的數量這一參數,相比其他分割方法,超像素分割更自動化,運算更高效。超像素分割后的超像素特征明顯,自成一體,相比原圖像維度大大減少,在進行聚類操作時,可減少大量計算,提高運算效率。
分割步驟如下:
假設圖像[I]大小為[m*n],像素點[x,y]相對應的灰度值為:
[px,y x=1,2,...m;y=1,2,...n]
(1) 初始化規則超像素。給定圖像合適的中心點個數[k],則初始化的規則超像素是邊界長度為[s=m*nk]的正方形。
(2) 選取新的中心點。在給定中心點的[2s*2s]鄰域內找到梯度值最小的像素點代替原先的中心點。
(3) 分配像素點。計算像素點與鄰近中心點的距離,將所有像素點分配到最近的中心點所屬的超像素中。
(4) 距離度量。計算像素點與中心點之間由[L,a,b]代表的顏色值特征及[x,y] 表示的空間特征兩者組成的特征向量的距離。像素點屬于與其距離最小的中心點。
(5) 算法迭代優化。重復步驟(2)-(4),直到中心點不再變化,分割完成。
2.2 超像素塊處理
進行區域聚類之前,需要對超像素分割后的結果進行預處理。每一個超像素都有自己特有的標簽,在1.1中每個像素點依照自身所屬標簽歸屬到相應的超像素中,完成了分類。對每一個超像素塊計算其所有像素的均值,用像素均值代替超像素。再將所有的超像素均值按照該超像素所在原圖像的位置進行排列,得到超像素均值矩陣[Mr*c; r=ms,c=ns],即矩陣的每個位置對應超像素分割后的各超像素塊,每個位置上的像素值對應各超像素塊的像素均值。
2.3 區域聚類
區域聚類是通過聚類的思想將超像素均值矩陣[Mr*c]中像素值距離相近的點進行聚類,最后將聚類的結果組合并顯示。通過對圖像的感興趣區域研究發現,感興趣區域一般在圖像的中心部分,且圖像邊角的四個區域不含有感興趣區域。因此,可設置聚類個數為5,再對超像素均值矩陣[Mr*c]進行區域聚類。用超像素均值矩陣代替原圖像進行聚類,不僅縮小了像素矩陣,計算量也大大減少,有效提升運算效率。
聚類步驟如下:
超像素塊均值矩陣[Mr*c]的大小為[ms*ns],像素點[x,y]對應的像素值為:
[Spx,yx=1,2,…ms;y=1,2,…ns]
(1) 初始化聚類中心。在圖像的中心區域及四個邊角合適大小的區域各自選定一個聚類中心[ckxk,yk],[k=1,2,3,4,5]。
(2) 分配像素值點。遍歷矩陣[Mr*c]中所有的點[Spx,y],計算每個點與各聚類中心[ckxk,yk]的距離[dk],構成向量[v]。將該點的空間坐標歸屬到與[v]的最小值[min_dk]相對應集合[Gk]中。
(3) 距離度量。定義聚類中心與矩陣中各點的距離[dk]為空間距離[ds]和顏色距離[dc]的加權和。空間距離和顏色距離分別如式(1) 和式(2) 所示:
[ ds=xi-Xk2+yi-Yk2] (1)
[ dc=pxi,yi-pXk,Yk2] (2)
同時,為避免不同特征距離之間單位的不統一,便于不同單位的指標進行計算和比較,需要對兩種距離進行標準化。方法如下:
min-max標準化:線性變換公式如式(3) 所示:
[ d'=d-mindmaxd-mind] (3)
對于空間距離[ds],最大值[maxds=r2+c2],最小值[minds=0]。
對于像素距離[dc],最大值[maxdc=255],最小值[mindc=0]。
最終像素點與聚類中心的距離如式(4) 所示:
[ dk=ds'2+dc'2 =ds-mindsmaxds-minds2+dc-mindcmaxdc-mindc2] (4)
(4) 更新聚類中心。遍歷所有點歸到所屬的集合[Gk]中。在每個集合中,將所有點的橫縱坐標的均值取整,作為新的聚類中心的坐標,像素值為該坐標點在原超像素均值矩陣中所對應的像素值。
(5) 算法迭代。計算新聚類中心與原聚類中心的距離,當二者的距離小于預先設定的閾值T,說明聚類中心沒有明顯的變化,否則迭代步驟(2)-(4)。
2.4 提取感興趣區域
比較2.3中5個集合聚類中心的位置,選取聚類中心在圖像中心部位的集合。將該集合中各個坐標所對應的超像素塊進行組合,其他的區域灰度值全都設為0,作為背景。最終組合得出的結果即為圖像的感興趣區域。
3 實驗結果及分析
為了驗證本文算法的有效性,選取經典數據庫Corel-5k中的恐龍、狐貍、老虎、熊等背景復雜度不等的圖像數據,利用基于局部閾值的分割方法、分水嶺法、超像素分割+K-means及本文提出的算法對圖像進行感興趣區域提取,并對提取結果進行比較。提取過程都是在灰度圖像中進行處理,結果如圖5~圖10所示:
以上提取結果圖中,灰色部分為提取出的感興趣區域,黑色部分為圖像背景區域,通過對上述結果進行比較,可以得出以下結論:
(1) 基于局部閾值的分割方法無法確定圖像的主體,易造成感興趣區域提取錯誤、提取不完整等問題。
(2) 分水嶺法相比較前一種方法,大致提取出了感興趣區域,但是也存在主體不明確的問題,且最終的提取結果噪聲較大,效果較差。
(3) 超像素分割與K-means相結合的方法能準確地找出圖像主體的相對位置,大致提取出了感興趣區域,但是對于背景比較復雜的圖像,提取效果較差,容易出現欠分割的現象。
(4) 本文提出的基于超像素及區域聚類算法在準確找出圖像主體的同時,既實現了超像素分割方法對圖像的邊緣特征的提取,又體現了聚類算法對圖像整體的把握,極大程度上避免了圖像的漏割,較為完整地提取出了感興趣區域,且大大減少了干擾因素,使得提取結果符合預期。
4 結束語
為了更好地解決圖像感興趣區域的提取問題,本文對圖像的感興趣區域進行研究,提出了一種基于超像素分割與區域聚類相結合的針對單主體圖像的感興趣區域提取方法。算法使用超像素分割先將圖像分割成超像素塊,再對分割后的超像素塊進行整合處理,通過區域聚類方法對處理后的超像素塊進行聚類,得到最終結果。本文算法實用性強,無需人工操作,且相比較其他算法,提取結果更優,效率也更高。但是由于多主體圖像的主體較為分散,不易準確查找,因此該算法對于多主體圖像的提取效果不盡如人意,在提取過程中容易漏掉部分主體。因而在后續的工作中應繼續研究,使得在提取多主體圖像的感興趣區域之前自動確定主體數目,且能保持精準提取。
參考文獻:
[1] 王拓.基于內容的圖像檢索技術研究與應用[D].貴陽:貴州師范大學,2017.
[2] 田原嫄,譚慶昌.亞像素邊緣定位算法過濾噪聲的分析[J].東北電力大學學報,2016,36(5):43-47.
[3] 胡建平,李玲,謝琪,等.一種新的航拍玻璃絕緣子圖像分割方法[J].東北電力大學學報,2018,38(2):87-92.
[4] 汪輝.圖像分割及其感興趣區域提取方法的研究[D].安慶:安慶師范大學,2017.
[5] 羅學剛,呂俊瑞,彭真明.超像素分割及評價的最新研究進展[J].激光與光電子學進展,2019,56(9):53-63.
[6] 姜全春,王寧,李雷,等.一種新的基于超像素聚類的圖像分割算法[J].軟件,2019,40(6):44-48.
[7] 郭偉,李紅達,邢宇哲.基于SLIC的自適應多主體圖像分割算法[J].計算機工程與科學,2018,40(8):1459-1467.
[8] Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel, and J?rg Sander. OPTICS: ordering points to identify the clustering structure[J]. Proceedings ACM SIGMOD international conference on Management of data, 1999, 28(2): 49-60.
[9] 劉洋,周寧寧.基于SLIC的圖像分割方法研究[J].計算機技術與發展,2019,29(1):75-79.
[10] 蘇建菖,馬燕.基于超像素和K-means的圖像分割算法[J].計算機時代,2019(2):58-60,66.
【通聯編輯:唐一東】