基于視覺顯著性和圖割的圖像分割算法優化方案

2024-01-10 10:08:32趙樹梅

科學技術創新 2024年2期

趙樹梅

（煙臺理工學院，山東煙臺）

近年來，視覺顯著性模型在圖像分割任務中得到了廣泛應用。視覺顯著性指的是圖像中那些在人類視覺感知中具有顯著性的區域，通常與前景目標相關。利用視覺顯著性可以幫助分割算法更好地捕捉目標邊界并減少背景噪聲的干擾。與此同時，圖割作為一種經典的圖像分割方法，具有良好的分割準確性和可擴展性。將視覺顯著性與圖割相結合，可以進一步提高圖像分割的性能。本文旨在提出一種基于視覺顯著性與圖割的圖像分割算法，以解決傳統分割方法在復雜場景下的局限性。

1 視覺顯著性模型

1.1 基于低級特征的視覺顯著性模型

基于低級特征的視覺顯著性模型是一種常用的方法，其基于圖像的低級特征（如顏色、紋理和邊緣等）來推測圖像中的顯著性區域。這些低級特征通常能夠捕捉到人眼在感知圖像時的注意力變化。顏色特征是基于人眼對顏色的敏感性來計算圖像顯著性的一種方法。通過比較圖像中的像素與整體顏色分布之間的差異，可以獲得顯著性信息[1]。例如，一些算法會將與周圍像素具有較大顏色差異的像素標記為顯著性區域，因為這些顏色較為突出。

紋理特征是通過分析圖像的局部紋理特性來計算顯著性的。通常情況下，紋理變化較大的區域更容易引起注意，因此紋理特征在顯著性模型中得到了廣泛應用。例如，Gabor 濾波器可以捕捉到圖像中的紋理信息，通過計算濾波后的響應來判斷顯著性。邊緣特征是指圖像中的邊緣信息，由于邊緣是圖像中物體之間的界限，因此在顯著性模型中具有重要作用。通過檢測圖像的邊緣并分析其特性，可以得到圖像的顯著性信息。例如，使用Canny算子可以提取出圖像中的邊緣，并將其作為顯著性區域的候選。

綜合利用顏色、紋理和邊緣等低級特征，可以構建一個基于低級特征的視覺顯著性模型。這些模型通常使用各個特征的加權組合來計算顯著性值，并將較高顯著性值的區域作為顯著性區域。例如，將顏色、紋理和邊緣特征進行融合，可以通過計算特征相似性加權和來確定顯著性值。舉例分析：對于一張自然風景圖片，基于低級特征的視覺顯著性模型可以從圖像中提取顏色、紋理和邊緣信息。假設在圖像中存在一片明亮的紅色花朵，該模型可以檢測到花朵的顏色與周圍環境的差異較大，紋理比周圍區域更多樣化，并且花朵邊緣清晰，因此給出較高的顯著性值，將花朵標記為顯著性區域。這樣的顯著性信息可用于后續的圖像分割任務。視覺顯著性模型如圖1 所示。

圖1 視覺顯著性模型

1.2 基于深度學習的模型

隨著深度學習的發展，基于深度學習的視覺顯著性模型在圖像分割任務中取得了重大突破。深度學習模型可以自動從大規模數據集中學習到圖像中的高級特征，具有較強的表達能力和泛化能力[2]。基于深度學習的視覺顯著性模型通常采用卷積神經網絡（CNN）進行特征提取和顯著性預測。CNN 可以學習到圖像的局部和全局特征，能夠捕捉到更高層次的語義信息。一般來說，基于深度學習的視覺顯著性模型的設計可以分為兩個主要步驟：特征提取和顯著性預測。

在特征提取階段，可以使用預訓練的深度網絡（如VGG、ResNet 等）作為特征提取器，通過提取網絡的中間層特征作為輸入。這樣的特征通常包含了豐富的語義信息，可以更好地表示圖像的顯著性。除了傳統的RGB圖像特征外，還可以使用多模態特征，如深度特征、顏色分布特征等。特征提取過程可以表示為：

[F_{ ext{features}}= ext{CNN}(I)]

其中，(F_ { ext {features}}) 表示提取的特征，( ext{CNN})表示用于特征提取的卷積神經網絡，(I)是輸入圖像。在顯著性預測階段，可以通過添加適當的分類器或回歸器來預測圖像中的顯著性分布?？梢栽诰W絡末端添加全連接層和激活函數，輸出每個像素的顯著性概率。顯著性預測可以表示為：

[M= ext{Classifier}(F_{ ext{features}})]

其中，(M)表示顯著性映射，( ext{Classifier})表示用于顯著性預測的分類器?；谏疃葘W習的視覺顯著性模型的優勢在于其能夠利用大規模的標注數據進行端到端的訓練，從而學習到具有較強泛化能力的顯著性模型。此外，該模型還能夠根據特定任務需求進行靈活調整和優化。例如，對于一張汽車駕駛場景的圖片，基于深度學習的視覺顯著性模型可以通過訓練后的深度網絡，自動學習到汽車、行人等顯著性對象的特征表示。該模型能夠將注意力集中在駕駛場景中的主要物體上，例如汽車、行人，而將背景、建筑等非顯著性區域置于次要位置。這樣的顯著性信息可以為目標檢測和駕駛輔助系統提供重要的先驗知識?；谏疃葘W習算法模型如圖2 所示。

圖2 基于深度學習圖像分割模型算法

2 圖像分割

2.1 圖割原理

圖割算法是一種用于圖像分割的方法，其原理基于圖論中的最小割/最大流問題。圖割的目標是將圖像分割成若干個互不重疊的區域，使得相似的像素歸為一類。將圖像表示為一個圖（Graph）的形式，其中圖的節點表示圖像的像素，邊表示像素之間的關系。常見的圖表示方式是使用鄰接矩陣或鄰接表。圖割算法通過計算圖中的邊的權重來評估像素之間的相似性。一般來說，相似的像素之間的邊權重較低，不相似的像素之間的邊權重較高。圖割算法通過最小割或最大流的方式將圖像分割成兩個部分。最小割是指找到一條割（Cut），使得割中邊的權重之和最小。最大流是指在圖中找到一個流（Flow），使得從源節點到匯節點的流量最大。最小割等價于最大流問題。通過調整割的位置，圖割算法可以將圖像分成多個區塊，從而實現圖像的分割。例如有一幅圖像，其中包含一個紅色蘋果和一個綠色橘子。我們可以將整個圖像視為一個圖，并用邊連接相鄰的像素。然后，通過計算邊的相似性來找到最小割，從而將圖像分割成紅色蘋果和綠色橘子兩個部分。圖割算法能夠根據像素之間的相似性自動完成這個分割過程。

2.2 圖割算法優化應用

為了提高圖割算法的效率和精度，人們進行了許多優化工作，源于圖割算法的種子點選擇。在圖割算法中，初始種子點的選擇對結果有很大的影響。一種常見的優化是通過手工選取或自動定位種子點，以確保種子點落在正確的目標區域上。圖割算法的圖構建和邊權重計算也是重要的優化方向[3]。通常，可以根據像素的顏色、紋理、梯度等特征來計算像素之間的相似性，并將其作為邊的權重。通過設計合適的相似性度量和權重計算方法，可以提高圖割算法的準確性和魯棒性。圖割算法中的圖割過程也可以進行優化。另一種常見的優化方法是使用迭代優化技術，例如圖割迭代法（Graph-cuts Iteration）和α- 擴展算法（α-expansion algorithm）。這些算法通過多次迭代優化割的位置，從而逐步改善分割結果。

針對大規模圖像分割問題，可以使用近似算法來加速計算。例如，基于圖割的超像素分割算法（Graph-cuts-based superpixel segmentation）將圖像分割成多個超像素塊，并在這些塊上進行圖割計算，從而大大減少了計算量。還可以結合其他算法和技術進行圖割算法的優化。例如，可以使用機器學習技術來輔助圖像分割過程，通過訓練分類器來指導割的過程。此外，還可以將圖割算法與其他圖像處理技術，如邊緣檢測、區域生長等方法結合起來，從而提高圖割算法的效果和穩定性。圖割算法通過最小割/最大流原理實現圖像分割，通過優化算法的種子點選擇、圖構建和邊權重計算、圖割過程等方面，可以提高算法的效率和精度。這些優化方法不僅可以應用于圖像分割領域，還可以推廣到其他相關領域，如計算機視覺、圖像處理等。圖割算法優化方法見表1。

表1 圖割算法優化方法

3 視覺顯著性與圖割的圖像分割算法

3.1 視覺顯著性區域檢測

視覺顯著性區域檢測是一項用于識別圖像中突出、吸引人注意力的區域的技術。其目標是模擬人類視覺系統的關注機制，準確地找出圖像中的顯著性區域。常見的視覺顯著性區域檢測方法包括基于局部對比度、全局對比度、頻域分析以及機器學習方法等。舉例來說，基于局部對比度的方法使用圖像中每個像素周圍的鄰域信息來計算像素的顯著性分數。通過比較像素與其鄰域的顏色、紋理、亮度等特征差異，可以判斷像素的顯著性。例如，一些像素與其周圍相似的像素相比具有更高的對比度，因此被認為是顯著性區域的一部分。視覺顯著性區域檢測如圖3。

圖3 視覺顯著性區域檢測

3.2 圖割分割的應用

圖割分割是一種圖像分割方法，它將圖像分成不同的區域或對象。圖割分割過程基于圖像的像素間關系以及預先提供的用戶定義的標記信息來確定哪些像素屬于同一分割區域[4]。主要步驟包括圖構建和最小割求解。在圖構建中，將圖像中的像素視為圖中的節點，并連接彼此相鄰的像素。這創建了一個具有像素連接關系的圖。然后，為圖中的邊分配權重，權重反映了相鄰像素之間的相似性。這些權重可以基于像素之間的顏色、紋理、空間距離等特征計算得出。在最小割求解中，通過定義一些節點作為種子節點，并給它們分配預先定義的標記（屬于前景或背景），通過最小化割來確定哪些像素被分配給前景或背景。最小割求解可以通過圖論算法，如Ford-Fulkerson 算法或最大流最小割算法來實現。這樣就可以根據用戶定義的標記信息進行有效的圖像分割。圖割分割的具體步驟見表2。

表2 圖割分割的具體步驟

3.3 分割結果后處理技術

分割結果后處理技術旨在進一步提高分割結果的質量，并消除可能存在的噪聲或錯誤分割。常見的后處理技術包括邊緣平滑、連通性分析和形態學運算等。邊緣平滑是一種常用的后處理方法，可以通過對分割結果中的邊緣進行平滑處理來消除邊緣中的噪聲或不連續性。一種常見的方法是使用濾波器或平滑算子對邊緣進行模糊處理，以減少邊緣的銳度和噪聲。

連通性分析可以通過將相鄰的像素或區域連接在一起來修復分割中的不連續性。這可以通過像素或區域的連接性和空間鄰近性來實現。例如，可以將相鄰的像素合并成一個區域，或者將不相鄰但具有相似特征的區域合并在一起。形態學運算是一種基于像素值的形態學操作，用于消除分割結果中的噪聲或填補分割中的空洞。常見的形態學運算包括膨脹和腐蝕[5]。膨脹可以擴張分割結果的區域，填充空洞，而腐蝕可以收縮區域，去除噪聲或細小的分割錯誤。這些分割結果的后處理技術可以幫助提高分割結果的準確性和一致性，使得分割結果更符合實際場景。

結束語

本文提出了一種基于視覺顯著性與圖割的圖像分割算法，并通過實驗證明了該算法的有效性和準確性。該算法在捕捉目標邊界和減少背景噪聲方面取得了顯著的改進。然而，仍存在一些挑戰，例如算法在復雜場景下的魯棒性和計算效率等方面的改進。未來的研究可以進一步探索如何結合更多的上下文信息和深度學習技術來提升圖像分割算法的性能?？傊疚乃岢龅幕谝曈X顯著性與圖割的圖像分割算法在實際圖像處理任務中具有潛在的應用價值，并為進一步研究圖像分割問題提供了有益的啟示和參考。