胡涵菲



關鍵詞:超像素分割;Mean Shift 分水嶺;最大相似性原理;目標提取
中圖分類號:TP18 文獻標識碼:A
文章編號:1009-3044(2023)14-0025-04
1 總體方案設計
1.1 功能模塊的劃分
一般圖像中的顏色與形狀特征較為復雜,很難實現目標物的全自動提取。本文結合圖像分割的基本原理,采用與用戶交互式的半自動分割方法,將系統分為對原始圖像的初步分割和對分割后的圖像進行相似度合并兩部分,最后得到目標提取結果圖像。
在像素分割模塊中,通過按鈕選擇原始圖像進行分割程序,并將分割后的圖像結果單獨保存;在目標提取模塊中,將原始圖像和分割圖像作為輸入,再通過畫筆粗略地標記目標對象和背景的位置,分割塊合并結束后,目標對象的邊緣被標記出,即完成提取。圖片在各功能模塊的輸入輸出流程如圖1所示。
1.2 主要實現功能的原理
1.2.1 基于Mean Shift 的圖像初始分割
Mean Shift算法是指一個迭代計算的步驟,即先算出當前點的偏移均值,再移動該點到其偏移均值,然后以此為新的起始點繼續移動,直到滿足一定的條件后結束迭代[1]。Comaniciu等人把Mean Shift算法成功地運用到特征空間的分析,在圖像分割中取得了很好的效果。此外,基于Mean Shift算法的圖像分割結果中過度分割較少,可以很好地保持目標邊界。
Mean Shift圖像分割算法的輸入可以是灰度圖像或彩色圖像,用戶唯一需要調整的參數是分析的分辨率[1]。基于該算法的圖像分割是間斷保持平滑算法的前向擴展,每個像素都與位于其鄰域內的聯合域密度的顯著模式相關聯,在對相鄰模式進行修剪后,生成圖像區域分割結果。
1.2.2 基于最大相似度的區域合并
在Mean Shift分割圖像的基礎上,基于最大相似度的區域合并(MSRM)機制進行區域合并,從而實現目標對象的輪廓提取。MSRM能夠自適應圖像內容,不需要一個預設的閾值[2],其原理為:如果在所有R的相鄰區域中,Q與其相似性最高,則將區域R與其相鄰區域Q合并[3]。
通過使用筆畫來粗略地標記目標對象和背景的位置后,該方法在標記的幫助下將Mean Shift分割的超像素按照是否被標記背景區域自動合并,非標記對象區域也將被識別,從而避免與背景合并。一旦所有的非標記區域都被標記出來,然后就可以很容易地從背景中提取出物體的輪廓。
2 各個功能模塊的實現原理
2.1 Mean Shift 圖像分割算法流程
通過Mean Shift 算法進行圖像分割包括兩個步驟:模點搜索和合并相似區域。通過模點搜索找到每個數據點的類中心,并以中心的顏色代替自己的顏色,以此來實現圖像平滑。但通過搜索得到的模點太多,且模點間距離較近,如果將每個模點都作為一類會導致類別太多,容易產生過分割,因此模點搜索后需要進行相似區域合并。
不斷重復步驟Step 1—Step 4,集合MB 覆蓋區域逐漸擴大,非標記區域N 的數量越來越少,當整個標記背景區域MB 找不到新的合并對象時,迭代停止。第一階段的區域合并后,一些非標記的背景區域與相應的背景標記合并;仍有一些非標記的背景區域由于彼此之間的相似性得分高于與標記的背景區域之間的相似性得分,因此未合并到背景集合中。圖3(b)顯示在第一階段合并后,許多屬于背景的區域的房子已合并,但仍有一些非標記的背景區域剩余。
循環執行這兩個合并階段,直到沒有新的合并發生。一般圖片的合并算法基本在2-3輪內結束,當所有區域被標記為提取目標或背景后,通過只提取目標區域可以很容易地得到物體的輪廓,如圖3(d)所示。
3 測試和調試
對六個測試圖像的像素分割和目標提取結果如圖4所示,第一列為原始圖像,第二列為Mean Shift初始分割結果,第三列顯示感興趣目標,并用白色線條勾勒出其輪廓。
由于圖像合并時根據區域間的RGB顏色直方圖計算區域間的相似度,因此目標對象顏色與背景顏色差異越大,合并效果也就越好。例如示例1、4、6,只需通過一筆標注就可以實現目標區域的準確提取。對于示例2、3,目標區域有部分像素塊的顏色與背景差異較小,需要對這些差異較小的區域著重標記,才能較好地實現分割。示例5的分割效果不好,由于左前車輪的顏色與影子顏色太過相近,在像素分割時直接被劃分到同一區域,因而在區域合并時,最終提取的目標輪廓也包含影子部分。可以通過其他的分割方法對示例5進行更細致的分割,或者手動進行圖像分割,或許可以將影子與車輪分割開來。
4 總結與反思
初始分割是目標提取的基礎,若是分割得太過細碎會導致合并效率降低,也會導致提取效果不太好。通過對比常用分割方法的效果發現,Mean Shift方法通過迭代產生規則形狀的超像素,但不能控制超像素的數量、大小;SLIC方法基于顏色和距離相似性進行的超像素分割,可以產生大小均勻、形狀規則的超像素;N-cut方法利用輪廓特征和紋理特征來全局最小化代價函數,可控制數量且形狀規整緊湊,但圖邊界效果不好[5]。考慮到MeanShift方法可以規則提取物體邊緣且分割塊較少,最終選擇該方法進行圖像分割。在超像素合并階段,寧紀鋒教授提出的最大相似度區域合并方法較為經典,在MSRM合并算法的基礎上進行了復雜度的簡化,并對合并效果進行了測試。對提取結果進行分析后發現改進效果較好,可以有效提取出感興趣目標物。