李斐朱曉磊
(1. 山東建筑大學信息與電氣工程學院,山東 濟南 250101;2. 山東建筑大學山東省智能建筑技術重點實驗室,山東 濟南 250101;3. 積成電子股份有限公司,山東 濟南 250100)
圖像分割是指根據目標與背景的先驗知識,將圖像劃分為某些特性上相近的連通區域的集合,通常為模式識別、圖像理解、圖像壓縮等應用的基礎準備,是從圖像處理到圖像分析的關鍵步驟[1]。 目前,自動化的圖像分割主要基于邊緣和區域的方法。由于每種方法具有不同特點,故適用于不同類型的圖像。 其中,基于圖像灰度的閾值分割方法屬于后者,是一種最為簡單有效的分割方法,根據圖像灰度的相似性,直接得到劃分好的區域。 閾值分割的前提是圖像中要提取的目標物與其背景在灰度特性存在差異,具有了不同的灰度值區域。 圖像的閾值個數由具體的劃分程度要求決定,單域值可以簡單地將圖像劃分為兩個區域,當實際應用中需要將圖像劃分為多個目標區域時,需要多個分割閾值。 傳統的閾值分割算法,通過窮舉法遍歷所有灰度值尋找最優閾值,其耗時較長,特別是當利用閾值分割算法進行多閾值分割時,計算法復雜度隨閾值個數呈指數級增長,因此需要更加高效和智能的閾值尋找方法。
元啟發式算法于20 世紀60 年代提出,利用仿生學原理,模擬生物或自然現象中群體移動和定位的行為機制進行目標函數優化,具有計算量低、優化效率高和自我調節等優點,已在解決非確定性多項式困難(Nondeterministic Polynomial-hard,NPH)、組合優化等問題上取得廣泛的應用。 元啟發式算法也已用于圖像的多閾值選擇問題上。 閾值處理可視為一種統計決策問題,常用的統計鑒別分析中的測度有最大類間方差和信息熵,呂鑫等[2]結合鳥群算法中飛行行為的思想優化麻雀搜索算法,提出改進麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA),提高算法的搜索能力和開拓能力,獲得更好的全局最優值,同時將最大類間方差和Kapur 熵作為ISSA 的目標函數進行圖像的多閾值尋優,得到更加穩定高效的分割性能;常君杰等[3]在烏鴉算法中引入Levy 飛行機制,提高全局搜索能力,并采用自適應尺度調整系數限制Levy 飛行的搜索范圍,加快尋優速度,改善了二維Tsallis 熵多閾值圖像分割計算量大的問題;賈鶴鳴等[4]采用Kent 混沌映射初始化螢火蟲算法,并利用改進后的優化算法優化了二維Renyi 熵函數中的變量,分割了復雜環境中的污油圖像,提高了圖像分割的準確度;霍星等[5]提出一種新的天牛須算法(Antennae Search Algorithm,BAS)進行二維K 熵下圖像的多閾值分割,將原始BAS 算法拓展為二進制離散形式并將其作為輔助算法與BAS 結合,解決了BAS 易陷入局部最優的不足。 基于二維灰度直方圖的方法比基于一維灰度直方圖的方法計算更加復雜。 灰狼算法(Grey Wolf Optimizer,GWO)是MIRJALILI 等[6]提出的一種新型元啟發式算法,其算法簡單、參數少、易實現,具有良好的搜索和開發能力,已廣泛應用在工程調度[7]、頻譜分配[8]、圖像分割等領域。 劉磊等[9]提出一種改進的灰狼算法(Improved Grey Wolf Optimizer,IGWO),在搜索過程引入萊維飛行機制,避免陷入局部極值;動態調整收斂因子和隨機權重以提高搜索精度,在Otsu 測度下取得了優秀的圖像多閾值分割結果,在這一算法中,灰狼的社會等級劃分是固定不變的,一定程度上限制了算法的收斂性能。
綜上所述,層出不窮的元啟發式算法在處理圖像多閾值分割問題上各有優勢,并且在有效改進策略下優化性能顯著提升。 為充分利用灰狼算法良好的搜索能力并進一步提升算法的收斂速度和計算精度,文章提出融合多種策略的灰狼算法(Grey Wolf Optimizer Fused With Multiple Strategies,MSGWO),對復雜圖像和多目標圖像開展了Renyi 熵多閾值分割;提出動態搜索策略,動態調整迭代初期和后期的頭狼等級劃分方式,對個體位置更新范圍進行前期擴展和后期壓縮,加快尋優速度,克服迭代后期易陷于局部極值的缺陷。 采用所提算法與其他幾種元啟發式算法進行標準圖像的多閾值分割實驗,通過對比迭代曲線、峰值信噪比和特征相似度,證明所提算法的優勢。
Renyi 熵是香農熵的推廣,在香農熵基礎上引入階參數α,對信息的度量更加靈活和具有一般性[10]。 假設N個離散隨機變量X具有概率分布{pk},k為隨機變量編號,k=1,2,…,N,其α階Renyi 熵形式由式(1)表示為
基于Renyi 熵的多閾值圖像分割原理為:假設大小為m×n的灰度圖像記為f(x,y)(1≤x≤m,1≤y≤n),其灰度級數為L,希望將圖像分割為K個目標區域,則需要選取D=K-1 個閾值t1,t2,…,tK-1。此時圖像的Renyi 熵由式(2)表示為
熵衡量了系統的不確定性或平均信息量,閾值分割希望每個分割后的區域內部的灰度是相近的,目標和背景的信息量最大,因此閾值分割的目標函數為最大化各個區域的Renyi 熵,由式(3)表示為
灰狼算法(GWO)是一種新型的元啟發式智能優化算法,通過模擬灰狼的社會階層結構和狩獵行為從而尋找適應函數的最優解。 根據分配任務的不同,將個體分成頭狼、探狼、猛狼,個體間互相協助、共享信息、協同完成覓食任務。 狼群算法通過對當前群體施加游走、奔襲、圍攻3 種智能行為捕獲獵物,從而使群體進化到接近最優解的狀態。 GWO 算法具有良好的廣度開拓和深度開采能力且算法設計簡單,其初始參數較少、收斂速度較快。
狼群的社會等級分為4 級。 狩獵過程中,離獵物最近的3 只狼記為α、β和δ狼,其社會地位最高,其他狼群則記為ω狼,在α、β和δ狼的引領下更新自己的位置。 狼的社會地位并非一成不變,每次位置更新后,狼群將進行一次優勝劣汰,α、β和δ狼隨之更新為當前3 個最優的解,其他候選解ω狼不斷向群體中的3 個最優解移動。 算法的數學模型描述如下:
追蹤獵物過程,首先計算當前灰狼與α、β和δ狼之間的距離和,由式(8)表示為
ω狼的位置更新由式(9)表示為
最終ω狼個體移動后的新位置由式(10)表示為
如式(6)所示的a是收斂因子,按照迭代次數線性遞減,該因子決定了個體更新的幅度。 而線性變化的振幅并不能很好地適應尋優過程,可能導致收斂速度較慢。 分析迭代過程,在初期的隨機分布位置下,大部分個體距離最優點可能較遠,需要更大的步長以便快速靠攏最優位置,在迭代后期,距離最優位置已經比較接近,更小的更新幅度適合局部精細查找,避免出現最優位置附近的震蕩,從而加速收斂、提高算法精度。 為此,文章提出一種變化幅度由大到小的非線性振幅調節因子,由式(11)表示為
式中t為當前迭代次數;M為最大迭代上限。
灰狼算法將狼群分為α、β、δ和ω等4 個等級,每次迭代中α、β、δ狼對應前3 個最優解,引領種群中其他個體ω進化。 文獻[11]提出了3 個等級的改進灰狼算法,將狼群的最低2 個等級合并為一組,以降低計算復雜度,加快收斂。 在新型元啟發算法黑猩猩算法[12]中,個體的更新步驟與灰狼算法類似,不同的是個體的位置更新是同時向驅趕者、攔截者、追逐者和狩獵者4 類黑猩猩的當前位置靠攏。在此啟發下,文章提出一種自適應探索策略,改進灰狼算法。
縱觀整個迭代過程,雖然在求解過程中事先并不知道最優解的位置,但隨著狼群開發和探索,種群的位置是逐步向最優解的位置靠攏的,種群的更新也是逐步細化的。 始終選取α、β、δ3 個最優解位置作為更新方向,并不適應從粗到細的更新變化,因此文章考慮采用動態探索策略,在迭代的初期和末期,采用不同的等級劃分方法。 初期階段,狼群距離最優解位置可能較遠,即便跟隨3 個最優解進行位置更新,個體也是從大方向上向獵物靠攏,此階段所有個體均距離獵物較遠,可以將4 個最優解記為γ狼,與α、β、δ狼共同帶領其他個體進行位置更新,個體位置更新的落點由3 個最優解包圍的范圍擴展到4個最優解包圍的范圍,加大了前期搜索的范圍。 經過多輪迭代后,狼群已經發現獵物并聚集在其附近,此時狼群與獵物之間的距離比較近,適當收縮更新位置落點范圍,以便個體進行精細位置更新,減少計算復雜度,在迭代后期,將帶領等級減小到兩個,即只保留α、β狼2 個高級等級,其他狼均劃為ω狼等級。
自適應探索過程的狼群位置更新過程如下,首先引入距離獵物最近的排名第4 的個體記為γ狼,社會等級位于ω狼之上,計算個體與其之間的距離,并以γ狼為引導,個體向其靠攏,由式(12)和(13)表示為
式中t為當前迭代次數;為第i個個體的更新位置;d(t) 為當前最優解位置與上次迭代的最優解的歐氏距離;和分別為解空間的上、下限。用最優解距離變化為標準,當變化大于空間最大距離的0.01 時,說明該個體距離獵物還較遠,取距離獵物最近的前4 個最優解為引領,擴大了其他個體的位置落點范圍;反之,說明該個體距離獵物較近,取距離獵物最近的前兩個最優解為引領,其他個體均作為ω狼,在收縮的較小落點范圍內進行精細更新。
為了避免在尋優的過程中個體陷入局部極值的問題,在迭代過程中引入個體的柯西變異機制,增大狼群對全局的探索能力。 標準柯西分布比標準高斯分布更加矮寬,具有更大的拖尾,因此容易產生更大的擾動能力,個體按照柯西分布隨機產生較大擾動,變異公式由式(15)表示為
利用Renyi 熵最大化作為圖像分割的目標函數,優化算法通常以尋找最小值為優化目標,因此取Renyi 熵的負值為優化的適應度函數。 多策略融合灰狼算法下的多閾值圖像分割流程圖如圖1所示。

圖1 多策略融合灰狼算法下的多閾值圖像分割流程圖
為驗證文章提出的多閾值分割算法的有效性,選取灰度級為256 的標準測試圖像Lena、cameraman和peppers 作為多目標分割對象,進行不同閾值數量下的分割。 同時,為了說明融合策略灰狼優化算法的尋優效果,選取原始灰狼算法、正弦余弦算法(Sine Cosine Algorithm,SCA)[13]、 蜻蜓算法(Dragonfly Algorithm,DA)[14]、以及新型元啟發式算法的改進——麻雀搜索算法(ISSA)[2]和改進灰狼優化算法(IGWO)[9]作為對比。
設置所有的優化算法種群數為20,最大迭代次數為200,個體每個維度的取值范圍為[0,255]。 所有算法的初始化時隨機生成,實驗結果取重復20 次實驗的均值。 衡量分割的指標采用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR),記作P。 通常,P值越大,圖像的分割效果越好。 計算公式由式(16)表示為
式中f(i,j) 為原始圖像;g(i,j) 為分割圖像;m和n分別為圖像的長和寬。
此外,特征相似性(Feature Similarity,FSIM),記作F,也是衡量圖像分割效果的有效指標,通過相位一致(Phase Congruency,PC) 特征和梯度幅度(Gradient Magnitude,GM)的耦合評估原始圖像與分割圖像的相似度,計算公式由式(17)表示為
式中Ω 為整個圖像空間;x為二維圖像中的像素坐標;SL(x) 為相位一致特征與梯度幅度在x處的融合相似度;PCm(x) 為原始圖像與分割圖像的在x處的相位一致特征的最大值,關于該指標的具體描述可見參考文獻[15];F取值在[0,1],越接近1,圖像越相似。
為說明多策略融合灰狼算法改進的有效性,考查每種改進單獨作用與原始灰狼算法以及MSGWO的迭代過程對比。 以Lena 圖像的3 閾值分割為例,其迭代曲線如圖2 所示。

圖2 GWO 改進方法效果對比圖
由圖2 可見,每一種改進方式單獨作用在GWO時,幾乎都會產生更加低的適應度函數值,除了自適應搜索方法在迭代次數30 附近有個別位置遜于原始GWO,但是后續該曲線迅速收斂到GWO 對應的黑色實線之下。 整體上看,3 種改進策略的MSGWO表現最佳,收斂速度最快且精度也最高,說明改進策略的有效性。
選取不同閾值個數,采用MSGWO 對3 幅標準圖像的分割結果如圖3 所示。

圖3 文章算法對Lena、cameraman 和peppers 的不同閾值下的分割結果圖
第一列圖像為原始圖像,第2 到5 列是閾值個數分別為2、3、5 和6 等4 種情況的分割圖像。 其分割結果直觀地反映了隨著閾值的增加,圖像細節越豐富,則信息越完整,由此也看出多閾值分割的必要性。
為觀察算法的精度和收斂性,對比文章算法與其他元啟發式算法的迭代過程。 選取3 幅標準圖像進行6 閾值的分割,以最小化負的Renyi 熵為優化目標,迭代過程曲線如圖4 所示。

圖4 迭代過程曲線圖
觀察3 幅曲線圖,從迭代過程上看,改進后的優化算法普遍比原始優化算法的收斂性好。 從迭代結果可知,改進算法的精度也普遍優于原始算法,其中DA 算法的精度有時優于部分改進算法,但整體收斂較慢; MSGWO 和ISSA 為精度最好的兩個算法,而MSGWO 相比于ISSA 的優勢在于其快速的收斂性,這一點在迭代初期表現很明顯,MSGWO 的曲線明顯地處于最低位置。 以Lena 圖像為例,ISSA 的迭代曲線收斂也很迅速,在迭代60 次后達到-22.72 bit的最小適應度值,而收斂到相同適應度值,MSGWO 僅需迭代15 次,迭代次數節省75%;cameraman 圖像中,ISSA 迭代49 次收斂到最小適應度值-24.65 bit,MSGWO 僅用10 次,迭代次數節省82.1%;peppers 圖片中,ISSA56 次收斂到最小適應度值-20.56 bit,MSGWO 僅用36 次,迭代次數節省35.7%;迭代次數平均可減少64.3%。 因此,MSGWO是收斂速度快且精度高的多閾值求解方法。
為更加客觀地對比幾種元啟發式算法在多閾值圖像分割上的性能,將4.3 節中精度較高的3 種算法——ISSA、IGWO、GWO 和所提算法MSGWO 進行峰值信噪比和特征相似性指標的對比,分別用3 和6 閾值對3 幅標準圖像多閾值分割,兩項指標的統計見表1。

表1 峰值信噪比和特征相似性指標統計表
觀察表中數據,峰值信噪比和特征相似性指標并非完全分布一致,因為峰值信噪比單純計算圖像灰度值差異,而特征相似性結合相位一致性和梯度的特征,可以描述圖像中的感興趣區域,往往認為其是比峰值信噪比更好的圖像相似性評價指標,MSGWO 可以取得至少一個指標下的最高分,不失為一種穩定優質的多閾值分割方法。
通過上述研究可知:
(1) 通過消融實驗,在灰狼算法上單獨實施了3 種改進措施,即非線性收斂因子、自適應搜索機制和柯西變異。 其均提高了灰狼算法的收斂性和精度,3 種改進策略融合可以實現優勢疊加,得到更高的收斂性和精度。 表明文章提出對灰狼算法的3 種融合改進策略可以有效提高收斂性和精度。
(2) 多閾值分割對比了MSGWO 與其他新型元啟發式算法。 從分割結果上看,MSGWO 可取得峰值信噪比和特征相似性中至少一項指標的最高分,分割精度高。 從分割過程看,MSGWO 具有更加快速的收斂性,達到與次優算法相同的最小收斂值,MSGWO 的迭代次數平均可節省64.3%。