賈鶴鳴 姜子超 彭曉旭 康立飛 李 瑤 孫康健
(東北林業大學機電工程學院 黑龍江 哈爾濱 150040)
圖像分割是圖像分析的關鍵步驟,是圖像標識和描述的必要前提和基礎,因此分割方法的選擇和分割精度是極為重要的[1]。現有的分割算法多基于邊緣、區域、閾值及特定理論等。閾值圖像分割法運算效率高、性能較穩定,是目前最廣泛應用的一種分割方法。閾值分割法的基本理論是依據某一準則求出最佳閾值,并進行像素點比較,將目標和背景區域區分出來。單閾值分割基本思想是按閾值把直方圖分割成目標和背景兩類,而多閾值分割則是將圖像分成多個類,使得多個類的類間方差最大[2]。因為單閾值分割圖像效果不夠理想,所以近些年研究學者多采用迭代的方式將其研究領域延伸至多閾值分割。
經典Otsu算法本質上是進行窮舉搜索,如果采用窮舉法進行多閾值的搜索,總計算量較大。利用類間方差最大化思想,可以將圖像的多閾值分割問題轉化為求最優閾值的目標函數優化問題,因此,為縮短運算時間,提升效率,可選用算法優化思想進行多閾值選取過程。但由于優化算法本身的局限性,在分割圖像時仍存在求解質量低、容易陷入局部最優等問題。
鬣狗算法(SpottedHyenaOptimizer,SHO)是印度塔帕爾大學GauravDhiman教授于2018年基于非洲斑點鬣狗種群覓食機制提出的一種新型群智能優化算法,主要通過模擬斑點鬣狗種群的捕食行為特性來達到優化搜索的目的。SHO算法操作簡單、設置參數少、穩定性強、求解精度更高,因其性能良好,已經開始被應用于解決非線性連續優化問題等多個工程領域。但由于其全局搜索能力和局部搜索能力僅通過B和E兩個隨機參數進行動態調節,且這兩個階段種群位置更新公式未進行明顯區分,SHO算法不可避免地存在易陷入局部最優解、求解質量低等類似缺陷,而在復雜優化問題中,大多要求優化算法盡可能遍歷到全局最優解可能的分布范圍[3]。所以SHO仍存在局部最優、復雜優化效果不良等缺陷。
針對標準SHO算法受隨機因子的影響而導致的全局優化效果差、收斂效率不良、求解速率與質量低等問題,本文提出一種改進鬣狗算法ISHO,并將其應用到多閾值圖像分割領域。通過引入混沌初始化策略、非線性收斂因子調整策略、萊維飛行策略以及精英反向學習策略,來提高算法在解決復雜性問題時的尋優效率及求解精度。為檢驗鬣狗優化算法及改進的鬣狗優化算法在圖像多閾值分割方面的可行性及分割精度的優越性,選取6幅經典伯克利圖像進行多閾值分割實驗,利用分割時間、適應度值、PSNR值、FISM值等指標評價分割效果,對比粒子群優化算法(particleswarmoptimization,PSO)、正余弦優化算法(sine-cosineoptimizationalgorithm,SCA)、灰狼優化算法(greywolfoptimizationalgorithm,GWO)、鯨魚優化算法(whaleoptimizationalgorithm,WOA)、標準SHO等五種優化算法,實驗結果表明:ISHO算法在分割速度及效率上具有明顯優勢,且圖像失真度較小,分割效果較好,有利于圖像提取的后續處理。

(1)
(2)
(3)
則目標函數可以描述為:

(4)
Otsu最佳閾值的定義為:
(5)
鬣狗種群的捕食機制包括搜索、包圍、狩獵和攻擊獵物四個過程[5]。鬣狗算法的基本原理如下:
(1) 包圍機制:鬣狗具有熟悉并判斷獵物的位置,從而包圍它們的能力。該行為的數學模型為:
Dh=|B·Pp(t)-P(t)|
(6)
B=2·r1
(7)
式中:Dh表示鬣狗個體與獵物之間的距離;t表示當前迭代次數;Pp表示獵物的位置;P(t)表示鬣狗種群中的個體位置;B表示搖擺因子;r1表示[0,1]之間均勻分布的隨機數。
鬣狗的個體位置更新如下所示:
P(t+1)=Pp(t)-E·Dh
(8)
E=2·h·r2-h
(9)
(10)
式中:E表示收斂因子;r2表示[0,1]之間均勻分布的隨機數;h表示控制因子,隨迭代次數的增加線性遞減,變化范圍為[0,5];Iteration表示算法運行當前迭代數目,其中Iteration=1,2,…,NI;NI表示最大迭代次數。
(2) 狩獵機制:斑點鬣狗通常依靠可信賴的種群網絡及識別獵物位置的能力來生活和分組捕殺。該機制的具體描述如下:
Dh=|B·Pp(t)-Pk|
(11)
Pk=Ph-E·Dh
(12)
Ch=Pk+Pk+1+…+Pk+N
(13)
式中:Ph定義了第一個最佳斑點鬣狗的位置;Pk表示其他斑點鬣狗的位置;N表示斑點鬣狗的數量;Ch是N個最優解的集群。其中N計算如下:
N=Countnos(Ph,Ph+1,Ph+2,…,(Ph+M))
(14)
式中:M是[0.5,1]中的隨機向量,在添加M之后,nos定義可行解的數量并計算所有候選解,其與給定搜索空間中的最優解相似。
(3) 攻擊獵物(局部搜索):鬣狗在獵食的最后階段開始攻擊獵物,當收斂因子|E|<1時,鬣狗個體便會向獵物發動攻擊。全局最優解通過求取當前最優解集的平均值來確定鬣狗搜索個體的更新趨勢。攻擊獵物的數學公式具體描述如下:
(15)
式中:Ph(t+1)為保存最優解;Ch表示最優解群集。
(4) 搜索機制(全局探索):鬣狗大多根據位于最優解群集Ch中的鬣狗群或群集的位置來搜尋獵物,當收斂因子|E|>1時,鬣狗會分散并遠離當前獵物,搜索更適合的獵物的位置,這種機制使得SHO算法能夠在全局進行搜索。
混沌理論因為具有強大的遍歷性、敏感性和非重復性而被廣泛引入群智能算法中用以增強種群多樣性以改善其優化性能。與隨機搜索相比,它可以以更高的概率和速度對搜索空間進行徹底搜索。目前群智能算法文獻多采用Logistic映射產生混沌序列,但均勻性較差。相比Logistic映射,Tent映射結構簡單,迭代速度快,具有更好的遍歷均勻性[6]。
因此,本文在鬣狗算法迭代初期進行混沌初始化,選用Tent映射產生的混沌序列來改進SHO算法,基于混沌Tent映射理論產生鬣狗種群的初始位置,使其均勻地分布在搜索空間內,以增加個體的多樣性,增大跳出局部最優的概率和對解空間進行深入搜索的能力,有助于提高求解效率和質量[7]。Tent映射數學表達式為:
(16)
經伯努利位移變換后可得:
yt+1=(2yt)mod1
(17)
標準鬣狗優化算法的控制因子h采用的是線性遞減策略,但是算法迭代過程實質上是非線性變化的,控制因子h線性遞減的方式不能準確地體現出實際的優化搜索過程。因此,本文引入一種新的遞減方式,具體描述如下所示:
(18)
式中:t為當前迭代次數;NI表示最大迭代次數;Q表示衰減系數,取值范圍為[0,10]并取整,Q越大,對應的控制因子h衰減越劇烈。改進后的控制因子h隨著迭代次數從5到0呈非線性遞減。在迭代初期,改進后的控制因子h遞減緩慢,呈漸進搜索狀態,衰減性優于原始的控制因子,便于更好地尋找全局最優解。在后期,改進的控制因子h的衰減程度開始提高,搜索速度加快,并向最優解靠近,有助于提高搜索到的局部最優解的精確性。因此,這種非線性收斂因子更符合算法的實際收斂過程,進一步增強了算法全局尋優能力[8]。
萊維飛行策略屬于一類非高斯隨機過程,其特點是隨機性比較強,飛行的步長滿足一個重尾的穩定分布。在飛行過程中,前期大步長后期小步長,不僅擴大了種群的多樣性,也使種群在小范圍內可以更好地收斂于全局最優解。萊維飛行位置更新公式為:
xi(t+1)=xi(t)+α⊕Levy(s)i=1,2,…,n
(19)

Levy(s)~u=t-1-β
(20)
式中:s表示步長,指數變量取值范圍一般為0<β≤2,本文取值β=1.5。
(21)
式中:u、v均服從標準正態分布:
(22)
(23)
式中:Γ為積分運算,是標準的Gamma函數。
研究表明,萊維飛行可以避免出現局部徘徊現象,引入萊維飛行,可以擴大種群的多樣性以及種群搜索范圍,有助于算法跳出局部最優,提高算法的尋優能力,從而達到提高全局最優的目的[9]。因此,為了增強鬣狗個體之間的信息交流,將萊維飛行策略引入鬣狗優化算法中,并作用于隨機因子r1和r2中。鬣狗優化算法引入萊維飛行策略后的包圍機制具體描述如下:
Dh=|B·Pp(x)-P(x)|
(24)
P(x+1)=Pp(x)-E·Dh
(25)
搖擺因子:
B=2·Levy·r1
(26)
收斂因子:
E=2·h·Levy·r2-h
(27)
(28)

(29)
式中:常數因子α∈U(0,1);(LBj,UBj)表示第j個決策變量的動態邊界。
LBj=min(xi,j)
(30)
UBj=max(xi,j)
(31)
式中:min(xi,j)、max(xi,j)分別表示鬣狗種群中第j維個體的最小值和最大值。
在精英反向學習策略中,可通過對常數因子α隨機取值生成多個不同的反向精英鬣狗個體來構造反向精英鬣狗種群,這樣有利于搜索反向精英鬣狗個體所處的領域空間,提高算法的局部搜索能力。當反向解超出范圍(LBj,UBj)失效時,需要在邊界內生成一個隨機位置來進行越界復位操作,具體描述為:
xj=rand(0,1)·(LBj,UBj)
(32)
算法執行過程中,EOBL策略擇優保留最優鬣狗個體,不代表每一次迭代都會進行更新。重復無篩選地進行反向學習,會增加計算量,影響算法收斂速度,此時最優鬣狗個體更新效果會下降。因此,本文引入執行精英反向學習的概率p1對反向學習的執行前提加以有效控制,取值為0.6。改進后的鬣狗優化算法基本思想是:當隨機數小于p1設置值時,則執行精英反向學習策略,反之則不執行。此時的新解更新機制具體描述如下:
(33)
式中:rand表示[0,1]上均勻分布的隨機數。
改進的鬣狗算法流程圖如圖1所示。

圖1 改進鬣狗優化算法
采用改進鬣狗優化算法結合Otsu多閾值分割思想對伯克利彩色圖像進行有效處理,并將該方法與PSO、SCA、GWO、SHO及WOA等算法的分割效果進行對比,驗證所選改進算法的可行性。
(1) 峰值信噪比(PSNR)。計算比較分割后圖像與原圖的PSNR值,PSNR值越大,則失真越少,說明該算法在多閾值分割應用上的性能越好[12-13]。PSNR計算過程如下:
(34)
(35)

(2) 特征相似性(FSIM)。特征相似性為一種基于圖像的相位一致性與圖像的空域梯度特征來評價圖像質量的指標[14]。
(36)
式中:SL(x,y)用來評價圖像的相似性;PCm(x,y)表示相位相似性;x∈X、y∈Y表示圖像的整個空域。
為減小算法隨機性的影響,提高實驗的公平性,實驗仿真環境均設置為Windows7系統,Intel(R)pentium(R)CPUG3260,內存均為3.30GHz,仿真軟件為MATLAB R2014b。實驗中測試函數決策變量的維數均設置為30,最大迭代次數設置為10000,種群規模設置為30。所有算法的參數設置如表1所示。

表1 算法參數設置
為檢驗鬣狗優化算法及改進的鬣狗優化算法在圖像多閾值分割方面的可行性及分割精度的優越性,選取6幅伯克利經典圖像進行多閾值分割實驗,采用優化算法對最佳閾值分割點進行尋優,獲得每幅圖像的最佳閾值及其他評價指標值,并與PSO、SCA、GWO、WOA、SHO等算法進行比較。通過算法的分割時間、最佳適應度值、PSNR值和FSIM值四種性能指標來評估ISHO算法的性能與其他五種的差異。伯克利測試圖像如圖2所示。

(a) Starfish (b) Dog (c) Horse

(d) Tiger (e) Bridge (f) Flower圖2 伯克利經典圖像
所有圖像分割后的實驗結果依次為閾值n={2,3,4,5}時采用PSO、SCA、GWO、WOA、SHO及ISHO算法分割后的結果,表2、表3、表4及表5分別為基于Otsu的PSO、SCA、GWO、WOA、SHO及ISHO算法的分割時間、最佳適應度值、PSNR值和FSIM值。

表2 各算法分割時間 s

表3 各算法最佳適應度值

續表3

表4 各算法PSNR值

表5 各算法FSIM值
(1) 分割時間:對比分析表2的算法分割時間可以發現,6種算法的分割時間在閾值數目相同時,GWO算法分割時間最短,WOA、SHO和ISHO算法時間相近,PSO算法耗費時間遠長于其他算法。隨著閾值數目的增加,計算量增大,算法復雜度呈指數次冪增長趨勢,運行時間也隨之增加,當閾值數目n=3、4、5時,PSO算法所用時間明顯增加,依舊大于其他算法,ISHO算法分割時間和效率仍保持一定優勢。實驗表明,同PSO、SCA、GWO、WOA及SHO算法相比,ISHO算法在分割速度及效率上具有明顯優勢,能夠快速完成彩色圖像多閾值分割的任務。
(2) 適應度值:由表3可知,分割閾值數目相同時,6種算法的求解質量(適應度值)相近,其中PSO和ISHO的適應度值差距極小,求得的最優閾值基本相同。
(3) PSNR值:結合表4可知,當閾值數目n=2時,所有算法的PSNR值基本一致,分割后圖像效果基本一致,差別不明顯,隨著閾值數目的增多,當閾值數目n等于3、4、5時,6種算法的PSNR值大小順序為ISHO>SHO>GWO>SCA>PSO>WOA,ISHO算法的分割性能優于其他算法。
(4) FSIM值:由表5可知,隨著閾值的增加,6種算法分割后圖像的FSIM數值均逐漸增加,ISHO算法分割后的特征相似性指標FSIM數值較大,說明分割后的圖像與原圖的相似度較高,圖像失真度較小,分割效果較好。
實驗結果表明,改進鬣狗優化算法能取得與粒子群等群智能算法等同的分割效果,在閾值較多時不易早熟,穩定性更好。與PSO、SCA、GWO、SHO及WOA算法相比,收斂速度更快,閾值尋優質量較高,且不易陷入局部最優,彩色圖像多閾值分割效果較好,分割后的目標圖像更加適合后續的圖像處理。
鬣狗優化算法具有原理簡單、收斂速度快等優點,同時也存在諸多不足,如在高維復雜優化問題時存在全局搜索能力差、易早熟,以及傳統多閾值圖像分割方法中存在的閾值選擇不準確、求解效率低等問題。針對這些不足,本文通過引入混沌初始化策略、非線性收斂因子調整策略、萊維飛行策略及精英反向學習策略,提出了改進的鬣狗優化算法,并通過伯克利經典圖像分割測試,驗證改進后算法的高效性和可行性。實驗結果表明ISHO具有較強的工程實用性。