倫向敏,侯一民,2
(1.東北電力大學 自動化工程學院,吉林 吉林132012;2.佐治亞大學 計算機系,喬治亞州 雅典城30605)
目前常用的圖像自動閾值分割方法較多,例如基于區域的圖像分割[1-3]、基于邊緣的圖像分割[1,4]、大津分割[5]、不變矩分割[6],此外,最大熵分割也廣泛應用。
熵是衡量系統混亂程度的量,一個系統自然發展的過程,是一個熵增加的過程,也就是說,系統的發展是趨于無序的,是能量的均衡的過程[7,8]。當系統達到平衡,則熵達到最大。
香農將熵的概念引入到信息論中,將熵定義為如下形式

式中:H——整個系統或者過程的熵值,i——系統或者過程中的隨機事件,因此,p(i)是指某隨機過程在整個系統或者過程中出現的概率,log是取對數函數[9,10]。
在信息論中,熵值代表了整個系統或過程的無序性,也代表了信息分部的均勻程度,信息分部越均勻,則系統的熵值就越大。在進行圖像分割的時候,往往將整個圖像看作系統,圖像中的像素值視為系統中的各個隨機過程。在一般的圖像中,往往都包含兩個部分,即目標和背景,圖像分割就是將圖像的目標和背景區分開來的過程,而目標和背景都在圖像中占有一定的比例,包含了大量的信息。在圖像分割的過程中,如果信息分部的越均勻,說明分割結果越趨于合理。最大熵分割符合了以上的假設,即,在分割過程中,盡量使整個圖像分割結果的熵值達到最大。最大熵分割等自動閾值選取的優點是無需操作者自行選擇分割閾值。但很多時候自動選擇的閾值并不能滿足分割結果的需求,其主要的問題是一些圖像的細節部分不能充分分割出來。
本文提出了一種基于最大熵分割的迭代分割方法,其主要目的是針對圖像中的細節部分進行分割,在最大熵分割的基礎上,自動選擇更加準確的閾值,提高圖像細節部分的分割效果。本方法將最大熵分割在圖像數據中運行,并將分割結果中的待定部分作為下一次迭代的數據源,通過多次運行最大熵分割方法最終求取分割閾值。實驗中通過多幅常用圖像,體現了本文的分割方法的對圖像細節部分的分割效果。
二維灰度圖像的最大熵二值分割過程中,將圖像像素看作整個系統中的一個隨機過程,那么根據信息論中熵的定義,給定圖像之后,圖像的熵就已經可以根據式 (2)計算得到

式中:his(i)——圖像直方圖中像素值出現的概率。
而最大熵分割并不是指整個原始圖像的熵,而是分割之后的熵。其標準是圖像分割完成之后,目標部分的熵加上背景部分的熵,其和值達到最大。可以用式 (3)表示熵值之和

則最佳的分割閾值Th滿足如下條件

以上的分割過程中,根據最大熵原理分割之后,如果準確的將目標和背景分割開,則目標類和背景類中,像素值的分布都達到最均勻,因此兩部分的熵之和達到最大;反之,如果分割不準確,則目標類中存在背景數據,或者背景類中存在目標數據,則混合類中的像素分布就不能達到最均勻,其熵值也不能達到最大。
在灰度圖像的二值分割中,分割閾值Th分布在目標和背景兩類中間,可以將大部分的目標和背景像素分割開來。但圖像中經常有細節部分,其像素值處于分割閾值Th 附近,此時分割閾值的準確性就決定了圖像中這些細節部分的分割效果。如圖1所示,圖中左邊為原始的圖像,為斑馬魚 (Zebrafish)圖像;中間為圖像直方圖,根據最大熵分割方法,選擇最佳閾值為128,如圖中黑線所示;右邊為最大熵分割結果。由圖中可以看出,原始圖像中,較為重要的細節部分,即魚的尾部的邊界 (如圖中圓環中部分),魚的脊髓 (如圖中橢圓部分),分割結果并不理想。

圖1 原始最大熵分割實例
根據以上敘述,原始的最大熵分割方法并不能滿足圖像中細節部分的要求,可能會丟失很多重要的細節信息。因此,本文提出了迭代最大熵分割方法解決此問題。
根據最大熵分割的描述,可以自動選擇圖像分割閾值,但是在選定的閾值附近的像素,可能會體現一些圖像細節,如果閾值選擇不準確,則會影響圖像細節部分的分割結果。本文提出了一種迭代的最大熵分割方法。方法中,在整個圖像領域內迭代使用最大熵分割,最終選定分割閾值。具體的流程可以描述為:①針對整個圖像進行最大熵分割,選定閾值Th(1),計算目標與背景兩類的均值U1(1),U2(1);②選定圖像像素值域中小于U1(1)的像素為一類,大于U2(1)的像素為另一類,將剩余部分,即大于等于U1(1)且小于等于U2(1)的像素視為下一次迭代的數據源;③利用該數據源作為下一次迭代的分割目標,重復步驟①和步驟②,直到滿足迭代結束條件。
如何定義迭代完成的條件是本算法中的關鍵問題。本文中提出了如下的迭代結束條件:由于給定了圖像之后,就可以計算圖像的統計信息,經過每一次迭代,都會有一些圖像中的像素被確定分類。兩類的均值之間的距離不斷減少,最佳分割閾值的變化也不斷減小。因此,本文以最佳閾值的變化作為迭代結束條件,在以下的實驗中,采用了8位灰度圖像,其像素值域為0至255,當第n+1次迭代最佳分割閾值相對第n次迭代的最佳分割閾值變化少于3的時候,則結束迭代。以上迭代步驟可以描述為如圖2所示的流程。

圖2 迭代最大熵分割方法流程
根據以上的迭代分割方法,針對圖1中的原始圖像進行分割,結果如圖3所示。
由圖3可以看出,原始的最大熵分割確定了最佳的閾值為128,分割結果中并未將原始圖像中細節部分體現出來,如圖1中第一次分割結果所示。隨著迭代次數的增加,分割閾值發生了一定的變化。第二次迭代的分割閾值變為135,第三次分割閾值變為157,第四次閾值結果為162,最后一次迭代結果為176。經過5次迭代,待定區域的像素比例不斷減少,如圖3的最后一個分割結果所示,第一次迭代后,待定區域的比例為53%,第二次迭代待定區域比例為27.3%,第三次迭代待定區域比例為11.2%,第四次迭代待定區域比例為5.39%,最后一次迭代待定區域比例為2.92%。最后一次迭代結束,分割結果已經能夠體現Zebrafish的一些細節信息了,例如外形及脊髓,如圖3中最后的分割結果所示。
本文采用了3幅圖像作為實驗數據,其中包括了一幅人工合成圖像,兩幅自然圖像。
在圖4所示的實驗中,采用了人工合成的圖像作為實驗對象。其中第一幅為原始圖像,圖像所有像素被分為幾類并加入了高斯噪聲,最終得到的原始圖像的直方圖如最后一幅圖所示。共有5類,其中4類加入了高斯噪聲,另一類是值為255的像素。5類中的4類像素比例與另一類相差較大。經過原始的最大熵分割,之后進行迭代,經過6次迭代得到最終分割結果。從結果可以看出,經過多次迭代之后,最終的分割結果最接近手動分割結果。

圖3 迭代最大熵分割方法實例
第二組實驗采用的是細胞圖像ipexcell。圖5第一幅為原始細胞圖像,經過第一次最大熵分割之后得到了如第二幅小圖所示的結果。圖中細胞體并未完整的體現在分割結果中,因此,采用了迭代最大熵分割方法,經過5 次迭代之后,得到了如第6幅小圖所示的結果。其中的閾值變化如直方圖中所示。

圖4 合成圖像迭代最大熵分割方法結果

圖5 細胞圖像迭代最大熵分割方法結果
本文提出了一種迭代的最大熵分割方法。主要思想是針對灰度圖像,多次運用最大熵分割方法優化分割閾值,最終得到分割結果。其主要目的是更加準確的體現一些像素值處于分割閾值附近的圖像細節。運用本文的方法共進行了4組實驗,包括了斑馬魚圖像,細菌圖像,細胞圖像和人工合成圖像的分割,結果體現了迭代的最大熵分割方法較之原始的最大熵分割,在優化分割閾值上有很大的優勢,能夠經過多次分割體現圖像中一些不易分割的細節部分。
[1]KONG Dingke,WANG Guozhao.Region-similarity based active contour model for SAR image segmentation [J].Journal of Computer-Aided Design &Computer Graphics,2010,22 (9):1554-1562 (in Chinese).[孔丁科,汪國昭.基于區域相似性的活動輪廓SAR 圖像分割 [J].計算機輔助設計與圖形學學報,2010,22 (9):1554-1562.]
[2]WU Shilin,GENG Jiajia,ZHU Feng,et al.Region-based multi-class object recognition and segmentation [J].Journal of Image and Graphics,2011,16 (9):1607-1616 (in Chinese).[吳士林,耿佳佳,朱楓,等.基于區域的多類目標識別與分割算法研究 [J].中國圖象圖形學報,2011,16 (9):1607-1616.]
[3]Wang Lingfeng,Pan Chunhong.Robust level set image segmentation via a local correntropy-based K-means clustering [J].Pattern Recognition,2014,47 (5):1917-1925.
[4]Qi Donga,Liu Yanli,Zhao Qijun,et al.Detecting soft shadows in a single outdoor image:From local edge-based models to global constraints[J].Computers & Graphics,2014,38:310-319.
[5]ZHAO Xiangwen,JIN Guowang,XU Jingxuan,et al.Pseudo-color quantization of SAR data based on multi-threshold Otsu method of histogram segmentation [J].Journal of Zhengzhou Institute of Surveying and Mapping,2012,29 (6):445-450(in Chinese).[趙向文,靳國旺,許競軒,等.基于多閾值大津法直方圖分割的SAR 數據偽彩色量化方法 [J].測繪科學技術學報,2012,29 (6):445-450.]
[6]Marin D,Aquino A,Gegundez-Arias ME,et al.Supervised method for blood vessel segmentation in retinal images by using gray-level and moment invariants-based features [J].IEEE Transactions on Medical Imaging,2011,30 (1):146-158.
[7]Jose S Canovas,María Munoz Guillermo.Computing topological entropy for periodic sequences of unimodal maps[J].Commun Nonlinear Sci Numer Simulat,2014,19 (9):3119-3127.
[8]Umberto Lucia.Entropy generation approach to cell systems[J].Physica A:Statistical Mechanics and its Applications,2014,406 (15):1-11.
[9]Sun Lin,Xu Jiucheng.Information entropy and mutual information-based uncertainty measures in rough set theory [J].Applied Mathematics &Information Sciences,2014,8 (4):1973-1985.
[10]Dai Jianhua,Tian Haowei.Entropy measures and granularity measures for set-valued information systems[J].Information Sciences,2013,240 (10):72-82.