付永強,宋麗華,李也白,馬 禮
(北方工業大學 計算機學院,北京 100144)
?
基于DTBNN的雙閾值圖像分割方法
付永強,宋麗華,李也白,馬禮
(北方工業大學 計算機學院,北京 100144)
為了能夠實現動態無灰度特征峰值的圖像分割,提出一種基于決策樹的神經網絡(Decision Tree Based Neural Network,DTBNN)雙閾值圖像分割方法。該方法首先運用決策樹與神經網絡的對應關系,構建出穩定、訓練高效的神經網絡;然后通過實驗采集的圖像提取圖像灰度均值,最大灰度偏差與閾值映射函數作為樣本數據訓練神經網絡;最后采用訓練好的神經網絡對被測圖像進行閾值映射函數篩選,并計算出被測圖像的上下灰度閾值,完成對圖像的雙閾值分割。仿真實驗表明,該方法不依賴于灰度直方圖的峰值特征并能獲取較好的上下限分割閾值,與最大類間方差雙閾值法和最大熵雙閾值法比較,能夠在動態圖像中實現雙閾值分割。
DTBNN;雙閾值;圖像分割
圖像分割技術的關鍵是將被識別物從背景環境中分離出來,通常的分割方法有基于閾值、基于邊緣提取和基于區域的圖像分割方法。其中以基于閾值的圖像分割方法最為常見,因其算法簡單、效率高而被廣泛應用于圖像處理中。閾值分割又可分為全局閾值分割和局部閾值分割,其算法主要有最大類間方差法(又稱為Otsu法)、最大熵法和模糊熵法。這些閾值分割算法可以采用單閾值和多閾值進行圖像分割。由于單閾值圖像分割是用一個閾值將圖像劃分為兩個灰度級部分,有時不能有效地將目標物體從圖像中分割出來。雙閾值圖像分割是通過劃分上限和下限并提出兩個閾值中間灰度域作為有效區域, 能夠更有效地將目標物體從圖像中分割出來。
在雙閾值圖像分割算法中,基于Otsu的雙閾值圖像分割及其改進算法[1-2]使用較為普遍,但是Otsu算法對圖像直方圖具有三峰特征值的圖像具有較好的分割結果,而對其他情況下的圖像分割效果不佳。基于最大熵的雙閾值圖像分割及其改進算法[3],由于其依據的是使圖像中目標與背景的總熵最大,所以在圖像處理過程中仍然需要灰度直方圖中具有三峰值特征。基于模糊熵及其改進的雙閾值圖像分割算法[4-5]是通過隸屬度函數確定暗、灰、亮三部分的范圍,但在動態圖像中無法有效確定隸屬度函數,所以不能用于動態圖像分割。另外還有基于二分灰度直方圖的多閾值分割算法[6],此方法仍然建立在最大類間方差的基礎上,對目標閾值的劃分也依賴于灰度直方圖的峰值特征。
在本文所提及的實際工程中,需要對旋轉物體圖像提取有效特征信息,但是由于環境光在旋轉面的反射成像,隨著旋轉物體旋轉角度的不同,使得在采集的圖像中灰度直方圖變化較大且有時不存在明顯峰值特征。基于以上應用背景和實際工程需要,本文提出一種基于決策樹的神經網絡(Decision Tree Based Neural Network, DTBNN)算法的雙閾值圖像分割方法,該方法在實際應用中表現出良好的圖像分割效果。
人工神經網絡(Artificial Neural Network,ANN)已經被廣泛應用于識別和分類算法中,其能夠通過有師學習或無師學習的方式,達到類似生物神經網絡的信息處理和分類的效果。本文中采用的BP(Back Propagation)神經網絡,即在前向神經網絡的基礎上增加逆向學習能力,在本文中簡稱神經網絡。該模型是一種按誤差逆向傳播訓練的多層前饋網絡,其網絡拓撲結構包括輸入層、隱層和輸出層。通過最速下降法學習使得在神經網絡中存儲大量的從輸入到輸出的映射關系,建立好的神經網絡通過這些映射關系可以對輸入信息做出推理和分類。在圖像識別的分類技術中也經常用到神經網絡,如人臉識別、分類篩選等,這些都是用以分類而滿足識別的,但本文提出將訓練后的神經網絡應用在圖像閾值函數的分類篩選過程中。
由于神經網絡結構和初始參數值在設計上較為困難,并嚴重影響網絡的性能,李愛軍等人在深入研究SETHI I K的熵網絡[7]基礎上提出基于決策樹的神經網絡(DTBNN)算法[8],并通過“異或”問題和多類問題驗證分析其有效性。決策樹算法是通過決策對象的屬性進行分類學習;神經網絡算法是通過神經元之間的權重關系分類學習。盡管兩者的機制不完全相同,但是決策樹與神經網絡存在一定的對應關系。李愛軍等人提出將決策樹的內部節點數與神經網絡的輸入層神經元數相對應,將決策樹的葉子節點數對應于隱層神經元數,將決策樹的分類數對應于輸出層的神經元數,將決策樹中的連接與神經網絡的神經元間連接相對應,將決策樹中的連接權重與神經網絡的連接權重相對應。圖1表示兩者之間的對應關系,矩形表示決策樹,橢圓形表示神經網絡。

圖1 決策樹與神經網絡對應規則
根據圖1展示的對應規則,可以利用決策樹構造出神經網絡的層次結構以及初始化參數值。N個決策樹內部節點對應神經網絡N個輸入層神經元;M個決策樹葉節點對應神經網絡M個隱層神經元;D種決策樹分類策略對應D個輸出層神經元;L個決策樹內部連接對應L個神經元連接;決策樹連接權重W對應神經元間連接權重W。
由于DTBNN中隱層神經元個數是通過決策樹的葉節點決定的,所以導致構建的隱層神經元復雜并且容易出現神經網絡過擬合現象。因此劉棟等人通過對信息熵最大增益原理的研究,提出DTBNN中隱層神經元的個數可以由決策樹的深度決定[9]。即在一棵決策樹中,存在一條從根節點到葉節點間的最長合取鏈,該鏈的長度為樹的深度。當神經網絡中隱層神經元的數目取決策樹最大合取鏈長度時,網絡效果最佳,同時既不會出現不正確的分類,也不會出現過擬合的現象。劉棟通過“異或問題”和“醫學分類問題”兩個實驗分別驗證了此改進算法的有效性。
根據參考文獻[8]、[9]所提出的基于決策樹的神經網絡構建方法,本文對DTBNN構建方法進行適當改進之后,應用在圖像閾值分割的神經網絡構建過程中。提出決策樹與神經網絡之間的對應規則:(1)決策樹的分支條件數對應神經網絡輸入層神經元個數;(2)決策樹的深度對應神經網絡隱層神經元個數;(3)決策樹的分類數對應神經網絡的輸出層神經元個數;(4)決策樹中的連接對應神經元間的連接。
2.1雙閾值圖像分割
設大小為X×Y的數據圖像,其灰度值f(x,y)取0, 1, 2, … ,L-1,L表示圖像的灰度級,本文取256。令Di={(x,y):f(x,y)=i,(x,y)∈D},hi=ni/N,其中D為圖像像素全體集合域,i=0, 1, … ,L-1為灰度值,Di表示圖像中屬于灰度i的像素集合,ni表示Di中圖像像素的個數,N=X×Y為總像素個數,hi為灰度i的概率分布。則H={h0,h1, … ,hL-1}表示圖像的灰度直方圖。
本文采用雙閾值分割圖像,利用閾值門限t1和t2將圖像域D分割為Dl、Dt、Dm三個域。其中Dl為非目標域,灰度級低的部分;Dt為目標域,灰度符合閾值范圍的部分;Dm為非目標域,灰度級高的部分。即Dl={(x,y):f(x,y)≤t1,(x,y)∈D},Dt={(x,y):t1 (1) 另外,從圖像灰度直方圖中可以得到兩個基本特征信息:灰度均值和最大灰度偏移,分別用M和S表示。灰度均值M是圖像中所有灰度級與其概率分布的乘積和,在灰度直方圖中表現為圖像整體灰度趨向性,其值越小表明圖像整體偏暗,反之則偏亮。最大灰度偏移S是圖像中存在的任意灰度級與灰度均值M差的最大值,在灰度直方圖中表現為峰值(或谷值)與灰度均值的差,其值反映明暗變化度。計算公式如式(2)所示。 (2) 因為M和S分別表征了圖像中的灰度趨向性和相對變化差,則對于工程中要分割的灰度圖像存在函數映射關系T=G(m,s),其中T為閾值t1和t2構成的一維向量且有t1 (3) 2.2構建DTBNN 在[8]、[9]所研究的DTBNN算法基礎上,本文提出建立在雙閾值圖像的DTBNN構建方法。本文設計的 DTBNN構建步驟如下: (1)根據決策樹與神經網絡對應規則,確定神經網絡的層數、輸入和輸出神經元數; (2)以最大合取鏈確定神經網絡的隱層神經元數; (3)按照規則設置網絡參數初始值; (4)為神經網絡中各神經元添加連接; (5)對神經網絡進行訓練。 由式(3)可知,圖像灰度均值m和圖像最大灰度偏移s與分割閾值映射函數G之間形成對應分類關系。由這種分類關系可以生成一棵多分支的分類決策樹,邏輯示意如圖2,mi為第i類的灰度均值范圍域,si為第i類的最大灰度偏移范圍域,Gi為i類的映射關系函數。圓形節點為決策樹的內部判定節點,m和s在各自范圍域內構成判定分支,方形節點為決策樹的分類信息。根據工程中圖像特點,將滿足{Gi(m,s):50≤m<200,20≤s<150}條件的分支保留,將其余分支剪去,以減小分類決策樹的冗余度。 圖2 分類決策樹邏輯結構 由圖2所示的分類決策樹,經過剪枝算法和映射關系合并,最終生成低冗余分類決策樹。按照決策樹與神經網絡的對應規則,將神經網絡設計為輸入層、隱層和輸出層。輸入層神經元數等于決策樹中的判定參數,在本文中為26個;輸出層神經元數等于分類決策樹的分類數,在本文中經過合并與剪枝后為6個;隱層神經元數為最大合取鏈長度即為決策樹的深度,在本文中為10個。本文構建的神經網絡邏輯示意圖如圖3所示,其中Wi為輸入層神經元到隱層神經元之間的連接權,Wo為隱層神經元到輸出層神經元之間的連接權,m為被測圖像的灰度均值作為輸入參數,s為被測圖像最大灰度偏移作為輸入參數,t1和t2為圖像分割所需的上下門限值。 圖3 神經網絡邏輯示意圖 輸入層到隱層的連接權Wi為26×10的矩陣,設基礎權值為ωi,Wi矩陣中被剪枝掉的連接其權值均為-ωi, 其余連接的權值為ωi。隱層到輸出層的連接權Wo為10×6的矩陣,設基礎權值為ωo,Wo矩陣中所有連接的權值均為ωo。根據李愛軍等人對兩層權值的初始設置規則證明[8],此方法比將兩個連接權矩陣初始化為隨機權值具有更好的網絡學習效果和收斂性,在本文中將基礎權值ωi和ωo設置為ωi=ωo=0.4。將帶有連接權值的連接加入到各層神經元之間,使其由獨立的分層結構組成帶權連接網絡,形成初始神經網絡。 建成初始神經網絡后,對采樣的圖像數據分別提取出圖像灰度均值、圖像最大灰度偏差以及對應的映射關系記錄(總共343條)作為訓練集和測試集的樣本空間。從樣本空間中抽出300條記錄作為訓練集,40條記錄作為測試集。并將神經網絡的學習率設為0.5,動量因子設為0.01。將初始網絡用訓練集進行訓練后成為最終的神經網絡,其表現出良好的閾值函數篩選效果。 圖4 CCD采集原始圖像 圖4為實際工程中用Manta G-201B型CCD工業攝像機采集的原始圖像,要求基于機器視覺方式測量出手輪下方六角形螺母旋轉角度。將求解旋轉角度問題轉化為識別出六角形螺母的一個有效側棱面。由于問題中被測物在不同旋轉角度的情況下,被測物對外界照明光線反射形成的圖像存在動態不定性,本文采用基于DTBNN算法的雙閾值圖像分割方法,并通過MATLAB仿真將本文方法與Otsu雙閾值法、最大熵雙閾值法進行比較。 首先采用劃定區域切割法將被測六角形螺母從原始整體圖像中分離出來,其分離后的圖像如圖5(a)和(e)所示。然后分別采用本文所提出的方法、Otsu雙閾值方法和雙閾值最大熵方法進行雙閾值圖像分割,其閾值分割結果如圖5所示。圖5(a)和(e)的灰度直方圖如圖6所示。 圖5 實驗處理圖像結果對比:(a)和(e)為兩次任意旋轉采集的被測圖像,(b)和(f)為采用Otsu雙閾值方法分割圖像,(c)和(g)為采用最大熵雙閾值方法分割圖像,(d)和(h)為采用本文DTBNN雙閾值方法分割圖像 圖6 實驗圖像的灰度直方圖 對圖5(a)和圖5(e)使用Otsu雙閾值方法獲取的灰度閾值上下限分別為203、206和246、249,能將圖5(a)中六角形螺母清晰分割出來,如圖5(b),而圖5(e)不能分割出來,如圖5(f)。使用最大熵雙閾值法對圖5(a)和圖5(e)進行閾值分割得到分割灰度閾值上下限分別為110、241和71、114,能將圖5(a)的六角形螺母的邊緣輪廓分割出來,如圖5(c),而不能將圖5(e)分割出來,如圖5(g)。采用本文提出的DTBNN雙閾值方法對圖5(a)和圖5(e)進行閾值分割,獲取的分割灰度閾值上下限為1、35和1、25,此方法將六角形螺母左側棱面清晰分割出來,如圖5(d)和圖5(h)。在圖5(a)的情況下,根據其對應的灰度直方圖圖6(a)可知其灰度直方圖存在明顯峰值特征,因此以上三種方法都能夠對圖5(a)進行有效的雙閾值圖像分割。而圖5(e)沒有明顯的灰度峰值特征,因此Otsu雙閾值方法和最大熵雙閾值方法都不能有效分割出圖像。 另外,從實驗采集的343個樣本圖像中分別隨機地提取三組測試圖像數據,每組分別包含10、20、50個樣本圖像。對所抽取的測試圖像組分別采用Otsu雙閾值、最大熵雙閾值和本文所提出的方法進行圖像分割,其統計如表1和表2所示。Otsu雙閾值分割法和最大熵雙閾值分割法在處理工程實驗圖像數據時,其正確分割概率分別為56%和72%。而對于本文所提出的方法,不論被測圖像灰度直方圖是否存在峰值特征,都能使用經過訓練后的網絡計算出閾值并將被測圖像的六角形螺母側棱面正確分割出來,其正確率接近100%。同時從表2統計結果分析,Otsu雙閾值分割方法平均運行耗時為0.48 s,最大熵雙閾值分割方法平均運行耗時為1.59 s。而對于本文提出的DTBNN方法運行時間比Otsu雙閾值和最大熵雙閾值方法都要少,其平均運行耗時為0.13 s。表明本文所提出的雙閾值圖像分割方法比Otsu雙閾值方法、最大熵雙閾值方法在圖像雙閾值分割上有更好的運行效率,能夠適應動態圖像的圖像分割。 表1 圖像分割正確數 (單位:個) 表2 圖像分割運行時間 (單位:s) 將基于決策樹的神經網絡分類算法應用于圖像閾值分割領域,通過實驗驗證其分類決策算法能夠使動態圖像獲取合適的雙閾值圖像分割門限,并在實際工程中應用該方法達到了解決實際問題的目的。實驗表明,對于動態圖像其灰度直方圖有無明顯特征信息都不會對此方法 造成影響,并且因該方法基于分類決策樹構建神經網絡,使得采用較少的訓練樣本就能夠得到穩定的神經網絡。 另外,本課題由“北方工業大學優勢學科項目”和“北京市屬高等學校創新團隊建設與教師職業發展計劃項目”支持。 [1] 丁銳, 劉甲甲, 李柏林, 等. 改進的Otsu圖像多閾值分割方法[J].計算機應用, 2013, 33(S1):214-217. [2] 童小念, 施博, 王江晴. 基于量子粒子群算法的雙閾值圖像分割方法[J].四川大學學報(工程科學版), 2010, 42(3): 132-138. [3] 張春麗. 基于分層遺傳算法的雙閾值圖像分割[J].微計算機應用, 2008, 29(1):92-95. [4] 陶文兵, 劉李漫, 田金文, 等. 采用遺傳算法與最大模糊熵的雙閾值圖像分割[J].信號處理, 2005, 21(6):684-687. [5] 周鮮成, 申群太, 王俊年. 基于最大模糊熵和微粒群的雙閾值圖像分割[J].計算機工程與設計, 2008, 29(12):3188-3190. [6] 劉欣欣, 李雪, 王瓊. 基于灰度直方圖的多閾值分割法[J].計算機應用與軟件, 2013, 30(12): 28-30. [7] SETHI I K. Neural implementation of tree classifier[J].IEEE Transactions on Systems, Man & Cybernetics, 1995, 25(8):1243-1249. [8] 李愛軍, 羅四維, 黃華, 等. 基于決策樹的神經網絡[J].計算機研究與發展, 2005, 42(8): 1312-1317. [9] 劉棟, 馮勇, 趙向輝. 基于決策樹算法確定一個最小神經網絡[J].計算機應用, 2010, 30(Z1): 83-85. Dual-threshold image segmentation based on DTBNN Fu Yongqiang,Song Lihua,Li Yebai, Ma Li (Department of Computer Sciences, North China University of Technology, Beijing 100144, China) In order to deal with the segment problem of dynamic image which have indistinctive ups and downs feature in histogram, a method of dual-threshold dynamic image segmentation based on DTBNN( Decision Tree Based Neutral Network) algorithm is proposed. Firstly, according to the correspondence between decision tree and neural network to build a stable and efficient training neural network. Then, the mean of gray value is extracted by experiment, the maximum deviation and the threshold mapping function are used as sample data to train the neural network. Finally, using the trained neural network to get threshold mapping function by testing images, and complete dual-threshold image segment by using the result of the upper and lower threshold values which are calculated from previous step. The simulation results show that this method does not depend on the feature of histogram and it could accurately get upper and lower segmentation threshold. Compared with Otsu dual-threshold method and maximum entropy dual-threshold method, the proposed method could achieve better dynamic image dual-threshold segmentation. DTBNN; dual-threshold; image segmentation TP391.41 A 10.19358/j.issn.1674- 7720.2016.15.017 2016-04-07) 付永強(1983-),男,碩士研究生,主要研究方向:機器視覺, 嵌入式系統。 宋麗華(1979-),女,博士,副教授,研究生導師,主要研究方向:嵌入式系統, 網絡通信與網絡協議。 李也白(1957-),男,碩士,教授,研究生導師,主要研究方向:電子商務與商業智能, 嵌入式技術應用。 引用格式:付永強,宋麗華,李也白,等. 基于DTBNN的雙閾值圖像分割方法[J].微型機與應用,2016,35(15):57-60,64.


3 實驗數據分析





4 結論