沈德勝,朱良寬,宋佳音,李克新
(東北林業(yè)大學(xué) 機(jī)電工程學(xué)院,哈爾濱 150040)
?
基于改進(jìn)k均值聚類方法的林木冠層孔隙度提取
沈德勝,朱良寬*,宋佳音,李克新
(東北林業(yè)大學(xué) 機(jī)電工程學(xué)院,哈爾濱 150040)
摘要:在利用林木冠層半球圖像獲取冠層孔隙度的過程中,針對因植被反光現(xiàn)象導(dǎo)致的圖像誤分割或分割不精確,以及傳統(tǒng)k均值聚類圖像分割方法易陷入局部最優(yōu)值的問題,提出一種新的林木孔隙度提取策略。首先,利用數(shù)字圖像處理方法消除了冠層半球圖像中植被的反光,降低了因植被反光引起孔隙度計算出現(xiàn)較大誤差的風(fēng)險;然后,將初始聚類中心優(yōu)化的k均值聚類方法與數(shù)字圖像的數(shù)據(jù)特點(diǎn)相結(jié)合,確定了較為合理的數(shù)據(jù)密度搜索半徑,提出改進(jìn)k均值聚類方法對冠層圖像進(jìn)行兩次聚類分割,計算出冠層孔隙度。最后,將結(jié)果與傳統(tǒng)k均值方法、Otsu法和WinSCANOPY2006a軟件的處理結(jié)果進(jìn)行對比分析,實驗結(jié)果表明所提的方法是可行且有效的。
關(guān)鍵詞:圖像反光;k均值聚類;冠層半球圖像;孔隙度
0引言
林木冠層孔隙度是植被結(jié)構(gòu)參數(shù)中重要的組成部分,也是獲取其他冠層結(jié)構(gòu)參數(shù)(如葉面積指數(shù)、植被郁閉度、葉面積等)的重要依據(jù)。冠層孔隙度是冠層圖像中植被部分所占的比例,近年來,由魚眼鏡頭獲得地面植被半球圖像計算植被冠層孔隙度的方法深受國內(nèi)外學(xué)者的青睞,如何探尋一種計算準(zhǔn)確、精度更高、計算速度更快的孔隙度獲取方法具有重要意義[1-4]。
目前,應(yīng)用數(shù)字圖像處理技術(shù)處理冠層圖像獲得冠層孔隙度是一種高效實用的方法,并取得了一系列成果。文獻(xiàn)[2]通過對植被半球圖像的藍(lán)色分量進(jìn)行處理,可以有效抑制部分光線對冠層孔隙度提取的影響,但是當(dāng)圖像中植被部分有較強(qiáng)反光時孔隙度的計算結(jié)果并不理想。文獻(xiàn)[3-5]通過對低矮植被圖像HIS(色度,飽和度,亮度)顏色空間H分量圖像進(jìn)行圖像分割雖然效果較好,但由于樹木冠層結(jié)構(gòu)復(fù)雜,H分量的植被區(qū)域與實際的植被區(qū)域差別較大,其對H分量圖像的分割結(jié)果并不理想。
針對上述問題,本文提出一種基于改進(jìn)k均值聚類的冠層孔隙度提取方法。首先,通過分析圖像RGB(紅,藍(lán),綠)和HSI顏色空間的色彩結(jié)構(gòu),并結(jié)合圖像形態(tài)學(xué)對圖像進(jìn)行預(yù)處理,旨在消除因樹木、枝葉等反光現(xiàn)象對圖像分割的影響;然后,將初始聚類中心優(yōu)化的思想與冠層數(shù)字圖像的數(shù)據(jù)特點(diǎn)相結(jié)合,對傳統(tǒng)k均值聚類方法進(jìn)行了改進(jìn),利用改進(jìn)后的k均值聚類方法對去除反光影響的圖像進(jìn)行兩次聚類分割,并將兩次聚類分割得到的植被區(qū)域合并;最后,將兩次聚類分割得到的圖像進(jìn)行二值化處理,利用公式計算出冠層孔隙度,并將得到的結(jié)果與常規(guī)方法處理結(jié)果進(jìn)行了對比驗證。
1圖像數(shù)據(jù)來源
實驗用冠層半球圖像來源于東北林業(yè)大學(xué)帽兒山實驗林場闊葉林實驗樣地,采用帶有魚眼鏡頭的WinSCANOPY2006a設(shè)備,在樣地內(nèi)由下向上采集闊葉林冠層半球圖像,試驗用圖像以WinSCANOPY2006a軟件測定的冠層孔隙度作為真實值,用于驗證不同方法計算得到孔隙度的準(zhǔn)確性。
2冠層半球圖像反光區(qū)預(yù)處理
2.1RGB與HSI顏色空間色彩結(jié)構(gòu)分析
RGB和HSI空間的數(shù)字圖像都是三維矩陣,通過相機(jī)獲得的圖像幾乎都是RGB顏色空間的圖像,RGB顏色空間數(shù)字化程度高,三個分量數(shù)據(jù)信息模式一致,使得數(shù)據(jù)計算方便快捷。但是,由于RGB三個顏色分量的相關(guān)度較高,任一分量的改變都會改變整個像素的顏色信息,在圖像處理中容易相互影響,而H分量與I分量相關(guān)度很低,因此若將其轉(zhuǎn)換成HSI顏色空間,則可將亮度分量與彩色圖像中的彩色信息分開,從而實現(xiàn)只改變亮度信息而不改變顏色信息。
2.2反光區(qū)處理
反光區(qū)處理的基本流程如圖1所示。

圖1 反光區(qū)處理流程圖Fig.1 Flow chart of reflective processing
RGB與HSI顏色空間轉(zhuǎn)換公式如下:
色度分量為:

(1)
其中

(2)
飽和度分量為:

(3)
亮度分量為:

(4)
應(yīng)用轉(zhuǎn)換公式(1)~公式(4),將原冠層圖像由RGB空間轉(zhuǎn)換為HSI空間,應(yīng)用形態(tài)學(xué)的方法確定天空灰度為0的區(qū)域,將該區(qū)域灰度值修正為正常值,得到新的H分量圖像H_NEW數(shù)據(jù),再用I-λ×H_NEW得到差值圖像(其中λ取值根據(jù)反光程度設(shè)定,反光越強(qiáng)λ越大,反之λ越小)。通過差值圖像可以得到明顯的反光區(qū),再進(jìn)一步確定反光區(qū)域的位置集合P,對I中相應(yīng)區(qū)域進(jìn)行減弱,I_NEW=m×I(P)(其中m為亮度調(diào)節(jié)參數(shù))得到新的I分量數(shù)據(jù)I_NEW,將I_NEW與原來的H分量數(shù)據(jù)和S分量數(shù)據(jù)合成新的圖像HSI_NEW,再將HSI_NEW圖像轉(zhuǎn)化為新的圖像RGB_NEW。

圖2 原圖HSI空間H分量 Fig.2 The H component inHSI space for the original image

圖3 形態(tài)學(xué)處理后H分量Fig.3 The H component aftermorphological processing
圖2、圖4為原圖HSI空間中的H分量圖和I分量圖,圖3為形態(tài)學(xué)處理修正后的H_NEW圖,圖5為I-λ×H_NEW得到的差值圖,圖中的亮區(qū)即樹葉和樹干的反光區(qū),圖6、圖7為原RGB圖及去除反光后的RGB_NEW圖像。圖8為去反光處理的對比結(jié)果,其中(a1),(b1),(c1)為原圖,(a2),(b2),(c2)為去反光后結(jié)果。可以發(fā)現(xiàn),應(yīng)用本文方法可有效去除反光,并未改變原始圖像非反光區(qū)的顏色信息和反光區(qū)色度信息,保留了圖像的原始數(shù)據(jù)。

圖4 原圖HSI空間I分量Fig.4 The I component in HSI space for the original image

圖5 差值圖像Fig.5 Differencial image

圖6 原RGB圖像Fig.6 The original RGB image

圖7 RGB_NEW圖像Fig.7 RGB_NEW image

(a1)

(a2)

(b1)

(b2)

(c1)

(c2)
表1給出了圖6中樹干和樹葉各3處反光區(qū)域、同類無反光區(qū)和去反光后的平均灰度對比結(jié)果,可以看出,本文去除反光的方法計算量較小,易于實現(xiàn)且效果較好,是一種林木冠層圖像反光區(qū)預(yù)處理較實用的方法。

表1 反光區(qū)處理結(jié)果對比
本文中的圖像數(shù)據(jù)是以魚眼鏡頭在樣地內(nèi)由下向上采集闊葉林冠層半球圖像,圖像只有植被和天空兩部分,文中圖像分割的目的是獲取植被和天空區(qū)域的面積即像素數(shù)量,用以計算孔隙度,但由于部分樹葉和樹干有較強(qiáng)的反光現(xiàn)象,直接導(dǎo)致實際的枝干、樹葉占空比降低,因此需要對其進(jìn)行上述(如流程圖1)的預(yù)處理,以提高孔隙度的計算精度。
3改進(jìn)k均值聚類法圖像分割
3.1k均值聚類算法
設(shè)對有N個數(shù)據(jù)的集合A分為k類,也就是k個族,x表示Ci族中的成員,ci表示Ci族中心值[5-8]一般使用公式(5):

(5)
為目標(biāo)收斂函數(shù),dis為集合A的族內(nèi)成員對族內(nèi)中心點(diǎn)的誤差平方和。k均值聚類迭代過程可參見文獻(xiàn)[5-8],在此不贅述。
3.2改進(jìn)k均值聚類方法
k均值聚類算法的不足之處在于:算法隨機(jī)選取聚類中心,如果初始中心為孤立點(diǎn),會導(dǎo)致迭代過程陷入局部最優(yōu)值,得不到最優(yōu)解;迭代的次數(shù)與初始聚類中心的選取密切相關(guān),隨機(jī)選取聚類中心也會使每次聚類時間不同,甚至最后的聚類結(jié)果也不同,增加了算法的不穩(wěn)定性。針對冠層圖像的數(shù)據(jù)特點(diǎn)和k均值聚類算法的不足,本文結(jié)合數(shù)據(jù)密度和最大化最小距離的方法,對k均值聚類方法進(jìn)行了改進(jìn)。
首先確立統(tǒng)計數(shù)據(jù)的區(qū)域半徑,本文的數(shù)據(jù)區(qū)域半徑 為全體數(shù)據(jù)中任意兩個數(shù)據(jù)的距離之和的均值。計算公式如下:

(6)
以r為區(qū)域半徑,統(tǒng)計任一區(qū)域內(nèi)數(shù)據(jù)的數(shù)量,如果數(shù)量大于Min則表示以該數(shù)據(jù)x為中心r為半徑的區(qū)域為高密度區(qū),x為高密度點(diǎn),統(tǒng)計所有的高密度點(diǎn)和相應(yīng)的密度。
最大化最小值方法描述如下:[9-10]
(1)假設(shè)G={x1,x2,x3,…,xn}為已選好的高密度點(diǎn)數(shù)據(jù)集,找出其中密度最大的點(diǎn)J1。
(2)在集合G中找到距離J1最遠(yuǎn)的點(diǎn)為J2。
(3)統(tǒng)計G中其余對象與J1和J2的距離di1和di2,計算其中較小的值為min(di1,di2)。
(4)計算min(di1,di2)中的最大值,即最大的最小距離max(min(di1,di2)),以此xi為J3。
(5)以此類推J4=max(min(di1,di2,di3))最終確定k個初始聚類中心點(diǎn)。
需要注意的是:由高密度點(diǎn)和最大化最小距離方法選取的初始聚類中心點(diǎn),避免了聚類結(jié)果的不確定性,避免了聚類局部最優(yōu)的風(fēng)險,可減少迭代次數(shù),由此得到的初始聚類中心方法切實可行。
結(jié)合最大化最小距離方法的改進(jìn)k均值聚類過程描述如下:
Step1:由公式(6)確定數(shù)據(jù)集A的區(qū)域半徑r,對A中每個樣本計算距離在r內(nèi)的數(shù)據(jù)量,若大于Min則為高密度點(diǎn),統(tǒng)計得到高密度點(diǎn)集G={x1,x2,x3,…,xn}。
Step2:在G中由最大化最小距離的方法確定出k個初始聚類中心。
Step3:由Step2中得到的k個初始聚類中心進(jìn)行k均值聚類。
3.3冠層圖像分割實驗
本文采用兩次聚類分割的方式:第一次從整個半球圖像整體差異上區(qū)分天空與植被,第二次以第一次分割出來的含有細(xì)小枝葉的天空為整體,此時的待分割對象雖然很相近,但類別很少,易于聚類分割。將分割出來的細(xì)小枝葉與第一次分割出來的植被區(qū)域合并,剩下的則為天空區(qū)域。由于在可見光波段中,綠色植物對藍(lán)光的吸收較強(qiáng),在藍(lán)色分量下對植物的綠色葉片與天空的區(qū)分非常明顯,得到的分割結(jié)果更為準(zhǔn)確,因此選取RGB_NEW中的藍(lán)色分量(如圖9所示)進(jìn)行圖像分割。
冠層半球圖像像素大小為2211×2211,圓形區(qū)域的像素數(shù)量為3 821 941個。首先,結(jié)合冠層圖像的特點(diǎn),分別取第一次聚類分割的類別數(shù)k1=3、4、5、6、7,對去反光圖像進(jìn)行本文方法聚類。綜合考慮分析處理結(jié)果和耗時長短,選擇k1=6對圖像進(jìn)行聚類,結(jié)果如圖10所示,按灰度值大小分為6類,同一類具有相同的灰度值,對分類后的圖像化分為兩類,黑色為植被區(qū)域,白色為天空區(qū)域,結(jié)果如圖11所示。然后,考慮到還有細(xì)小枝干未被分割出來,對未分割完全的天空部分再進(jìn)行第二次聚類分割,取第二次聚類分割的類別數(shù)為k2=2,結(jié)果如圖12所示。可見利用本文的方法幾乎可以將植被部分完全分割出來,取得了較好的冠層圖像分割效果。

圖9 RGB_NEW藍(lán)色分量圖Fig.9 Blue componentdiagram of RGB_NEW

圖10 第一次k1=6聚類Fig.10 The first time k1=6clustering result

圖11 第一次k1=6聚類效果圖及細(xì)節(jié)Fig.11 The first time k1=6clustering result

圖12 第二次k2=2聚類效果圖及細(xì)節(jié)Fig.12 The second time k2=2clustering result
4孔隙度計算
孔隙度為天空區(qū)域所占的面積與植被區(qū)域和天空區(qū)域面積和的比值,計算公式如下[11-12]:

(7)
式中:T為孔隙度;Ns為天空像素總數(shù);Nl為植被部分像素總數(shù),由RGB_NEW的藍(lán)色分量分割結(jié)果得出天空像素總數(shù)Ns=409 600,植被部分像素總數(shù)Nl=3 412 341,經(jīng)計算得T=10.71%。
表2為針對冠層圖像數(shù)據(jù)利用傳統(tǒng)k均值聚類與本文算法選取不同k值時所花費(fèi)的時間和聚類次數(shù)的對比,可以看出,本文方法可在一定程度上減少聚類次數(shù),降低了聚類時間。

表2 傳統(tǒng)k均值與本文方法聚類時間對比
目前,關(guān)于孔隙度的計算有直接測量法和間接測量法,直接測量法中有落葉收集法、斜點(diǎn)樣方法等,測量準(zhǔn)確但費(fèi)時費(fèi)力實現(xiàn)性差;間接測量法中有基于輻射量的方法和光學(xué)儀器法,測量儀器有HemiView、LAI-2000、CI-110、TRAC、DHP等,其中,WinSCANOPY2006a冠層圖像分析儀作為一種通過間接測量法獲得林木冠層參數(shù)的商業(yè)化儀器,測量精度較高,操作方便,在同類產(chǎn)品中測量效果較好,在業(yè)內(nèi)受到廣泛的認(rèn)可,因此本文以WinSCANOPY2006a冠層圖像分析儀的測量結(jié)果作為孔隙度真實值,用以驗證不同方法孔隙度計算結(jié)果的有效性。
表3為針對采集的10幅冠層半球圖像分別利用Otsu法、傳統(tǒng)k均值方法及本文方法進(jìn)行孔隙度提取,再將WinSCANOPY2006a軟件的計算結(jié)果與不同方法的計算結(jié)果相對比。圖13為根據(jù)10幅圖像所得三種方法的孔隙度數(shù)據(jù)和WinSCANOPY2006a軟件的處理結(jié)果,結(jié)果表明,相比傳統(tǒng)k均值方法和Otsu方法,本文方法最接近WinSCANOPY2006a軟件的處理結(jié)果,所得到的冠層孔隙度更準(zhǔn)確。

圖13 幾種方法計算結(jié)果對比圖Fig.13 The comparison charts of results with different methods

圖 號孔隙度/%Otsu算法傳統(tǒng)k均值算法本文方法WinSCANOPY2006a113.2812.4810.3210.67215.2811.8710.169.39317.3513.4511.4910.97414.1711.149.649.34511.8611.869.649.15613.9013.2610.8110.21717.4817.2414.7214.31810.8010.588.108.58912.1611.9310.149.95109.789.457.837.74
表4給出了三種方法與WinSCANOPY2006a處理結(jié)果的平均誤差對比。由表4可以看出,本文方法平均誤差小于5%,經(jīng)統(tǒng)計分析得到與WinSCANOPY2006a的結(jié)果相關(guān)系數(shù)R=0.978 6,決定系數(shù)R2=0.926 1二者具有很高的相關(guān)性,說明了本文方法精度較高,結(jié)果較Otsu法和傳統(tǒng)k均值法更為精確。

表4 三種方法與WinSCANOPY2006a
5結(jié)論與討論
本文提出了一種新的林木冠層孔隙度提取方法,該方法考慮了植被反光現(xiàn)象對圖像分割的影響,通過對圖像進(jìn)行預(yù)處理有效地去除了半球圖像的反光,并利用改進(jìn)k均值聚類方法對預(yù)處理后的圖像進(jìn)行兩次聚類分割,計算出冠層孔隙度。通過實驗可以看出,本文提出的方法去除冠層半球圖像反光效果較好,而且在聚類分割的效率和精確度方面具有明顯的優(yōu)勢,相比傳統(tǒng)k均值方法和Otsu方法,所得到的冠層孔隙度更準(zhǔn)確,為森林生長狀況分析提供了有效的依據(jù),為冠層孔隙度的獲取提供了一種新的方法和途徑。
【參考文獻(xiàn)】
[1]潘桂穎.基于半球攝影法的水稻冠層結(jié)構(gòu)參數(shù)測量與反演[D].杭州:浙江大學(xué),2011.
[2]凌飛龍,李增元,陳爾學(xué),等.青海云杉林葉面積指數(shù)半球攝影測量方法研究[J].地球科學(xué)進(jìn)展,2009,24(7):803-809.
[3]李明,張長利,房俊龍.基于圖像處理技術(shù)的小麥葉面積指數(shù)的提取[J].農(nóng)業(yè)工程學(xué)報,2010,26(1):205-209.
[4]Han J,Kamber M.Data mining concepts and technique(2nd Ed)[M].Beijing:China Machine Press,2006.
[5]黃芬,于琪,姚霞,等.小麥冠層圖像H分量的K均值聚類分割[J].計算機(jī)工程與應(yīng)用,2014,(3):129-134.
[6]張文君,顧行發(fā),陳良富,等.基于均值-標(biāo)準(zhǔn)差的K均值初始聚類中心選取算法[J].遙感學(xué)報,2006,10(5):715-721.
[7]MacQueen J B.Some methods for clustering and analysis of multivariate observations[M].Berkeley:University of California Press,1967.
[8]Ester M,Kriegel H P,Sander J,et al.A density based algorithm for discovering clusters in large spatial databases with noise[M].Portland:AAAI Press,1996.
[9]袁方,周志勇,宋鑫.初始聚類中心優(yōu)化的k-means算法[J].計算機(jī)工程,2007,33(3):65-66.
[10]張健沛,楊悅,楊靜,等.基于最優(yōu)劃分的K-Means初始聚類中心選取算法[J].系統(tǒng)仿真學(xué)報,2009,(9):2586-2590.
[11]杜春雨,范文義.有效葉面積指數(shù)與真實葉面積指數(shù)的模型轉(zhuǎn)換[J].東北林業(yè)大學(xué)學(xué)報,2010,38(7):126-128.
[12]李根柱,王賀新,朱教君.遼東山區(qū)長白落葉松葉面積指數(shù)和林冠開闊度的月動態(tài)[J].東北林業(yè)大學(xué)學(xué)報,2009,37(7):20-22.
Extraction of Vegetation Hemisphere Image Porosity Based onImproved k-means Clustering Method
Shen Desheng,Zhu Liangkuan*,Song Jiayin,Li Kexin
(College of Mechanical and Electrical Engineering,Northeast Forestry University,Harbin 150040)
Abstract:Forest canopy hemisphere images can be used to capture the canopy porosity.However,the reflective phenomenon of vegetation can easily lead to image segmentation by mistake or inaccuracy,and the traditional k-means clustering image segmentation method is easy to fall into local optimal value,therefore a novel porosity extraction method was proposed in this paper.Firstly,the digital image processing technology was applied to eliminate the reflection of vegetation in the canopy hemisphere images,which reduced the risk of a larger porosity calculation error caused by vegetation reflection.Then,the method of k-means clustering algorithm was combined with the data characteristics of digital image to determine a reasonable searching radius of data density,and the image after being removed the reflective was segmented twice by the improved k-means clustering method.Finally,the canopy porosity was computed and the result was compared with the traditional k-means method,Otsu method,and WinSCANOPY2006a software processing results.The experimental results showed that the proposed method was feasible and effective.
Keywords:reflective image;k-means clustering;canopy hemisphere image;porosity
中圖分類號:S718.42
文獻(xiàn)標(biāo)識碼:A
文章編號:1001-005X(2016)02-0014-05
作者簡介:第一沈德勝,碩士研究生。研究方向:圖像處理技術(shù)林業(yè)應(yīng)用。*通信作者:朱良寬,博士,副教授。研究方向:林業(yè)信息智能檢測。Email:zhulk@126.com
基金項目:國家自然科學(xué)基金項目(31370710);高等學(xué)校博士學(xué)科點(diǎn)專項科研基金資助(20110062110002)
收稿日期:2015-11-17
引文格式:沈德勝,朱良寬,宋佳音,等.基于改進(jìn)k均值聚類方法的林木冠層孔隙度提取[J].森林工程,2016,32(2):14-18.