陳冬梅,袁 琳,顏 鵬,范姍慧,周賢鋒,張競成,吳開華
(1. 杭州電子科技大學 生命信息與儀器工程學院,浙江 杭州310018;2. 浙江水利水電學院 信息工程與藝術設計學院,浙江 杭州310018;3. 中國農業科學院 茶葉研究所,農業部茶葉質量安全控制重點實驗室,浙江 杭州310008)
茶樹為多年生木本植物,其葉片含有多種對人體有益的功能成分,如多酚類、茶多糖、茶氨酸,使得茶葉兼具美味和保健的特點[1]。隨著茶葉需求量增加,部分茶區茶品種單一,管理粗放,使茶樹病害日益嚴重。其中,茶炭疽病是發病比較普遍的病害之一,在我國各個茶區都有分布,一般南方比北方茶區嚴重,濕度大、海拔高、云霧多的茶區發生嚴重[2]。茶炭疽病主要為害當年生成葉,茶炭疽病嚴重時可導致大量落葉,影響茶樹的光合作用,影響茶樹的生理代謝,造成茶葉減產和品質下降[3],經濟效益損失嚴重。茶炭疽病是由茶葉炭疽菌屬真菌感染引起,變異快,種類多,地理分布和寄主范圍又十分廣泛。如不能正確判斷茶炭疽病病害嚴重程度,過量、盲目地使用農藥,就難以保證作物的無公害、綠色化生產,對出口貿易也造成一定障礙。難以保證既可以有效的施用農藥消滅植物病害,提高作物產量,同時又能合理地使用農藥,有效減少農藥對環境的污染,快速、準確地判斷作物受害程度是關鍵,才能為農業生產者采取有針對性的防治方法,科學系統地治理病害提供技術支撐
測量植物葉片病斑面積的方法有網格法、傳統法和軟件法等。網格法指用已知每格面積的紗網或標準尺測量病斑面積[4-7],這種方法比較準確,但是不便于大批量操作。傳統法是測量出病斑最大長度和最大寬度(兩者呈直角),然后用公式計算出相對病斑面積(RLA)[8]。軟件法指用Photoshop等軟件將病斑部分顯示出來,并計算病斑部分的像素數[9]。這種方法雖然精確,但是不具備實時性,且在操作人員的視覺疲勞后病斑測量結果會出現較大差異。在實際生產過程中,對于茶炭疽病的病害嚴重程度的判斷,主要以農業生產者個人經驗進行分析和判斷,造成病害程度標準含糊不清,嚴重影響病害判斷準確性。近年來,隨著信息技術的發展,數碼照相機、智能手機、家用計算機等獲取圖片的設備得到普及,農業工作者很容易得到茶葉的彩色數字圖像。利用計算機圖像處理技術對茶炭疽病圖像進行處理,能夠克服人工處理帶來的主觀性、經驗性和效率低等問題,幫助茶樹栽培管理的智能化發展。
目前已有一些國內外學者利用計算機圖像處理技術對植物病害展開研究。虞佳佳以番茄灰霉病的高光譜圖像為研究對象,選擇拉普拉斯銳化結合Sobel算子的邊緣提取的方法提取目標區域,并且選擇高頻強調濾波銳化方式在特征融合圖像中計算病斑面積[10]。黃帥提出一種基于Markov隨機場和K均值聚類的復雜背景下葉部病害圖像分割方法,實現復雜背景下的病斑提取,并計算葉片病斑面積[11]。毛罕平等提出了一種自適應分割方法,這種方法基于模糊C均值聚類算法(FCM),并通過有效性驗證確定了FCM中的最優聚類數和模糊加權指數,將病斑和非病斑區分割開來[12]。劉小川等在研究植物黑腐病的分割算法中,針對圖像模糊閾值分割法存在的窗口寬度自動選取困難的問題,提出了一種直方圖變換方法,根據變換后的直方圖,再利用自適應模糊閾值分割法對植物黑腐病病斑圖像進行分割[13]。張健欽等獲得CCD彩色圖像,通過灰度變換和閾值分割獲得二值圖像,用中值濾波去除離散噪聲,利用Kirsch邊緣算子得到的輪廓,最后借助參考物算法計算出葉片的面積[14]。Barbedo提出一種利用彩色數組圖像量化病害的方法,該法對各種場景下的檢測結果都提供了準確的估計[15]。Cui D提出一種基于色彩模型的圖像處理方法,定義病變指數(LI)為病斑面積與健康葉面積的比值來評估葉片受損程度[16]。然而這些研究內容在茶炭疽病病斑的自動識別與計算的應用還十分有限。
利用計算機圖像處理技術處理茶炭疽病病斑圖像的核心在于圖像分割,只有準確提取目標葉片和病斑面積,計算出的病斑面積才會準確。本文以茶炭疽病病斑葉片彩色數字圖像作為研究對象,采用自適應模糊閾值分割和基于顏色通道差值分割兩種分割方法對不同病斑級別的圖像進行分割,根據像素轉換的茶葉病斑區域與目標葉片面積計算相對病斑面積(RLA),并與手動分割的結果進行比較,評價算法的準確性和實用性。
本研究中所使用的茶樹炭疽病葉片樣本于2017年9月10日取自浙江省金華市武義縣中國茶葉研究所實驗茶園,茶炭疽病為自然發病。拍攝葉片彩色圖像時,相機垂直于病害葉片,葉片盡量緊貼背光板(減少葉片邊緣翹起產生的陰影),圖像須包含完整的葉片區域,保證光照充足,避免光照不足使葉片區域顏色偏黑,丟失彩色信息。相機設置為手動調節焦距和光圈,自動白平衡,關閉閃光燈以避免出現亮斑。
用數碼相機拍攝的茶葉葉片病斑圖像因受拍攝環境影響會產生噪聲、斑點等不利于圖像處理的干擾因素。所以,前期往往需要對圖像進行預處理,消除不利干擾,簡化數據,恢復圖像質量,提高圖像分割的速度和準確性,為后期的圖像分割和面積計算做好準備。同時,圖像的白色背景也不利于后續圖像的運算和顏色特征的提取,進行圖像分割之前也需要提取葉片區域,去除背景。葉部病害按侵蝕葉面積大小可分為5級,0級(無感染),1級(1%~25%葉感染面積),2級(26%~50%葉感染面積),3級(51%~75%葉感染面積)和4級(76%~100%葉感染面積)。為驗證本方法效果,將在 Windows 10、MATLAB 2014b環境下對不同等級的54幅茶炭疽病病斑圖像進行驗證,其中1級13幅、2級19幅、3級14幅、4級8幅,所選圖像均有病斑的圖像。以Photoshop手動分割結果作為對照標準。
茶葉病斑面積計算關鍵在于如何準確合理的提取葉片與病斑部分,并依據兩者像素計算相對面積。在進行計算時,首先進行顏色空間轉換,然后使用自適應模糊閾值方法進行圖像分割,并利用中值濾波和最大連通域技術消除部分邊緣噪聲。為了比較評估結果,對比方法采用傳統的顏色通道差值分割。
1.2.1 基于顏色通道差值的分割
顏色通道差值分割方法是按照彩色圖像的色彩規則和基本圖像運算將葉片病斑區域從葉片圖像中間分割出來的算法。該分割算法利用兩幅圖像像素的不同,將兩幅圖像直接相減,將相減結果經過處理后二值化,直接作為分割結果輸出,最終實現對圖像的分割。本文中將圖像由RGB色彩空間轉換到L* a* b色彩空間。L* a* b色彩空間是一種基于生理特征的顏色系統,是用數字化的方法來描述人的視覺感應。因為明度是單獨保存在L通道中的,所以可以在不改變明度的前提下調整色彩。取a、b通道,對兩個通道分別進行全局閾值分割,將b通道閾值分割后的圖像與a通道閾值分割后的圖像做代數運算,得到結果如圖1所示。比較原始圖像和提取出的病斑圖像,可見基于顏色通道差值方法能將病斑從葉片中提取出來,但病斑邊緣不清晰。同時,基于顏色通道差值方法還將部分葉片邊緣線誤分割為病斑。

圖 1 基于顏色通道差值方法分割結果Fig. 1 Segmentation results based on the color channel difference method
1.2.2 自適應模糊閾值分割
模糊集合理論由美國加州大學伯克利分校電氣工程系的L.A.zadeh教授于1965年創立[17]。在模糊集合概念中,一個元素總是一定程度上屬于某一個集合,也可以同時以不同的程度屬于不同的集合,這樣的集合叫做模糊集。對于人的視覺感知來說,由黑到白的變化是模糊的,這種模糊性也體現在圖像中。圖像的邊緣、區域等也存在著一定的模糊性。葉片的正常區域和病斑區域存在著一個像素過渡帶,此過渡帶中的像素一定程度上屬于正常區域也一定程度上屬于病斑區域。選定合適的閾值是閾值分割的關鍵,模糊閾值法由Pal等于1983年提出[18],通過計算圖像的模糊率或模糊熵來選取圖像分割的閾值。模糊理論應用于圖像分割更加符合圖像的特點和人的視覺特性,更加符合事物本身特點。
其中,隸屬度函數是模糊理論中最重要的概念,處理模糊問題的首要任務就是確定隸屬度函數。隸屬度函數是描述一個對象x隸屬于集合A的程度的函數,用μA(x)表示,0≤μA(x)≤ 1。

隸屬度函數可表示為標準的S型函數,如圖2所示。S型函數是一種從0到1的單調遞增函數,可由q和?q兩個參數確定。Zadeh定義的標準S型隸屬度函數:

其中,q=2?q,在x=2?q處,隸屬度函數等于0.5。用L(0-255)表示灰度級,令w=2?q表示隸屬函數的窗口寬度,它是隸屬函數的模糊區域,q稱為拐點或窗口中心。

圖2 隸屬度函數Fig. 2 subordinating degree function
為了定量分析集合的模糊度,引入模糊率,用γ(x)表示。設圖像的X的大小為M×N,有L級灰度{0,1,2,……,L-1}。μ(x)為定義在L上的隸屬度函數,圖像中灰度為k(k∈[0,L-1])的像素數是h(k),γ(x)的表達式如下:

其中,0<x<L。可見,模糊率γ(x)由圖像像素的灰度值和隸屬度函數μ(x)決定。
取隸屬度函數為S型函數時,隸屬度函數的窗寬為w=2?q,式(4)取最小值時對應的圖像灰度值即為分割圖像的模糊閾值。求解過程是預先設定窗寬w,通過改變q使得隸屬度函數μ(x)在灰度級上滑動,再計算模糊率γ(x),以獲得模糊率曲線。該曲線的谷點,即是γ(x)取得最小值時,對應的參數q,就是待分割圖像的閾值。由于q在灰度級上是遍歷的,可見w決定著分割結果的好壞。w取值越小,μ(x)曲線越陡峭,得到的谷點可能出現振蕩,產生假閾值;w取值越大,μ(x)曲線越平坦,可能會平滑掉谷點,造成閾值丟失。根據經驗,推薦窗寬為灰度圖像雙峰間距的0.3~0.5倍。
選定隸屬度函數后,閾值完全由給定的窗寬決定,窗寬是通過觀察灰度直方圖的峰值人為給定的。對已知直方圖分布的圖像,這種方法總能找到合適的窗寬,但當圖像改變時(如圖像的目標大小在較寬的范圍變化),直方圖也隨之變化,預選的窗寬可能失效,造成誤分割。根據本課題的葉片病斑情況,需要根據待分割的圖像自動選取窗寬,因此選擇自適應模糊理論來確定閾值,即找到模糊率曲線的谷底,谷底對應的灰度值就是模糊閾值。
自適應模糊閾值選取的原理如下:提前獲知圖像的像素類別數,設為α,那么圖像對應的直方圖就有α個峰,α-1個谷點。通過判斷模糊率曲線的谷點數量是否等于α-1個,實現模糊閾值分割的窗寬自動選取。具體方法為:(1)設窗寬w的最小值為2;(2)按照設定的窗寬計算模糊率γ(x),獲得模糊率曲線;(3)根據模糊率曲線判斷谷點數n。如果 n=α-1,則停止,此時對應的窗寬w就是最小窗寬;如果n≠α-1,則w=w+2,返回(2)繼續計算。
本文中將圖像由RGB色彩空間轉換到HSI色彩空間,這是利用HSI色彩空間的兩個優點:其一,I分量與圖像色彩無關,對彩色圖像處理時不需要考慮I分量,只需處理H和S分量;其二,HSI模型完全反映了人感知顏色的基本屬性,與人感知顏色的結果一一對應,使用HSI色彩空間能使分割結果更符合人眼對色彩的感知。取H通道,統計H通道直方圖,設窗寬w最小值為2,按照上述自適應模糊閾值分割的步驟,計算模糊率,獲得模糊率曲線,找到谷點對應的灰度值即為對應的分割閾值。效果如圖3所示:比較原始圖像和分割后的圖像,可見目標病斑區域邊界保持良好,邊緣清晰,整個目標病斑區域被完整提取出來。

圖 3 自適應模糊閾值方法分割結果Fig. 3 The results of the adaptive fuzzy threshold method segmentation
相對病斑面積(Relative Lesion Area, RLA)反應了病害侵染植物葉片的程度,是定量評估植物病害程度的指標[19]。通過本課題的圖像分割算法可實現RLA的無損測量。本文采用準確率和絕對誤差這兩個指標反映病斑面積的準確性。采用相對準確率(MA)衡量分割精度[4],相對準確率的計算公式為:

其中La是用Photoshop手動分割出來的目標病斑區域像素數,Li是用算法分割出來的目標病斑區域像素數。MA越小,表明精度越大,方法性能越好。用絕對準確率(AA)檢驗RLA的準確性,絕對準確率定義為:

其中,Ra是Photoshop手動分割計算出來的RLA,Ri是用算法分割計算出來的RLA,S是整個葉片區域像素數。
不同的分割方法具有不同的適用場景,不存在一個分割方法對所有問題通用。本研究需要分割的葉片圖像有四個等級(不考慮完全沒有被茶炭疽病感染的情況),染病的程度不同造成病斑的大小面積分布均不相同,用到的兩種方法在不同等級的葉片上效果不同。因此將采集到的圖像在MATLAB下進行分析處理,首先比較了兩種方法在不同發病等級的葉片的分割效果,然后分別統計了各個等級葉片的病斑面積計算結果。
以下對不同等級葉片兩種方法的分割效果作對比分析。各級別圖像分割結果如圖4所示。比較傳統的顏色通道差值方法,可以看出兩種方法均可以分割出病斑區域,但是顏色差值方法不能夠完整分割出病斑區域,結果中存在不連續的空洞。自適應模糊閾值方法能夠得到完整的病斑區域,有效的分離出葉片中的病斑和健康區域,因此該方法能夠有效的進行病斑區域的識別與計算。
將兩種方法用于計算所有葉片的病斑面積結果在表1中比較。可見兩種方法對不同等級的病斑圖像效果不同:對于1級病害圖像,基于顏色通道方法的分割效果要明顯優于自適應模糊閾值分割方法。對于2級病斑圖像,因為病斑更明晰,面積增大,顏色也變深,圖像自適應模糊閾值方法的準確性增加,顏色通道差值方法與自適應模糊閾值方法效果相當。對于3級病斑圖像,病斑顏色由棕變黑,面積變大,與正常綠色葉片部分區別明顯,灰度直方圖雙峰明顯,谷底平坦,自適應模糊閾值方法的準確率繼續增加。4級病斑圖像中,病斑顏色已經非常深,顏色通道差值方法誤分割情況增加明顯。而且葉片的生理狀態比較差,葉片出現卷曲、部分缺失、折疊的情況很多,導致圖像中葉片的陰影部分比較大,顏色也比較深,使得圖像預處理時已經不能很好地提取目標葉片,導致絕對誤差變大。在這一階段,自適應模糊閾值方法表現比顏色通道差值方法穩定,顏色通道差值方法會出現誤分割,部分圖像不能提取完整的病斑區域。基于上述實驗結果,針對茶炭疽病病斑面積的計算來說,自適應模糊閾值方法能夠有效的計算病斑面積。盡管對1級病斑圖像的分割效果與顏色通道差值方法相差不大,但是在處理2、3、4級病斑圖像時,效果穩定,具有較高的準確度和魯棒性。

圖 4 各級茶炭疽病病斑圖像分割結果Fig.4 Image segmentation results of tea anthracnose lesions at various levels

表1 茶炭疽病病斑圖像分割準確率Table 1 Image segmentation accuracy of tea anthracnose lesions
本文以茶炭疽病病斑葉片彩色數字圖像作為研究對象,采用自適應模糊閾值分割和基于顏色通道差值分割兩種分割方法對不同病斑級別的圖像進行分割,根據像素轉換的茶葉病斑區域與目標葉片的計算相對病斑面積,并與Photoshop手動分割計算的結果進行比較,分析算法的準確性和實用性。根據分析可知,自適應模糊閾值方法在處理圖像時效果穩定,具有較高的準確度和魯棒性。
本文通過研究和實驗,較準確地計算了茶炭疽病病斑面積,但仍存在一些問題有待改進。由于自適應模糊閾值方法適用于雙峰明顯、谷底平坦的圖像,對于某些茶炭疽病病斑圖像病斑部分較小,雙峰不明顯,甚至在直方圖上呈現單峰,不能準確將病斑從葉片中分割,如何更加準確的選擇隸屬度函數從而使結果魯棒性提高還有待研究。同時由于某些圖像的病斑部分顏色較深,且有些區域可能有灰塵,呈現黑色或灰色,或因葉片本身狀況不佳,出現卷曲、折疊情況,使圖像中有大面積陰影或陰影顏色較深,這些情況都使得后期分割效果不佳,需要在前期圖像預處理時考慮如何提高圖像質量,從而提高本文方法的適用性。近年來,隨著人工智能和深度學習的發展,有文章也使用了基于卷積神經網路的方法利用病斑成像來進行病情種類的調查[20],對于不同種類的茶葉病害識別準確率達到了90%。相比于這類機器學習方法,本文的方法不依賴于大量的樣品處理和模型訓練,其復雜性和成本較低。在后續研究中,我們會考慮如何將傳統的圖像識別方法和深度學習框架融合,兼顧其成本和準確性,吸收二者的優勢,實現葉片病斑的類別和等級檢測。