王 馳,張真煒,劉 洋,郭冰玉,陳 灝
(石河子大學信息科學與技術學院,新疆 石河子 832000)
棉花黃萎病危害棉花生產,其使得棉花容易減產甚至絕收[1]。目前,棉花黃萎病病害監測主要依靠人工觀察棉花葉片,基于經驗監測棉花是否出現黃萎病病變。傳統的監測手段過度依賴人的主觀性,監測效率低,費時費力。因此,為棉花黃萎病病害的發現提供一種更為準確、實時的診斷措施具有重大意義。近年來,通過圖像處理和機器學習監測植物病蟲害已經成為新的發展趨勢。本文采用基于機器學習分類方法,對比分析傳統機器學習和深度學習效果,提出基于機器學習的圖像(RGB圖像和熱紅外圖像)融合判斷監測棉花黃萎病的方案,為植物病蟲害監測領域提供寶貴的案例。
新疆是中國最大的產棉區。2020年新疆棉花的種植面積約占全國棉花種植總面積的78%,產量約占全國總產量的87%[2]。同時,在新疆地區,國家針對性實施棉花目標價格補貼政策,這保障了棉農的收益,調動了棉農的種植積極性,使得新疆棉花種植面積不斷擴大。
棉花黃萎病是棉花生產的重大阻力,是棉花生育期間的“癌癥”[3]。在棉花的整個生育期內都有可能被感染棉花黃萎病,七月中旬達到第一次發病高峰,八月底九月初到達一年之中的發病最高峰[4]。依據歷年棉花生產經驗,黃萎病對棉花的質量和產量都造成極其嚴重的影響,一般導致棉花減產20%左右,而病變嚴重的棉田減產可達70%,甚至絕收[5]。
劉海洋等[6]研究表明,棉花黃萎病作為目前危害棉花生產最主要的病害,近年來,在新疆的發作呈現加重趨勢,到目前為止其已經造成了巨大損失,必須要引起足夠的重視[7]。及時地發現感染黃萎病的植株,可以盡早進行治療,防止病菌傳播和蔓延,防止棉花產量大規模減少[8]。
中國棉花黃萎病分類識別工作主要依靠人工完成,而人工分類局限性大、缺陷明顯,這對于棉花的最終產量有重大影響。利用計算機監測棉花黃萎病,可以克服傳統人工分類方法過度依賴主觀性、易疲勞、費時費力等缺點,從而更好避免了棉花黃萎病的危害。
近年來,機器學習發展迅猛,應用方面廣泛并取得突破性進展。許多傳統業務因和深度學習的結合進一步發展,不僅節省了人力物力,也提高了作業效率。現如今,通過機器學習算法將原本煩瑣的任務交由計算機處理已成為時代的趨勢。
因此,借助機器學習等新技術,研究一種切實可行、操作方便、探測準確的棉花黃萎病病發狀況監測技術,這對于提高新疆乃至全國棉花生產地區的棉花產量,具有重要意義。
TELLAECHE等[9]根據作物與雜草顏色不同的特點,實現了識別雜草,并在一定程度上消除了植物葉片重疊、不同相機的焦距、風速不同等環節造成的影響,從而使圖像方法獲得較高的實用性;KⅠM等[10]在研究患灰霉病的紫薇葉片的數字紅外熱成像時,經驗證得出結論,數字化紅外熱像儀可以用來評估灰霉病對葉片溫度變化的影響,從而做到對灰霉病的有效檢測;JAFARⅠ等[11]在利用熱視覺檢測玫瑰白粉病和灰霉病前期癥狀的研究中發現利用熱成像技術可以對玫瑰白粉病和灰霉病進行癥狀前檢測;CAMARGO等[12]構建了一個機器視覺系統,利用彩色數字圖像對作物病害視覺特征進行識別,從圖像中提取一系列的病害特征,將這些特征輸入到一個SVM分類器中,從而實現作物病害的識別。
鄧繼忠等[13]利用采集的小麥病害顯微圖像為研究對象,采用圖像分析、圖像識別技術對小麥的三類病害進行識別;陳斌等[14]在利用紅外熱成像技術監測植物病害的研究中證實紅外熱成像技術在檢測病害方面所具備的良好可行性;錢小燕等[15]為了增強融合效果,提高融合速度,提出了一種快速有效的紅外與可見光圖像融合算法,此算法獲得的生成融合圖像更加清晰、自然,速度更快、更簡單;何永強等[16]結合紅外圖像和微光圖像各自的特點,利用小波圖像融合的方法把紅外圖像和微光圖像進行融合,從大量的融合圖像中提取不同物體的紋理特征,提出了一種基于圖像融合的夜視圖像彩色化方法。
總之,農作物病蟲害識別方法的研究多在實驗室環境中進行,實驗室中的環境單一、噪聲干擾較少,往往能夠取得較好的效果,而在實際的大田環境中,存在各種各樣的干擾。目前,沒有相關學者對棉花的熱成像特征進行病害監測,但是,已有相關學者在農作物病蟲害領域使用熱成像技術進行研究[17],也已有學者利用機器視覺對棉花的病蟲害領域進行研究[18]。在實際應用中,存在著許多圖像融合算法,但并不都適用于紅外與可見圖像融合,因此需要根據項目實際選擇適合的圖像融合算法以滿足項目的需求。
棉花黃萎病的分類識別過程包括圖像數據的輸入、對圖像數據的預處理、對圖像數據進行的提取、分類處理和輸出結果。具體流程如下。
第一,在生長期間將部分棉花接種黃萎病,運用Pro高性能機載熱紅外成像儀(Workswell公司,捷克)拍攝熱圖像圖片。設定鏡頭距離地面高度大于130 cm,用以確保圖像可以完整捕捉棉株單株。
第二,設立對照組和真菌接種組,通過對40株接種棉花黃萎病菌和40株未接種棉花黃萎病菌的棉花觀察,做圖像數據采集,從而建立棉花黃萎病樣本庫,并提取感興趣區,生成感興趣區的RGB圖像、紅外圖像和融合圖像。完成機器分類前的人工處理,建立了樣本庫與測試庫,便于之后的學習、測試。
第三,按照算法分析并計算棉花黃萎病的特征參數,得到從卷積神經網絡(Convolutional Neural Networks,CNN)輸出的分類器結果,按照結果,計算機進行自動分類,并輸出棉花黃萎病分類結果。
一般情況下,中紅外區是2.5~25 μm的紅外波段[19]。植被溫度與大氣溫度接近。雖然大氣溫度每天都有變化,但不同部位會有所不同。也就是說,健康區域和不健康區域會有明顯差異[20]。因此可以利用中紅外熱成像技術獲取植株基于熱圖像特征的差異,從而形成對健康植株和不健康植株區分的分類依據。
在正式的采集前,先設立對照組和真菌接種組。接種一段時間后,使用Pro高性能機載熱紅外成像儀拍攝2組植株(對照組和真菌接種組)的熱圖像圖片。
紅外圖像具有全天候工作、抗干擾能力強的優點,但是紅外圖像存在對比度低、清晰度低、可視性差、細節信息匱乏、對溫差敏感等缺點,使圖像中的目標和場景難以識別、分析。因此,本文引入圖像融合。
圖像融合是將兩幅或多幅圖像利用特定的算法綜合成一幅新的圖像的方法。在進行融合之前要事先經過去噪、配準等處理過程,然后在利用特定的算法對圖像進行融合。
圖像融合的一般過程為特征提取、后期優化和融合3個步驟。特征提取是通過數學模型,從源圖像中提取圖像特征的過程,一般包括圖像分割、特征表示和特征選擇3步。后期優化是利用中心像素與鄰域內像素的關系,對特征的優化。最后,圖像融合是采用加權平均等規則完成圖像的合并。
3.4.1 卷積神經網絡
卷積神經網絡是一類深度神經網絡,其中包含卷積計算,是深度學習的代表算法之一[21-22]。CNN是為解決圖像識別問題而專門設計的一種神經網絡。在圖像處理的相關領域,CNN有十分出色的表現[23]。實質上,CNN是一種由輸入到輸出的映射。CNN不需要任何確定的數學公式,而是通過大量的從輸入到輸出的映射關系的學習,從而獲得了從輸入到輸出的映射能力[24]。CNN應用廣泛,其應用領域涉及圖像和視頻的識別、圖像分類、圖像分割、醫學圖像分析、自然語言處理和推薦系統等[25]。
CNN一般由輸入層、隱含層和輸出層構成,其中隱含層一般包含卷積層、池化層和全連接層[26]。CNN的分類處理過程可概括如下:首先進行圖像數據獲取,并對圖像數據進行簡單的處理,如去噪等工作[27]。之后送入隱含層進行卷積、池化的運算。卷積層的功能是提取圖像特征,池化層的功能是對池化層的特征進行選擇和過濾。在反復地進行了卷積和池化的工作后,全連接層會將提取的特征進行線性組合而后輸出結果。
3.4.2 優化改進
由于采用熱紅外成像技術獲取圖像數據,本文對卷積神經網絡的網絡結構提出了一種新的設計方案,包含卷積核數量的更變、卷積層數、卷積核的尺寸、激活函數等內容的優化,并采用多輸入多輸出模型。
網絡結構設計完成之后,為了進一步提高卷積神經網絡的準確性,降低損失度。建議采用多種改進方法:①增加迭代次數。一個擁有大量數據的卷積神經網絡需要經過多次的迭代才能取得良好的訓練成效,獲得理想的訓練成果,增加迭代次數,是直接提高穩定性和準確率的有效手段。②調整學習率。學習率決定了神經網絡能否成功收斂到局部最小值。過高的學習率會使得神經網絡跳過全局最小值,從而導致無法收斂。過低的學習率會增加花費的時間,最優的學習率能夠獲得高效而理想的局部最小值。③增加卷積神經網絡的深度。通過增加神經網絡的深度可以增加可學習參數的個數,從而使得神經網絡的擬合能力提高,對于提高準確率有一定的幫助。但同時注意,過高的深度一定程度上會導致過擬合。④數據增強。在不實質性增加數據的前提下,對已有的數據集進行改變,諸如翻轉、旋轉等,從而獲得增加數據的效果。在進行數據增強后,使得增強后的數據集代表更為全面的數據集合,卷積神經網絡因而可以從原始數據集提取更多的特征信息,從而防止過擬合現象。
本文介紹了一種基于卷積神經網絡的棉花黃萎病監測方法,建立了CNN模型,在已有的比較成熟的算法上進行測試,建立適合棉花黃萎病監測的算法模型,最終獲得能夠成功辨識棉花是否感染黃萎病的成果。相較于傳統的人工監測方法,該方法具有作業時間連續、效率高、準確率高的特點,克服了傳統人工監測方法費時費力、主觀性強的缺點。對于監測棉花黃萎病,有著不可多得的優勢。但該方法也有局限性,對于有著輕微感染情況的棉花植株,難以完全準確地作出監測判斷。在后續研究中,可以通過對算法的進一步優化來解決。